قدم بعدی هوش مصنوعی در سال ۲۰۲۴ چیست؟

2 سال پیش

به‌ گزارش پیوست، این موارد مطرح شده شامل تغییرات گسترده‌ای بودند و تاثیرات قابل توجهی را در حیطه مربوطه رقم زدند. در ادامه به نظرات و گفته‌های کارشناسان این حوزه را درباره چشم‌انداز هوش مصنوعی در سال ۲۰۲۴ می‌پردازیم.

چت‌بات‌های سفارشی‌ شده

در سال ۲۰۲۴، شرکت‌هایی که سرمایه‌گذاری سنگینی روی هوش مصنوعی مولد کرده‌اند، تحت فشار قرار می‌گیرند که ثابت کنند محصولاتشان درآمدزا است. غول‌های هوش مصنوعی مثل گوگل بارد و OpenAI برای این کار قمار بزرگی کرده‌اند تا کوچک کار کنند. هر دو در حال توسعه پلتفرم‌های کاربرپسندی هستند که افراد را قادر می‌سازد تا مدل‌های زبانی قدرتمند را سفارشی کرده و مینی‌ چت‌بات‌های خود را بسازند. چت‌بات‌هایی که مخصوص نیازهای شما و بدون کدنویسی ساخته می‌شود. هر دو، ابزار وب‌محوری را به راه انداخته‌اند که هر کسی را به توسعه‌دهنده نرم‌افزار هوش مصنوعی مولد تبدیل می‌کند.

در سال ۲۰۲۴، هوش مصنوعی مولد واقعا برای فرد غیرفنی و معمولی، کاربردی می‌شود و افراد می‌توانند میلیون‌ها مدل زبانی کوچک را سرهم کنند. وضعیت مدل‌های هوش مصنوعی هنری مانند GPT-4 و جمینی، چند وجهی است؛ یعنی آن‌ها غیر از متن، می‌توانند تصویر و ویدیو را نیز پردازش کنند. این ویژگی، قفل کلی اپ جدید را باز می‌کند. برای مثال، املاکی‌ها می‌توانند متنی از لیست قبلی خود آپلود کنند و مدل قدرتمندی برای تولید متن مشابه با یک کلیک بسازند. سپس، ویدیو و تصاویر لیست جدید را بارگذاری کرده و از هوش مصنوعی سفارشی‌ شده خود بخواهند تا توضیحات ملک را تولید کند.

اما البته موفقیت این مدل‌ها بستگی به این دارد که کارکرد مطمئنی داشته باشد. مدل‌های زبانی اغلب بهانه می‌آورند و مدل‌های مولد نیز با سوگیری همراه هستند. هک‌ کردن آن‌ها نیز ساده است. مخصوصا اگر اجازه گشتن در وب را داشته باشند. شرکت‌های فناوری هیچ‌ یک از این مشکلات را حل نکرده‌ است. وقتی هیجانات فروکش می‌کند، آن‌ها باید راه‌حل‌هایی را برای مقابله با این مشکلات پیش پای مشتریان خود بگذارند.

موج دوم هوش مصنوعی مولد، ویدیو خواهد بود

سرعت تبدیل فانتزی‌های ما به واقعیت بسیار شگفت‌انگیز است. اولین مدل‌های مولد برای تولید تصاویر واقع‌گرا در سال ۲۰۲۲ به جریان اصلی جامعه وارد شد و سریع رواج پیدا کرد. ابزاری مانند دال‌ای از OpenAI، استیبیلیتی از استیبل دیفیوژن و فایرفلای از ادوبی با عکس‌های بی‌نظیرشان، از پاپ در بالنسیاگا گرفته تا عکس برنده جایزه، اینترنت را تسخیر کرد. با این‌حال، همه‌چیز صرفا سرگرم‌کننده نیست. برای هر تصویر سگ پاپی که لباس صورتی پوشیده، تصویر فانتزی تاریک یا استریوتایپ جنسیت‌زده‌ای نیز وجود دارد.

مرز بعدی که در هم می‌شکند، تبدیل متن به ویدیو است. هرچیز خوب، بد و زشتی را که درباره تبدیل متن به تصویر شنیده‌اید در ذهن داشته باشید و آن را چند برابر کنید.

سال گذشته، تلاش مدل‌های هوش مصنوعی مولد را برای چسباندن چند تصویر به‌هم و تولید ویدیوی چند ثانیه‌ای دیدیم. نتایج بسیار بد و نامرتب بود، اما فناوری به سرعت پیشرفت می‌کند و در تلاش برای رفع این نقص قرار می‌گیرد.

Runway، استارتاپی است که مدل‌های مولد ویدیو را می‌سازد و شرکت همکار در ساخت استیبل دیفیوژن به‌شمار می‌رود. ران‌وی، نسخه جدید ابزارهای خود را هر چند ماه یکبار منتشر می‌کند. آخرین مدل این استارتاپ، به‌نام Gen-2، هنوز در حال ساخت ویدیوهای چند ثانیه‌ای اما با کیفیت بالا است. بهترین کلیپ‌های آن فاصله چندانی با خروجی‌های پیکسار ندارد.

Runway جشنواره‌‌ای را برای فیلم‌های ساخته هوش مصنوعی به‌طور سالیانه برگزار می‌کند که فیلم‌های سینمایی آزمایشی ساخته‌ شده با چندین ابزار هوش مصنوعی را نمایش می‌دهد. جشنواره امسال جایزه ۶۰ هزار دلاری داشت و ۱۰ فیلم برتر، در نیویورک و لس‌آنجلس به روی پرده رفتند.

تعجبی ندارد که توجه استودیوهای برتر جلب شده‌ باشد. غول‌های صنعت فیلم‌سازی مانند پارامونت و دیزنی، در جست‌وجوی راهی برای استفاده از هوش مصنوعی مولد در خط تولید خود هستند. از فناوری برای تنظیم لب‌‌زدن بازیگران در نمایش‌های خود استفاده می‌شود تا دوبله به زبان‌های مختلف طبیعی‌تر به‌نظر برسد. کارهایی که با جلوه‌های ویژه می‌توانیم انجام دهیم نیز در حال اختراع مجدد است. هریسون فورد در سال ۲۰۲۳، برای فیلم جدید ایندیانا جونز به استفاده از فناوری جوان‌سازی صورت دیپ‌فیک روی آورد. این‌ها فقط نقطه شروع است.

از پرده نمایش که دور شویم، فناوری دیپ‌فیک برای اهداف بازاریابی و آموزشی نیز استفاده می‌شود. برای مثال، Synthesia واقع در انگلستان ابزاری ساخته که می‌تواند یک بار نمایش بازیگر را به جریانی بی‌پایان از آواتارهای دیپ‌فیک تبدیل کند. هر فیلم‌نامه‌ای را که به آن بدهید، با یک دکمه اجرا می‌کند. براساس آمار این شرکت، ۴۴ درصد شرکت‌های فورچون۱۰۰، از فناوری آن بهره می‌برند.

توانایی انجام کار زیاد با تلاش کم، سوالات زیادی را برای بازیگران به‌وجود آورده‌ است. نگرانی‌ها درباره استفاده و سوءاستفاده از هوش مصنوعی، محور اصلی اعتصابات SAG-AFTRA در سال گذشته بود. تاثیر واقعی فناوری تازه در حال پدیدار شدن است. سوکی مهدائویی، فیلم‌ساز مستقل و هم‌بنیانگذار Bell & Whistle، مشاوری متخصص در فناوری‌های خلاق است که می‌گوید:« هنر فیلم‌سازی از اساس در حال تغییر است.»

اطلاعات نادرست هوش مصنوعی مولد درباره انتخابات همه‌جا خواهد بود

اگر انتخابات قبلی را معیار در نظر بگیریم، اطلاعات نادرست تولیدشده هوش مصنوعی درباره انتخابات و دیپ‌فیک‌ها به مشکل بزرگی تبدیل خواهد شد، زیرا تعداد بی‌‌سابقه‌ای از مردم در نظرسنجی‌های ۲۰۲۴ شرکت می‌کنند. در حال حاضر سیاست‌مدارانی را می‌بینیم که این ابزار را تبدیل به سلاح خود کرده‌اند. دو نفر از کاندیداهای انتخاباتی در آرژانتین، تصاویر و ویدیوهایی از رقیب خود با هوش مصنوعی ساختند تا به آن‌ها حمله کنند. در اسلواکی، دیپ‌فیک‌هایی از رهبر حزب لیبرال طرفدار اروپا با مضمون تهدید به افزایش قیمت آبجو در طول انتخابات کشور حاشیه‌ساز شد. دونالد ترامپ در آمریکا نیز گروهی را تشویق کرد که از هوش مصنوعی برای تولید میم‌های نژادپرستانه و جنسیت‌زده استفاده می‌کردند.

اندازه‌گیری میزان تاثیر این‌گونه مثال‌ها روی خروجی انتخابات دشوار است، اما افزایش آن روند نگران‌کننده‌ای محسوب می‌شود. تشخیص‌ محتوای واقعی و صحیح در فضای آنلاین هر روز سخت‌تر می‌شود. در فضای ملتهب و چندقطبی سیاست، این موارد می‌تواند عواقب مختلفی داشته باشد.

همین چند سال پیش، ساختن دیپ‌فیک نیازمند مهارت‌های فنی پیشرفته‌ای بود؛ اما هوش مصنوعی مولد این کار را به‌طرز احمقانه‌ای ساده و در دسترس کرده و خروجی‌ها هر روز واقعی‌تر به‌نظر می‌رسد. حتی منابع معتبر نیز می‌تواند فریب محتوای تولید هوش مصنوعی را بخورد.

سال پیش‌رو برای کسانی که در حال مبارزه با افزایش چنین محتواهایی هستند، چرخش خواهد داشت. روش‌های ردگیری و کاهش محتوا هنوز در روزهای اول توسعه خود است. واترمارک‌هایی مانند SynthID از گوگل دیپ‌مایند هنوز داوطلبانه است و کاملا بی‌اشتباه نیست. پلتفرم‌های شبکه‌های اجتماعی نیز در تشخیص اطلاعات نادرست وحشتناک و کند هستند. آماده تجربه حجم عظیمی از اخبار جعلی تولید شده توسط هوش مصنوعی باشید.

ربات‌هایی که چند کار انجام می‌دهند

ربات‌سازان با الهام از تکنیک‌های اصلی پشت هوش مصنوعی مولد، شروع به ساخت ربات‌های عمومی‌تری کرده‌اند که کارهای گسترده‌تری انجام می‌دهد.

چند سال گذشته در صنعت هوش مصنوعی شاهد تغییر موضع از مدل‌های چندگانه کوچک که برای کارهای متفاوت آموزش دیده بودند مانند شناسایی تصاویر، طراحی آن و کپشن‌ نوشتن برای آن، به مدل‌های یکتا و یکپارچه بودیم که برای انجام همه این کارها و فراتر از آن آموزش دیده‌اند. محققان با نشان‌ دادن چند مثال اضافه به GPT-3 از شرکت OpenAI توانستند این هوش مصنوعی را برای حل مسائل کدنویسی، نوشتن فیلم‌نامه سینمایی، قبولی در امتحان زیست‌شناسی دبیرستان و غیره آموزش دهند. مدل‌های چندوجهی مانند GPT-4 و جمینی از دیپ مایند گوگل می‌تواند تسک‌های بصری و زبان‌شناسی را حل کنند.

همین رویکرد برای ربات‌ها نیز به‌کار می‌رود؛ بنابراین لازم نیست یکی را برای برگرداندن پنکیک و دیگری را برای بازکردن در آموزش دهیم. یک مدل مناسب همه به ربات‌ها قدرت می‌دهد تا چندین کار انجام دهند. چندین مثال از این حوزه در سال ۲۰۲۳ رخ داد.

دیپ‌مایند در اکتبر، روبوکت (به‌روزرسانی برای Gato) را منتشر کرد که داده‌های خود را از آزمون و خطا تولید می‌کند تا چگونگی کنترل بازوهای مختلف ربات را یاد بگیرد.

این شرکت در همان اکتبر، مدل عمومی دیگری را برای ربات‌ها، به‌نام RT-X و مجموعه داده بزرگ و جدیدی را با هدف آموزش عمومی به کمک ۳۳ آزمایشگاه دانشگاهی منتشر کرد. تیم‌های تحقیقاتی برتر دیگر، مانند RAIL (Robotic Artificial Intelligence and Learning) در دانشگاه کالیفرنیا، برکلی نیز به‌دنبال چنین فناوری هستند.

مشکل، کمبود داده‌ها است. هوش مصنوعی مولد از مجموعه داده‌ای به بزرگی اینترنت و متشکل از متن و تصویر استفاده می‌کند. در مقایسه، ربات‌ها منابع داده خوب بسیار کمی دارند که به آن‌ها در یادگیری انجام کارهای صنعتی و خانگی کمک کند.

لرل پینتو در دانشگاه نیویورک، یکی از تیم‌‌های این حوزه را هدایت می‌کند. او و همکارانش در حال توسعه تکنیک‌هایی هستند که به ربات اجازه می‌دهد تا با آزمون و خطا، مجموعه داده خود را برای آموزش بسازند. پینتو حتی در پروژه‌ای کوچک‌تر، چندین داوطلب را جمع کرده تا داده‌های ویدیویی را از اطراف خانه‌هایشان جمع‌آوری کنند. آن‌ها این کار را با دوربین آیفون نصب شده روی اشغال‌گیر انجام می‌دهند. شرکت‌های بزرگی مانند Meta Ego4D در چند سال گذشته نیز شروع به انتشار مجموعه داده‌ها برای آموزش ربات‌ها کرده‌اند.

این رویکرد در خودروهای بی‌راننده نیز وعده داده شده‌ است. استارتاپ‌هایی مانند Wayve، Waabi و Ghost پیشگام موج جدیدی از هوش مصنوعی خودران هستند که از یک مدل بزرگ برای کنترل وسیله نقلیه به‌جای مدل‌های کوچک‌تر چندگانه برای کنترل تسک‌های رانندگی مشخص استفاده می‌کنند. این رویکرد به شرکت‌های کوچک اجازه می‌دهد تا پا به پای غول‌هایی مانند Cruise و Waymo حرکت کنند. Waymo هم‌اکنون در حال آزمایش ماشین‌های بی‌راننده خود در خیابان‌های محدود و شلوغ لندن است. ربات‌ها در همه‌جا در حال پیشرفتی مشابه هستند.

چت‌بات‌های سفارشی شده، قابلیت‌های هوش مصنوعی مولد، اطلاعات نادرست و فعالیت‌های متعدد ربات‌ها موضوعاتی است که در سال پیش‌رو باعث بروز تغییرات قابل توجهی خواهد شد.

گزارش عملکرد ایرانسل در سال 1400 منتشر شد: ثبت درآمد عملیاتی 22 هزار میلیارد تومانی در یک سال

نوآم چامسکی: ChatGPT نمونه‌ای شگفت‌انگیز از یادگیری ماشینی اما مصداقی از ابتذال شر است

مدیرعامل بقراط: توسعه زیرساخت اینترنت، ضرورت توسعه سلامت دیجیتال است

سامسونگ احتمالاً برای گوشی‌های گلکسی و لپ‌تاپ‌های گلکسی بوک هسته CPU اختصاصی می‌سازد

وزارت رفاه: اجرای طرح کالابرگ الکترونیک در سراسر کشور آغاز شد

افزایش فعالیت سامسونگ در حوزه گجت‌های پوشیدنی: ثبت‌نام‌های تجاری «گلکسی گلس» و «گلکسی رینگ»

هجوم کتاب‌های نوشته‌شده با ChatGPT به فروشگاه آمازون؛ نویسندگان نگران هوش مصنوعی هستند

وزیر ارتباطات: از ممنوعیت واردات آیفون استقبال نمی‌کنیم، اما باید به‌سمت گوشی‌های تولید داخل برویم

OpenAI با پلتفرم Foundry منابع اختصاصی برای اجرای مدل‌های هوش مصنوعی را فراهم می‌کند

صرافی والکس چطور امنیت کاربران خود را تامین می‌کند؟

در پنل موبایل و صنعت VOD مطرح شد: صداوسیما طبق قانون اساسی حق تنظیم‌گری ندارد

رقیب چینی ChatGPT از راه رسید؛ شروع آزمایش عمومی چت‌بات MOSS

ثبت‌نام در دوازدهمین دوره نمایشگاه اینوتکس آغاز شد / فرصتی برای هم‌افزایی اکوسیستم استارتاپی در شرایط محدودیت‌های اینترنتی

گوگل رسماً از رقیب ChatGPT رونمایی کرد: Bard از راه رسید

پنتاگون درباره استفاده فزاینده از هوش مصنوعی در جنگ‌افزارهای آینده هشدار داد

معرفی ایران به عنوان دومین کشور دارای بیشترین محدودیت اینترنت

سریع‌ترین قطار سوخت هیدروژنی جهان با سرعت 160 کیلومتر بر ساعت در چین شروع به کار کرد

پنج پیش‌بینی در مورد بانکداری و فین‌تک برای سال 2023 به قلم ران شولین

پرجزئیات‌ترین تصاویر ماه از روی زمین با راداری ضعیف‌تر از یک مایکروویو ثبت شد

مایکروسافت می‌خواهد فناوری هوش مصنوعی OpenAI را به آفیس اضافه کند

سامسونگ نگران کاهش تقاضای جهانی برای محصولات خود است

انجمن تجارت الکترونیک با ارائه اینترنت طبقاتی مخالفت کرد

تأمین مالی فیلیمو از بورس، بدون حضور در تابلوی بورسی / دستی بر آتش بورس، اما با فاصله و بدون استرس

ماجرای پول نقد ندادن دستگاه‌های خودپرداز چیست؟ / مقاومت بانک‌ها یا بالارفتن تقاضا برای پول نقد؟

عصر تراکنش به پله شصت‌وپنجم رسید / بدون نوآوری واقعی محکوم به شکستیم

اپل واچ می‌تواند سطح استرس را به‌طور دقیق اندازه‌گیری کند

گردشی در استارتاپ دکتر دکتر: مطبی به وسعت اینترنت

فردابانک؛ یک نئوبانک غیربانکی

قابلیت ‏های اینترنت اشیا و کلان‏ داده برای کشف تقلب و کلاهبرداری در بانکداری دیجیتال

در مراسم رونمایی از سالنامه مهاجرت مطرح شد: نیمی از مدیران میانی در مسیر مهاجرت هستند

مینگ-چی کو: اپل آیفون SE 4 را تولید نمی‌کند یا آن را تا 2024 به تعویق می‌اندازد

جورج هاتز، هکر مشهور آیفون پس از حدود پنج هفته از سمت خود در توییتر استعفا کرد

۱۱۴ شعبه اچ‌اس‌بی‌سی در بریتانیا تعطیل می‌شود / آیا مردم بانکداری آنلاین را بیشتر دوست دارند؟

بررسی کیف‌ پول سخت‌افزاری؛ ابزار نگهداری ارزهای دیجیتال

تسلا سرویس گیمینگ استیم را برای خودروهای جدید مدل X و S منتشر کرد

واکنش وزیر ارتباطات به افزایش قیمت قبوض تلفن ثابت: مخابرات برای نوسازی و توسعه نیاز به منابع دارد

احتمال خروج رایتل از بازار / از دست رفتن بیش از ۳۰۰ میلیارد ریال از درآمد اپراتور سوم کشور

دیپ‌مایند هوش مصنوعی Dramatron را معرفی کرد؛ ابزاری برای نوشتن فیلمنامه

اپل و اریکسون بر سر پتنت‌های شبکه‌های سلولی به توافق رسیدند

مرکز توسعه تجارت الکترونیکی: مهمتر از اینماد، توجه به رتبه اعتماد کسب و کارها است

حمایت استارتاپ‌ها از کسب‌وکارهای کوچک و خانگی به یاد کیان پیرفلک: «قایقی باید ساخت»

نمایشگاه تلکام از تقویم نمایشگاهی حذف شد

اپل احتمالاً مشغول توسعه متاورس مخصوص به خودش است

رکورد ترافیک داخلی با شش ترابیت بر ثانیه شکسته شد/ کاربران فعال پلتفرم‌های داخلی افزایش یافت

انتقاد نمایندگان مجلس از افزایش هزینه آبونمان قبوض تلفن ثابت / رئیس مجلس دستور پیگیری داد

افشای مشخصات کامل شیائومی 13 و 13 پرو پیش از معرفی رسمی

آیفون 15 پرو احتمالاً از USB-C با تاندربولت 3 پشتیبانی خواهد کرد

دامنه ابر آروان از دسترس خارج شد

شورای عالی فضای مجازی خبر داد / حضور ۶۰درصدی کسب‌و‌کارها در پلتفرم‌های داخلی

درخواست فوری کارگروه اقتصاد دیجیتال در هیات دولت از شاپرک: دستور الزام ای‌نماد را لغو کنید

عضو کمیسیون اینترنت نصر تهران / مردم با دستور به پیام‌رسان داخلی کوچ نمی‌کنند

گفت‌و‌گو با آزاد معروفی، مدیرعامل لاوان‌ارتباط / به حال اقتصاد دیجیتال باید گریست

انتقاد معاون فناوری اطلاعات شرکت مخابرات از پروژه پوشش ۲۰ میلیون فیبر نوری وزارت ارتباطات / وزیر وعده غیرممکن داده است + به‌روزرسانی

افزایش سقف تراکنش درگاه‌های پرداخت اینترنتی و کارت‌خوان‌های تاپ به ۱۰۰ میلیون تومان

نماینده مجلس مدعی شد: پهنای باند روبیکا سه برابر استارلینک خواهد شد

عضو کمیسیون اقتصادی مجلس: قطع اینترنت جواب نمی‌دهد و فقط به تعداد بیکاران افزوده است

همکاری جدید اپل‌پی با شرکت گلدمن‌ساکس / اپل روزبه‌روز بیشتر شبیه یک بانک می‌شود

سامسونگ از سریع‌ترین DRAM LPDDR5X دنیا با سرعت 8.5 گیگابیت بر ثانیه رونمایی کرد

کارزار تبلیغاتی متا علیه iMessage اپل؛ مارک زاکربرگ: واتس‌اپ خیلی بهتر و ایمن‌تر است

وزیر ارتباطات: خسارت کسب‌وکارهای مجازی برعهده کسانی است که اغتشاش و آشوب به وجود آورده‌اند

گوشی اقتصادی آنر پلی 6C با نمایشگر 90 هرتزی و اسنپدراگون 480 معرفی شد

کوالکام احتمالا تامین‌کننده مودم 5G سری آیفون 15 و آیفون 16 باقی می‌ماند

ملی‌شدن اینترنت چه تأثیری بر شبکه پرداخت کشور دارد؟

عضو کمیته فیلترینگ: با پذیرش قوانین جمهوری اسلامی ایران فعالیت اینستاگرام و واتس‌اپ منعی ندارد

گزارش «راه پرداخت» از وضعیت کسب‌وکارهای فعال در اینستاگرام / ناامیدی و آینده نامعلوم؛ دغدغه امروز فعالان کسب‌وکارهای خرد

آیفون 14 پرو در بررسی DxOMark بالاترین امتیاز دوربین سلفی و فیلمبرداری را کسب کرد

هوش مصنوعی یک مسئله کوانتومی 100 هزار معادله‌‎ای را در 4 معادله خلاصه کرد

ریال یا ارز دیجیتال بانک مرکزی ایران، جهش ژنتیکی پرداخت ایران است

سامانه مدیریت هوشمند ناوگان ایرانسل، راهی برای نظارت بر ناوگان‌های پیچیده

شماره ۶۶ هفته‌نامه کارنگ و رمزارز شماره ۳۶ منتشر شد

رد توسعه‌دهندگان را چطور بزنیم؟

خدمات پیامک انبوه جیرینگ چه مزایایی برای مشتریان دارد؟

اپل ظاهرا در لحظه آخر تصمیم به استفاده از «جزیره پویا» در آیفون 14 پرو گرفته است

استفاده از API چه مزایایی برای شرکت‌های فین‌تک دارد؟

بنچمارک آنتوتو از افزایش 28 درصدی عملکرد گرافیکی تراشه A16 Bionic حکایت دارد

اینستاگرام ابزار جدید «Gifts» را برای کسب درآمد اینفلوئنسرها آزمایش می‌کند

طرح‌های مفهومی آیپد پرو با طراحی «جزیره پویا» آیفون 14 پرو را ببینید

بازگشت آنی وجه به حساب مشتری با سرویس استرداد وجه زیبال

چرا اپل از تولید آیفون 14 مینی منصرف شد؟

مدیر حوزه‌های علمیه: در تدوین سندهای راهبردی با موضوع هوش مصنوعی باید حضوری موثر داشته باشیم