
در ماههای اخیر تعداد زیادی آزمایشگاه هوش مصنوعی با تمرکز بر پژوهش راهاندازی شدهاند و «هواپیماهای بالزن» یکی از جالبترین آنهاست. این مجموعه که توسط بنیانگذاران جوان و کنجکاوش هدایت میشود، بر یافتن روشهایی برای آموزش هوش مصنوعی با وابستگی کمتر به داده تمرکز دارد. این رویکرد میتواند قواعد بازی را در اقتصاد و توانمندیهای مدلهای هوش مصنوعی تغییر دهد — و با ۱۸۰ میلیون دلار سرمایه اولیه، فرصت کافی برای آزمودن ایدههایشان خواهند داشت.
هفته گذشته با سه همبنیانگذار این آزمایشگاه — برادران بن و اَشر اسپکتور و آیدان اسمیت — درباره اینکه چرا اکنون زمان هیجانانگیزی برای راهاندازی یک آزمایشگاه جدید هوش مصنوعی است و چرا بارها به ایدههای مرتبط با مغز انسان بازمیگردند، گفتوگو کردم.
میخواهم با این سؤال شروع کنم: چرا حالا؟ آزمایشگاههایی مانند OpenAI و DeepMind هزینههای هنگفتی برای مقیاسدهی مدلهایشان صرف کردهاند. رقابت باید دلهرهآور به نظر برسد. چرا احساس کردید اکنون زمان مناسبی برای راهاندازی یک شرکت مدل پایه است؟
بن: کارهای بسیار زیادی برای انجام دادن وجود دارد. پیشرفتهایی که در پنج تا ده سال گذشته داشتهایم خارقالعاده بودهاند. ما این ابزارها را دوست داریم و هر روز از آنها استفاده میکنیم. اما سؤال این است: آیا این تمام کارهایی است که باید انجام شود؟ ما با دقت زیادی به این موضوع فکر کردیم و پاسخمان «نه» بود؛ کارهای بسیار بیشتری باقی مانده است. در مورد ما، فکر کردیم مسئله کارایی داده واقعاً کلید اصلی است. مدلهای پیشرو امروز با مجموع کل دانش بشری آموزش میبینند، در حالی که انسانها آشکارا با بسیار کمتر از آن هم میتوانند کار کنند. این شکاف بزرگی است و ارزش فهمیدن دارد.
آنچه ما انجام میدهیم در واقع یک شرطبندی متمرکز بر سه چیز است. اول، اینکه مسئله کارایی داده موضوع مهمی است که باید روی آن کار کرد؛ مسیری تازه و متفاوت که میتوان در آن پیشرفت کرد. دوم، اینکه این کار از نظر تجاری بسیار ارزشمند خواهد بود و اگر موفق شویم، جهان را به جای بهتری تبدیل میکند. و سوم، اینکه تیم مناسب برای این کار، تیمی خلاق و حتی تا حدی کمتجربه است که بتواند این مسائل را از پایه دوباره بررسی کند.
آیدان: بله، دقیقاً. ما خودمان را در رقابت مستقیم با دیگر آزمایشگاهها نمیبینیم، چون فکر میکنیم مجموعه کاملاً متفاوتی از مسائل را بررسی میکنیم. اگر به ذهن انسان نگاه کنید، یادگیریاش بهطرز باورنکردنی با ترنسفورمرها متفاوت است — نه لزوماً بهتر، فقط بسیار متفاوت. مدلهای زبانی بزرگ توانایی شگفتانگیزی در حفظ کردن و بهرهگیری از گستره وسیعی از دانش دارند، اما در یادگیری سریع مهارتهای جدید چندان خوب نیستند. برای سازگار شدن، به سیلابی از داده نیاز دارند. وقتی به درون مغز نگاه میکنید، میبینید الگوریتمهایی که استفاده میکند اساساً با گرادیان نزولی و روشهای رایج آموزش امروز متفاوتاند. به همین دلیل ما در حال ساخت نسل جدیدی از پژوهشگران هستیم تا این مسائل را با نگاهی متفاوت بررسی کنند.
اَشر: این پرسش از نظر علمی بسیار جذاب است: چرا سیستمهای هوشمندی که ساختهایم تا این حد با شیوه کار انسانها متفاوتاند؟ این تفاوت از کجا میآید؟ چگونه میتوانیم از دانش درباره این تفاوت برای ساخت سیستمهای بهتر استفاده کنیم؟ در عین حال، فکر میکنم این مسیر از نظر تجاری هم بسیار قابلاجرا و برای جهان مفید است. حوزههای مهم زیادی هستند که بهشدت با محدودیت داده مواجهاند، مثل رباتیک یا کشف علمی. حتی در کاربردهای سازمانی، مدلی که یک میلیون برابر کاراتر از نظر داده باشد، احتمالاً یک میلیون برابر راحتتر وارد اقتصاد میشود. برای ما بسیار هیجانانگیز بود که با دیدگاهی تازه به این رویکردها نگاه کنیم و بپرسیم اگر مدلی واقعاً بسیار کاراتر از نظر داده داشته باشیم، چه کارهایی میتوانیم انجام دهیم؟
این بحث به سؤال بعدی من میرسد که به نام «هواپیماهای بالزن» هم مربوط است. در هوش مصنوعی یک پرسش فلسفی وجود دارد: تا چه حد میخواهیم آنچه انسانها در مغزشان انجام میدهند را بازآفرینی کنیم، و تا چه حد میخواهیم نوعی هوش انتزاعی بسازیم که مسیر کاملاً متفاوتی را طی میکند؟ آیدان پیشتر در Neuralink کار کرده که کاملاً بر مغز انسان متمرکز است. آیا شما خود را در حال دنبال کردن دیدگاهی نورومورفیک در هوش مصنوعی میبینید؟
آیدان: من به مغز بهعنوان «اثبات وجود» نگاه میکنم. مغز نشان میدهد الگوریتمهای دیگری هم وجود دارند؛ فقط یک ارتدوکسی واحد در کار نیست. مغز محدودیتهای عجیبی دارد. از نظر سختافزاری، شلیک یک پتانسیل عمل یک میلیثانیه طول میکشد، در حالی که کامپیوتر شما در همان زمان عملیات بسیار زیادی انجام میدهد. بنابراین احتمالاً رویکردی وجود دارد که هم از مغز بهتر است و هم بسیار متفاوت از ترنسفورمر. ما از برخی کارهای مغز الهام میگیریم، اما خود را به آن محدود نمیکنیم.
بن: همانطور که در ناممان هم هست: «هواپیماهای بالزن». سیستمهای فعلی را مثل یک بوئینگ ۷۸۷ بزرگ تصور کنید. ما نمیخواهیم پرنده بسازیم — این یک قدم بیش از حد است. ما میخواهیم نوعی هواپیمای بالزن بسازیم. از دیدگاه من در سیستمهای کامپیوتری، محدودیتهای مغز و سیلیکون آنقدر متفاوتاند که نباید انتظار داشته باشیم سیستمها در نهایت شبیه هم شوند. وقتی بستر فیزیکی اینقدر متفاوت است و بدهبستانهای کاملاً متفاوتی درباره هزینه محاسبه و جابهجایی داده وجود دارد، طبیعی است که سیستمها کمی متفاوت باشند. اما متفاوت بودن به این معنا نیست که نباید از مغز الهام بگیریم.
(متن کامل گفتوگو بسیار طولانی است؛ در ادامه، ترجمه کامل بخشهای باقیمانده:)
به نظر میرسد اکنون آزادی بیشتری برای آزمایشگاهها وجود دارد تا بر پژوهش تمرکز کنند، نه صرفاً توسعه محصول. این تفاوت بزرگی برای نسل جدید آزمایشگاههاست. برخی کاملاً پژوهشمحورند و برخی «فعلاً پژوهشمحور». این بحث در هواپیماهای بالزن چگونه است؟
اَشر: ای کاش میتوانستم یک جدول زمانی بدهم و بگویم سه سال دیگر مسئله پژوهشی را حل میکنیم و بعد تجاریسازی میکنیم. اما نمیتوانم. ما به دنبال حقیقت هستیم. با این حال، پیشینه تجاری داریم و معتقدیم رساندن ارزش خلقشده به دست مردم کار خوبی است. فقط فکر میکنیم باید از پژوهش شروع کنیم، چون اگر با قراردادهای بزرگ سازمانی شروع کنیم، حواسمان پرت میشود.
آیدان: ما میخواهیم چیزهایی واقعاً بهشدت متفاوت را امتحان کنیم، و گاهی ایدههای رادیکال حتی بدتر از پارادایم فعلی از آب درمیآیند. ما در حال کاوش مجموعهای از بدهبستانهای متفاوت هستیم.
بن: استارتاپها وقتی بهترین عملکرد را دارند که روی یک چیز متمرکز باشند. ما اکنون بیشترین ارزش را زمانی خلق میکنیم که کاملاً روی حل مسائل بنیادی متمرکز باشیم.
(…)
درباره هزینههای محاسباتی: بن توضیح میدهد که پژوهشهای عمیق و رادیکال گاهی paradoxically ارزانتر از کارهای افزایشی هستند، چون ایدههای کاملاً جدید معمولاً در مقیاس کوچک شکست میخورند و نیازی به مقیاسدهی پرهزینه ندارند. با این حال، مقیاس همچنان ابزار مهمی برای آنهاست.
اَشر سه فرضیه درباره آینده مطرح میکند:
۱) آموزش با داده کمتر ممکن است مدلها را به سمت «درک عمیقتر» سوق دهد، حتی اگر دانش واقعیتی کمتری داشته باشند.
۲) ممکن است آموزش پسینی بسیار کاراتر شود و با چند مثال بتوان مدل را وارد حوزهای جدید کرد.
۳) ممکن است حوزههای جدیدی مانند برخی شاخههای رباتیک یا کشف علمی باز شوند که امروز به دلیل محدودیت داده عملی نیستند.
بن تأکید میکند که جذابترین چشمانداز هوش مصنوعی صرفاً خودکارسازی و کاهش هزینهها نیست، بلکه خلق علم و فناوریهای جدیدی است که انسانها به تنهایی قادر به ابداع آنها نیستند.
در بحث AGI، اَشر میگوید تعریف روشنی از آن ندارد و معتقد نیست در کوتاهمدت به «خدایی در جعبه» یا تکینگی برسیم. جهان بزرگ است و کارهای زیادی باقی مانده.
آیدان میگوید مغز سقف نیست، بلکه شاید کف باشد؛ سیستمی فیزیکی با محدودیتها که احتمالاً میتوان از آن فراتر رفت.
در مورد استخدام، آنها به دنبال خلاقیت هستند — افرادی بسیار جوان که هنوز در چارچوب هزاران مقاله «آلوده» نشدهاند و بتوانند پارادایم را تغییر دهند. تجربه ارزشمند است، اما ترس نداشتن از تغییر پارادایم مهمتر است.
درباره تفاوت سیستمهای آینده، اَشر میگوید باید انتظار آیندهای «عجیب» را داشته باشیم، با معماریهای حتی عجیبتر و بهبودهایی هزار برابری در کارایی داده. بن اضافه میکند که این قابلیتهای عجیب در نهایت به شکلی قابلمصرف ارائه خواهند شد.