
در روز سهشنبه، شرکت متا نخستین کنفرانس توسعهدهندگان هوش مصنوعی LlamaCon را در دفتر مرکزی خود در منلو پارک برگزار میکند، جایی که این شرکت تلاش خواهد کرد توسعهدهندگان را به ساخت برنامههایی با استفاده از مدلهای باز Llama تشویق کند. تنها یک سال پیش، این کار چندان دشوار نبود.
با این حال، در ماههای اخیر، متا در رقابت سریع هوش مصنوعی با آزمایشگاههای «باز» مانند DeepSeek و رقبای تجاری بسته مانند OpenAI، دچار عقبماندگی شده است. برگزاری LlamaCon در این زمان برای متا اهمیت زیادی دارد تا بتواند اکوسیستم گستردهای پیرامون Llama بسازد.
جذب توسعهدهندگان شاید به سادگی انتشار مدلهای باز بهتر باشد؛ اما انجام این کار بهسادگی گفتن آن نیست.
یک شروع امیدوارکننده
انتشار مدل Llama 4 در اوایل این ماه توسط متا توسعهدهندگان را ناامید کرد، زیرا بسیاری از امتیازات بنچمارک آن پایینتر از مدلهایی مانند R1 و V3 از DeepSeek بود. این وضعیت فاصله زیادی با گذشتهی Llama داشت؛ زمانی که مجموعهای پیشرو از مدلهای هوش مصنوعی بهشمار میرفت.
تابستان گذشته، زمانی که متا مدل Llama 3.1 با 405 میلیارد پارامتر را معرفی کرد، مارک زاکربرگ، مدیرعامل این شرکت، آن را یک موفقیت بزرگ خواند. متا در یک پست وبلاگی، Llama 3.1 405B را «توانمندترین مدل بنیادین باز موجود» توصیف کرد که عملکردی در سطح مدل برتر آن زمان OpenAI یعنی GPT-4o داشت.
این مدل بدون شک چشمگیر بود — همانطور که سایر مدلهای خانواده Llama 3 نیز چنین بودند. جرمی نیکسون، که طی سالهای اخیر میزبان هکاتونهایی در AGI House سان فرانسیسکو بوده، عرضه مدلهای Llama 3 را «لحظاتی تاریخی» نامید.
Llama 3 باعث شد بسیاری از توسعهدهندگان هوش مصنوعی به متا علاقهمند شوند، چراکه عملکرد پیشرفتهای را با آزادی میزبانی دلخواه مدلها فراهم میکرد. امروز، مدل Llama 3.3 متا بیشتر از Llama 4 دانلود میشود — به گفته جف بودیه، مدیر محصول و رشد Hugging Face.
در مقابل، واکنشها به خانواده Llama 4 کاملاً متفاوت بوده است. از همان ابتدا، Llama 4 بحثبرانگیز بود.
بنچمارکهای مشکوک
متا نسخهای از یکی از مدلهای Llama 4 خود به نام Llama 4 Maverick را برای «مکالمهپذیری» بهینهسازی کرد، که باعث شد در بنچمارک جمعسپاریشده LM Arena به رتبه بالایی دست یابد. اما این مدل هیچگاه بهطور عمومی منتشر نشد — نسخهای که منتشر شد عملکرد بسیار ضعیفتری در LM Arena داشت.
گروه پشتیبان LM Arena اعلام کرد که متا باید «شفافتر» درباره تفاوت مدلها توضیح میداد. آیون استویکا، یکی از بنیانگذاران LM Arena و استاد دانشگاه برکلی که همچنین شرکتهایی مانند Anyscale و Databricks را بنیانگذاری کرده، به TechCrunch گفت که این ماجرا باعث کاهش اعتماد جامعه توسعهدهندگان به متا شده است.
استویکا گفت: «[متا] باید بهوضوح میگفت که مدل Maverick که در [LM Arena] قرار داشت با مدلی که منتشر شد متفاوت است. وقتی چنین اتفاقی میافتد، مقداری از اعتماد جامعه از بین میرود. البته، میتوانند این اعتماد را با انتشار مدلهای بهتر بازیابند.»
نبود مدل استدلالی
یکی از نکات منفی برجسته در خانواده Llama 4 نبود یک مدل استدلالی بود. مدلهای استدلالی قادرند با دقت بیشتری به سؤالات پاسخ دهند. در سال گذشته، بخش عمدهای از صنعت هوش مصنوعی به انتشار چنین مدلهایی روی آورده، چراکه عملکرد بهتری در برخی بنچمارکها دارند.
متا اشاره کرده که در حال توسعه یک مدل استدلالی برای Llama 4 است، اما زمانی برای عرضه آن مشخص نکرده.
ناتان لمبرت، پژوهشگر Ai2، میگوید عدم انتشار یک مدل استدلالی همراه با Llama 4 نشان میدهد که شاید متا این عرضه را با عجله انجام داده.
لمبرت گفت: «همه دارند مدلهای استدلالی منتشر میکنند و این باعث میشود مدلهایشان خیلی خوب به نظر برسند. چرا [متا] صبر نکرد؟ پاسخ آن را نمیدانم. به نظر میرسد چیز عجیبی در سیاستهای شرکت وجود دارد.»
او اشاره کرد که مدلهای باز رقیب اکنون به خط مقدم نزدیکتر از همیشه هستند و در انواع و اندازههای مختلف عرضه میشوند — این موضوع فشار زیادی بر متا وارد کرده است. برای مثال، روز دوشنبه شرکت علیبابا مجموعهای از مدلها با نام Qwen 3 منتشر کرد که گفته میشود در بنچمارک Codeforces از برخی از بهترین مدلهای برنامهنویسی OpenAI و گوگل عملکرد بهتری دارند.
دستور کار متا
برای بازپسگیری جایگاه پیشتاز در مدلهای باز، متا باید مدلهایی با عملکرد برتر عرضه کند — به گفته راوید شوارتز-زیو، پژوهشگر مرکز علم داده دانشگاه نیویورک. او به TechCrunch گفت که این امر ممکن است نیاز به ریسکپذیری بیشتر و بهکارگیری تکنیکهای جدید داشته باشد.
اینکه آیا متا اکنون در موقعیتی هست که بتواند چنین ریسکهایی بکند یا نه، هنوز مشخص نیست. کارمندان کنونی و سابق به Fortune گفتهاند که آزمایشگاه تحقیقات هوش مصنوعی متا در حال «مردن تدریجی» است. جویل پینو، معاون تحقیقات هوش مصنوعی شرکت، نیز اعلام کرده که این ماه متا را ترک خواهد کرد.
LlamaCon فرصتی است برای متا تا نشان دهد چه چیزی در چنته دارد تا با نسخههای جدید شرکتهایی مانند OpenAI، گوگل، xAI و دیگران رقابت کند. اگر نتواند انتظارات را برآورده کند، ممکن است در این فضای فوقالعاده رقابتی بیشتر عقب بیفتد.