LlamaCon

در روز سه‌شنبه، شرکت متا نخستین کنفرانس توسعه‌دهندگان هوش مصنوعی LlamaCon را در دفتر مرکزی خود در منلو پارک برگزار می‌کند، جایی که این شرکت تلاش خواهد کرد توسعه‌دهندگان را به ساخت برنامه‌هایی با استفاده از مدل‌های باز Llama تشویق کند. تنها یک سال پیش، این کار چندان دشوار نبود.

با این حال، در ماه‌های اخیر، متا در رقابت سریع هوش مصنوعی با آزمایشگاه‌های «باز» مانند DeepSeek و رقبای تجاری بسته مانند OpenAI، دچار عقب‌ماندگی شده است. برگزاری LlamaCon در این زمان برای متا اهمیت زیادی دارد تا بتواند اکوسیستم گسترده‌ای پیرامون Llama بسازد.

جذب توسعه‌دهندگان شاید به سادگی انتشار مدل‌های باز بهتر باشد؛ اما انجام این کار به‌سادگی گفتن آن نیست.

یک شروع امیدوارکننده

انتشار مدل Llama 4 در اوایل این ماه توسط متا توسعه‌دهندگان را ناامید کرد، زیرا بسیاری از امتیازات بنچمارک آن پایین‌تر از مدل‌هایی مانند R1 و V3 از DeepSeek بود. این وضعیت فاصله زیادی با گذشته‌ی Llama داشت؛ زمانی که مجموعه‌ای پیشرو از مدل‌های هوش مصنوعی به‌شمار می‌رفت.

تابستان گذشته، زمانی که متا مدل Llama 3.1 با 405 میلیارد پارامتر را معرفی کرد، مارک زاکربرگ، مدیرعامل این شرکت، آن را یک موفقیت بزرگ خواند. متا در یک پست وبلاگی، Llama 3.1 405B را «توانمندترین مدل بنیادین باز موجود» توصیف کرد که عملکردی در سطح مدل برتر آن زمان OpenAI یعنی GPT-4o داشت.

این مدل بدون شک چشمگیر بود — همان‌طور که سایر مدل‌های خانواده Llama 3 نیز چنین بودند. جرمی نیکسون، که طی سال‌های اخیر میزبان هکاتون‌هایی در AGI House سان فرانسیسکو بوده، عرضه مدل‌های Llama 3 را «لحظاتی تاریخی» نامید.

Llama 3 باعث شد بسیاری از توسعه‌دهندگان هوش مصنوعی به متا علاقه‌مند شوند، چراکه عملکرد پیشرفته‌ای را با آزادی میزبانی دلخواه مدل‌ها فراهم می‌کرد. امروز، مدل Llama 3.3 متا بیشتر از Llama 4 دانلود می‌شود — به گفته جف بودیه، مدیر محصول و رشد Hugging Face.

در مقابل، واکنش‌ها به خانواده Llama 4 کاملاً متفاوت بوده است. از همان ابتدا، Llama 4 بحث‌برانگیز بود.

بنچمارک‌های مشکوک

متا نسخه‌ای از یکی از مدل‌های Llama 4 خود به نام Llama 4 Maverick را برای «مکالمه‌پذیری» بهینه‌سازی کرد، که باعث شد در بنچمارک جمع‌سپاری‌شده LM Arena به رتبه بالایی دست یابد. اما این مدل هیچ‌گاه به‌طور عمومی منتشر نشد — نسخه‌ای که منتشر شد عملکرد بسیار ضعیف‌تری در LM Arena داشت.

گروه پشتیبان LM Arena اعلام کرد که متا باید «شفاف‌تر» درباره تفاوت مدل‌ها توضیح می‌داد. آیون استویکا، یکی از بنیان‌گذاران LM Arena و استاد دانشگاه برکلی که همچنین شرکت‌هایی مانند Anyscale و Databricks را بنیان‌گذاری کرده، به TechCrunch گفت که این ماجرا باعث کاهش اعتماد جامعه توسعه‌دهندگان به متا شده است.

استویکا گفت: «[متا] باید به‌وضوح می‌گفت که مدل Maverick که در [LM Arena] قرار داشت با مدلی که منتشر شد متفاوت است. وقتی چنین اتفاقی می‌افتد، مقداری از اعتماد جامعه از بین می‌رود. البته، می‌توانند این اعتماد را با انتشار مدل‌های بهتر بازیابند.»

نبود مدل استدلالی

یکی از نکات منفی برجسته در خانواده Llama 4 نبود یک مدل استدلالی بود. مدل‌های استدلالی قادرند با دقت بیشتری به سؤالات پاسخ دهند. در سال گذشته، بخش عمده‌ای از صنعت هوش مصنوعی به انتشار چنین مدل‌هایی روی آورده، چراکه عملکرد بهتری در برخی بنچمارک‌ها دارند.

متا اشاره کرده که در حال توسعه یک مدل استدلالی برای Llama 4 است، اما زمانی برای عرضه آن مشخص نکرده.

ناتان لمبرت، پژوهشگر Ai2، می‌گوید عدم انتشار یک مدل استدلالی همراه با Llama 4 نشان می‌دهد که شاید متا این عرضه را با عجله انجام داده.

لمبرت گفت: «همه دارند مدل‌های استدلالی منتشر می‌کنند و این باعث می‌شود مدل‌هایشان خیلی خوب به نظر برسند. چرا [متا] صبر نکرد؟ پاسخ آن را نمی‌دانم. به نظر می‌رسد چیز عجیبی در سیاست‌های شرکت وجود دارد.»

او اشاره کرد که مدل‌های باز رقیب اکنون به خط مقدم نزدیک‌تر از همیشه هستند و در انواع و اندازه‌های مختلف عرضه می‌شوند — این موضوع فشار زیادی بر متا وارد کرده است. برای مثال، روز دوشنبه شرکت علی‌بابا مجموعه‌ای از مدل‌ها با نام Qwen 3 منتشر کرد که گفته می‌شود در بنچمارک Codeforces از برخی از بهترین مدل‌های برنامه‌نویسی OpenAI و گوگل عملکرد بهتری دارند.

دستور کار متا

برای بازپس‌گیری جایگاه پیشتاز در مدل‌های باز، متا باید مدل‌هایی با عملکرد برتر عرضه کند — به گفته راوید شوارتز-زیو، پژوهشگر مرکز علم داده دانشگاه نیویورک. او به TechCrunch گفت که این امر ممکن است نیاز به ریسک‌پذیری بیشتر و به‌کارگیری تکنیک‌های جدید داشته باشد.

این‌که آیا متا اکنون در موقعیتی هست که بتواند چنین ریسک‌هایی بکند یا نه، هنوز مشخص نیست. کارمندان کنونی و سابق به Fortune گفته‌اند که آزمایشگاه تحقیقات هوش مصنوعی متا در حال «مردن تدریجی» است. جویل پینو، معاون تحقیقات هوش مصنوعی شرکت، نیز اعلام کرده که این ماه متا را ترک خواهد کرد.

LlamaCon فرصتی است برای متا تا نشان دهد چه چیزی در چنته دارد تا با نسخه‌های جدید شرکت‌هایی مانند OpenAI، گوگل، xAI و دیگران رقابت کند. اگر نتواند انتظارات را برآورده کند، ممکن است در این فضای فوق‌العاده رقابتی بیشتر عقب بیفتد.