
دیپسیک به ترند جهانی تبدیل شده است.
آزمایشگاه هوش مصنوعی چینی DeepSeek این هفته با رسیدن اپلیکیشن چتبات خود به صدر جدول فروشگاه اپ استور اپل (و همچنین گوگل پلی)، توجه عمومی را به خود جلب کرد. مدلهای هوش مصنوعی دیپسیک که با استفاده از تکنیکهای محاسباتی کارآمد آموزش داده شدهاند، باعث شدهاند تحلیلگران والاستریت و تکنولوژیستها این سؤال را مطرح کنند که آیا ایالات متحده میتواند برتری خود را در رقابت هوش مصنوعی حفظ کند و اینکه آیا تقاضا برای تراشههای AI پایدار خواهد ماند یا نه.
اما دیپسیک از کجا آمده و چگونه در مدت کوتاهی به شهرت بینالمللی دست یافته است؟
دیپسیک با حمایت شرکت High-Flyer Capital Management، یک صندوق سرمایهگذاری کمی چینی که از هوش مصنوعی برای تصمیمگیریهای معاملاتی خود استفاده میکند، فعالیتش را آغاز کرد.
لیانگ ونفنگ (Liang Wenfeng)، علاقهمند به هوش مصنوعی، High-Flyer را در سال ۲۰۱۵ همبنیانگذاری کرد. ونفنگ که گفته میشود در دوران دانشجویی در دانشگاه ژجیانگ شروع به معاملهگری کرده بود، در سال ۲۰۱۹ High-Flyer را بهعنوان یک صندوق تمرکزیافته بر توسعه و بهکارگیری الگوریتمهای هوش مصنوعی راهاندازی کرد.
در سال ۲۰۲۳، High-Flyer آزمایشگاه دیپسیک را برای تحقیق در ابزارهای AI بهطور جداگانه از فعالیتهای مالی خود تأسیس کرد. این آزمایشگاه بعدها با سرمایهگذاری High-Flyer به شرکت مستقلی با نام DeepSeek تبدیل شد.
از همان روز اول، دیپسیک خوشههای دیتاسنتری خود را برای آموزش مدلها ساخت. اما مانند سایر شرکتهای چینی فعال در حوزه AI، این شرکت نیز از ممنوعیتهای صادرات سختافزار ایالات متحده آسیب دید. برای آموزش یکی از مدلهای اخیر خود، دیپسیک مجبور شد از تراشههای Nvidia H800 استفاده کند که نسخه ضعیفتری از تراشه H100 هستند که شرکتهای آمریکایی به آنهخا دسترسی دارند.
گفته میشود تیم فنی دیپسیک جوان است و این شرکت با جدیت از میان دانشآموختگان دکتری دانشگاههای برتر چین در حوزه AI استخدام میکند. همچنین افراد بدون سابقه در علوم رایانه نیز استخدام میشوند تا در درک بهتر مدلها از موضوعات گسترده کمک کنند (بر اساس گزارش نیویورک تایمز).
دیپسیک اولین مجموعه مدلهای خود با نامهای DeepSeek Coder، DeepSeek LLM، و DeepSeek Chat را در نوامبر ۲۰۲۳ رونمایی کرد. اما توجه صنعت زمانی جلب شد که نسخه بعدی مدلهای نسل جدید DeepSeek-V2 در بهار سال بعد منتشر شد.
مدل DeepSeek-V2، یک سیستم تحلیل متن و تصویر همهمنظوره است که عملکرد خوبی در معیارهای مختلف AI داشت — و بسیار ارزانتر از مدلهای مشابه در آن زمان بود. این موضوع رقبای داخلی دیپسیک مانند ByteDance و Alibaba را مجبور کرد قیمت استفاده از برخی از مدلهای خود را کاهش دهند یا رایگان کنند.
مدل DeepSeek-V3 که در دسامبر ۲۰۲۴ منتشر شد، به شهرت دیپسیک افزود.
بر اساس تستهای داخلی دیپسیک، DeepSeek V3 بهتر از مدلهای اپنسورس مانند Llama از متا و مدلهای «بسته» مانند GPT-4o از OpenAI عمل میکند.
مدل «استدلالی» DeepSeek R1 که در ژانویه معرفی شد نیز چشمگیر است. دیپسیک ادعا میکند که R1 در معیارهای کلیدی عملکردی برابر با مدل o1 از OpenAI دارد.
مدلهای استدلالی مانند R1 خودشان را بررسی و تصحیح میکنند و این باعث میشود از خطاهایی که سایر مدلها دچار آن میشوند، جلوگیری شود. این مدلها زمان بیشتری برای رسیدن به پاسخ صرف میکنند (چند ثانیه تا چند دقیقه بیشتر)، اما در حوزههایی مانند فیزیک، علوم و ریاضیات قابل اعتمادتر هستند.
با این حال، مدلهای R1، DeepSeek V3 و دیگر مدلهای دیپسیک دارای نقطهضعفی نیز هستند. از آنجایی که این مدلها در چین توسعه یافتهاند، باید تحت بررسی نهاد نظارتی اینترنت چین قرار بگیرند تا اطمینان حاصل شود پاسخهای آنها «ارزشهای سوسیالیستی محوری» را نمایش میدهند. برای مثال، در اپلیکیشن چتبات دیپسیک، مدل R1 به پرسشهایی درباره میدان تیانآنمن یا استقلال تایوان پاسخ نمیدهد.
در ماه مارس، دیپسیک از مرز ۱۶.۵ میلیون بازدید عبور کرد. دیوید کار، سردبیر Similarweb، به تککرانچ گفت: «در ماه مارس، دیپسیک دوم شد، با اینکه بازدید روزانهاش نسبت به فوریه ۲۵٪ کاهش داشت.» البته این رقم در مقایسه با ChatGPT که در مارس به بیش از ۵۰۰ میلیون کاربر فعال هفتگی رسید، ناچیز است.
اگر دیپسیک مدلی تجاری دارد، مشخص نیست دقیقاً چه مدلی است. این شرکت محصولات و خدمات خود را بسیار پایینتر از قیمت بازار قیمتگذاری میکند — و برخی را کاملاً رایگان ارائه میدهد. همچنین با وجود علاقه شدید سرمایهگذاران، هیچ سرمایه خارجی جذب نکرده است.
به گفته دیپسیک، پیشرفتهایش در بهرهوری، عامل رقابت قیمتی شدید آن است. برخی کارشناسان اما ارقام ارائهشده را زیر سؤال بردهاند.
در هر صورت، توسعهدهندگان به مدلهای دیپسیک علاقهمند شدهاند. این مدلها اپنسورس به معنای رایج نیستند، اما تحت مجوزهای باز تجاری ارائه شدهاند. کلِم دِلَنگ، مدیرعامل Hugging Face (یکی از میزبانان مدلهای دیپسیک)، میگوید که توسعهدهندگان بیش از ۵۰۰ مدل مشتقشده از R1 ساختهاند که در مجموع ۲.۵ میلیون بار دانلود شدهاند.
موفقیت دیپسیک در برابر رقبای بزرگتر و قدیمیتر، گاهی «برهمزننده AI» و گاهی «بیشازحد هیجانی» توصیف شده است. این موفقیت دستکم تا حدودی باعث افت ۱۸٪ قیمت سهام انویدیا در ژانویه شد و واکنش علنی مدیرعامل OpenAI، سم آلتمن را در پی داشت. در ماه مارس، وزارت بازرگانی آمریکا اعلام کرد که استفاده از دیپسیک در دستگاههای دولتی ممنوع خواهد شد (بر اساس گزارش رویترز).
مایکروسافت اعلام کرد دیپسیک را در سرویس Azure AI Foundry خود در دسترس قرار داده است. زمانی که از مارک زاکربرگ درباره تأثیر دیپسیک بر هزینههای AI متا در تماس سود فصلی پرسیده شد، گفت که سرمایهگذاری در زیرساخت AI همچنان یک «مزیت راهبردی» برای متا خواهد بود. در مارس، OpenAI دیپسیک را «یاریشده توسط دولت» و «تحت کنترل دولت» توصیف کرد و توصیه کرد که دولت آمریکا استفاده از مدلهای آن را ممنوع کند.
در تماس درآمدی سهماهه انویدیا، جنسن هوانگ، مدیرعامل شرکت، از «نوآوری عالی» دیپسیک تمجید کرد و گفت که مدلهای استدلالی مانند آنها برای انویدیا خوب هستند چون به قدرت پردازشی زیادی نیاز دارند.
در عین حال، برخی شرکتها و حتی کشورها و دولتها دیپسیک را ممنوع کردهاند، از جمله کره جنوبی. همچنین ایالت نیویورک استفاده از آن در دستگاههای دولتی را ممنوع کرده است.
اما آینده دیپسیک چه خواهد بود؟ هنوز مشخص نیست. بهبود مدلها تقریباً قطعی است. ولی به نظر میرسد دولت آمریکا روز به روز نگرانتر از آن چیزی میشود که آن را نفوذ خارجی مضر تلقی میکند. در مارس، والاستریت ژورنال گزارش داد که ایالات متحده احتمالاً استفاده از دیپسیک را در دستگاههای دولتی ممنوع خواهد کرد.