دیپ‌سیک به ترند جهانی تبدیل شده است.

آزمایشگاه هوش مصنوعی چینی DeepSeek این هفته با رسیدن اپلیکیشن چت‌بات خود به صدر جدول فروشگاه اپ استور اپل (و همچنین گوگل پلی)، توجه عمومی را به خود جلب کرد. مدل‌های هوش مصنوعی دیپ‌سیک که با استفاده از تکنیک‌های محاسباتی کارآمد آموزش داده شده‌اند، باعث شده‌اند تحلیل‌گران وال‌استریت و تکنولوژیست‌ها این سؤال را مطرح کنند که آیا ایالات متحده می‌تواند برتری خود را در رقابت هوش مصنوعی حفظ کند و اینکه آیا تقاضا برای تراشه‌های AI پایدار خواهد ماند یا نه.

اما دیپ‌سیک از کجا آمده و چگونه در مدت کوتاهی به شهرت بین‌المللی دست یافته است؟

ریشه‌های معاملاتی دیپ‌سیک

دیپ‌سیک با حمایت شرکت High-Flyer Capital Management، یک صندوق سرمایه‌گذاری کمی چینی که از هوش مصنوعی برای تصمیم‌گیری‌های معاملاتی خود استفاده می‌کند، فعالیتش را آغاز کرد.

لیانگ ون‌فنگ (Liang Wenfeng)، علاقه‌مند به هوش مصنوعی، High-Flyer را در سال ۲۰۱۵ هم‌بنیان‌گذاری کرد. ون‌فنگ که گفته می‌شود در دوران دانشجویی در دانشگاه ژجیانگ شروع به معامله‌گری کرده بود، در سال ۲۰۱۹ High-Flyer را به‌عنوان یک صندوق تمرکز‌یافته بر توسعه و به‌کارگیری الگوریتم‌های هوش مصنوعی راه‌اندازی کرد.

در سال ۲۰۲۳، High-Flyer آزمایشگاه دیپ‌سیک را برای تحقیق در ابزارهای AI به‌طور جداگانه از فعالیت‌های مالی خود تأسیس کرد. این آزمایشگاه بعدها با سرمایه‌گذاری High-Flyer به شرکت مستقلی با نام DeepSeek تبدیل شد.

از همان روز اول، دیپ‌سیک خوشه‌های دیتاسنتری خود را برای آموزش مدل‌ها ساخت. اما مانند سایر شرکت‌های چینی فعال در حوزه AI، این شرکت نیز از ممنوعیت‌های صادرات سخت‌افزار ایالات متحده آسیب دید. برای آموزش یکی از مدل‌های اخیر خود، دیپ‌سیک مجبور شد از تراشه‌های Nvidia H800 استفاده کند که نسخه ضعیف‌تری از تراشه H100 هستند که  شرکت‌های آمریکایی به آنهخا دسترسی دارند.

گفته می‌شود تیم فنی دیپ‌سیک جوان است و این شرکت با جدیت از میان دانش‌آموختگان دکتری دانشگاه‌های برتر چین در حوزه AI استخدام می‌کند. همچنین افراد بدون سابقه در علوم رایانه نیز استخدام می‌شوند تا در درک بهتر مدل‌ها از موضوعات گسترده کمک کنند (بر اساس گزارش نیویورک تایمز).


مدل‌های قدرتمند دیپ‌سیک

دیپ‌سیک اولین مجموعه مدل‌های خود با نام‌های DeepSeek Coder، DeepSeek LLM، و DeepSeek Chat را در نوامبر ۲۰۲۳ رونمایی کرد. اما توجه صنعت زمانی جلب شد که نسخه بعدی مدل‌های نسل جدید DeepSeek-V2 در بهار سال بعد منتشر شد.

مدل DeepSeek-V2، یک سیستم تحلیل متن و تصویر همه‌منظوره است که عملکرد خوبی در معیارهای مختلف AI داشت — و بسیار ارزان‌تر از مدل‌های مشابه در آن زمان بود. این موضوع رقبای داخلی دیپ‌سیک مانند ByteDance و Alibaba را مجبور کرد قیمت استفاده از برخی از مدل‌های خود را کاهش دهند یا رایگان کنند.

مدل DeepSeek-V3 که در دسامبر ۲۰۲۴ منتشر شد، به شهرت دیپ‌سیک افزود.

بر اساس تست‌های داخلی دیپ‌سیک، DeepSeek V3 بهتر از مدل‌های اپن‌سورس مانند Llama از متا و مدل‌های «بسته» مانند GPT-4o از OpenAI عمل می‌کند.

مدل «استدلالی» DeepSeek R1 که در ژانویه معرفی شد نیز چشمگیر است. دیپ‌سیک ادعا می‌کند که R1 در معیارهای کلیدی عملکردی برابر با مدل o1 از OpenAI دارد.

مدل‌های استدلالی مانند R1 خودشان را بررسی و تصحیح می‌کنند و این باعث می‌شود از خطاهایی که سایر مدل‌ها دچار آن می‌شوند، جلوگیری شود. این مدل‌ها زمان بیشتری برای رسیدن به پاسخ صرف می‌کنند (چند ثانیه تا چند دقیقه بیشتر)، اما در حوزه‌هایی مانند فیزیک، علوم و ریاضیات قابل اعتمادتر هستند.

با این حال، مدل‌های R1، DeepSeek V3 و دیگر مدل‌های دیپ‌سیک دارای نقطه‌ضعفی نیز هستند. از آنجایی که این مدل‌ها در چین توسعه یافته‌اند، باید تحت بررسی نهاد نظارتی اینترنت چین قرار بگیرند تا اطمینان حاصل شود پاسخ‌های آن‌ها «ارزش‌های سوسیالیستی محوری» را نمایش می‌دهند. برای مثال، در اپلیکیشن چت‌بات دیپ‌سیک، مدل R1 به پرسش‌هایی درباره میدان تیان‌آن‌من یا استقلال تایوان پاسخ نمی‌دهد.

در ماه مارس، دیپ‌سیک از مرز ۱۶.۵ میلیون بازدید عبور کرد. دیوید کار، سردبیر Similarweb، به تک‌کرانچ گفت: «در ماه مارس، دیپ‌سیک دوم شد، با اینکه بازدید روزانه‌اش نسبت به فوریه ۲۵٪ کاهش داشت.» البته این رقم در مقایسه با ChatGPT که در مارس به بیش از ۵۰۰ میلیون کاربر فعال هفتگی رسید، ناچیز است.


رویکردی برهم‌زننده

اگر دیپ‌سیک مدلی تجاری دارد، مشخص نیست دقیقاً چه مدلی است. این شرکت محصولات و خدمات خود را بسیار پایین‌تر از قیمت بازار قیمت‌گذاری می‌کند — و برخی را کاملاً رایگان ارائه می‌دهد. همچنین با وجود علاقه شدید سرمایه‌گذاران، هیچ سرمایه خارجی جذب نکرده است.

به گفته دیپ‌سیک، پیشرفت‌هایش در بهره‌وری، عامل رقابت قیمتی شدید آن است. برخی کارشناسان اما ارقام ارائه‌شده را زیر سؤال برده‌اند.

در هر صورت، توسعه‌دهندگان به مدل‌های دیپ‌سیک علاقه‌مند شده‌اند. این مدل‌ها اپن‌سورس به معنای رایج نیستند، اما تحت مجوزهای باز تجاری ارائه شده‌اند. کلِم دِلَنگ، مدیرعامل Hugging Face (یکی از میزبانان مدل‌های دیپ‌سیک)، می‌گوید که توسعه‌دهندگان بیش از ۵۰۰ مدل مشتق‌شده از R1 ساخته‌اند که در مجموع ۲.۵ میلیون بار دانلود شده‌اند.

موفقیت دیپ‌سیک در برابر رقبای بزرگ‌تر و قدیمی‌تر، گاهی «برهم‌زننده AI» و گاهی «بیش‌از‌حد هیجانی» توصیف شده است. این موفقیت دست‌کم تا حدودی باعث افت ۱۸٪ قیمت سهام انویدیا در ژانویه شد و واکنش علنی مدیرعامل OpenAI، سم آلتمن را در پی داشت. در ماه مارس، وزارت بازرگانی آمریکا اعلام کرد که استفاده از دیپ‌سیک در دستگاه‌های دولتی ممنوع خواهد شد (بر اساس گزارش رویترز).

مایکروسافت اعلام کرد دیپ‌سیک را در سرویس Azure AI Foundry خود در دسترس قرار داده است. زمانی که از مارک زاکربرگ درباره تأثیر دیپ‌سیک بر هزینه‌های AI متا در تماس سود فصلی پرسیده شد، گفت که سرمایه‌گذاری در زیرساخت AI همچنان یک «مزیت راهبردی» برای متا خواهد بود. در مارس، OpenAI دیپ‌سیک را «یاری‌شده توسط دولت» و «تحت کنترل دولت» توصیف کرد و توصیه کرد که دولت آمریکا استفاده از مدل‌های آن را ممنوع کند.

در تماس درآمدی سه‌ماهه انویدیا، جنسن هوانگ، مدیرعامل شرکت، از «نوآوری عالی» دیپ‌سیک تمجید کرد و گفت که مدل‌های استدلالی مانند آن‌ها برای انویدیا خوب هستند چون به قدرت پردازشی زیادی نیاز دارند.

در عین حال، برخی شرکت‌ها و حتی کشورها و دولت‌ها دیپ‌سیک را ممنوع کرده‌اند، از جمله کره جنوبی. همچنین ایالت نیویورک استفاده از آن در دستگاه‌های دولتی را ممنوع کرده است.

اما آینده دیپ‌سیک چه خواهد بود؟ هنوز مشخص نیست. بهبود مدل‌ها تقریباً قطعی است. ولی به نظر می‌رسد دولت آمریکا روز به روز نگران‌تر از آن چیزی می‌شود که آن را نفوذ خارجی مضر تلقی می‌کند. در مارس، وال‌استریت ژورنال گزارش داد که ایالات متحده احتمالاً استفاده از دیپ‌سیک را در دستگاه‌های دولتی ممنوع خواهد کرد.