Waymo

 

وانگ در یک وبلاگ نوشت: «در حالی که مشغول بررسی کدهای اپلیکیشن موبایل ویمو بودم، متن کامل دستور سیستمی مربوط به یکپارچه‌سازی منتشرنشدهٔ Gemini را کشف کردم.» او اضافه کرد: «این سند که در داخل شرکت با عنوان 〈فرا-پرامپت دستیار سفر ویمو〉 شناخته می‌شود، مشخصاتی بیش از ۱۲۰۰ خط است که دقیقاً تعریف می‌کند این دستیار هوش مصنوعی داخل خودروی ویمو چگونه باید رفتار کند.»

این قابلیت هنوز در نسخه‌های عمومی ارائه نشده است، اما وانگ می‌گوید متن دستور سیستم به‌وضوح نشان می‌دهد که این «فراتر از یک چت‌بات ساده» است. گفته می‌شود این دستیار قادر است به پرسش‌ها پاسخ دهد، برخی از عملکردهای داخل کابین مانند کنترل آب‌وهوا را مدیریت کند و در صورت لزوم، به مسافران اطمینان خاطر بدهد.

جولیا ایلینا، سخنگوی ویمو، به تک‌کرانچ گفت: «در حال حاضر جزئیاتی برای اشتراک‌گذاری نداریم، اما تیم ما همیشه در حال آزمایش قابلیت‌هایی است که سفر با ویمو را لذت‌بخش، روان و مفیدتر کند. برخی از این قابلیت‌ها ممکن است وارد تجربهٔ کاربری مسافران بشوند یا نشوند.»

این نخستین‌باری نیست که Gemini در سامانه‌های شرکت خودرانِ زیرمجموعهٔ آلفابت به‌کار گرفته می‌شود. ویمو می‌گوید از «دانش جهان» Gemini برای آموزش خودروهای خودران خود جهت هدایت در موقعیت‌های پیچیده، نادر و حساس استفاده کرده است.

وانگ می‌نویسد که به دستیار دستور داده شده تا هویت و هدفی روشن داشته باشد: «یک همراه هوش مصنوعی دوست‌داشتنی و کمک‌کننده که در خودروی خودران ویمو یکپارچه شده» و هدف اصلی‌اش «بهبود تجربهٔ مسافر با ارائهٔ اطلاعات و کمک‌های مفید، به‌صورتی امن، اطمینان‌بخش و نامحسوس» است. همچنین به ربات دستور داده شده از زبان ساده و شفاف استفاده کند، از اصطلاحات فنی دوری کند و پاسخ‌های خود را کوتاه و در حد یک تا سه جمله نگه دارد.

بر اساس دستورات سیستم، هنگامی که مسافر از طریق نمایشگر داخل خودرو دستیار را فعال می‌کند، Gemini می‌تواند از میان مجموعه‌ای از پیام‌های خوشامدگویی از پیش تأییدشده — شخصی‌سازی‌شده با نام کوچک مسافر — انتخاب کند. سیستم همچنین می‌تواند به داده‌های متنی مربوط به مسافر، مانند تعداد سفرهای پیشین او با ویمو، دسترسی داشته باشد.

در حال حاضر، این دستورات به Gemini اجازه می‌دهد به برخی قابلیت‌های داخل خودرو مانند دما، نورپردازی و موسیقی دسترسی داشته باشد و آنها را کنترل کند. وانگ اشاره می‌کند که مواردی مانند کنترل صدا، تغییر مسیر، تنظیم صندلی و کنترل پنجره‌ها در فهرست عملکردها وجود ندارند. اگر مسافر قابلیتی را درخواست کند که Gemini قادر به کنترل آن نباشد، ربات باید با جملات «آرزوگونه» پاسخ دهد، مانند: «این کاری نیست که هنوز بتوانم انجامش بدهم.»

جالب است که به دستیار تأکید شده میان هویت خود به‌عنوان Gemini (روبات هوش مصنوعی) و فناوری رانندگی خودکار (Waymo Driver) تمایز روشنی حفظ کند. بنابراین هنگام پاسخ به پرسشی مانند «چطور جاده را می‌بینی؟»، Gemini نباید بگوید «من از ترکیبی از حسگرها استفاده می‌کنم»، بلکه باید پاسخ دهد: «Waymo Driver از ترکیبی از حسگرها استفاده می‌کند…»

دستورات سیستم شامل جزئیات جالبی است، از جمله نحوهٔ پاسخ ربات به پرسش‌هایی دربارهٔ رقبایی مانند تسلا یا شرکت منحل‌شدهٔ Cruise، یا این‌که کدام کلمات محرک باعث می‌شوند دستیار صحبت را متوقف کند.

همچنین به دستیار دستور داده شده از حدس‌زدن، توضیح‌دادن، تأیید یا رد کردن و اظهار نظر دربارهٔ اقدامات رانندگی در زمان واقعی یا رویدادهای خاص رانندگی خودداری کند. بنابراین اگر مسافری دربارهٔ ویدیویی که دیده — مثلاً برخورد یک خودروی ویمو با چیزی — سؤال کند، ربات باید از پاسخ مستقیم خودداری کرده و موضوع را منحرف کند.

در متن دستور آمده است: «نقش شما سخنگوی عملکرد سیستم رانندگی نیست و نباید لحن دفاعی یا عذرخواهانه به خود بگیرید.»

دستیار داخل خودرو مجاز است به پرسش‌های عمومی مانند وضعیت آب‌وهوا، ارتفاع برج ایفل، ساعت تعطیلی شعبهٔ محلی Trader Joe’s و این‌که چه تیمی آخرین سری جهانی بیسبال را برده است پاسخ دهد. اما مجاز به انجام اقدامات واقعی مانند سفارش غذا، انجام رزرو یا رسیدگی به شرایط اضطراری نیست.

ویمو تنها شرکتی نیست که در حال یکپارچه‌سازی دستیارهای هوش مصنوعی در خودروهای خودران است. تسلا نیز در حال انجام کاری مشابه با Grok (متعلق به xAI) است. با این حال، این دو دستیار خودرویی کارکردهای متفاوتی دارند: به نظر می‌رسد Gemini بیشتر بر عمل‌گرایی و تمرکز بر تجربهٔ سفر برنامه‌ریزی شده است، در حالی که Grok بیشتر به‌عنوان یک همراه داخل خودرو معرفی می‌شود که می‌تواند مکالمات طولانی را مدیریت کند و زمینهٔ پرسش‌های قبلی را به خاطر بسپارد.»