
وانگ در یک وبلاگ نوشت: «در حالی که مشغول بررسی کدهای اپلیکیشن موبایل ویمو بودم، متن کامل دستور سیستمی مربوط به یکپارچهسازی منتشرنشدهٔ Gemini را کشف کردم.» او اضافه کرد: «این سند که در داخل شرکت با عنوان 〈فرا-پرامپت دستیار سفر ویمو〉 شناخته میشود، مشخصاتی بیش از ۱۲۰۰ خط است که دقیقاً تعریف میکند این دستیار هوش مصنوعی داخل خودروی ویمو چگونه باید رفتار کند.»
این قابلیت هنوز در نسخههای عمومی ارائه نشده است، اما وانگ میگوید متن دستور سیستم بهوضوح نشان میدهد که این «فراتر از یک چتبات ساده» است. گفته میشود این دستیار قادر است به پرسشها پاسخ دهد، برخی از عملکردهای داخل کابین مانند کنترل آبوهوا را مدیریت کند و در صورت لزوم، به مسافران اطمینان خاطر بدهد.
جولیا ایلینا، سخنگوی ویمو، به تککرانچ گفت: «در حال حاضر جزئیاتی برای اشتراکگذاری نداریم، اما تیم ما همیشه در حال آزمایش قابلیتهایی است که سفر با ویمو را لذتبخش، روان و مفیدتر کند. برخی از این قابلیتها ممکن است وارد تجربهٔ کاربری مسافران بشوند یا نشوند.»
این نخستینباری نیست که Gemini در سامانههای شرکت خودرانِ زیرمجموعهٔ آلفابت بهکار گرفته میشود. ویمو میگوید از «دانش جهان» Gemini برای آموزش خودروهای خودران خود جهت هدایت در موقعیتهای پیچیده، نادر و حساس استفاده کرده است.
وانگ مینویسد که به دستیار دستور داده شده تا هویت و هدفی روشن داشته باشد: «یک همراه هوش مصنوعی دوستداشتنی و کمککننده که در خودروی خودران ویمو یکپارچه شده» و هدف اصلیاش «بهبود تجربهٔ مسافر با ارائهٔ اطلاعات و کمکهای مفید، بهصورتی امن، اطمینانبخش و نامحسوس» است. همچنین به ربات دستور داده شده از زبان ساده و شفاف استفاده کند، از اصطلاحات فنی دوری کند و پاسخهای خود را کوتاه و در حد یک تا سه جمله نگه دارد.
بر اساس دستورات سیستم، هنگامی که مسافر از طریق نمایشگر داخل خودرو دستیار را فعال میکند، Gemini میتواند از میان مجموعهای از پیامهای خوشامدگویی از پیش تأییدشده — شخصیسازیشده با نام کوچک مسافر — انتخاب کند. سیستم همچنین میتواند به دادههای متنی مربوط به مسافر، مانند تعداد سفرهای پیشین او با ویمو، دسترسی داشته باشد.
در حال حاضر، این دستورات به Gemini اجازه میدهد به برخی قابلیتهای داخل خودرو مانند دما، نورپردازی و موسیقی دسترسی داشته باشد و آنها را کنترل کند. وانگ اشاره میکند که مواردی مانند کنترل صدا، تغییر مسیر، تنظیم صندلی و کنترل پنجرهها در فهرست عملکردها وجود ندارند. اگر مسافر قابلیتی را درخواست کند که Gemini قادر به کنترل آن نباشد، ربات باید با جملات «آرزوگونه» پاسخ دهد، مانند: «این کاری نیست که هنوز بتوانم انجامش بدهم.»
جالب است که به دستیار تأکید شده میان هویت خود بهعنوان Gemini (روبات هوش مصنوعی) و فناوری رانندگی خودکار (Waymo Driver) تمایز روشنی حفظ کند. بنابراین هنگام پاسخ به پرسشی مانند «چطور جاده را میبینی؟»، Gemini نباید بگوید «من از ترکیبی از حسگرها استفاده میکنم»، بلکه باید پاسخ دهد: «Waymo Driver از ترکیبی از حسگرها استفاده میکند…»
دستورات سیستم شامل جزئیات جالبی است، از جمله نحوهٔ پاسخ ربات به پرسشهایی دربارهٔ رقبایی مانند تسلا یا شرکت منحلشدهٔ Cruise، یا اینکه کدام کلمات محرک باعث میشوند دستیار صحبت را متوقف کند.
همچنین به دستیار دستور داده شده از حدسزدن، توضیحدادن، تأیید یا رد کردن و اظهار نظر دربارهٔ اقدامات رانندگی در زمان واقعی یا رویدادهای خاص رانندگی خودداری کند. بنابراین اگر مسافری دربارهٔ ویدیویی که دیده — مثلاً برخورد یک خودروی ویمو با چیزی — سؤال کند، ربات باید از پاسخ مستقیم خودداری کرده و موضوع را منحرف کند.
در متن دستور آمده است: «نقش شما سخنگوی عملکرد سیستم رانندگی نیست و نباید لحن دفاعی یا عذرخواهانه به خود بگیرید.»
دستیار داخل خودرو مجاز است به پرسشهای عمومی مانند وضعیت آبوهوا، ارتفاع برج ایفل، ساعت تعطیلی شعبهٔ محلی Trader Joe’s و اینکه چه تیمی آخرین سری جهانی بیسبال را برده است پاسخ دهد. اما مجاز به انجام اقدامات واقعی مانند سفارش غذا، انجام رزرو یا رسیدگی به شرایط اضطراری نیست.
ویمو تنها شرکتی نیست که در حال یکپارچهسازی دستیارهای هوش مصنوعی در خودروهای خودران است. تسلا نیز در حال انجام کاری مشابه با Grok (متعلق به xAI) است. با این حال، این دو دستیار خودرویی کارکردهای متفاوتی دارند: به نظر میرسد Gemini بیشتر بر عملگرایی و تمرکز بر تجربهٔ سفر برنامهریزی شده است، در حالی که Grok بیشتر بهعنوان یک همراه داخل خودرو معرفی میشود که میتواند مکالمات طولانی را مدیریت کند و زمینهٔ پرسشهای قبلی را به خاطر بسپارد.»