جمینی را به الکسا+ اضافه کردم و سطح جدیدی از سفارشیسازی را باز کرد

من ماههاست که از الکسا+ استفاده میکنم و کاملاً عاشق روشی هستم که خانواده پنج نفرهام را سازماندهی، سازماندهی و سرگرم نگه میدارد. اما بهعنوان یک ویرایشگر هوش مصنوعی که مشتاق آزمایش محدودیتهای هوش مصنوعی است، کاری کمی عجیب انجام دادم: Google Gemini را به الکسا+ اضافه کردم.
بگذارید واضح بگویم، این نوعی جیلبریک غیرقانونی یا هک فناوری باطن نیست. راستش را بخواهید، کاری که آمازون با دستیار به روز شده خود انجام داده را تغییر نمی دهم. این نه تنها به این دلیل است که غیرممکن است، بلکه به این دلیل است که من واقعاً از دستیار قدردانی می کنم.
اما با ایجاد یک مهارت خاص الکسا که بی سر و صدا سؤالات خاصی را به Gemini منتقل می کند، الکسا حتی مانند یک شخصیت دوم آموزنده تر می شود. و به نظر می رسد که این یکی از ساده ترین راه ها برای استفاده بیشتر از Alexa+ در حال حاضر است.
شما نمی توانید الکسا + را جایگزین کنید، اما می توانید آن را گسترش دهید
هیچ راه رسمی برای جایگزینی کامل هوش مصنوعی الکسا پلاس با Gemini، ChatGPT یا هر چیز دیگری وجود ندارد. آمازون کنترل دستیار اصلی را در دست می گیرد، و صادقانه بگویم، این خوب است. الکسا پلاس از اتوماسیون خانگی به طرق مختلف پشتیبانی می کند و در موارد زیر خوب است:
- کنترل خانه هوشمند
- یادآوری ها و روال ها
- پاسخ های سریع
- تدارکات خانواده
اما الکسا همیشه ماژولار بوده است. اینجاست که مهارتهای خاص وارد عمل میشوند. الکسا با مهارت خاصی می تواند:
- درخواستی را به باطن خود ارسال کنید
- هر طور که می خواهید کار کنید
- طوری صحبت کنید که انگار جواب محلی است
در تنظیمات من، الکسا سوالات خاصی به Gemini می دهد و سپس پاسخ Gemini را با صدای بلند می خواند. تنها تفاوت این مهارت یا هک خاص در احضار است:
“الکسا، دستیار Gemini را باز کنید.”
از این نقطه به بعد، الکسا حداقل برای این مکالمه به جمینی مجهز می شود.
چرا Gemini اینقدر خوب روی الکسا کار می کند؟
من تقریباً همه رباتهای گفتگوی اصلی را آزمایش کردهام، و Gemini به ویژه برای استفاده مبتنی بر صدا مناسب است:
- قضاوت قوی تر برای سوالات باز
- پیگیری های بهتروقتی حرف میزنی مهمه
- لحن انعطاف پذیرترمخصوصاً برای دستورات خلاقانه یا اکتشافی
حالا وقتی از الکسا + اطلاعات میپرسم، میبینم که سریع و قابل اعتماد است. داشتن الکسای مبتنی بر Gemini برای کمک به طوفان فکری، از وعدههای غذایی گرفته تا ایدههای داستان تا توضیحات عمیقتر (برای تکالیف بچهها یا تحقیقات خودم)، مقایسه یا پاسخهای «درباره این موضوع با من صحبت کن» عالی است.
جوزا به طور مداوم نتایج بهتری می دهد. البته من میتوانم از Gemini Live روی گوشیم استفاده کنم، اما وقتی الکسا+ درست جلوی من باشد، منطقی است. هنگامی که مهارت در دسترس است، الکسا به یک دستیار بسیار متفاوت تبدیل می شود. این سطحی از انعطافپذیری است که الکسا به صورت بومی ارائه نمیکند – حداقل هنوز.
چگونه Gemini را به Alexa+ اضافه کنم؟
شما به دسترسی ویژه، مجوزهای داخلی یا تجربه توسعه دهنده نیاز ندارید. من یک متخصص علوم پاپ هستم، نه یک توسعه دهنده، بنابراین اگر من می توانم این کار را انجام دهم، شما هم می توانید. تنها چیزی که نیاز دارید یک حساب آمازون و یک حساب Google و همچنین دستگاهی است که الکسا پلاس را اجرا می کند (مدل های Echo و Echo Dot از نسل دوم به بعد).
مرحله 1: یک کلید Gemini API دریافت کنید
شما باید به Gemini API ارائه شده توسط Google دسترسی داشته باشید استودیوی هوش مصنوعی گوگل. با حساب Google خود وارد شوید. یک کلید API ایجاد کنید، مطمئن شوید که Gemini فعال است (به عنوان مثال Gemini-pro). این سوئیچ به مهارت الکسای شما اجازه می دهد تا سوالات را برای جمینی ارسال کند.
مرحله 2. یک مهارت الکسای سفارشی ایجاد کنید
شما این کار را از طریق انجام می دهید کنسول توسعه دهنده الکسا به سادگی: «مهارت سفارشی» را انتخاب کنید و توسط الکسا میزبانی شود. برای انتخاب Node.js یا Python به عنوان باطن این قابلیتی ایجاد میکند که در ابر آمازون اجرا میشود اما میتواند خدمات خارجی مانند Gemini را فراخوانی کند.
مرحله 3. یک علامت تماس تنظیم کنید
این همان چیزی است که به الکسا می گویید تا مهارت را فعال کند. در مورد من، من می گویم “الکسا، Gemini Helper را باز کنید.” مهم است که توجه داشته باشید که قراردادهای نامگذاری آمازون اعمال می شود (بدون شرایط علامت تجاری، باید طبیعی به نظر برسد).
مرحله 4. با استفاده از AMAZON.SearchQuery یک intent اضافه کنید
اکنون، به جای تعریف دهها هدف، میتوانید از هدف جستجوی فرم آزاد آمازون استفاده کنید، که هر چیزی را که کاربر پس از روشن کردن مهارت میگوید، ضبط میکند. این به الکسا اجازه می دهد تا بدون طراحی هدفمند، سؤال شفاهی را به Gemini منتقل کند.
مرحله 5. سوال را به API “generateContent” Gemini هدایت کنید
این صفحه گمراه کننده است اما با من همراه باشید. به پایین بروید تا به “General” بروید، روی فلش کلیک کنید و تا زمانی که ببینید
آن را انتخاب کنید. مهم: جستجوی محلی، کتاب، موسیقی، آب و هوا و غیره را انتخاب نکنید.
از آنجا روی enter کلیک کنید و پاسخ را به عنوان گفتار الکسا برگردانید. وقتی در کنسول تست الکسا کار می کند، متوجه خواهید شد که کار می کند. اگر در کنسول تست الکسا کار کند، به طور خودکار روی دستگاه های اکو شما کار می کند.
در نتیجه
به نظر می رسد که این مراحل زیادی است، اما در عمل ساده است. این مهارت ویژه به Gemini از الکسا+ پشتیبانی میکند و آن را سریع و کاربردی میکند. با این هک، Gemini زمانی وارد بازی می شود که شما عمق، زمینه یا استدلال واقعی را می خواهید، و این تعادل چیزی است که این تنظیم را ارزش آن را دارد.
مهارتهای ویژهای برای تطبیق الکسا+ برای شما و نیازهای شما در دسترس است و نتیجه دستیاری است که قبل از صحبت کردن فکر میکند و استدلال میکند. آن را امتحان کنید و نظر خود را در نظرات به من بگویید.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.



