انحصاری: چگونه تراشه Tensor G4 در پیکسل 9 می تواند «تلفن هوش مصنوعی» را دوباره تعریف کند
دلیلی وجود دارد که گوگل تاریخ رویداد Made by Google را به ماه آگوست موکول کرد، اما این شرکت هرگز اعلامیه رسمی نکرد. واضح است که گوگل میخواهد عرضه اولیه پیکسل 9 کمی سر و صدای آیفون 16 آینده را از بین ببرد.
برای انجام این کار، گوگل طیف گستردهای از ویژگیهای هوش مصنوعی Pixel 9 را به نمایش گذاشت، از Add Me برای افزودن شخصی به عکس و سپس Call Notes برای ضبط و خلاصه کردن مکالمات تلفنی. و ویژگی Google Pixel Screenshots می تواند به شما در کشف جزئیات با استفاده از جستارهای زبان طبیعی کمک کند.
همه این ها توسط تراشه جدید Tensor G4 گوگل که به طور خاص برای اجرای پیشرفته ترین مدل های هوش مصنوعی طراحی شده است، پشتیبانی می شود. در واقع، این اولین پردازندهای است که میتواند Gemini Nano را با قابلیت چندوجهی تامین کند، به این معنی که پیکسل 9، پیکسل 9 پرو، پیکسل 9 پرو XL و پیکسل 9 پرو فولد همگی میتوانند متن، تصاویر و صدا را درک کنند.
برای نگاهی دقیق تر به سلاح مخفی هوش مصنوعی گوگل، با Jesse Seed، مدیر محصول گروه Google Silicon، و Zach Gleicher، مدیر محصول Google DeepMind، در مورد آنچه که تراشه Tensor G4 می تواند انجام دهد و چگونه متمایز است صحبت کردم.
تماشا کنید
چه چیزی تراشه Tensor G4 را در دریایی از گوشی های هوشمند متمایز می کند؟
جسی سید: من فکر میکنم بزرگترین نوآوری که امسال انجام دادیم اولین تلفنی بود که سیلیکون و Gemini Nano را به صورت چند وجهی اجرا کرد. و این قفل موارد استفاده بسیار جالب را باز می کند، که یکی از آنها Pixel Screenshots است. اگر میخواهید چیزهایی را به خاطر بسپارید، این بسیار مفید است.
یکی دیگر از ویژگی هایی که به مدل Gemini Nano مربوط نمی شود اما من واقعاً آن را دوست دارم ویژگی Add Me است. کسانی از ما که عکاس خانواده یا تیم ما هستند، قطعا از اینکه بتوانیم عکاس را به صورت پویا اضافه کنیم، قدردانی خواهیم کرد. و این چیزی است که ما سخت روی تنظیم بیش از 15 مدل مختلف یادگیری ماشین و همچنین استفاده از Google Augmented Reality SDK کار کرده ایم.
چگونه چیزی به پیشرفتهای Gemini Nano را در گوشی جا دادید؟
زک گلیچر: در DeepMind، ما با تیمهای زیادی در سراسر Google همکاری میکنیم و میخواهیم مطمئن شویم که در حال ساخت مدلهای Gemini هستیم که نیازهای همه محصولات Google را برآورده میکند. بنابراین، همانطور که Gemini را با همکاری Android و Pixel توسعه دادیم، متوجه شدیم که نیاز به مدلهای روی دستگاه وجود دارد. ما این را به عنوان یک چالش دیدیم زیرا همه در سمت سرور به دنبال مدل های بالقوه بزرگتر و توانمندتر بودند. از سوی دیگر، محدودیت های حافظه، محدودیت های مصرف برق و غیره وجود دارد. ما همه این محدودیت های جالب را داشتیم که قبلا وجود نداشت.
بنابراین، با همکاری تیم Tensor و Pixel، توانستیم دور هم جمع شویم و بفهمیم که موارد استفاده کلیدی برای این مدلهای روی دستگاه چیست، چه محدودیتهایی برای این مدلهای روی دستگاه وجود دارد، و در واقع یک مدل را با هم توسعه دهیم. این یک تجربه واقعاً هیجانانگیز بود و ساخت چیزی را امکانپذیر ساخت که بسیار قادر و قادر به پشتیبانی از این موارد استفاده باشد.
چه چیزی در مورد تراشه G4 برای افرادی که 3 تا 4 سال است گوشی خود را به روز نکرده اند برجسته می شود؟
بذر: به همین دلیل برای ما بسیار مهم است که آنچه را که اصول اولیه می نامیم، مانند قدرت و عملکرد، بهبود بخشیم. تراشه نسل چهارم ما، Tensor G4، کارآمدترین و با عملکرد بالا است. بنابراین ما معتقدیم که کاربران این را در تجربیات روزمره مانند عملکرد وب یا مرور وب، راه اندازی برنامه و چابکی کلی رابط کاربری مشاهده خواهند کرد. من فکر می کنم این یک تجربه واقعا روان است. این را در مواردی مانند عملکرد وب به طور متوسط 20٪ سریعتر و راه اندازی برنامه ها 17٪ سریعتر خواهید دید.
اما در مورد عملکرد بازی واقعا برای افرادی که این روزها یک گوشی جدید می خرند چه اهمیتی دارد؟
بذر: بنابراین در آزمایش خود، شاهد بهبودهایی در عملکرد اوج و بلندمدت در بازیهای در حال اجرا بر روی پلتفرم و در بازیهای عمومی بودیم.
Tensor G4 چگونه به عمر باتری کمک می کند؟
بذر: ما راندمان برق را در بسیاری از موارد استفاده روزانه بهبود بخشیده ایم. بنابراین مواردی مانند فیلمبرداری، عکسبرداری، مرور شبکههای اجتماعی – همه اینها نسبت به نسل قبلی انرژی کمتری مصرف میکنند.
همه اینها 20٪ عمر باتری اضافی را که در بحث اصلی ذکر کردید افزایش می دهد. بنابراین، تنسور G4 تقریباً 20٪ عمر باتری بهتری دارد و به این امر کمک می کند.
کدام یک از ویژگی های هوش مصنوعی ارائه شده توسط Gemini در تلفن های پیکسل 9 شما را بیشتر هیجان زده می کند؟
با تشکر: برخی از انگیزههای اصلی تیم Tensor و تیم Pixel که برای موارد استفاده روی دستگاه به ما مراجعه کنند، قابلیت اطمینان بهتر است. این بدان معنی است که شما مجبور نیستید به اتصال اینترنت تکیه کنید، تجربه می تواند قابل اعتماد باشد و در هر کجا که هستید کار کند.
چیز دیگری که ما به آن فکر می کنیم حفظ حریم خصوصی است. اگر توسعهدهندگان نمیخواهند دادهها واقعاً از دستگاه جدا شده و به طور کامل روی دستگاه پردازش شوند، این امکان با LLM در دستگاه وجود دارد.
چیزی که من از نظر ویژگی های هوش مصنوعی هیجان زده هستم، اسکرین شات های پیکسل واقعا عالی هستند. فکر میکنم این واقعاً نشان میدهد که چگونه میتوانیم این ویژگیهای چند وجهی را که در دموها میبینید، روی دستگاه کار کنیم. واقعاً سریع بود، تأخیر کم داشت، اما همچنین فوق العاده توانا بود. و تمام این اطلاعات و داده ها به صورت محلی در دستگاه شما ذخیره می شوند و می توانند به صورت محلی پردازش شوند. بنابراین ما واقعاً هیجانزده هستیم که Gemini nano میتواند این نوع تجربهها را فعال کند.
من فکر می کنم ما شروع به دیدن کشش برای موارد استفاده خلاصه و پاسخ های هوشمند کرده ایم.
عکسهای صفحهنمایش پیکسل با Windows Recall که به خاطر نگرانیهای مربوط به حفظ حریم خصوصی مورد انتقاد قرار گرفته است، چه تفاوتی دارد؟
بذر: یکی از راههایی که ما از حریم خصوصی کاربر محافظت میکنیم، داشتن یک مدل توانمند روی دستگاه است. به این ترتیب، هیچ یک از تجزیه و تحلیل های انجام شده روی آن اسکرین شات از دستگاه خارج نمی شود. این یکی از راههایی است که میتوانیم به نگرانی حریم خصوصی رسیدگی کنیم.
من فکر می کنم چیز دیگر این است که به کاربران اجازه دهیم تصمیم بگیرند که چه کاری می خواهند انجام دهند، مانند اینکه چگونه می خواهند از چیزی مانند Gemini استفاده کنند. و مانند موارد استفاده آنها در تعامل با آنها احساس راحتی می کنند و کدام را ندارند. بنابراین من فکر می کنم که واقعاً به انتخاب کاربر بستگی دارد. اما در این مورد [of] به طور خاص، اسکرینشاتهای پیکسل یک مورد استفاده کاملاً خاص دستگاه هستند.
ما تمام معیارهای معمول را با Tensor G4 انجام خواهیم داد، اما عصر هوش مصنوعی نیز چیزها را تغییر می دهد. نظر شما در مورد عملکرد این تراشه چیست؟
بذر: من فکر می کنم همه چیز بر اساس موارد استفاده در دنیای واقعی است. مثلاً، این چیز در دست چگونه عمل می کند؟ بنابراین من فکر میکنم مواردی مانند سرعت پاسخ مرور وب، سرعت راهاندازی برنامهها، سرعت و پاسخگویی رابط کاربری همه موارد استفاده روزمره هستند. اینها چیزهای استاندارد خوبی هستند که باید به آنها نگاه کرد.
اما از دیدگاه هوش مصنوعی چطور؟ چه زمانی یک تلفن پیکسل تست عملکرد شما را با موفقیت پشت سر می گذارد؟
با تشکر: هنگامی که به معیارهای LLM و Gemini فکر می کنیم، و به ویژه هنگامی که به Gemini Nano فکر می کنیم، تمرکز عظیمی از صنعت بر روی معیارهای آکادمیک مشاهده می کنیم. و معیارهای آکادمیک مانند MMLU عالی هستند زیرا یک معیار مشترک را ارائه می دهند. اما اینها را می توان گیمیفی کرد و مردم می توانند برای آنها بهینه سازی کنند. و ممکن است چیزی را که واقعاً به آن اهمیت می دهید، نشان ندهد.
برای یک مدل روی دستگاه، ما واقعاً اهمیتی نمی دهیم که او سؤالات پیشینه خود را بداند. ما فکر می کنیم که این احتمالاً مورد استفاده بهتری برای یک مدل سمت سرور است. آنچه ما به آن اهمیت می دهیم موارد استفاده مانند خلاصه سازی است.
همچنین باید محدودیت هایی مانند مصرف باتری را در نظر بگیریم. ما باید مطمئن شویم که مدل عملکرد خوبی دارد و باتری زیادی مصرف نمی کند. و چون تاخیر هم خوب است. بنابراین ما در واقع با تیم Tensor شریک می شویم و این مدل ها را با هم طراحی می کنیم و مدل های خود را نمایه می کنیم و مطمئن می شویم که معماری خوبی به دست می آوریم.
بذر: این فقط در مورد معیارهای عملکرد سنتی نیست، بلکه به کیفیت نیز مربوط می شود. بنابراین اگر به مواردی مانند کیفیت پاسخ های مدل یا حتی کیفیت عکس نگاه کنید. این چیزی است که کاربران دنیای واقعی بیشتر از یک عدد در کنار جعبه ای که در دست دارند به آن اهمیت می دهند.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide