من به تازگی کار بر روی هوش بصری را در آیفون 16 شروع کردم – این بسیار بزرگ است
هوش بصری یکی از بزرگترین ویژگیهای جدیدی بود که به عنوان بخشی از معرفی سری آیفون 16 معرفی شد، اما کاربران تاکنون به این ویژگی دسترسی نخواهند داشت. اما با انتشار نسخه بتای توسعهدهنده iOS 18.2، همه کاربرانی که در Apple Developer ثبتنام میکنند میتوانند آن را امتحان کنند، این دقیقاً همان کاری است که من انجام میدهم.
اپل هوش بصری را به عنوان راهی برای کمک به شما در مورد هر چیزی که می خواهید بدانید، دقیقاً در مقابل شما از طریق دوربین تلفن خود معرفی می کند. حتی زمانی که آیفون 16 شما قفل است، میتوانید به سرعت به هوش بصری دسترسی پیدا کنید و با نگهداشتن Camera Control برخی از پاسخها را دریافت کنید. این اساساً رویکرد اپل به Google Lens یا Circle to Search است، اما با این استثنا که محدود به سری آیفون 16 است.
کاربردهای بالقوه زیادی برای هوش بصری وجود دارد، اما برای اولین برداشت من تا جایی که می توانستم تلاش کردم. به نظر نمی رسد که همه چیزهایی که اپل وعده داده است هنوز آماده باشد، اما برای چشیدن طعم تلاش های اپل کافی است.
هوش بصری: ویژگی ها
روشن کردن هوش بصری با کنترل دوربین بسیار ساده است و با یک فلاش رنگین کمانی سرگرم کننده برای نشان دادن فعال بودن آن ارائه می شود. سپس می توانید از کنترل دوربین برای گرفتن عکس (همراه با دکمه شاتر روی صفحه) استفاده کنید یا تا 3 برابر بزرگنمایی کنید. با این حال، این زوم دیجیتال است که می تواند عکس های تاری ایجاد کند که خواندن را برای DoP دشوار می کند. امیدواریم اپل در آینده پشتیبانی از زوم دوربین تله فوتو را به آیفونهای سازگار اضافه کند.
پس از گرفتن عکس، از نظر تئوری می توانید انواع چیزها را یاد بگیرید، مانند جزئیات مکان یا نظرات و ساعات کاری یک فروشگاه یا رستوران. در حالی که میتوانستم این کار را از طریق عملکرد جستجو انجام دهم، نتوانستم فوراً آنها را به نمایش بگذارم، همانطور که اپل در کلیپهای نمایشی نشان میدهد، علیرغم اینکه این ویژگی میتواند موقعیت مکانی من را شناسایی کند.
شاید به این دلیل است که من از آن در بریتانیا استفاده میکنم، که یک قدم عقبتر از ایالات متحده در عرضه Apple Intelligence است، یا به این دلیل که این قابلیت در نسخه بتا بعدی ظاهر میشود. حداقل در حال حاضر میتوانید از عملکرد جستجوی Google برای به دست آوردن مؤثر همان اطلاعات استفاده کنید.
اگر متن کافی برای خواندن در تصویر وجود دارد، هوش بصری میتواند خلاصهای سریع برای شما ایجاد کند، مشابه آنچه میتوانید در اعلانها یا هنگام تایپ در برنامه Notes انجام دهید، یا اگر نمیتوانید یا نمیتوانید آن را با صدای بلند بخوانید. نمی خواهم. برای خواندن در آن لحظه این برای یک نمای کلی به سبک آخرین خط یک پیام خوب عمل می کند، اما شما به آنچه می توانید در منظره یاب بگنجانید محدود هستید. علائم، پوسترها و اسناد دنیای واقعی همیشه به گونه ای طراحی نشده اند که به خوبی روی صفحه نمایش تلفنی قرار گیرند.
هر متنی که توسط هوش بصری شناسایی شود را می توان در جای دیگری کپی و جایگذاری کرد. به عنوان مثال، اگر می خواهید چیزی را که پاس کرده اید یادداشت کنید و بعداً به آن نگاه کنید. این قابلیتی است که از زمانی که Live Text در iOS 15 معرفی شد، میتوانید با تصاویر روی آیفون خود انجام دهید، اما انتخاب هوشمندانهای است که آن را در اینجا نیز قرار دهید.
داستان مشابه با توانایی هوش بصری برای اسکن کدهای QR. باز هم، این کاری است که دوربین معمولی آیفون شما می تواند انجام دهد، اما هیچ اشکالی ندارد که در حالت هوش بصری نیز در دسترس باشد.
همچنین اگر متنی به زبانی غیر از زبان مورد استفاده شما نوشته شده باشد، می توانید ترجمه کنید. بنابراین اکنون دقیقاً می دانم که نام رستوران ایتالیایی نزدیک دفتر TG به چه معناست.
به نظر من، چشمگیرترین کاری که هوش بصری در حال حاضر می تواند انجام دهد این است که شماره تلفن، ایمیل و تاریخ ها را از یک تصویر بیرون بکشد و اقدامات بعدی را پیشنهاد دهد. میتوانید فوراً با یک کشیدن انگشت به این شمارهها یا ایمیلها پیام ارسال کنید، آنها را به مخاطبین خود اضافه کنید یا با چند ضربه یک رویداد تقویم ایجاد کنید.
فراتر از ویژگیهای روی دستگاه، هوش بصری به شما امکان میدهد یک جستجوی بصری برای یک مورد در Google راهاندازی کنید، و هر بار که از آن استفاده کردهام این برای من کاملاً کار کرده است. به عنوان مثال، لیوان من را با دقت توصیف کرد و برخی از وب سایت های مرتبط را برای کسب اطلاعات بیشتر یا خرید لیوان دیگری ارائه داد.
شاید بیشترین پتانسیل، گزینه ای برای بررسی بیشتر نمای هوش بصری از طریق ادغام ChatGPT باشد، ویژگی که به نسخه بتای iOS 18.2 نیز اضافه شده است. با این حال، پیغام خطایی دریافت میکردم مبنی بر اینکه ChatGPT قادر به استفاده از اسکرینشاتهای هوش بصری نیست. همچنین زمانی که سعی کردم به حساب OpenAI خود وارد شوم تا ببینم آیا این مشکل را برطرف می کند، مرتباً خطاهایی دریافت می کردم. دوستان، این یک سبک زندگی بتا است، بنابراین ما باید در تاریخ بعد، بخشهای هوش بصری مبتنی بر ChatGPT را دوباره مرور کنیم.
هوش بصری: ظاهر
در حالی که هنوز کارهای زیادی برای انجام دادن در این مرحله وجود دارد، هوش بصری قبلاً من را تحت تأثیر قرار داده است. شبیه Circle to Search است که برای ارائه اطلاعات و خدمات مشابه به جز روی صفحه شما طراحی شده است.
Circle to Search میتواند مانند هوش بصری عمل کند، اگر آن را در حالی که دوربین روشن است فعال کنید و به آنچه میخواهید جستجو کنید نگاه کنید. اما Visual Intelligence طوری طراحی شده است که با iOS و برنامه های مرتبط با آن بسیار یکپارچه تر کار کند. این شرم آور است که فقط به آخرین آیفون ها محدود شده است.
هنوز راه زیادی تا ورود هوش بصری به دستگاههای آیفون 16 کاربران معمولی باقی مانده است و امیدواریم این تنها راهی باشد که این ویژگی با بهبود نسخههای بتا آینده در دسترس خواهد بود. در حالی که ما قبلاً سری آیفون 16 را دوست داریم، اضافه شدن هوش بصری در نهایت به آن یک ویژگی کاملاً جدید نسبت به آیفون های قبلی می دهد و به ارتقا دهندگان احتمالی دلیلی برای ارتقاء می دهد.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide