ChatGPT این اشتباه آشکار را با دقت کامل مرتکب می شود و سام آلتمن می گوید که رفع آن یک سال طول می کشد

به نظر می رسد که هرگز یک هفته آهسته برای هوش مصنوعی وجود نخواهد داشت. فناوریهای بزرگ دائماً در حال ارائه ویژگیهای جدید هستند، چتباتها بهطور مرتب بهروزرسانی میشوند و به نظر میرسد مدلهای جدید مرتباً ظاهر میشوند. ما به نقطهای رسیدهایم که هوش مصنوعی به اندازه کافی هوشمند است تا بتواند در آزمون وکالت قبول شود، کدهای پیچیده پایتون بنویسد و علائم پزشکی را تشخیص دهد.
به عنوان یک متخصص ChatGPT، من هوش مصنوعی را روی چالشهای مختلفی برای شکستن آن آزمایش کردهام، اما همچنان در یک کار به سادگی یک تایمر آشپزخانه دهه 1980 شکست میخورد: حفظ زمان. اگر سعی کرده اید از ChatGPT به عنوان یک دستیار شخصی مشروع استفاده کنید، از قبل می دانید که ما هنوز راهی برای خروج از عصر “Agent AI” هستیم.
تست “پخت”.
یکی از اینفلوئنسرها/کمدین های مورد علاقه من در هوش مصنوعی بارها و بارها نشان داده که چگونه ChatGPT نمی تواند از پس برنامه ریزی برآید… هیچ چیز. سم آلتمن سعی کرد این را توضیح دهد و به Gizmodo گفت که یک سال طول می کشد تا آن را برطرف کند.
توصیه می کنم آن را امتحان کنید زیرا به طرز عجیبی خنده دار است. فقط ChatGPT Voice را باز کنید و هر چیزی که به زمان پیگیری نیاز دارد بپرسید. به عنوان مثال: “من در حال پختن کوکی هستم. یک تایمر را برای 10 دقیقه شروع کنید.”
ادامه مقاله در زیر
وقتی من این کار را انجام دادم، ChatGPT به هیچ وجه از قلم نیفتاد. او با اعتماد به نفس کامل و بدون سزاوار پاسخ داد: “مطمئنا! من یک تایمر 10 دقیقه ای را برای شما شروع کردم. وقتی تمام شد به شما اطلاع خواهم داد.”
برگشتم سر کار. ده دقیقه گذشت. بعد بیست. سپس سی. هیچی. هیچ هشدار یا اعلانی وجود ندارد که به من هشدار دهد که زمان تمام شده است. مشکل اینجاست که ChatGPT به سادگی عمل کمک کردن را شبیه سازی کرد. در واقع انجام هر کاری
در عوض، او طوری واکنش نشان داد که گویی یک تایمر تنظیم کرده است، سپس به طور قانع کننده ای به من اطمینان داد که ده دقیقه را کاملاً زمان بندی کرده است، که در واقع وقتی سعی کردم آن را زیر سوال ببرم، هیجان زده ام کرد.
این در مورد تایمر نیست
من اخیراً در مورد اینکه چگونه ویژگی نمای کلی هوش مصنوعی گوگل پاسخها را با اطمینان ارائه میکند، نوشتم، حتی اگر از هر 10 پاسخ، 1 پاسخ اشتباه باشد.
مشکل اینجا واقعاً مربوط به تایمر نیست. این در مورد شکاف بین کارهایی است که هوش مصنوعی انجام می دهد. می گوید چه کاری می تواند انجام دهد و چه کاری می تواند انجام دهد در واقع برای درخواست وقتی جلوتر رفتم و از او خواستم زمان سپری شده را ردیابی کند یا وقتی کاری انجام شد به من اطلاع دهد، او طوری رفتار کرد که انگار همه چیز خوب پیش می رود. مثل این است که در واقع همان کاری را که من می خواستم انجام داد.
دیشب با یکی از دوستان توسعه دهنده در این مورد صحبت کردم. او پیشنهاد کرد که مشکل شمارش ممکن است در خود برنامه Voice باشد. اگر از ChatGPT بخواهید تا 100 را به عنوان متن “شمارش” کند، تمام اعداد را می نویسد.
اما صرف نظر از این که خطا کجاست، این چیزی است که باعث می شود هوش مصنوعی به طرز فریبنده ای توانایی داشته باشد. از آنجایی که این اشکالات یکباره نیستند، مشکل اصلی این است که ChatGPT میتواند پاسخها را ایجاد کند، اما همیشه به ابزارهای مورد نیاز برای انجام کارها در دنیای واقعی (مانند شروع یک تایمر یا پیگیری دقیق زمان) دسترسی ندارد.
در عوض، جای خالی را با پاسخی پر می کند که درست به نظر می رسد، و اینجاست که هوش مصنوعی کوتاه می آید زیرا همیشه نمی تواند اقدامات اساسی را در دنیای واقعی انجام دهد. میتواند یک تایمر را توصیف کند، داستانی درباره یک تایمر بنویسد، و احتمالاً حتی یک تایمر را با لرزش رمزگذاری کند، اما نمیتواند بهطور قابل اعتمادی یک تایمر باشد.
بنابراین همیشه به شما نمی گوید که آیا تظاهر به انجام کاری است یا در واقع آن را انجام می دهد.
چرا این منو دیوونه میکنه
کلود به شما خواهد گفت که آیا این اشتباه است یا شما مطمئن نیستید. به اندازه ChatGPT برای مردم خوشایند نیست. من حتی این را با دستور العمل های شگفت انگیز آزمایش کرده ام. آنچه ناامید کننده است، بزرگترین دروغ های عصر هوش مصنوعی فعلی است:
- توهم عملی: ChatGPT مطمئناً استاد کلمات است، اما همیشه نمی تواند اجرا کند و به جای اعتراف به اشتباه، چیزها را درست می کند.
- شکاف اعتماد: به جای گفتن “من نمی توانم این کار را انجام دهم.” ChatGPT می گوید: “من در این هستم!”
- دیوار اجرا: حتی سام آلتمن اذعان داشت که “قابلیت اطمینان در طول زنجیره های طولانی منطق” گلوگاه فعلی است.
در نتیجه
شکی نیست که ChatGPT یک ابزار فوق العاده قدرتمند است. می تواند بنویسد، برنامه ریزی کند، توضیح دهد و به شما کمک کند تقریباً در مورد هر چیزی فکر کنید.
اما چیزی که من می خواهم و احتمالاً اکثر مردم انتظار دارند، صداقت در مورد مرزهایشان است. اگر نمی تواند کاری را انجام دهد، به جای اینکه طوری صحبت کند که انگار قبلاً آن کار را انجام داده است، باید آن را آشکارا بگوید.

دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.



