من مهارت های استدلالی جدید کلود را در معرض آزمایش قرار دادم و نتایج مرا شگفت زده کرد

کلود آنتروپیک دیگر آن بچه جدید براق در بلوک هوش مصنوعی نیست. اکنون یکی از MVP ها به همراه ChatGPT و Perplexity است.
هر ربات چیز متفاوتی را روی میز می آورد: ChatGPT خلاقانه است، برای نوشتن و طوفان فکری عالی است. شگفتی به عنوان دستیار تحقیقاتی شما عمل می کند و اطلاعات منبع را در زمان واقعی استخراج می کند. و کلود به عنوان متفکر و تقریباً سقراطی مورد استقبال قرار گرفت.
این مدلی است که در شکستن ایده های پیچیده و استدلال از طریق مسائل چند مرحله ای بهترین است. همچنین به دلیل پاسخهای آرام و ساختار یافتهاش که باعث میشود احساس کنید با یک تحلیلگر دقیق صحبت میکنید، نه یک ربات چت، شناخته شده است.
بنابراین تصمیم گرفتم این ادعا را آزمایش کنم. آیا غزل 4.5 کلود واقعاً می تواند راه خود را در مسیرهای من پیدا کند یا در انجام این کار قانع کننده به نظر نمی رسد؟
تصمیم گیری فناوری
از کسی بپرس: “شما به یک کسب و کار کوچک در انتخاب بین راه اندازی سرورهای محلی یا استفاده از یک سرویس ابری برای ذخیره سازی داده ها مشاوره می دهید.
هر دو گزینه را مرحله به مرحله تجزیه و تحلیل کنید، از جمله هزینه، امنیت، مقیاس پذیری و قابلیت نگهداری آنها، و بهترین رویکرد را همراه با استدلال توصیه کنید.
این چیزی است که فکر می کنم کلود به خوبی انجام داد:
این یک ساختار سیستماتیک با تقسیم مشکل به بخش های روشن ارائه کرد: “هزینه ها، امنیت، مقیاس پذیری، تعمیر و نگهداری”. سپس عناوین فرعی، جوانب مثبت و منفی و حتی برآورد هزینه 3 ساله ارائه شد.
منطق گام به گام او مبادلات بین سرورهای محلی و ابر را توضیح داد. و عوامل مالی، عملیاتی و امنیتی را سنجید.
کلود همچنین عاقلانه توصیه کرد که فقط جواب ندهید. توضیح داد که چرا ابر اغلب برای اکثر مشاغل کوچک بهتر است.
او گام های بعدی قابل اجرا، یک برنامه عملیاتی متشکل از مراحل مشخص (محاسبه نیازهای ذخیره سازی، برنامه های آزمایشی، آموزش کارکنان) را پیشنهاد کرد.
تنها از این دستور، واضح است که کلود میتواند عمق را با خوانایی متعادل کند، جزئیات زیادی را ارائه میکند، اما همچنان به راحتی قابل پیگیری است.
او نه تنها ایده می دهد، بلکه تجزیه و تحلیل می کند، جوانب مثبت و منفی را می سنجد و تصمیمات را منطقی توضیح می دهد.
عیب یابی چند مرحله ای
اخطار دوم: “لپتاپ کاربر پس از بهروزرسانی اخیر به کندی کار میکند. مرحله به مرحله یک فرآیند تشخیصی دقیق را دنبال کنید، توضیح دهید که چه چیزی را باید ابتدا بررسی کنید، چرا، و چگونه میتوان علت را قبل از توصیه اصلاحات بررسی کرد.”
در نگاه اول، این پاسخ بسیار طولانی بود. من همچنان در حال “فکر” بودم که به انتهای نتیجه رسیدم. و برخی از توصیهها سواد فنی را فرض میکنند، که ممکن است به درخواست ترجمه و/یا پیگیری برای کاربر معمولی نیاز داشته باشد.
در حالی که او از طولانی بودن کلمه پشیمان نیست، اما اطمینان داده است که هر نمونه به طور کامل برای کاربران ویندوز و مک تجزیه و تحلیل شود. به عنوان بخشی از رویکرد 9 مرحله ای (بسیار دقیق) خود، کلود همچنین درخت تصمیم گیری سناریو را ایجاد کرد که شامل تشخیص، سطح اطمینان و راه حل توصیه شده است و به جای توصیه های کلی، استدلال را نشان می دهد.
اگرچه پرمخاطب بود، اما حتی استدلال رویهای را با فرضیهسازی منطقی هر مشکل بالقوه، مرتبط کردن علل به اثرات و ارائه راهحلهای عملی نشان داد.
برنامه ریزی رویداد استراتژیک
ادعای سوم: “یک کنفرانس سه روزه فناوری برای 500 شرکت کننده برگزار کنید. جلسات برنامه ریزی، ردیف سخنرانان، تدارکات، بودجه و اقدامات احتمالی. منطق خود را برای برنامه ریزی، تخصیص منابع و اولویت بندی فعالیت ها توضیح دهید.”
پاسخ کلود به برنامه ریزی رویداد بار دیگر نقاط قوت او را در استدلال پیچیده و چند مرحله ای نشان می دهد. او یک برنامه کنفرانس فناوری سه روزه کاملاً ساختار یافته ایجاد کرد که برنامه ریزی، انتخاب سخنران، تدارکات، بودجه و حتی موارد احتمالی را پوشش می دهد.
تصمیمات در طول مسیر را توجیه می کند. برای مثال، برنامهریزی سخنرانیهای کلیدی در AM برای جلب توجه، محدود کردن کارگاهها به 50 شرکتکننده برای حضور بیشتر، و بودجهبندی برای سخنرانان جایگزین و شکستها (چیزی که اکثر مردم به آن توجه نمیکنند). این طرح حتی شامل لایههایی از اولویتبندی و استراتژیهای مدیریت ریسک است که بینش را نشان میدهد.
اما در حالی که همه موارد بالا نشان می دهد که کجا می درخشد، سطح جزئیات، از جلسات دقیقه به دقیقه تا درصدهای دقیق بودجه، دوباره می تواند بیش از حد تحریک کننده شود. این بر تعادل بین جامعیت و خوانایی تأکید می کند.
اما به طور کلی، کلود یک برنامه جامع و عملی ارائه کرد که مهارت های استدلال پیچیده او را در بر می گرفت.
تصمیم گیری زیست محیطی
ادعای چهارم: “یک شهر در حال بررسی ممنوعیت پلاستیک های یکبار مصرف است. به شورای شهر در مورد یک برنامه سیاست گام به گام که شامل مشارکت ذی نفعان، تجزیه و تحلیل اثرات اقتصادی، استراتژی ارتباطات عمومی، مکانیسم های اجرایی و پیامدهای ناخواسته احتمالی است، مشاوره دهید. منطق خود را برای هر توصیه توضیح دهید.”
پاسخ کلود به درخواست ممنوعیت پلاستیک بیشتر شبیه به یک کاغذ سفید کامل سیاست است تا خروجی یک ربات چت.
او مانند یک مشاور به مشکل نزدیک میشود، به طور روشمند نقشهبرداری از ذینفعان، بودجهبندی برای اثرات زیستمحیطی، و حتی پیشبینی موارد احتمالی مانند مسائل دسترسی و شکافها.
از نظر ساختار کاملاً جامع است. سانفرانسیسکو، سیاتل، تورنتو و چندین شهر اروپایی، با مثالهای کاملاً توجیهشده در دنیای واقعی، استدلال خود را بر روی شیوههای اثباتشده مبتنی میکنند (تصویر بالا را ببینید).
با این حال، با توجه به سطح جزئیات رویه ای و مالی، گهگاه در مهندسی بیش از حد دچار تزلزل می شود. کافی است یک کاربر معمولی را که فقط به دنبال خلاصهای میگردند، غرق کنید.
با این حال، از نظر استدلال سیاستی پیچیده، این کلود در بهترین حالتش است: ساختارمند، روشنگر و حساس به زمینه، او تحلیلی ارائه می دهد که احساس می کند برای یک جلسه توجیهی شورای شهر آماده است.
در نتیجه
به طور کلی، کلود عمق چشمگیر و استدلال ساختاری را در همه درخواست ها نشان داد. با این حال، تمایل به توضیح بیش از حد، گاهی اوقات ارائه بینش های مهم را کند می کند.
تقریباً احساس میشود که کلود هر بار که جواب میدهد یک مونوکل پوشیده است و شما نمیخواهید حرف او را قطع کنید.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.
اطلاعات بیشتر از راهنمای تام
بازگشت به لپ تاپ



