ما تقریباً به طور قطع به سال 2024 به عنوان آغاز یک دهه تعیین کننده دوران نگاه خواهیم کرد. هوش مصنوعی سرانجام به وعده های اولیه خود عمل کرد و به طور جدی وارد عمل شد. این در هیچ کجا به اندازه نبرد LLM ها مشهود نبود، مدل های زبانی بزرگی که در قلب انقلاب قرار داشتند.
این LLM ها ابزارهایی هستند که ما در رایانه، تلفن و وب خود برای دسترسی به قدرت هوش مصنوعی استفاده می کنیم. آنها اغلب برای همه چیز از کدنویسی وب سایت های جدید گرفته تا نوشتن ایمیل، ارائه ها و موارد دیگر استفاده می شوند. سؤالی را تایپ یا صحبت کنید و آنها با آنچه شما نیاز دارید پاسخ می دهند. مانند جستجوی وب روی استروئیدها است.
چه معتقد به هوش مصنوعی باشید و چه شکاک، غیرممکن است که تغییرات عظیمی را که در سرتاسر جهان اتفاق میافتد، انکار کنید، زیرا مردم و مشاغل شروع به استفاده از این ابزارها برای انجام جدی وظایف شخصی و تجاری خود میکنند.
دو قهرمان اصلی در خط مقدم، OpenAI با مدل ChatGPT و Anthropic با کلود هستند. بزرگترین شگفتی بین این دو این بود که کلود چقدر سریع در زندگی کوتاه خود پیشرفت کرد. آنتروپیک در سال 2021 توسط مدیران سابق OpenAI و خواهر و برادران داریو و دانیلا آمودی تأسیس شد تا جایگزینی برای «شرکت منافع عمومی» برای شرکتهای AI تأسیس شده در آن زمان ارائه کند.
این شرکت Claude LLM را در سال 2023 راه اندازی کرد که به عنوان یک مدل «ایمن و قابل اعتماد» معرفی شد که بر اجتناب از خطرات هوش مصنوعی تمرکز دارد. علیرغم دریافت وعده های سرمایه گذاری بیش از 6 میلیارد دلار از گوگل و آمازون، اولین مدل این شرکت، کلود، با واکنش ملایم عمومی منتشر شد. تصور می شد که برای استفاده عمومی بسیار محدود کننده است.
اما انتشار غزل کلود 3.5 در ژوئن 2024 واقعاً دنیای هوش مصنوعی را با کاربرد و تطبیقپذیری قابل توجه آن در طیف گستردهای از کاربردها به حرکت درآورد. ناگهان OpenAI با یک رقیب جدی روبرو شد که بسیاری آن را برتر از ChatGP می دانستند، به خصوص از نظر برنامه نویسی و زنجیره کلی وظایف فکری.
همه اینها ارزش بررسی را در بین بهترین مدل های زبان بزرگ دنیا می کند.
نقد کلود: اولین برداشت ها
ثبت نام برای یک حساب Anthropic در Claude.ai آسان است. هنگامی که با ایمیل یا حساب Google وارد سیستم شدید، میتوانید بلافاصله از کادر درخواست استفاده کنید. حساب رایگان پیشفرض دارای محدودیت شدید 5 درخواست در دقیقه و 300 هزار توکن در روز است. این ممکن است زیاد به نظر برسد، اما وقتی واقعاً شروع به تکرار در یک پروژه کنید، استفاده از این محدودیتها آسان است.
اساساً، اگر میخواهید کارهایی بیش از کارهای متنی ساده مانند خلاصهنویسی یا ترجمه انجام دهید، بهتر است به برنامه حرفهای 20 دلاری در ماه ارتقا دهید. در این سطح، شما حق دریافت 4000 درخواست در دقیقه به هنگام پرداخت را دارید.
گزینه خوب دیگر استفاده از یک برنامه شخص ثالث و Claude API است که از محدودیت نرخ آشکاری رنج نمی برد. من از API به طور منظم با TypingMind.com بر اساس رمز PAYG استفاده می کنم و عالی است. تنها مشکل این است که در حال حاضر کاربران API به ویژگی Claude’s Artifacts دسترسی ندارند، اما امیدواریم که این ویژگی به زودی ارائه شود.
بررسی کلود: در حال استفاده
نکته مهمی که باید به آن توجه کرد این است که جهان کلود به دو قسمت تقسیم شده است. کلود چت (Claude.ai) چت ربات عمومی است که اکثر مردم از آن استفاده خواهند کرد. اما توسعهدهندگان همچنین میتوانند برای نسخه Console ثبت نام کنند، که مدیریت و مهندسی عمیقتر ادعاها را ارائه میدهد، اما فاقد ویژگی بسیار جالب Artifacts است. شما می توانید برای هر دو با یک ایمیل ثبت نام کنید، اما برای اهداف استفاده و صورتحساب جداگانه باقی می مانند، که کمی گیج کننده است.
برای این بررسی، چند تست را با استفاده از چت استاندارد و Artifacts امتحان کردم. Artifacts یک ویژگی کاملاً جدید است که یک پنجره WYSIWYG را در کنار پنجره خط فرمان اضافه می کند، بنابراین می توانید ببینید کد تولید شده چه چیزی ایجاد می کند. این یک راه عالی برای دیدن خلقت شما در مقابل چشمان شما است. کد پشت نتایج نیز فقط با یک کلیک یا دانلود فاصله دارد، تکرار و آزمایش ایدههای شما تا زمانی که کاملاً قالببندی شده و آماده اجرا شوند را آسان میکند.
نکته سریع: ویژگی Artifacts به طور پیش فرض روشن نیست. باید روی نام حساب خود در پایین سمت چپ صفحه اصلی کلود کلیک کنید و با استفاده از گزینه منوی پیشنمایش ویژگی، آن را به صورت دستی روشن کنید.
حالت چت برای کارهای ساده بسیار خوب، سریع و دقیق عمل می کرد، اما تمایل داشت با الزامات پیچیده تر مبارزه کند. یکی از ویژگیهای جالبی که باید به آن اشاره کنم این است که اگر هنگام تکرار ایده شما خطایی رخ داد، میتوانید به سادگی آن را در کادر چت کلود کپی و جایگذاری کنید و هوش مصنوعی معمولاً فوراً مشکل را برطرف میکند. این خیلی عالیه
برای مثال، ایجاد یک برنامه وب تحلیلگر نظرات YouTube با استفاده از YouTube API فقط چند ثانیه طول کشید. در واقع، ساخت API YouTube بیشتر از ساخت برنامه طول کشید، و چند تکراری که برای صیقل دادن نتایج استفاده کردم بدون درد بود.
اما وقتی سعی کردم با وارد کردن دادهها از یک فایل PDF آپلود شده، یک برنامه دستور العمل تعاملی پیچیدهتر ایجاد کنم، همه چیز شروع به مشکل کرد. اما من دقیقا می دانستم مشکل چیست. به دلیل درخواستهای فوری گستردهای که انجام دادهام، پنجرههای متنی من تمام شده است.
من میتوانستم نسخه اولیه برنامه را در عرض چند دقیقه آماده و اجرا کنم، اما به محض اینکه سعی کردم با افزودن تعامل بیشتر، برخی بهبودها را ایجاد کنم، فضای متن تمام شد و کلود شروع به خطا کرد. این غم انگیز است زیرا تا آن مرحله واقعاً خوب پیش می رفت. فکر میکنم با کمی زمان بیشتر و بهینهسازی بهتر در حین پرواز میتوانستم از این مشکل کاملاً جلوگیری کنم.
اگر در دنیای واقعی یک کدنویس شغلی بودم، میتوانستم پیش بروم و آن را با دست تمام کنم، اما به عنوان یک کدنویس آماتور مشتاق شانسی نداشتم. اما مطمئناً واضح است که طولی نمیکشد که این LLMها بازیها و برنامههای پرتقاضا را برای هر کسی که نبض و کمی میل دارد تولید کند.
من همچنین می خواستم برنامه کنسول را آزمایش کنم، زیرا یکی از متمایز کننده های محصول اخیراً منتشر شده است که کلود به وضوح به آن افتخار می کند. یکی از ویژگیهای بسیار مفید کنسول Workbench است که میتوانید دستورات خود را قبل از استفاده در عمل آزمایش، ارزیابی و اصلاح کنید. در عمل، Workbench ثابت کرده است که صرفه جویی زیادی در زمان و هزینه دارد. قبل از اینکه تصمیم به خرج کردن اعتبار بگیرید، می توانید ترکیب های مختلفی از دستورات پیشنهادی خود را آزمایش کنید تا نتایج واقعی را ببینید و اینکه آیا مدل به درخواست شما پاسخ خوبی می دهد یا خیر.
دو ویژگی برجسته Workbench توانایی آن برای انجام این آزمایش عمیق و چند سطحی و کتابخانه ای از دستورات آماده آن است که می تواند کل فرآیند تولید را کوتاه کند. اما هدف واقعی کنسول کمک به شرکت ها برای ایجاد تیم هایی برای کنترل توسعه هوش مصنوعی آنهاست. ویژگی هایی وجود دارد که دعوت و اشتراک گذاری با همکاران را آسان می کند، همچنین کلیدهای API و دسترسی به اسناد مرجع را اختصاص می دهد.
OpenAI تجربه مشابهی را با Playground خود ارائه می دهد، که شامل عملکردهای بیشتری مانند بهینه سازی و ایجاد مشترک است. اما مطمئن نیستم که برای اکثر نیازهای مردم مفیدتر باشد. به عنوان مثال، بهینه سازی اغلب آخرین راه حل است زیرا مهندسی سریع و فراخوانی عملکرد بهتر اغلب می تواند بسیاری از مشکلات تکمیل را حل کند. همچنین جمعآوری، تمیز کردن و سازماندهی مجموعه دادههای مربوطه چندان آسان نیست، که میتواند از همان ابتدا کارایی تنظیم دقیق را مختل کند.
در هر صورت، Anthropic Workbench و عملکرد مرکز حساب، گواهی بر تعهد شرکت به بازار سازمانی است. این تفاوت بین ارائه دهندگان LLM که فقط یک محصول اصلی را ارائه می دهند و کسانی که بر ارائه یک اکوسیستم هوش مصنوعی ارزشمند برای مشتریان خود تمرکز می کنند، ایجاد می کند. این واقعیت که میتوانید کد سریع دریافت کنید، نسخهها را دنبال کنید، و همه چیز را از تنظیمات مدل گرفته تا متغیرها و فرمان سریع سیستم را تنظیم کنید، این مکان را به مکانی مناسب برای بزرگسالان برای انجام کارهای واقعی تبدیل میکند. آنتروپیک کار خوبی در ساخت این سمت از ارائه محصول خود انجام داده است.
بررسی کلود: نتیجه گیری
هنوز برای هوش مصنوعی، چت ربات ها و LLM ها بسیار ابتدایی است، بنابراین هر نظری باید با در نظر گرفتن این هشدار خوانده شود. ما در حال مشاهده اولین پیچک های یک انقلاب واقعی فناوری هستیم و نباید از روز اول انتظار معجزه داشت. با این حال، کاری که آنتروپیک در چند ماه گذشته برای رقابتی کردن محصولاتش – به ویژه غزل کلود 3.5 – در بازار انجام داده، شگفتانگیز است. این آخرین مدل، شرکت را در بسیاری از زمینه ها، به ویژه در زمینه برنامه نویسی کمک خلبان، رهبری کرد.
این بدان معنا نیست که مدلهای دیگر در زمینههای کاربردی مختلف برابر یا برتر نیستند، اما وقتی صحبت از آن به میان میآید، به نظر میرسد مردم کیفیت پایینتر از تجربه کلود را ترجیح میدهند. از منظر شخصی، Sonnet 3.5 اکنون مدل مورد علاقه من است که نشان میدهد عرضههای اخیر OpenAI چقدر ضعیف بوده است. من شک ندارم که مسابقه تازه شروع شده است و خیلی زود نتایج خارق العاده ای از سوی شرکت های هوش مصنوعی در سراسر جهان به دست خواهد آمد. اما تا آن زمان، خوشحالم که از این قطعه تأثیرگذار نثر آمریکایی لذت می برم.
منبع: tomsguide
نظرات کاربران