بررسی هوش مصنوعی کلود

پروین میرمیرانآگوست 24, 2024آخرین به روز رسانی: آگوست 24, 2024

0 2,711 خواندن این مطلب 6 دقیقه زمان میبرد

ما تقریباً به طور قطع به سال 2024 به عنوان آغاز یک دهه تعیین کننده دوران نگاه خواهیم کرد. هوش مصنوعی سرانجام به وعده های اولیه خود عمل کرد و به طور جدی وارد عمل شد. این در هیچ کجا به اندازه نبرد LLM ها مشهود نبود، مدل های زبانی بزرگی که در قلب انقلاب قرار داشتند.

این LLM ها ابزارهایی هستند که ما در رایانه، تلفن و وب خود برای دسترسی به قدرت هوش مصنوعی استفاده می کنیم. آنها اغلب برای همه چیز از کدنویسی وب سایت های جدید گرفته تا نوشتن ایمیل، ارائه ها و موارد دیگر استفاده می شوند. سؤالی را تایپ یا صحبت کنید و آنها با آنچه شما نیاز دارید پاسخ می دهند. مانند جستجوی وب روی استروئیدها است.

چه معتقد به هوش مصنوعی باشید و چه شکاک، غیرممکن است که تغییرات عظیمی را که در سرتاسر جهان اتفاق می‌افتد، انکار کنید، زیرا مردم و مشاغل شروع به استفاده از این ابزارها برای انجام جدی وظایف شخصی و تجاری خود می‌کنند.

دو قهرمان اصلی در خط مقدم، OpenAI با مدل ChatGPT و Anthropic با کلود هستند. بزرگترین شگفتی بین این دو این بود که کلود چقدر سریع در زندگی کوتاه خود پیشرفت کرد. آنتروپیک در سال 2021 توسط مدیران سابق OpenAI و خواهر و برادران داریو و دانیلا آمودی تأسیس شد تا جایگزینی برای «شرکت منافع عمومی» برای شرکت‌های AI تأسیس شده در آن زمان ارائه کند.

این شرکت Claude LLM را در سال 2023 راه اندازی کرد که به عنوان یک مدل «ایمن و قابل اعتماد» معرفی شد که بر اجتناب از خطرات هوش مصنوعی تمرکز دارد. علیرغم دریافت وعده های سرمایه گذاری بیش از 6 میلیارد دلار از گوگل و آمازون، اولین مدل این شرکت، کلود، با واکنش ملایم عمومی منتشر شد. تصور می شد که برای استفاده عمومی بسیار محدود کننده است.

اما انتشار غزل کلود 3.5 در ژوئن 2024 واقعاً دنیای هوش مصنوعی را با کاربرد و تطبیق‌پذیری قابل توجه آن در طیف گسترده‌ای از کاربردها به حرکت درآورد. ناگهان OpenAI با یک رقیب جدی روبرو شد که بسیاری آن را برتر از ChatGP می دانستند، به خصوص از نظر برنامه نویسی و زنجیره کلی وظایف فکری.

همه اینها ارزش بررسی را در بین بهترین مدل های زبان بزرگ دنیا می کند.

نقد کلود: اولین برداشت ها

(اعتبار تصویر: کلود)

ثبت نام برای یک حساب Anthropic در Claude.ai آسان است. هنگامی که با ایمیل یا حساب Google وارد سیستم شدید، می‌توانید بلافاصله از کادر درخواست استفاده کنید. حساب رایگان پیش‌فرض دارای محدودیت شدید 5 درخواست در دقیقه و 300 هزار توکن در روز است. این ممکن است زیاد به نظر برسد، اما وقتی واقعاً شروع به تکرار در یک پروژه کنید، استفاده از این محدودیت‌ها آسان است.

اساساً، اگر می‌خواهید کارهایی بیش از کارهای متنی ساده مانند خلاصه‌نویسی یا ترجمه انجام دهید، بهتر است به برنامه حرفه‌ای 20 دلاری در ماه ارتقا دهید. در این سطح، شما حق دریافت 4000 درخواست در دقیقه به هنگام پرداخت را دارید.

گزینه خوب دیگر استفاده از یک برنامه شخص ثالث و Claude API است که از محدودیت نرخ آشکاری رنج نمی برد. من از API به طور منظم با TypingMind.com بر اساس رمز PAYG استفاده می کنم و عالی است. تنها مشکل این است که در حال حاضر کاربران API به ویژگی Claude’s Artifacts دسترسی ندارند، اما امیدواریم که این ویژگی به زودی ارائه شود.

بررسی کلود: در حال استفاده

کلود

(اعتبار تصویر: کلود)

نکته مهمی که باید به آن توجه کرد این است که جهان کلود به دو قسمت تقسیم شده است. کلود چت (Claude.ai) چت ربات عمومی است که اکثر مردم از آن استفاده خواهند کرد. اما توسعه‌دهندگان همچنین می‌توانند برای نسخه Console ثبت نام کنند، که مدیریت و مهندسی عمیق‌تر ادعاها را ارائه می‌دهد، اما فاقد ویژگی بسیار جالب Artifacts است. شما می توانید برای هر دو با یک ایمیل ثبت نام کنید، اما برای اهداف استفاده و صورتحساب جداگانه باقی می مانند، که کمی گیج کننده است.

برای این بررسی، چند تست را با استفاده از چت استاندارد و Artifacts امتحان کردم. Artifacts یک ویژگی کاملاً جدید است که یک پنجره WYSIWYG را در کنار پنجره خط فرمان اضافه می کند، بنابراین می توانید ببینید کد تولید شده چه چیزی ایجاد می کند. این یک راه عالی برای دیدن خلقت شما در مقابل چشمان شما است. کد پشت نتایج نیز فقط با یک کلیک یا دانلود فاصله دارد، تکرار و آزمایش ایده‌های شما تا زمانی که کاملاً قالب‌بندی شده و آماده اجرا شوند را آسان می‌کند.

نکته سریع: ویژگی Artifacts به طور پیش فرض روشن نیست. باید روی نام حساب خود در پایین سمت چپ صفحه اصلی کلود کلیک کنید و با استفاده از گزینه منوی پیش‌نمایش ویژگی، آن را به صورت دستی روشن کنید.

حالت چت برای کارهای ساده بسیار خوب، سریع و دقیق عمل می کرد، اما تمایل داشت با الزامات پیچیده تر مبارزه کند. یکی از ویژگی‌های جالبی که باید به آن اشاره کنم این است که اگر هنگام تکرار ایده شما خطایی رخ داد، می‌توانید به سادگی آن را در کادر چت کلود کپی و جایگذاری کنید و هوش مصنوعی معمولاً فوراً مشکل را برطرف می‌کند. این خیلی عالیه

کلود

(اعتبار تصویر: کلود)

برای مثال، ایجاد یک برنامه وب تحلیلگر نظرات YouTube با استفاده از YouTube API فقط چند ثانیه طول کشید. در واقع، ساخت API YouTube بیشتر از ساخت برنامه طول کشید، و چند تکراری که برای صیقل دادن نتایج استفاده کردم بدون درد بود.

کلود

(اعتبار تصویر: کلود)

اما وقتی سعی کردم با وارد کردن داده‌ها از یک فایل PDF آپلود شده، یک برنامه دستور العمل تعاملی پیچیده‌تر ایجاد کنم، همه چیز شروع به مشکل کرد. اما من دقیقا می دانستم مشکل چیست. به دلیل درخواست‌های فوری گسترده‌ای که انجام داده‌ام، پنجره‌های متنی من تمام شده است.

کلود

(اعتبار تصویر: کلود)

من می‌توانستم نسخه اولیه برنامه را در عرض چند دقیقه آماده و اجرا کنم، اما به محض اینکه سعی کردم با افزودن تعامل بیشتر، برخی بهبودها را ایجاد کنم، فضای متن تمام شد و کلود شروع به خطا کرد. این غم انگیز است زیرا تا آن مرحله واقعاً خوب پیش می رفت. فکر می‌کنم با کمی زمان بیشتر و بهینه‌سازی بهتر در حین پرواز می‌توانستم از این مشکل کاملاً جلوگیری کنم.

کلود

(اعتبار تصویر: کلود)

اگر در دنیای واقعی یک کدنویس شغلی بودم، می‌توانستم پیش بروم و آن را با دست تمام کنم، اما به عنوان یک کدنویس آماتور مشتاق شانسی نداشتم. اما مطمئناً واضح است که طولی نمی‌کشد که این LLMها بازی‌ها و برنامه‌های پرتقاضا را برای هر کسی که نبض و کمی میل دارد تولید کند.

من همچنین می خواستم برنامه کنسول را آزمایش کنم، زیرا یکی از متمایز کننده های محصول اخیراً منتشر شده است که کلود به وضوح به آن افتخار می کند. یکی از ویژگی‌های بسیار مفید کنسول Workbench است که می‌توانید دستورات خود را قبل از استفاده در عمل آزمایش، ارزیابی و اصلاح کنید. در عمل، Workbench ثابت کرده است که صرفه جویی زیادی در زمان و هزینه دارد. قبل از اینکه تصمیم به خرج کردن اعتبار بگیرید، می توانید ترکیب های مختلفی از دستورات پیشنهادی خود را آزمایش کنید تا نتایج واقعی را ببینید و اینکه آیا مدل به درخواست شما پاسخ خوبی می دهد یا خیر.

کلود

(اعتبار تصویر: کلود)

دو ویژگی برجسته Workbench توانایی آن برای انجام این آزمایش عمیق و چند سطحی و کتابخانه ای از دستورات آماده آن است که می تواند کل فرآیند تولید را کوتاه کند. اما هدف واقعی کنسول کمک به شرکت ها برای ایجاد تیم هایی برای کنترل توسعه هوش مصنوعی آنهاست. ویژگی هایی وجود دارد که دعوت و اشتراک گذاری با همکاران را آسان می کند، همچنین کلیدهای API و دسترسی به اسناد مرجع را اختصاص می دهد.

کلود

(اعتبار تصویر: کلود)

OpenAI تجربه مشابهی را با Playground خود ارائه می دهد، که شامل عملکردهای بیشتری مانند بهینه سازی و ایجاد مشترک است. اما مطمئن نیستم که برای اکثر نیازهای مردم مفیدتر باشد. به عنوان مثال، بهینه سازی اغلب آخرین راه حل است زیرا مهندسی سریع و فراخوانی عملکرد بهتر اغلب می تواند بسیاری از مشکلات تکمیل را حل کند. همچنین جمع‌آوری، تمیز کردن و سازماندهی مجموعه داده‌های مربوطه چندان آسان نیست، که می‌تواند از همان ابتدا کارایی تنظیم دقیق را مختل کند.

کلود

(اعتبار تصویر: کلود)

در هر صورت، Anthropic Workbench و عملکرد مرکز حساب، گواهی بر تعهد شرکت به بازار سازمانی است. این تفاوت بین ارائه دهندگان LLM که فقط یک محصول اصلی را ارائه می دهند و کسانی که بر ارائه یک اکوسیستم هوش مصنوعی ارزشمند برای مشتریان خود تمرکز می کنند، ایجاد می کند. این واقعیت که می‌توانید کد سریع دریافت کنید، نسخه‌ها را دنبال کنید، و همه چیز را از تنظیمات مدل گرفته تا متغیرها و فرمان سریع سیستم را تنظیم کنید، این مکان را به مکانی مناسب برای بزرگسالان برای انجام کارهای واقعی تبدیل می‌کند. آنتروپیک کار خوبی در ساخت این سمت از ارائه محصول خود انجام داده است.

بررسی کلود: نتیجه گیری

هنوز برای هوش مصنوعی، چت ربات ها و LLM ها بسیار ابتدایی است، بنابراین هر نظری باید با در نظر گرفتن این هشدار خوانده شود. ما در حال مشاهده اولین پیچک های یک انقلاب واقعی فناوری هستیم و نباید از روز اول انتظار معجزه داشت. با این حال، کاری که آنتروپیک در چند ماه گذشته برای رقابتی کردن محصولاتش – به ویژه غزل کلود 3.5 – در بازار انجام داده، شگفت‌انگیز است. این آخرین مدل، شرکت را در بسیاری از زمینه ها، به ویژه در زمینه برنامه نویسی کمک خلبان، رهبری کرد.

این بدان معنا نیست که مدل‌های دیگر در زمینه‌های کاربردی مختلف برابر یا برتر نیستند، اما وقتی صحبت از آن به میان می‌آید، به نظر می‌رسد مردم کیفیت پایین‌تر از تجربه کلود را ترجیح می‌دهند. از منظر شخصی، Sonnet 3.5 اکنون مدل مورد علاقه من است که نشان می‌دهد عرضه‌های اخیر OpenAI چقدر ضعیف بوده است. من شک ندارم که مسابقه تازه شروع شده است و خیلی زود نتایج خارق العاده ای از سوی شرکت های هوش مصنوعی در سراسر جهان به دست خواهد آمد. اما تا آن زمان، خوشحالم که از این قطعه تأثیرگذار نثر آمریکایی لذت می برم.

منبع: tomsguide

پروین میرمیرانآگوست 24, 2024آخرین به روز رسانی: آگوست 24, 2024

0 2,711 خواندن این مطلب 6 دقیقه زمان میبرد

بررسی هوش مصنوعی کلود

پروین میرمیران

دیدگاهتان را بنویسید لغو پاسخ

به الگوریتم نتفلیکس اجازه دادم هر چیزی را که برای یک هفته تماشا کردم انتخاب کند. عالی بود… تا اینکه نشد.

اختصاصی: Garmin Cirqa PM می گوید برای راه اندازی یک ردیاب تناسب اندام بدون صفحه، “همه قطعات احساس می کردند در جای خود هستند”

برانت می گوید نمودارهای مدرسه قدیمی هنوز برای بیت کوین کار می کنند – U.Today

30 ژوئیه تجزیه و تحلیل قیمت Solana (SOL)، Zcash (ZEC) و Bitcoin (BTC): تست آستانه های پشتیبانی محلی – U.Today

Mini آفرودترین شاسی بلند خود را تا کنون آزمایش می کند

چرا لکه های سیاه کوچک روی شیشه جلو اتومبیل ها وجود دارد؟

قیمت برخی از استیک های پخش دو برابر بیشتر است. این همان چیزی است که هزینه ها را افزایش می دهد

مدیر دارایی 592 میلیون دلاری موقعیت جدید XRP ETF – U.Today را اعلام کرد

مدیر عامل شرکت Quantum Giant به بیت کوین هشدار داد – U.Today

مرسدس کوچکترین شاسی بلند خود را برای عصر EV اختراع کرد