چرا در این روز زمین از هوش مصنوعی بزرگ دست می کشم؟ من به جای آن از مدل های کوچک هوش مصنوعی استفاده می کنم

بر کسی پوشیده نیست که هوش مصنوعی هزینه زیست محیطی دارد. طبق گزارش آژانس بین المللی انرژی، مراکز داده در سال 2025 تقریباً 415 تراوات ساعت برق مصرف کرده اند. این تقریباً 1.5 درصد تقاضای جهانی برق بود و انتظار میرود این رقم تا سال 2030 به حدود 945 تراوات ساعت برسد که عمدتاً به دلیل رشد هوش مصنوعی است. این آژانس می گوید در ایالات متحده، مراکز داده تقریباً نیمی از رشد تقاضای برق در سال 2025 را تشکیل می دهند. این بدان معنا نیست که هوش مصنوعی ذاتاً برای سیاره بد است، اما به این معنی است که هر پیامی ردپایی دارد. دقیقاً به همین دلیل است که مدلهای هوش مصنوعی کوچکتر و کارآمدتر در این روز زمین و هر روز شایسته توجه بیشتری هستند.
هنگامی که بیشتر مردم به هوش مصنوعی فکر می کنند، بزرگ ترین نام ها مانند ChatGPT، Gemini یا Claude به ذهنشان خطور می کند. متأسفانه، این نام های بزرگ با استفاده از برق و آب نیز همراه هستند. در حالی که هوش مصنوعی می تواند به حل مشکلات دنیای واقعی کمک کند، منصفانه است که بپرسیم آیا هر کار به یک سیستم طراحی شده برای حل فیزیک کوانتومی فقط برای بازنویسی یک ایمیل نیاز دارد یا خیر.
اینجاست که مدلهای زبان کوچک، که اغلب SLM نامیده میشوند، میتوانند مفید باشند. و بله، آنها دقیقاً همان چیزی هستند که به نظر می رسند. مدلهای هوش مصنوعی طراحی شدهاند تا کوچکتر و کارآمدتر از محبوبترین چتباتها باشند. پس از گذراندن وقت با آنها، به این فکر می کنم که آنها برای زندگی روزمره مناسب تر هستند.
مدل uvula چیست؟
بزرگترین سیستمهای هوش مصنوعی امروزی را بهعنوان SUVهای عظیم در نظر بگیرید: قدرتمند، چشمگیر و قادر به حمل تقریباً هر چیزی. مدل های کوچک زبان بیشتر شبیه خودروهای هیبریدی یا کامپکت هستند.
ادامه مقاله در زیر
آنها از پارامترهای کمتری استفاده می کنند (تنظیمات داخلی که به هوش مصنوعی کمک می کند الگوها را یاد بگیرد)، به قدرت محاسباتی کمتری نیاز دارند و به طور کلی می توانند سریع تر و ارزان تر اجرا شوند. برخی از آنها حتی به اندازه کافی کوچک هستند تا مستقیماً روی تلفن ها یا لپ تاپ ها اجرا شوند نه اینکه کاملاً به سرورهای ابری متکی باشند.
آنها همچنین به اندازه کافی صادق هستند که بتوانند بسیاری از کارهای روزمره هوش مصنوعی مانند بازنویسی ایمیل، خلاصه کردن یادداشت ها، سازماندهی یک لیست خرید یا کارهای انجام شده، ترجمه یک پیام کوتاه، طوفان فکری با زیرنویس، پاسخ به سؤالات ساده و مرتب کردن داده ها یا فرم ها را انجام دهند.
چرا این برای زمین ما مهم است؟
مدلهای بزرگ هوش مصنوعی میتوانند منابع زیادی داشته باشند. آموزش آنها به قدرت محاسباتی عظیمی نیاز دارد و ارائه میلیونها درخواست هر روز مستلزم زیرساختهای تشنه انرژی است.
مدل های کوچکتر بدون ضربه نیستند، اما می توانند این بار را به چند روش کاهش دهند:
- آنها کمتر از محاسبات استفاده می کنند. پیچیدگی کمتر به طور کلی به معنای قدرت پردازش کمتر برای کارهای رایج است.
- آنها می توانند به صورت محلی کار کنند. وقتی هوش مصنوعی به جای سرور بر روی یک دستگاه اجرا می شود، می تواند رفت و برگشت عملیات مداوم ابر را کاهش دهد. در واقع، رایانه یا تلفن شما ممکن است از قبل دارای یک “مغز” خاص به نام NPU (واحد پردازش عصبی) باشد که به طور خاص برای این مدل ها ساخته شده و به آنها اجازه می دهد کارآمدتر کار کنند.
- آنها برای کارهای ساده سریعتر هستند. برای ایجاد لیست کارهایی که باید انجام دهید نیازی به ابر رایانه ندارید.
- آنها می توانند مفید بودن دستگاه را افزایش دهند. همانطور که هوش مصنوعی روی دستگاه بهبود مییابد، مردم میتوانند به جای اینکه همیشه به دنبال ارتقاء بعدی باشند، به سختافزار موجود اطمینان بیشتری پیدا کنند.
زمانی که به استدلال عمیق، کمک نوشتاری پیشرفته یا تحقیقات پیچیده نیاز دارم، هنوز از سیستمهای هوش مصنوعی بزرگ استفاده میکنم.
و البته من این مدل ها را برای کارم تست و بررسی می کنم، اما زمانی که ساعت خاموش هستم و کار سریع انجام می دهم، هوشیارتر می شوم.
پنج مدل uvula ارزش دانستن دارد
در اینجا چند مدل زبان کوچک وجود دارد که در حال حاضر چشم انداز هوش مصنوعی را شکل می دهد:
- مایکروسافت فی-3 مینی. من فکر میکنم خانواده فی مایکروسافت یکی از واضحترین نمونههای هوش مصنوعی فشرده است که به روش درست استفاده میشود. من این مدل را به دلیل استدلال قدرتمند آن در بسته بندی سبک وزن دوست دارم.
- گوگل جما. شما نمی توانید با مدل های کوچکتر الهام گرفته از تحقیقات پشت جمینی اشتباه کنید. جما یک هوش مصنوعی بسیار با استعداد است. من واقعا دوست دارم از این برای کارهای کوچک استفاده کنم.
- متا لاما 3.2 یک بعدی و سه بعدی. من در ابتدا کاربر بزرگی از این مدل نبودم، زیرا بیشتر از Gemma استفاده می کنم، اما تمرکز روی دستگاه مدل کوچکتر متا برای سرعت بدون وابستگی مداوم به ابر عالی است.
- Alibaba Cloud Qwen 2.5 1.5B. من از مدل های جمع و جور خانواده Qwen علی بابا شگفت زده شدم. آنها با بهره وری قوی، توانایی چند زبانه و مقرون به صرفه بودن تأثیر زیادی می گذارند.
- گرانیت آی بی ام. من حداقل این را تست کرده ام اما تا کنون طرفدار آن هستم. این مدل بر وظایف عملی سازمانی مانند خلاصه سازی، اتوماسیون و گردش کار داخلی تمرکز دارد
در نتیجه
مسابقه هوش مصنوعی بر روی اینکه چه کسی بزرگتر، سریعتر و قدرتمندتر است متمرکز است. اما روز زمین یادآوری خوبی است که هوشمندتر همیشه به معنای بزرگتر نیست. مدلهای زبان کوچک جایگزین هر چت بات نمیشوند، اما برای بسیاری از کارهای روزمره ارزش دیدن دارند. ناگفته نماند که یک ابزار عالی برای سرعت، حفظ حریم خصوصی و احتمالاً ردپای کوچکتر است.
آیا یک مدل زبان کوچک را امتحان کرده اید؟ آن را امتحان کنید و نظر خود را در نظرات به من بگویید.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.



