برای کمک به درک بهتر نحوه کار پلتفرم هوش مصنوعی آروند، ابتدا لازم است با چند مفهوم پایه آشنا شویم. نگران نباشید؛ سعی کردهایم همه چیز را به زبان ساده توضیح دهیم.
هوش مصنوعی چیست؟
وقتی امروز از «هوش مصنوعی» صحبت میکنیم، منظور ما معمولاً مدلهای زبانی و چندرسانهای پیشرفتهای هستند که میتوانند متن تولید کنند، به سوالات پاسخ دهند، تصویر بسازند، محتوا را تحلیل کنند و بسیاری از کارهای دیگر را انجام دهند.
اگرچه تحقیقات هوش مصنوعی دههها قدمت دارند، اما استقبال عمومی از این فناوری با انتشار عمومی مدل GPT-3 توسط شرکت OpenAI در سال 2020 به شکل چشمگیری افزایش یافت. از آن زمان به بعد، شرکتهای مختلفی مانند OpenAI، Anthropic، Google، xAI و بسیاری دیگر مدلهای قدرتمند خود را عرضه کردند و امروزه اصطلاح «هوش مصنوعی» برای بسیاری از کاربران به همین ابزارهای گفتگو و تولید محتوا اشاره دارد.
در واقع، مدلهای هوش مصنوعی را میتوان موتورهای پردازش اطلاعات بسیار پیشرفتهای دانست که با دریافت ورودی از کاربر، مناسبترین پاسخ را تولید میکنند.
توکن چیست؟
مدلهای هوش مصنوعی متن را مانند انسان به صورت جمله یا پاراگراف پردازش نمیکنند؛ بلکه آن را به بخشهای کوچکتری به نام «توکن» تقسیم میکنند.
به زبان ساده، هر کلمه، بخشی از یک کلمه، عدد یا علامت نگارشی میتواند یک یا چند توکن باشد.
برای مثال:
جمله «سلام، حالت چطوره؟» از چند توکن تشکیل میشود.
یک متن 1000 کلمهای ممکن است حدود 1200 تا 1500 توکن داشته باشد.
به طور کلی دو نوع توکن وجود دارد:
توکن ورودی (Input Tokens)
تمام اطلاعاتی که برای مدل ارسال میشوند، شامل:
پیام جدید شما
پیامهای قبلی گفتگو
تصاویر انتخابشده
دستورالعملهای سیستمی
همگی به عنوان توکن ورودی محاسبه میشوند.
توکن خروجی (Output Tokens)
پاسخی که مدل هوش مصنوعی برای شما تولید میکند نیز شامل توکنهایی است که به عنوان توکن خروجی محاسبه میشوند.
بنابراین هزینه پردازش مدلهای هوش مصنوعی معمولاً بر اساس مجموع توکنهای ورودی و خروجی تعیین میشود.
کانتکست (زمینه گفتگو) چیست و آروند آن را چگونه مدیریت میکند؟
یکی از مهمترین ویژگیهای هوش مصنوعی این است که میتواند مکالمه را به خاطر داشته باشد و بر اساس پیامهای قبلی پاسخ دهد.
اما برخلاف تصور بسیاری از کاربران، مدل هوش مصنوعی به صورت دائمی چیزی را ذخیره نمیکند. در هر بار ارسال پیام، لازم است بخشهای مرتبط از گفتگو مجدداً برای مدل ارسال شوند.
فرض کنید این گفتگو را داشته باشید:
کاربر:
«من یک فروشگاه آنلاین دارم.»
چند پیام بعد:
کاربر:
«برای تبلیغاتش چه پیشنهادی داری؟»
اگر جمله اول برای مدل ارسال نشود، مدل نمیداند منظور شما از «تبلیغاتش» چیست.
به همین دلیل در هر درخواست، بخشی از پیامهای قبلی نیز همراه پیام جدید ارسال میشوند تا رشته گفتگو حفظ شود. به این اطلاعات ارسالی، کانتکست یا زمینه گفتگو گفته میشود.
طبیعتاً هرچه گفتگو طولانیتر شود:
حجم کانتکست بیشتر میشود.
تعداد توکنهای مصرفی افزایش پیدا میکند.
هزینه پردازش بالاتر میرود.
خلاصهسازی هوشمند در آروند
برای حل این مشکل، در آروند از سیستم خلاصهسازی هوشمند استفاده میکنیم.
این سیستم در زمان مناسب، بخشهایی از گفتگو را به شکل خلاصه و ساختاریافته نگهداری میکند تا:
مصرف توکن کاهش پیدا کند.
هزینهها کمتر شود.
مدل بتواند روی اطلاعات مهمتر تمرکز کند.
کیفیت پاسخها در گفتگوهای طولانی حفظ شود.
در نتیجه میتوانید مکالمات طولانیتری داشته باشید، بدون اینکه هزینه و حجم پردازش به شکل غیرضروری افزایش پیدا کند.
مدیریت هوشمند تصاویر
تصاویر معمولاً نسبت به متن، حجم بیشتری از اطلاعات را برای مدل ارسال میکنند و میتوانند تعداد قابل توجهی توکن ورودی مصرف کنند.
به همین دلیل در آروند تصمیم گرفتیم کنترل این موضوع را در اختیار خود کاربران قرار دهیم.
در هر گفتگو میتوانید با یک انتخاب ساده مشخص کنید که کدام تصاویر برای مدل هوش مصنوعی ارسال شوند و کدام تصاویر صرفاً در گفتگو باقی بمانند.
این قابلیت دو مزیت مهم دارد:
کاهش مصرف اعتبار و هزینه پردازش
افزایش دقت مدل با ارسال تنها تصاویر مرتبط
به این ترتیب کنترل کامل اطلاعات ارسالی در اختیار شما خواهد بود.
اعتبار چیست؟
اگر قرار بود کاربران دائماً با مفاهیمی مانند Input Tokens، Output Tokens، نرخهای متفاوت مدلها و محاسبات پیچیده هزینه سروکار داشته باشند، استفاده از پلتفرم دشوار میشد.
به همین دلیل در آروند از واحدی سادهتر به نام «اعتبار» استفاده میکنیم.
اعتبار در واقع نماینده میزان منابع مصرفشده توسط مدلهای هوش مصنوعی است.
هر مدل با توجه به هزینه پردازش خود، مقدار مشخصی اعتبار مصرف میکند و سیستم به صورت خودکار محاسبات مربوط به توکنها را انجام میدهد.
در نتیجه شما به جای درگیر شدن با جزئیات فنی، تنها اعتبار مصرفی خود را مشاهده میکنید و مدیریت سادهتری روی استفاده از سرویس خواهید داشت.
چند نوع مدل هوش مصنوعی وجود دارد؟
امروزه مدلهای هوش مصنوعی تنها به تولید متن محدود نمیشوند و در حوزههای مختلفی فعالیت میکنند.
مهمترین دستههای این مدلها عبارتاند از:
مدلهای تولید متن
برای گفتگو، پاسخ به سوالات، تولید محتوا، برنامهنویسی، ترجمه، تحلیل و بسیاری کاربردهای دیگر.
مدلهای تولید تصویر
برای ساخت تصاویر جدید بر اساس توضیحات متنی یا ویرایش تصاویر موجود.
مدلهای صوتی
برای تبدیل متن به گفتار، تبدیل گفتار به متن و پردازش صدا.
مدلهای تولید ویدیو
برای ساخت یا ویرایش ویدیو با استفاده از هوش مصنوعی.
در حال حاضر آروند از مدلهای تولید متن و تولید تصویر پشتیبانی میکند و به مرور قابلیتهای بیشتری به پلتفرم اضافه خواهند شد.
آروند چه کاری انجام میدهد؟
آروند به جای محدود شدن به یک مدل یا یک شرکت خاص، بستری فراهم میکند که بتوانید از مدلهای مختلف هوش مصنوعی در یک محیط واحد استفاده کنید.
ما پیچیدگیهای فنی مانند مدیریت مدلها، محاسبه هزینهها، مدیریت کانتکست، بهینهسازی مصرف توکن و پردازش درخواستها را بر عهده میگیریم تا شما بتوانید روی کار اصلی خود تمرکز کنید:
استفاده از قدرت هوش مصنوعی برای یادگیری، تولید محتوا، حل مسئله و خلق ایدههای جدید.