برای کمک به درک بهتر نحوه کار پلتفرم هوش مصنوعی آروند، ابتدا لازم است با چند مفهوم پایه آشنا شویم. نگران نباشید؛ سعی کرده‌ایم همه چیز را به زبان ساده توضیح دهیم.

هوش مصنوعی چیست؟

وقتی امروز از «هوش مصنوعی» صحبت می‌کنیم، منظور ما معمولاً مدل‌های زبانی و چندرسانه‌ای پیشرفته‌ای هستند که می‌توانند متن تولید کنند، به سوالات پاسخ دهند، تصویر بسازند، محتوا را تحلیل کنند و بسیاری از کارهای دیگر را انجام دهند.

اگرچه تحقیقات هوش مصنوعی دهه‌ها قدمت دارند، اما استقبال عمومی از این فناوری با انتشار عمومی مدل GPT-3 توسط شرکت OpenAI در سال 2020 به شکل چشمگیری افزایش یافت. از آن زمان به بعد، شرکت‌های مختلفی مانند OpenAI، Anthropic، Google، xAI و بسیاری دیگر مدل‌های قدرتمند خود را عرضه کردند و امروزه اصطلاح «هوش مصنوعی» برای بسیاری از کاربران به همین ابزارهای گفتگو و تولید محتوا اشاره دارد.

در واقع، مدل‌های هوش مصنوعی را می‌توان موتورهای پردازش اطلاعات بسیار پیشرفته‌ای دانست که با دریافت ورودی از کاربر، مناسب‌ترین پاسخ را تولید می‌کنند.

توکن چیست؟

مدل‌های هوش مصنوعی متن را مانند انسان به صورت جمله یا پاراگراف پردازش نمی‌کنند؛ بلکه آن را به بخش‌های کوچکتری به نام «توکن» تقسیم می‌کنند.

به زبان ساده، هر کلمه، بخشی از یک کلمه، عدد یا علامت نگارشی می‌تواند یک یا چند توکن باشد.

برای مثال:

جمله «سلام، حالت چطوره؟» از چند توکن تشکیل می‌شود.
یک متن 1000 کلمه‌ای ممکن است حدود 1200 تا 1500 توکن داشته باشد.

به طور کلی دو نوع توکن وجود دارد:

توکن ورودی (Input Tokens)

تمام اطلاعاتی که برای مدل ارسال می‌شوند، شامل:

پیام جدید شما
پیام‌های قبلی گفتگو
تصاویر انتخاب‌شده
دستورالعمل‌های سیستمی

همگی به عنوان توکن ورودی محاسبه می‌شوند.

توکن خروجی (Output Tokens)

پاسخی که مدل هوش مصنوعی برای شما تولید می‌کند نیز شامل توکن‌هایی است که به عنوان توکن خروجی محاسبه می‌شوند.

بنابراین هزینه پردازش مدل‌های هوش مصنوعی معمولاً بر اساس مجموع توکن‌های ورودی و خروجی تعیین می‌شود.

کانتکست (زمینه گفتگو) چیست و آروند آن را چگونه مدیریت می‌کند؟

یکی از مهم‌ترین ویژگی‌های هوش مصنوعی این است که می‌تواند مکالمه را به خاطر داشته باشد و بر اساس پیام‌های قبلی پاسخ دهد.

اما برخلاف تصور بسیاری از کاربران، مدل هوش مصنوعی به صورت دائمی چیزی را ذخیره نمی‌کند. در هر بار ارسال پیام، لازم است بخش‌های مرتبط از گفتگو مجدداً برای مدل ارسال شوند.

فرض کنید این گفتگو را داشته باشید:

کاربر:
«من یک فروشگاه آنلاین دارم.»

چند پیام بعد:

کاربر:
«برای تبلیغاتش چه پیشنهادی داری؟»

اگر جمله اول برای مدل ارسال نشود، مدل نمی‌داند منظور شما از «تبلیغاتش» چیست.

به همین دلیل در هر درخواست، بخشی از پیام‌های قبلی نیز همراه پیام جدید ارسال می‌شوند تا رشته گفتگو حفظ شود. به این اطلاعات ارسالی، کانتکست یا زمینه گفتگو گفته می‌شود.

طبیعتاً هرچه گفتگو طولانی‌تر شود:

حجم کانتکست بیشتر می‌شود.
تعداد توکن‌های مصرفی افزایش پیدا می‌کند.
هزینه پردازش بالاتر می‌رود.

خلاصه‌سازی هوشمند در آروند

برای حل این مشکل، در آروند از سیستم خلاصه‌سازی هوشمند استفاده می‌کنیم.

این سیستم در زمان مناسب، بخش‌هایی از گفتگو را به شکل خلاصه و ساختاریافته نگهداری می‌کند تا:

مصرف توکن کاهش پیدا کند.
هزینه‌ها کمتر شود.
مدل بتواند روی اطلاعات مهم‌تر تمرکز کند.
کیفیت پاسخ‌ها در گفتگوهای طولانی حفظ شود.

در نتیجه می‌توانید مکالمات طولانی‌تری داشته باشید، بدون اینکه هزینه و حجم پردازش به شکل غیرضروری افزایش پیدا کند.

مدیریت هوشمند تصاویر

تصاویر معمولاً نسبت به متن، حجم بیشتری از اطلاعات را برای مدل ارسال می‌کنند و می‌توانند تعداد قابل توجهی توکن ورودی مصرف کنند.

به همین دلیل در آروند تصمیم گرفتیم کنترل این موضوع را در اختیار خود کاربران قرار دهیم.

در هر گفتگو می‌توانید با یک انتخاب ساده مشخص کنید که کدام تصاویر برای مدل هوش مصنوعی ارسال شوند و کدام تصاویر صرفاً در گفتگو باقی بمانند.

این قابلیت دو مزیت مهم دارد:

کاهش مصرف اعتبار و هزینه پردازش
افزایش دقت مدل با ارسال تنها تصاویر مرتبط

به این ترتیب کنترل کامل اطلاعات ارسالی در اختیار شما خواهد بود.

اعتبار چیست؟

اگر قرار بود کاربران دائماً با مفاهیمی مانند Input Tokens، Output Tokens، نرخ‌های متفاوت مدل‌ها و محاسبات پیچیده هزینه سروکار داشته باشند، استفاده از پلتفرم دشوار می‌شد.

به همین دلیل در آروند از واحدی ساده‌تر به نام «اعتبار» استفاده می‌کنیم.

اعتبار در واقع نماینده میزان منابع مصرف‌شده توسط مدل‌های هوش مصنوعی است.

هر مدل با توجه به هزینه پردازش خود، مقدار مشخصی اعتبار مصرف می‌کند و سیستم به صورت خودکار محاسبات مربوط به توکن‌ها را انجام می‌دهد.

در نتیجه شما به جای درگیر شدن با جزئیات فنی، تنها اعتبار مصرفی خود را مشاهده می‌کنید و مدیریت ساده‌تری روی استفاده از سرویس خواهید داشت.

چند نوع مدل هوش مصنوعی وجود دارد؟

امروزه مدل‌های هوش مصنوعی تنها به تولید متن محدود نمی‌شوند و در حوزه‌های مختلفی فعالیت می‌کنند.

مهم‌ترین دسته‌های این مدل‌ها عبارت‌اند از:

مدل‌های تولید متن

برای گفتگو، پاسخ به سوالات، تولید محتوا، برنامه‌نویسی، ترجمه، تحلیل و بسیاری کاربردهای دیگر.

مدل‌های تولید تصویر

برای ساخت تصاویر جدید بر اساس توضیحات متنی یا ویرایش تصاویر موجود.

مدل‌های صوتی

برای تبدیل متن به گفتار، تبدیل گفتار به متن و پردازش صدا.

مدل‌های تولید ویدیو

برای ساخت یا ویرایش ویدیو با استفاده از هوش مصنوعی.

در حال حاضر آروند از مدل‌های تولید متن و تولید تصویر پشتیبانی می‌کند و به مرور قابلیت‌های بیشتری به پلتفرم اضافه خواهند شد.

آروند چه کاری انجام می‌دهد؟

آروند به جای محدود شدن به یک مدل یا یک شرکت خاص، بستری فراهم می‌کند که بتوانید از مدل‌های مختلف هوش مصنوعی در یک محیط واحد استفاده کنید.

ما پیچیدگی‌های فنی مانند مدیریت مدل‌ها، محاسبه هزینه‌ها، مدیریت کانتکست، بهینه‌سازی مصرف توکن و پردازش درخواست‌ها را بر عهده می‌گیریم تا شما بتوانید روی کار اصلی خود تمرکز کنید:

استفاده از قدرت هوش مصنوعی برای یادگیری، تولید محتوا، حل مسئله و خلق ایده‌های جدید.

پلتفرم هوش مصنوعی آروند چطور کار می‌کند؟