Bbabo NET

العلوم والتكنولوجيا أخبار

قدمت Yandex الجيل الثالث من نماذج اللغات الكبيرة YandexGPT

نعلن اليوم عن خط الشبكات العصبية YandexGPT 3. أولها، YandexGPT 3 Pro، متاح بالفعل عبر واجهة برمجة التطبيقات (API) على موقع Yandex Cloud الإلكتروني، بما في ذلك الوضع التجريبي المجاني. بالإضافة إلى ذلك، يمكنك الآن تدريب شبكة عصبية جديدة بنفسك.

تعمل الشبكات العصبية من الجيل الجديد بشكل أفضل مع الاستعلامات المعقدة وتتبع تنسيق استجابة معين بدقة أكبر، مما يجعلها مفيدة بشكل خاص في حل المشكلات الحقيقية للمستخدمين والشركات.

في المستقبل القريب، ستظهر شبكات YandexGPT 3 العصبية في خدمات Yandex لجمهور واسع.

لتقييم جودة YandexGPT 3 Pro، أجرينا عدة اختبارات. أولاً، قمنا بتقييم النموذج على نسخة محلية من معيار MMLU الدولي. ثانيًا، قمنا باختبار النموذج باستخدام طريقة Side-by-Side على طلبات حقيقية من المستخدمين والشركات. ثالثًا، أنشأنا اختبار اللغة الروسية الخاص بنا استنادًا إلى معيار IFEval لتقييم مدى امتثال الاستجابة للتنسيق المحدد في الطلب. الآن المزيد عن كل منهما.

لتقييم جودة الشبكة العصبية الجديدة، أنشأنا YaMMLU_ru، وهو إصدار باللغة الروسية من المعيار الدولي المفتوح MMLU. للقيام بذلك، قمنا بترجمة المهام الأصلية إلى اللغة الروسية باستخدام مترجم Yandex. ثم قام الخبراء بفحص النصوص مرة أخرى، وقاموا بتصحيح الأخطاء، وقاموا أيضًا بترجمة الاستفسارات (على سبيل المثال، جعل وحدات القياس متوافقة مع المعايير الروسية). يتيح لنا هذا الإصدار أن نأخذ في الاعتبار بشكل أفضل السياق المحلي وتفاصيل الاستعلامات المصاغة باللغة الروسية.

قمنا أيضًا بتطبيق طريقة SBS لتقييم كيفية تعامل النموذج الجديد مع توليد الأفكار وتلخيص المعلومات ومهام التصنيف وإنشاء المحتوى والطلبات الأخرى المطلوبة بين المستخدمين والشركات.

انخفض عدد المواقف التي لا يجيب فيها النموذج على سؤال المستخدم بمقدار 5 مرات. بالإضافة إلى ذلك، فإن النموذج اللغوي الجديد يرتكب أخطاء أقل بكثير. لقد اختبرنا ذلك على مجموعة خاصة من الاستعلامات المعقدة بشكل خاص. نتائج هذه المجموعة:

للتحقق من مدى توافق استجابات الشبكة العصبية مع التنسيق المحدد في الطلب، يوجد معيار IFEval جيد. أنه يحتوي على مطالبات يمكن تقييم الإجابات عليها بدقة تامة. على سبيل المثال، "اكتب نصًا يحتوي على أكثر من 400 كلمة" أو "اذكر مصطلح الذكاء الاصطناعي ثلاث مرات على الأقل". لتقييم استجابات YandexGPT 3، أنشأنا إصدارًا باللغة الروسية من المعيار استنادًا إلى IFEval. في الوقت نفسه، تم توسيع قائمة المهام التي يتعين حلها بشكل كبير ومعقدة.

بالمقارنة مع YandexGPT 2، تحسنت جودة إجابات YandexGPT 3 بمقدار 10 نقاط مئوية، وتضاعف اتساقها. وهذا يعني أن الشبكة العصبية تعلمت أن تفهم بشكل أفضل الإجابات التي يجب أن تكون بالضبط على الاستعلامات التي تكون متماثلة بشكل أساسي، ولكن تمت صياغتها بشكل مختلف.

يمكن دمج YandexGPT 3 Pro في المنتجات عبر واجهة برمجة التطبيقات (API). انخفضت تكلفة استخدام الشبكة العصبية الجديدة إلى النصف تقريبًا، ولكن يمكنك اختبارها مجانًا. في الوضع التجريبي، يتوفر 30 طلبًا مجانيًا في الساعة للمستخدمين المسجلين الجدد.

تعمل الشبكة العصبية الجديدة بشكل جيد في مجالات مثل دعم العملاء والمبيعات عبر الإنترنت والاتصالات الرقمية والتسويق والإعلان وإدارة شؤون الموظفين. كما يعمل نموذج اللغة بشكل أفضل مع المستندات: على سبيل المثال، يقوم بإعداد العقود والفواتير والوثائق التنظيمية والوصف الوظيفي والمزيد. تشكل المهام المتعلقة بالصناعات المذكورة أعلاه جزءًا كبيرًا من مجموعة بيانات التدريب YandexGPT 3.

مثال قمنا بإنشائه عبر واجهة برمجة التطبيقات (API) على موقع Yandex Cloud الإلكتروني:

بالإضافة إلى ذلك، يمكنك الآن تدريب YandexGPT 3 Pro بشكل مستقل في خدمة Yandex DataSphere لجعله يناسب احتياجاتك بشكل أفضل. لبدء عملية التدريب الإضافية، تحتاج إلى تحميل ملف يحتوي على أمثلة للاستعلامات والإجابات القياسية عليها في DataSphere. ستكون الشبكة العصبية المعاد تدريبها متاحة لك فقط.

قدمت Yandex الجيل الثالث من نماذج اللغات الكبيرة YandexGPT