مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

19 خبر
  • نبض الملاعب
  • العملية العسكرية الروسية في أوكرانيا
  • هدنة وحصار المضيق
  • نبض الملاعب

    نبض الملاعب

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • إسرائيل تواصل غاراتها على لبنان

    إسرائيل تواصل غاراتها على لبنان

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

رد إيراني على تهديدات واشنطن بصورة لترامب وصدام حسين.. ما علاقة الـ"3 أيام"؟

تقرير عبري يحذر من انهيار الجيش بسبب العبء على المجندين وتعاظم قوة مصر وإيران وحزب الله وحماس

الدفاع الإماراتية: إصابة مولد كهربائي خارج محطة براكة للطاقة النووية في منطقة الظفرة بمسيرة

رضائي لـ RT: صدرت أوامر في حال الهجوم برا على إيران ألا يترك جندي أمريكي على قيد الحياة

تطورات جديدة في أزمة البحارة المصريين المختطفين بالصومال

"والا" العبري يكشف تفاصيل جديدة عن القاعدتين العسكريتين الإسرائيليتين السريتين في العراق

مستشار سابق بالدفاع العراقية: واشنطن خدعت بغداد وتحركات إسرائيل في صحراء العراق تمت بغطاء أمريكي

"قوة الفضاء.. زر أحمر وكائن فضائي".. ترامب ينشر صورا بالذكاء الاصطناعي لحرب يخوضها في الفضاء

الجيش الإسرائيلي يوجه إنذارا عاجلا لسكان 5 بلدات وقرى لبنانية

لحظة بلحظة.. رغم تمديد الهدنة: إسرائيل تواصل قصف لبنان بالتوازي مع مسعى أمريكي لـ"تنسيق عسكري"

ترامب يحذر إيران مجددا: الوقت ينفد وعليهم التحرك بسرعة وإلا لن يتبقى منهم شيء

بقائي يتحدث عن كذبة إسرائيل وأمريكا التالية لمواصلة الحرب على إيران وتوسيع نيرانها

أوليانوف: استئناف الضربات على إيران يعني عجز واشنطن وتل أبيب عن استخلاص العبر

مقتل قيادي بحركة الجهاد الإسلامي وابنته جراء استهداف شقته جنوبي بعلبك بصاروخ إسرائيلي (فيديو)

لأول مرة منذ سقوط الأسد.. مصدر في الدفاع السورية يكشف حقيقة تحليق طائرات حربية للجيش (فيديو)