مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

43 خبر
  • اتفاق أمريكي إيراني لوقف الحرب على جميع الجبهات
  • إسرائيل تواصل عملياتها في لبنان
  • العملية العسكرية الروسية في أوكرانيا
  • اتفاق أمريكي إيراني لوقف الحرب على جميع الجبهات

    اتفاق أمريكي إيراني لوقف الحرب على جميع الجبهات

  • إسرائيل تواصل عملياتها في لبنان

    إسرائيل تواصل عملياتها في لبنان

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • مونديال 2026

    مونديال 2026

  • فيديوهات

    فيديوهات

  • الحكم بالسجن على لاعب إسباني بتهمة الاعتداء الجنسي

    الحكم بالسجن على لاعب إسباني بتهمة الاعتداء الجنسي

  • سجن وغرامة مالية بحق عضو مجلس إدارة الزمالك بسبب النادي الأهلي

    سجن وغرامة مالية بحق عضو مجلس إدارة الزمالك بسبب النادي الأهلي

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

المجلس الأعلى للأمن القومي الإيراني يصدر "بيانا للشعب" عقب إعلان الاتفاق مع واشنطن

مصدر إيراني مطلع: تنازل استثنائي انتزعه قاليباف من ترامب في اللحظة الأخيرة

علي أكبر ولايتي: ساعة الصفر حانت والمنصات تأخذ وضعية الإطلاق

التلفزيون الإيراني يعلن رسميا التوصل لاتفاق مع الولايات المتحدة (فيديو)

بيان مشترك لأربع دول أوروبية تؤكد استعدادها لرفع العقوبات عن إيران

"القناة 12" العبرية: ترامب يتحدث عن نتنياهو بطريقة لم يسبق لأي زعيم أن تحدث بها عنه علنا من قبل

"قبل بزوغ الفجر".. الحرس الثوري الإيراني يتوعد إسرائيل برد مزلزل بعد قصف الضاحية الجنوبية لبيروت

بعد انفجار ترامب غضبا في وجه نتنياهو.. بن غفير يتحدى ويوجه رسالة لسيده ورئيسه

"سنرد قريبا جدا".. إيران ترفض عرضا قدمه ترامب مقابل ضبط النفس وعدم مهاجمة إسرائيل

ترامب يعلن التوصل إلى اتفاق سلام مع إيران والرفع الفوري للحصار البحري وفتح مضيق هرمز بالكامل

نائب وزير الخارجية الإيراني يكشف تفاصيل محادثات الـ60 يوما مع واشنطن

قرقاش: الاتفاق الأمريكي - الإيراني قد يطوي صفحة الحرب في المنطقة

أمين مجلس الأمن القومي الإيراني: لبنان حياتنا ورد جند الإسلام قادم

باكستان: أمريكا وإيران اتفقتا على وقف فوري ونهائي لإطلاق النار على كل الجبهات بما في ذلك لبنان

ترامب يشيد بدور بوتين وشي في تسهيل التوصل إلى تسوية مع إيران

الرئيس الإيراني:‏ وصف فريق التفاوض بالخائن أمر مؤسف

تستبعد تركيا.. أمريكا وإسرائيل واليونان وقبرص توقع اتفاقية لإنشاء مركز طاقة جديد في شرق المتوسط

ترامب: الهجوم على بيروت ما كان ينبغي أن يحدث ونحن على وشك التوصل إلى اتفاق سلام مع إيران

"يديعوت أحرونوت": تقديرات إسرائيلية بأن إيران ستمتنع عن مهاجمة إسرائيل مقابل مزايا

"قناة 15" العبرية: إسرائيل قررت الرد عسكريا إذا استهدفتها إيران بالصواريخ

وكالة "فارس" تسرد تفاصيل تدمير السرب 157 الإسرائيلي في قاعدة رامات ديفيد

تقرير عبري: مصر أصبحت اللاعب الإقليمي الأبرز في حرب إيران.. والقاهرة جنت مكاسب دبلوماسية غير متوقعة

بزشكيان: قرار الحرب والتفاوض يعودان إلى قائد الثورة والمجلس الأعلى للأمن القومي والكل سيلتزم

بعد 3 سنوات على هجوم "محمد صلاح".. الجيش الإسرائيلي يعيد حساباته تجاه التهديدات القادمة من مصر

يزن 500 كغ.. الشرطة الإيرانية تعلن تفكيك صاروخ "توماهوك" متطور سقط في فارامين (صور)