نماذج الذكاء الاصطناعي الجديدة من Open AIتُصاب بالهلوسة أكثر من نماذجها القديمة

الثورة – المهندس بسام مهدي:

تُعدّ نماذج الذكاء الاصطناعي o3 وo4-mini، التي أطلقتها Open AI مؤخراً، من أحدث التقنيات في جوانب عديدة.

ومع ذلك، لا تزال النماذج الجديدة تُصاب بالهلوسة، أو تُختلق الأمور في الواقع، تُصاب بالهلوسة أكثر من العديد من نماذج Open AI القديمة.

أثبتت الهلوسة أنها من أكبر وأصعب المشكلات في مجال الذكاء الاصطناعي، وتؤثر حتى على أفضل الأنظمة أداءً اليوم. تاريخياً، تحسّن كل نموذج جديد قليلاً في مجال الهلوسة، حيث كانت الهلوسة أقل من سابقه، ولكن يبدو أن هذا لا ينطبق على o3 وo4-mini.

وفقاً لاختبارات Open AI الداخلية، فإن o3 وo4-mini، وهما ما يُسمى بنماذج الاستدلال، تُصابان بالهلوسة أكثر من نماذج الاستدلال السابقة للشركة – o1 وo1-mini وo3-mini – بالإضافة إلى نماذج Open AI التقليدية “غير الاستدلالية”، مثل GPT-4o، ومن الجدير ذكره هو أن نموذج الاستدلال هو النموذج المدرب (Trained Model) الذي يتم استخدامه لتنفيذ عملية الاستدلال (Inference)، أي التنبؤ بالمخرجات بناءً على بيانات جديدة لم يرها النموذج من قبل. وربما يكون الأمر الأكثر إثارة للقلق هو أن الشركة المُطوّرة لـ Chat GPT لا تعرف سبب حدوث ذلك، في تقريرها الفني عن o3 وo4-mini، كتبت Open AI أن “هناك حاجة إلى مزيد من البحث” لفهم سبب تفاقم الهلوسة مع توسيع نطاق نماذج الاستدلال، يُظهر O3 وo4-mini أداءً أفضل في بعض المجالات، بما في ذلك المهام المتعلقة بالبرمجة والرياضيات، ولكن نظراً لأنهما “يُقدمان ادعاءات أكثر بشكل عام”، فغالباً ما يُدفعان إلى تقديم “ادعاءات أكثر دقة بالإضافة إلى ادعاءات أكثر غير دقيقة / مُصطنعة”، وفقاً للتقرير.

قد تساعد الهلوسة النماذج على التوصل إلى أفكار شيقة والإبداع في “تفكيرها”، ولكنها أيضاً تجعل بعض النماذج صعبة البيع للشركات في الأسواق التي تُعدّ فيها الدقة أمراً بالغ الأهمية، على سبيل المثال، من المرجح ألا ترضى شركة محاماة بنموذج يُدرج الكثير من الأخطاء الواقعية في عقود عملائها.

إحدى الطرق الواعدة لتعزيز دقة النماذج هي تزويدها بإمكانيات البحث على الويب. يحقق نظام GPT-4o من Open AI، المزود ببحث الويب، دقة 90 في المئة على Simple QA، وهو معيار آخر من معايير الدقة لدى Open AI من المحتمل أن يُحسّن البحث أيضاً معدلات الهلوسة في نماذج الاستدلال على الأقل في الحالات التي يكون فيها المستخدمون على استعداد لعرض مطالبات البحث على مزود بحث خارجي، إذا استمر توسيع نطاق نماذج الاستدلال في تفاقم الهلوسة، فسيجعل البحث عن حل أكثر إلحاحاً.

في العام الماضي، تحول قطاع الذكاء الاصطناعي الأوسع نطاقاً إلى التركيز على نماذج الاستدلال بعد أن بدأت تقنيات تحسين نماذج الذكاء الاصطناعي التقليدية تُظهر نتائج متناقصة، يُحسّن الاستدلال أداء النموذج في مجموعة متنوعة من المهام دون الحاجة إلى كميات هائلة من الحوسبة والبيانات أثناء التدريب، ومع ذلك، يبدو أن الاستدلال قد يؤدي أيضاً إلى المزيد من الهلوسة، ما يُمثل تحدياً.

آخر الأخبار
شراكة وطنية ودولية غير مسبوقة لكشف مصير المفقودين في سوريا لا أحد فوق القانون حين يتكلم الشرطي باسم الدولة    "المنطقة الصحية" في منبج تدعو لتنظيم العمل الصيدلاني وتوحيد التراخيص  "صحة درعا" تحدث ثلاث نقاط إسعاف على الأتوتستراد الدولي افتتاح مشاريع خدمية عدة في بلدة كحيل بدرعا قلوب صغيرة تنبض بالأمل في مستشفى دمر 11 ألف شركة في 9 أشهر.. هل تُنعش الاقتصاد أو تُغرق السوق بالاستيراد؟ سوريا في COP30.. لمواجهة التحديات البيئية بعد سنوات من الحرب "سمرقند" تجمع سوريا وقطر على رؤية مشتركة للنهوض بالتعليم الكهرباء تتحرك ميدانياً.. استبدال محولات وتركيب كابلات في مناطق بريف دمشق حق التعلم للجميع..مشروع رقمي يضع المناهج بمتناول كل طالب حلب تطلق النظام المروري الذكي.. خطوة نوعية لتسهيل حياة المواطنين دول تتحول الى مقابر للسيارات التقليدية  "آيباك" تقود التيارات الرافضة لإلغاء العقوبات الأميركية على سوريا أزمة صحية خانقة تواجه سكان قرى حماة.. وطريق العلاج طويل زراعة الفطر.. مشروع واعد يطمح للتوسع والتصدير هوية تنموية لسوريا الجديدة  اهتمام دولي بزيارة الشرع لواشنطن ودمشق تستثمر الانفتاح الكبير لإدارة ترامب هل تستعيد الولايات المتحدة العجلة من "إسرائيل" المدمرة مؤتمر"COP30 " فرصة للانتقال من التفاوض والوعود إلى التنفيذ