غوغل تقرّ: روبوتات الدردشة تخطئ في ثلث إجاباتها

تكنولوجيا 18 كانون الأول, 2025

أقرت شركة غوغل بأن روبوتات الدردشة المعتمدة على الذكاء الاصطناعي لا تزال تعاني ضعفًا في الدقة الواقعية، مؤكدة أن هذه الأنظمة بعيدة عن الاعتماد الكامل كمصادر موثوقة.

ووفق اختبار FACTS Benchmark Suite الذي أجرته الشركة، لم يتمكن أي نموذج من تجاوز 70% دقة في صحة المعلومات، إذ سجل Gemini 3 Pro أعلى نتيجة بنسبة 69%، بينما حققت نماذج منافسة من OpenAI وAnthropic وxAI نسبًا أدنى، ما يعني أن الروبوتات تخطئ في نحو ثلث إجاباتها رغم أسلوبها الواثق.

وأوضحت غوغل أن هذا الخلل يمثل خطرًا في قطاعات حساسة مثل الطب والتمويل والقانون، حيث قد تؤدي معلومة خاطئة واحدة إلى نتائج جسيمة.

ويقيس اختبار FACTS دقة الذكاء الاصطناعي في المعرفة المضمّنة، والبحث عبر الإنترنت، والالتزام بالمصادر، وفهم الرسوم والمخططات، وهي المهام التي سجلت فيها النماذج أضعف أداء، خصوصًا في الفهم متعدد الوسائط.

وخلصت غوغل إلى أن الذكاء الاصطناعي لا يزال بحاجة إلى رقابة بشرية وتحقق مستمر قبل الاعتماد عليه كمصدر للحقيقة.

هل تريد/ين الاشتراك في نشرتنا الاخبارية؟

Please wait...

شكرا على الاشتراك!

مواضيع ذات صلة :

انضم الى قناة “هنا لبنان” على يوتيوب الان، أضغط هنا

Contact Us