غوغل تقرّ: روبوتات الدردشة تخطئ في ثلث إجاباتها

أقرت شركة غوغل بأن روبوتات الدردشة المعتمدة على الذكاء الاصطناعي لا تزال تعاني ضعفًا في الدقة الواقعية، مؤكدة أن هذه الأنظمة بعيدة عن الاعتماد الكامل كمصادر موثوقة.
ووفق اختبار FACTS Benchmark Suite الذي أجرته الشركة، لم يتمكن أي نموذج من تجاوز 70% دقة في صحة المعلومات، إذ سجل Gemini 3 Pro أعلى نتيجة بنسبة 69%، بينما حققت نماذج منافسة من OpenAI وAnthropic وxAI نسبًا أدنى، ما يعني أن الروبوتات تخطئ في نحو ثلث إجاباتها رغم أسلوبها الواثق.
وأوضحت غوغل أن هذا الخلل يمثل خطرًا في قطاعات حساسة مثل الطب والتمويل والقانون، حيث قد تؤدي معلومة خاطئة واحدة إلى نتائج جسيمة.
ويقيس اختبار FACTS دقة الذكاء الاصطناعي في المعرفة المضمّنة، والبحث عبر الإنترنت، والالتزام بالمصادر، وفهم الرسوم والمخططات، وهي المهام التي سجلت فيها النماذج أضعف أداء، خصوصًا في الفهم متعدد الوسائط.
وخلصت غوغل إلى أن الذكاء الاصطناعي لا يزال بحاجة إلى رقابة بشرية وتحقق مستمر قبل الاعتماد عليه كمصدر للحقيقة.
مواضيع ذات صلة :
ميزة جديدة لصور غوغل في مصر وتركيا.. تعرفوا إليها | غوغل تضيف ميزة قفل التطبيقات المدمجة في أندرويد 17 | غوغل تطلق ضوابط أمان متقدمة لحماية مستخدمي كروم من مخاطر الوكلاء الذكيين |




