Araşdırma: Grok ChatGPT və Gemini-dən qat-qat az “hallüsinasiyaya” yol verir

25.12.2025

Çat-botların etibarlılığı ilə bağlı aparılan yeni araşdırma gözlənilməz nəticə ortaya qoyub. Relum aqreqatorunun 2025-ci ilin dekabr ayına aid hesabatına əsasən, İlon Maskın Grok modeli on populyar süni intellekt arasında ən dəqiq cavablar verən sistem olub. Hesabata görə, Grok-un “hallüsinasiyaları” ChatGPT ilə müqayisədə dörd dəfə azdır.Araşdırmanın nəticələrinə əsasən, Grok-un «hallüsinasiya» səviyyəsi cəmi 8% təşkil edir. Müqayisə üçün, ChatGPT-də bu göstərici 35%, Google Gemini-də isə 38% olub. Bu rəqəmlər faktiki dəqiqliyin vacib olduğu tapşırıqlarda həmin modellərin etibarlılığı ilə bağlı suallar yaradır.

Qiymətləndirmə təkcə hallüsinasiyaların sayı ilə məhdudlaşmayıb. Mütəxəssislər həmçinin istifadəçi reytinqlərini, cavabların stabilliyini və sistemin fasiləsiz işləmə səviyyəsini də nəzərə alıblar. Bu meyarlara əsasən, hər bir çat-bota 0-dan 99-a qədər risk balı verilib — bal nə qədər yüksəkdirsə, nəticə bir o qədər zəif sayılır. Grok cəmi 6 bal toplayaraq lider olub: 4,5 istifadəçi reytinqi, stabil cavablar və cəmi 0,07% fasilə buna əsas səbəb kimi göstərilir.

Maraqlıdır ki, ChatGPT bu siyahıda sonuncu yeri tutub və maksimum — 99 risk balı ilə qeydə alınıb. Ondan sonra Claude (75 bal) və Meta AI (70 bal) qərarlaşıb. Eyni zamanda, Çinin DeepSeek modeli Grok-a çox yaxın nəticə göstərib: 14% «hallüsinasiyalar», sıfır fasilə və yekun risk balı 4.

Bu nəticələr göstərir ki, süni intellekt yarışında təkcə populyarlıq deyil, dəqiqlik və sabitlik də getdikcə daha həlledici amilə çevrilir.

Предыдущая статья

Perisphere qulaqlıqları VR-eynəklərə çevrilə bilir

Следующая статья

В Epic Games Store началась раздача Disco Elysium: The Final Cut

НОВОСТИ ПО ТЕМЕ

Пн	Вт	Ср	Чт	Пт	Сб	Вс
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Araşdırma: Grok ChatGPT və Gemini-dən qat-qat az “hallüsinasiyaya” yol verir

Microsoft представил три ИИ-модели для генерации текста, голоса и изображений

Alibaba-nın yeni AI modeli Qwen 3.5-Omni video dərsliklərdən istifadə edərək kod yaza bilir

R.I.S.K. Company announces internship program for individuals interested in the field of AI (Artificial Intelligence)

О ЖУРНАЛЕ

ПОДПИШИТЕСЬ НА НАС

Araşdırma: Grok ChatGPT və Gemini-dən qat-qat az “hallüsinasiyaya” yol verir

Microsoft представил три ИИ-модели для генерации текста, голоса и изображений

Alibaba-nın yeni AI modeli Qwen 3.5-Omni video dərsliklərdən istifadə edərək kod yaza bilir

R.I.S.K. Company announces internship program for individuals interested in the field of AI (Artificial Intelligence)

СОЦИАЛЬНЫЕ СЕТИ

О ЖУРНАЛЕ

ПОДПИШИТЕСЬ НА НАС