В исследовании надежности чат-бот Grok получил самый низкий показатель галлюцинаций

25.12.2025

Компания Relum провела исследование надежности ИИ, в котором оценивались чат-боты по таким параметрам, как частота возникновения галлюцинаций, рейтинг клиентов, стабильность ответов и частота простоев. Были протестированы 10 основных ИИ-моделей. Чат-ботам присваивался балл риска надежности от 0 до 99, причем более высокие баллы указывали на более серьезные проблемы.

По результатам исследования, Grok, от компании Илона Маска xAI, признан одним из самых надежных чат-ботов с искусственным интеллектом для использования на рабочем месте. Нейросеть показывает самый низкий уровень ложных срабатываний — всего 8%. Для сравнения, у Gemini от Google, этот показатель составил 38%, у ChatGPT от OpenAI — 35%.

«Зависимость от инструментов искусственного интеллекта, вероятно будет расти, поэтому компаниям следует выбирать чат-ботов, исходя из их надежности и соответствия конкретным потребностям бизнеса. Чат-бот, которым пользуются все, не обязательно является лучшим вариантом для вашей отрасли или дает точные ответы на ваши задачи», — отметил директор по продуктам компании Relum Разван-Лучиан Хайдук.

Остальные параметры Grok — рейтинг клиентов 4,5, стабильность 3,5 и время простоя 0,07%, что привело к общему показателю риска всего 6 баллов. DeepSeek занял второе место с 14% случаев возникновения галлюцинаций и нулевым временем простоя, получив показатель риска 4. Высокие показатели галлюцинаций и времени простоя ChatGPT обеспечили ему наивысший балл показатель риска 99.

Предыдущая статья

Google разрешит менять адрес электронной почты Gmail с сохранением данных

Следующая статья

Logitech G304 X Lightspeed: игровой манипулятор с аккумулятором, обеспечивающий автономность до 106 часов

НОВОСТИ ПО ТЕМЕ

Пн	Вт	Ср	Чт	Пт	Сб	Вс
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

В исследовании надежности чат-бот Grok получил самый низкий показатель галлюцинаций

Microsoft представил три ИИ-модели для генерации текста, голоса и изображений

Alibaba-nın yeni AI modeli Qwen 3.5-Omni video dərsliklərdən istifadə edərək kod yaza bilir

R.I.S.K. Company announces internship program for individuals interested in the field of AI (Artificial Intelligence)

О ЖУРНАЛЕ

ПОДПИШИТЕСЬ НА НАС

В исследовании надежности чат-бот Grok получил самый низкий показатель галлюцинаций

Microsoft представил три ИИ-модели для генерации текста, голоса и изображений

Alibaba-nın yeni AI modeli Qwen 3.5-Omni video dərsliklərdən istifadə edərək kod yaza bilir

R.I.S.K. Company announces internship program for individuals interested in the field of AI (Artificial Intelligence)

СОЦИАЛЬНЫЕ СЕТИ

О ЖУРНАЛЕ

ПОДПИШИТЕСЬ НА НАС