Подразделение Microsoft Research представило Magma, новую мультимодальную ИИ-модель, которая может управлять программными интерфейсами и роботизированными системами. Magma представляет собой интегрированное решение, объединяющее обработку визуальных...
Кроме ИИ-модели Qwen2.5-Max компания Alibaba выпустила Qwen2.5-VL, которая получила значительные улучшения по сравнению с предыдущей версией Qwen2-VL.
Мультимодальная модель Qwen2.5-VL умеет анализировать диаграммы и графики,...
Китайский стартап DeepSeek, который получил большую известность благодаря своему ИИ-чат-боту, сообщил о запуске мультимодальной нейросети Janus Pro. Модель способна генерировать и анализировать изображения лучше,...
Компания Google представила мультимодальную модель искусственного интеллекта под названием Gemini, бесплатной альтернативы GPT-4 от OpenAI. Google называет Gemini своей «самой большой и мощной» моделью...