spot_img
3 апреля, 2026
ДомойAI / MLMicrosoft представил три ИИ-модели для генерации текста, голоса и изображений

Microsoft представил три ИИ-модели для генерации текста, голоса и изображений

Исследовательское подразделение компании Microsoft представило три новые ИИ-модели, способные генерировать текст, голос и изображения. Разработчики сделали упор на снижение стоимости вычислений по сравнению с аналогами от Google и OpenAI.

  • MAI-Transcribe-1 переводит речь на 25 языках в текст, опережая по скорости сервис Azure Fast в 2,5 раза. Расшифровка текста начинается от $0,36 в час;
  • MAI-Voice-1 создает минутную аудиодорожку за одну секунду и поддерживает настройку голосов. Синтез речи оценивается в $22 за 1 млн. символов;
  • MAI-Image-2 отвечает за генерацию визуального контента по текстовому описанию. Работа с изображениями обойдется в $5 за 1 млн. входных токенов и $33 за генерацию 1 млн. выходных токенов.

Все модели уже развернуты на платформе Microsoft Foundry, а модели транскрипции и синтеза речи также доступны в MAI Playground.

Несмотря на выпуск собственных разработок, исполнительный директор подразделения Мустафа Сулейман (Mustafa Suleyman), отметил приверженность Microsoft партнерству с OpenAI, в которую она уже инвестировала более $13 млрд. Корпорация все так же продолжит использовать модели OpenAI в своих продуктах в рамках многолетнего контракта.

НОВОСТИ ПО ТЕМЕ

СОЦИАЛЬНЫЕ СЕТИ

11,788ФанатыМне нравится
1,030ЧитателиЧитать
3,086ЧитателиЧитать
718ПодписчикиПодписаться
- Реклама -
- Реклама -