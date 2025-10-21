Компании IBM и Groq объявили о стратегическом партнерстве с целью предоставления клиентам возможностей высокоскоростного ИИ-инференса по доступной цене. Объединение watsonx Orchestrate от IBM с аппаратными решениями Groq позволит ускорить развертывание агентных ИИ-систем. В рамках партнерства компании планируют интегрировать и усовершенствовать технологию Red Hat vLLM с архитектурой LPU Groq.

Совместное решение позволит клиентам использовать возможности watsonx Orchestrate привычным образом и с привычными инструментам в инференс-платформе GroqCloud, предоставляющей разработчикам доступ к высокоскоростной и недорогой обработке LLM. Интеграция позволит удовлетворить ключевые потребности разработчиков ИИ-решений, включая оркестрацию инференса, балансировку нагрузки и аппаратное ускорение. Также планируется поддержка моделей IBM Granite в GroqCloud для клиентов компании.

Предприятия при переводе ИИ-агентов из пилотной версии в промышленную эксплуатацию сталкиваются с проблемами обеспечения скорости, стоимости и надежности. Отмечается, что партнерство IBM и Groq позволит объединить скорость инференса Groq, экономическую эффективность и доступ к новейшим open source моделям с оркестрацией агентского ИИ IBM, предоставляя клиентам инфраструктуру, необходимую для их масштабирования.

IBM сообщила, что LPU обеспечивают минимум в пять раз более быстрый и экономичный инференс, чем системы на ускорителях конкурентов. Это позволяет обеспечить стабильно низкую задержку и производительность при масштабировании нагрузок, что особенно важно для ИИ-агентов в регулируемых отраслях. Благодаря Groq ИИ-агенты IBM смогут анализировать информацию в режиме реального времени и мгновенно предоставлять точные ответы, позволяя организациям принимать более оперативные и обоснованные решения.