Компании, вложившие миллиарды долларов на создание больших языковых моделей (LLM), теперь делают ставку на небольшие ИИ-модели в качестве нового источника повышения доходов, пишет Financial Times. Небольшие модели гораздо дешевле создавать и обучать, чем LLM.
Apple, Microsoft, Meta и Google недавно выпустили новые небольшие языковые модели с расширенными возможностями и более ориентированными на выполнение конкретных задач. На обучение и запуск таких моделей требуется меньше энергии, кроме того, они способны обеспечить защиту конфиденциальных данных.
«Обладая таким высоким качеством при меньших затратах, вы фактически предоставляете клиентам возможность использовать гораздо больше приложений и выполнять такие действия, которые, по их мнению, не принесли бы им достаточной отдачи от этих инвестиций (в LLM), чтобы оправдать их реальное использование», — сказал Эрик Бойд (Eric Boyd), корпоративный вице-президент Microsoft Azure AI Platform.
Преимущество небольших языковых моделей также заключается в том, что они могут выполнять задачи локально на устройстве, не отправляя информацию в облако, что будет удобно многим клиентам, заботящимся о конфиденциальности и не желающим отправлять информацию за пределы внутренних сетей. Также такие модели можно использовать на смартфонах. Например, модель Gemini Nano от Google установлена на смартфонах Pixel и Samsung S24.
Глава OpenAI Сэм Альтман (Sam Altman) заявил, что компания по-прежнему будет сосредоточена на создании более крупных моделей ИИ с расширенными возможностями, способными рассуждать, планировать и выполнять задачи, и которые в конечном итоге смогут достичь такого же уровня интеллекта, как у человека.