Компания Google открыла доступ к бета-версии нейросети Gemini 1.5 Pro для всех пользователей. Доступ к нейросети на данное время предоставляется только в некоторых регионах на ограниченном количестве языков. Об этом сообщил ведущий научный сотрудник Google DeepMind Джефф Дин (Jeff Dean).
We’re starting to roll out API support for Gemini 1.5 Pro for developers. We’re excited to see what you build with the 1M token context window!
We’ll be onboarding people to the API slowly at first, and then we’ll ramp it up. In the meantime, developers can try out Gemini 1.5… https://t.co/bvyISON05E
— Jeff Dean (@🏡) (@JeffDean) March 21, 2024
Языковая модель справляется с широким спектром задач и, по заявлению ее создателей, значительно превосходит по своим возможностям GPT-4. Gemini 1.5 Pro работает со стандартным контекстным окном на 128 000 токенов, хотя, как сообщается, обрабатываемый объем информации можно увеличить до 1 млн. токенов. В рамках одного запроса нейросеть способна обработать до часа видео, 11 часов аудио, кодовые базы с более чем 30 000 строк кода или более 700 000 слов. В ходе исследования Google также успешно протестировала обработку до 10 млн. токенов.
Как утверждает компания, модель Gemini 1.5 Pro не только превзошла GPT-4 в 8,2 раза по размеру «контекстного окна», но и оказалась способна понимать информацию на всем его протяжении. Gemini 1.5 Pro отлично справляется с различными задачами, такими как анализ исторических документов, например, в расшифровке стенограммы миссии «Аполлон-11». Нейросеть способна не только анализировать большие блоки данных, но и быстро находить определенный фрагмент текста внутри них. В тесте Needle In A Haystack (NIAH) нейросеть достигает 99% успеха в обнаружении конкретных фактов в длинных текстах.