Разработчики из Google Research и подразделения компании по исследованию искусственного интеллекта DeepMind, представили новое семейство больших языковых моделей под названием Med-Gemini для применения в сфере здравоохранения.
Med-Gemini являются новым поколением мультимодальных ИИ-систем (LMM), способных обрабатывать разнообразную медицинскую информацию – от текста и изображений до аудио и видео. Главной особенностью моделей стал встроенный механизм поиска в интернете, который позволяет им эффективно находить дополнительные данные для повышения точности ответов на сложные медицинские вопросы.
На данное время ИИ-модели находятся на стадии исследования, но уже сейчас разработчики утверждают, что Med-Gemini продемонстрировали выдающиеся результаты, превзойдя даже ведущие модели GPT-4 от OpenAI по широкому спектру медицинских задач. Новые ИИ-модели обладают огромным потенциалом в клинической диагностике и превосходят отраслевые стандарты в 14 популярных профильных бенчмарках.
В тесте MedQA (USMLE), имитирующем экзамен на медицинскую лицензию в США, точность ответов модели Med-Gemini достигла 91,1%, что на 4,5% выше, чем у предыдущего медицинского ИИ от Google – Med-PaLM 2. Новые модели также превзошли людей в обобщении медицинских текстов и составлении рекомендаций, причем врачи в половине случаев оценивали ответы Med-Gemini-M 1.0 как хорошие или даже лучше, чем ответы экспертов. По 7 мультимодальным бенчмаркам, включая проверку по изображениям New England Journal of Medicine (NEJM), модель Med-Gemini показала гораздо лучшие результаты, чем GPT-4.
Для проверки способности Med-Gemini понимать и рассуждать на основе длинной контекстной медицинской информации, исследователи с успехом выполнили с ее помощью так называемую задачу поиска «иголки в стоге сена», используя большую общедоступную базу данных Medical Information Mart for Intensive Care (MIMIC-III), содержащую обезличенные данные о состоянии здоровья пациентов, поступивших в отделение интенсивной терапии. Модель смогла с высокой точностью (0,77) найти и выделить упоминания редких заболеваний и симптомов в огромных массивах медицинских данных.
Google отмечает, что поддержка Med-Gemini эффективного поиска в базе данных электронных медицинских карт Electronic Health Record (EHR) позволит «значительно снизить когнитивную нагрузку и расширить возможности врачей за счет эффективного извлечения и анализа важной информации из огромных объемов данных пациентов».