Представлен бесплатный ИИ-сервис NotesGPT, предназначенный для транскрибации голосовых заметок с помощью нейросетей. Есть поддержка многих языков. Код приложения написан на TypeScript, а в качестве модели машинного обучения используется открытая Mixtral, развернутая на мощностях сервиса Together AI. Функция распознавания голоса реализована на базе нейросети Whisper, которая запущена на Replicate. Дополнительно используются Convex и Clerk. Сервис можно запустить через браузер. Работает как на компьютерах, так и на смартфонах. Для регистрации достаточно привязать учетную запись Google.
Для того, чтобы пользоваться NotesGPT необходимо совершить следующие действия:
- Перейти на сайт NotesGPT и авторизироваться;
- Нажать «Get started» — «Record a new voice note»;
- Нажать на значок с микрофоном и начать говорить;
- После нажать на кнопку паузы и ждать перевода.
Сервис работает молниеносно. Запись из 2-3 предложений переводится в текст за пару секунд. На перевод целой лекции может уйти до 20 минут. По желанию можно скопировать и отредактировать полученный текст. Если запись получилась слишком долгой, сервис может сделать краткий пересказ с важными моментами.
В будущем разработчики планируют добавить в NotesGPT возможность приостанавливать запись и продолжать позже, а также перейти на более быструю версию Whisper. Кроме того, планируется реализовать PWA, мобильное приложение и интеграцию с Notion, чтобы транскрибированные записи можно было сохранять в виде документа.
Код проекта открыт и опубликован на GitHub. В репозитории есть инструкция по развертыванию NotesGPT на собственном сервисе.