В НГУ создали нейросеть, которая превращает научные книги в аудио за полчаса

Сервис на базе платформы «Каппа» уже озвучил 100 книг в пилотном режиме — весь фонд из 7 тысяч изданий планируют перевести в звук за месяц.

Фото: freepik

Исследовательский центр искусственного интеллекта НГУ разработал технологию автоматического создания аудиоверсий научных книг. Сейчас сервис проходит этап апробации, сообщили в пресс-службе университета.

Нейросеть извлекает текст из PDF, обрабатывает его и формирует звуковую версию. На одну книгу уходит около получаса процессорного времени — при этом достаточно 16-ядерного процессора без видеокарты.

«Для массового использования важно, что решение не является ресурсоёмким», — пояснил ведущий научный сотрудник центра ИИ Евгений Павловский.

В пилотном режиме уже озвучены первые 100 книг. Разработчики ожидают обратной связи от пользователей. Планируется перевести в аудиоформат весь фонд университетского издательства и электронной библиотеки — около 7 тысяч изданий — с разрешения правообладателей.

Технология создана на базе платформы «Каппа», которая тестирует модели ИИ перед внедрением, снижая риск «галлюцинаций». В дальнейшем разработку предложат другим университетам и публичным библиотекам. По оценке учёных, технически весь фонд можно озвучить за месяц, но на проверку результатов потребуется около года.

ИА Сибинформ
Exit mobile version