Студентка Новосибирского государственного университета создала систему, которая способна автоматически распознавать, оцифровывать и анализировать классические тибетские тексты с помощью машинного обучения, сообщает пресс-служба вуза.
Планируется, что разработка поможет сохранить тибетское текстовое наследие, которое является частью культуры бурятского народа.
В своем исследовании студентка направления «Фундаментальная и прикладная лингвистика» гуманитарного института НГУ Анна Мурашкина использовала изображения тибетских текстов, датируемых XVIII-XX веками. Она пояснила, что решила создать модель, умеющую распознавать символы тибетского алфавита с изображений, которая переводила бы его в машиночитаемый вид с большей точностью.
Так, студентка создала модульный алгоритм, действующий на этапах предобработки, сегментации, распознавания и постобработки.
В результате ученые получили новые возможности оцифровки древних тибетских рукописей.
Ранее мы писали о том, что систему для диагностики и разрушения раковых клеток разрабатывают в Новосибирске
ИА Сибинформ