В Санкт-Петербурге ученые совершили настоящий прорыв — создали программу, которая понимает карельскую речь. Речь идет о ливвиковском наречии, на котором говорят в южных районах Карелии. Это особенно важно, потому что карельский язык сегодня в опасности — в повседневной жизни его используют всего несколько тысяч человек, в основном старшее поколение.
Разработчики из Федерального исследовательского центра РАН столкнулись с непростой задачей. Для обучения компьютера понимать карельскую речь пришлось собирать материал буквально по крупицам — использовали и радиопередачи на карельском, и тексты из газет, и специально записанные разговоры носителей языка. Особенно ценно, что программа научилась распознавать смешанную речь, когда в карельскую речь вплетаются русские слова — так действительно говорят многие современные носители языка.
Эта технология — не просто научное достижение. Она может стать настоящим спасением для исчезающего языка. Программа поможет расшифровывать старые аудиозаписи, сохранять современную разговорную речь, создавать словари и учебные материалы. В будущем на ее основе можно будет сделать голосовых помощников и переводчики для карельского языка.
Как отмечают исследователи, их система учитывает реальные особенности живой карельской речи, в отличие от существующих аналогов. Это дает надежду, что уникальный язык карелов не канет в лету, а получит новый шанс на жизнь в цифровую эпоху. Главное теперь — не упустить эту возможность и продолжать работу по сохранению языкового наследия.