Ученые Карельского научного центра РАН работают над созданием речевого корпуса прибалтийско-финских языков Карелии. Они уже побывали в Медвежьегорском районе. Сотрудники двух институтов – языка, литературы и истории и прикладных математических исследований посетили Паданы, Сельги, Сяргозеро, Шалговаару, Венгигору, Евгору, Карельскую Масельгу.
Нам удалось собрать и уточнить материалы лингвистического, этнографического и фольклорного характера у жителей Паданского куста деревень – это один из нескольких ареалов республики, где собственно карельское наречие остаётся в наиболее сохранном состоянии. Аудиозаписи бесед с носителями местных говоров войдут в состав будущего речевого корпуса, – рассказала младший научный сотрудник Сектора языкознания Института языка, литературы и истории КарНЦ РАН Наталия Пеллинен.
Корпус – это информационно-справочная система. Она включает в себя тексты и словари, хранящиеся в базе данных, а также компьютерную программу, обеспечивающую поиск и обработку текстов. Новый проект позволит дополнить его аудиозаписями на разных диалектах. Их планируется снабдить транскрипцией, разметкой и переводом на русский язык.
Цифровизация архивных и полевых аудио-образцов карельской и вепсской речи в формате Речевого корпуса в дальнейшем сможет упростить обработку и хранение материалов, позволит ввести в научный оборот и представить в открытый доступ уникальные аудиоматериалы, отражающие состояние карельских и вепсских диалектов начиная с середины прошлого столетия. Эти материалы хранятся в Фонограммархиве Института языка, литературы и истории КарНЦ РАН и крайне нуждаются в оцифровке, в целях обеспечения их дальнейшего хранения.
Одним из итогов проекта станет мультимедийная карта говоров. Она поможет представить всё многообразие живой и утраченной прибалтийско-финской диалектной речи Карелии. Карту можно будет использовать в образовательных и просветительских целях, а также для развития туризма в регионе.