Компании передано уже более половины из необходимых 100 тысяч предложений на ливвиковском наречии карельского языка – примеров текстов разных жанров. Об этом и других направлениях развития платформы рассказала старший научный сотрудник ИЯЛИ Карельского научного центра Российской академии наук Александра Родионова в ходе VII Международной конференции «Цифровизация языков народов России: Масштабирование опыта и перспективы» в Марийском государственном университете в Йошкар-Оле.

«ВепКар» – это уникальная цифровая платформа, созданная языковедами и математиками Карельского научного центра РАН.
Во-первых, это единственный в мире корпус вепсского и карельского языков. Корпус — это информационно-справочная система, основанная на собрании текстов различных жанров в электронной форме. «ВепКар» содержит более девяти тысяч текстов на 58 диалектах и почти три миллиона слов. Почти все они имеют разметку – лингвистическую или метатекстовую – что позволяет пользователям узнавать лексические, грамматические и другие характеристики элементов текста. Это бесценная информация для исследователей или изучающих язык.
Во-вторых, за время своего развития «ВепКар» из коллекции текстов превратился во многофункциональную языковую платформу, на базе которой помимо основной библиотеки функционируют крупные ресурсы: Аудиокарта прибалтийско-финских языков Карелии, Мультимедийный словарь карельского языка LiPaS – Livvin paginan sanat и Людиковский диалектный лексикон.
Ранее мы рассказывали о том, как в СССР пытались связать карельский язык с кавказским.