Подкорпус общественно-политической лексики татарского языка

Подкорпус общественно-политической лексики татарского языка является тематическим лингвистическим ресурсом современного татарского языка. Проект выполняется в НИИ «Прикладная семиотика» Академии наук Республики Татарстан в рамках гранта Российского научного фонда «Разработка моделей связывания терминологии в разных языках (на материале русского и татарского языков)», проект № 16-18-02074.

Общественно-политическая область – это широкая область современных общественных отношений, знания о которой входят в компетенцию образованных людей-неспециалистов. Данная область охватывает политику и сферу управления, международные отношения, экономику и финансы, промышленность, военные отношения, искусство, спорт, религия и др. Наибольшее проявление общественно-политическая область находит в публикациях средств массовой информации общей направленности, которые включают в обсуждение материал большого количества конкретных предметных областей, содержат большое количество терминов, и при этом адресованы непрофессионалам и понятны непрофессионалам. Общественно-политическая сфера — одна из наиболее динамично развивающихся сфер современной жизни, соответственно, общественно-политическая лексика находится в непрерывном развитии и постоянно обогащается новыми языковыми единицами, отражающими реалии современной жизни. Поэтому материалы общественно-политического подкорпуса имеют большое значение для всестороннего и объективного исследования процессов, происходящих в современном татарском языке.

Объем подкорпуса на конец 2017 года составляет свыше 16 миллионов словоупотреблений. В качестве основных источников стали тексты официальных документов, размещенные на портале «Официальный Татарстан» (http://tatarstan.ru), материалы СМИ, учебников по общественным наукам на татарском языке и др.

Тексты, включенные в подкорпус, снабжены морфологической разметкой (представлена информация о части речи и грамматических характеристиках словоформы). Морфологическая разметка текстов выполняется автоматически с использованием модуля двухуровневого морфологического анализа татарского языка, реализованного в программном инструментарии PC-KIMMO.

Поисковая система подкорпуса позволяет искать материал по лексеме, словоформе, а также по отдельным грамматическим характеристикам.

Разрабатываемый подкорпус адресован широкому кругу пользователей: лингвистам, специалистам в области татарского и тюркского языкознания, преподавателям татарского языка, деятелям культуры, переводчикам, а также всем, кто изучает и интересуется татарским языком.