• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

YARN: полпути к русскому ворднету. Эксперименты по дизамбигуации.

Доклад Даниила Алексеевского

11.12.2015  на очередном заседании научного семинара Школы лингвистики и группы проекта "Корпусные исследования границ речевого варьирования: от аграмматизма к норме" с докладом "YARN: полпути к русскому ворднету. Эксперименты по дизамбигуации" выступил Даниил Алексеевский.
Для русского языка не существует в свободном доступе лексического ресурса, выровненного с Princeton WordNet. Наша школа принимает участие в проекте по созданию такого ресурса. За время существования проект успел опробовать широкий круг подходов, основанных как на ручном труде, так и на автоматической обработке данных. Последний подход связан с автоматическим выделением отношений гиперонимии (is_a, частное-общее) из текстов словарных определений толкового словаря.

Одним из ключевых мест в этом подходе является семантическая дизамбигуация кандидата в гиперонимы. Для словарей это сложная задача, на которой согласованность между экспертами не превышает 55%. Была проведена серия экспериментов с классическими эвристическими подходами к дизамбигуации и с их расширением с использованием базы данных семантической близости слов. В докладе  представлено современное состояние проекта в целом, проведённые эксперименты по дизамбигуации и их результаты.