YARN: полпути к русскому ворднету. Эксперименты по дизамбигуации.
Доклад Даниила Алексеевского
Для русского языка не существует в свободном доступе лексического ресурса, выровненного с Princeton WordNet. Наша школа принимает участие в проекте по созданию такого ресурса. За время существования проект успел опробовать широкий круг подходов, основанных как на ручном труде, так и на автоматической обработке данных. Последний подход связан с автоматическим выделением отношений гиперонимии (is_a, частное-общее) из текстов словарных определений толкового словаря.
Одним из ключевых мест в этом подходе является семантическая дизамбигуация кандидата в гиперонимы. Для словарей это сложная задача, на которой согласованность между экспертами не превышает 55%. Была проведена серия экспериментов с классическими эвристическими подходами к дизамбигуации и с их расширением с использованием базы данных семантической близости слов. В докладе представлено современное состояние проекта в целом, проведённые эксперименты по дизамбигуации и их результаты.
Дата
16 декабря
2015
В статье упомянуты