Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Автоматический поиск формульных конструкций в древнеисландских сагах

Выступали Дарья Глебова, Анастасия Костяницына и Евгений Глазунов

Проект нацелен на разработку алгоритма, который бы позволил автоматически находить формулы в древнеисландских сагах. Формула - группа слов, которая употребляется регулярно в одних условиях для выражения некоторой идеи, она может иметь постоянный или вариативный лексический состав (ср. в русских сказках зачин “жили-были”).  На основе корпуса из 49 саг был составлен список нграмм, который постепенно фильтровался или кластеризовался с помощью различных эвристик, которые направлены на выделение тех или иных предполагаемых свойств формул (например, похожий контекст с помощью тематического моделирования). С помощью методов анализа естественного языка и анализа данных (векторные семантические модели, разные методы кластеризации, тематическое моделирование) был создан  алгоритм, который находит как некоторые  часто встречающиеся, так и еще не рассматривавшиеся в научной литературе формулы.