• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Лев Толстой и сетевой анализ

Доклад Даниила Скоринкина на научном семинаре лингвистической лаборатории

На очередном научном семинаре лингвистической лаборатории и школы лингвистики преподаватель школы Даниил Скоринкин рассказал о применении теории графов и анализа сетей (network analysis) для исследования художественного наследия Л.Н. Толстого.





       
Методы теории сетей (network theory/network science/network analysis) применяются в диапазоне от политических наук до эпидемиологии — везде, где уместно моделировать объект исследования в виде графа. Не осталось в стороне и литературоведение: и художественных персонажей, и прочие именованные сущности в текстах, да и сами тексты можно представить в виде узлов и связей между ними. Серьезных преимуществ тут два:

1. Из всех формальных абстракций сеть (граф) — одна из самых наглядных и интуитивно понятных. Небольшие сети легко визуализировать и анализировать невооруженным глазом, в то же время существует множество математических метрик для оценки структурных особенностей сети в целом и "значимости" отдельных узлов, разработано немало алгоритмов выделения сообществ в сетях.   
2. При наличии подходящих инструментов NLP или достаточно "умной" разметки текстов можно производить количественные исследования (в духе distant reading) на больших корпусах художественных произведений. Здесь открываются возможности для исследования типологии произведений, анализа эволюции определенного типа/жанра текстов и т.д. 

В докладе рассказано о применении сетевого анализа для исследования текстов Л.Н. Толстого. Первый и основной сюжет рассказа — извлечение и анализ сетей в романе "Война и мир". Показано, как некоторые особенности сетей связаны с антитезой "мирного" и "военного" в романе, как с помощью метрик центральности можно отследить переключения "точки зрения" между героями, какие группы персонажей получается выделить стандартными методами кластеризации графов и на какие литературные параллели всё это наталкивает. Второй (побочный и маленький) сюжет связан с недавно созданным под руководством Бориса Орехова прекрасным цифровым указателем к 90-томному собранию сочинений Л.Н. Толстого. Среди прочего этот ресурс позволяет работать с "указателем имен собственных" к 90-томнику как с графом, связь в котором устанавливается на основе совместного упоминания. Автор доклада попытался использовать возможности цифрового указателя для анализа художественной части наследия Толстого.