• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Новости

Лингвистическое моделирование как инструмент атрибуции текста

Доклад Анны Хоменко (НИУ ВШЭ Нижний Новгород)

Хоменко Анна Юрьевна

Департамент прикладной лингвистики и иностранных языков: Старший преподаватель

Доклад посвящен проблеме текстовой атрибуции с помощью методов моделирования индивидуального стиля автора как репрезентации его языковой личности. Речь идет о разработке интегративной методики идентификации автора письменного текста, основанной на соединении двух подходов к атрибуции: квалификативного и квантитативного. Вслед за М.Коппелом и Дж. Шлером в исследовании разработан путь объективации результатов анализа, проведенного методами интерпретативной лингвистики, посредством математической статистики. Созданная атрибуционная методика включает ряд итераций:
1) автоматическое извлечение из текста параметров, описывающих идиостиль с точки зрения прагматикона, тезауруса и лексикона автора;
2) поиск традиционных стилеметрических текстовых данных (индекс удобочитаемости Флеша-Кинкейда, индекс туманности Ганнинга, коэффициент предметности ипр.);
3) присвоение веса каждому параметру;
4) построение математических моделей анализируемых текстов;
5) сравнение математических моделей с помощью ряда метрик (коэффициент корреляции Пирсона, коэффициент детерминации линейной регрессии, t-статистикаСтьюдента);
6) интерпретация полученных данных экспертным путем. Поиск параметров, описывающих авторский идиостиль, ведется на основании подхода к тексту как к продукту деятельности конкретной языковойличности (Ю.Н.Караулов, С.М. Вул). Автоматическое извлечение предустановленных параметров осуществляется с помощью разработанного входе исследования электронного лингвистического ресурса «ХоРом». Доказано, что интегративная атрибуционная модель является достаточно полной, всесторонне имитирующей оригинал и одновременно объективной и способна успешно решать идентификационную задачу атрибуционной лингвистики на текстах разного объема и жанровой отнесенности.