Лингвистическое моделирование как инструмент атрибуции текста
Доклад Анны Хоменко (НИУ ВШЭ Нижний Новгород)
Хоменко Анна Юрьевна
Департамент прикладной лингвистики и иностранных языков: Старший преподаватель
1) автоматическое извлечение из текста параметров, описывающих идиостиль с точки зрения прагматикона, тезауруса и лексикона автора;
2) поиск традиционных стилеметрических текстовых данных (индекс удобочитаемости Флеша-Кинкейда, индекс туманности Ганнинга, коэффициент предметности ипр.);
3) присвоение веса каждому параметру;
4) построение математических моделей анализируемых текстов;
5) сравнение математических моделей с помощью ряда метрик (коэффициент корреляции Пирсона, коэффициент детерминации линейной регрессии, t-статистикаСтьюдента);
6) интерпретация полученных данных экспертным путем. Поиск параметров, описывающих авторский идиостиль, ведется на основании подхода к тексту как к продукту деятельности конкретной языковойличности (Ю.Н.Караулов, С.М. Вул). Автоматическое извлечение предустановленных параметров осуществляется с помощью разработанного входе исследования электронного лингвистического ресурса «ХоРом». Доказано, что интегративная атрибуционная модель является достаточно полной, всесторонне имитирующей оригинал и одновременно объективной и способна успешно решать идентификационную задачу атрибуционной лингвистики на текстах разного объема и жанровой отнесенности.
Дата
5 февраля
2021
Рубрики
В статье упомянуты