Выпускница совместной магистратуры Томского государственного университета и Skillfactory Мария Кутейникова разработала уникальную модель на основе технологий NLP, способную анализировать «эмоциональную кривую» художественных произведений и предсказывать их коммерческий успех. Разработка уже интегрируется в работу крупнейшего издательства «Эксмо».
«Идея, которая легла в основу проекта, заключается в том, что художественный текст можно рассматривать не только как последовательную связь событий во времени, но и как непрерывную последовательность эмоций, которая ведет читателя от экспозиции к кульминации и развязке», — поясняет автор проекта.
Модель, созданная на Python, анализирует эмоциональный тон каждого предложения с помощью языковой модели, адаптированной для русского языка.
Исследование проводилось на базе масштабного датасета из более чем 4000 книг, предоставленных издательством. Результаты показали четкую корреляцию между эмоциональной кривой и коммерческим успехом произведений.
«Результаты показали, что эмоциональная кривая действительно коррелирует с успешностью текста. Автоматизированный подход способен выявлять перспективные рукописи с высокой точностью, сопоставим с ручным рецензированием — но работает быстрее и с меньшими затратами», — добавляют в университете.
Это первый в России пример успешной реализации подобной аналитической системы для издательского рынка. Проект был выполнен под руководством профессора Зои Резановой с филологического факультета ТГУ. В настоящее время Мария продолжает совершенствовать модель в рамках стажировки в издательстве «Эксмо», где ее разработка уже проходит этап интеграции в рабочий процесс редакторов.