Sentiment-анализ и кластерный анализ
Sentiment-анализ
Первый текст
Второй текст
Первый текст - это рецензия на сериал "Отчаянные домохозяйки". Второй текст - рецензия на сериал "Почему женщины убивают".
В первом тексте большинство абзацев имеют позитивную окраску. Но часть все таки окрашена негативно. Это связано с тем, что в тексте присутствуют слова: "убийство", "расстройство", "неудачник" и тд. - которые окрашены негативно. Хоть в основном сам текст позитивный, в описании персонажей встречаются негативные упоминания их характеров. По дисторсии видно, что большая часть абзацев уходит в позитивный аспект.
Второй текст окрашен либо нейтрально, либо негативно, позитивного мало, это связано с тем, что в рецензии также упоминаются негативные характеры персонажей, либо их действия. И в самом название сериала уже чувствуется негативный посыл.
Наиболее эмоциональным является первый текст, судя по показателям. На мой взгляд наиболее точной является вторая модель. Там можно увидеть аналитические данные. В первой модели можно разделить блоки на проявление эмоций только визуально.
Кластерный анализ
Использовались тексты про самых известных маньяков и убийц в мире, приводится статистика по жертвам и небольшая историческая справка.
Хоть все тексты и связаны с убийцами и маньяками, и очень похожи не только по тематике, но и по событиям и структуре, все же тексты под номерами 1,5,9,2,8 и 6, 7, 10, 3, 4 - объединились в две группы.
Первая группа - тексты, где серийные маньяки убивали исключительно женщин. У второй же группы нет конкретной привязке к полу или возрасту, они убивали людей.
Комментарии
Отправить комментарий