Sentiment-анализ и кластерный анализ

 Sentiment-анализ

1. Текст "Большая вода"

Я посчитала, что программа неверно определила эмоциональную окраску текста. "Большая вода" - это сочинение-описание картины, у меня оно вызвало только теплые ощущения. Каким образом предложение "На картине изображен тихий весенний день" можно назвать негативным?...

Из позитивного выделен только один фрагмент, содержащий краткое описание атмосферы картины (весенняя, веет ароматом, новыми надеждами, тихой радостью). Нейтрального было меньше всего (вдали виднеются деревенские домики, светлые с темными крышами). В целом, с позитивным и нейтральным в тексте я согласна, но все остальное ушло в негативную окраску, а это, на мой взгляд, неправильно. 



2. Текст "9 кругов Ада"

В данном тексте программа выделила еще больше негативного, но это оправданно, так как сама картина, по которой написан текст, не является позитивной. Все негативные предложения программа выбрала правильно, они описывают страдания, которые испытывают люди на каждом круге Ада.

Также цветовая схема кардинально отличается от предыдущей из-за четкого разделения фрагментов и изменения формы (в 1 - тексте круги, во 2 - треугольники). 

Нейтральным стал фрагмент про передний план на картине, где изображен вход в Ад. Описание входа мне кажется негативным из-за словосочетаний "зловещая пасть" и "изображает различные виды наказаний".

Почему-то программа посчитала позитивным фрагмент "Восьмой круг - обитель обманщиков, их муки соответствуют преступлениям". Это, конечно, позитивно, что обманщики тоже страдают, но я бы не назвала это правильным.


Feature Statistics

1. Текст "Большая вода"

Этот анализ тоже показал, что текст в основном негативный. 4/7 значений являются отрицательными. Результаты двух анализов схожи.



2. Текст "9 кругов Ада"

В данном анализе программа сочла, что текст вызывает меньше эмоций (?), потому что отрицательных и положительных значений меньше, если сравнивать с 1 текстом.



Вывод: доминирующий посыл обоих текстов негативный. В первом тексте программа посчитала, что присутствует больше эмоций, чем во втором. 
Самым точным получился анализ текста "9 кругов Ада", так как он действительно является негативным по содержанию, с анализом "Большой воды" программа не угадала. 

Кластерный анализ

Тексты являются художественным описанием картин. С помощью каких-то обычных вещей образуется некая реальность, которая влияет на персонажей.

В 1-й группе собраны тексты с конкретным главным героем (алхимик, художник, библиотекарь), которые двигают сюжет.

Во 2-й группе - художественное описание объектов и философские размышления (шкатулка и город).

Это правильное разделение текстов, которое соответствует их содержанию. 



Комментарии

Популярные сообщения из этого блога

Метод свободных ассоциаций

Включенное наблюдение (видеоконтент) Ткачёва Н. ЖМК-302