Análisis de sentimiento: ¿Cómo funciona?

Monitoring

2312 VISTAS

Análisis de sentimiento: ¿Cómo funciona?

La mayoría de las herramientas de Social Media Monitoring posee un módulo de análisis de sentimiento para intentar extraer el tono de los posts mencionado por consumidores en redes.  Buzzmonitor también utiliza un conjunto de estos clasificadores basados en el Teorema de Bayes. En esencia, este teorema dice que podemos calcular la probabilidad del sentimiento de una oración comunicada , si conocemos las probabilidades de los sentimientos de cada término, y considerando también, el orden en el que son mencionados.

 

El siguiente ejemplo explica de una manera más didáctica y simple este teorema:

 

Vamos a suponer que dentro de una oración encontramos la palabra “bien”. Ahora supongamos que este término por si sólo posee una probabilidad de sentimiento positivo de 0.8.   Sin embargo, junto a esta palabra, nos damos cuenta de que se encuentra el término “mal”. El Algoritmo ya posee una fórmula que le indica que si esta misma palabra se encuentra a lado de la palabra “mal”, automáticamente el valor del término disminuya considerablemente. Es decir que 0.8 pasará a un 0.1 cuando este acompañado de la palabra “mal”, lo que a su vez hará que todo el post completo al final, pase a tener un sentimiento negativo.

 

Y al contrario, el algoritmo ya posee un pre-cálculo que le indica que si la palabra “bien” esta acompañada por un “muy”, la probabilidad de que la oración sea de carácter positivo es muy alta. 

 

El sentimiento de un post, entonces es una fórmula que unifica estas y varias otras posibilidades y da un número entre 0 y 1. Lo que el sistema hace es tomar este resultado final, si el número queda entre el 0 y el 0.5 el resultado será negativo, del 0.6 al 0.7 será neutral, y del 0.7 en adelante será positivo.

 

¿Cómo calcula el algoritmo estas probabilidades?

Las probabilidades son calculadas basadas en un conjunto de términos de prueba, que es un conjunto de oraciones y términos ya pre-clasificados en positivos y negativos.

 

¿Porqué muchos resultados algunas veces son incorrectos?

Considera el siguiente tweet: “¡Esa canción nueva es como un virus! ¡Auxilio, no puedo parar de escucharla!”  En este ejemplo muy probablemente las palabras “virus” y “auxilio” tengan una connotación negativa dentro del conjunto de prueba de la herramienta, lo cuál hará que este tweet sea clasificado con este sentimiento, pero muy probablemente en realidad, esta publicación sea de carácter positivo, y el usuario este expresando su gusto por esta canción al no poder para de escucharla. Los conjuntos de prueba son finitos, y por ello es muy complicado capturar la ambigüedad de los infinitos casis del lenguaje natural, como por ejemplo la ironía.  Por lo tanto aunque la herramienta posea u conjunto de prueba muy amplio, siempre se quedará corto en relación al mecanismo del cerebro humano. Es por ello que el análisis de sentimiento en todas las herramientas debe ser tomado siempre como un indicador, y nunca como algo absoluto.

 

 

En resumen

El análisis de sentimiento, en general, es realizado utilizando clasificadores estadísticos. Esto significa que en la práctica, los sistemas solamente son capaces de comparar datos obtenidos con los que ya se encuentran en la base de la herramienta para saber la probabilidad de que un post sea de carácter positivo o negativo. Estas probabilidades so calculadas por cada término y en general por cada par de términos utilizando un conjunto base (conjunto de prueba) que ya fue previamente clasificado por un analista humano. Por ser estadístico, todo clasificador entrega resultados probabilísticos por definición con algunos errores asociados. Estos resultados deben siempre ser tratados como indicadores generales y no como verdades absolutas. 

USA BUZZMONITOR GRATIS AQUÍ

COMENTARIOS

Deja un comentario