Desafios da análise de texto sobre Mídias Sociais

lima

Estava assistindo um apresentação da analise de texto sobre mídias sociais. Achei interessante os desafios as quais as ferramentas de Smart Analytics passam.

O objetivo destas ferramentas eh extrair informações que os usuários  escrevem em website, blogs, redes sociais; então agregar essa informação gerando estatísticas e relatórios para analise.

Dentre alguns tipos de informações podemos incluir:

  • Sentimentos: usuários escrevem positivamente ou negativamente sobre um produto ou serviço;
  • Demográficos: sexo, idade, status familiar, região, pais;
  • Comportamento: se o autor esta recomendando ou advertindo sobre um produto e se este autor é vendedor ou comprador;

Para agregar os dados existem abordagens baseados em Regras ou Aprendizado de Máquinas.  Ambas as abordagens tem seus prós e contras, mas não vou explicar elas aqui, pois quero falar dos desafios.

Abaixo descrevo alguns exemplos de desafios enfrentados:

  • Detectar termos positivos e negativos 
    • Sua decoração natalina ficou um doce, parabéns!
  • Remover termos que são cobertas por bloqueadores sentimento
    • Amor essa roupa me deixa gorda
    • Essa roupa não está a sua altura
  • Aplicar regras de sintaxe para determinar negação, desejos, perguntas …
    • Será que essa roupa está boa?
    •  “problema” ou “problema resolvido
    • “Eles são bons” ou “Eles são bons?”

E para finalizar este artigo.

  • Múltiplos significados
    • A palavra Lima pode ser fruta,  ferramenta,  cidade,  pessoa?

 

Leia também: