Estava assistindo um apresentação da analise de texto sobre mídias sociais. Achei interessante os desafios as quais as ferramentas de Smart Analytics passam.
O objetivo destas ferramentas eh extrair informações que os usuários escrevem em website, blogs, redes sociais; então agregar essa informação gerando estatísticas e relatórios para analise.
Dentre alguns tipos de informações podemos incluir:
- Sentimentos: usuários escrevem positivamente ou negativamente sobre um produto ou serviço;
- Demográficos: sexo, idade, status familiar, região, pais;
- Comportamento: se o autor esta recomendando ou advertindo sobre um produto e se este autor é vendedor ou comprador;
Para agregar os dados existem abordagens baseados em Regras ou Aprendizado de Máquinas. Ambas as abordagens tem seus prós e contras, mas não vou explicar elas aqui, pois quero falar dos desafios.
Abaixo descrevo alguns exemplos de desafios enfrentados:
- Detectar termos positivos e negativos
- Sua decoração natalina ficou um doce, parabéns!
- Remover termos que são cobertas por bloqueadores sentimento
- Amor essa roupa me deixa gorda
- Essa roupa não está a sua altura
- Aplicar regras de sintaxe para determinar negação, desejos, perguntas …
- Será que essa roupa está boa?
- “problema” ou “problema resolvido“
- “Eles são bons” ou “Eles são bons?”
E para finalizar este artigo.
- Múltiplos significados
- A palavra Lima pode ser fruta, ferramenta, cidade, pessoa?