segunda-feira, 20 de abril de 2015

IBM: Descubra e use terminologia do mundo real com o IBM Watson Content Analytics



Use análise linguística no IBM® Watson™ Content Analytics (WCA) para explorar terminologias específicas do domínio e desenvolva dicionários de domínio que reflitam as preferências de vocabulário da "vida real" dos usuários.

Argumentos a favor de dados não estruturados

Há muito interesse sobre a variedade de informações que a sociedade produz em quantidades sempre crescentes (seja nas empresas, na web ou em redes sociais). É possível usar esses dados de várias maneiras para produzir insights que podem melhorar a saúde, a democracia ou a maneira como você faz negócios. Esses insights baseados em dados são o playground tradicional de Analytics ou Business Intelligence (BI), que normalmente contam com dados estruturados, como datas, valores financeiros, quantidades ou nomes de empresas. Porém, a maioria dos dados está em formato não estruturado — textos, imagens, filmes— em proporções que variam de 70% para dados corporativos a quase 100% para mídia social.
Qualquer aplicativo de análise que use apenas dados estruturados o faz, portanto, sem cerca de quatro quintos das informações disponíveis. Extrair informações estruturadas de fontes não estruturadas parece ser obrigatório na era de Big Data.

IBM Watson Content Analytics

O IBM Content Analytics com procura corporativa é uma plataforma de procura e análise. Ele utiliza análise de rich text para trazer à tona novos insights acionáveis de muitas fontes e tipos de conteúdo textual, incluindo conteúdo corporativo, conteúdo da web (como mídia social), email ou bancos de dados.

Na prática, o IBM Watson Content Analytics (WCA) pode ser usado de duas maneiras gerais:


  • Uso imediato de visualizações analíticas para produzir insights rápidos por meio de conjuntos dimensionáveis de conteúdos. Essas visualizações costumam operar em máscaras. Máscaras são aspectos significativos dos documentos derivados de metadados que já estão estruturados (por exemplo, data, autor, tags) ou de conceitos extraídos de conteúdo textual.

  • Por meio da extração de entidades ou conceitos para uso por visualização de análise do WCA ou outras soluções de recebimento de dados. Exemplos típicos incluem a mineração de relatórios de análises de laboratório ou de médicos para preencher prontuários de pacientes, extrair entidades nomeadas e relacionamentos para alimentar software de investigação ou definir uma tipologia de sentimentos expressos em redes sociais para melhorar a análise estatística do comportamento do consumidor.
Acesse a matéria completa em: http://www.ibm.com/developerworks/br/library/ba-watson-dictionary/index.html

Para maiores informações entre em contato conosco: www.path.com.br/contato

Nenhum comentário:

Postar um comentário