Data Mining

 

Ao longo dos anos, as organizações se mostraram extremamente eficientes em capturar, organizar e armazenar grandes quantidades de dados, obtidos de suas operações diárias ou pesquisas científicas, porém, ainda não usam adequadamente essa gigantesca montanha de dados para transformá-la em conhecimentos que possam ser utilizados em suas próprias atividades, sejam elas comerciais ou científicas.

O que é Data Mining?

Os cientistas, especialistas no assunto definem de várias formas o Data Mining como, por exemplo, a definição de Usama Fayyad (Fayyad et al. 1996):
"processo não-trivial de identificar, em dados, padrões válidos, novos,
potencialmente úteis e compreensíveis" ou de Naliato (Naliato, 2000), "o conceito de data mining flutua entre uma forma estatística e um conceito revolucionário". Técnica que visa encontrar padrões, ainda não descobertos nos dados, que possam gerar respostas corretas para novos casos. Este processo de busca e interpretação de padrões é tipicamente interativo, envolvendo a aplicação repetitiva de métodos específicos de mineração de dados ou algoritmos e interpretações dos padrões gerados como resultado destes algoritmos.

Os problemas que podem ser resolvidos com Data Mining, normalmente são divididos em dois grandes grupos: Predição e Descoberta de Conhecimento.
A predição tem a finalidade de atingir um objetivo específico de acordo com os casos ocorridos no passado, como o próprio nome já diz, com o objetivo de projetar respostas para novos casos.

A descoberta de conhecimento já apresenta uma maior abrangência ao suporte à tomada de decisão. Usa-se para resolver problemas que estão em um estágio antes da predição, ou melhor, onde não se conhece nenhuma informação. Dentro destas duas linhas, existem várias técnicas.
Na predição pode-se identificar duas:
- Classificação: A resposta será apresenta na forma de verdadeiro ou falso.
- Regressão: A resposta será um valor numérico

Para descoberta de conhecimento existem as seguintes técnicas:
- Detecção de desvios: Identifica mudanças nos padrões anteriormente detectados. A técnica clássica para executar tal detecção é o teste de significância, por exemplo, média, variância, desvio padrão.
- Segmentação de bases de dados: O objetivo é dividir um problema em segmentos menores que formam grupos inter-relacionados.
- Regras de associação: São regras que são formadas com informações existentes na base de dados.
- Resumo e visualização: O objetivo é encontrar descrições compactas dos dados e prover diferentes maneiras de apresentá-los. O nível de resumo ou detalhamento dos resultados é específico ao tipo de usuário desta informação.
- Mineração de textos: A técnica pode ser definida com uma busca de tendências ou padrões.

O trabalho da TENBU BI Solutions é utilizar o avanço científico e tecnológico na técnica de Data Mining numa aplicação simples e produtiva nas diversas necessidades das empresas como: Identificar padrões de compra de clientes, descobrir associações entre características demográficas de clientes, Predizer respostas a campanhas publicitárias, Análise de mercado, detecção de fraude, Descobrir correlações escondidas entre diferentes indicadores financeiros, Identificar padrões de comportamento em clientes de risco.