Pesquisa

quarta-feira, 12 de fevereiro de 2014

Mapa Conceitual

Abaixo, um mapa conceitual, elaborado por nossa equipe, para resumir o BI e introduzir uma visão geral deste processos que os sustentam.


Processo KDD

Conhecer o perfil do cliente traz uma série de benefícios para a instituição, o principal deles é a capacidade de melhorar a qualidade de seus serviços prestados. Conhecendo o público alvo é possível montar uma melhor estratégia de marketing e com isto garantir resultados mais significativos com a venda de produtos ou serviços.O problema é que estes registros muitas vezes representam apenas dados e não conhecimento.Visando transformar estes dados em conhecimento, surge o processo chamado de Descoberta de Conhecimento em Bancos de Dados (Knowledge Discovery in Databases - KDD).

O processo de KDD contém uma série de passos, a saber: seleção, pré-processamento e limpeza, transformação, mineração de dados (data mining) e interpretação/avaliação. Como se pode ver, o processo compreende, na verdade, todo o ciclo que o dado percorre até virar conhecimento ou informação, como preferir.

Fonte: Adaptação de FAYYAD et al. (1996).

O processo possui duas características relevantes: é interativo e iterativo. Interativo, pois o usuário pode interferir e controlar o curso das atividades. Iterativo, por ser uma sequência limitada de operações onde o resultado de cada uma é dependente dos resultados das antecedentes. A seguir, daremos uma visão geral de cada uma das fases.

  • Seleção dos dados:
A fase de seleção dos dados é a primeira no processo de busca da informação. Nesta fase é escolhido o conjunto de dados, pertencente a uma área, contendo todas as possíveis variáveis e registros que farão parte da análise. Normalmente a escolha dos dados fica a critério de um especialista do domínio. 
O processo de seleção é bastante complexo, uma vez que os dados podem vir de uma série de fontes diferentes (data warehouses, planilhas, sistemas legados) e podem possuir os mais diversos formatos. Este passo possui impacto significante sobre a qualidade do resultado do processo.

  • Pré-processamento e limpeza dos dados:
Esta é uma parte importantíssima no processo, pois a qualidade dos dados vai determinar a eficiência dos algoritmos de mineração. Nesta etapa deverão ser realizadas tarefas que eliminem dados redundantes e inconsistentes, recuperar dados incompletos e avaliar possíveis dados divergentes ao conjunto. Mais uma vez o auxílio do especialista do domínio é fundamental. Nesta fase também são utilizados métodos de redução ou transformação para diminuir o número de variáveis envolvidas no processo, visando com isto melhorar o desempenho do algoritmo de análise.

  • Transformação dos dados:
Após serem selecionados, limpos e pré-processados os dados necessitam ser armazenados e formatados adequadamente para que os algoritmos de aprendizado possam ser aplicados. Em grandes corporações é comum encontrar computadores rodando diferentes sistemas operacionais e diferentes Sistemas Gerenciadores de Bancos de Dados (SGDB). Estes dados que estão dispersos devem ser agrupados em um repositório único. 

  • .Mineração de dados (data mining):
Todas as etapas do processo de KDD possuem grau elevado de importância para o sucesso do  mesmo. Entretanto, é a etapa de Mineração de Dados (data mining) que recebe o maior destaque na literatura. É onde é feita a exploração e análise, de forma automática ou semi-automática, de grandes bases de dados com objetivo de descobrir padrões e regras. O objetivo principal do processo de data mining é fornecer as corporações informações que a possibilitem montar melhores estratégias de marketing, vendas e suporte, para alcançar melhores resultados nos negócios.

  • Interpretação e avaliação
Esta é mais uma fase que deve ser feita em conjunto com um ou mais especialistas no assunto. O conhecimento adquirido através da técnica de data mining deve ser interpretado e avaliado para que o objetivo final seja alcançado. Caso o resultado não seja satisfatório, o que não é raro, o processo pode retornar a qualquer um dos estágios anteriores ou até mesmo ser recomeçado. Duas das ações mais comuns caso o resultado não seja satisfatório são: modificar o conjunto de dados inicial ou trocar o algoritmo de data mining ou ao menos alterar suas configurações de entrada.


terça-feira, 11 de fevereiro de 2014

Data Warehouse em BI



Na década de 90, a tecnologia e comunicação tiveram um grande desenvolvimento na sua área, surgindo assim a internet. Tudo isso por conta da nova moeda corrente: a informação. A partir daí iniciou-se um avanço maciço nos meios de comunicação, dando mais celeridade ao processo de tomada de decisões e ao mesmo tempo tornando o caminho entre a informação e o conhecimento mais curto. O mundo mudou desde então, mas o conceito permanece o mesmo. A necessidade de unir informações para que se tenha uma gestão empresarial eficiente é hoje uma realidade frequente nas organizações. Atualmente o interesse pelo BI vem crescendo na medida em que seu uso possibilita às corporações realizar uma série de análises e projeções, de uma forma que se possa agilizar os processos relacionados às tomadas de decisão.


Segundo Bolieiro (2008), no mundo de tempestade de informações, torna-se necessário conseguir filtrar as informações, e o Business Intelligence (BI) pode ajudar em duas coisas fundamentais: reduzir custos e aumentar receitas. Isto pode ser feito através da otimização de processos por meio da análise de dados, melhorando produtos ou criando novos.


A arquitetura construída sobre a base de dados gera relatórios para análise e estudo de ampla quantidade de informações obtidas. Existem ferramentas que possibilitam melhor empenho de análise para decisões estratégicas. O Data Warehouse é uma dessas ferramentas, que consiste em armazenar informações de um banco de dados referente a uma ou mais atividades de uma empresa de forma consolidada. É como um agrupamento inteligente de dados de uma mesma fonte, como: origem, formato, nomes, tipo de negócio, regras, conexões entre outros. Este princípio é muito discutido quando relacionado a Business Intelligence. Tudo isso favorece um resultado mais completo ao usuário, sem a necessidade de executar várias consultas, cruzar essas informações e finalmente chegar a um resultado. Por enquanto, pense que em Data Warehouse os relatórios são exibidos dinamicamente de acordo com a necessidade e foca em pontos estratégicos.


Disponível em: http://www.avanco.com/sol_business_intel.html



O propósito do Data Warehouse é fornecer um histórico de dados com a possibilidade de criar filtros detalhista afim de encontrar uma relação propícia e extrair uma possível informação que possa ser explorada, trazendo uma vantagem competitiva para a organização. Data Mart são banco de dados departamentalizados. A intenção do Data Mart é dividir a centralização de dados única de um Data Warehouse e levar essa consulta de dados para responsabilidade de cada departamento. É possível trabalhar com Data Mart e Data Warehouse juntos numa organização, sendo os Data Mart departamentais coletores de dados de uma central de Data Warehouse.