segunda-feira, 6 de julho de 2015

DATA WAREHOUSE E MODELAGEM DIMENSIONAL

ANHANGUERA EDUCACIONAL
FACULDADE ANHANGUERA DE BAURU




CURSO SUPERIOR DE TECNOLOGIA EM
GESTÃO DA TECNOLOGIA DA INFORMAÇÃO







ADMINISTRAÇÃO DE BANCO DE DADOS








BAURU
2014
FACULDADE ANHANGUERA DE BAURU




ADMINISTRAÇÃO DE BANCO DE DADOS
Atividades Práticas Supervisionadas




Bruno Romeiro Comin
Guilherme Roberto Simões 
João Fabio Marques da Silva
Matthews Henrique Nicomedes



Disciplina: Administração de Banco de Dados
Prof. Antonio Emílio M. Brunatti





BAURU
2014
Sumário
              RELATORIO.................................................................................................17
                  REFERÊNCIA..........................................................................................18

Obras Citadas

MACHADO, Felipe Nery Rodrigues. Citações e Referência. Livro: Tecnologia e Projeto de Data warehouse. Editora Érica Ltda. São Paulo (2.007).
BRUNATTI, Antonio Emílio M. Referência. Aulas: 01, 02, 03, 04 e 05 de Administração de Banco de Dados.  Bauru (2.014).
CURCIO, Tiago. Citações e Referência. Site: www.tiagocurcio.com Acessado em (2.014).
RAMOS, Leandro Dionízio. Citações e Referência. Site: www.devmedia.com.br. Acessado em (2.014)
ELIAS, Diego. Citações e Referência. Site: http://corporate.canaltech.com.br/ Acessado em (2.014).
BONOMO, Peeter. Citações e Referência. Site: http://imasters.com.br/ Acessado em (2.014).
NOVAIS, Ramon Ramos de Castro. Citações e Referência. Trabalho de Conclusão de Curso da Faculdade Técnica – FATEC de São Paulo. Acessado em (2.014).
OLIVEIRA, Thiago José da Silva. Citações e Referência. Trabalho de apresentação da UNIVERSIDADE FEDERAL DA PARAÍBA - UFPB. Acessado em (2.014).

DATA WAREHOUSE E MODELAGEM DIMENSIONAL

            De acordo com enciclopédia livre WIKIPEDIA juntamente com Felipe Nery Rodrigues Machado na sua publicação TECNOLOGIA E PROJETOS DE DATA WAREHOUSE (terceira edição, (2.007)), o artigo de (02/03/2.009) por Peeter Bonomo e as aulas (02) de Administração de Banco de Dados do prof. Antonio Emilio M. Brunatti, (2.014). Data Warehouse (armazém de dados) surgiu na década de 1.980 como conceito acadêmico sobre a evolução dos sistemas de informações empresariais e das necessidades de análise dos dados.
            Criado a partir do erro existente dos sistemas OLTP (Online Transaction Processing ou Processamento de Transação em Tempo Real), o data warehouse consegue analisar grandes quantidades de volume de dados, a partir desta coleta os dados não são voláteis, ou seja, eles não mudam. O data warehouse faz uma multi-interação com Business Intelligence (BI ou Inteligência Empresarial), o BI trabalha com coleta, organização, analise, compartilhamento e monitoramento de informação. Com a multi-integração com BI, o data warehouse possibilita a exploração com ferramentas como OLAP (Online Analytical Processing ou Processo Analítico em Tempo Real) que possibilita a integração com banco de dados normalizados fazendo consultas em níveis de granularidade ou detalhamento em formatos de cubo com dados; Data Mining (MD ou Mineração de Dados) que ajuda o processo de descoberta de padrões existentes em grandes massas de dados; Data Mart (DM ou Repositórios de Dados) que é subconjuntos de dados de um data warehouse que são construídos para responder prováveis perguntas de um tipo específico de usuário.
            Um data warehouse é constituído em arquiteturas que são: Global, Independente e Integrada.
            Arquitetura Global é relatada como aquela que suporta toda ou maior parte dos requisitos ou necessidade de um data warehouse integrado com grande grau de acesso e utilização das informações na empresa.


Figura 1 – Global

            Arquitetura Data Mart Independente são preferidas dos fornecedores de software para consulta de informações de data warehouse, essa arquitetura independente requer os mesmos perfis técnicos para implementação, porém os recursos e pessoal operacional podem ser administrados pelo grupo de trabalho ou departamento.


Figura 2 – DM_Independente

            Arquitetura Data Mart Integrado é basicamente distribuição de implementação, possibilitando muitas outras funções e capacidade de informação em relação à arquitetura independente, consequentemente, aumenta sensivelmente o nível de complexidade de requisitos.


Figura 3 – DM_Integrada

            A arquitetura de um data warehouse ira formar um banco de dados contendo dados extraídos do sistema de informação da empresa, que forma selecionados e depurados, com a finalidade de serem utilizados para processamento de consultas e não para processamentos de transações.
            Modelagem Dimensional de acordo com o Professor Doutor e PhD (Doutor da Filosofia) Ralph Kimball, modelagem dimensional é uma ferramenta que interage banco de dados com data warehouse utilizando dois elementos imprevisíveis: as tabelas Fatos e as tabelas Dimensões. Ambas obrigatórias e possuem características complementares dentro de um data warehouse. As tabelas dimensões  são os descritores de dados oriundos da tabela fato, com característica qualificativa da informação e relacionamento de “ um para muitos” com tabela fato. É a tabela que permite a visualização das informações por diversos aspectos e perspectivas.
            As tabelas fatos contem as métricas, possui o caráter qualificativo das informações descritivas armazenadas nas tabelas dimensões. Na tabela fato é a onde estão armazenadas as ocorrências do negocio e possui relacionamento “ muitos para um ” com as tabelas periféricas dimensão.
            A modelagem dimensional possui dois modelos: modelo estrela (Star schema) e modelo floco de neve (Snowflake).
            Modelo Star ou Estrela são modelos de dados multidimensionais. Sua composição típica possui grande entidade central dimensionada fato (fact table) e um conjunto de entidades menores denominadas dimensões (dimension table), arranjadas ao redor dessa entidade central, formando uma estrela.



Figura 4 – Modelo Star ou Estrela



Figura 5 – Modelo Estrela

            Modelo Snowflake ou Floco de Neve é o resultado da composição de uma ou mais dimensão que possuem hierarquia entre seus membros. Os resultados do modelo snowflake resultam na aplicação da terceira forma normal sobre entidade dimensão. Possui relacionamento entre si, visando diminuir o espaço ocupado por estas tabelas.


Figura 6 – Modelo Floco de Neve


Figura 7 - Modelo Snowflake

TOP DOWN E BOTTOM UP      

Segundo o escritor e coautor da obra TECNOLOGIA E PROJETO DE DATA WAREHOUSE, Felipe Nery Rodrigues Machado, terceira edição (2.007). Sobre implementações: Top Down e Bottom Up.
A implementação top down é tida como padrão inicial do conceito de data warehouse. Ela requer maior planejamento e trabalho de definições conceituais de tecnologia completos antes iniciar-se o projeto data warehouse.



Figura 8 – Top Down
Vantagens:
§  Herança de arquitetura;
§  Visão de empreendimento;
§  Repositório de metadados centralizados e simples
§  Controle;
§  Caracterização de regras.
Desvantagens:
§  Implementação muito longa;
§  Alta taxa de risco;
§  Heranças de cruzamentos funcionais;
§  Expectativas relacionadas ao ambiente.
Nessa arquitetura o processo se inicia com a extração, a transformação e a integração das informações dos sistemas operativos e dados externos para um ODS (Operational Data Storage) ou diferentes das fontes operacionais.



Figura 9 - ODS



Figura 10 - ODS
            A implementação bottom up é a mais popular, pois em virtude da implementação top down ser politicamente difícil de ser definida e muito cara, requerendo um tempo grande para implementação, investimento e sem apresentar retorno rápido, a técnica bottom up ganha mercado e investimento.
            Na implementação bottom up o retorno de investimento é muito mais rápido ou faster pay back, seu propósito é a construção de um data warehouse incremental a partir do desenvolvimento independente.


Figura 11 – Bottom_Up
            Vantagens:
§  Implementação rápida;
§  Retorno rápido;
§  Manutenção do enfoque da equipe;
§  Herança incremental.
            Desvantagens:
§  Período Lagamart (dificuldade futura de integração);
§  Desafio de possuir a visão de empreendimento;
§  Administração em coordenar múltiplas equipes e iniciativas;
§  A maldição do sucesso.

 

RELATÓRIO
         Relatório ao Cliente.
            No primeiro passo na qual é DATA WAREHOUSE e MODELAGEM DIMENSIONAL, foi relado um pouco sobre a historia do data warehouse  e da historia da modelagem dimensional, relatando também algumas ferramentas oferecidas para melhor desempenho de um projeto e os métodos utilizados.
            No segundo passo no qual é IMPLEMENTAÇÃO TOP DOWN E BOTTOM UP, foi relatado como deve ser apresentado um projeto de data warehouse alem de ter feito uma breve abordagem sobre aplicação a ser utilizada e a descrição das vantagens e desvantagem dessa implementação.
            No terceiro passo no qual é o DESAFIO, foi relatado e mostrado um projeto e seu mapeamento como deve ser feito.
Relatório Técnico.
No primeiro passo na qual é DATA WAREHOUSE e MODELAGEM DIMENSIONAL, foi feito um levantamento técnico da historia do data warehouse e da modelagem dimensional. Foi descrito algum erro existente de sistema, também a interação com vários métodos, descrevendo funções exercidas de algumas ferramentas como OLTP, OLAP, Data Mining, Data Mart e BI. Alem de descrever as arquiteturas Global, Independente e Integrada e detalhando os modelos Star Schema e Snowflake.
No segundo passo na qual é IMPLEMENTAÇÃO TOP DOWN E BOTTOM UP, foi feito um resumo detalhado sobre implementação e destrinchando as vantagens e desvantagens de utilizar a implementação top down e bottom up.
E no terceiro passo que é o DESAFIO, foi criado uma modelagem Data Warehouse no DB Designer e foi feito o mapeamento detalhado dos dados na modelagem contida e explicações de regras utilizadas também.

REFERÊNCIA
MACHADO, Felipe Nery Rodrigues. Citações e Referência. Livro: Tecnologia e Projeto de Data warehouse. Editora Érica Ltda. São Paulo (2.007).
BRUNATTI, Antonio Emílio M. Referência. Aulas: 01, 02, 03, 04 e 05 de Administração de Banco de Dados.  Bauru (2.014).
CURCIO, Tiago. Citações e Referência. Site: www.tiagocurcio.com Acessado em (2.014).
RAMOS, Leandro Dionízio. Citações e Referência. Site: www.devmedia.com.br. Acessado em (2.014)
ELIAS, Diego. Citações e Referência. Site: http://corporate.canaltech.com.br/ Acessado em (2.014).
BONOMO, Peeter. Citações e Referência. Site: http://imasters.com.br/ Acessado em (2.014).
NOVAIS, Ramon Ramos de Castro. Citações e Referência. Trabalho de Conclusão de Curso da Faculdade Técnica – FATEC de São Paulo. Acessado em (2.014).
OLIVEIRA, Thiago José da Silva. Citações e Referência. Trabalho de apresentação da UNIVERSIDADE FEDERAL DA PARAÍBA - UFPB. Acessado em (2.014).

Nenhum comentário:

Postar um comentário