Categorias
Business Intelligence

ETL e Business Intellince

ETL e Business Intellince

ETL (Extract, Transform e Load) é o processo de extrair, transformar e carregar dados, e surge como uma estratégia para a análise e o uso de informações armazenadas em bancos de dados, desde os mais simples até os mais complexos.

Por meio do ETL, é possível definir a qualidade dos dados e a forma como eles são manipulados a fim de transformá-los em uma informação inteligível e confiável.

 

Extração

A primeira etapa no processo é extrair os dados nas origens das fontes. Os projetos em geral consolidam diferentes fontes com diferentes formatos dos dados, organizados também em estruturas diferentes.

Veja abaixo exemplos das fontes de dados mais utilizadas:

  • Arquivos de Texto/CSV;
  • Excel;
  • Banco de Dados Relacionais;
  • Banco de Dados Cloud;
  • JSON;
  • Endereço WEB;

 

Transformação

Consiste no tratamento, limpeza e adaptação dos dados extraídos. Desta transformação são gerados os dados a serem carregados.

A parte de transformação consiste em padronizar os dados em relação ao tamanho e tipo. Remover colunas ou linhas indesejadas. Substituir caracteres estranhos, corrigir erros de digitação, padronizar nomes e termos etc.

 

Carregamento

Na última etapa é preciso fazer o carregamento dos dados já organizados em um novo repositório, como o Data Warehouse. Este processo varia de acordo com a aplicação, necessidade e organização.

Com a carga dos dados é possível ler e gerar valor sobre eles. A partir deste ponto o analista ou gestor de negócios consegue manipular e formar seus relatórios e análises para o processo de tomada de decisão.

 

Mas com o BI se liga a isso?

O ETL é fundamental para as estratégias de Business Intelligence e, por isso, ambos são interdependentes.

É por meio desse processo que organizamos todos os dados que vão embasar as iniciativas analíticas de inteligência de negócios.

Para traçar uma estratégia efetiva de BI, é essencial que tenhamos os dados previamente organizados a fim de viabilizarmos a execução do projeto.

Assim sendo, é preciso categorizá-los, criar hierarquias e relações para que possam ser consultados e deem as respostas esperadas.