3 min de leitura
As 3 etapas da Ciência de Dados
Neste post falo sobre as três etapas da ciência de dados de uma organização verdadeiramente madura.
Empresas em todo o mundo estão em uma corrida para extrair uma visão significativa de seus dados. Muitas organizações estão correndo atrás de equipes de ciência de dados e atacando problemas (alguns mais bem sucedidos do que outros). No entanto, um dos desafios é determinar o estágio atual da ciência dos dados dentro da organização. Em seguida, é determinar o estágio desejado da ciência dos dados.
Abaixo estão 3 etapas de uma organização de ciência de dados verdadeiramente madura.
1. Dashboards
O estágio inicial da ciência dos dados são os painéis. Trata-se de responder “Quanto?” E “O que aconteceu?”, observando relatórios de dados históricos. Se bem feito, pode até ajudar uma organização a responder “Porquê”. Muitas organizações se referirão a esta fase como Business Intelligence.
O estágio do painel pode ser muito caro para uma organização, em termos de horas-pessoas e dinheiro. Geralmente envolve investimentos em:
- Data Warehouse ou algum outro ambiente de armazenamento, para armazenar os dados em um único local para relatórios fáceis
- Ferramentas ETL (Extract Transform Load) para manipular, combinar e mover dados para o data warehouse
- Ferramentas de relatórios para exibir os resultados e permitir que os usuários “explorem” os dados
Aqui estão algumas perguntas comuns que podem ser respondidas através de painéis tradicionais:
- Quantos clientes vivem em cada região?
- Quais foram as vendas na Back Friday?
- Quantos pacientes visitaram o hospital no mês passado?
Como você pode ver, existem grandes quantidades de valor que podem ser obtidas somente nesta fase. É fundamental para uma empresa compreender claramente a performance passada. Infelizmente, esta fase é onde muitas empresas param.
2. Machine Learning
A verdadeira “ciência” da ciência dos dados não começa até a segunda fase, que é o Machine Learning. Ele se concentra em estimar quantidades que não podem ser observadas diretamente. Isso pode ser o que os filmes que um cliente vai gostar, o preço do estoque de uma empresa amanhã, ou o efeito causal de uma campanha publicitária específica. O Machine Learning usa os dados da primeira fase e aplica métodos estatísticos ou outros para obter informações adicionais.
Pense em Machine Learning como respondendo o seguinte:
- Quando um cliente se muda, quanto ele / ela gastará dinheiro em uma loja de ferragens?
- Quando uma compra de cartão de crédito é feita, qual a probabilidade da cobrança ser fraudulenta?
- Qual é o custo de vida esperado de um novo cliente?
- Se um furacão estiver chegando, o que as pessoas comprarão? (Ex: Água para estocar)
Observe a conexão entre um evento e algum resultado. O valor do Machine Learning vem da estimativa do resultado causal de eventos potenciais. Esta fase é preenchida com termos como: Machine Learning, Mineração de Dados (Data Mining) e Modelagem Estatística. O estágio de Machine Learning é tudo sobre olhar para o futuro!
3. Ações
Determinar as ações a serem realizadas, é a terceira e última fase. Ela tenta capitalizar os resultados de Machine Learning para tomar as ações apropriadas. As seguintes ações podem ser adequadas para os eventos identificados na seção preditiva acima.
- Quando um cliente se muda, envie um pacote “bem-vindo ao bairro” com cupons para lojas de ferragens próximas.
- Recusar a cobrança fraudulenta ou desativar o cartão de crédito.
- Se o novo cliente tiver um custo de vida esperado muito elevado, ofereça algum tratamento especial ou ofertas para garantir que o cliente se torne um cliente para toda a vida.
- Quando um furacão se aproxima, coloque a água em promoção e/ou em destaque na loja.
Como você pode ver, uma bom Machine Learning a partir da segunda fase pode levar a ações claras.
Conclusão
Para obter o sucesso em ciência de dados é preciso conquistar as três etapas. Cada estágio baseia-se na fase anterior. Se você colocou o esforço para completar a primeira etapa, por que não continuar na segunda e terceira etapas?
Fonte: The 3 Stages of Data Science
Gostou do artigo? Por favor, dê sua opinião! Até a Próxima :)
Comentários