As 3 etapas da Ciência de Dados

Neste post falo sobre as três etapas da ciência de dados de uma organização verdadeiramente madura.

Imagem de capa

Empresas em todo o mundo estão em uma corrida para extrair uma visão significativa de seus dados. Muitas organizações estão correndo atrás de equipes de ciência de dados e atacando problemas (alguns mais bem sucedidos do que outros). No entanto, um dos desafios é determinar o estágio atual da ciência dos dados dentro da organização. Em seguida, é determinar o estágio desejado da ciência dos dados.

Abaixo estão 3 etapas de uma organização de ciência de dados verdadeiramente madura.

1. Dashboards

O estágio inicial da ciência dos dados são os painéis. Trata-se de responder “Quanto?” E “O que aconteceu?”, observando relatórios de dados históricos. Se bem feito, pode até ajudar uma organização a responder “Porquê”. Muitas organizações se referirão a esta fase como Business Intelligence.

O estágio do painel pode ser muito caro para uma organização, em termos de horas-pessoas e dinheiro. Geralmente envolve investimentos em:

Aqui estão algumas perguntas comuns que podem ser respondidas através de painéis tradicionais:

Como você pode ver, existem grandes quantidades de valor que podem ser obtidas somente nesta fase. É fundamental para uma empresa compreender claramente a performance passada. Infelizmente, esta fase é onde muitas empresas param.

2. Machine Learning

A verdadeira “ciência” da ciência dos dados não começa até a segunda fase, que é o Machine Learning. Ele se concentra em estimar quantidades que não podem ser observadas diretamente. Isso pode ser o que os filmes que um cliente vai gostar, o preço do estoque de uma empresa amanhã, ou o efeito causal de uma campanha publicitária específica. O Machine Learning usa os dados da primeira fase e aplica métodos estatísticos ou outros para obter informações adicionais.

Pense em Machine Learning como respondendo o seguinte:

Observe a conexão entre um evento e algum resultado. O valor do Machine Learning vem da estimativa do resultado causal de eventos potenciais. Esta fase é preenchida com termos como: Machine Learning, Mineração de Dados (Data Mining) e Modelagem Estatística. O estágio de Machine Learning é tudo sobre olhar para o futuro!

3. Ações

Determinar as ações a serem realizadas, é a terceira e última fase. Ela tenta capitalizar os resultados de Machine Learning para tomar as ações apropriadas. As seguintes ações podem ser adequadas para os eventos identificados na seção preditiva acima.

Como você pode ver, uma bom Machine Learning a partir da segunda fase pode levar a ações claras.

Conclusão

Para obter o sucesso em ciência de dados é preciso conquistar as três etapas. Cada estágio baseia-se na fase anterior. Se você colocou o esforço para completar a primeira etapa, por que não continuar na segunda e terceira etapas?

Fonte: The 3 Stages of Data Science

Gostou do artigo? Por favor, dê sua opinião! Até a Próxima :)