Skip to content

🧠 Fundamentos Essenciais

Fundamentos Data Science

Importância da Ciência de de Dados

DATA SCIENCE

Olhando para essa palavra, percebemos que a palavra-chave é Science, ou seja, a ciência é a parte mais importante desse processo, sem a ciência em si, os dados não servem de nada, agora, se temos dados e aplicarmos técnicas de ciência de dados, podemos transformar os dados em informação, consequentemente, irão se tornar conhecimento e então poderemos agregar valor a partir desse conhecimento.

A ciência de dados é sobre resolver problemas através de métodos científicos.



Explorando uma parte da Ciência de Dados

Iremos utilizar a ciência de dados para Solucinar problemas;
Então, vamos utilizar Métodos Científicos para buscar a solução, realizando regras;
Técnicas, conhecimento para aplicar esses métodos;
Utilizando Matemática e Estatística, para aplicar essas regras, para aplicar a estratégia Correta e interpretar os resultados;
Então vamos precisar usar a Computação como ferramenta para aplicar os métodos científicos;
Vamos trabalhar então com Visualização, para podermos entregar o resultado através de Visualizações, como dashboard's, gráficos, ou até mesmo uma história dos dados (Storytelling) para melhor interpretação para quem será os espectadores;
Embora a ciência seja a parte mais importante, os dados precisam de tratamento, processamento, limpeza, colocar em formato correto, então aí que entra a Engenharia de Dados, que entrará a estrutura de extração, transformação e carga de dados;
Quando vamos montar o resultado final, precisamos de Conhecimento de Negócio, precisamos compreender o problema, saber o que vamos entregar;

Com isso, teremos a SOLUÇÃO para o problema de negócio.



Processo Data-Driven

Primeiro, vamos receber os dados no formato bruto, então vamos fazer os sequintes questionamentos:

  • O que aconteceu?
  • Por que aconteceu?
  • Acontecerá novamente?
  • O que deve ser feito?

Com base nessas perguntas, vamos tomar uma decisão, que irá nos levar a uma ação que irá trazer o resultado esperado.

Ética em Ciência de Dados

Responsabilidade e Transparência:

  • Cientistas de dados devem ser transparentes em relação ao métodos e algoritmos que utilizam, explicando como os dados são coletados e analisados.
  • É de importância documentar o processo de análise e fornecer justificativas claras para as decisões tomadas com base nos dados.

Justiça e Não Discriminação:

  • Devem ser evitadas vieses nos dados e nos algoritmos que possam levar a decisões injustas ou discriminatórias.
  • A igualdade de oportunidades deve ser promovida, garantindo que os sistemas de IA e aprendizado de máquina não perpetuem desigualdades existentes.

Consentimento Informado:

  • Os indivíduos devem ser informados sobre como seus dados serão usados e dar consentimento explícito para a coleta e utilização de seus dados.
  • O consentimento deve ser obtido de forma clara e compreensível, sem ambiguidade.

Beneficência e Não Maleficência

  • Os Cientistas de Dados devem garantir que suas análises tragam benefícios e evitem causar danos aos indivíduos ou grupos envolvidos.
  • Devem ser considerados os impactos sociais e éticos das análises e decisões baseadas em dados.