🧠 Fundamentos Essenciais
Fundamentos Data Science
Importância da Ciência de de Dados
DATA SCIENCE
Olhando para essa palavra, percebemos que a palavra-chave é Science, ou seja, a ciência é a parte mais importante desse processo, sem a ciência em si, os dados não servem de nada, agora, se temos dados e aplicarmos técnicas de ciência de dados, podemos transformar os dados em informação, consequentemente, irão se tornar conhecimento e então poderemos agregar valor a partir desse conhecimento.
A ciência de dados é sobre resolver problemas através de métodos científicos.
Explorando uma parte da Ciência de Dados
Iremos utilizar a ciência de dados para Solucinar problemas;
Então, vamos utilizar Métodos Científicos para buscar a solução, realizando regras;
Técnicas, conhecimento para aplicar esses métodos;
Utilizando Matemática e Estatística, para aplicar essas regras, para aplicar a estratégia Correta e interpretar os resultados;
Então vamos precisar usar a Computação como ferramenta para aplicar os métodos científicos;
Vamos trabalhar então com Visualização, para podermos entregar o resultado através de Visualizações, como dashboard's, gráficos, ou até mesmo uma história dos dados (Storytelling) para melhor interpretação para quem será os espectadores;
Embora a ciência seja a parte mais importante, os dados precisam de tratamento, processamento, limpeza, colocar em formato correto, então aí que entra a Engenharia de Dados, que entrará a estrutura de extração, transformação e carga de dados;
Quando vamos montar o resultado final, precisamos de Conhecimento de Negócio, precisamos compreender o problema, saber o que vamos entregar;
Com isso, teremos a SOLUÇÃO para o problema de negócio.
Processo Data-Driven
Primeiro, vamos receber os dados no formato bruto, então vamos fazer os sequintes questionamentos:
- O que aconteceu?
- Por que aconteceu?
- Acontecerá novamente?
- O que deve ser feito?
Com base nessas perguntas, vamos tomar uma decisão, que irá nos levar a uma ação que irá trazer o resultado esperado.
Ética em Ciência de Dados
Responsabilidade e Transparência:
- Cientistas de dados devem ser transparentes em relação ao métodos e algoritmos que utilizam, explicando como os dados são coletados e analisados.
- É de importância documentar o processo de análise e fornecer justificativas claras para as decisões tomadas com base nos dados.
Justiça e Não Discriminação:
- Devem ser evitadas vieses nos dados e nos algoritmos que possam levar a decisões injustas ou discriminatórias.
- A igualdade de oportunidades deve ser promovida, garantindo que os sistemas de IA e aprendizado de máquina não perpetuem desigualdades existentes.
Consentimento Informado:
- Os indivíduos devem ser informados sobre como seus dados serão usados e dar consentimento explícito para a coleta e utilização de seus dados.
- O consentimento deve ser obtido de forma clara e compreensível, sem ambiguidade.
Beneficência e Não Maleficência
- Os Cientistas de Dados devem garantir que suas análises tragam benefícios e evitem causar danos aos indivíduos ou grupos envolvidos.
- Devem ser considerados os impactos sociais e éticos das análises e decisões baseadas em dados.