Article image
Junior Lima
Junior Lima26/07/2023 14:55
Share

Falta Ciência de Dados nos Bootcamps de Python para Ciência de Dados!

  • #Python

Ficou confuso? Não esquenta não! Já já você vai entender.

Bom, meu primeiro artigo aqui na DIO e gostaria de falar sobre o que venho estudando no momento, python e ciência de dados. Mas, por que, na minha opinião, falta ciência de dados nos bootcamps de python para ciência de dados?

Atualmente, aqui na plataforma, temos dois bootcamps voltados para essa área e, ao analisar os módulos dentro de cada bootcamp, temos os módulos que falam sobre introdução a ciência de dados com python, SQL, power bi e machine learning. No primeiro módulo temos o necessário que devemos saber sobre python para darmos os primeiros passos nesse mundo de análise e ciência de dados, mas o que temos é somente o python puro, e na minha humilde opinião, falta de fato um módulo que nos introduza a ciência de dados com python, e por isso gostaria de citar aqui cinco pontos fundamentais dentro da ciência de dados que são essenciais para quem esta começando e que esta faltando nos bootcamps.

1. Estatística: Como estudar ciência de dados sem conhecer ao menos o básico sobre essa disciplina? É preciso ter o mínimo de conhecimento sobre análise exploratória e suas estimativas como média, mediana, média aparada, mediana ponderada! Partindo desse ponto, começamos a falar então sobre as bibliotecas python mais utilizadas em ciência de dados.

2. Numpy: Uma biblioteca poderosa para se trabalhar com arrays multi-dimensionais. Ela nos trás uma vasta coleção de funções matemáticas que facilita o trabalho com dados. É aqui que aplicamos de fato o conhecimento em estatística através do python. Algumas dessas funções nos ajudam a aplicar as estimativas estatísticas como mean(retorna a média), std(desvio padrão), average(calculo da média ponderada), dentre varias outras.

3. Pandas: O pandas nos permite realizar análise de dados em varios tipos de arquivos, xls e csv são alguns exemplos. Criação de dataframes, manipulação e limpeza dos dados, todo o processo de ETL(extração, transformação e carregamento dos dados), e muito mais.

4. Matplotlib: Trabalhando em conjunto com a biblioteca numpy, é utilizada para a criação de gráficos, facilitando a visualização e o entendimento dos dados obtidos.

5. Seaborn: Uma biblioteca de analise gráfica de dados em python. O seaborn é baseado no matplotlib e como tal, serve para criar gráficos estatísticos mais elegantes. Ele é útil para se trabalhar com dados complexos, pois oferece ferramentas que simplificam o processo de visualização.

É isso! Acho que um módulo que abrangesse esses cinco pontos, a disciplina de estatística e as quatro bibliotecas que estão entre as mais utilizadas para ciência de dados, seria o ideal para termos uma formação ideal em ciência de dados. Lógico que é apenas minha opinião, até mesmo pelo que tenho visto de outros cursos. Deixando claro que não estou querendo desmerecer a qualidade do ensino aqui na DIO, sou aluno e sei da qualidade da plataforma, mas esse artigo é como uma critica construtiva para que plataforma possa melhorar cada vez mais.

Fica a dica ai DIO, esse conteúdo aqui seria ótimo em futuros bootcamps e/ou formações. Agora gostaria de saber sua opinião! Concorda, discorda, tem algo a acrescentar? Então, até o próximo artigo.

Share
Comments (12)

ON

Otavio Neto - 02/08/2023 00:37

Olá Junior!

Fiz minha matrícula recente e também estou sentindo falta dos conteúdos citados no seu tópico, sendo que foi os principais temas que vi em outros cursos.


Não sei se a DIO. Já tem programação para uma abordagem desses temas, seria essencial para uma formação

completa e solida.



Fernando Araujo
Fernando Araujo - 26/07/2023 15:12

Olá, Junior, artigo bem pertinente!

Eu também estou matriculado em 2 cursos de Ciências de Dados da DIO e sinto falta do mesmo que você.

Os dois cursos são ótimos para introduzir os conceitos básicos de Python para quem não conhece a linguagem e também tratam, superficialmente, de conceitos básicos de bancos de dados e operações como ETL, além de dedicar alguns módulos para Machine Learning.

Tradicionalmente, as Acelerações são direcionadas para quem já é experiente em temas avançados sobre os assuntos e os Boorcamps e Formações para quem não sabe de um assunto e tem à disposição desde o básico até o intermediário superficial, não detalhado.

Só que eu sinto a falta de cursos intermediários aqui, que seriam bem adequados para preencher o gap entre os cursos básicos (Bootcamps e Formações) e as Acelerações.

Os cursos intermnediários tratariam destas técnicas e tecnologias que você listou no seu artigo.

Espero que a DIO considere suas recomendações e lance um curso intermediário sobre Ciência de Dados, pois é exatamente o que falta para o aluno daqui chegar preparado a uma aceleração.

Sou aluno da DIO há muitos anos, elogio e aplaudo cada iniciativa da equipe toda, mas acredito que cursos intermediários enriqueceriam a ementa de qualquer área disponível a plataforma.

Augusto Montaurio
Augusto Montaurio - 28/07/2023 14:16

Eu fiz alguns bootcamps aqui e quando consegui uma vaga pra usar os conhecimentos tbm senti muita falta exatamente dos pontos que você citou, muito bem colocado

Junior Lima
Junior Lima - 26/07/2023 15:17

@Marcos Leonel, agradeço o comentário. Deixo a dica aqui de 3 livros muito bons que estou começando a estudar: Python para análise de dados do Wes McKinney, estatística pratica para ciência de dados do Peter Bruce e Andrew Bruce e data science do zero do Joel grus.

Joyce Novais
Joyce Novais - 27/07/2023 15:40

Infelizmente é isso mesmo, também senti falta da mesma coisa no bootcamp.

Junior Lima
Junior Lima - 26/07/2023 16:41

Obrigado @Mikel Fraga! É exatamente sobre isso. Se não tiver os pilares não adianta muita coisa.

MF

Mikel Fraga - 26/07/2023 16:29

Boa tarde a todos.


Primeiro, @JuniorLima, excelente colocação. Realmente, quando falamos em Ciência de Dados, conceitos Matemáticos e Estatísticos (principalmente), são os pilares principais. De nada adianta um expert em Python, mas não saber o que fazer com aquilo.


Parabéns mais uma vez.


Vou deixar aqui, o conteúdo programático de outro curso que irei iniciar, logo finalize os dois bootcamps daqui. Acredito que seja isso que você esta sentidno falta:


  • Conteúdo Introdutório

image


  • Conteúdo Básico

image


  • Conteúdo Intermediário

image


Não vou expor a origem, em respeito aos trabalhos da DIO, que são ótimos na minha opinião. Mas caso desejem esse contato, podem me procurar no Discord. Estou tentando recuperar a minha senha, mas assim que conseguir, eu compartilho com os interessados.


Abraço a todos e parabéns mais uma vez @JuniorLima

Junior Lima
Junior Lima - 26/07/2023 15:53

Obrigado pela dica Alessandro. Tenho estudado por fora também com livros e outros cursos pra aprimorar um pouco mais.

Paulo Pereira
Paulo Pereira - 26/07/2023 15:52

Acho que como uma base inicial está sendo muito legal. Como ainda estou no inícion não consegui identificar isso mas talvez venham melhorias por ai!

Alessandro Junior
Alessandro Junior - 26/07/2023 15:44

Bem colocado Junior, também tive essa impressão. O bootcamp tem muito conteúdo de relevância, porém peca pois não aprofunda nem um pouco de fato em datascience. Aconselho da uma olhadinha no Kaggle. Eu to fazendo lá e ká para conciliar os estudos.

Marcos Leonel
Marcos Leonel - 26/07/2023 15:08

Amigo seu comentário é de grande valor, estou no mesmo barco que vc, vou ter que pegar esse seus conselhos e estudar cada modulo desse separado, abraços amigo

Isis Struckl
Isis Struckl - 26/07/2023 15:01

Muito legal!