image

Acesso vitalício ao Atalho Secreto + bootcamps ilimitados

86
%OFF
Article image
Djonatan Schvambach
Djonatan Schvambach08/05/2025 22:11
Compartilhe
Microsoft Certification Challenge #5 - DP 100Recomendados para vocêMicrosoft Certification Challenge #5 - DP 100

Desenvolvendo um Pandas em Golang 1milhão de registros em 0.48s

  • #Python
  • #Inteligência Artificial (IA)
  • #GoLang

Desenvolvendo um formato de dados colunar/framework de dados 100% em golang, semelhante ao Pandas / Spark. porem não distribuído ainda.

Atualmente recem consegui implementar um pool de memoria melhorou a performace atualmente lendo 1 milhão de registros parquet em 0.48 segundos.

a estrutura de Dataframe já existe e já é possível fazer algumas operações como UpperCase, ReplaceData, e estou aprimorando testes de benchmarks para testar e identificar gargalos nos metodos de transformações de dados que vão ser criados. isso é algo que vejo como grande problema nos frameworks modernos de processamento de dados não tem como mensurar gargalos no processo ETL/ELT de maneira simples.

publicação original : https://www.linkedin.com/posts/djonatan-schvambach-25a2051bb_dataengineering-dados-datascience-activity-7323126393276391426-ymmw?utm_source=social_share_send&utm_medium=member_desktop_web&rcm=ACoAADMcKyYBSOoNm2dAbK0clhhg1gD8fSEqAg8

image

Compartilhe
Recomendados para você
Bradesco - GenAI & Dados
Neo4J - Análise de Dados com Grafos
Luizalabs - Back-end com Python
Comentários (1)

RR

Ricardo Rebêlo - 13/01/2026 17:45

Trinta milhões de cálculos exponenciais em 0,162 segundos em Clang/Clang++.

0.126 em Futharklang multiprocessado.

0.080 em Cilklang multiprocessado.

1.280 em Golang.

(eu botei tudo com -lang porque achei legal, mas nenhuma tem, nem "Golang")

Recomendados para vocêMicrosoft Certification Challenge #5 - DP 100