Banco de dados NoSQL: com Big Data
- #SQL
- #NoSQL
- #Big Data
- #Banco de Dados
Se você já domina bancos de dados relacionais e sabe o que é uma boa modelagem em SQL, então está na hora de dar um passo além, e entender como o Big Data muda esse jogo. 😉
▪️Introdução
Quando o banco de dados tradicional não dá mais conta. Você já sabe trabalhar com PostgreSQL, MySQL ou SQL Server. Faz JOINs como quem toma café e entende o que é ACID sem pensar duas vezes. Mas... e quando os dados deixam de caber no seu banco? Quando os gigabytes viram terabytes e o tempo de resposta não acompanha o crescimento?
É aqui que entra o Big Data. Mas calma, nada de buzzwords soltas. Vamos entender isso juntos, passo a passo.
▪️ O que é Big Data❔
Big Data refere-se a conjuntos de dados extremamente grandes e complexos que as ferramentas tradicionais de processamento de dados não conseguem gerenciar com eficiência.
Esses dados são caracterizados por três principais dimensões: volume (a quantidade de dados), velocidade (a taxa na qual os dados são gerados e processados), e variedade (a diversidade de tipos de dados, como estruturados, semiestruturados e não estruturados).
O Big Data é usado para identificar padrões, tendências e comportamentos em grandes volumes de dados, permitindo a tomada de decisões mais informadas e aprimorando processos em diversas área
Big Data não é só “grandes dados", "macrodados", ou "megadados”. É uma mudança completa na forma de armazenar, processar e analisar grandes volumes de dados que presentam os seguintes desafios, conhecidos como os 4 Vs do Big Data:
- Volume → Os dados crescem sem parar. Estamos falando de terabytes, petabytes e até exabytes de informação.
- Velocidade → Os dados chegam o tempo todo, em tempo real ou quase em tempo real, como em sensores IoT, redes sociais ou logs de sistemas.
- Variedade → Os dados vêm de diferentes fontes e formatos: textos, imagens, vídeos, planilhas, bancos SQL e NoSQL, etc.
- Veracidade → Os dados nem sempre são confiáveis. Eles podem estar incompletos, duplicados, desatualizados ou com erros, e por isso precisam ser tratados antes da análise.
Esse é o famoso modelo dos Vs do Big Data, e o motivo pelo qual soluções tradicionais muitas vezes travam ou se tornam caras e ineficientes. .
❌ Por que bancos relacionais em determinado ponto não são mais o suficiente❔
Bancos relacionais funcionam muito bem quando lidamos com dados estruturados, tabelas bem definidas, e precisamos de transações confiáveis com integridade referencial. Até aqui, tudo certo.
Mas quando entramos no cenário de Big Data, os desafios mudam, e o modelo relacional começa a tropeçar. Isso por que:
- Dados nem sempre vêm organizados: logs de sistemas, imagens, vídeos, sensores, cliques... muitos deles são semi ou não estruturados, e não se encaixam bem em tabelas fixas.
- Volume e a variedade exigem processamento distribuído: não dá mais pra contar com um único servidor. É preciso dividir a carga em clusters de máquinas trabalhando juntas.
- Crescimento exponencial: escalar “verticalmente” (colocar mais RAM ou CPU no mesmo servidor) tem limite e é caro. No Big Data, precisamos escalar horizontalmente, ou seja, adicionar mais máquinas ao sistema.
💬 Spoiler realista: Bancos relacionais tradicionais começam a engasgar nesse cenário. Eles não foram feitos para lidar com esse nível de diversidade, escala e velocidade por serem mais lentos.
▪️ Agora, entram os bancos NoSQL
Os bancos NoSQL não vieram para substituir o SQL, mas para complementar, adaptando-se a cenários de Big Data por serem mais rápido e de rápido acesso em tempo real.
Existem 4 principais tipos:
1. Documentos (Ex: MongoDB)
Armazenam dados no formato JSON ou BSON. Flexível e ideal para dados semi-estruturados.
- JSON (JavaScript Object Notation)
Formato de texto leve, amplamente usado para troca de dados
- BSON (Binary JSON)
É um formato de serialização binária que expande o JSON para ser mais eficiente em armazenamento e leitura, além de suportar mais tipos de dados.
Exemplo: Um app que armazena perfis de usuários com preferências personalizadas. Cada usuário pode ter campos diferentes.
2. Chave-Valor (Ex: Redis, DynamoDB)
Extremamente rápidos, ideais para cache ou sessões.
Exemplo: Login de usuários, contadores de curtidas em redes sociais.
3. Colunar (Ex: Apache Cassandra, HBase)
Armazenam dados por coluna e não por linha, otimizando buscas analíticas massivas.
Exemplo: Relatórios de analytics com bilhões de registros.
4. Grafos (Ex: Neo4j)
Perfeitos para representar relações complexas, como redes sociais ou rotas logísticas.
Exemplo: “Quem conhece quem” numa rede ou “qual o caminho mais curto entre X e Y”.
▪️E o que mais entra no ecossistema Big Data❔
Big Data não é só banco, é uma arquitetura inteira.
Veja alguns pilares:
- Hadoop & HDFS
Framework para armazenamento distribuído. Pensa num “HD virtual gigante” espalhado em vários servidores.
- Spark
Processamento de dados em memória, muito mais rápido que o antigo MapReduce.
- Kafka
Mensageria em tempo real. Ideal para dados em streaming, como logs ou cliques em tempo real.
- Data Lakes
Repositórios de dados brutos e diversos, onde tudo é armazenado primeiro para depois ser tratado (diferente de um data warehouse tradicional).
🔄️ E onde tudo isso roda❔
A maioria das arquiteturas de Big Data hoje está na nuvem. Veja alguns exemplos:
- AWS: S3 + Glue + Athena + EMR + DynamoDB
- Azure: Data Lake Storage + Synapse + Cosmos DB
- GCP: BigQuery + Dataflow + Firestore
A boa notícia? Você não precisa montar tudo do zero, a nuvem já traz soluções prontas (e muitas vezes gratuitas no plano inicial ou contas vinculadas a universidade).
▪️ Conclusão
Hora de expandir seu mindset!!👩🏻💻
Você já domina os fundamentos dos bancos de dados. Agora, pense além:
- Em dados que não cabem em tabelas,
- Em arquiteturas distribuídas,
- Em escalar não só o sistema, mas a sua forma de pensar.
Big Data não é um substituto. É uma evolução natural para quem lida com sistemas que crescem. Comece pequeno: explore um MongoDB, rode uma consulta no BigQuery ou monte seu primeiro Data Lake com arquivos CSV.
Sempre explore!!
🙋♀️ E aí, fez sentido pra você?
Esse artigo te ajudou a clarear o que é Big Data no mundo dos bancos de dados? Já teve alguma experiência com NoSQL ou ficou com dúvidas?
👉 Comenta aqui o que você já conhecia e o que foi novidade!