image

Bootcamps ilimitados + curso de inglés para sempre

80
%OFF
Article image
Fernanda Araujo
Fernanda Araujo14/07/2025 03:14
Compartir
Randstad - Análise de DadosRecomendado para tiRandstad - Análise de Dados

Matrizes em Python: Tipos, Fórmulas e Saídas com analogias AWS

  • #AWS
  • #Python

Aprenda como manipular matrizes em Python e entenda como isso se conecta ao seu dia a dia com bancos de dados na nuvem (como AWS RDS, Redshift e até S3).

🧮 O que é uma Matriz em Python?

Conceito:

Uma matriz é uma coleção de dados em forma de tabela — linhas e colunas — muito usada em ciência de dados, machine learning e bancos relacionais.

Código:

python

matriz = [
  [1, 2, 3],
  [4, 5, 6],
  [7, 8, 9]
]
print(matriz[1][2])  # saída: 6

Analogias AWS:

  • Pense na matriz como uma tabela no Amazon RDS (MySQL ou PostgreSQL): cada linha é um registro (row), e cada coluna é um campo (column).
  • matriz[1][2] é como fazer:
sql

SELECT coluna3 FROM tabela WHERE id = 2;

📊 Tipos de Matrizes

Matriz Quadrada

python

quadrada = [
  [1, 0],
  [0, 1]
]

Na AWS: Uma matriz 2x2 pode representar controle de permissões simples, como se fossem flags de acesso a tabelas por função.

Matriz Identidade

python

import numpy as np
identidade = np.identity(3)
print(identidade)

Na AWS: Pode ser comparada ao controle de integridade referencial em banco relacional. Cada “1” na diagonal mostra que o campo está “relacionado com ele mesmo” — útil para entender primary keys.

Matriz Transposta

python

matriz = [
  [1, 2, 3],
  [4, 5, 6]
]

transposta = list(zip(*matriz))
print(transposta)

Na AWS: Isso seria como pivotar uma tabela no Redshift ou com Athena. Ou seja, transformar linhas em colunas — como no Power BI ou Excel.

➗ Fórmulas e Operações com Matrizes

Soma de Matrizes

python

A = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6], [7, 8]])
soma = A + B
print(soma)

Na AWS: Como se você tivesse dois conjuntos de dados em S3 e fizesse um merge com soma de colunas numéricas usando AWS Glue ou Pandas no SageMaker.

Multiplicação de Matrizes

python

produto = np.dot(A, B)
print(produto)

Na AWS: Equivale a um JOIN + agregação em uma query SQL Redshift, onde você cruza dados de duas tabelas com base em chave primária e aplica um SUM().

Determinante de uma Matriz

python

det = np.linalg.det(A)
print(det)

Na AWS: Pode representar o "grau de dependência" dos dados — como descobrir se a tabela tem chaves redundantes ou colunas com valores duplicados que impactam integridade.

🔄 Saídas e Como Interpretar

Acessando elementos

python

print(A[0][1])  # acesso à linha 1, coluna 2

Na AWS: Mesma lógica de uma query com WHERE + SELECT.

Iterando elementos

python

for linha in A:
  for valor in linha:
      print(valor)

Na AWS: Como fazer um scan total de tabela no DynamoDB, onde percorremos linha por linha.

☁️ Simulando uma situação real na AWS

Você tem logs armazenados no S3 como arquivos CSV. Ao carregá-los no Pandas:

python

import pandas as pd
df = pd.read_csv("dados.csv")
matriz = df.values

A partir daí, você pode fazer cálculos com np.mean(matriz), transpor, filtrar, etc.

É como se transformasse um bucket S3 em uma estrutura de matriz para análise, sem precisar carregar tudo no Redshift!

⁉️ Possíveis Duvidas...

  • O que é Iterando Elementos?

Iterar significa percorrer item por item dentro de uma estrutura de dados. No caso de uma matriz em Python (ou seja, uma lista de listas), iterar elementos é o processo de visitar cada número ou valor que ela contém — geralmente com um laço for.

  • O que é Query?

Uma query é uma consulta de dados. No contexto de banco de dados (como MySQL, PostgreSQL, Redshift ou DynamoDB), é um comando que você envia ao banco para buscar, filtrar, contar ou modificar informações.

  • O que é Merge?

Merge significa juntar dados de diferentes fontes com base em alguma chave comum — como o CPF, ID ou e-mail de uma pessoa.

  • O que são Flags?

Uma flag é uma variável binária que indica se algo está ativo (True/1) ou inativo (False/0). Muito usada para controle de estados, permissões e condições lógicas.

  • O que é Primary Key (Chave Primária)?

Uma Primary Key (chave primária) é um identificador único para cada registro (linha) em uma tabela de banco de dados. Ela garante que não existam duplicatas e que cada linha seja única.

✅ Conclusão

Matrizes são a base para muitas operações em Python e são ainda mais poderosas quando pensamos em bancos de dados como AWS RDS, Redshift, Athena ou DynamoDB. Ao dominar esses conceitos, você consegue Otimizar queries, entender dependências e trabalhar com grandes volumes em nuvem de forma inteligente.

📚 Referências

Compartir
Recomendado para ti
Suzano - Python Developer
BairesDev - Machine Learning Practitioner
Santander - Cibersegurança #2
Comentarios (0)
Recomendado para tiRandstad - Análise de Dados