Código Rápido para Análise de Dados #02
- #Data
- #Python
Diante da lista de registros e seus valores abaixo:
[('gama', 9), ('alfa', 3), ('delta', 5), ('epsilon', 7), ('beta', 1)]
Desenvolva um código em Python que imprima o valor da terceira linha da tabela ordenada e da segunda coluna (coluna 'b').
# Entrada Python
import numpy as np
import pandas as pd
x = np.array(
[('gama', 9), ('alfa', 3),('delta', 5),('epsilon', 7),('beta', 1)], dtype=[('a', 'U10'), ('b', 'i4')])
y = pd.DataFrame(x)
z = y.sort_values(by="a")
print(z.iloc[2,1])
# Saída
5
# Código comentado
import numpy as np
# Importa a biblioteca Numpy como ‘np’ para manipulação de arrays
import pandas as pd
# Importa a biblioteca pandas como ‘pd’ para análise de dados tabulares
x = np.array(
[('gama', 9), ('alfa', 3),('delta', 5),('epsilon', 7),('beta', 1)], dtype=[('a', 'U10'), ('b', 'i4')])
# Cria um array NumPy com 5 pares de valores, cada um contendo uma string (coluna 'a') e um número inteiro (coluna 'b')
y = pd.DataFrame(x)
# Converte o array estruturado em um DataFrame do pandas.
# Resultado:
# a | b
# 0 gama | 9
# 1 alfa | 3
# 2 delta | 5
# 3 epsilon | 7
# 4 beta | 1
z = y.sort_values(by="a")
# A função sort_values() do Pandas ordena o DataFrame com base na coluna 'a' (ordem alfabética crescente).
# Resultado após ordenação:
# a | b
# 1 alfa | 3
# 4 beta | 1
# 2 delta | 5
# 3 epsilon | 7
# 0 gama | 9
print(z.iloc[2,1])
# o indexador iloc[] acessa a terceira linha (índice 2) e a segunda coluna (índice 1) do DataFrame ordenado, que corresponde ao valor 5, associado à string 'delta': ['delta', 5]
# Coluna 'b' = 5
Fonte: Código extraído de questão de concurso.