image

Acesse bootcamps ilimitados e +650 cursos

33
%OFF
Article image
Anderson Martins
Anderson Martins29/12/2025 18:46
Compartilhe

Dados Estatísticos em Código

  • #Python

Sobre a Matemática

Os dados estatísticos são informações obtidas em pesquisas estatísticas. Esses dados são classificados conforme a natureza da informação que representam e se dividem em qualitativos e quantitativos.

Os dados qualitativos são dados que descrevem características ou qualidades, não sendo expressos por números com significado matemático. Podem ser Nominais, representam categorias sem ordem natural (por exemplo, cor dos olhos, sexo) ou Ordinais, representam categorias com ordem, mas sem diferença numérica mensurável (por exemplo, grau de satisfação – baixo, médio, alto).

Os dados quantitativos (numéricos) são os dados expressos por números, nos quais operações matemáticas fazem sentido. Podem ser Discretos, resultam de contagens e assumem apenas valores inteiros (por exemplo, quantidade de livros, número de filhos) ou Contínuos, resultam de medições e podem assumir qualquer valor real dentro de um intervalo (exemplo, altura, peso, tempo).

Sobre o Código

Na linguagem de programação Python,

import – é o comando usado para carregar bibliotecas ou módulos externos para uso no programa. Permite reutilizar códigos prontos.

pandas – é a biblioteca voltada para organização, manipulação e análise de dados, especialmente em forma de tabelas estatísticas.

numpy – é a biblioteca focada em cálculos numéricos e estatísticos, oferecendo funções matemáticas eficientes.

as – é a palavra-chave usada para criar um apelido (alias) para uma biblioteca, facilitando a escrita e a leitura do código.

{} – são os delimitadores do dicionário, estrutura de dados que armazena informações em pares chave : valor, muito usada para representar variáveis estatísticas.

df – é o nome de variável (convencional) usado para representar um DataFrame, isto é, uma tabela de dados estatísticos.

.DataFrame – é a função do pandas que transforma dados estruturados (como dicionários) em uma tabela estatística com linhas e colunas.

print() – é a função nativa que exibe informações na tela, permitindo visualizar dados, resultados e mensagens do programa.

\n – é a sequência de escape que representa uma quebra de linha, usada para organizar melhor a saída no terminal.

f"..." (f-string) – é a forma de formatar textos permitindo inserir valores de variáveis ou cálculos diretamente dentro da string.

np.mean() – é a função do NumPy que calcula a média aritmética de um conjunto de dados numéricos.

np.median() – é a função do NumPy que calcula a mediana, o valor central de um conjunto de dados ordenado.

.min() – é o método que retorna o menor valor de uma coleção de dados numéricos.

.max() – é o método que retorna o maior valor de uma coleção de dados numéricos.

.value_counts() – é o método do pandas que calcula a frequência absoluta, contando quantas vezes cada valor aparece.

# – é usado para criar comentários ao código, que são notas para se entender melhor o que o código faz.

Vamos ao código…

import pandas as pd
import numpy as np

# Criação dos dados da pesquisa
dados = {
  "idade": [15, 16, 15, 17, 16, 15, 18],
  "altura": [1.60, 1.72, 1.65, 1.80, 1.75, 1.62, 1.78],
  "sexo": ["F", "M", "F", "M", "M", "F", "M"]
}

# Criação do DataFrame (tabela estatística)
df = pd.DataFrame(dados)

image

print("DADOS DA PESQUISA\n")
print(df)

print("\nANÁLISE ESTATÍSTICA\n")

# Análise dos dados quantitativos
print("Idade:")
print(f"Média: {np.mean(df['idade'])}")
print(f"Mediana: {np.median(df['idade'])}")
print(f"Valor mínimo: {df['idade'].min()}")
print(f"Valor máximo: {df['idade'].max()}")

print("\nAltura:")
print(f"Média: {np.mean(df['altura'])}")
print(f"Mediana: {np.median(df['altura'])}")
print(f"Valor mínimo: {df['altura'].min()}")
print(f"Valor máximo: {df['altura'].max()}")

# Análise dos dados qualitativos
print("\nSexo (frequência):")
print(df['sexo'].value_counts())

image

Saída do código (valor de retorno)…

DADOS DA PESQUISA

  idade altura sexo

0   15  1.60  F

1   16  1.72  M

2   15  1.65  F

3   17  1.80  M

4   16  1.75  M

5   15  1.62  F

6   18  1.78  M

ANÁLISE ESTATÍSTICA

Idade:

Média: 16.0

Mediana: 16.0

Valor mínimo: 15

Valor máximo: 18

Altura:

Média: 1.7028571428571428

Mediana: 1.72

Valor mínimo: 1.6

Valor máximo: 1.8

Sexo (frequência):

sexo

M  4

F  3

Fonte:

  • Editora Didática Paulista. Ensino Didático 2000: Ensino Fundamental e Ensino Médio. Sorocaba: Editora Didática Paulista, [s.d.].
  • Códigos e comentários gerados por ChatGPT com revisão nossa.
  • https://docs.python.org/pt-br/3/ [Documentação Oficial do Python]
Compartilhe
Recomendados para você
Bradesco - GenAI & Dados
Neo4J - Análise de Dados com Grafos
Luizalabs - Back-end com Python
Comentários (0)