Visualização de Dados: Muito além do Excel e do Power BI!
- #Estrutura de dados
Eis que você se depara com um mar de dados que você precisa apresentar, e seu primeiro pensamento é ‘colocar em uma planilha, fazer um dashboard’. Porém, seria mesmo essa a melhor abordagem para uma boa visualização de dados? Lançar tudo da forma mais prática e visual possível? Se assim como eu, você é um amante das tabelas, mapas, gráficos e por aí vai, tenho uma notícia para você: até chegar em seu processo de montar a visualização, tem um longo caminho a ser percorrido. Porém, não se preocupe, eu estou aqui para te guiar até lá!
Se você está atualmente empregado, já trabalhou ou está em busca de seu primeiro emprego, já deve ter percebido que ultimamente ferramentas como Power BI e Data Studio tem aparecido com frequência nos requisitos das vagas de emprego. Em um mundo cada vez mais tecnológico, cheio de dados por toda parte, é claro que alguém precisa estar encarregado de transformar esses dados. E principalmente, de uma maneira que qualquer pessoa dentro da empresa seja capaz de entender o que está sendo mostrado, e é aí que entra a visualização de dados!
Tá bom, dados, dados e mais dados! A gente fala tanto sobre dados, mas afinal o que são dados? “Ah, dado não é aquele com seis lados, que eu nunca consigo girar no valor que eu quero que caia?”
Brincadeiras à parte, se você quer saber sobre, sente aí que lá vem história!
O que você vai ver neste artigo:
- Iniciando nossa Caminhada: Dado x Informação x Conhecimento;
- Formulando Perguntas e Entendendo Seus Tipos;
- Análise de Dados e Estatística;
- Compreendendo os Tipos de Dados;
- A Fonte do Poder Supremo: Onde Buscar os Dados, Limpeza e Organização do sucesso;
- Chegando no Final do Arco-Íris: A Visualização de Dados!
O que é um dado?
Antes de mais nada, é importante entender a diferença entre dado, informação e conhecimento. Apesar de muitas vezes dados e informações serem utilizados como sinônimos, na área da tecnologia são coisas diferentes.
- Dado x Informação
Dado é um conhecimento bruto, ou seja, uma matéria-prima, é como um diamante que ainda precisa ser lapidado. Um dado pode ser qualquer coisa, um número, uma letra, uma palavra entre muitos outros. Mas quando pegamos esses dados e os organizamos, estes se tornam uma informação. Ou seja, informação nada mais é do que um dado que foi organizado e estruturado.
Se eu falar para você: “gato amarelo comida”, não vai fazer muito sentido, certo? Mas se eu falar: “o gato amarelo está querendo comida”, agora sim vai fazer sentido.
- Mas e o conhecimento?
Depois do processo de organizar os dados e transformá-los em informação, chegamos no processo de conhecimento. O conhecimento é quando pegamos as informações e podemos analisá-las e adquirir conhecimento através deste.
Quando lemos um artigo, um livro, uma pesquisa e está cheio de informações, números, gráficos e textos que podemos ler e entender, este já passou por um processo de transformar os dados até chegar nesse resultado que estamos lendo.
Ou seja, esse artigo primeiro reuniu vários dados e os organizou de uma maneira para que essa informação possa virar conhecimento para você, meu caro leitor.
Resumindo: Informações são dados que foram organizados para poder transmitir o conhecimento. O conhecimento é a análise dessa informação.
Perguntas: A Essência da Pesquisa!
Agora que você entendeu a diferença entre dado, informação e conhecimento, vamos começar o trabalho. Para que seja possível fazer uma boa análise de dados, perguntas são a base para o sucesso. Basicamente, elas são o alicerce que irá construir e segurar todas suas informações de maneira efetiva.
As perguntas precisam ser claras e úteis, para que você possa seguir um repertório que faça sentido e que realmente transforme seus dados em informações e conhecimento. Perguntas podem ajudar a evitar coleta dados irrelevantes, que venham produzir um trabalho ineficiente e desnecessário.
É importante que no processo de formulação de perguntas, você as estabeleça já pensando em quais respostas deseja obter.
E quais são os tipos de perguntas que podemos fazer?
1. Abertas: Esse tipo de pergunta, permite informações mais detalhadas e exploração de novas ideias, já que damos espaço para uma resposta menos específica, diferente das fechadas.
2. Fechadas: São perguntas que já tem um caminho estabelecido, são úteis quando você precisa de respostas precisas e específicas, ao contrário das perguntas abertas que são mais livres.
3. Descritivas: Interessantes quando você precisa de um resumo ou descrever os dados. Ajudam muito na busca por insights mais detalhados.
4. Exploratórias: Uma das mais usadas na análise de dados, as perguntas exploratórias buscam explorar tendências e padrões nos dados. Você se torna um “CSI” pois realiza uma investigação, e essa investigação pode até mesmo descobrir informações e esclarecer padrões que antes não eram evidentes.
5. Inferenciais: Aqui, os dados apresentados nas perguntas exploratórias, ganham conclusões mais amplas, estimativas e testa hipóteses.
Vamos criar uma empresa fictícia, ela se chamará “Amo Gatinhos” (sim, eu realmente amo). Essa é uma empresa que vende roupas para pets online. Uma fofura, não acha?
Estou em busca de analisar os dados de venda do último semestre, quais perguntas devo fazer para poder iniciar meu estudo?
Aqui vão alguns exemplos:
- Qual é a receita da empresa? (pergunta descritiva)
- Qual o produto de maior venda atualmente? (pergunta fechada)
- Quais são os principais fatores que influenciam os clientes a escolher comprar na 'Amo Gatinhos'? (pergunta aberta)
- Qual foi o mês de maior número de vendas? (pergunta descritiva)
- Quais fatores podem explicar as variações de receita? (pergunta exploratória)
- Com base na análise de vendas, qual a estimativa para os próximos três meses? (pergunta inferencial)
Lembrando que dentro de uma pergunta pode haver mais de um tipo, inclusive pode até ser mais eficaz juntarmos uma pergunta descritiva com uma pergunta inferencial, por exemplo. Esse é apenas um dos passos para fazer uma análise de dados realmente eficiente, porém é um passo essencial para que você tenha um resultado efetivo. Perguntas que realmente fazem sentido, vão escrever um roteiro para que você possa encontrar os dados, organizar em informação e transmitir o conhecimento para a empresa de forma hábil.
Analisando a Análise de Dados
Agora sim, chegamos no ponto crucial. Antes posso dizer que estávamos coletando a receita para fazer uma boa análise de dados, mas agora que já sabemos quais ingredientes precisamos, vamos colocar a mão na massa. Assim como na preparação de uma receita exige a seleção cuidadosa dos melhores ingredientes, a análise de dados requer uma abordagem similar.
Então, da mesma forma como um padeiro habilidoso faz com a massa, manipularemos os dados com precisão e perícia. Estamos prontos para moldar insights, descobrir padrões e, acima de tudo, extrair conhecimento valioso.
Depois de fazer as perguntas (úteis e claras, não se esqueça!), e obter esses dados, agora chegou a hora de analisá-los. E como vamos fazer isso? Com auxílio da Estatística. Dentro da Estatística, temos a estatística descritiva e inferencial. Não se preocupe muito com nomes, estou apenas os apresentando para que você possa entender onde vamos chegar.
- Estatística Inferencial
Lembra sobre o que foi falado sobre ‘pergunta inferencial’? O conceito aqui é o mesmo, só que ao invés de apenas perguntar, utilizaremos os dados de uma amostra para generalizar uma população de dados. Porém, esse modelo não é muito utilizado, a não ser que você seja uma empresa que trabalhe com estatísticas e pesquisas, por exemplo.
- Estatísticas Descritiva
Este é o modelo mais utilizado pelas empresas, e é o que a gente está acostumado a ver. Envolve utilizar métodos que permitem apresentar, medir, verificar e analisar um conjunto de dados. É nesse tipo de análise, que ordenamos a informações, colocamos em tabelas e criamos gráficos para visualizar os dados!
Em Direção ao Pote de Tesouro: Compreendendo os Tipos de Dados
Agora sim estamos cada vez mais próximos do nosso pote de tesouro, (ok será se só eu que gosto tanto assim de visualização de dados?), mesmo assim, estamos chegando no tema principal desse artigo. Mas pera lá! Sem pressa, ainda temos mais um pedacinho até chegarmos. Precisamos entender que tipos de dados iremos encontrar em nossa jornada.
Como foi dito lá no começo, os dados podem ser basicamente qualquer coisa, um número, um nome, uma letra etc. Nesse gráfico, fica um pouco mais claro como funciona essa dinâmica, irei explicar cada um.
Temos nossos dados e eles se dividem em:
- Quantitativo: Aqui, o nome já diz tudo - remete à quantidade, ou seja, são dados numéricos. Dentro dos quantitativos, temos a categorização em discretos e contínuos:
- ↳ Dados discretos: são representados por números inteiros (1,2,3...), são como uma contagem. Pense em idade, número de funcionários, a quantidade de roupas da “Amo Gatinhos” etc.
- ↳ Dados contínuos: envolve medições de infinitos valores possíveis. Por exemplo: altura, salário, custo etc.
- Qualitativos: Aqui, a palavra-chave é qualidade, ou seja, expressam uma característica ou ordem. Os qualitativos se dividem em dois subgrupos:
- ↳ Dados nominais: a raça, a cor, a profissão, o setor assim como exemplificado no gráfico, todos esses são exemplos de dados nominais. Consistem em nomes, rótulos etc.
- ↳ Dados ordinais: estes são parecidos com os nominais, mas podem ser classificados por uma ordem. Exemplo: classe social, grau de satisfação, estatura etc. A altura por si só, 1,65 cm, por exemplo, é um dado contínuo, mas quando colocado em ordem de estatura, mais alto, mais baixo, esse dado se torna ordinal.
Agora que compreendemos essas distinções, estamos prontos para avançar e explorar como esses tipos de dados desempenham papéis cruciais na visualização e interpretação dos tesouros que nossas análises podem revelar. Vamos em frente, que o pote de tesouro nos aguarda!
Fonte dos Desejos: O Poder da Informação!
Discutimos conceitos e tipologias, mas agora a pergunta que não quer calar: onde encontrar os tão essenciais dados? A resposta? Bem, isso depende! Os dados são como tesouros escondidos, espalhados por todo o cenário empresarial e digital. A fonte que você escolhe para saciar sua sede de informações dependerá do setor em que atua e do tipo de insights que procura.
Exemplos de fonte de dados focados mais no setor interno de uma empresa:
No entanto, também podemos buscar fontes externas, no caso de querer realizar uma análise com dados de várias empresas, econômicos ou populacionais, podemos recorrer ao IBGE, a revistas conceituadas de economia, a pesquisas de mercado, utilizar as mídias sociais e por aí vai. São muitas as maneiras de se obter dados desde que sua fonte seja confiável. Além da possibilidade de coletar informações através de entrevistas, pesquisas internas ou com clientes e até mesmo fazendo observações tal como um espião.
Não se esqueça que após coletar os dados é preciso realizar uma limpeza. Segundo informações do site da AWS (Amazon Web Services), a limpeza de dados implica: "remover dados redundantes, executar operações matemáticas para análise posterior ou filtrar e converter dados para atender aos critérios da pergunta”. Por exemplo, a remoção de dados do volume de vendas de Natal e pós-campanhas de marketing pode ser necessária para identificar as vendas médias por tipo de embalagem. (AWS, [O que é visualização de dados?], https://aws.amazon.com/pt/what-is/data-visualization/)
E por último, mas não menos importante, temos o processo de organização dos dados. E como faremos isso? Aqui começa a parte divertida da visualização de dados: a organização dos dados. Tabelas, gráficos, mapas e planilhas são algumas das ferramentas comuns nessa jornada de transformar dados brutos em insights poderosos.
O Final do Arco-Íris: A Visualização de Dados!
E finalmente, o tão esperado tópico: a nossa querida Visualização de Dados. Depois de todo processo descrito anteriormente, finalmente podemos começar a construir as ferramentas visuais dos dados. O nosso dado passou de informação, para conhecimento e ta na hora de se tornar um conhecimento apresentável. Mas o quão importante é a visualização de dados?
Imagine que você trabalha na “Amo Gatinhos”. Você tem um grande número de dados para trabalhar e eu solicito para que você os coloque de maneira que todos da empresa possam entender o que eles significam. O que será mais fácil para entendimento geral: criar uma tabela no Excel e enviar para todos, um texto de pelo menos 5 páginas ou um dashboard com gráficos, diagramas, mapas? Tenho certeza de que o dashboard fará muito mais sucesso, e se for uma apresentação no Power Point, então é gg!
A visualização de dados vai muito além de um senso estético, ela também é um recurso acessível capaz de demonstrar e conscientizar todos da equipe sobre os dados coletados e organizados. Agora sim, esse dado se tornou um conhecimento e de conhecimento geral!
Para podermos escolher um software, é interessante relembrarmos o conceito de BI. Business Intelligence é um processo que utiliza análise de dados para fornecer insights valiosos e basear decisões estratégicas nas organizações. Por meio de ferramentas e tecnologias, o BI coleta, transforma e apresenta dados históricos e atuais de maneira visual e intuitiva, auxiliando na compreensão e otimização do desempenho empresarial. A Microsoft define Business Intelligence como o processo que "revela insights para a tomada de decisões estratégicas. As ferramentas de business intelligence analisam dados históricos e atuais e apresentam as descobertas em formatos visuais intuitivos" (Power BI, [O que é Business Intelligence?], https://powerbi.microsoft.com/pt-br/what-is-business-intelligence/).
E então, quais softwares são ideais para o uso? Bem, depende do seu objetivo. Atualmente, o Power BI tem sido uma ferramenta bem popular. É um ótimo instrumento para elaboração de dashboards com gráficos e recursos visuais dinâmicos. Porém, vai depender do que você busca para analisar e visualizar seus dados.
Se você procura uma ferramenta com foco na construção de tabelas, o Excel é o mais conhecido entre as opções. Ele é frequentemente requisitado em vagas de emprego e é uma escolha popular para trabalhar com dados tabulares. Embora seja possível criar dashboards no Excel, é importante notar que o Power BI oferece uma experiência mais fácil e intuitiva para a criação desses recursos visuais. E existem muitas outras alternativas como Google Data Studio, Tableau, Domo, Zoho Analytics, SAP etc. Todas elas com prós e contras que você pode procurar para poder fazer uma escolha mais interessante para seu negócio.
No entanto, se você é um estudante de Análise de Dados, acredito que seu foco deva ser Excel, Power BI e mais uma alguma ferramenta para ter um conhecimento interessante destas, que são as mais utilizadas e requisitadas pelos empregadores, ao menos no início de sua carreira.
E quais são os recursos gráficos que podemos utilizar? Os mais usuais são: tabelas, gráficos de pizza, de barras, de colunas, mapas, diagramas, entre outros. Contudo, os gráficos são os queridinhos e por isso, darei uma atenção especial a eles.
Você sabe me dizer qual gráfico é melhor em qual situação? Se não, vem que eu te mostro alguns exemplos.
Gráfico de Barras/Colunas
Muito utilizado, gráfico de barras e/ou colunas, costuma ser uma boa opção, geralmente indicam um dado quantitativo (lembram deles lá em cima?). É um dos tipos que mais facilita a compreensão de todos. Porém, você sabia que tem uma diferença entre eles? O gráfico de barras tem suas informações na horizontal e o valor de cada barra é proporcional ao seu crescimento. Já o gráfico de colunas é na vertical e o valor de cada coluna é proporcional a seu desenvolvimento.
Gráfico de Pizza
Os outros podem ser famosos, mas nenhum é mais famoso do que esse aqui. O gráfico de pizza, torta ou setor, é utilizado até para memes na internet, ele realmente sabe representar o nome que tem. É uma alternativa certeira, caso você não tenha um número alto de dados. Se colocado muitos dados, este fica poluído e desagradável de entender as informações.
Histograma
O histograma é um tipo de gráfico de barras. Ele é interessante de ser usado quando é preciso resumir um grande conjunto de dados ou comparar resultados.
Séries Temporais
Uma série temporal consiste em observações realizadas sequencialmente ao longo do tempo. Uma série temporal é uma sequência de observações de uma variável ao longo do tempo, sendo crucial a preservação da ordem dos dados nesse contexto.
Gráfico de Linhas
É um gráfico utilizado para quando precisa-se mostrar dados que vão mudando ao longo do tempo. Um gráfico de linha exibe pontos conectados por linhas, estendendo-se da esquerda para a direita no gráfico e cada ponto representa um valor de dados específico.
Existem esses tipos, além de muitos outros gráficos e representações visuais, que contribuem para tornar a visualização de dados completa e efetiva. O que apresentei até agora já oferece uma ideia geral do que é considerado eficaz na comunicação visual de informações, proporcionando clareza e compreensão em diversas situações analíticas. Essas representações são muito importantes, mas também acredito que para aprender de verdade é preciso colocar a mão na massa e trabalhar até entender qual gráfico ou qualquer outro modelo de visualização se encaixa melhor no que está sendo proposto.
Um exemplo prático de um dashboard que fiz. Meu primeiro dashboard sem nenhum tipo de ajuda, acho que ficou legal! E vocês? O que achararm? Gostaria de receber feedbacks para poder melhorar.
Conclusão
Concluímos que a visualização de dados vai muito além da formulação e observação de gráficos. Exige um pensamento crítico, curioso e disposto a ir além para realizar análises, capazes de até mesmo, mudar o rumo de uma empresa. Aprendemos sobre as diferenças entre dados, informações e conhecimento. Também foi destacada a importância de fazer perguntas e quais tipos de questões devem ser feitas. Descobrimos os tipos de dados, onde e quais devemos coletar, enfatizando a necessidade de uma boa limpeza para evitar redundância. A organização é o fator principal da análise de dados, desde sua construção até a visualização. A escolha do gráfico certo faz toda a diferença na hora de apresentar, e toda a estrutura deve ser muito bem pensada.
Agora, um depoimento pessoal: Na verdade, faz apenas cerca de duas semanas que me interessei pela área de Análise de Dados. E quem poderia me culpar? A área de TI é tão vasta, e estou sempre descobrindo novos segmentos que me agradam. Recentemente, me encantei pelo Power BI. Como uma ferramenta pode tornar a vida tão mais fácil? Atualmente, estou realizando cursos para aprimorar minhas habilidades, então ainda não alcancei um nível muito avançado. Certamente, desejo continuar me especializando nessa área. Já iniciei meus estudos sobre banco de dados e SQL, e pretendo aprofundar meu conhecimento nesse campo. Espero que tenham apreciado, adquirido conhecimento e, quem sabe, se divertido com meu artigo. (Será se devo investir na Amo Gatinhos? haha)
Foi um prazer abordar esse tema, especialmente estando tão imersa nesse conteúdo. Espero que tenham gostado tanto quanto eu gostei de escrever.
Referências
ANDRADE, I. Fonte de Dados - Cronapp - Docs - Cronapp. Disponível em: <https://docs.cronapp.io/display/CRON2/Fonte+de+Dados>. Acesso em: 6 dez. 2023.
CARLOS, E. Leitura de gráficos de barras ou colunas e tabelas simples. Disponível em: <https://centraldefavoritos.com.br/2019/07/23/leitura-de-graficos-de-barras-ou-colunas-e-tabelas-simples>. Acesso em: 6 dez. 2023.
Dados e Informação: Entendendo e Formulando Perguntas. Disponível em: <https://educacao-executiva.fgv.br/cursos/online/curta-media-duracao-online/dados-e-informacao-entendendo-e-formulando-perguntas>. Acesso em: 6 dez. 2023.
Dados X informação. Disponível em: <https://www.binapratica.com.br/dados-x-informacao>. Acesso em: 6 dez. 2023.
DUÒ, M. O Guia para as Melhores Ferramentas de Visualização de Dados. Disponível em: <https://kinsta.com/pt/blog/ferramentas-visualizacao-de-dados/>. Acesso em: 6 dez. 2023.
Estatística Descritiva x Estatística Inferencial. Disponível em: <https://estatmg.com.br/2023/06/24/estatistica-descritiva-x-estatistica-inferencial/>. Acesso em: 6 dez. 2023.
GUIMARÃES, L. Qual a diferença entre dado e informação? Entenda agora! Know Solutions, 7 out. 2019. Disponível em: <https://www.knowsolution.com.br/diferenca-dado-e-informacao/>. Acesso em: 6 dez. 2023
Histograma: O que é, Exemplos, Gráficos e Tipos. Disponível em: <https://www.alura.com.br/artigos/o-que-e-um-histograma>. Acesso em: 6 dez. 2023.
Medidas tipo Atributo ou variável? - MI Domenech - Saiba mais. Disponível em: <https://www.midomenech.com.br/medidas-tipo-atributo-ou-variavel/>. Acesso em: 6 dez. 2023.
PINHEIRO, N. M. Introdução a series temporais — Parte 1 - data hackers - medium. Disponível em: <https://medium.com/data-hackers/series-temporais-parte-1-a0e75a512e72>. Acesso em: 6 dez. 2023.
ROCHA, K. H. S. Aprenda sobre Dado, Informação, Conhecimento e Inteligência em TI. Disponível em: <https://www.estrategiaconcursos.com.br/blog/dado-informacao-conhecimento-inteligencia/>. Acesso em: 6 dez. 2023.
Séries temporais e suas aplicações. Disponível em: <https://www.alura.com.br/artigos/series-temporais-e-suas-aplicacoes>. Acesso em: 6 dez. 2023.
WIKIPEDIA CONTRIBUTORS. Série temporal. Disponível em: <https://pt.wikipedia.org/w/index.php?title=S%C3%A9rie_temporal&oldid=66748582>. Acesso em: 6 dez. 2023.
O que é visualização de dados? Disponível em: <https://aws.amazon.com/pt/what-is/data-visualization>. Acesso em: 6 dez. 2023.