Problemas com pontos? Como solucionar erro de leitura de decimais em csv no Power BI.
- #Power BI
Para quem já trabalho com bancos de dados de repositórios internacionais sabe que um problema comum é se deparar com um arquivo .csv no padrão métrico estado unidense onde os números decimais são separados por um ponto de vírgula, como no brasileiro.
Nestes casos, nem sempre fazer a substituição por vírgula no arquivo funciona pois pode atrapalhar a leitura das colunas do seu BD.
Neste exemplo, a coluna "Diabetes Pedrigree Function" possui uma série de dados decimais no sistema norte americano usando o ponto como separador:
E assim que você for subir o arquivo para o Power Bi automaticamente o programa vai ler no sistema métrico brasileiro onde o ponto separa as casas de milhares transformando 0,627 em 627:
Mas como resolver?
Muito simples!
Assim que você subir os dados e acessar o Power Query, ele já vai te listar na barra lateral as aplicações automáticas que o programa fez, como padrão o Power Bi faz automaticamente a adequação de tipo, a causa raiz do nosso problema.
Já no campo superior você vê listado quais as alterações de tipo que foram realizadas na ultima aplicação "Tipo Alterado" onde estará listado a nossa coluna de interesse:
Como esta aplicação automática foi a responsável pelo equívoco na leitura nós vamos remove-la clicando no X:
Após a remoção perceba que a nossa coluna de interesse já recupera o imput do arquivo original, mas ainda não resolvemos nosso problema pois agora a coluna é lida como texto (note o ABC ao lado do título da coluna):
Agora basta clicar com o botão direito em cima do cabeçalho da coluna e ir em Alterar Tipo > Usando localidade...
Selecione "Número Decimal" em Tipo de Dados e Inglês (Estados Unidos) em Localidade, assim o programa irá fazer a leitura no sistema métrico norte americano
Ao dar ok e confirmar a aplicação, a coluna de interesse estará corretamente configurada e você pode seguir com as demais transformações necessárias:
Me deparei com este problema durante o Bootcamp Santander e achei essa solução no canal do Marcos Furlan (https://www.youtube.com/watch?v=SEtwNQ5C3BU).
Acredito que é uma solução mais duradoura visto que mesmo com novas inclusões no BD original a alteração é replicada em todas as linhas automaticamente.