COMO LER ARQUIVOS CSV COM PYTHON
Está cada vez mais comum o "empoderamento" das pessoas na utilização de
tecnologias para potencializar o seu dia a dia otimizando tarefas em
casa e no trabalho. O python é uma parte importante no meio tecnológico
para isso ocorrer, ele permite de maneira rápida e fácil a leitura,
tratamento e análise de dados vindas de diversas fontes, hoje mostrarei
como ler um arquivo csv em python já importado ele para uma tabela
possível de ser trabalhada.
Para isso utilizaremos um ferramenta muito comum para quem conhece a
linguagem, o pandas, uma biblioteca que, como verão logo abaixo,
facilita demais a vida de quem quer trazer dados de arquivos para
trabalhar no python.
Partiremos do princípio de que você já tem o python instalado e daremos
nossos exemplos por meio do Jupyter Notebook, mas se você quiser
utilizar outro editor fique a vontade, o código não depende do editor.
Para iniciarmos, precisamos garantir que você possui a biblioteca
pandas instalada, isso podemos realizar de maneira simples utilizando o
comando abaixo no prompt de comando do windows ou no seu terminal no
linux:
pip install pandas
No meu caso, como já tenho instalado aparece a mensagem abaixo, caso
contrário você instalará as dependências e os pacotes com esse comando:
Por incrível que pareça, isso é tudo de dependência que temos para iniciar os trabalhos, então vamos pro código.
Primeiro passo é importar a biblioteca no seu código python, para isso utilize o comando import conforme abaixo:
import pandas as pd
Se você não estiver acostumado com o python provavelmente estará se
perguntando o que significa o "as pd", na verdade para não precisarmos
ficar digitando "pandas." para todo comando que formos utilizar a
biblioteca o comando "as pd" significa que estamos definindo pd como um
"apelido" para "pandas", com isso podemos chamar os comandos utilizando
"pd.".
Na sequência já vamos pro código que é nosso objetivo, isso mesmo, com o
python podemos sempre ir direto ao ponto que queremos, isso que faz com
que cada vez mais ganhe adeptos em busca de produtividade para lidar
com dados, não precisa de muito para chegarmos aos dados em si.
Temos um arquivo csv com uma listagem de preços de cotação de um par de
moedas (EURUSD) com suas colunas separadas por ";", conforme abaixo:
Para importar esse arquivo para um DataFrame, uma estrutura
bidimensional como se fosse uma planilha, utilizamos o comando a seguir:
dados = pd.read_csv('forex1.csv',sep=';')
Destrinchando o código: read_csv é a função do pandas que faz a leitura
de um csv, primeiro parâmetro ('forex1.csv') é o nome do meu arquivo, o
segundo parâmetro, no caso acima, eu coloquei o separador de colunas,
pois por padrão ele entende como ',', mas no nosso caso o separados é o
';', portanto isso justifica o "sep=';'"
Para testarmos se funcionou podemos pegar somente os primeiros dados do
arquivo importado (as vezes os arquivos são enormes) e exibimos como
uma amostra na tela:
dados.head()
Isso gerará o código + resultado abaixo:
Reparem que ele importou nosso csv para um DataFrame que é uma
estrutura semelhante a umma tabela/planilha, que agora podemos
trabalhar, inclusive utilizando os campos como por exemplo
dados['open'], se fizermos isso iremos listar toda a coluna open dos
dados importados.
O objetivo deste artigo era importar o arquivo csv para uma estrutura
no python de maneira que pudesse, a partir daí, ser utilizado para
diversos cenários que podem ser realizados na ferramenta como estudo de
dados, mesclagem de dados, limpeza de dados, enfim qualquer que seja sua
necessidade.
Vejam que com python não utilizamos mais do que 2 linhas de código
para importar o arquivo csv e 1 linha para apenas testarmos se a
importação foi ok. Python é isso, simples assim!
Até a próxima!
Nenhum comentário:
Postar um comentário