Repositório com um tutorial simples e claro de Polars, biblioteca de análise de dados no Python, uma alternativa ao Pandas.
O notebook se encontra em: 01-polars_notebook.ipynb.
- 0. Setup e considerações iniciais
- 1. Carregando os dados: CSV e Excel
- 2. Informações iniciais do dataframe: head, info, shape e etc
- 3. Selecionando colunas específicas: por nome e por index
- 4. Operações entre colunas: soma, multiplicação e etc
- 5. Renomeando colunas
- 6. Filtrando as linhas: igual, diferente, maior que, menor que, está dentro de uma lista
- 7. Funções de agregação: value_counts, média, mínimo, máximo e etc
- 8. Funções de agregação + group by
- 9. Ordenando as linhas
- 10. Trabalhar com duplicatas
- 11. Lidando com valores nulos: fillna(), dropna(), filtros e etc
- 12. Joins
- 13. Pivot table e Melt
- 14. Operações com datas
- 15. Exportando os dados
- 16. Criando e aplicando funções personalizadas
- 17. Trabalhando com JSON
- 18. Window functions: row number e rank
- 19. Um pouco de teoria: breve descrição e referências
- 20. Bônus e referências
- Adicionar um passo a passo de instalação do Polars + VirtualEnv no README
Criando uma virtual environment (venv) antes de tudo:
python3 -m venv venv
Ative a venv:
. venv/bin/activate
Instale todas as libs necessárias que estão no requirements.txt
:
pip3 install -r requirements.txt
Enjoy!