Quem trabalha com a poderosa biblioteca Python Pandas se depara com centenas de funções adequadas para infinitos cenários mas, no dia a dia, acabamos usando apenas um punhado que realizam a maioria das tarefas que precisamos:
Funções de 𝗟𝗲𝗶𝘁𝘂𝗿𝗮 𝗱𝗲 𝗗𝗮𝗱𝗼𝘀:
1. pd.read_csv(): permite acessar dados de um arquivo CSV ou de outros formatos como Excel, HTML, JSON, etc.
𝗜𝗻𝗳𝗼𝗿𝗺𝗮çõ𝗲𝘀 𝗱𝗼 𝗗𝗮𝘁𝗮𝗙𝗿𝗮𝗺𝗲:
2. df.info(): Mostra detalhes do o DataFrame, como número de linhas, colunas e tipos de dados e valores nulos, essencial para a primeira aproximação aos dados.
3. df.head() e df.tail(): Mostra as 5 primeiras linhas do DataFrame e as 5 ultimas linhas, respectivamente.
4. df.shape: Retorna o número de linhas e colunas do DataFrame.
Funções de 𝗟𝗶𝗺𝗽𝗲𝘇𝗮 𝗱𝗲 𝗗𝗮𝗱𝗼𝘀:
5. dropna(): Remove linhas com valores nulos.
6. fillna(): Preenche valores nulos com um valor específico.
7. drop_duplicates(): Remove linhas duplicadas.
8. replace(): Substitui valores específicos por outros valores.
9. astype(): Converte o tipo de dados de uma coluna.
Funções de 𝗙𝗶𝗹𝘁𝗿𝗮𝗴𝗲𝗺 𝗱𝗲 𝗗𝗮𝗱𝗼𝘀:
10. loc[]: Acessa linhas e colunas pelo rótulo.
11. iloc[]: Acessa linhas e colunas pelo índice numérico.
12. query(): Filtra o DataFrame usando expressões booleanas.
Funções de 𝗠𝗮𝗻𝗶𝗽𝘂𝗹𝗮çã𝗼 𝗱𝗲 𝗗𝗮𝗱𝗼𝘀:
13. merge() e join(): Combina DataFrames com base em chaves.
14. concat(): Concatena DataFrames ao longo de um eixo.
15. pivot_table(): Cria uma tabela dinâmica a partir de um DataFrame.
16. melt(): Transforma colunas em linhas.
Funções de 𝗔𝗻á𝗹𝗶𝘀𝗲 𝗱𝗲 𝗗𝗮𝗱𝗼𝘀:
17. describe(): Fornece estatísticas descritivas para colunas numéricas.
18. groupby(): Agrupa dados com base em uma ou mais colunas.
19. value_counts(): Conta a ocorrência de valores únicos em uma coluna.
20. corr(): Calcula a correlação entre colunas numéricas.
21. apply(): Aplica uma função a cada elemento de uma coluna ou linha.
Comments are closed