Quem trabalha com a poderosa biblioteca Python Pandas se depara com centenas de funções adequadas para infinitos cenários mas, no dia a dia, acabamos usando apenas um punhado que realizam a maioria das tarefas que precisamos:

Funções de 𝗟𝗲𝗶𝘁𝘂𝗿𝗮 𝗱𝗲 𝗗𝗮𝗱𝗼𝘀:

1. pd.read_csv(): permite acessar dados de um arquivo CSV ou de outros formatos como Excel, HTML, JSON, etc.

𝗜𝗻𝗳𝗼𝗿𝗺𝗮çõ𝗲𝘀 𝗱𝗼 𝗗𝗮𝘁𝗮𝗙𝗿𝗮𝗺𝗲:

2. df.info(): Mostra detalhes do o DataFrame, como número de linhas, colunas e tipos de dados e valores nulos, essencial para a primeira aproximação aos dados.

3. df.head() e df.tail(): Mostra as 5 primeiras linhas do DataFrame e as 5 ultimas linhas, respectivamente.

4. df.shape: Retorna o número de linhas e colunas do DataFrame.

Funções de 𝗟𝗶𝗺𝗽𝗲𝘇𝗮 𝗱𝗲 𝗗𝗮𝗱𝗼𝘀:

5. dropna(): Remove linhas com valores nulos.

6. fillna(): Preenche valores nulos com um valor específico.

7. drop_duplicates(): Remove linhas duplicadas.

8. replace(): Substitui valores específicos por outros valores.

9. astype(): Converte o tipo de dados de uma coluna.

Funções de 𝗙𝗶𝗹𝘁𝗿𝗮𝗴𝗲𝗺 𝗱𝗲 𝗗𝗮𝗱𝗼𝘀:

10. loc[]: Acessa linhas e colunas pelo rótulo.

11. iloc[]: Acessa linhas e colunas pelo índice numérico.

12. query(): Filtra o DataFrame usando expressões booleanas.

Funções de 𝗠𝗮𝗻𝗶𝗽𝘂𝗹𝗮çã𝗼 𝗱𝗲 𝗗𝗮𝗱𝗼𝘀:

13. merge() e join(): Combina DataFrames com base em chaves.

14. concat(): Concatena DataFrames ao longo de um eixo.

15. pivot_table(): Cria uma tabela dinâmica a partir de um DataFrame.

16. melt(): Transforma colunas em linhas.

Funções de 𝗔𝗻á𝗹𝗶𝘀𝗲 𝗱𝗲 𝗗𝗮𝗱𝗼𝘀:

17. describe(): Fornece estatísticas descritivas para colunas numéricas.

18. groupby(): Agrupa dados com base em uma ou mais colunas.

19. value_counts(): Conta a ocorrência de valores únicos em uma coluna.

20. corr(): Calcula a correlação entre colunas numéricas.

21. apply(): Aplica uma função a cada elemento de uma coluna ou linha.

Categories:

Comments are closed