Skip to content

Utilizando NumPy com Pandas

Usando NumPy e Pandas para Manipulação de Dados!

Imprimindo o DataFrame que será manipulado

python
df2.head()
out:

Estado Taxa Desemprego Taxa Crescimento Ano
estado1 Santa Catarina 1.5 NaN 2004
estado2 Rio de Janeiro 1.7 NaN 2005
estado3 Tocantins 1.6 NaN 2006
estado4 Bahia 2.4 NaN 2007
estado5 Minas Gerais 2.7 NaN 2008



Imprimindo um resumo estatístico do meu DF das colunas do tipo numérico!

python
df2.describe()
out:

Taxa Desemprego Ano
count 5.000000 5.000000
mean 1.980000 2006.000000
std 0.535724 1.581139
min 1.500000 2004.000000
25% 1.600000 2005.000000
50% 1.700000 2006.000000
75% 2.400000 2007.000000
max 2.700000 2008.000000



Retornando True para as colunas com valor ausente!

python
df2.isna()
out:

Estado Taxa Desemprego Taxa Crescimento Ano
estado1 False False True False
estado2 False False True False
estado3 False False True False
estado4 False False True False
estado5 False False True False



Olhando uma coluna específica para verificar se há valores ausentes.

python
df2['Taxa Crescimento'].isna()
out:
    estado1    True
    estado2    True
    estado3    True
    estado4    True
    estado5    True
    Name: Taxa Crescimento, dtype: bool


Importando o NumPy para nos auxiliar na manipulação

python
import numpy as np


Usando o numpy para preencher uma das colunas do df!

python
df2['Taxa Crescimento'] = np.arange(5.)
df2
out:

Estado Taxa Desemprego Taxa Crescimento Ano
estado1 Santa Catarina 1.5 0.0 2004
estado2 Rio de Janeiro 1.7 1.0 2005
estado3 Tocantins 1.6 2.0 2006
estado4 Bahia 2.4 3.0 2007
estado5 Minas Gerais 2.7 4.0 2008



Agora, verificando se ainda há valores ausentes no DF

python
df2['Taxa Crescimento'].isna()
out:
    estado1    False
    estado2    False
    estado3    False
    estado4    False
    estado5    False
    Name: Taxa Crescimento, dtype: bool