Construção de Gráficos com Pandas
Construção de gráficos com um DF Pandas!
Apesar de ter essa funcionalidade no Pandas, não é tão recomendado, existem outras bibliotecas que fazem isso de forma melhor aprimorada!
Instalando uma versão específica do Scikit Learn!
python
!pip install scikit-learn==1.2.1
Importando o Scikit
python
import sklearn
sklearn.__version__
# A versão usada é o 1.2.1
out: '1.2.1'
Vamos começar importando o dataset iris do scikit-learn
python
from sklearn.datasets import load_iris
data = load_iris()
Então carregamos o dataset iris como um dataframe do Pandas
python
out:
df = pd.DataFrame(data['data'], columns = data['feature_names'])
df['species'] = data['target']
df.head()
| sepal length (cm) | sepal width (cm) | petal length (cm) | petal width (cm) | species | |
|---|---|---|---|---|---|
| 0 | 5.1 | 3.5 | 1.4 | 0.2 | 0 |
| 1 | 4.9 | 3.0 | 1.4 | 0.2 | 0 |
| 2 | 4.7 | 3.2 | 1.3 | 0.2 | 0 |
| 3 | 4.6 | 3.1 | 1.5 | 0.2 | 0 |
| 4 | 5.0 | 3.6 | 1.4 | 0.2 | 0 |
Plotando o DF como um gráfico
python
out:
df.plot()

Vamos fazer um gráfico de dispersão entre duas variáveis
python
out:
df.plot.scatter(x = 'sepal length (cm)', y = 'sepal width (cm)')

Criando um gráfico de área:
python
out:
# criando uma lista de títulos de colunas
columns = ['sepal length (cm)', 'petal length (cm)', 'sepal width (cm)', 'sepal width (cm)']
df[columns].plot.area()

Criando um gráfico de barras com a média de algumas colunas:
python
out:
df.groupby('species').mean().plot.bar()

Ou então, podemos fazer a contagem das classes da coluna species e plotamos em um gráfico de pizza
python
out:
df.groupby('species').count().plot.pie(y = 'sepal length (cm)')

Criando um gráfico KDE para cada variável do DF
python
out:
df.plot.kde(subplots = True, figsize = (8,8))
