Skip to content

Agrupamento de Dados com GroupBy

Agrupamento de dados em DF com Group By

Primeiro: Filtramos os dados extraindo 3 colunas: Segmento, Região e Valor Venda.

Em seguida: Agrupamos por duas colunas: Segmento e Região.

Então: Calculamos a média da coluna que ficou de fora do groupby

python
df3[ ['Segmento', 'Regiao', 'Valor_Venda'] ].groupby(['Segmento', 'Regiao']).mean()
out:

Valor_Venda
Segmento Regiao
Consumer Central 207.946728
East 238.875539
South 233.390180
West 217.033955
Corporate Central 234.763466
East 228.516929
South 238.992025
West 235.265911
Home Office Central 208.248046
East 253.911805
South 272.996329
West 239.442692

Ele nos retorna: Esse segmento, nas regiões, tem essa média POR REGIÃO!



Agregação Múltipla com Group By

Retornando: A média, o Desvio Padrão e a Contagem das linhas!

python
df3[ ['Segmento', 'Regiao', 'Valor_Venda'] ].groupby(['Segmento', 'Regiao']).agg(
    Média=('Valor_Venda', 'mean'),
    Desvio_Padrão=('Valor_Venda', 'std'),
    Contagem=('Valor_Venda', 'count'))
out:

Média Desvio_Padrão Contagem
Segmento Regiao
Consumer Central 207.946728 587.906523 1212
East 238.875539 633.371169 1469
South 233.390180 559.346824 838
West 217.033955 551.997547 1672
Corporate Central 234.763466 818.947521 673
East 228.516929 530.001654 877
South 238.992025 586.176947 510
West 235.265911 471.288764 960
Home Office Central 208.248046 371.009180 438
East 253.911805 722.777318 502
South 272.996329 1404.798466 272
West 239.442692 529.242737 571