Skip to content

Slipt de Strings

Split de Strings em DFs

Filtrando uma coluna específica do DF

python
df3['ID_Pedido'].head()
out:
    0    CA-2016-152156
    1    CA-2016-152156
    2    CA-2016-138688
    3    US-2015-108966
    4    US-2015-108966
    Name: ID_Pedido, dtype: object
Essa coluna de Id, nos retorna: o País, o ano e o ID do pedido, vamos extrair esses dados e gravar em uma nova coluna!



Separando os dados dos ID com base no '-'

python
df3['ID_Pedido'].str.split('-')
out:
    0       [CA, 2016, 152156]
    1       [CA, 2016, 152156]
    2       [CA, 2016, 138688]
    3       [US, 2015, 108966]
    4       [US, 2015, 108966]
                   ...        
    9989    [CA, 2014, 110422]
    9990    [CA, 2017, 121258]
    9991    [CA, 2017, 121258]
    9992    [CA, 2017, 121258]
    9993    [CA, 2017, 119914]
    Name: ID_Pedido, Length: 9994, dtype: object
Ele está nos retornando uma lista em cada ID



O Split ele divide os valores e nos retorna eles em uma lista por cada ID separadamente



Separando os dados, porém, retornando apenas o valor de índice 1, ou seja, o ano

python
df3['ID_Pedido'].str.split('-').str[1].head
out:
    <bound method NDFrame.head of 0       2016
    1       2016
    2       2016
    3       2015
    4       2015
            ... 
    9989    2014
    9990    2017
    9991    2017
    9992    2017
    9993    2017
    Name: ID_Pedido, Length: 9994, dtype: object>


Agora, estamos fazendo o split, separando os valores e armazenando em uma coluna específica

python
df3['Ano'] = df3['ID_Pedido'].str.split('-').str[1]

Visualizando as alterações!

python
df3.head()
out:

ID_Pedido Data_Pedido ID_Cliente Segmento Pais Regiao ID_Produto Categoria Nome_Produto Valor_Venda Quantidade Ano
0 CA-2016-152156 2016-11-08 CG-12520 Consumer United States South FUR-BO-10001798 Furniture Bush Somerset Collection Bookcase 261.9600 3.0 2016
1 CA-2016-152156 2016-11-08 CG-12520 Consumer United States South FUR-CH-10000454 Furniture Hon Deluxe Fabric Upholstered Stacking Chairs,... 731.9400 3.0 2016
2 CA-2016-138688 2016-06-12 DV-13045 Corporate United States West OFF-LA-10000240 Office Supplies Self-Adhesive Address Labels for Typewriters b... 14.6200 2.0 2016
3 US-2015-108966 2015-10-11 SO-20335 Consumer United States South FUR-TA-10000577 Furniture Bretford CR4500 Series Slim Rectangular Table 957.5775 5.0 2015
4 US-2015-108966 2015-10-11 SO-20335 Consumer United States South OFF-ST-10000760 Office Supplies Eldon Fold 'N Roll Cart System 22.3680 2.0 2015