Slipt de Strings
Split de Strings em DFs
Filtrando uma coluna específica do DF
python
df3['ID_Pedido'].head()
out:
Essa coluna de Id, nos retorna: o País, o ano e o ID do pedido, vamos extrair esses dados e gravar em uma nova coluna!
0 CA-2016-152156
1 CA-2016-152156
2 CA-2016-138688
3 US-2015-108966
4 US-2015-108966
Name: ID_Pedido, dtype: object
Separando os dados dos ID com base no '-'
python
df3['ID_Pedido'].str.split('-')
out:
Ele está nos retornando uma lista em cada ID
0 [CA, 2016, 152156]
1 [CA, 2016, 152156]
2 [CA, 2016, 138688]
3 [US, 2015, 108966]
4 [US, 2015, 108966]
...
9989 [CA, 2014, 110422]
9990 [CA, 2017, 121258]
9991 [CA, 2017, 121258]
9992 [CA, 2017, 121258]
9993 [CA, 2017, 119914]
Name: ID_Pedido, Length: 9994, dtype: object
O Split ele divide os valores e nos retorna eles em uma lista por cada ID separadamente
Separando os dados, porém, retornando apenas o valor de índice 1, ou seja, o ano
python
df3['ID_Pedido'].str.split('-').str[1].head
out:
<bound method NDFrame.head of 0 2016
1 2016
2 2016
3 2015
4 2015
...
9989 2014
9990 2017
9991 2017
9992 2017
9993 2017
Name: ID_Pedido, Length: 9994, dtype: object>
Agora, estamos fazendo o split, separando os valores e armazenando em uma coluna específica
python
df3['Ano'] = df3['ID_Pedido'].str.split('-').str[1]
Visualizando as alterações!
python
out:
df3.head()
| ID_Pedido | Data_Pedido | ID_Cliente | Segmento | Pais | Regiao | ID_Produto | Categoria | Nome_Produto | Valor_Venda | Quantidade | Ano | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | CA-2016-152156 | 2016-11-08 | CG-12520 | Consumer | United States | South | FUR-BO-10001798 | Furniture | Bush Somerset Collection Bookcase | 261.9600 | 3.0 | 2016 |
| 1 | CA-2016-152156 | 2016-11-08 | CG-12520 | Consumer | United States | South | FUR-CH-10000454 | Furniture | Hon Deluxe Fabric Upholstered Stacking Chairs,... | 731.9400 | 3.0 | 2016 |
| 2 | CA-2016-138688 | 2016-06-12 | DV-13045 | Corporate | United States | West | OFF-LA-10000240 | Office Supplies | Self-Adhesive Address Labels for Typewriters b... | 14.6200 | 2.0 | 2016 |
| 3 | US-2015-108966 | 2015-10-11 | SO-20335 | Consumer | United States | South | FUR-TA-10000577 | Furniture | Bretford CR4500 Series Slim Rectangular Table | 957.5775 | 5.0 | 2015 |
| 4 | US-2015-108966 | 2015-10-11 | SO-20335 | Consumer | United States | South | OFF-ST-10000760 | Office Supplies | Eldon Fold 'N Roll Cart System | 22.3680 | 2.0 | 2015 |