Como converter o índice de um Pandas Dataframe em uma coluna
-
df.index
para Adicionar Índice como uma Nova Coluna -
com
reset_index
comrename_axis
para renomear o nome da coluna atual do índice -
set_index
Método para Converter Coluna em Índice -
MultiIndex
para definir múltiplas camadas deindexes
nacolumn
Introduziremos vários métodos para converter o index
de um Pandas dataframe
em uma coluna, como df.index
, set_index
, e reset_index
com rename_axis
para renomear o index
.
Também apresentaremos como podemos aplicar Multi-Index
a um determinado Dataframe
com múltiplas camadas de índices.
df.index
para Adicionar Índice como uma Nova Coluna
A maneira mais simples de adicionar índice como a coluna é adicionando df.index
como uma nova coluna ao dataframe
.
Códigos de exemplo:
# python 3.x
import pandas as pd
df = pd.DataFrame([
(1,2,None),
(None,4,None),
(5,None,7),
(5,None,None)
],columns=['a','b','d'])
df['index'] = df.index
print(df)
Resultado:
a b d index1
0 1.0 2.0 NaN 0
1 NaN 4.0 NaN 1
2 5.0 NaN 7.0 2
3 5.0 NaN NaN 3
com reset_index
com rename_axis
para renomear o nome da coluna atual do índice
Podemos mudar o nome de nosso index
, depois utilizar reset_index
para uma série:
# python 3.x
import pandas as pd
df = pd.DataFrame([
(1,2,None),
(None,4,None),
(5,None,7),
(5,None,None)],
columns=['a','b','d'])
df = df.rename_axis('index').reset_index()
print(df)
Resultado:
index a b d
0 0 1.0 2.0 NaN
1 1 NaN 4.0 NaN
2 2 5.0 NaN 7.0
3 3 5.0 NaN NaN
set_index
Método para Converter Coluna em Índice
Podemos converter qualquer coluna em index
utilizando o método set_index
:
# python 3.x
import pandas as pd
df = pd.DataFrame([
(1,2,None),
(None,4,None),
(5,4,7),
(5,5,None)],
columns=['a','b','d'])
df.set_index('b',inplace=True)
print(df)
Resultado:
a d
b
2 1.0 NaN
4 NaN NaN
4 5.0 7.0
5 5.0 NaN
Ou se quisermos remover o nome index
, como no original, podemos fazer df.index.name = None
:
# python 3.x
import pandas as pd
df = pd.DataFrame([
(1,2,None),
(None,4,None),
(5,4,7),
(5,5,None)
],columns=['a','b','d'])
df.set_index('b',inplace=True)
df.index.name = None
print(df)
Resultado:
a d
2 1.0 NaN
4 NaN NaN
4 5.0 7.0
5 5.0 NaN
MultiIndex
para definir múltiplas camadas de indexes
na column
Podemos utilizar a função MultiIndex.from_product()
para fazer um MultiIndex como se segue:
# python 3.x
import pandas as pd
import numpy as np
index = pd.MultiIndex.from_product([
['Burger', 'Steak', 'Sandwich'],
['Half', 'Full']],
names=['Item', 'Type'])
df = pd.DataFrame(index=index,
data=np.random.randint
(0, 10, (6,4)),
columns=list('abcd'))
print(df)
Resultado:
a b c d
Item Type
Burger Half 0 3 9 1
Full 2 2 0 5
Steak Half 8 4 5 5
Full 5 8 0 7
Sandwich Half 2 8 9 5
Full 4 4 5 9