如何按一列的值对 Pandas DataFrame 进行排序

  1. Dataframe 排序顺序-参数 Ascending
  2. Dataframe 排序顺序 - 参数 na_position

我们将介绍 pandas.DataFrame.sort_values 方法来对 Dataframe 值进行排序,以及类似 ascending 选项来指定排序顺序,以及 na_position 来确定 NaN 在排序结果中的位置。

考虑下面的 DataFrame

import pandas as pd
df = pd.DataFrame({
    'col1': ['g', 't', 'n', 'w', 'n', 'g'],
    'col2': [5, 2, 5, 1, 3, 6],
    'col3': [0, 7, 2, 8,1, 2],
})
print(df)

如果运行此代码,你将得到以下尚未排序的输出。

    col1  col2  col3
0    g     5     0
1    t     2     7
2    n     5     2
3    w     1     8
4    n     3     1
5    g     6     2

现在我们可以使用以下代码对 dataframe 进行排序。

import pandas as pd
df = pd.DataFrame({
    'col1': ['g', 't', 'n', 'w', 'n', 'g'],
    'col2': [5, 2, 5, 1, 3, 6],
    'col3': [0, 7, 2, 8,1, 2],
})
print(df.sort_values(by=['col1']))

我们按 col1dataframe 进行了排序。运行上面的代码后,你将获得以下输出。

    col1  col2  col3
0    g     5     0
5    g     6     2
2    n     5     2
4    n     3     1
1    t     2     7
3    w     1     8

我们也可以使用多个列进行排序,让我们如下更改上述代码的最后一行,

print(df.sort_values(by=['col1','col2']))

运行代码后,我们将获得以下输出。

    col1  col2  col3
0    g     5     0
5    g     6     2
4    n     3     1
2    n     5     2
1    t     2     7
3    w     1     8

现在,dataframe 也通过 col2 进一步排序。

Dataframe 排序顺序-参数 Ascending

默认情况下,排序按升序排列,要按降序更改 Dataframe,我们需要设置标志 ascending = false

print(df.sort_values(by=['col1','col2'], ascending=False))

运行代码后,我们将获得以下输出。

    col1  col2  col3
3    w     1     8
1    t     2     7
2    n     5     2
4    n     3     1
5    g     6     2
0    g     5     0

Dataframe 排序顺序 - 参数 na_position

na_position 在排序后指定 NaN 的位置.lastNaN 放在排序的最后,它的默认值是 first,将 NaN 放在排序结果的开头。

考虑下面的 DataFrame

import numpy as np
import pandas as pd
s = pd.Series([np.nan, 2, 4, 10, 7])
print(s.sort_values(na_position='last'))

运行代码后,我们将获得以下输出。

1 2.0
2 4.0
4 7.0
3 10.0
0 NaN

相关文章 - Pandas DataFrame

  • 如何将 Pandas DataFrame 的索引转换为列
  • 如何在 Pandas DataFrame 中添加一行
  • comments powered by Disqus