網站首頁編程語言正文

python?pandas?數據排序的幾種常用方法_python

作者：soulsoul_god ? 更新時間： 2022-11-06 編程語言

前言：

pandas中排序的幾種常用方法，主要包括sort_index和sort_values。

基礎數據：

import pandas as pd
import numpy as np
data = {
    'brand':['Python', 'C', 'C++', 'C#', 'Java'],
    'B':[4,6,8,12,10],
    'A':[10,2,5,20,16],
    'D':[6,18,14,6,12],
    'years':[4,1,1,30,30],
    'C':[8,12,18,8,2]
}
index = [9,3,4,5,2]
df = pd.DataFrame(data=data, index = index)
print("df數據：\n", df, '\n')

out：

df數據：
? ? ?A ? B ? C ? D ? brand ?years
9 ?10 ? 4 ? 8 ? 6 ?Python ? ? ?4
3 ? 2 ? 6 ?12 ?18 ? ? ? C ? ? ?1
4 ? 5 ? 8 ?18 ?14 ? ? C++ ? ? ?1
5 ?20 ?12 ? 8 ? 6 ? ? ?C# ? ? 30
2 ?16 ?10 ? 2 ?12 ? ?Java ? ? 30?

按行索引排序：

print("按行索引排序:\n", df.sort_index(), '\n')

out：

按行索引排序:
? ? ?A ? B ? C ? D ? brand ?years
2 ?16 ?10 ? 2 ?12 ? ?Java ? ? 30
3 ? 2 ? 6 ?12 ?18 ? ? ? C ? ? ?1
4 ? 5 ? 8 ?18 ?14 ? ? C++ ? ? ?1
5 ?20 ?12 ? 8 ? 6 ? ? ?C# ? ? 30
9 ?10 ? 4 ? 8 ? 6 ?Python ? ? ?4

通過設置參數ascending可以設置升序或者降序排序，默認情況下ascending=True，為升序排序。

設置ascending=False時，為降序排序。

print("按行索引降序排序:\n", df.sort_index(ascending=False), '\n')

out:

按行索引降序排序:
? ? ?A ? B ? C ? D ? brand ?years
9 ?10 ? 4 ? 8 ? 6 ?Python ? ? ?4
5 ?20 ?12 ? 8 ? 6 ? ? ?C# ? ? 30
4 ? 5 ? 8 ?18 ?14 ? ? C++ ? ? ?1
3 ? 2 ? 6 ?12 ?18 ? ? ? C ? ? ?1
2 ?16 ?10 ? 2 ?12 ? ?Java ? ? 30

按列的名稱排序：

設置參數axis=1實現按列的名稱排序：

print("按列名稱排序:\n", df.sort_index(axis=1), '\n')

out：

按列名稱排序:
? ? ?A ? B ? C ? D ? brand ?years
9 ?10 ? 4 ? 8 ? 6 ?Python ? ? ?4
3 ? 2 ? 6 ?12 ?18 ? ? ? C ? ? ?1
4 ? 5 ? 8 ?18 ?14 ? ? C++ ? ? ?1
5 ?20 ?12 ? 8 ? 6 ? ? ?C# ? ? 30
2 ?16 ?10 ? 2 ?12 ? ?Java ? ? 30

同樣，也可以設置ascending參數：

print("按列名稱排序:\n", df.sort_index(axis=1, ascending=False), '\n')

out：

按列名稱排序:
? ? years ? brand ? D ? C ? B ? A
9 ? ? ?4 ?Python ? 6 ? 8 ? 4 ?10
3 ? ? ?1 ? ? ? C ?18 ?12 ? 6 ? 2
4 ? ? ?1 ? ? C++ ?14 ?18 ? 8 ? 5
5 ? ? 30 ? ? ?C# ? 6 ? 8 ?12 ?20
2 ? ? 30 ? ?Java ?12 ? 2 ?10 ?16

按數值排序：

sort_values()是pandas中按數值排序的函數：

1、按單個列的值排序

sort_values()中設置單個列的列名，可以對單個列進行排序，通過設置ascending可以設置升序或者降序。

print("按列名稱A排序:\n", df.sort_values('A'), '\n')

out：

按列名稱排序:
? ? ?A ? B ? C ? D ? brand ?years
3 ? 2 ? 6 ?12 ?18 ? ? ? C ? ? ?1
4 ? 5 ? 8 ?18 ?14 ? ? C++ ? ? ?1
9 ?10 ? 4 ? 8 ? 6 ?Python ? ? ?4
2 ?16 ?10 ? 2 ?12 ? ?Java ? ? 30
5 ?20 ?12 ? 8 ? 6 ? ? ?C# ? ? 30

設置ascending=False進行降序排序：

print("按列名稱A降序排序:\n", df.sort_values('A', ascending=False), '\n')

out：

按列名稱A降序排序:
? ? ?A ? B ? C ? D ? brand ?years
5 ?20 ?12 ? 8 ? 6 ? ? ?C# ? ? 30
2 ?16 ?10 ? 2 ?12 ? ?Java ? ? 30
9 ?10 ? 4 ? 8 ? 6 ?Python ? ? ?4
4 ? 5 ? 8 ?18 ?14 ? ? C++ ? ? ?1
3 ? 2 ? 6 ?12 ?18 ? ? ? C ? ? ?1

按多個列的值排序：

先按year列的數據進行升序排序，year列相同的再看B列進行升序排序

print("按多個列排序:\n", df.sort_values(['years', 'B']), '\n')

out：

按多個列排序:
? ? ?A ? B ? C ? D ? brand ?years
3 ? 2 ? 6 ?12 ?18 ? ? ? C ? ? ?1
4 ? 5 ? 8 ?18 ?14 ? ? C++ ? ? ?1
9 ?10 ? 4 ? 8 ? 6 ?Python ? ? ?4
2 ?16 ?10 ? 2 ?12 ? ?Java ? ? 30
5 ?20 ?12 ? 8 ? 6 ? ? ?C# ? ? 30?

也可以分別設置列的升序、降序來排序：

years列為升序，B列為降序。

print("按多個列排序:\n", df.sort_values(['years', 'B'], ascending=[True, False]), '\n')

out：

按多個列排序:
? ? ?A ? B ? C ? D ? brand ?years
4 ? 5 ? 8 ?18 ?14 ? ? C++ ? ? ?1
3 ? 2 ? 6 ?12 ?18 ? ? ? C ? ? ?1
9 ?10 ? 4 ? 8 ? 6 ?Python ? ? ?4
5 ?20 ?12 ? 8 ? 6 ? ? ?C# ? ? 30
2 ?16 ?10 ? 2 ?12 ? ?Java ? ? 30

inplace使用：

inplace=True：不創建新的對象，直接對原始對象進行修改；默認是False，即創建新的對象進行修改，原對象不變，和深復制和淺復制有些類似。

df.sort_values('A', inplace=True)
print("按A列排序:\n", df, '\n')

out:

按A列排序:
? ? ?A ? B ? C ? D ? brand ?years
3 ? 2 ? 6 ?12 ?18 ? ? ? C ? ? ?1
4 ? 5 ? 8 ?18 ?14 ? ? C++ ? ? ?1
9 ?10 ? 4 ? 8 ? 6 ?Python ? ? ?4
2 ?16 ?10 ? 2 ?12 ? ?Java ? ? 30
5 ?20 ?12 ? 8 ? 6 ? ? ?C# ? ? 30

缺失值：

含有nan值的數據排序：

data = {
    'brand':['Python', 'C', 'C++', 'C#', 'Java'],
    'B':[4,6,8,np.nan,10],
    'A':[10,2,5,20,16],
    'D':[6,18,14,6,12],
    'years':[4,1,1,30,30],
    'C':[8,12,18,8,2]
}
index = [9,3,4,5,2]
df = pd.DataFrame(data=data, index = index)
print("df數據：\n", df, '\n')

out:

df數據：
? ? ?A ? ? B ? C ? D ? brand ?years
9 ?10 ? 4.0 ? 8 ? 6 ?Python ? ? ?4
3 ? 2 ? 6.0 ?12 ?18 ? ? ? C ? ? ?1
4 ? 5 ? 8.0 ?18 ?14 ? ? C++ ? ? ?1
5 ?20 ? NaN ? 8 ? 6 ? ? ?C# ? ? 30
2 ?16 ?10.0 ? 2 ?12 ? ?Java ? ? 30

B列含有nan值，對B列進行排序，缺失值排在最前面：

print("按B列排序:\n", df.sort_values('B', na_position='first'), '\n')

按B列排序:
? ? ?A ? ? B ? C ? D ? brand ?years
5 ?20 ? NaN ? 8 ? 6 ? ? ?C# ? ? 30
9 ?10 ? 4.0 ? 8 ? 6 ?Python ? ? ?4
3 ? 2 ? 6.0 ?12 ?18 ? ? ? C ? ? ?1
4 ? 5 ? 8.0 ?18 ?14 ? ? C++ ? ? ?1
2 ?16 ?10.0 ? 2 ?12 ? ?Java ? ? 30

包含缺失值，缺失值排在最后：

print("按B列排序:\n", df.sort_values('B', na_position='last'), '\n')

out：

按B列排序:
? ? ?A ? ? B ? C ? D ? brand ?years
9 ?10 ? 4.0 ? 8 ? 6 ?Python ? ? ?4
3 ? 2 ? 6.0 ?12 ?18 ? ? ? C ? ? ?1
4 ? 5 ? 8.0 ?18 ?14 ? ? C++ ? ? ?1
2 ?16 ?10.0 ? 2 ?12 ? ?Java ? ? 30
5 ?20 ? NaN ? 8 ? 6 ? ? ?C# ? ? 30

原文鏈接：https://blog.csdn.net/xiadeliang1111/article/details/126831607

上一篇：Git?Commitizen提交規范化自動生成changel
下一篇：pandas?dataframe?drop函數介紹_pyth

日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

網站首頁編程語言正文

python?pandas?數據排序的幾種常用方法_python

相關推薦

日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

網站首頁 編程語言 正文

python?pandas?數據排序的幾種常用方法_python

相關推薦

網站首頁編程語言正文