日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

python?pandas?數據排序的幾種常用方法_python

作者:soulsoul_god ? 更新時間: 2022-11-06 編程語言

前言:

pandas中排序的幾種常用方法,主要包括sort_index和sort_values。

基礎數據:

import pandas as pd
import numpy as np
data = {
    'brand':['Python', 'C', 'C++', 'C#', 'Java'],
    'B':[4,6,8,12,10],
    'A':[10,2,5,20,16],
    'D':[6,18,14,6,12],
    'years':[4,1,1,30,30],
    'C':[8,12,18,8,2]
}
index = [9,3,4,5,2]
df = pd.DataFrame(data=data, index = index)
print("df數據:\n", df, '\n')

out:

df數據:
? ? ?A ? B ? C ? D ? brand ?years
9 ?10 ? 4 ? 8 ? 6 ?Python ? ? ?4
3 ? 2 ? 6 ?12 ?18 ? ? ? C ? ? ?1
4 ? 5 ? 8 ?18 ?14 ? ? C++ ? ? ?1
5 ?20 ?12 ? 8 ? 6 ? ? ?C# ? ? 30
2 ?16 ?10 ? 2 ?12 ? ?Java ? ? 30?

按行索引排序:

print("按行索引排序:\n", df.sort_index(), '\n')

out:

按行索引排序:
? ? ?A ? B ? C ? D ? brand ?years
2 ?16 ?10 ? 2 ?12 ? ?Java ? ? 30
3 ? 2 ? 6 ?12 ?18 ? ? ? C ? ? ?1
4 ? 5 ? 8 ?18 ?14 ? ? C++ ? ? ?1
5 ?20 ?12 ? 8 ? 6 ? ? ?C# ? ? 30
9 ?10 ? 4 ? 8 ? 6 ?Python ? ? ?4

通過設置參數ascending可以設置升序或者降序排序,默認情況下ascending=True,為升序排序。

設置ascending=False時,為降序排序。

print("按行索引降序排序:\n", df.sort_index(ascending=False), '\n')

out:

按行索引降序排序:
? ? ?A ? B ? C ? D ? brand ?years
9 ?10 ? 4 ? 8 ? 6 ?Python ? ? ?4
5 ?20 ?12 ? 8 ? 6 ? ? ?C# ? ? 30
4 ? 5 ? 8 ?18 ?14 ? ? C++ ? ? ?1
3 ? 2 ? 6 ?12 ?18 ? ? ? C ? ? ?1
2 ?16 ?10 ? 2 ?12 ? ?Java ? ? 30

按列的名稱排序:

設置參數axis=1實現按列的名稱排序:

print("按列名稱排序:\n", df.sort_index(axis=1), '\n')

out:

按列名稱排序:
? ? ?A ? B ? C ? D ? brand ?years
9 ?10 ? 4 ? 8 ? 6 ?Python ? ? ?4
3 ? 2 ? 6 ?12 ?18 ? ? ? C ? ? ?1
4 ? 5 ? 8 ?18 ?14 ? ? C++ ? ? ?1
5 ?20 ?12 ? 8 ? 6 ? ? ?C# ? ? 30
2 ?16 ?10 ? 2 ?12 ? ?Java ? ? 30

同樣,也可以設置ascending參數:

print("按列名稱排序:\n", df.sort_index(axis=1, ascending=False), '\n')

out:

按列名稱排序:
? ? years ? brand ? D ? C ? B ? A
9 ? ? ?4 ?Python ? 6 ? 8 ? 4 ?10
3 ? ? ?1 ? ? ? C ?18 ?12 ? 6 ? 2
4 ? ? ?1 ? ? C++ ?14 ?18 ? 8 ? 5
5 ? ? 30 ? ? ?C# ? 6 ? 8 ?12 ?20
2 ? ? 30 ? ?Java ?12 ? 2 ?10 ?16

按數值排序:

sort_values()是pandas中按數值排序的函數:

1、按單個列的值排序

sort_values()中設置單個列的列名,可以對單個列進行排序,通過設置ascending可以設置升序或者降序。

print("按列名稱A排序:\n", df.sort_values('A'), '\n')

out:

按列名稱排序:
? ? ?A ? B ? C ? D ? brand ?years
3 ? 2 ? 6 ?12 ?18 ? ? ? C ? ? ?1
4 ? 5 ? 8 ?18 ?14 ? ? C++ ? ? ?1
9 ?10 ? 4 ? 8 ? 6 ?Python ? ? ?4
2 ?16 ?10 ? 2 ?12 ? ?Java ? ? 30
5 ?20 ?12 ? 8 ? 6 ? ? ?C# ? ? 30

設置ascending=False進行降序排序:

print("按列名稱A降序排序:\n", df.sort_values('A', ascending=False), '\n')

out:

按列名稱A降序排序:
? ? ?A ? B ? C ? D ? brand ?years
5 ?20 ?12 ? 8 ? 6 ? ? ?C# ? ? 30
2 ?16 ?10 ? 2 ?12 ? ?Java ? ? 30
9 ?10 ? 4 ? 8 ? 6 ?Python ? ? ?4
4 ? 5 ? 8 ?18 ?14 ? ? C++ ? ? ?1
3 ? 2 ? 6 ?12 ?18 ? ? ? C ? ? ?1

按多個列的值排序:

先按year列的數據進行升序排序,year列相同的再看B列進行升序排序

print("按多個列排序:\n", df.sort_values(['years', 'B']), '\n')

out:

按多個列排序:
? ? ?A ? B ? C ? D ? brand ?years
3 ? 2 ? 6 ?12 ?18 ? ? ? C ? ? ?1
4 ? 5 ? 8 ?18 ?14 ? ? C++ ? ? ?1
9 ?10 ? 4 ? 8 ? 6 ?Python ? ? ?4
2 ?16 ?10 ? 2 ?12 ? ?Java ? ? 30
5 ?20 ?12 ? 8 ? 6 ? ? ?C# ? ? 30?

也可以分別設置列的升序、降序來排序:

years列為升序,B列為降序。

print("按多個列排序:\n", df.sort_values(['years', 'B'], ascending=[True, False]), '\n')

out:

按多個列排序:
? ? ?A ? B ? C ? D ? brand ?years
4 ? 5 ? 8 ?18 ?14 ? ? C++ ? ? ?1
3 ? 2 ? 6 ?12 ?18 ? ? ? C ? ? ?1
9 ?10 ? 4 ? 8 ? 6 ?Python ? ? ?4
5 ?20 ?12 ? 8 ? 6 ? ? ?C# ? ? 30
2 ?16 ?10 ? 2 ?12 ? ?Java ? ? 30

inplace使用:

inplace=True:不創建新的對象,直接對原始對象進行修改;默認是False,即創建新的對象進行修改,原對象不變,和深復制和淺復制有些類似。

df.sort_values('A', inplace=True)
print("按A列排序:\n", df, '\n')

out:

按A列排序:
? ? ?A ? B ? C ? D ? brand ?years
3 ? 2 ? 6 ?12 ?18 ? ? ? C ? ? ?1
4 ? 5 ? 8 ?18 ?14 ? ? C++ ? ? ?1
9 ?10 ? 4 ? 8 ? 6 ?Python ? ? ?4
2 ?16 ?10 ? 2 ?12 ? ?Java ? ? 30
5 ?20 ?12 ? 8 ? 6 ? ? ?C# ? ? 30

缺失值:

含有nan值的數據排序:

data = {
    'brand':['Python', 'C', 'C++', 'C#', 'Java'],
    'B':[4,6,8,np.nan,10],
    'A':[10,2,5,20,16],
    'D':[6,18,14,6,12],
    'years':[4,1,1,30,30],
    'C':[8,12,18,8,2]
}
index = [9,3,4,5,2]
df = pd.DataFrame(data=data, index = index)
print("df數據:\n", df, '\n')

out:

df數據:
? ? ?A ? ? B ? C ? D ? brand ?years
9 ?10 ? 4.0 ? 8 ? 6 ?Python ? ? ?4
3 ? 2 ? 6.0 ?12 ?18 ? ? ? C ? ? ?1
4 ? 5 ? 8.0 ?18 ?14 ? ? C++ ? ? ?1
5 ?20 ? NaN ? 8 ? 6 ? ? ?C# ? ? 30
2 ?16 ?10.0 ? 2 ?12 ? ?Java ? ? 30

B列含有nan值,對B列進行排序,缺失值排在最前面:

print("按B列排序:\n", df.sort_values('B', na_position='first'), '\n')

按B列排序:
? ? ?A ? ? B ? C ? D ? brand ?years
5 ?20 ? NaN ? 8 ? 6 ? ? ?C# ? ? 30
9 ?10 ? 4.0 ? 8 ? 6 ?Python ? ? ?4
3 ? 2 ? 6.0 ?12 ?18 ? ? ? C ? ? ?1
4 ? 5 ? 8.0 ?18 ?14 ? ? C++ ? ? ?1
2 ?16 ?10.0 ? 2 ?12 ? ?Java ? ? 30

包含缺失值,缺失值排在最后:

print("按B列排序:\n", df.sort_values('B', na_position='last'), '\n')

out:

按B列排序:
? ? ?A ? ? B ? C ? D ? brand ?years
9 ?10 ? 4.0 ? 8 ? 6 ?Python ? ? ?4
3 ? 2 ? 6.0 ?12 ?18 ? ? ? C ? ? ?1
4 ? 5 ? 8.0 ?18 ?14 ? ? C++ ? ? ?1
2 ?16 ?10.0 ? 2 ?12 ? ?Java ? ? 30
5 ?20 ? NaN ? 8 ? 6 ? ? ?C# ? ? 30

原文鏈接:https://blog.csdn.net/xiadeliang1111/article/details/126831607

欄目分類
最近更新