網站首頁 編程語言 正文
1、pivot函數的定義
pivot(index=None,columns=None,values=None) -> DataFrame
2、pivot函數的說明
通過給定的索引(index)和列(column)的值重新生一個DataFrame對象。
根據列值對數據進行整形(生成一個“透視”表)。從指定的索引/列中使用唯一的值來形成結果數據幀的軸。此函數不支持數據聚合,多個值將導致列中的多索引。
3、pivo函數的參數
index:指定一列做為生成DataFrame對象的索引,如果為空則默認為原來的索引。
columns:指定一列的值作為列名,必須傳值。
values:指定一列作為生成DataFrame對象的值。可以為空。
4、pivot函數實例
df = pd.DataFrame({'foo': ['one', 'one', 'one', 'two', 'two', 'two'],
'bar': ['A', 'B', 'C', 'A', 'B', 'C'],
'baz': [1, 2, 3, 4, 5, 6],
'zoo': ['x', 'y', 'z', 'q', 'w', 't']})
# 指定foo的值為新dataframe的index,bar的值為columns,dataframe中對應的值為baz
df.pivot(index='foo', columns='bar', values='baz')
# 沒有指定value,列名最外層保留原來的列,如下結果baz和zoo為原dataframe中的列名,新指定的列名bar在里層(暫時這么理解)。
df.pivot(index='foo', columns='bar')
# 可以通過索引的方式取指定的列數據
df.pivot(index='foo', columns='bar')['baz']
# 可以指定多個values
df.pivot(index='foo', columns='bar', values=['baz', 'zoo'])
# 指定多個columns
df.pivot(index='foo', columns=['bar','baz'], values=['zoo'])
# 指定多個index
df.pivot(index=['foo','bar'], columns='baz', values='zoo')
# 指定多個index可以通過index名取當個index的數據
df.pivot(index=['foo','bar'], columns='baz', values='zoo').loc["one",:]
# 這兩行代碼運行將會報錯。
# 報錯提示:ValueError: Index contains duplicate entries, cannot reshape
# 意思是指定的索引one有兩個列bar=A沖突了。
df = pd.DataFrame({"foo": ['one', 'one', 'two', 'two'],
"bar": ['A', 'A', 'B', 'C'],
"baz": [1, 2, 3, 4]})
df.pivot(index='foo', columns='bar', values='baz')
5、pivot函數在實際工作中解決的案例
現在要上圖中的不同code之間從2020-11-16到2020-11-18三天內num序列數的相關性。
首先,dataframe對象可以直接調用函數corr()計算不同列之間的相關性,所以現在需要將原始的dataframe對象轉換成以code為列,date為索引,num為值的dataframe。
第一種比較笨的方法就是循環,此方法不但代碼量較多而且在數據量很大時會比較耗時。不建議使用。
grouped = df.groupby(by=["code"])
df_num = pd.DataFrame()
for name,group in grouped:
d = pd.Series(data=group["num"].values,name=name)
df_num = pd.concat([df_num,d],axis=1)
df_close
第二種方法就是使用pivot函數,一行代碼解決,運行快速。
df_num = df.pivot(index='date',columns='code',values='num')
想要的形式的dataframe生成了就可以直接調用corr()函數直接求出code之間的相關性了
# 計算列之間的相關性
df_num.corr()
總結
原文鏈接:https://blog.csdn.net/superY_26/article/details/112689493
相關推薦
- 2022-11-01 PyTorch實現MNIST數據集手寫數字識別詳情_python
- 2022-09-30 react中useState使用:如何實現在當前表格直接更改數據_React
- 2022-07-18 anaconda常用命令的整理
- 2022-07-18 CSS浮動定位與背景樣式
- 2023-02-12 redis加鎖的三種方式小結_Redis
- 2022-08-15 ArrayList和LinkedList和Vector的區別
- 2022-10-03 Python中不同圖表的數據可視化的實現_python
- 2022-06-22 深入淺析C/C++?的條件編譯_C 語言
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支