網站首頁 編程語言 正文
一行拆分成多行
1.根據某一列拆分
效果:
代碼:
if __name__ == '__main__':
import pandas as pd
df = pd.DataFrame({'Country': ['China,US', 'Japan,EU', 'UK,Australia', 'Singapore,Netherland'],
'Number': [100, 150, 120, 90],
'Value': [1, 2, 3, 4],
'label': list('abcd')})
df_split_row = df.drop('Country', axis=1).join(
df['Country'].str.split(',', expand=True).stack().reset_index(level=1, drop=True).rename('Country'))
2.根據多列拆分
效果:
代碼:
if __name__ == '__main__':
import pandas as pd
df = pd.DataFrame({'Code': ['212027'],
'Color': ['blue, pink, yellow'],
'Size': ['12-18M, 2-3Y, 3-4Y']})
split_columns = ['Color', 'Size']
df_convert = df.drop(columns=split_columns, axis=1)
for column in split_columns:
df_convert = df_convert.join(
df[column].str.split(',', expand=True).stack().reset_index(level=1, drop=True).rename(column))
df_convert = df_convert.reset_index(drop=True)
一行轉多行、多行轉一行
1.測試數據
df = pd.DataFrame([['張世龍', '籃球、羽毛球、英雄聯盟'],
['黃邵飛', '兵乓球、足球、下棋'],
['劉苗苗', '繪畫、寫小說、跑步']])
df.columns = ['姓名','愛好']
2.一行轉多行
方法一:
# 1、把渠道字段拆分,分為多列; 2、把行轉列成列;3、重置索引,并刪除多于的索引;4、更改名稱
df_ = df['愛好'].str.split('、',expand=True).stack().reset_index(level=1,drop=True).rename('愛好')
df1 = df.drop(['愛好'], axis=1).join(df_)
方發二:
# 1、將渠道字段拆分;2、調用explode()方法
df['愛好'] = df['愛好'].map(lambda x:x.split('、'))
df1 = df.explode('愛好')
3.多行轉一行
#定義拼接函數,并對字段進行去重
def concat_func(x):
return pd.Series({
'愛好':'、'.join(x['愛好'].unique())
})
#分組聚合 + 拼接
df2 = df1.groupby(df1['姓名']).apply(concat_func).reset_index()
原文鏈接:https://blog.csdn.net/baidu_30809315/article/details/93748732
相關推薦
- 2022-02-09 將?C++?類型屬性暴露給?QML_C 語言
- 2022-05-13 Centos error: cannot remove “core“: snap “core“ is
- 2022-08-04 django中使用memcached示例詳解_python
- 2022-05-02 winform關閉窗體FormClosing事件用法介紹_C#教程
- 2022-08-19 insert語句返回新增主鍵id失敗的解決方法
- 2022-08-21 利用Python創建第一個Django框架程序_python
- 2022-09-21 Flutter自定義底部導航欄的方法_Android
- 2023-01-18 python中的參數類型匹配提醒_python
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支