網站首頁 編程語言 正文
pandas 將字符串映射為數字
在有些數據集中,有些數據變量用字符串表示,但為了方便處理,往往想轉換為好處理的格式,這時候不一定要用one hot進行編碼,也可以直接轉成整數:
test_df["xx"] = pd.factorize(test_df["xx"])[0].astype(int)
但是這樣映射的數字是從0開始的,如果有初始要求,可以對映射結果加上某個值,例如,把從0開始變為從15開始:
test_df["xx"] = test_df["xx"].add(15)
效果gift_cards["user_id"] = pd.factorize(gift_cards["user_id"])[0].astype(int):
? ? ? ? ? ?user_id ? ? ? ? item_id ?ratings ? ? ? ?time
0 ? ? ? B001GXRQW0 ? APV13CM0919JD ? ? ?1.0 ?1229644800
1 ? ? ? B001GXRQW0 ?A3G8U1G1V082SN ? ? ?5.0 ?1229472000
2 ? ? ? B001GXRQW0 ? A11T2Q0EVTUWP ? ? ?5.0 ?1229472000
3 ? ? ? B001GXRQW0 ? A9YKGBH3SV22C ? ? ?5.0 ?1229472000
4 ? ? ? B001GXRQW0 ?A34WZIHVF3OKOL ? ? ?1.0 ?1229472000
... ? ? ? ? ? ?... ? ? ? ? ? ? ... ? ? ?... ? ? ? ? ...
147189 ?B01H5PPJT4 ?A2K9WVQW9TLWNK ? ? ?5.0 ?1536969600
147190 ?B01H5PPJT4 ?A149ALSR6TPGF7 ? ? ?4.0 ?1536278400
147191 ?B01H5PPJT4 ?A2Q066NZCQSCOR ? ? ?5.0 ?1535500800
147192 ?B01H5PPJT4 ?A1KJLWCW7XBS8I ? ? ?5.0 ?1534550400
147193 ?B01H5PPJT4 ? ANABUB0FRZXRM ? ? ?5.0 ?1534204800
? ? ? ? user_id ? ? ? ? item_id ?ratings ? ? ? ?time
0 ? ? ? ? ? ? 0 ? APV13CM0919JD ? ? ?1.0 ?1229644800
1 ? ? ? ? ? ? 0 ?A3G8U1G1V082SN ? ? ?5.0 ?1229472000
2 ? ? ? ? ? ? 0 ? A11T2Q0EVTUWP ? ? ?5.0 ?1229472000
3 ? ? ? ? ? ? 0 ? A9YKGBH3SV22C ? ? ?5.0 ?1229472000
4 ? ? ? ? ? ? 0 ?A34WZIHVF3OKOL ? ? ?1.0 ?1229472000
... ? ? ? ? ... ? ? ? ? ? ? ... ? ? ?... ? ? ? ? ...
147189 ? ? ?858 ?A2K9WVQW9TLWNK ? ? ?5.0 ?1536969600
147190 ? ? ?858 ?A149ALSR6TPGF7 ? ? ?4.0 ?1536278400
147191 ? ? ?858 ?A2Q066NZCQSCOR ? ? ?5.0 ?1535500800
147192 ? ? ?858 ?A1KJLWCW7XBS8I ? ? ?5.0 ?1534550400
147193 ? ? ?858 ? ANABUB0FRZXRM ? ? ?5.0 ?1534204800
pandas 將某一列的字符值轉換為數字
使用map的方法就可以實現把某一列的字符類型的值轉換為數字。
class_mapping = {'A':0, 'B':1}
data[class] = data[class].map(class_mapping)
首先定義一個字典,然后使用map方法就可以把某一列的字符類型的值轉換為數字。
好了,這就是對使用pandas把某一列的字符值轉換為數字的認識。
原文鏈接:https://baishui.blog.csdn.net/article/details/123782779
相關推薦
- 2021-10-24 Linux多線程中fork與互斥鎖過程示例_Linux
- 2022-08-15 使用enum關鍵字定義的枚舉類實現接口的情況
- 2022-12-12 C語言實現打印星號圖案_C 語言
- 2022-07-13 IO流詳解之字符流與File類
- 2022-08-03 python中multiprosessing模塊的Pool類中的apply函數和apply_asyn
- 2022-07-30 jQuery?UI工具提示框部件Tooltip?Widget_jquery
- 2022-06-13 Go語言學習之運算符使用詳解_Golang
- 2022-06-14 golang?channel管道使用示例解析_Golang
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支