網站首頁 編程語言 正文
pandas 將字符串映射為數字
在有些數據集中,有些數據變量用字符串表示,但為了方便處理,往往想轉換為好處理的格式,這時候不一定要用one hot進行編碼,也可以直接轉成整數:
test_df["xx"] = pd.factorize(test_df["xx"])[0].astype(int)
但是這樣映射的數字是從0開始的,如果有初始要求,可以對映射結果加上某個值,例如,把從0開始變為從15開始:
test_df["xx"] = test_df["xx"].add(15)
效果gift_cards["user_id"] = pd.factorize(gift_cards["user_id"])[0].astype(int):
? ? ? ? ? ?user_id ? ? ? ? item_id ?ratings ? ? ? ?time
0 ? ? ? B001GXRQW0 ? APV13CM0919JD ? ? ?1.0 ?1229644800
1 ? ? ? B001GXRQW0 ?A3G8U1G1V082SN ? ? ?5.0 ?1229472000
2 ? ? ? B001GXRQW0 ? A11T2Q0EVTUWP ? ? ?5.0 ?1229472000
3 ? ? ? B001GXRQW0 ? A9YKGBH3SV22C ? ? ?5.0 ?1229472000
4 ? ? ? B001GXRQW0 ?A34WZIHVF3OKOL ? ? ?1.0 ?1229472000
... ? ? ? ? ? ?... ? ? ? ? ? ? ... ? ? ?... ? ? ? ? ...
147189 ?B01H5PPJT4 ?A2K9WVQW9TLWNK ? ? ?5.0 ?1536969600
147190 ?B01H5PPJT4 ?A149ALSR6TPGF7 ? ? ?4.0 ?1536278400
147191 ?B01H5PPJT4 ?A2Q066NZCQSCOR ? ? ?5.0 ?1535500800
147192 ?B01H5PPJT4 ?A1KJLWCW7XBS8I ? ? ?5.0 ?1534550400
147193 ?B01H5PPJT4 ? ANABUB0FRZXRM ? ? ?5.0 ?1534204800
? ? ? ? user_id ? ? ? ? item_id ?ratings ? ? ? ?time
0 ? ? ? ? ? ? 0 ? APV13CM0919JD ? ? ?1.0 ?1229644800
1 ? ? ? ? ? ? 0 ?A3G8U1G1V082SN ? ? ?5.0 ?1229472000
2 ? ? ? ? ? ? 0 ? A11T2Q0EVTUWP ? ? ?5.0 ?1229472000
3 ? ? ? ? ? ? 0 ? A9YKGBH3SV22C ? ? ?5.0 ?1229472000
4 ? ? ? ? ? ? 0 ?A34WZIHVF3OKOL ? ? ?1.0 ?1229472000
... ? ? ? ? ... ? ? ? ? ? ? ... ? ? ?... ? ? ? ? ...
147189 ? ? ?858 ?A2K9WVQW9TLWNK ? ? ?5.0 ?1536969600
147190 ? ? ?858 ?A149ALSR6TPGF7 ? ? ?4.0 ?1536278400
147191 ? ? ?858 ?A2Q066NZCQSCOR ? ? ?5.0 ?1535500800
147192 ? ? ?858 ?A1KJLWCW7XBS8I ? ? ?5.0 ?1534550400
147193 ? ? ?858 ? ANABUB0FRZXRM ? ? ?5.0 ?1534204800
pandas 將某一列的字符值轉換為數字
使用map的方法就可以實現把某一列的字符類型的值轉換為數字。
class_mapping = {'A':0, 'B':1}
data[class] = data[class].map(class_mapping)
首先定義一個字典,然后使用map方法就可以把某一列的字符類型的值轉換為數字。
好了,這就是對使用pandas把某一列的字符值轉換為數字的認識。
原文鏈接:https://baishui.blog.csdn.net/article/details/123782779
相關推薦
- 2023-06-04 Pandas通過index選擇并獲取行和列_python
- 2022-03-16 .Net?6簡介并和之前版本寫法做對比_基礎應用
- 2023-12-11 Mybatis結果集映射ResultMap
- 2022-04-28 WPF使用Grid網格面板布局_實用技巧
- 2022-08-10 Pandas?reindex重置索引的使用_python
- 2022-09-25 Idea maven項目報錯:Unable to import maven project: See
- 2022-08-15 C語言實現字符串的部分匹配算法
- 2022-05-24 redis中的bitmap你了解嗎_Redis
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支