網(wǎng)站首頁 編程語言 正文
異常描述
有時(shí)我們的Excel有一個(gè)調(diào)整過自定義格式的日期字段:
當(dāng)我們用pandas讀取時(shí)卻是這樣的效果:
不管如何指定參數(shù)都無效。
出現(xiàn)原因
沒有使用系統(tǒng)內(nèi)置的日期單元格格式,自定義格式?jīng)]有對負(fù)數(shù)格式進(jìn)行定義,pandas讀取時(shí)無法識別出是日期格式,而是讀取出單元格實(shí)際存儲的數(shù)值。
解決方案:修改自定義格式
可以修改為系統(tǒng)內(nèi)置的自定義格式:
或者在自定義格式上補(bǔ)充負(fù)數(shù)的定義:
增加;@即可
pandas直接解析Excel數(shù)值為日期
有時(shí)這種Excel很多,我們需要通過pandas批量讀取,挨個(gè)人工修改Excel的自定義格式費(fèi)時(shí)費(fèi)力,下面我演示如何使用pandas直接解析這些數(shù)值成為日期格式。
excel中常規(guī)格式和日期格式的轉(zhuǎn)換規(guī)則如下:
1900/1/1為起始日期,轉(zhuǎn)換的數(shù)字是1,往后的每一天增加1
1900/1/2轉(zhuǎn)換為數(shù)字是 2
1900/1/3轉(zhuǎn)換為數(shù)字是 3
1900/1/4轉(zhuǎn)換為數(shù)字是 4
以此類推
excel中時(shí)間轉(zhuǎn)換規(guī)則如下:
在時(shí)間中的規(guī)則是把1天轉(zhuǎn)換為數(shù)字是 1
每1小時(shí)就是 1/24
每1分鐘就是 1/(24×60)=1/1440
每1秒鐘就是 1/(24×60×60)=1/86400
根據(jù)Excel的日期存儲規(guī)則,我們只需要以1900/1/1為基準(zhǔn)日期,根據(jù)數(shù)值n偏移n-1天即可得到實(shí)際日期。不過還有個(gè)問題,Excel多存儲了1900年2月29日這一天,而正常的日歷是沒有這一天的,而我們的日期又都是大于1900年的,所以應(yīng)該偏移n-2天,干脆使用1899年12月30日作為基準(zhǔn),這樣不需要作減法操作。
解析代碼如下:
import pandas as pd from pandas.tseries.offsets import Day df = pd.read_excel("日期.xlsx") basetime = pd.to_datetime("1899/12/30") df.日期 = df.日期.apply(lambda x: basetime+Day(x)) df.日期 = df.日期.apply(lambda x: f"{x.month}月{x.day}日") df.head()
? | 日期 |
---|---|
0 | 6月8日 |
1 | 6月9日 |
2 | 6月10日 |
3 | 6月11日 |
4 | 6月12日 |
如果需要調(diào)用time的strftime方法,由于包含中文則需要設(shè)置locale:
import pandas as pd from pandas.tseries.offsets import Day import locale locale.setlocale(locale.LC_CTYPE, 'chinese') df = pd.read_excel("日期.xlsx") basetime = pd.to_datetime("1899/12/30") df.日期 = df.日期.apply(lambda x: basetime+Day(x)) df.日期 = df.日期.dt.strftime('%Y年%m月%d日') df.head()
? | 日期 |
---|---|
0 | 2021年06月08日 |
1 | 2021年06月09日 |
2 | 2021年06月10日 |
3 | 2021年06月11日 |
4 | 2021年06月12日 |
總結(jié)?
原文鏈接:https://blog.csdn.net/as604049322/article/details/117919953
相關(guān)推薦
- 2022-09-15 Go語言操作redis數(shù)據(jù)庫的方法_Golang
- 2022-06-17 C語言深入講解棧與堆和靜態(tài)存儲區(qū)的使用_C 語言
- 2022-05-22 Shell腳本一鍵安裝Nginx服務(wù)自定義Nginx版本_linux shell
- 2022-09-10 Golang中Interface接口的三個(gè)特性_Golang
- 2022-12-14 Tensorflow2.1?完成權(quán)重或模型的保存和加載_python
- 2022-09-26 符合選擇器和css三大特性組合
- 2022-07-12 CSS樣式:樣式的沖突 樣式的繼承 偽元素 偽類
- 2022-02-09 QT5實(shí)現(xiàn)UDP通信的示例代碼_C 語言
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細(xì)win安裝深度學(xué)習(xí)環(huán)境2025年最新版(
- Linux 中運(yùn)行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運(yùn)算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認(rèn)證信息的處理
- Spring Security之認(rèn)證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯(cuò)誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實(shí)現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務(wù)發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡單動態(tài)字符串(SD
- arthas操作spring被代理目標(biāo)對象命令
- Spring中的單例模式應(yīng)用詳解
- 聊聊消息隊(duì)列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠(yuǎn)程分支