網站首頁 編程語言 正文
這次介紹日期數據處理。
用python中的方法對日期數據進行處理, 我們可以獲取很多有用的信息, 比如年月日,星期,周次,季度等, 這里分享工作和數據競賽30余種常用的轉換方法。
1 計算日期的年月日時分秒,星期,周次…
用pandas的read_excel()方法讀取excel表數據,將表格中"日期"列轉日期格式
import pandas as pd
import numpy as np
import datetime
df = pd.read_excel('./日期問題.xlsx')
# 將日期列轉成日期格式
df['日期'] = pd.to_datetime(df['日期'])
dt模塊可輕松獲取日期基本屬性
# 轉年月日格式(字符串文本)
df['年月日'] = df['日期'].apply(lambda x: x.strftime('%Y%m%d'))
df['年']=df['日期'].dt.year
df['季度']=df['日期'].dt.quarter
df['月']=df['日期'].dt.month
df['日']=df['日期'].dt.day
df['星期幾']=df['日期'].dt.dayofweek
df['周次']=df['日期'].dt.week
df['時']=df['日期'].dt.hour
df['分']=df['日期'].dt.minute
df['秒']=df['日期'].dt.second
2計算一年中的第幾天, 第幾個10分鐘, 日期轉數值
通過對天, 時,分的四則運算將日期轉為序列數值數據
df['一年中的第幾天']=df['日期'].dt.dayofyear
df['一天中的第幾分鐘']=df['日期'].apply(lambda x: x.minute + x.hour*60)
df['一天中的第幾個10分鐘'] = df['時'] * 6 + df['分'] // 10
df['數值'] = df["日期"].values.astype(np.int64) // 10 ** 9
# 轉年月(數值)
df['年月'] = df['日期'].dt.year * 100 + df['日期'].dt.month
3判斷日期是否閏年,年初年末,月初月末…
apply() 和lambda()方法使用. python中2個強大的高階函數.
df['是否閏年'] = df['日期'].apply(lambda x: x.is_leap_year) # 是否閏年
df['是否月初'] = df['日期'].apply(lambda x: x.is_month_start) # 是否月初
df['是否月末'] = df['日期'].apply(lambda x: x.is_month_end) # 月末
df['是否季節初'] = df['日期'].apply(lambda x: x.is_quarter_start) # 季度初
df['是否季節末'] = df['日期'].apply(lambda x: x.is_quarter_end) # 季度末
df['是否年初'] = df['日期'].apply(lambda x: x.is_year_start) # 年初
df['是否年尾'] = df['日期'].apply(lambda x: x.is_year_end) # 年內末
df['是否周末'] = df['日期'].apply(lambda x: True if x.dayofweek in [5, 6] else False) # 是否周末
df.loc[((df['時'] >= 8) & (df['時'] < 22)), '是否營業時間'] = True
4字符串時段,季節
構造字典, 用map方法進行替換.
period_dict ={
23: '深夜', 0: '深夜', 1: '深夜',
2: '凌晨', 3: '凌晨', 4: '凌晨',
5: '早晨', 6: '早晨', 7: '早晨',
8: '上午', 9: '上午', 10: '上午', 11: '上午',
12: '中午', 13: '中午',
14: '下午', 15: '下午', 16: '下午', 17: '下午',
18: '傍晚',
19: '晚上', 20: '晚上', 21: '晚上', 22: '晚上',
}
df['時間段']=df['時'].map(period_dict)
# 一年中的哪個季度
season_dict = {
1: '春季', 2: '春季', 3: '春季',
4: '夏季', 5: '夏季', 6: '夏季',
7: '秋季', 8: '秋季', 9: '秋季',
10: '冬季', 11: '冬季', 12: '冬季',
}
df['季節']=df['月'].map(season_dict)
5for循環快捷計算
python中的getattr()方法
time_features = ['year', 'month', 'quarter', 'week', 'day', 'dayofweek', 'dayofyear']
dtype = np.int16
for time_feature in time_features:
df[time_feature] = getattr(df['日期'].dt, time_feature).astype(dtype)
6時間間隔天數計算
日期與一指定日期或者今天日期相比, 計算間隔天數
# 設置初始的時間
base_time = datetime.datetime.strptime('2021-06-01', '%Y-%m-%d')
# 計算時間差
df['時間差'] = df['日期'].apply(lambda x: x-base_time).dt.days
# 距離今天天數
df['間隔天數'] = list(map(lambda x: x.days, pd.to_datetime('today') - df['日期']))
補充:Python日期獲取今天及昨天的年月日等信息
import time
from datetime import datetime, date, timedelta
# 當前日期
now_date = time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())
print("now_date: {}".format(now_date))
# 當前時間的年月日
year = datetime.now().year
month = datetime.now().month
day = datetime.now().day
print(f"year: {year}, month: {month}, day: {day}")
# 昨天
month_yesterday = (date.today() + timedelta(days=-1)).month
day_yesterday = (date.today() + timedelta(days=-1)).day
print(f"month_yesterday: {month_yesterday}, day_yesterday: {day_yesterday}")
輸出結果:
now_date: 2022-06-01 11:22:11
year: 2022, month: 6, day: 1
month_yesterday: 5, day_yesterday: 31
總結
原文鏈接:https://blog.csdn.net/muyashui/article/details/122562058
相關推薦
- 2022-01-31 git統計當前項目代碼行數
- 2022-06-22 C語言詳解Z字形變換排列的實現_C 語言
- 2023-12-20 SpringCloud服務無法注冊到Nacos的踩坑記錄
- 2022-09-14 C語言指針如何實現字符串逆序反轉_C 語言
- 2023-03-28 react-redux及redux狀態管理工具使用詳解_React
- 2022-10-23 C#中的yield關鍵字詳解_C#教程
- 2022-08-19 InnoDB 事務
- 2022-03-15 Maven安裝配置以及本地倉庫配置和阿里云鏡像設置
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支