日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

Pandas中字符串和時間轉換與格式化的實現_python

作者:夏悠 ? 更新時間: 2023-03-15 編程語言

Pandas 提供了若干個函數來格式化時間。

把字符串轉為時間格式

其中,最常用的是 to_datetime() 函數。

可以使用 to_datetime() 函數將一個字符串解析為時間,并指定字符串的格式。例如:

import pandas as pd

# 將字符串 "2022-01-01" 轉為時間格式
time = pd.to_datetime("2022-01-01", format="%Y-%m-%d")

print(time)

輸出:

<class 'pandas._libs.tslibs.timestamps.Timestamp'>:2022-01-01 00:00:00

把時間格式化為字符串

還可以使用 strftime() 函數將時間格式化為字符串。例如:

import pandas as pd

# 將時間 "2022-01-01 00:00:00" 格式化為字符串
time_str = pd.to_datetime("2022-01-01 00:00:00").strftime("%Y-%m-%d")

print(time_str)

輸出:

<class 'str'>:2022-01-01

格式化某一列的時間為字符串

如果想要格式化某一列中的時間,可以使用 pandas 的 to_datetime 函數。

例如,假設你有一個名為 df 的數據,并且你想要格式化其中一列名為 “Date” 的時間列,你可以這樣做:

df['Date'] = pd.to_datetime(df['Date'])

這將會將 “Date” 列中的所有時間轉換為 Pandas 的時間數據類型。你也可以指定一個特定的時間格式,例如:

df['Date'] = pd.to_datetime(df['Date'], format='%Y-%m-%d %H:%M:%S')

這將會將 “Date” 列中的所有時間按照指定的格式轉換為 Pandas 的時間數據類型。

遇到的錯誤

但是,我在修改以下數據的格式時,想要把listed_date和delisted_date格式化為字符串,出現了錯誤。

? ? ? sec_id ?sec_name ? ? ? ? ? ? ? listed_date ? ? ? ? ? ? delisted_date
2716 ?hc2301 ?熱軋卷板2301 2022-01-18 00:00:00+08:00 2023-01-16 00:00:00+08:00
2717 ?hc2302 ?熱軋卷板2302 2022-02-16 00:00:00+08:00 2023-02-15 00:00:00+08:00
2718 ?hc2303 ?熱軋卷板2303 2022-03-16 00:00:00+08:00 2023-03-15 00:00:00+08:00
2719 ?hc2304 ?熱軋卷板2304 2022-04-18 00:00:00+08:00 2023-04-17 00:00:00+08:00
2720 ?hc2305 ?熱軋卷板2305 2022-05-17 00:00:00+08:00 2023-05-15 00:00:00+08:00
2721 ?hc2306 ?熱軋卷板2306 2022-06-16 00:00:00+08:00 2023-06-15 00:00:00+08:00
2722 ?hc2307 ?熱軋卷板2307 2022-07-18 00:00:00+08:00 2023-07-17 00:00:00+08:00
2723 ?hc2308 ?熱軋卷板2308 2022-08-16 00:00:00+08:00 2023-08-15 00:00:00+08:00
2724 ?hc2309 ?熱軋卷板2309 2022-09-16 00:00:00+08:00 2023-09-15 00:00:00+08:00
2725 ?hc2310 ?熱軋卷板2310 2022-10-18 00:00:00+08:00 2023-10-16 00:00:00+08:00
2726 ?hc2311 ?熱軋卷板2311 2022-11-16 00:00:00+08:00 2023-11-15 00:00:00+08:00
2727 ?hc2312 ?熱軋卷板2312 2022-12-16 00:00:00+08:00 2023-12-15 00:00:00+08:00

格式化代碼如下:

data_choose['listed_date'] = data_choose['listed_date'].dt.strftime('%Y-%m-%d %H:%M:%S')
data_choose['delisted_date'] = data_choose['delisted_date'].dt.strftime('%Y-%m-%d %H:%M:%S')

報錯:

SettingWithCopyWarning: ? ? ?
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy

推測錯誤原因:

不能直接修改原來的dataframe上的列,然后再替換原來的列數據。

于是,復制了一個數據副本:

data_new = data_choose.copy()

data_new['listed_date'] = data_choose['listed_date'].dt.strftime('%Y-%m-%d %H:%M:%S')
data_new['delisted_date'] = data_choose['delisted_date'].dt.strftime('%Y-%m-%d %H:%M:%S')

在復制的數據上進行修改,果然沒再報錯。

輸出:

? ? ? sec_id ?sec_name ? ? ? ? ?listed_date ? ? ? ?delisted_date
2716 ?hc2301 ?熱軋卷板2301 ?2022-01-18 00:00:00 ?2023-01-16 00:00:00
2717 ?hc2302 ?熱軋卷板2302 ?2022-02-16 00:00:00 ?2023-02-15 00:00:00
2718 ?hc2303 ?熱軋卷板2303 ?2022-03-16 00:00:00 ?2023-03-15 00:00:00
2719 ?hc2304 ?熱軋卷板2304 ?2022-04-18 00:00:00 ?2023-04-17 00:00:00
2720 ?hc2305 ?熱軋卷板2305 ?2022-05-17 00:00:00 ?2023-05-15 00:00:00
2721 ?hc2306 ?熱軋卷板2306 ?2022-06-16 00:00:00 ?2023-06-15 00:00:00
2722 ?hc2307 ?熱軋卷板2307 ?2022-07-18 00:00:00 ?2023-07-17 00:00:00
2723 ?hc2308 ?熱軋卷板2308 ?2022-08-16 00:00:00 ?2023-08-15 00:00:00
2724 ?hc2309 ?熱軋卷板2309 ?2022-09-16 00:00:00 ?2023-09-15 00:00:00
2725 ?hc2310 ?熱軋卷板2310 ?2022-10-18 00:00:00 ?2023-10-16 00:00:00
2726 ?hc2311 ?熱軋卷板2311 ?2022-11-16 00:00:00 ?2023-11-15 00:00:00
2727 ?hc2312 ?熱軋卷板2312 ?2022-12-16 00:00:00 ?2023-12-15 00:00:00

使用apply()和lambda函數

另一種格式化方式,并不會出錯:

# 把日期改為字符串
data_choose.listed_date = data_choose.listed_date.apply(lambda x: x.strftime("%Y-%m-%d %H:%M:%S"))
# 把時間列轉為字符串
data_choose.delisted_date = data_choose.delisted_date.apply(lambda x: x.strftime("%Y-%m-%d %H:%M:%S"))

這里對列使用了apply()和lambda函數,相當于遍歷列的數據進行修改替換。

把某一列轉為時間格式
直接使用pd.to_datetime()就可以了。

這里不會出現錯誤。

# 把列轉為時間格式
data_new.listed_date = pd.to_datetime(data_new.listed_date)
data_new.delisted_date = pd.to_datetime(data_new.delisted_date)

原文鏈接:https://blog.csdn.net/qq_37944726/article/details/128585466

欄目分類
最近更新