網站首頁 編程語言 正文
在這里記錄一下,python使用pandas讀取文件的方法
用到pandas庫的read_csv函數(shù)
# -*- coding: utf-8 -*-
"""
Created on Mon Jan 24 16:48:32 2022
@author: zxy
"""
# 導入包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.gridspec as gridspec
import seaborn as sns; plt.style.use('ggplot')
import sklearn
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.utils import shuffle
from sklearn.metrics import confusion_matrix
from sklearn.manifold import TSNE
# 導入并查看數(shù)據(jù)
crecreditcard_data=pd.read_csv('./creditcard.csv')
crecreditcard_data.shape,crecreditcard_data.info()
crecreditcard_data.describe()
crecreditcard_data.head()
# 看看欺詐與非欺詐的比例如何
count_classes=pd.value_counts(crecreditcard_data['Class'],sort=True).sort_index()
# 統(tǒng)計下具體數(shù)據(jù)
count_classes.value_counts()
# 也可以用count_classes[0],count_classes[1]看分別數(shù)據(jù)
count_classes.plot(kind='bar')
plt.show()
知識點擴展:
pandas讀取csv文件的操作
1. 讀取csv文件
import pandas as pd
import numpy as np
# 讀取整個csv文件
csv_data = pd.read_csv("./stock_day.csv")
# 讀取指定列索引字段的數(shù)據(jù)
csv_data = pd.read_csv("./stock_day.csv", usecols=['open', 'close'])
# 將我們修改完的csv的文件保存到新的路徑下
csv_data.to_csv('demo.csv')
觀察我們保存的文件的格式(行索引為我們的日期, 列索引為 open close) :
# 查看新保存的文件
new_data = read_csv('./demo.csv')
觀察新保存的文件(我們在讀取的時候默認給我們添加了新的行索引, 及Unnamed:0):?
使用to_csv的時候, 我們可以給他傳入幾個參數(shù):
csv_data.to_csv('demo.csv', header=True, index=False)
to_csv這個方法中可以傳遞一些參數(shù):
?DataFrame.to_csv(path_or_buf=None, sep=', ’, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None)
- path_or_buf :文件保存的路徑;
- sep :默認是以 , 進行分割 , 也可以自己制定;
- columns : 保存索引列和指定列;
- index:是否寫進行索引 0或者1;
- header :boolean or list of string, default True,是否寫進列索引值 0或者 1;
- na_rep=NaN: 缺失值保存為Na 如果不寫 默認為空;
- float_format='%.2f' :保留兩位小數(shù);
再來回顧一下將我們的行索引裝成日期格式的方法:
# 生成一個時間的序列,略過周末非交易日
date = pd.date_range('2018-02-27', periods=new_data.shape[1], freq='B')
# index代表行索引,columns代表列索引
new_data = pd.DataFrame(new_data, index=date)
原文鏈接:https://blog.csdn.net/qq_44321147/article/details/122670833
相關推薦
- 2022-11-14 C#中對集合排序的三種方式_C#教程
- 2022-08-23 構建?Python?命令行參數(shù)的?4?種常見方式_python
- 2023-01-05 Presenting?Streams?in?Flutter小技巧_Android
- 2022-09-25 linux基礎入門1 vi/vim編輯器
- 2022-05-10 torch.cuda.is_available()返回false最終解決方案
- 2022-09-14 jquery實現(xiàn)計算器小功能_jquery
- 2022-09-09 python定義函數(shù)如何判斷年份是否為閏年_python
- 2022-07-19 C語言實現(xiàn)二叉樹的三種遍歷
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細win安裝深度學習環(huán)境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結構-簡單動態(tài)字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支