網(wǎng)站首頁 編程語言 正文
用python讀取excel表中的數(shù)據(jù)
假如說有如下一張存儲了數(shù)據(jù)的excel表,其中x1-x6是特征,y_label是特征對應(yīng)的類別標簽。我們想要使用python對以下數(shù)據(jù)進行數(shù)據(jù)分析,那么第一步就要先把excel表中的數(shù)據(jù)讀取出來才行。這里我們主要使用到了python中的pandas庫。
首先確定excel表存放的路徑所在,比如我的路徑是 ‘E:\relate_code\svm\dataset\data.xlsx’.
import pandas as pd
file_path = r'E:\relate_code\svm\dataset\data.xlsx' # r對路徑進行轉(zhuǎn)義,windows需要
raw_data = pd.read_excel(file_path, header=0) # header=0表示第一行是表頭,就自動去除了
print(raw_data)
這樣就可以取出數(shù)據(jù)了,輸出見下圖。可以看出,這里就沒有表中的x1等表頭信息了。
但是,最左邊這里還有0-169這些行號額外信息,咱們可以用以下命令只要里面的有用信息,并保存到數(shù)組中。
data = raw_data.values # 只提取表中信息
print(data)
輸出結(jié)果:
這時候數(shù)據(jù)就都讀進來了,并且存儲為了數(shù)組形式。咱們可以選擇想要的數(shù)據(jù),比如想把x和y分開,畢竟一個是特征,另一個是標簽,這時候可以使用以下代碼。
features = data[:, 0:6] # 由于是二維數(shù)組,所以第一個冒號表示選擇所有行,之后0:6表示只要前六列的數(shù)據(jù)
labels = data[:, -1] # 標簽只要最后一列
1、還可以對特征進行選擇,假如只要第四列的特征也可以使用:
feature_4 = data[: 3:4] # 這樣得出的數(shù)組依然是二維數(shù)組,便于后續(xù)特征操作
2、如果不想要第四個特征,其它都想要,也可以這樣使用,需要用到numpy庫:
import numpy as np
feature1_3 = data[:, 0:3] # 取前三列特征
feature5_6 = data[:, 4:6] # 取第5,第6列特征
feature_choose = np.hstack(feature1_3, feature5_6) # 對兩份特征進行特征拼接
這里再多說一下,np.hstack()函數(shù)和 np.vstack()函數(shù):
這里是np.vstack()函數(shù)。主要是進行豎直堆疊,使用這個函數(shù)的時候要保證兩個數(shù)組列數(shù)是一致的(都是三列),得出的結(jié)果如下。
import numpy as np
arr1 = np.array([[1, 2, 3], [4, 5, 6]])
arr2 = np.array([7, 8, 9])
print(np.vstack((arr1, arr2)))
下面是np.hstack()函數(shù),主要是進行水平堆疊,使用這個函數(shù)的時候要保證行數(shù)是一致的(都是兩行)。
import numpy as np
arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[7, 8, 9], [10, 11, 12]])
print(np.hstack((arr1, arr2)))
就先介紹到這里吧,下一篇文章介紹機器學(xué)習(xí)的代碼使用!
總結(jié)
原文鏈接:https://blog.csdn.net/WYKB_Mr_Q/article/details/122999267
相關(guān)推薦
- 2022-06-22 C++深度探索運算符重載和返回值優(yōu)化_C 語言
- 2022-12-29 React中事件的類型定義方式_React
- 2022-06-18 python使用Random隨機生成列表的方法實例_python
- 2022-08-26 Python?Pandas中l(wèi)oc和iloc函數(shù)的基本用法示例_python
- 2022-05-11 Redis之RedisTemplate配置方式(序列和反序列化)_Redis
- 2022-09-29 python繪制柱狀圖的方法_python
- 2022-09-27 WIN10使用IIS部署ftp服務(wù)器詳細教程_FTP服務(wù)器
- 2023-04-11 一文帶你搞懂useCallback的使用方法_React
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細win安裝深度學(xué)習(xí)環(huán)境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務(wù)發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡單動態(tài)字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應(yīng)用詳解
- 聊聊消息隊列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支