日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

python?pandas庫讀取excel/csv中指定行或列數據_python

作者:Westin_Li ? 更新時間: 2022-05-01 編程語言

引言

關鍵!!!!使用loc函數來查找。

話不多說,直接演示:

有以下名為try.xlsx表:

1.根據index查詢

條件:首先導入的數據必須的有index

或者自己添加吧,方法簡單,讀取excel文件時直接加index_col

代碼示例:

import pandas as pd                      #導入pandas庫

excel_file = './try.xlsx'               #導入excel數據
data = pd.read_excel(excel_file, index_col='姓名')        
#這個的index_col就是index,可以選擇任意字段作為索引index,讀入數據
print(data.loc['李四'])

打印結果就是

部門 B
工資 6600
Name: 李四, dtype: object
(注意點:索引)

2.已知數據在第幾行找到想要的數據

假如我們的表中,有某個員工的工資數據為空了,那我們怎么找到自己想要的數據呢。

代碼如下:

for i in data.columns:
    for j in range(len(data)):
        if (data[i].isnull())[j]:
            bumen = data.iloc[j, [0]]                             #找出缺失值所在的部門
            data[i][j] = charuzhi(bumen)

原理很簡單,首先檢索全部的數據,然后我們可以用pandas中的iloc函數。上面的iloc[j, [2]]中j是具體的位置,【0】是你要得到的數據所在的column

3.根據條件查詢找到指定行數據

例如查找A部門所有成員的的姓名和工資或者工資低于3000的人:

代碼如下:

"""根據條件查詢某行數據"""
import pandas as pd            #導入pandas庫

excel_file = './try.xlsx'        #導入文件
data = pd.read_excel(excel_file)      #讀入數據

print(data.loc[data['部門'] == 'A', ['姓名', '工資']])     #部門為A,打印姓名和工資
print(data.loc[data['工資'] < 3000, ['姓名','工資']])    #查找工資小于3000的人

結果如下:

若要把這些數據獨立生成excel文件或者csv文件:

添加以下代碼

"""導出為excel或csv文件"""
#單條件
dataframe_1 = data.loc[data['部門'] == 'A', ['姓名', '工資']]
#單條件
dataframe_2 = data.loc[data['工資'] < 3000, ['姓名', '工資']]
#多條件
dataframe_3 = data.loc[(data['部門'] == 'A')&(data['工資'] < 3000), ['姓名', '工資']]
#導出為excel
dataframe_1.to_excel('dataframe_1.xlsx')
dataframe_2.to_excel('dataframe_2.xlsx')

4.找出指定列

data['columns']  #columns即你需要的字段名稱即可
#注意這列的columns不能是index的名稱
#如果要打印index的話就data.index
data.columns  #與上面的一樣

以上全過程用到的庫:

pandas,xlrd , openpyxl

5.找出指定的行和指定的列

主要使用的就是函數iloc

data.iloc[:,:2]  #即全部行,前兩列的數據

逗號前是行,逗號后是列的范圍,很容易理解

6.在規定范圍內找出符合條件的數據

data.iloc[:10,:][data.工資>6000]

這樣即可找出前11行里工資大于6000的所有人的信息了

總結

原文鏈接:https://blog.csdn.net/weixin_45082522/article/details/106364847

欄目分類
最近更新