日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學(xué)無先后,達(dá)者為師

網(wǎng)站首頁 編程語言 正文

Python實現(xiàn)讀取excel中的圖片功能_python

作者:ZackSock ? 更新時間: 2022-04-10 編程語言

一、讀取excel文件

我們先來看看如何讀取excel文件,讀取excel文件的方式很多。這里選擇openpyxl模塊,安裝語句如下:

pip install openpyxl

我們還需要用到一些其它模塊,具體如下:

pip install pyzbar
pip install pillow
pip install numpy

下面我們就可以開始操作了。

在Excel中,有工作簿、表、單元等。這里簡單說一下,工作簿就是一個excel文件,表的話就是我們excel左下角切換的sheet1、sheet2,單元就是一個格子。下面我們來讀取一個excel文件:

from openpyxl import load_workbook
# 加載excel
wb = load_workbook("111.xlsx")
# 切換到第一張表
ws = wb[wb.sheetnames[0]]
# 獲取A3單元
cell = ws['A3']
# 輸出A3單元的值
print(cell.value)

openpyxl的更多操作可以看看官方的文檔https://openpyxl.readthedocs.io/en/stable/tutorial.html

二、讀取excel中的圖片

讀取excel中的圖片有多種方式,本文會分享兩種方式。

(1)使用zipfile模塊

excel本身是一個壓縮文件,我們把excel的后綴改成zip后,手動解壓就會看到在xl/media目錄下有一些圖片文件,這些圖片就是excel種插入的圖片。因此我們就可以通過解壓的方式讀取excel種的圖片,具體代碼如下:

import os
from zipfile import ZipFile
# 解壓目錄
unzip_path = "./unzip"
if not os.path.exists(unzip_path):
    os.mkdir(unzip_path)
with ZipFile("111.xlsx") as f:
    for file in f.namelist():
        # 解壓圖片部分的文件
        if file.startswith("xl/media"):
            f.extract(file, path=unzip_path)

詳細(xì)講解可以參考這篇文章

(2)使用openpyxl讀取

上面的操作可以獲取excel中的圖片,但是有個缺點。就是我們不知道哪個圖片來自哪個單元,在有些情況下知道圖片來自哪個單元是很有比較的。下面我們就來解決這個問題:

from openpyxl import load_workbook
wb = load_workbook("111.xlsx")
ws = wb[wb.sheetnames[0]]
# 遍歷表中所有托
for image in ws._images:
    print(image)

我們先讀取了一個表,然后調(diào)用_images獲取表中的所有圖片。但是這個圖片我們還不能操作,具體對圖片的操作我們下一節(jié)再看。我們先看看怎么知道圖片來自哪個單元,我們可以輸出圖片的anchor._from:

from openpyxl import load_workbook
wb = load_workbook("111.xlsx")
ws = wb[wb.sheetnames[0]]
for image in ws._images:
    # 輸出圖片的位置信息
    print(image.anchor._from)

具體輸入內(nèi)容如下:

<openpyxl.drawing.spreadsheet_drawing.AnchorMarker object>
Parameters:
col=0, colOff=1, row=0, rowOff=1

其中col表示行號,row表示列號。根據(jù)這些信息,我們就可以知道圖片的單元了。比如col=0,row=0,表示的應(yīng)該是A1單元。如果col=1,row=1,表示的應(yīng)該是B2單元。

三、對讀取的圖片進(jìn)行處理

對圖片處理的操作有很多,這里要看具體需要。這里我分享一下把excel中圖片轉(zhuǎn)換成pillow圖片和ndarray對象的操作。轉(zhuǎn)換后,我們就可以用numpy和pillow對圖片進(jìn)行各種操作。

import numpy as np
from PIL import Image
from openpyxl import load_workbook
wb = load_workbook("111.xlsx")
ws = wb[wb.sheetnames[0]]
for image in ws._images:
    # 將圖片轉(zhuǎn)換成Pillow中的圖片對象
    img = Image.open(image.ref).convert("RGB")
    # 將Pillow中的圖片對象轉(zhuǎn)換成ndarray數(shù)組
    img = np.array(img)

如果我們excel中的圖片是二維碼,我們就可以進(jìn)行下面的操作:

import numpy as np
from PIL import Image
from pyzbar import pyzbar
from openpyxl import load_workbook
wb = load_workbook("111.xlsx")
ws = wb[wb.sheetnames[0]]
for image in ws._images:
    # 轉(zhuǎn)換成容易操作的圖片對象
    img = Image.open(image.ref).convert("RGB")
    img = np.array(img)
    
    # 解析二維碼
    data = pyzbar.decode(img)
    if data:
        text = data[0].data.decode('utf-8')
        print(text)
    else:
        print("未識別到內(nèi)容")

補(bǔ)充

除了以上的方法,還可以通過以下操作實現(xiàn):

1、將待讀取的excel文件后綴名改成zip,變成壓縮文件。

2、再解壓這個文件。

3、在解壓后的文件夾中,就有excel中的圖片。

4、這樣讀excel中的圖片,就變成了讀文件夾中的圖片了,和普通文件一樣,可以做各種處理。

具體實現(xiàn)代碼

 '''
 File Name:  readexcelimg
 Author:   tim
 Date:    2018/7/26 19:52
 Description: 讀取excel中的圖片,打印圖片路徑
   先將excel轉(zhuǎn)換成zip包,解壓zip包,包下面有文件夾存放了圖片,讀取這個圖片
 ''' 
 import os
 import zipfile
 # 判斷是否是文件和判斷文件是否存在
 def isfile_exist(file_path):
   if not os.path.isfile(file_path):
     print("It's not a file or no such file exist ! %s" % file_path)
     return False
   else:
     return True
 # 修改指定目錄下的文件類型名,將excel后綴名修改為.zip
 def change_file_name(file_path, new_type='.zip'):
   if not isfile_exist(file_path):
     return ''
   extend = os.path.splitext(file_path)[1] # 獲取文件拓展名
   if extend != '.xlsx' and extend != '.xls':
     print("It's not a excel file! %s" % file_path)
     return False
   file_name = os.path.basename(file_path) # 獲取文件名
   new_name = str(file_name.split('.')[0]) + new_type # 新的文件名,命名為:xxx.zip
   dir_path = os.path.dirname(file_path) # 獲取文件所在目錄
   new_path = os.path.join(dir_path, new_name) # 新的文件路徑
   if os.path.exists(new_path):
     os.remove(new_path)
   os.rename(file_path, new_path) # 保存新文件,舊文件會替換掉
   return new_path # 返回新的文件路徑,壓縮包
 # 解壓文件
 def unzip_file(zipfile_path):
   if not isfile_exist(zipfile_path):
     return False
   if os.path.splitext(zipfile_path)[1] != '.zip':
     print("It's not a zip file! %s" % zipfile_path)
     return False
   file_zip = zipfile.ZipFile(zipfile_path, 'r')
   file_name = os.path.basename(zipfile_path) # 獲取文件名
   zipdir = os.path.join(os.path.dirname(zipfile_path), str(file_name.split('.')[0])) # 獲取文件所在目錄
   for files in file_zip.namelist():
     file_zip.extract(files, os.path.join(zipfile_path, zipdir)) # 解壓到指定文件目錄
   file_zip.close()
   return True
 # 讀取解壓后的文件夾,打印圖片路徑
 def read_img(zipfile_path):
   if not isfile_exist(zipfile_path):
     return False
   dir_path = os.path.dirname(zipfile_path) # 獲取文件所在目錄
   file_name = os.path.basename(zipfile_path) # 獲取文件名
   pic_dir = 'xl' + os.sep + 'media' # excel變成壓縮包后,再解壓,圖片在media目錄
   pic_path = os.path.join(dir_path, str(file_name.split('.')[0]), pic_dir)
   file_list = os.listdir(pic_path)
   for file in file_list:
     filepath = os.path.join(pic_path, file)
     print(filepath)
 # 組合各個函數(shù)
 def compenent(excel_file_path):
   zip_file_path = change_file_name(excel_file_path)
   if zip_file_path != '':
     if unzip_file(zip_file_path):
       read_img(zip_file_path)
 # main
 if __name__ == '__main__':
   compenent('/Users/Desktop/test/people.xlsx')

原文鏈接:https://blog.csdn.net/ZackSock/article/details/122222765

欄目分類
最近更新