日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

一文教會你用Python實現pdf轉word_python

作者:Josepyth ? 更新時間: 2023-02-10 編程語言

一、實驗目標

通過利用python中的pyinstaller庫和PySimpleGUI庫,實現將pdf轉為word的實際功能。

二、實驗準備

1、安裝pdf2docx庫

pip install pdf2docx

2、安裝PySimpleGUI庫

pip install PySimpleGUI

三、實驗代碼

from pdf2docx import Converter
import PySimpleGUI as sg
 
 
def pdf2word(file_path):
    file_name = file_path.split('.')[0]
    doc_file = f'{file_name}.docx'
    p2w = Converter(file_path)
    p2w.convert(doc_file, start=0, end=None)
    p2w.close()
    return doc_file
 
 
def main():
    # 選擇主題
    sg.theme('DarkAmber')
 
    layout = [
        [sg.Text('pdfToword', font=('微軟雅黑', 12)),
         sg.Text('', key='filename', size=(50, 1), font=('微軟雅黑', 10))],
        [sg.Output(size=(80, 10), font=('微軟雅黑', 10))],
        [sg.FilesBrowse('選擇文件', key='file', target='filename'), sg.Button('開始轉換'), sg.Button('退出')]]
    # 創建窗口
    window = sg.Window("張臥虎", layout, font=("微軟雅黑", 15), default_element_size=(50, 1))
    # 事件循環
    while True:
        # 窗口的讀取,有兩個返回值(1.事件;2.值)
        event, values = window.read()
        print(event, values)
 
        if event == "開始轉換":
 
            if values['file'] and values['file'].split('.')[1] == 'pdf':
                filename = pdf2word(values['file'])
                print('文件個數 :1')
                print('\n' + '轉換成功!' + '\n')
                print('文件保存位置:', filename)
            elif values['file'] and values['file'].split(';')[0].split('.')[1] == 'pdf':
                print('文件個數 :{}'.format(len(values['file'].split(';'))))
                for f in values['file'].split(';'):
                    filename = pdf2word(f)
                    print('\n' + '轉換成功!' + '\n')
                    print('文件保存位置:', filename)
            else:
                print('請選擇pdf格式的文件哦!')
        if event in (None, '退出'):
            break
 
    window.close()
main()

四、部分代碼解析

1、pdf轉word代碼主體部分

def pdf2word(file_path):
    file_name = file_path.split('.')[0]
    doc_file = f'{file_name}.docx'
    p2w = Converter(file_path)
    p2w.convert(doc_file, start=0, end=None)
    p2w.close()
    return doc_file

convert(doc_file,start,end)函數中

doc_file:轉化完成后文件名

start:轉化開始頁面

end:轉化結束頁面

注意點:

①若不給start,end參數則默認轉化全篇

②對于不連續的頁面,也可寫作convert(doc_file , pages = [2,4,6])

2、圖形化界面部分

sg.theme('default1')
layout = [[sg.Text('pdfToword', font=('微軟雅黑', 12)),
        sg.Text('', key='filename', size=(50, 1), font=('微軟雅黑', 10))],
        [sg.Output(size=(80, 10), font=('微軟雅黑', 10))],
        [sg.FilesBrowse('選擇文件', key='file', target='filename'), sg.Button('開始轉換'),sg.Button('退出')]]
window = sg.Window("id", layout, font=("微軟雅黑", 15), default_element_size=(50, 1))

theme表示主題,即圖形化界面的主題顏色(sg.theme_list()可以查看所有可用主題)

3、實現多個文件轉化

if event == "開始轉換":
 
    if values['file'] and values['file'].split('.')[1] == 'pdf':
        filename = pdf2word(values['file'])
        print('文件個數 :1')
        print('\n' + '轉換成功!' + '\n')
        print('文件保存位置:', filename)
    elif values['file'] and values['file'].split(';')[0].split('.')[1] == 'pdf':
        print('文件個數 :{}'.format(len(values['file'].split(';'))))
        for f in values['file'].split(';'):
            filename = pdf2word(f)
            print('\n' + '轉換成功!' + '\n')
            print('文件保存位置:', filename)
    else:
        print('請選擇pdf格式的文件')

①第一個if處,通過“.”進行劃分,判斷是否為單個且pdf格式文件

②else if處,通過“;”劃分,將所有文件的存儲路徑儲存在一個數組中,利用循環來遍歷數組,從而達到依次轉化的目的

③else處,若傳入非pdf文件則輸出提示文字

五、結果

220220a570b445aea523fc3ea03f0c6f.png

完結撒花!

總結

原文鏈接:https://blog.csdn.net/Josepyth/article/details/126603643

欄目分類
最近更新