日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

python與xml數據的交互詳解_python

作者:搬磚,贊路費 ? 更新時間: 2022-09-14 編程語言

一 什么是XML?

python與json數據的交互詳情?在這篇文章中我們介紹了json是一種獨立于編程語言和平臺的數據存儲和交換方式(格式),其實xml和json基本一樣,也是一種用于進行數據存儲和交換的方式,并且也獨立于編程語言和平臺。
XML可擴展標記語言(英語:Extensible Markup Language,簡稱:XML)是一種標記語言,是從標準通用標記語言(SGML)中簡化修改出來的。XML設計的宗旨就是用來傳輸數據的。

二 XML語法規則

1. xml語法規則

xml的語法規則和html的語法規則很像,但卻有著明顯的差別。相同的是它們都用標簽對來存儲數據,但是html的標簽都是預定義的,而xml的標簽則完全是由編輯者自己定義的。

xml的語法規則如下:

<?xml version="1.0" encoding="utf-8"?>
<CFX>
    <Head>
        <TxCode>CHL2108</TxCode>
        <WorkDate>20220629</WorkDate>
        <WorkTime>164506</WorkTime>
    </Head>
    <WDWMSG>
        <login username="張三" password="123456">張三</login>>
        <PayAcct>1</PayAcct>
        <TrnPwd></TrnPwd>
        <TsmNbr>SSM1050000000001</TsmNbr>
        <PwdKeySeq>001</PwdKeySeq>
        <PwdChkVal>6391E8421C007ED5</PwdChkVal>
        <Reverse>D0E8C46A0B765B</Reverse>
    </WDWMSG>
    <PSBMSG>
        <PayAcct>2</PayAcct>
    </PSBMSG>
    <CHL2108>
        <TrnSerial>2207081541590398</TrnSerial>
        <CHLSerial>STM202206291645060000000000</CHLSerial>
        <PayAcct>6232621151792579</PayAcct>
        <HandOrgName>達拉崩吧班德貝蒂卜多比魯翁·昆圖庫塔卡提考特蘇瓦西拉松·木大</HandOrgName>
        <PrintAcct>755933363410722</PrintAcct>
        <TrnAmt>70000</TrnAmt>
        <TaxVouNo>010021102121600095</TaxVouNo>
        <TaxOrgCode>23301900000</TaxOrgCode>
        <TrnPlace>0075</TrnPlace>
        <TaxPayCode>1456151561650569</TaxPayCode>
        <TrnSrc>STM</TrnSrc>
    </CHL2108>
</CFX>

xml 必須包含根元素,它是所有其它元素的父元素,如上文中的CFXxml 標簽必須是成對出現的,即必須有關關閉標簽

<?xml version="1.0" encoding="utf-8"?>

上面這部分是xml的文檔聲明部分,包含了版本信息和編碼方式,是可選的。其他

更多的規則請參考:

2. xml與html的區別

xml和html很像,但區別也很大,具體不同如下:

  • html標簽是預定義的,而xml則是由使用者自己定義
  • xml被設計用來傳輸和存儲數據,其焦點是數據的內容
  • html被設計用來顯示數據,其焦點是數據的外觀

三 python與xml的交互

python獲取xml的數據信息一般用xml.dom 來解析,具體如下

1. 獲取標簽對內的數據

比如提取上面xml文件中PayAcct 標簽內的數據

from xml.dom import minidom

#mimidom.parse將xml文件解析成DOM文檔
data = minidom.parse('../練習文件/XML練習.XML')
print(type(data))
print('*'*50)

#首先利用data.getElementsByTagName('標簽名')提取出標簽
payacct = data.getElementsByTagName('PayAcct')
print(type(payacct))
for i in range(len(payacct)):
    print(payacct[i].toxml())#toxml還原xml格式
print('*'*50)

print('PayAcct標簽內容如下:')
#再用 firstChild.data 獲取標簽數據值
for i in range(len(payacct)):
    print(payacct[i].firstChild.data)

如上,minidom.parse()的作用是將xml文檔解析成DOM文檔,然后通過getElementsTagName()方法提取出標簽對,最后通過firstChild.data獲取標簽內的數據,過程中需要注意的是getElementsTagName()方法提取出標簽對返回的結果是一個列表,

結果如下:

>>>
<class 'xml.dom.minidom.Document'>
**************************************************
<class 'xml.dom.minicompat.NodeList'>
<PayAcct>1</PayAcct>
<PayAcct>2</PayAcct>
<PayAcct>6232621151792579</PayAcct>
**************************************************
PayAcct標簽內容如下:
1
2
6232621151792579

2. 獲取標簽屬性值

通過getAttribute 獲取標簽的屬性值。如下獲取login標簽的屬性值

<login username="張三" password="123456">張三</login>
from xml.dom import minidom

#mimidom.parse將xml文件解析成DOM文檔
data = minidom.parse('../練習文件/XML練習.XML')

#首先利用data.getElementsByTagName('標簽名')提取出標簽
login = data.getElementsByTagName('login')
print(type(login))
print(login)
for i in range(len(login)):
    print(login[i].toxml())
print('*'*50)

#再用 getAttribute('屬性值') 獲取標簽屬性值
print('login的屬性值如下:')
print(login[0].getAttribute('username'))
print(login[0].getAttribute('password'))

結果如下:

>>>
<class 'xml.dom.minicompat.NodeList'>
[<DOM Element: login at 0x188b60ec048>]
<login password="123456" username="張三">張三</login>
**************************************************
login的屬性值如下:
張三
123456

原文鏈接:https://blog.csdn.net/qq_44690947/article/details/125882945

欄目分類
最近更新