日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

Python實現xml格式轉txt格式的示例代碼_python

作者:l。Ve ? 更新時間: 2022-06-01 編程語言

1、前言

最近學習Yolo v5是遇見了個問題,找的數據集全是xml文件,VOC 的標注是 xml 格式的,而YOLO是.txt格式,那么問題就來了,手動提取肯定是不可能的,那只能借用程序解決咯。

2、分析xml、txt數據

這是xml樹形結構

這是txt格式

總結:

1.提取object->name、bndbox->xmin,ymin,xmax,ymin

2.格式轉化需要用公式轉換

YOLO數據集txt格式:

x_center :歸一化后的中心點x坐標

y_center : 歸一化后的中心點y坐標

w:歸一化后的目標框寬度

h: 歸一化后的目標況高度

(此處歸一化指的是除以圖片寬和高)

VOC數據集xml格式

yolo的四個數據 xml->txt公式
x_center ((x_min+x_max)/2-1)/w_image
y_center ((y_min+y_max)/2-1)/h_image
w (x_max-x_min)/w_image
h (y_max-y_min)/h_image

3、轉換過程

定義兩個文件夾,train放xml數據, labels放txt數據。

代碼解析:

import os
import xml.etree.ElementTree as ET
import io
find_path = './train/' ? ?#xml所在的文件
savepath='./labels/' ? #保存文件

class Voc_Yolo(object):
? ? def __init__(self, find_path):
? ? ? ? self.find_path = find_path
? ? def Make_txt(self, outfile):
? ? ? ? out = open(outfile,'w')?
? ? ? ? print("創建成功:{}".format(outfile))
? ? ? ? return out
? ? def Work(self, count):
? ? #找到文件路徑
? ? ? ? for root, dirs, files in os.walk(self.find_path):
? ? ? ? #找到文件目錄中每一個xml文件
? ? ? ? ? ? for file in files:
? ? ? ? ? ? #記錄處理過的文件
? ? ? ? ? ? ? ? count += 1
? ? ? ? ? ? ? ? #輸入、輸出文件定義
? ? ? ? ? ? ? ? input_file = find_path + file
? ? ? ? ? ? ? ? outfile = savepath+file[:-4]+'.txt'
? ? ? ? ? ? ? ? #新建txt文件,確保文件正常保存
? ? ? ? ? ? ? ? out = self.Make_txt(outfile)
? ? ? ? ? ? ? ? #分析xml樹,取出w_image、h_image
? ? ? ? ? ? ? ? tree=ET.parse(input_file)
? ? ? ? ? ? ? ? root=tree.getroot()
? ? ? ? ? ? ? ? size=root.find('size')
? ? ? ? ? ? ? ? w_image=float(size.find('width').text)
? ? ? ? ? ? ? ? h_image=float(size.find('height').text)
? ? ? ? ? ? ? ? #繼續提取有效信息來計算txt中的四個數據
? ? ? ? ? ? ? ? for obj in root.iter('object'):
? ? ? ? ? ? ? ? #將類型提取出來,不同目標類型不同,本文僅有一個類別->0
? ? ? ? ? ? ? ? ? ? classname=obj.find('name').text
? ? ? ? ? ? ? ? ? ? cls_id = classname
? ? ? ? ? ? ? ? ? ? xmlbox=obj.find('bndbox')
? ? ? ? ? ? ? ? ? ? x_min=float(xmlbox.find('xmin').text)
? ? ? ? ? ? ? ? ? ? x_max=float(xmlbox.find('xmax').text)
? ? ? ? ? ? ? ? ? ? y_min=float(xmlbox.find('ymin').text)
? ? ? ? ? ? ? ? ? ? y_max=float(xmlbox.find('ymax').text)
? ? ? ? ? ? ? ? ? ? #計算公式
? ? ? ? ? ? ? ? ? ? x_center=((x_min+x_max)/2-1)/w_image
? ? ? ? ? ? ? ? ? ? y_center=((y_min+y_max)/2-1)/h_image
? ? ? ? ? ? ? ? ? ? w=(x_max-x_min)/w_image
? ? ? ? ? ? ? ? ? ? h=(y_max-y_min)/h_image
? ? ? ? ? ? ? ? ? ? #文件寫入
? ? ? ? ? ? ? ? ? ? out.write(str(cls_id)+" "+str(x_center)+" "+str(y_center)+" "+str(w)+" "+str(h)+'\n')
? ? ? ? ? ? ? ? out.close()
? ? ? ? return count
if __name__ == "__main__":
? ? data = Voc_Yolo(find_path)
? ? number = data.Work(0)
? ? print(number)

4、最后結果對比

創建成功

與真實數據對比誤差很小

原文鏈接:https://blog.csdn.net/qq_43604989/article/details/123781947

欄目分類
最近更新