本篇文章給大家分享的是有關使用python怎么截取XML中bndbox的坐標,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
成都創(chuàng)新互聯(lián)公司是一家專注于成都網(wǎng)站設計、成都做網(wǎng)站與策劃設計,豐潤網(wǎng)站建設哪家好?成都創(chuàng)新互聯(lián)公司做網(wǎng)站,專注于網(wǎng)站建設十年,網(wǎng)設計領域的專業(yè)建站公司;建站業(yè)務涵蓋:豐潤等地區(qū)。豐潤做網(wǎng)站價格咨詢:18982081108Python的優(yōu)點有哪些1、簡單易用,與C/C++、Java、C# 等傳統(tǒng)語言相比,Python對代碼格式的要求沒有那么嚴格;2、Python屬于開源的,所有人都可以看到源代碼,并且可以被移植在許多平臺上使用;3、Python面向對象,能夠支持面向過程編程,也支持面向對象編程;4、Python是一種解釋性語言,Python寫的程序不需要編譯成二進制代碼,可以直接從源代碼運行程序;5、Python功能強大,擁有的模塊眾多,基本能夠實現(xiàn)所有的常見功能。
文件目錄
Annotations中是XML文件。
JPEGImages中是對應的JPG文件
XML文件
要截取bndbox坐標中的內容。
python代碼
# -*- coding: utf-8 -*- # @Time : 2020/2/8 22:14 # @Author : SanZhi # @File : get_xml.py # @Software: PyCharm import cv2 import numpy as np import xml.dom.minidom import os import argparse def main(): # JPG文件的地址 img_path = 'D:/ser/JPEGImages/' # XML文件的地址 anno_path = 'D:/ser/Annotations/' # 存結果的文件夾 cut_path = 'D:/ser/cut/' # 獲取文件夾中的文件 imagelist = os.listdir(img_path) for image in imagelist: image_pre, ext = os.path.splitext(image) img_file = img_path + image img = cv2.imread(img_file) xml_file = anno_path + image_pre + '.xml' DOMTree = xml.dom.minidom.parse(xml_file) collection = DOMTree.documentElement objects = collection.getElementsByTagName("object") for object in objects: print("start") bndbox = object.getElementsByTagName('bndbox')[0] xmin = bndbox.getElementsByTagName('xmin')[0] xmin_data = xmin.childNodes[0].data ymin = bndbox.getElementsByTagName('ymin')[0] ymin_data = ymin.childNodes[0].data xmax = bndbox.getElementsByTagName('xmax')[0] xmax_data = xmax.childNodes[0].data ymax = bndbox.getElementsByTagName('ymax')[0] ymax_data = ymax.childNodes[0].data xmin = int(xmin_data) xmax = int(xmax_data) ymin = int(ymin_data) ymax = int(ymax_data) img_cut = img[ymin:ymax, xmin:xmax, :] cv2.imwrite(cut_path + 'cut_img_{}.jpg'.format(image_pre), img_cut) if __name__ == '__main__': main()
補充知識:python讀取XML中bndbox和object name的方法
直接貼代碼了,封裝為了函數(shù),直接調用即可。其中有幾個點需要注意。
1、bndbox下面有4個子對象,因此不能直接使用firstChild來找到內容,需要從該對象里面繼續(xù)尋找標簽為xmin等這樣的對象,注意要加[0]才正確,有問題的可以直接調試,然后看變量的結構,根據(jù)變量的結構來調用某一對象。
2、將空格' '替換為'_',方便命名。但是使用str.replace(' ', '_')不會直接改變str的內容,返回的字符串是改變后的,因此需要變量保存。
import xml.dom.minidom as xmldom def get_bndboxfromxml(imageNum, xmlfilebasepath): # 讀取xml文件 bndbox = [0, 0, 0, 0] xmlfilepath = xmlfilebasepath + "\%06d" % imageNum+'.xml' # print(xmlfilepath) domobj = xmldom.parse(xmlfilepath) elementobj = domobj.documentElement sub_element_obj = elementobj.getElementsByTagName('bndbox') if sub_element_obj is not None: bndbox[0] = int(sub_element_obj[0].getElementsByTagName('xmin')[0].firstChild.data) bndbox[1] = int(sub_element_obj[0].getElementsByTagName('ymin')[0].firstChild.data) bndbox[2] = int(sub_element_obj[0].getElementsByTagName('xmax')[0].firstChild.data) bndbox[3] = int(sub_element_obj[0].getElementsByTagName('ymax')[0].firstChild.data) return bndbox def get_bndboxnamefromxml(imageNum, xmlfilebasepath): bndbox = [0, 0, 0, 0] xmlfilepath = xmlfilebasepath + "\%06d" % imageNum + '.xml' domobj = xmldom.parse(xmlfilepath) elementobj = domobj.documentElement sub_element_obj = elementobj.getElementsByTagName('name') name = sub_element_obj[0].firstChild.data.replace(' ', '_') return name
以上就是使用python怎么截取XML中bndbox的坐標,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注創(chuàng)新互聯(lián)行業(yè)資訊頻道。
當前名稱:使用python怎么截取XML中bndbox的坐標-創(chuàng)新互聯(lián)
鏈接URL:http://chinadenli.net/article48/dhpgep.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供電子商務、App開發(fā)、自適應網(wǎng)站、商城網(wǎng)站、Google、網(wǎng)站維護
聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)