如何在Python中解析XML文件？

发布时间：2023-06-10 05:10:30

Python中有几个内置的模块可用于解析XML文件。最常用的有ElementTree和minidom。本文将重点介绍这两个模块的使用方法。

一、ElementTree模块

1.导入模块

import xml.etree.ElementTree as ET

2.加载XML文件

tree = ET.parse('example.xml')
root = tree.getroot()

以上代码将XML文件example.xml加载到内存中，并将XML根元素存储在变量root中。

3.获取元素文本或属性值

如果您需要获取元素的文本内容，可以使用以下代码：

tag = root.tag  # 获取根元素的标记
text = root.text  # 获取根元素的文本
attrib = root.attrib  # 获取根元素的属性字典

4.遍历XML结构

可以使用以下代码来遍历整个XML树：

for element in root:
    print(element.tag, element.attrib)
    for sub_element in element:
        print('    ', sub_element.tag, sub_element.attrib, sub_element.text)

输出结果类似于：

bookstore {'country': 'United States'}
     book {'category': 'Web', 'lang': 'en'}
          title {} Learning XML
          author {}
          year {} 2003
          price {} 39.95
     book {'category': 'Python', 'lang': 'en'}
          title {} The Python Tutorial
          author {}
          year {} 2017
          price {} 49.99

5.查找元素

可以使用以下代码查找符合条件的元素：

# 查找所有book元素
books = root.findall('.//book')
# 查找所有category为Python的book元素
python_books = root.findall(".//book[@category='Python']")
# 查找      个title元素
first_title = root.find(".//title")

二、minidom模块