使用Python解析和处理XML文件

发布时间：2023-12-04 14:27:30

在Python中，使用xml.etree.ElementTree模块可以解析和处理XML文件。ElementTree模块提供了一种简单的方式来生成、解析和操作XML数据。下面是一个例子来演示如何使用Python解析和处理XML文件。

首先，我们需要导入xml.etree.ElementTree模块：

import xml.etree.ElementTree as ET

接下来，假设我们有一个XML文件（example.xml）如下所示：

<root>
  <person>
    <name>John Doe</name>
    <age>30</age>
    <city>New York</city>
  </person>
  <person>
    <name>Jane Smith</name>
    <age>25</age>
    <city>London</city>
  </person>
</root>

我们可以使用ElementTree模块来解析这个XML文件：

tree = ET.parse('example.xml')  # 解析XML文件
root = tree.getroot()  # 获取根节点

现在，我们可以使用ElementTree对象的各个方法来访问XML的不同部分。例如，如果我们想获取名为“person”的所有子元素，可以按如下方式做：

persons = root.findall('person')  # 查找名为“person”的子元素

然后，我们可以迭代所有的“person”元素，并获取它们的子元素的文本值：

for person in persons:
    name = person.find('name').text  # 获取name元素的文本值
    age = person.find('age').text  # 获取age元素的文本值
    city = person.find('city').text  # 获取city元素的文本值
    print(f"Name: {name}, Age: {age}, City: {city}")

输出结果将是：

Name: John Doe, Age: 30, City: New York
Name: Jane Smith, Age: 25, City: London

除了查找子元素，我们还可以使用其他方法来访问XML文件的不同部分。下面是几个常用的方法：

- find(element)：查找名为“element”的个子元素。

- findall(element)：查找所有名为“element”的子元素，返回一个元素列表。

- get(attribute)：获取元素的属性值。

- iter(element)：迭代查找名为“element”的所有子元素。

除了解析XML文件之外，ElementTree模块还提供了一种创建和编辑XML文件的方式。例如，我们可以使用Element对象创建一个新的XML文件。

root = ET.Element("root")  # 创建根节点
person = ET.SubElement(root, "person")  # 创建子元素
name = ET.SubElement(person, "name")  # 创建子元素
name.text = "John Doe"  # 设置文本值
age = ET.SubElement(person, "age")  # 创建子元素
age.text = "30"  # 设置文本值
tree = ET.ElementTree(root)  # 创建ElementTree对象
tree.write("new.xml")  # 写入XML文件

这将创建一个新的XML文件（new.xml），内容如下：

<root>
  <person>
    <name>John Doe</name>
    <age>30</age>
  </person>
</root>

上述内容演示了如何使用Python解析和处理XML文件。ElementTree模块提供了一种简单而强大的方式来解析和操作XML数据。通过使用ElementTree对象的各种方法，我们可以轻松地访问和修改XML文件的不同部分。同时，ElementTree模块也提供了一种创建和编辑XML文件的方式，方便我们生成自己的XML数据。