Python中如何解析XML文件

发布时间：2024-01-04 06:28:23

在Python中解析XML文件有多种方式，其中一种常用的方式是使用ElementTree模块。ElementTree是Python的一个内置模块，它提供了一种简单的方式来解析和操作XML数据。以下是一个使用ElementTree解析XML文件的例子：

假设有一个名为data.xml的XML文件，内容如下：

<data>
  <country name="China">
    <city name="Beijing">20 million</city>
    <city name="Shanghai">22 million</city>
    <city name="Guangzhou">15 million</city>
  </country>
  <country name="USA">
    <city name="New York">8 million</city>
    <city name="Los Angeles">4 million</city>
    <city name="Chicago">2 million</city>
  </country>
</data>

我们可以使用ElementTree来解析这个XML文件，首先需要导入ElementTree模块：

import xml.etree.ElementTree as ET

然后使用ElementTree的parse函数来打开并解析XML文件：

tree = ET.parse('data.xml')

通过调用getroot()方法可以获取XML文件的根节点：

root = tree.getroot()

我们可以通过遍历根节点和它的子节点来访问XML文件中的数据：

# 遍历根节点的子节点
for country in root:
    # 获取country节点的name属性值
    country_name = country.get('name')
    print('Country:', country_name)
    
    # 遍历country节点的子节点
    for city in country:
        # 获取city节点的name属性值
        city_name = city.get('name')
        # 获取city节点的文本内容
        city_population = city.text
        print('City:', city_name)
        print('Population:', city_population)

运行上述代码，输出结果为：

Country: China
City: Beijing
Population: 20 million
City: Shanghai
Population: 22 million
City: Guangzhou
Population: 15 million
Country: USA
City: New York
Population: 8 million
City: Los Angeles
Population: 4 million
City: Chicago
Population: 2 million

通过使用ElementTree模块，我们可以方便地解析和操作XML文件中的数据。除了遍历节点，ElementTree还提供了一些其他的方法和属性来搜索和过滤XML数据，可以根据具体的需求选择合适的方式来解析XML文件。