使用Python从XML文件中提取特定的数据

发布时间：2023-12-11 17:36:47

在Python中，可以使用xml.etree.ElementTree模块来解析XML文件并提取特定的数据。下面是一个使用示例：

假设我们有一个名为data.xml的XML文件，其内容如下：

<students>
    <student>
        <name>John</name>
        <age>20</age>
        <gender>Male</gender>
    </student>
    <student>
        <name>Jane</name>
        <age>21</age>
        <gender>Female</gender>
    </student>
    <student>
        <name>Bob</name>
        <age>22</age>
        <gender>Male</gender>
    </student>
</students>

我们想要提取每个学生的姓名和年龄。可以使用以下代码来实现：

import xml.etree.ElementTree as ET

# 解析XML文件
tree = ET.parse('data.xml')

# 获取根元素
root = tree.getroot()

# 遍历每个学生元素
for student in root.findall('student'):
    # 获取学生的姓名和年龄
    name = student.find('name').text
    age = student.find('age').text
    
    # 打印学生的姓名和年龄
    print(f"Name: {name}")
    print(f"Age: {age}")
    print()

运行以上代码，将输出以下结果：

Name: John
Age: 20

Name: Jane
Age: 21

Name: Bob
Age: 22

在这个示例中，首先我们使用ET.parse()方法将XML文件解析成一个ElementTree对象。然后，使用getroot()方法获取XML文件的根元素。

接下来，使用findall()方法查找所有名为student的元素，并通过find()方法在每个学生元素中查找名为name和age的子元素。使用.text属性可以获取这些子元素的文本内容。

最后，我们通过打印输出学生的姓名和年龄。