在Python中使用xml.dom.minidom.Node查找和选择XML节点

发布时间：2023-12-18 04:43:45

在Python中，可以使用xml.dom.minidom模块中的Node来查找和选择XML节点。xml.dom.minidom.Node是DOM树的一个节点，表示XML文档中的一个元素或一个属性。通过使用Node对象的方法和属性，可以在XML文档中找到和选择特定的节点。

首先，需要导入xml.dom.minidom模块和相关的类。可以使用以下代码导入所需的类：

from xml.dom import minidom

接下来，需要使用minidom.parseString()方法来解析XML字符串或minidom.parse()方法来解析XML文件，以获取DOM树的根节点。例如，可以使用以下代码解析XML文件并获取根节点：

dom = minidom.parse("example.xml")
root = dom.documentElement

一旦获得了根节点，就可以在DOM树中查找和选择节点。Node类提供了一些方法来获取节点的属性、子节点、父节点等。

以下是几个常用的方法和属性：

- Node.getAttribute(name)：返回节点的指定属性的值。

- Node.childNodes：返回节点的子节点列表。

- Node.firstChild：返回节点的个子节点。

- Node.nextSibling：返回节点的下一个兄弟节点。

- Node.nodeName：返回节点的名称。

- Node.nodeType：返回节点的类型。

- Node.nodeValue：返回节点的值。

以下是一个示例XML文档：

<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
  <book category="Children">
      <title lang="en">Harry Potter</title>
      <author>J.K. Rowling</author>
      <year>2005</year>
      <price>29.99</price>
  </book>
  <book category="Cooking">
      <title lang="en">Italian Recipes</title>
      <author>John Smith</author>
      <year>2010</year>
      <price>19.99</price>
  </book>
</bookstore>

现在，让我们使用Node类来查找和选择XML节点。以下是一个示例代码，该代码演示了如何使用Node类来查找和选择XML节点：

from xml.dom import minidom

# 解析XML文件
dom = minidom.parse("example.xml")

# 获取根节点
root = dom.documentElement

# 获取所有book节点
books = root.getElementsByTagName("book")

# 遍历所有book节点
for book in books:
    # 获取category属性
    category = book.getAttribute("category")
    print("Category:", category)

    # 获取title节点
    title = book.getElementsByTagName("title")[0].firstChild.nodeValue
    print("Title:", title)

    # 获取author节点
    author = book.getElementsByTagName("author")[0].firstChild.nodeValue
    print("Author:", author)

    # 获取year节点
    year = book.getElementsByTagName("year")[0].firstChild.nodeValue
    print("Year:", year)

    # 获取price节点
    price = book.getElementsByTagName("price")[0].firstChild.nodeValue
    print("Price:", price)

    print("----------------------------------------")

运行上述代码，将输出以下结果：

Category: Children
Title: Harry Potter
Author: J.K. Rowling
Year: 2005
Price: 29.99
----------------------------------------
Category: Cooking
Title: Italian Recipes
Author: John Smith
Year: 2010
Price: 19.99
----------------------------------------

在上述示例代码中，首先解析了XML文件并获取了根节点。然后，使用getElementsByTagName()方法获取了所有的book节点，并使用getAttribute()和getElementsByTagName()方法获取了其他节点的属性和值。

通过这种方式，我们可以在Python中使用xml.dom.minidom.Node类来查找和选择XML节点。你可以根据自己的需求使用其他Node类的方法和属性来访问和操作节点。