Java中怎么对xml进行操作

发布时间：2023-05-15 16:27:39

XML（eXtensible Markup Language）即可扩展标记语言，在Java中我们可以使用许多Java API来操作XML文档，这些API包括传统的DOM、SAX和现代的StAX、JAXB等。本文主要介绍Java中对XML进行操作的四种主要的API，分别是DOM解析、SAX解析、StAX解析和JAXB（即Java XML绑定）。在介绍每种API之前，我们先来看一下需要用到的常用的XML概念。

常用的XML概念

XML的数据可以分为两个主要类型：元素和属性。元素包含其他数据，如其他元素和文本数据，而属性则是用来定义元素的特征，例如颜色、大小等。在XML中，元素需要用尖括号（<>）括起来，其中>号代表闭合元素；属性则需要使用括号包含起来。如下例子所示：

<book>
    <title>Java XML Programming</title>
    <author>J. Doe</author>
    <publisher>Wrox Press</publisher>
    <year>2015</year>
    <price currency="USD">49.99</price>
</book>

在这个例子中，我们有一个名为“book”的元素，包含了多个子元素和属性。其中，“title”、“author”、“publisher”、“year”和“price”都是子元素，而“currency”则是一个属性。

DOM解析

DOM（Document Object Model）是Java操作XML文档的一种基本方式，通过将整个XML文档加载到内存中的DOM树结构中，我们可以方便地访问和操作文档中的数据。DOM操作需要加载整个文档树，因此对于大型XML文档来说，其性能可能会较为低效。DOM解析的基本步骤如下：

1. 获取DocumentBuilderFactory实例

2. 获取DocumentBuilder实例

3. 将XML文档解析为Document对象

4. 遍历Document对象中的元素和属性

下面是一个使用DOM解析XML的示例代码：

// 获取DocumentBuilderFactory实例
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
// 获取DocumentBuilder实例
DocumentBuilder builder = factory.newDocumentBuilder();
// 将XML文档解析为Document对象
Document document = builder.parse(new File("books.xml"));
// 获取根元素
Element root = document.getDocumentElement();
// 遍历子元素
NodeList nodeList = root.getChildNodes();
for (int i = 0; i < nodeList.getLength(); i++) {
    Node node = nodeList.item(i);
    if (node.getNodeType() == Node.ELEMENT_NODE) {
        Element element = (Element) node;
        // 获取子元素的名称和值
        String name = element.getNodeName();
        String value = element.getTextContent();
        System.out.println(name + ": " + value);
    }
}

这个例子中，我们使用了DocumentBuilderFactory和DocumentBuilder两种工厂类和一个Document对象来解析XML文档，然后通过获取根元素和遍历子元素节点来获取XML中的数据。

SAX解析

SAX（Simple API for XML）是一种基于事件的XML解析方式，可以解析大型XML文档而不必将整个文档加载到内存中。SAX解析器逐行读取XML文档，对每个元素或属性（称为“事件”）执行回调方法。由于SAX解析是一种事件驱动机制，因此相对于DOM解析可能会更快一些。SAX解析的基本步骤如下：

1. 获取SAXParser实例

2. 实现ContentHandler接口，定义事件处理回调方法

3. 解析XML文档

下面是一个使用SAX解析XML的示例代码：

// 获取SAXParser实例
SAXParserFactory factory = SAXParserFactory.newInstance();
SAXParser saxParser = factory.newSAXParser();
// 实现ContentHandler接口
DefaultHandler handler = new DefaultHandler() {
    boolean title = false;
    boolean author = false;
    boolean publisher = false;
    boolean year = false;
    boolean price = false;
    public void startElement(String uri, String localName, String qName, Attributes attributes) {
        if (qName.equalsIgnoreCase("title")) {
            title = true;
        }
        if (qName.equalsIgnoreCase("author")) {
            author = true;
        }
        if (qName.equalsIgnoreCase("publisher")) {
            publisher = true;
        }
        if (qName.equalsIgnoreCase("year")) {
            year = true;
        }
        if (qName.equalsIgnoreCase("price")) {
            price = true;
            System.out.print("Currency: " + attributes.getValue("currency") + ", ");
        }
    }
    public void endElement(String uri, String localName, String qName) {
    }
    public void characters(char ch[], int start, int length) {
        if (title) {
            System.out.print("Title: " + new String(ch, start, length) + ", ");
            title = false;
        }
        if (author) {
            System.out.print("Author: " + new String(ch, start, length) + ", ");
            author = false;
        }
        if (publisher) {
            System.out.print("Publisher: " + new String(ch, start, length) + ", ");
            publisher = false;
        }
        if (year) {
            System.out.print("Year: " + new String(ch, start, length) + ", ");
            year = false;
        }
        if (price) {
            System.out.println("Price: " + new String(ch, start, length));
            price = false;
        }
    }
};
// 解析XML文档
saxParser.parse(new File("books.xml"), handler);

这个例子中，我们使用SAXParserFactory和SAXParser两种工厂类以及一个DefaultHandler对象来解析XML文档，并实现了ContentHandler接口中的回调方法来处理XML中的元素和属性。

StAX解析

StAX（Streaming API for XML）是一种基于迭代器的XML解析方式，可以像SAX一样逐行读取XML文档，但与SAX不同的是，它允许我们推进和弹出XML结构，并将数据存储在事件中。使用StAX解析XML的基本步骤如下：

1. 获取XMLInputFactory实例

2. 获取XMLStreamReader实例

3. 迭代遍历XMLStreamReader对象

下面是一个使用StAX解析XML的示例代码：

// 获取XMLInputFactory实例
XMLInputFactory factory = XMLInputFactory.newInstance();
// 获取XMLStreamReader实例
XMLStreamReader reader = factory.createXMLStreamReader(new FileInputStream("books.xml"));
// 迭代遍历XMLStreamReader对象
while (reader.hasNext()) {
    int event = reader.next();
    switch (event) {
        case XMLStreamConstants.START_ELEMENT:
            if (reader.getLocalName().equals("title")) {
                System.out.print("Title: ");
                reader.next();
                System.out.print(reader.getText());
                System.out.print(", ");
            }
            if (reader.getLocalName().equals("author")) {
                System.out.print("Author: ");
                reader.next();
                System.out.print(reader.getText());
                System.out.print(", ");
            }
            if (reader.getLocalName().equals("publisher")) {
                System.out.print("Publisher: ");
                reader.next();
                System.out.print(reader.getText());
                System.out.print(", ");
            }
            if (reader.getLocalName().equals("year")) {
                System.out.print("Year: ");
                reader.next();
                System.out.print(reader.getText());
                System.out.print(", ");
            }
            if (reader.getLocalName().equals("price")) {
                System.out.print("Currency: " + reader.getAttributeValue(null, "currency") + ", ");
                System.out.println("Price: " + reader.getElementText());
            }
            break;
    }
}

在这个例子中，我们使用XMLInputFactory和XMLStreamReader两种工厂类来解析XML文档，并使用迭代器遍历XMLStreamReader对象。

JAXB

JAXB（Java Architecture for XML Binding）是一种自动化实现Java对象和XML文档之间双向映射的方式。它提供了一个Java类库，可以将XML Schema转换为Java类，并可使用这些类来编组和解组XML数据，并从生成的Java对象和XML文档之间自动进行转换。使用