解析XML文件并保留有关行号的信息 - java

我正在创建一个分析某些XML文件(准确地说是XHTML文件)的工具。该工具的目的不仅在于验证XML结构,还在于检查某些属性的值。

因此,我创建了自己的org.xml.sax.helpers.DefaultHandler来处理XML解析期间的事件。我的要求之一是获取有关当前行号的信息。因此,我决定在自己的org.xml.sax.helpers.LocatorImpl中添加一个DefaultHandler。这几乎解决了我所有的问题,除了有关XML属性的问题。

让我们举个例子:

<rootNode>
    <foo att1="val1"/>
    <bar att2="val2"
         answerToEverything="43"
         att3="val3"/>
</rootNode>

我的规则之一表明,如果在节点answerToEverything上定义了属性bar,则其值不应与42相同。

遇到此类XML时,我的工具应检测到错误。由于我想向用户提供准确的错误消息,例如:

文件“ foo.xhtml”中的错误,第4行:answerToEverything仅允许将“ 42”作为值。

我的解析器必须能够在解析期间保留行号,即使是属性也是如此。如果我们为我自己的DefaultHandler类考虑以下实现:

public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
    System.out.println("Start element <" + qName + ">" + x());
    for (int i = 0; i < attributes.getLength(); i++) {
        System.out.println("Att '" + attributes.getQName(i) + "' = '" + attributes.getValue(i) + "' at " + locator.getLineNumber() + ":" + locator.getColumnNumber());
    }
}

然后对于节点>bar>,它将显示以下输出:

在5:23开始元素
att'att2'='val2'在5:23
在5:23输入'answerToEverything'='43'
在5:23上输入'att3'='val3'

如您所见,行号是错误的,因为解析器会将整个节点(包括其属性)视为一个块。

理想情况下,如果接口ContentHandler已经定义了startAttributestartElementBeforeReadingAttributes方法,那么我在这里不会有任何问题:o)

所以我的问题是如何解决我的问题?

有关信息,我正在使用Java 6

ps:这个问题的另一个标题可能是带有属性解析事件的Java SAX解析,或者类似的东西...

参考方案

我认为实现此目的的唯一方法是创建自己的InputStream(或Reader),该行对行进行计数并以某种方式与SAX处理程序进行通信。我没有尝试自己实施此操作,但我相信这是可能的。祝您好运,如果您成功完成此操作并将结果发布在这里,将感到非常高兴。

java:继承 - java

有哪些替代继承的方法? java大神给出的解决方案 有效的Java:偏重于继承而不是继承。 (这实际上也来自“四人帮”)。他提出的理由是,如果扩展类未明确设计为继承,则继承会引起很多不正常的副作用。例如,对super.someMethod()的任何调用都可以引导您通过未知代码的意外路径。取而代之的是,持有对本来应该扩展的类的引用,然后委托给它。这是与Eric…

Java:BigInteger,如何通过OutputStream编写它 - java

我想将BigInteger写入文件。做这个的最好方式是什么。当然,我想从输入流中读取(使用程序,而不是人工)。我必须使用ObjectOutputStream还是有更好的方法?目的是使用尽可能少的字节。谢谢马丁 参考方案 Java序列化(ObjectOutputStream / ObjectInputStream)是将对象序列化为八位字节序列的一种通用方法。但…

Java-如何将此字符串转换为日期? - java

我从服务器收到此消息,我不明白T和Z的含义,2012-08-24T09:59:59Z将此字符串转换为Date对象的正确SimpleDateFormat模式是什么? java大神给出的解决方案 这是ISO 8601标准。您可以使用SimpleDateFormat simpleFormat = new SimpleDateFormat("yyyy-MM…

Java:从类中查找项目名称 - java

仅通过类的实例,如何使用Java反射或类似方法查找项目名称?如果不是,项目名称(我真正想要的是)可以找到程序包名称吗? 参考方案 项目只是IDE使用的简单组织工具,因此项目名称不是类或JVM中包含的信息。要获取软件包,请使用Class#getPackage()。然后,可以调用Package#getName()将包作为您在代码的包声明中看到的String来获取…

Java Double与BigDecimal - java

我正在查看一些使用双精度变量来存储(360-359.9998779296875)结果为0.0001220703125的代码。 double变量将其存储为-1.220703125E-4。当我使用BigDecimal时,其存储为0.0001220703125。为什么将它双重存储为-1.220703125E-4? 参考方案 我不会在这里提及精度问题,而只会提及数字…