模式匹配时冻结 - java

我的程序遇到一个小问题。它似乎冻结了,很可能是由于while循环引起的。

我正在尝试做的是拾取并替换Java注释。因此,在键入块注释时,您将使用/*打开该注释。如果没有结束符(*/),该程序将在5-6秒内冻结,您将无法使用它。我使用更多的正则表达式和一个超过10,000行的文件运行了此文件,而没有任何性能问题,因此任何类型的性能下降都令人震惊,但仅延迟5秒。

private static final String COMMENT_MATCHER = "(//.*)|(/\\u002A((\\s)|(.))*?\\u002A/)";

private String clearMatches(String code, final String regex) {
    final Pattern pattern = Pattern.compile(regex);
    final Matcher matcher = pattern.matcher(code);
    while (matcher.find()) {
        final String match = matcher.group();
        code = code.replace(match, CharBuffer.allocate(match.length()).toString());
    }
    return code;
}

我猜问题是由于星号有误,所以找到了许多匹配项并对其进行了迭代。

问候,Obicere。

参考方案

您的时间观察不足为奇。由于回溯,Java正则表达式匹配可能非常慢(即,如果n是正则表达式的长度,则为O(2 ** n))。有时可以修改regexp以避免回溯,因此它将变得很快。

一种提速的想法是使用所有格量词,请参见http://docs.oracle.com/javase/6/docs/api/java/util/regex/Pattern.html。另一个加速想法是使用更少的|运算符。

试试这个:

private static final String COMMENT_MATCHER = "(//.*+)|(?s)(/[*].*?[*]/)";

Java:线程池如何将线程映射到可运行对象 - java

试图绕过Java并发问题,并且很难理解线程池,线程以及它们正在执行的可运行“任务”之间的关系。如果我创建一个有10个线程的线程池,那么我是否必须将相同的任务传递给池中的每个线程,或者池化的线程实际上只是与任务无关的“工人无人机”可用于执行任何任务?无论哪种方式,Executor / ExecutorService如何将正确的任务分配给正确的线程? 参考方案 …

java split regex-字符的任意组合 - java

我正在使用3个字符分割字符串:空格,破折号和逗号我想要的是能够使用这3个字符的任意组合进行拆分,例如:-,(破折号后跟逗号)或,--(逗号后加2破折号)或- , -(破折号,逗号间隔破折号)等 String address = "Sector -18B, Dwarka"; String[] addressParts = address.s…

JAVA:字节码和二进制有什么区别? - java

java字节代码(已编译的语言,也称为目标代码)与机器代码(当前计算机的本机代码)之间有什么区别?我读过一些书,他们将字节码称为二进制指令,但我不知道为什么。 参考方案 字节码是独立于平台的,在Windows中运行的编译器编译的字节码仍将在linux / unix / mac中运行。机器代码是特定于平台的,如果在Windows x86中编译,则它将仅在Win…

java:继承 - java

有哪些替代继承的方法? java大神给出的解决方案 有效的Java:偏重于继承而不是继承。 (这实际上也来自“四人帮”)。他提出的理由是,如果扩展类未明确设计为继承,则继承会引起很多不正常的副作用。例如,对super.someMethod()的任何调用都可以引导您通过未知代码的意外路径。取而代之的是,持有对本来应该扩展的类的引用,然后委托给它。这是与Eric…

Java:BigInteger,如何通过OutputStream编写它 - java

我想将BigInteger写入文件。做这个的最好方式是什么。当然,我想从输入流中读取(使用程序,而不是人工)。我必须使用ObjectOutputStream还是有更好的方法?目的是使用尽可能少的字节。谢谢马丁 参考方案 Java序列化(ObjectOutputStream / ObjectInputStream)是将对象序列化为八位字节序列的一种通用方法。但…