连字预处理 - java

我需要一些线索来使用PHP和/或Java(当前为Spring + Hibernate)中的工具来进行内容的断字。我在包含的文件中有一些文本内容,而在数据库中有一些。所有文本都是utf-8编码的,我需要使用软连字符作为支持,这在大多数浏览器中都很常见。

因此,此存储原始:

<p> These words need hyphenation</p>

会变成这样的东西

<p> The&shy;se wor&shy;ds need hyp&shy;he&shy;na&shy;tion</p>

在最终加载的网页的源代码中。

任何想法如何实现这一目标?

对于没有使用任何服务器端代码且仅使用纯HTML源文件的情况,也欢迎使用在HTML标记内包含连字符的文本编辑工具的建议。

另外,我还没有找到连字单词列表的良好来源。

参考方案

CSS3定义client-side hyphenation。

这意味着在支持的浏览器¹中,您只需指定文本的语言以及您对自动连字的需求,它将自动进行连字,而无需您进行任何工作。显然,这意味着连字符由浏览器的语言资源控制。

对于手动控制,您可以在任意要使用的连字符处放置任意连字符,并指示浏览器仅使用那些连字符。

在实践中,要查找连字点并插入任意连字号,最好的方法可能是使用古老的TeX-style hyphenation method,其中指定分层连字或无连字点的子词模式与要连字的词匹配。这些模式现已得到广泛使用(包括OpenOffice,LibreOffice和Adobe InDesign),并且适用于大多数语言。

实现该算法仅需要几行代码。而且,有多种语言的现成实现:诸如phpHyphenator的PHP实现,诸如TeXHyphenator-J或Hyphenation的Java实现以及针对libhyphen的C++实现的Java绑定(如jhyphen)。

¹目前,Firefox,Safari和IE具有自动连字支持,而Chrome和Opera没有。

Java:正则表达式模式匹配器是否有大小限制? - java

我的模式类似于OR:“word1 | word2 | word3”我大约有800个字。可能有问题吗? 参考方案 您仅受记忆和理智的限制。 :)

Java:线程池如何将线程映射到可运行对象 - java

试图绕过Java并发问题,并且很难理解线程池,线程以及它们正在执行的可运行“任务”之间的关系。如果我创建一个有10个线程的线程池,那么我是否必须将相同的任务传递给池中的每个线程,或者池化的线程实际上只是与任务无关的“工人无人机”可用于执行任何任务?无论哪种方式,Executor / ExecutorService如何将正确的任务分配给正确的线程? 参考方案 …

Java:我可以在Hashmaps中使用数组吗? - java

我可以在Hashmaps中使用数组吗?如果是这样,则声明这种哈希图的确切语法是什么?谢谢 参考方案 数组也是对象。甚至像int[]这样的原始数组。Map<String,String[]> map = new HashMap<String,String[]>();

JAVA:字节码和二进制有什么区别? - java

java字节代码(已编译的语言,也称为目标代码)与机器代码(当前计算机的本机代码)之间有什么区别?我读过一些书,他们将字节码称为二进制指令,但我不知道为什么。 参考方案 字节码是独立于平台的,在Windows中运行的编译器编译的字节码仍将在linux / unix / mac中运行。机器代码是特定于平台的,如果在Windows x86中编译,则它将仅在Win…

java:继承 - java

有哪些替代继承的方法? java大神给出的解决方案 有效的Java:偏重于继承而不是继承。 (这实际上也来自“四人帮”)。他提出的理由是,如果扩展类未明确设计为继承,则继承会引起很多不正常的副作用。例如,对super.someMethod()的任何调用都可以引导您通过未知代码的意外路径。取而代之的是,持有对本来应该扩展的类的引用,然后委托给它。这是与Eric…