从.csv文件中进行文本的内部链接(在Java中) - java

我有一个带文本的.csv文件,应该解析数据,并根据特定的关键字,用必要的html标签替换这些单词,以将这些关键字链接到网站。

到目前为止,我编写了一个.csv解析器和writer,它从第一个文件中获取所需列中的所有数据,并将这些列打印到新创建的(.csv)文件中(例如,一个单元格中的文本ID,文本标题在下一个单元格中,而实际文本在下一个单元格中)。

现在,我仍在等待获取关键字列表以及网站层次结构和放置它的链接,但是老实说,我不知道如何继续进行此工作。我将不得不以某种方式解析网站层次结构,以显示文本标题所在的位置,只考虑其下方的元素,然后将其链接到文本中的关键字。如何才能做到这一点?我有特殊的扩展软件,库,java软件包来执行以下操作吗?

任何帮助将不胜感激,我在这里截止日期...
谢谢!

附言:我正在用Java编写所有代码

参考方案

我不确定,但是听起来您想在输出中创建href列:

<a href="http://www.w3schools.com" id="foo" title = "bar">Visit W3Schools</a>

您可以通过串联字符串来最简单地执行此操作:

String makeHref(String title, String id, String link) {
    return "<a href=" + ... etc. }

在您写出第二个csv之前。当然,您需要转义“”。

我也很可能不理解这个问题。在这种情况下,您可能想尝试更具体。

在Java中:拍摄目录快照并还原它 - java

是否有一个用于存放文件夹,对其内容进行快照,进行一些修改,然后直接从Java程序(即不是从命令行)将其还原到以前状态的库?编辑:基本上,我正在处理一个非常大的文件夹:80mb,〜7000个文件。而且我只想还原尽快修改的文件。仅将所有内容复制回来很耗时。 参考方案 快照基本上是所有目录的递归副本,这似乎是不可避免的。在还原方面,只需删除目录并使用原始名称重命名…

Java:正则表达式模式匹配器是否有大小限制? - java

我的模式类似于OR:“word1 | word2 | word3”我大约有800个字。可能有问题吗? 参考方案 您仅受记忆和理智的限制。 :)

Java:线程池如何将线程映射到可运行对象 - java

试图绕过Java并发问题,并且很难理解线程池,线程以及它们正在执行的可运行“任务”之间的关系。如果我创建一个有10个线程的线程池,那么我是否必须将相同的任务传递给池中的每个线程,或者池化的线程实际上只是与任务无关的“工人无人机”可用于执行任何任务?无论哪种方式,Executor / ExecutorService如何将正确的任务分配给正确的线程? 参考方案 …

Java:我可以在Hashmaps中使用数组吗? - java

我可以在Hashmaps中使用数组吗?如果是这样,则声明这种哈希图的确切语法是什么?谢谢 参考方案 数组也是对象。甚至像int[]这样的原始数组。Map<String,String[]> map = new HashMap<String,String[]>();

JAVA:字节码和二进制有什么区别? - java

java字节代码(已编译的语言,也称为目标代码)与机器代码(当前计算机的本机代码)之间有什么区别?我读过一些书,他们将字节码称为二进制指令,但我不知道为什么。 参考方案 字节码是独立于平台的,在Windows中运行的编译器编译的字节码仍将在linux / unix / mac中运行。机器代码是特定于平台的,如果在Windows x86中编译,则它将仅在Win…