表中不同列的段落 - java

我想创建一个程序,以便如果我在文本区域中插入了一个段落,则希望将该段落的某些部分放在表格的不同列中。例如,该语句是:

我叫詹姆斯·奥尔森。我21岁了。我是一名医生。我住在伦敦培根街的坎特维尔。

然后该表应自动如下所示:

|姓名|年龄|专业|地区名称|街道名称|面积

詹姆斯| 21 |医生|坎特维尔|培根街|伦敦|

我还想知道哪种语言最好-Python或Java。

参考方案

是的,当然可以这样做,我个人更喜欢使用Python来完成这项工作。

我已经编写了代码,它不是最好或效率最高的代码,但是可以肯定会完成工作,但是我的代码存在问题。仅当句子的顺序和模式相同时,它才有效。该模式应与示例中提供的模式完全相同。

如果您希望该代码可用于多个句子,则只需对代码稍作更改即可,只需执行一个循环即可。

import pandas as pd

my_sent = "My name is James Olson. I am 21 years old. I am a doctor. I live in Canterville, Bacon Street, London."
my_words = my_sent.split()

my_stopwords = ['My', 'name', 'is', 'I', 'am', 'years', 'old.', 'I', 'am', 'a', 'I', 'live', 'in',]

cleaned_stopwords = []
useful_words = []

for temp in my_stopwords:
    cleaned_stopwords.append(temp.lower().strip())

for word in my_words:
    if word.lower().strip() not in cleaned_stopwords:
        useful_words.append(word.title().strip(".").strip(","))

name = useful_words[0] + " " + useful_words[1]
street = useful_words[5] + " " + useful_words[6]

useful_words.pop(0)
useful_words.pop(0)
useful_words.insert(0, name)
useful_words.pop(4)
useful_words.pop(4)
useful_words.insert(4, street)

all_columns = ["Name", "Age", "Profession", "Area Name", "Street Name", "Area"]
my_df = pd.DataFrame([useful_words], columns = all_columns)

输出:

           Name  Age  Profession   Area Name    Street Name    Area
0   James Olson   21      Doctor Canterville   Bacon Street  London

Java-如何将此字符串转换为日期? - java

我从服务器收到此消息,我不明白T和Z的含义,2012-08-24T09:59:59Z将此字符串转换为Date对象的正确SimpleDateFormat模式是什么? java大神给出的解决方案 这是ISO 8601标准。您可以使用SimpleDateFormat simpleFormat = new SimpleDateFormat("yyyy-MM…

Java-搜索字符串数组中的字符串 - java

在Java中,我们是否有任何方法可以发现特定字符串是字符串数组的一部分。我可以避免出现一个循环。例如String [] array = {"AA","BB","CC" }; string x = "BB" 我想要一个if (some condition to tell wheth…

Java:线程池如何将线程映射到可运行对象 - java

试图绕过Java并发问题,并且很难理解线程池,线程以及它们正在执行的可运行“任务”之间的关系。如果我创建一个有10个线程的线程池,那么我是否必须将相同的任务传递给池中的每个线程,或者池化的线程实际上只是与任务无关的“工人无人机”可用于执行任何任务?无论哪种方式,Executor / ExecutorService如何将正确的任务分配给正确的线程? 参考方案 …

Java RegEx中的单词边界\ b - java

我在使用\b作为Java Regex中的单词定界符时遇到困难。对于text = "/* sql statement */ INSERT INTO someTable"; Pattern.compile("(?i)\binsert\b");找不到匹配项Pattern insPtrn = Pattern.compile(&…

JAVA:字节码和二进制有什么区别? - java

java字节代码(已编译的语言,也称为目标代码)与机器代码(当前计算机的本机代码)之间有什么区别?我读过一些书,他们将字节码称为二进制指令,但我不知道为什么。 参考方案 字节码是独立于平台的,在Windows中运行的编译器编译的字节码仍将在linux / unix / mac中运行。机器代码是特定于平台的,如果在Windows x86中编译,则它将仅在Win…