apache poi vs python xlrd - java

我打算在Linux上使用apache poi或python xlrd在Linux上的程序中读取电子表格。我对python xlrd有偏见,但是apache poi对我来说似乎是一个更完整的项目(可能是由于apache基金会的支持)。什么是更好的选择(我偏向python但仍然..)?我希望能够读取大多数版本的excel和读取宏。

参考方案

根据您的需求的复杂性,您可能仅使用Apache Tika CLI。 Tika处理与POI(和其他库)的对话,并将为您提供文档的XHTML或纯文本版本。如果只需要一个简单的linux命令,那可能就足够了。

否则,这可能取决于您的Java技能。 POI应该做所有您需要的事情,但是您需要编写一些代码来抓住您感兴趣的部分。看看quick guide可以帮助您入门。

(我不了解xlrd,对不起)

POI-将工作表设置为非常隐藏不起作用 - java

我正在使用POI库在XLS文件上执行一些Java代码。我试图将某些工作表设置为非常隐藏,以便用户根本无法访问它们。非常隐藏的工作表的定义http://www.kiranjholla.com/myblog/2010/03/the-very-hidden-sheet-in-excel.html码 // Creates and hides a sheet HSSF…

有效地将包含字母的字符串转换为Int-Apache Spark - java

我正在使用将用户作为字符串的数据集(即B000GKXY4S)。我想将这些用户中的每一个都转换为int,因此可以在Apache Spark ALS中使用Rating(user:Int,product:Int,rating:Double)类。最有效的方法是什么?最好使用Spark Scala函数或python本机函数。 参考方案 如果只想将任何可匹配的Strin…

httpURLConnection vs Apache Commons http - java

我只是想知道使用Java默认HttpURLConnection类是否有任何问题。某种错误使您切换到Apache Commons。还是仅仅是类公开的(丑陋的)接口证明了第三方http lib的诞生? 披露:我听到了一些反对java.net的争论,但有一些严重的问题,但是我很难相信,在多次发布JDK之后,属于Java核心发行版的类仍然存在问题。 参考方案 使我进…

Apache POI背景颜色样式似乎不起作用 - java

晚上好!我在apache poi v.14版本中遇到了一些麻烦,当我使用Libreoffice或Excel打开渲染的xlsx时,样式未正确应用。我有以下代码:class... { private XSSFCellStyle doubleLockStyle; /** * Create default cell style. * * @param myWorkB…

将新的单元格写入工作表apache poi - java

我正在使用以下代码,以便使用apache poi(其.xlsx文件)读取Excel。请让我知道我可以做些什么,也可以在循环不断进行的同时更改每行中一个单元格的值。谢谢import java.io.FileInputStream; import org.apache.poi.ss.usermodel.Cell; import org.apache.poi.xs…