从各种文档格式中提取文本
PDF 和 DOC 可能是当今最常见的数字文档扩展。这意味着你需要一个 PDF 阅读器和一个兼容 DOC 的应用程序,否则你就完蛋了。
幸运的是,还有另一个技巧可以让你阅读 PDF、DOC 和其他流行的文档格式,而无需阅读安装他们的相关软件。只需使用文本挖掘工具,这是一个简单的实用程序,可以从您加载到程序的任何文件中提取文本并将其显示在其屏幕上。然后您只需将其保存为纯格式或直接将其复制到剪贴板以供以后使用。
该程序不包含任何其他配置选项,这使其非常易于使用。不利的一面是,它缺乏自定义输出的可能性。在我们的测试过程中,我们从 PDF 文档中提取了文本,结果 TXT 文件在记事本中打开时全是乱码(而不是在写字板中打开时)。
文本挖掘工具是一个很好的工具将文本从 PDF 和 DOC 提取到纯文件的选择。请记住,格式和图像都会丢失。
用户对 Text Mining Tool 的评分
您是否尝试过 Text Mining Tool?成为第一个离开您的意见!