- 软件大小:28.79M
- 软件语言:中文
- 软件类型:国产软件
- 软件类别:免费软件 / 编程工具
- 更新时间:2017-07-24 13:57
- 运行环境:WinAll, WinXP, Win7, Win8, Win10
- 软件等级:
- 软件厂商:
- 官方网站:暂无
顶好评:50%
踩坏评:50
1.23M/中文/5.0
10.15M/中文/2.0
1.52M/中文/10.0
643KB/中文/5.0
0KB/中文/10.0
tikaapp.jar包是一款可以轻松提取文本正文工具,它集成了POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面,提供了便利的扩展API,用来丰富其对第三方文件格式的支持,感兴趣的朋友可以下载使用!
Tika是一个用于文本解释的框架,其本身并不提供任何的库用于解释文本,而是调用各种各样的库,如POI,PDFBox等。使用Tika,可以提取文件中的作者、标题、创建时间、正文等内容,相比于Java.io自带的一些功能。
1.进入Tika所有的目录,运行以下命令:java -jar "tika-app-1.5 (1).jar" -g
2.Tika的图形界面被打开,然后找开File-openURL:
3.点击确认后,即返回解释结果。默认情况下显示的是文本的元信息
4.可以通过view菜单中的选项,分别查看 metadata, formatted text, plain text, main content, stuctured text等信息。
请描述您所遇到的错误,我们将尽快予以修正,谢谢!
*必填项,请输入内容