当前位置:首页 > 开发 > 行业应用 > 正文

TXT转换PDF方法2:利用Word转换的效率及适应性研究(JAVA环境)

发表于: 2013-02-20   作者:doingwell   来源:转载   浏览次数:
摘要: 结论:处理文件的页数约多,单页处理效率约高。相比wps,不论是大文件还是小文件,都明显要慢很多。处理文字编码为UTF-8的文件时速度较快。(查看WPS测试结果)   0. 运行环境 既然是利用Microsoft Office word,所以理所当然需要运行在Windows下。测试用的Office版本:2010。   1.需要的辅助工具: 由于java环境无法直接调用

结论:处理文件的页数约多,单页处理效率约高。相比wps,不论是大文件还是小文件,都明显要慢很多。处理文字编码为UTF-8的文件时速度较快。(查看WPS测试结果

 

0. 运行环境

既然是利用Microsoft Office word,所以理所当然需要运行在Windows下。测试用的Office版本:2010。

 

1.需要的辅助工具:

由于java环境无法直接调用ActiveX,所以借助于开源的jacob。版本: 1.17。

 

2.代码准备:

这里只列举几个关键步骤吧,完整代码就不列举了,可以自行组合。

 

2.1 创建Word的ActiveX对象

ActiveXComponent app = new ActiveXComponent("Word.Application");
app.setProperty("Visible", false);

 

2.2 打开txt文档

Dispatch docs = app.getProperty("Documents").toDispatch();
Dispatch  doc = Dispatch.call(docs,
                    "Open",
                    in, // FileName
                    false, // ConfirmConversions
                    true // ReadOnly
                    ).toDispatch();

 

2.3 输出为PDF文档

Dispatch.call(doc,
                    "SaveAs",
                    out, // FileName
                    17);

 

2.4 关闭文档

Dispatch.call(doc, "Close", false);
doc.safeRelease();

 

2.5 关闭ActiveX

if (docs != null) {
    docs.safeRelease();
}
if (app != null) {
   app.invoke("Quit", 0);
   app.safeRelease();
}

 

3. 转换效率

场景1:txt文件大小:5.02k,GBK编码。生成pdf后123k~124k,4页。生成的文件不都是相同大小,这个问题还有待研究。处理1024个文件,用时:898889ms,14分58秒。平均每个文件用时:877.8ms。比WPS文字603.5ms慢了45%。

 

场景2:txt文件大小:6.04k,UTF-8编码。生成pdf是122k,4页。pdf文件还是大小不一。处理1024个文件,用时:876222ms,14分36秒。平均每个文件用时:855.7ms。时间略低于场景1。原因有可能是word需要把GBK编码的文件转换成UTF-8编码后才能再执行操作,这一点有待证实。

 

场景3:txt文件大小:2.42m,GBK编码。生成pdf后13.4m,1430页。处理2个文件,用时:464491ms,7分44秒。平均每个文件用时:232245.5ms。比WPS文字慢3.6倍。

 

分析结果得出:处理文件的页数约多,单页处理效率约高。相比wps,不论是大文件还是小文件,都明显要慢很多。

 

TXT转换PDF方法2:利用Word转换的效率及适应性研究(JAVA环境)

  • 0

    开心

    开心

  • 0

    板砖

    板砖

  • 0

    感动

    感动

  • 0

    有用

    有用

  • 0

    疑问

    疑问

  • 0

    难过

    难过

  • 0

    无聊

    无聊

  • 0

    震惊

    震惊

编辑推荐
背景及编码思路 关于用 OpenOffice 的场景更多是将 word 中的内容另存为(转化) html 。我的应用场
怎么把pdf转换txt工具   最近一段时间,小璐发现网上有一篇不错的文章,但是都是内容却是英文的PD
之前介绍过很多PDF转Word类的软件,不过也是有很多网友询问如何将Word文档转换为PDF文件,此类应用
怎么把pdf转换成txt文档   最近同事在QQ上传给我一些PDF文件,央求我将这些PDF文件转换成TXT格式
有的时候我们在文学网上观看电子书,时间长了,会觉得很伤眼睛,就想把它转换到TXT文本上看,怎样把
如何将pdf转换成word在线转换 绝大多数公司习惯以PDF格式存放文件和资料,PDF文档的不可编辑性,倘
通过代码将PDF转换成SWF来说,现在比较常用的一种方式就是利用SWFTools工具中的pdf2swf(http://www
通过代码将PDF转换成SWF来说,现在比较常用的一种方式就是利用SWFTools工具中的pdf2swf(http://www
原文:java文本、表格word转换生成PDF加密文件代码下载 代码下载地址:http://www.zuidaima.com/sha
不同与传统的PDF转换成Word转换器,迅捷PDF转换器不再局限于传统的PDF转Word功能。新版本的迅捷PDF
版权所有 IT知识库 CopyRight © 2009-2015 IT知识库 IT610.com , All Rights Reserved. 京ICP备09083238号