当前位置:首页 > 开发 > 编程语言 > Java > 正文

Java使用OpenOffice将word转换为pdf文件

发表于: 2014-06-11   作者:BigBird2012   来源:转载   浏览次数:
摘要: 在公文审批流转过程中,用户需要实时查看所审批的呈批件的内容,这些呈批件都是doc或者docx格式的word文件,所以就使用openoffice将word文件转换成pdf文件,然后使用专门的pdf阅读插件来查看文件内容。 在转换过程中,遇到了2个问题: (1)openoffice服务未开启,需要手动使用cmd命令开启,然后才可以转换; (2)openoffice服务开启后。占用内存过大。 对

在公文审批流转过程中,用户需要实时查看所审批的呈批件的内容,这些呈批件都是doc或者docx格式的word文件,所以就使用openofficeword文件转换成pdf文件,然后使用专门的pdf阅读插件来查看文件内容。

在转换过程中,遇到了2个问题:

1openoffice服务未开启,需要手动使用cmd命令开启,然后才可以转换;

2openoffice服务开启后。占用内存过大。

对于第一个问题,可以使用Java提供的相关接口来完成openoffice服务的开启,对于第二个问题,可以在转换完成后,关闭openoffice的进程。

 

代码示例如下:

 

package com.kingt;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.net.ConnectException;
import java.util.Properties;

import com.artofsolving.jodconverter.DocumentConverter;
import com.artofsolving.jodconverter.openoffice.connection.OpenOfficeConnection;
import com.artofsolving.jodconverter.openoffice.connection.SocketOpenOfficeConnection;
import com.artofsolving.jodconverter.openoffice.converter.OpenOfficeDocumentConverter;

/**
 * 将Office文档转换为PDF文档
 * 
 * @author Kingt.W
 * 
 */
public class Office2PDF {

	/**
	 * 环境变量下面的url.properties的绝对路径
	 */
	private static final String RUL_PATH = Thread.currentThread().getContextClassLoader().getResource("").getPath()
			.replace("%20", " ")
			+ "url.properties";

	/**
	 * 将Office文档转换为PDF. 运行该函数需要用到OpenOffice, OpenOffice下载地址为
	 * http://www.openoffice.org/
	 * 
	 * <pre>
	 * 方法示例:
	 * String sourcePath = "F:\\office\\source.doc";
	 * String destFile = "F:\\pdf\\dest.pdf";
	 * Converter.office2PDF(sourcePath, destFile);
	 * </pre>
	 * 
	 * @param sourceFile
	 *            源文件, 绝对路径. 可以是Office2003-2007全部格式的文档, Office2010的没测试. 包括.doc,
	 *            .docx, .xls, .xlsx, .ppt, .pptx等. 示例: F:\\office\\source.doc
	 * @param destFile
	 *            目标文件. 绝对路径. 示例: F:\\pdf\\dest.pdf
	 * @return 操作成功与否的提示信息. 如果返回 -1, 表示找不到源文件, 或url.properties配置错误; 如果返回 0,
	 *         则表示操作成功; 返回1, 则表示转换失败;返回-2表示连接OpenOffice服务失败
	 */
	public static int office2PDF(String sourceFile, String destFile) {
		try {
			File inputFile = new File(sourceFile);
			if (!inputFile.exists()) {
				return -1;// 找不到源文件, 则返回-1
			}

			// 如果目标路径不存在, 则新建该路径
			File outputFile = new File(destFile);
			if (!outputFile.getParentFile().exists()) {
				outputFile.getParentFile().mkdirs();
			}

			/*
			 * 从url.properties文件中读取OpenOffice的安装根目录, OpenOffice_HOME对应的键值.
			 * 我的OpenOffice是安装在D:\Program Files\OpenOffice.org 3下面的, 如果大家的
			 * OpenOffice不是安装的这个目录下面,需要修改url.properties文件中的 OpenOffice_HOME的键值.
			 * 但是需要注意的是:要用"\\"代替"\",用"\:"代替":" . 如果大家嫌麻烦,
			 * 可以直接给OpenOffice_HOME变量赋值为自己OpenOffice的安装目录
			 */
			Properties prop = new Properties();
			FileInputStream fis = null;
			fis = new FileInputStream(RUL_PATH);// 属性文件输入流
			prop.load(fis);// 将属性文件流装载到Properties对象中
			fis.close();// 关闭流

			String OpenOffice_HOME = prop.getProperty("OpenOffice_HOME");
			if (OpenOffice_HOME == null)
				return -1;
			// 如果从文件中读取的URL地址最后一个字符不是 '\',则添加'\'
			if (OpenOffice_HOME.charAt(OpenOffice_HOME.length() - 1) != '\\') {
				OpenOffice_HOME += "\\";
			}
			// 启动OpenOffice的服务
			String command = OpenOffice_HOME
					+ "program\\soffice.exe -headless -accept=\"socket,host=127.0.0.1,port=8100;urp;\" -nofirststartwizard";
			Process pro = Runtime.getRuntime().exec(command);
			// connect to an OpenOffice.org instance running on port 8100
			OpenOfficeConnection connection = new SocketOpenOfficeConnection("127.0.0.1", 8100);
			connection.connect();

			// convert
			DocumentConverter converter = new OpenOfficeDocumentConverter(connection);
			converter.convert(inputFile, outputFile);

			// close the connection
			connection.disconnect();
			// 关闭OpenOffice服务的进程
			pro.destroy();

			return 0;
		} catch (FileNotFoundException e) {
			e.printStackTrace();
			return -1;
		} catch (ConnectException e) {
			e.printStackTrace();
			return -2;
		} catch (IOException e) {
			e.printStackTrace();
		}
		return 1;
	}
}

   

 

 

Java使用OpenOffice将word转换为pdf文件

  • 0

    开心

    开心

  • 0

    板砖

    板砖

  • 0

    感动

    感动

  • 0

    有用

    有用

  • 0

    疑问

    疑问

  • 0

    难过

    难过

  • 0

    无聊

    无聊

  • 0

    震惊

    震惊

编辑推荐
最近的一个项目中遇到一个超级恶心的需求,用户要求从列表项自动的生成PDF文件,这个需求可以说是把
1.Maven工程中主要添加的依赖 <!--处理excel、word--> <dependency> <groupId>or
原文: 如何通过WPS 2013 API 将Office(Word、Excel和PPT)文件转PDF文件 1. 描述   PDF 文件是一
1. 描述   PDF 文件是一种便携文件格式,是由Adobe公司所开发的独特的跨平台文件格式。PDF文件以P
背景及编码思路 关于用 OpenOffice 的场景更多是将 word 中的内容另存为(转化) html 。我的应用场
提到的方法非常管用,感谢原作者的分享。 原文地址:http://blog.163.com/rongting_chen/blog/stati
如何将pdf转换成word在线转   前言:   当面对较大PDF文件转换时,下载安装一个PDF转换成Word转
转至:http://zhiwu88.blog.hexun.com/70623952_d.html 字号:大 中 小 很多时候我们看一个网页没看
PDF2Word能够从PDF格式文档中提取文字、图形和其它内容存放入Word格式文档中,因此你就能重复利用你
PDF2Word能够从PDF格式文档中提取文字、图形和其它内容存放入Word格式文档中,因此你就能重复利用你
版权所有 IT知识库 CopyRight © 2009-2015 IT知识库 IT610.com , All Rights Reserved. 京ICP备09083238号