Word 转成HTML

发表于2015-12-022019-01-01 作者 wind

来自CSDN的代码：

import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;

import org.apache.poi.xwpf.converter.core.FileImageExtractor;
import org.apache.poi.xwpf.converter.core.FileURIResolver;
import org.apache.poi.xwpf.converter.xhtml.XHTMLConverter;
import org.apache.poi.xwpf.converter.xhtml.XHTMLOptions;
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFPictureData;
import org.junit.Assert;
import org.junit.Test;

public class word07toHtml {

	@Test
	public void canExtractImage() throws IOException {
		File f = new File("d:/test/test.docx");
		if (!f.exists()) {
			System.out.println("Sorry File does not Exists!");
		} else {
			if (f.getName().endsWith(".docx") || f.getName().endsWith(".DOCX")) {
				
				// 1) Load DOCX into XWPFDocument
				InputStream in = new FileInputStream(f);
				XWPFDocument document = new XWPFDocument(in);

				// 2) Prepare XHTML options (here we set the IURIResolver to
				// load images from a "word/media" folder)
				File imageFolderFile = new File("d:/test/media");
				XHTMLOptions options = XHTMLOptions.create().URIResolver(
						new FileURIResolver(imageFolderFile));
				options.setExtractor(new FileImageExtractor(imageFolderFile));

				// 3) Convert XWPFDocument to XHTML
				OutputStream out = new FileOutputStream(new File(
						"d:/test/test.htm"));
				XHTMLConverter.getInstance().convert(document, out, options);
			} else {
				System.out.println("Enter only MS Office 2007+ files");
			}
		}
	}
}

了解工作生活心情记忆的更多信息

订阅后即可通过电子邮件收到最新文章。

发表回复取消回复

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理。

BigData (14)
- Doris (1)
- flink (7)
- Hadoop (4)
- HBase (2)
- Ignite (1)
Database (34)
- Mongo (1)
- mssql (1)
- MyCat (1)
- MySQL (28)
- psql (1)
DevOps (1)
Docker (24)
- k8s (12)
English (8)
groovy (1)
Java (117)
- Activiti (4)
- Cas (1)
- Gradle (1)
- Hibernate (7)
- jackson (4)
- jetty (1)
- jms (1)
- JPA (5)
- jxl (1)
- log4j (1)
- mail (1)
- Maven (16)
- mybatis (1)
- poi (2)
- regex (1)
- report (1)
- Shiro (1)
- spring (26)
  - SpringBoot (7)
  - SpringCloud (4)
  - SpringMVC (11)
  - SpringSecurity (1)
- Test (1)
- Thymeleaf (1)
- Tomcat (4)
- velocity (1)
- 加密 (2)
Linux (58)
- shell (4)
- tty (1)
- vim (3)
- vsftpd (3)
Mac (26)
Mobile (6)
- Android (6)
music (5)
Network (2)
NodeJS (5)
- npm (3)
OpenWrt (2)
Python (2)
qcloud (1)
rust (1)
Server (7)
- SSL (7)
Think (29)
Video (1)
web (54)
- Angular (2)
- angular-demo (1)
- AngularJS (7)
- CSS (2)
- CSS3 (5)
- element-ui (1)
- eslint (1)
- ExtJS (1)
- H5 (2)
- html5 (2)
- JavaScript (4)
- jQuery (2)
- js (4)
- JS控件 (4)
- nginx (4)
- vue (4)
- websocket (1)
- wordpress (7)
windows (5)
云计算 (1)
工具技巧 (50)
- chrome (7)
- Git (6)
- gitlab (1)
- jenkins (4)
- postman (1)
- vscode (2)
- wsl (2)
微信平台 (4)
- 小程序 (2)
政策 (2)
日记 (136)
未分类 (35)
- 字体 (1)
架构 (4)
算法 (2)
行业知识 (6)
- Ad (4)
- 打印 (1)
项目经验 (2)