当前位置:首页 > 开发 > 编程语言 > 编程 > 正文

诡异的dom4j的输出

发表于: 2011-04-13   作者:asialee   来源:转载   浏览次数:
摘要:         昨天发现一个问题,使用dom4j的XMLWrtier输出的问题。         首先先说一下现象吧,如果XML里面包含了一些特殊字符,比如 
 这个是line feed,也就是换行符。在经过它输出后总是会变成\n, 不好干预
        昨天发现一个问题,使用dom4j的XMLWrtier输出的问题。
        首先先说一下现象吧,如果XML里面包含了一些特殊字符,比如 
 这个是line feed,也就是换行符。在经过它输出后总是会变成\n, 不好干预它的转化。下面来看具体的例子。
这个是原始的xml文件:
     
<?xml version="1.0" encoding="UTF-8"?>
<Package id = "test" name = "Test&#10;Test">
	
</Package>
        


下面是测试代码:

import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.InputStreamReader;

import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.stream.StreamResult;

import junit.framework.Assert;

import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.DocumentSource;
import org.dom4j.io.XMLWriter;
import org.junit.Test;

public class TestXMLOutput {
	
	public final static String FILE_NAME = "text.xml";
	
	@Test
	public  void testDom4j() {

		Document document = createDocument();
		try {
			Element rootElement = document.getRootElement();
			String packageName = rootElement.attributeValue("name");
			
			Assert.assertEquals("Test\nTest", packageName);
			
			FileOutputStream fos = new FileOutputStream("dom4j_"+FILE_NAME);
			XMLWriter writer = new XMLWriter(fos);
			writer.setEscapeText(false);
			writer.write(document);
			
			fos.close();
			writer.close();
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
	
	@Test
	public void testDom(){
		Document document = createDocument();
		
		Element rootElement = document.getRootElement();
		String packageName = rootElement.attributeValue("name");
		
		Assert.assertEquals("Test\nTest", packageName);
		
		try {
			FileOutputStream fos = new FileOutputStream("dom_"+FILE_NAME);
			 // Use a Transformer for output
			 TransformerFactory tFactory =
			    TransformerFactory.newInstance();
			 Transformer transformer = tFactory.newTransformer();
			 transformer.setOutputProperty("indent","yes");
			 transformer.setOutputProperty("{http://xml.apache.org/xslt}indent-amount","4");
			 transformer.setOutputProperty("encoding","UTF-8");
			 
			 DocumentSource source = new DocumentSource(document);
			 StreamResult result = new StreamResult(fos);
			 transformer.transform(source,result);
			 
			 fos.close();
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
	
	private Document createDocument(){
		Document document = null;
		try {
			File file = new File(FILE_NAME);
			BufferedReader reader = new BufferedReader(
					new InputStreamReader(new FileInputStream(file)));
			
			StringBuffer buffer = new StringBuffer();
			String line = "";
			while((line = reader.readLine()) != null){
				buffer.append(line);
			}
			reader.close();
			
			document = DocumentHelper.parseText(buffer.toString());
		} catch (Exception e) {
			e.printStackTrace();
		}
		return document;
	}
}


下面是dom4j的转换后的输出:

<?xml version="1.0" encoding="UTF-8"?>
<Package id="test" name="Test
Test">	</Package>


下面是transfomer的输出:
<?xml version="1.0" encoding="UTF-8"?>
<Package id="test" name="Test&#10;Test">	</Package>


大家看到效果了把,dom4j变成了 \n, 但是transfomer还是原来的格式。
如果大家谁有对这块有研究的,希望给我留言解决这个问题。

另外,我把工程上传,希望大家帮忙解决。

诡异的dom4j的输出

  • 0

    开心

    开心

  • 0

    板砖

    板砖

  • 0

    感动

    感动

  • 0

    有用

    有用

  • 0

    疑问

    疑问

  • 0

    难过

    难过

  • 0

    无聊

    无聊

  • 0

    震惊

    震惊

编辑推荐
第一场景: 在宇宙飞船上,都是外星人……囧 3D实景的动画游戏,可以两人玩的对打的游戏……游戏现
现象: <beans:bean class="org.springframework.web.servlet.view.InternalResourceViewResolve
现象: <beans:bean class="org.springframework.web.servlet.view.InternalResourceViewResolve
有这样一段 SQL 代码: 通过 C# 获取查询结果: SQL 代码中有两个参数,且都是字符串类型,以上的 C
今天在工作中遇到一个诡异的问题,代码如下: private DataTable CovertDataType(DataTable orgData
看了很多关于NGUI drawCall的文章,见得比较多的一个观点是:一个 Atlas 对应一个Drawcall。 好奇心
想必经常写js的人必然会经常性的用到prototype这个属性,我写这篇文章倒不是自己对prototype这个属
有一张表,很多数据: 想取某个月的数据。初始的想法很简单,根据日期(RQ)形成条件即可: 符合条
这个问题不知道算不是微软sharepoint的bug,暂且说是一个bug吧. 该问题目前出现在列表为“文档库”类
今天新建了两个web项目,测试总是在其中一个项目图标下面有个错误提示,但是里面的类并没有报出错误
版权所有 IT知识库 CopyRight © 2009-2015 IT知识库 IT610.com , All Rights Reserved. 京ICP备09083238号