当前位置:首页 > 开发 > 系统架构 > Tomcat > 正文

从tomcat乱码问题中学习Java编码

发表于: 2014-04-03   作者:aawty   来源:转载   浏览:
摘要:     项目在jetty中运行正常,打包到tomcat中,发现项目有的页面出现乱码。好像之前部署的时候也出现过这个BUG,但是当时不是这个项目,也不是我解决的。刚好趁这次回顾一下以前学习的编码知识。     关于为什么要编码:计算机中存储信息的最小单元是一个字节,8bit(0~255),人类要表示的符号太多,无法用一个字节完全表示,则有

    项目在jetty中运行正常,打包到tomcat中,发现项目有的页面出现乱码。好像之前部署的时候也出现过这个BUG,但是当时不是这个项目,也不是我解决的。刚好趁这次回顾一下以前学习的编码知识。

    关于为什么要编码:计算机中存储信息的最小单元是一个字节,8bit(0~255),人类要表示的符号太多,无法用一个字节完全表示,则有一个新的数据结构Char到byte的编码。

    JAVA中经常遇到几种编码格式的区别:ASCII,ISO-8895-1,GB2312,GBK,UTF-8,UTF-16看作字典,规定了转换规则。

    Java中需要编码的场景:1.I/O操作中存在编码(磁盘和网络I/O),InputStreamReader类是关联字节到字符的桥梁,负责I/O过程中字节到字符的转换,具体转换委托给StreamDecoder解码,其中由用户指定编码格式;2.内存操作中的编码。

    Java中需要编码的数据:用户从浏览器发起一个HTTP请求,存在编码的地方是URL,Cookie,Parameter.服务器端要解析HTTP协议,其中URI.COOKIE.POST表单参数要解码,服务器端可能要读取数据库中的数据——本地或网络中其他地方的文本文件,都存在编码问题。

    通常可以将常见的乱码问题分为JSP页面显示中文乱码、表单提交乱码两类。

    JSP页面中显示中文乱码:在JSP文件中使用page命令指定响应结果的MIME类型,如<%@ page language="java" contentType="text/html;charset=gb2312" %>

    表单提交乱码: 主要是因为服务器处理编码的方式和页面提交方式(post和get)不同。以tomcat为例,tomcat处理提交的参数时默认的是iso-8859-1,使用request.getParameter方法会得到乱码。换句话说:tomcat默认将单字节作为一个字符,但是中文是2个或者3个字节表示一个字符。

    tomcat遇到的常见问题解决方式。

    对于post方式:解决办法是编写一个过滤器统一处理post请求,过滤器在用户提交的数据被处理之前被调用

    对于get方式:这是我所遇到的情况。tomcat对post和get的处理方法不一样,所以过滤器不能解决get的乱码问题,它需要在其他地方设置。解决方法是打开<tomcat_home>\conf目录下server.xml文件,找到对8080端口进行服务的Connector组件的设置部分,给这个组件添加一个属性:URIEncoding="UTF-8"。注意修改后重新启动tomcat才能起作用。

    为什么get方式要这样处理?因为客户端发送过来的请求,tomcat对url编码会判断server.xml中没有设置URIEncoding,如果有设置,则用设置的编码方式,否则用tomcat默认的即iso-8859-1(iso-8859-1)。我遇到的也是因为get中参数提交的时候出现以上情况。

 

参考:深入分析java web技术内幕   第3章 深入分析Java Web中的中文编码问题
          http://nileader.blog.51cto.com/1381108/384353

          http://zhuzhsh.iteye.com/blog/251743

     

   

从tomcat乱码问题中学习Java编码

  • 0

    开心

    开心

  • 0

    板砖

    板砖

  • 0

    感动

    感动

  • 0

    有用

    有用

  • 0

    疑问

    疑问

  • 0

    难过

    难过

  • 0

    无聊

    无聊

  • 0

    震惊

    震惊

编辑推荐
来源:http://www.javaeye.com/topic/300656 最近又碰到了中文乱码问题,这里我没有把数据库牵扯进
JAVA学习---Myeclipse中乱码的问题 2010-04-12 17:43 (1)Myeclipse中文注释乱码的问题 编码的问题
最近项目中发现前后端编码问题有很多陷阱,特地把自己遇到的一些写出来。 1、页面title、内容乱码,
此处对于开发中的编码问题做一个小集结,首先看下下面几个: 1、几种编码介绍 在jsp、servlet中有如
在Android Studio中,无论是自己新建的项目,还是import的项目,亦或是从网络返回的数据,只要其中
在tomcat文件夹的conf文件夹下,改动server.xml文件,在以下截图中的位置加上URIEncoding="UTF-8"则
一、Java、JSP编码 开发工具会有好多地方设置编码这个不解少了,这里不介绍了。 java与mysq编码对应
首先说在java里那些地方能够设置编码 开发工具会有好多地方设置编码这个不解少了,这里不介绍了。
近来试着FTP搜索,遇到编码问题,研究了下。 Java内部的String为Unicode编码,每个字符占两个字节。
Java编码及网络传输中的编码问题 Java编码及网络传输中的编码问题  近来试着FTP搜索,遇到编码问题
版权所有 IT知识库 CopyRight © 2009-2015 IT知识库 IT610.com , All Rights Reserved. 京ICP备09083238号