Struts+Hibernate+MyEclipse+Tomcat+MySQL的乱码之解决篇

在系统中出现乱码一般是编码设定和编码转换问题,那么我们来看看当中有多少编码设定和编码转换的呢?



显示界面,JSP 2.0      

JAVA容器:Tomcat 5.X

MVC构架:Struts 1.2

ORM工具:Hibernate 3

数据库:MySQL   5.0

编译IDE:MyEclipse 5.0



知道了有六个地方要设定编码,那么哪种编码最好呢?使用中文可以GBK,但我认为UTF-8会是更好的选择,如果想知道了解编码的更多细节,请访问:

计算机编码大全-A

计算机编码大全-B



好现在选定UTF-8,在上面的这六个地方一一设定吧:



显示界面,JSP

       在页面的开头加入或修改成:<%@ page language="java" pageEncoding="utf-8"%> 红色部分为要设定部分。



JAVA容器:Tomcat

       本人参照某兄台的之作:Tomcat中文编码问题解决方案(简) 有兴趣可以进去看看。

       下面开始设定,在Tomcat安装目录下的conf文件打开Server.xml文件,找到相应段落并更改成以下字样:

       <Connector port="8080" maxThreads="150" minSpareThreads="25"

maxSpareThreads="75" enableLookups="false" redirectPort="8443"

acceptCount="100" debug="0" connectionTimeout="20000"

        disableUploadTimeout="true"  URIEncoding="utf-8"/>

       红色部分为要设定部分。



MVC构架:Struts

       在这里添加一个字符集的Fliter,代码如下:

package com.ruder.filters;

//上面的包名表示你把这个Fliter文件放在哪个包中,在下面的Web.xml也要相应改动。
import java.io.IOException;
import javax.servlet.Filter;
import javax.servlet.FilterChain;
import javax.servlet.FilterConfig;
import javax.servlet.ServletException;
import javax.servlet.ServletRequest;
import javax.servlet.ServletResponse;
import javax.servlet.UnavailableException;
public class SetCharacterEncodingFilter implements Filter {
protected String encoding = null;
protected FilterConfig filterConfig = null;
protected boolean ignore = true;
public void destroy() {
this.encoding = null;
this.filterConfig = null;
}
public void doFilter(ServletRequest request, ServletResponse response,
FilterChain chain)
throws IOException, ServletException {
// Conditionally select and set the character encoding to be used
if (ignore || (request.getCharacterEncoding() == null)) {
String encoding = selectEncoding(request);
if (encoding != null)
request.setCharacterEncoding(encoding);
}
// Pass control on to the next filter
chain.doFilter(request, response);
}
public void init(FilterConfig filterConfig) throws ServletException {
this.filterConfig = filterConfig;
this.encoding = filterConfig.getInitParameter("encoding");
String value = filterConfig.getInitParameter("ignore");
if (value == null)
this.ignore = true;
else if (value.equalsIgnoreCase("true"))
this.ignore = true;
else if (value.equalsIgnoreCase("yes"))
this.ignore = true;
else
this.ignore = false;
}
protected String selectEncoding(ServletRequest request) {
return (this.encoding);
}
}

下面是对Web.xml的配置:

<filter>

                   <filter-name>Set Character Encoding</filter-name>

                           <filter-class>com.ruder.filters.SetCharacterEncodingFilter</filter-class>

                   <init-param>

                           <param-name>encoding</param-name>

                          <param-value>UTF-8</param-value>

                </init-param>

      </filter>

       <filter-mapping>

                           <filter-name>Set Character Encoding</filter-name>

                   <url-pattern>
21    public void init(FilterConfig arg0) throws ServletException {
22        // TODO Auto-generated method stub
23        this.filterConfig = arg0;
24        this.defaultEncoding = filterConfig.getInitParameter("defaultencoding");
25    }
26
27   
30    public void doFilter(
31        ServletRequest request,
32        ServletResponse response,
33        FilterChain chain)
34        throws IOException, ServletException {
35        // TODO Auto-generated method stub
36        request.setCharacterEncoding(selectEncoding(request));
37        chain.doFilter(request, response);
38    }
39
40
41    public void destroy() {
42        
43        this.defaultEncoding = null;
44        this.filterConfig = null;
45    }
46
47
48    protected String selectEncoding(ServletRequest request) {
49
50        return this.defaultEncoding;
51    }
52
53}


4.提交表单的jsp页面设置
<%@ page language="java"  contentType="text/html; charset=UTF-8"%>




至此问题已经解决,但是还有一些我们应该了解的,下面我简述一下:

为 每个jsp页面设置了其编码格式(utf-8),但传递数据到另一页面时依然显示为乱码?  首先要需要了解的是web容器默认编码是iso- 8859-1,一个汉字占用两个字节,而在utf-8中一个汉字占用三个字节。所以在数据传递过程中,必须手动设定容器编码格式,否则会出现字符位丢失的 情况。即3个字节变为两个字节,自然会变成乱码。为什么保存到数据库中的数据都变成了乱码?  原理同上,首先要搞清楚使用的数据库默认的编码格式,比如 mysql默认的字符编码是ISO-8859-1。所以必须手动修改其默认编码格式。  清楚了以上问题后,再来看如何解决utf-8的乱码问题。

1. 设置web容器的编码格式。为你的servlet的doGet或doPost方法开始处加入如下代 码:request.setCharacterEncoding("utf-8");   response.setCharacterEncoding ("utf-8");

2.为每个jsp页面指定其编码格式。<%@ page pageEncoding="utf-8"%>

3.在连接数据库用的URL后加入:useUnicode=true; characterEncoding=utf-8 如: url="jdbc:mysql:///db1?useUnicode=true; characterEncoding=utf-8"

4.为指定数据库默认编码格式。在C:\WINDOWS目录下找到my.ini文件,并在 [mysqld]中加入default-character-set=gbk,重新启动mysql服务。 

至此,乱码问题全部解决。

起初总搞上去不清,为什么要将mysql的默认编码格式设置为gbk,后来由相关的资料得知utf-8默认输入编码方式为gbk,默认输出编码方式为utf-16be。  

个 人认为,将数据进行utf-8进行编码的目的(即将中文编码为%的形式),主要是为了在多层服务间进行数据传输时,防止发生字符丢失(如msn)。普通的 web程序显然没有必要这样做,只要使用以上方法进行处理,就可以有效的解决乱码问题,从而结省存储空间。如果都像公司的SC系统那样,将一个汉字编码为 18个字符后,再存储到数据库中,抛开效率不说,就存储空间的浪费就够人受的,要知道,那是需要银子地!