最新公告
  • 欢迎您光临立业阁,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • java出现乱码的原因与解决方法详解_Java教程


    java在字符串中统一用Unicode表示。(推荐:java视频教程

    对于任意一个字符串:String string = “测试字符串”;

    如果源文件是GBK编码,操作系统默认环境编码也为GBK,那么编译的时候,JVM将按照GBK编码将字节数组解析为字符,然后将字符转换为Unicode格式的字节数组,作为内部存储(字节数组→字符→Unicode字节数组)

    当打印这个字符串时,JVM根据操作系统本地的语言环境,将Unicode转换为GBK,然后操作系统将GBK格式的内容显示出来。

    当源码文件是UTF-8, 我们需要通知编译器源码的格式,javac -encoding utf-8 … , 编译时,JVM按照utf-8 解析成字符,然后转换为unicode格式的字节数组, 那么不论源码文件是什么格式,同样的字符串,最后得到的unicode字节数组是完全一致的,显示的时候,也是转成GBK来显示(跟OS环境有关)

    乱码是如何产生的?

    本质上都是由于字符串原本的编码格式与读取时解析用的编码格式不一致导致的。

    乱码指的是程序显示出来的字符文本无法用任何语言去解读。一般情况下会包含大量的?。乱码问题是所有计算机用户或多或少会遇到的问题。

    造成乱码的原因就是因为使用了错误的字符编码去解码字节流,因此当我们在思考任何跟文本显示有关的问题时,请时刻保持清醒:当前使用的字符编码是什么。只有这样,我们才能正确分析和处理乱码问题。

    例如最常见的网页乱码问题。如果你是网站技术人员,遇到这样的问题,需要检查以下原因:

    1、服务器返回的响应头Content-Type没有指明字符编码

    2、网页内是否使用META HTTP-EQUIV标签指定了字符编码

    3、网页文件本身存储时使用的字符编码和网页声明的字符编码是否一致

    java代码中的乱码问题如何解决呢?

    例如:String s = “测试字符串”;

    System.out.println( new String(s.getBytes(),"UTF-8")); 
    //错误,因为getBytes()默认使用GBK编码, 而解析时使用UTF-8编码,肯定出错。

    其中getBytes()是将Unicode转换为操作系统默认格式的字节数组,即“测试字符串”的GBK格式,new String (bytes, Charset) 中的charset 是指定读取byte的方式,这里指定为UTF-8,即把bytes的内容当做UTF-8来读取。

    如下两种方式得到的结果都是正确的,因为它们的源内容编码和解析用的编码是一致的。

    System.out.println( new String(s.getBytes(),"GBK"));
    System.out.println( new String(s.getBytes("UTF-8"),"UTF-8"));

    那么,如何利用getBytes 和 new String() 来进行编码转换呢?

    网上流传着一种错误的方法:

    GBK--> UTF-8: new String( s.getBytes("GBK") , "UTF-8);

    这种方式是完全错误的,因为getBytes 的编码与 UTF-8 不一致,肯定是乱码。

    但是为什么在tomcat 下,使用 new String(s.getBytes(“iso-8859-1”) ,”GBK”) 却可以用呢?

    答案是:

    tomcat 默认使用iso-8859-1编码, 也就是说,如果原本字符串是GBK的,tomcat传输过程中,将GBK转成iso-8859-1了,默认情况下,使用iso-8859-1读取中文肯定是有问题的。

    那么我们需要将iso-8859-1 再转成GBK, 而iso-8859-1 是单字节编码的,即他认为一个字节是一个字符, 那么这种转换不会对原来的字节数组做任何改变,因为字节数组本来就是由单个字节组成的。

    如果之前用GBK编码,那么转成iso-8859-1后编码内容完全没变, 则 s.getBytes(“iso-8859-1”) 实际上还是原来GBK的编码内容则 new String(s.getBytes(“iso-8859-1”) ,”GBK”) 就可以正确解码了。 所以说这是一种巧合。

    如何正确的将GBK转UTF-8 ? (实际上是unicode转UTF-8)

    //利用getBytes将unicode字符串转成UTF-8格式的字节数组,然后用utf-8 对这个字节数组解码成新的字符串
    new String( s.getBytes("utf-8") , "utf-8");
    
    UTF-8 转GBK原理也是一样
    new String( s.getBytes("GBK") , "GBK");

    其实核心工作都由getBytes(charset)做了。getBytes的JDK描述:Encoding this String into a sequence of bytes using the named charset,storing the result into a new byte array.

    OutputStreamWriter w1 = new OutputStreamWriter(new FileOutputStream("D:\\file1.txt"),"UTF-8");
    InputStreamReader( stream, charset)

    可以帮助我们轻松的按照指定编码读写文件。

    附录:
    HttpClient post请求中文乱码问题解决

    最近接到现场同事反馈,在掉接口的过程中,厂家收到的请求报文中文是乱码的。我检查了版控的代码,找到如下解决办法:

    原始代码(中文乱码):

    HttpPost httpPost = new HttpPost(url);
    DefaultHttpClient httpClient = new DefaultHttpClient();
    //请求头
    httpPost.setHeader("Accept", MediaType.APPLICATION_JSON);
    httpPost.setHeader("Content-Type", "application/json;charset=UTF-8");
    //请求实体
    StringEntity reqEntity = new StringEntity(reqStr);
    httpPost.setEntity(reqEntity);
    //获取响应
    HttpResponse httpResp = httpClient.execute(httpPost);
    HttpEntity respEntity = httpResp.getEntity();

    解决办法:

    方法一:
    //请求实体
    HttpEntity reqEntity = new ByteArrayEntity(reqStr.getBytes("UTF-8"));
    //StringEntity reqEntity = new StringEntity(reqStr);
    httpPost.setEntity(reqEntity);
    
    方法二:
    //请求实体
    StringEntity reqEntity = new StringEntity(reqStr,Charset.forName("UTF-8"));
    httpPost.setEntity(reqEntity);

    更多java知识请关注java基础教程栏目。

    以上就是java出现乱码的原因与解决方法详解的详细内容,更多请关注liyege.cn其它相关文章!

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    • 1155会员总数(位)
    • 111856资源总数(个)
    • 6本周发布(个)
    • 0 今日发布(个)
    • 241稳定运行(天)

    提供最优质的资源集合

    立即查看 了解详情
    冀ICP备19022365号-1 百度地图

    [email protected]

    立业阁(www.liyege.cn)免费提供wordpress主题模板、dedecms模板、帝国cms模板、小说网站源码、电影网站源码以及网络技术分享,建站源码,小说模板,电影模板,网赚教程,VPS推荐