Fork me on GitHub

JDK9的新特性:String压缩和字符编码

简介

String的底层存储是什么?相信大部分人都会说是数组。如果要是再问一句,那么是以什么数组来存储呢?相信不同的人有不同的答案。

在JDK9之前,String的底层存储结构是char[],一个char需要占用两个字节的存储单位。

据说是JDK的开发人员经过调研了成千上万的应用程序的heap dump信息,然后得出了一个结论:大部分的String都是以Latin-1字符编码来表示的,只需要一个字节存储就够了,两个字节完全是浪费。

据说他们用了大数据+人工智能,得出的结论由不得我们不信。

于是在JDK9之后,字符串的底层存储变成了byte[]。

更多内容请访问www.flydean.com

底层实现

先看下java9之前的String是怎么实现的:

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence {
 
    //The value is used for character storage.
    private final char value[];
}

再看下java9中String的实现和一些关键的变量:

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence {
 
    /** The value is used for character storage. */
    @Stable
    private final byte[] value;

    private final byte coder;

    @Native static final byte LATIN1 = 0;
    @Native static final byte UTF16  = 1;

    static final boolean COMPACT_STRINGS;

    static {
        COMPACT_STRINGS = true;
    }

从代码我们可以看到底层的存储已经变成了byte[]。

再看一下coder变量,coder代表编码的格式,目前String支持两种编码格式LATIN1和UTF16。

LATIN1需要用一个字节来存储。而UTF16需要使用2个字节或者4个字节来存储。

而COMPACT_STRINGS则是用来控制是否开启String的compact功能。默认情况下COMPACT_STRINGS功能是开启的。

如果我们想关闭COMPACT_STRINGS功能则可以使用-XX:-CompactStrings参数。

总结

本文讲解了新的String实现和COMPACT_STRINGS模式的关闭方法。

本文作者:flydean程序那些事

本文链接:http://www.flydean.com/jdk9-string-compact/

本文来源:flydean的博客

欢迎关注我的公众号:程序那些事,更多精彩等着您!

posted @   flydean  阅读(1517)  评论(1)    收藏  举报
编辑推荐:
· Java虚拟机代码是如何一步一步变复杂且难以理解的?
· 领域驱动的事实与谬误 一 DDD 与 MVC
· SQL Server 2025 中的改进
· 当数据爆炸遇上SQL Server:优化策略全链路解析
· 记录一次线上问题排查:JDK序列化问题
阅读排行:
· 一个包含 80+ C#/.NET 编程技巧实战练习开源项目!
· 待到山花烂漫时:鸿蒙开发者的个人感悟
· 凯亚利用直播推流技术请大家看电影
· Socket实践:使用云服务器当代理连接公司内网,简单实现跨局域网调用部署在公司局域网里的api接口
· 【SQL周周练】一句 SQL 如何帮助 5 个人买到电影院最好的座位?
点击右上角即可分享
微信分享提示