关于 Java String,这是面试的基础,但是还有很多童鞋不能说清楚,所以本文将简单而又透彻的说明一下那个让你迷惑的 String

在 Java 中,我们有两种方式创建一个字符串

1
2
String x = "abc";
String y = new String("abc");

你常见也常写第一种,很少见第二种,但面试还总问这类问题,双引号和构造器两种形式创建字符串到底有什么差别呢?

先来看例子

例子 1

1
2
3
4
String a = "abcd";
String b = "abcd";
System.out.println(a == b); // True
System.out.println(a.equals(b)); // True

a == b 结果为 true,是因为 a 和 b 都指向 方法区(method area) 同一个字符串文字,内存引用是同一个

当多次创建相同的字符串文字时,只存储每个不同字符串值的一个副本。这个叫做字符串留驻/留用,Java 中所有编译期字符串常量都会被自动留驻

例子 2

1
2
3
4
String c = new String("abcd");
String d = new String("abcd");
System.out.println(c == d); // False
System.out.println(c.equals(d)); // True

c==d 结果为 false,因为 c 和 d 的引用指向中不同的对象,不同的对象肯定有不同的内存引用

举了两个例子,文字描述有点懵?我们来试图通过图形来理解上述两种情况:

也许你已经看看出来了,一个是在方法区,一个是在中,在 JVM 模型中这是两个不同的区域,也许你面试时也经常被问到吧,来看下图:

再次提醒一下,所有 new 的对象都会在 Heap 中,这样以后你就好区分了

运行期字符串留驻

上面说的字符串留驻是在编译期,那么运行期可以吗?答案是肯定的,我们需要一个函数来帮忙

1
2
3
4
String c = new String("abcd").intern();
String d = new String("abcd").intern();
System.out.println(c == d); // Now true
System.out.println(c.equals(d)); // True

看到 c == d 结果为 true,你应该理解 intern (英文有拘留,软禁的意思)的作用了,通过调用 intern()方法,就好比把创建的字符串拘留在方法区一样了

在面试时甚至还会问你下面代码创建了几个对象:

1
String d = new String("abcd")
  1. 如果方法区已存在”abcd”, 那么只创建一个 new String 的对象
  2. 如果方法区没有”abcd”, 那么要创建两个对象,一个在方法区,一个在堆中

所以,正常情况下我们没必要使用构造器创建对象,因为这很可能会产生一个额外的没用的对象,但是有例外哦,我们下面说

1
2
String s = "abcd";
s = s.concat("ef");

当我们想在字符串 s 后面拼接字符”ef”时,会在堆中创建一个新的对象,并将 s 的引用指向新创建的对象,由于 String 创建的是不可变对象,所以 String 类中的所有方法都不会改变它自身,而是返回一个新的字符串(快打开你的 IDE,看看是否每个操作String 的方法最后都是返回有 return new String 字样),到这里你也应该理解了一个道理:

如果我们需要一个字符串被修改,我们最好使用 StringBuffer 或者 StringBuilder,否则,由于每次操作字符串都会创建一个新的对象,而旧的对象不会有引用指向它,这样我们会浪费很多垃圾回收的时间

到这里还没完,你有没有想过为什么 String 会被设置/制造成 final?

为什么 String 类被 final 修饰

谈及这个问题我们需要一些倒推的或者相互约束思维来思考

字符串池的需求

字符串池(String intern pool)是方法区域中的一个特殊存储区域。当创建一个字符串时,如果该字符串已经存在于池中,那么返回现有字符串的引用,而不是创建一个新对象。所以说,如果一个字符串是可变的,那么改变一个引用的值,将导致原本指向该值的引用获取到错误的值

缓存 hashcode

字符串的hashcode在Java中经常使用。例如,在HashMap或HashSet中。不可变保证hashcode始终是相同的,这样就可以在不担心更改的情况下兑现它。这意味着,不需要每次使用hashcode时都计算它。这样更有效率。所以你会在 String 类中看到下面的成员变量的定义:

1
2
/** Cache the hash code for the string */
private int hash; // Default to 0

安全性

String被广泛用作许多java类的参数,例如网络连接、打开文件等。如果字符串不是不可变的,连接或文件将被更改,这可能导致严重的安全威胁。该方法认为它连接到一台机器上,但实际上并没有。可变字符串也可能导致反射中的安全问题,因为参数是字符串

不可变对象天生是线程安全的

由于不可变对象不能被更改,所以它们可以在多个线程之间自由共享。这消除了同步的需求。

总之,出于效率和安全性的考虑,String 被设计为不可变的。这也是为什么在一般情况下,不可变类是首选的原因。

附加说明

关于不可变对象和不可变引用总是有同学搞不清楚

1
final User user = new User();

上面的代码指的是 user 引用不能被更改指向内存的其他地址,但是由于 User 是可变对象,我们可以调用 user 的 setter 方法修改其属性

在String类中包含很多学问,包括你对JVM模型的理解,这也就是为什么面试官为什么喜欢问String,主要考察你的基本功

灵魂追问

  1. String 和基本类型的包装类如 Integer 和 Long 都被 final 修饰,但为什么不建议作为 synchronized 同步块的参数适用呢?
  2. 基本类型自动装箱你知道发生了什么吗?和上一个问题有关系

提高效率工具

Material Theme UI

这是一款 IDEA 的主题插件,安装后,选择 Material Palenight 主题,同时作出如下设置

设置完后,你的 IDEA 就是下面这样,引起极度舒适


推荐阅读


欢迎持续关注公众号:「日拱一兵」

  • 前沿 Java 技术干货分享
  • 高效工具汇总 | 回复「工具」
  • 面试问题分析与解答
  • 技术资料领取 | 回复「资料」

以读侦探小说思维轻松趣味学习 Java 技术栈相关知识,本着将复杂问题简单化,抽象问题具体化和图形化原则逐步分解技术问题,技术持续更新,请持续关注……



加我微信,咱们交流技术与思想,共同成长


 评论



Copyright 2018-2019 Tanθ's Blog   |   辽ICP备19017651号-1   |     站点总字数: 162.6k 字   |   载入天数...载入时分秒...   |  站点地图   |  站长统计
  总访问量:  次  总访问人数:  人

博客内容遵循 署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0) 协议