JVM基础知识-个人在线分享

一、JVM的内存区域划分

一个进程在运行的时候,会向操作系统申请到内存资源,从来存放程序运行的相关数据。

JVM本质上就是一个java进程,在运行的时候也会从操作系统那搞一块内存，供Java代码执行使用。

JVM又把申请的一块内存根据不同的用途划分出了不同区域。

JVM基础知识插图

每一个线程中都独有一份自己的栈空间和程序计数器(PC)

栈：存放方法调用关系,局部变量。

程序计数器(PC)：记录当前线程执行的下一条指令的内存地址。

堆：存放对象的实例,即new出来的对象都在这里。

方法区(元数据区)：存放类对象,常量池,静态成员。

二、JVM类加载机制

类加载本质上就是将.class文件(硬盘)加载到内存(方法区)中。

Java程序最开始在编写的时候是一个.java文件,然后通过编译生成.class(字节码)文件,运行java程序,JVM就会读取.class文件,把文件的内容放到内存中,构造.class对象。

类加载的过程

JVM基础知识插图(1)

加载:找到.class文件,打开文件,读取文件内容。
验证:检查当前.class文件的格式。
准备:给类对象分配内存空间。给类对象分配空间并进行默认初始化(一般置为0)。
解析:主要针对字符串常量,将常量池中的符号引用替换为直接引用。
符号引用:相对的位置
直接引用:真是的内存地址
在.class文件中,由于还未加载到内存中,无法确定内存地址,只能使用一个相对偏移量来表示内存地址。当JVM将.class文件进行加载分配了内存地址，此时字符串常量就有了真实地址,然后将一些引用变量中的”符号引用”替换成直接引用。
初始化:对类对象进行初始化。初始化静态成员,执行静态代码块,加载父类…..

双亲委派模型

双亲委派模型描述的是类加载的过程中,如何找.class文件。

JVM在加载.class文件的时候,需要用到类加载器,在JVM中就自带了三个类加载器。

这三个类加载器存在”父子关系”,这里的父子关系并不是通过继承形成的,而是对象中有一个引用指向”父类”加载器实例

Bootstarp ClassLoader 负责加载标准库中的类(Java标准文档中规定了需要提供哪些基本类)
Extension ClassLoader 负责加载JVM扩展库中的类(JVM厂商可能还会添加一些类)
Application ClassLoader 负责加载第三方库的类(mysql、jackson…….以及一些自己写的类)

双亲委派模型就描述了类加载的流程:

JVM基础知识插图(2)

1.先从Application ClassLoader开始，此时并不会立即搜索第三方库的类,而是先把加载任务委派给”父亲”,让父亲先尝试加载
2.到了Extension ClassLoader，此时也不会立即搜索扩展库的类,而是再把加载任务委派给”父亲”,让父亲先尝试加载
3.到了Bootstrap ClassLoader，此时Bootstrap ClassLoader没有”父亲”了,只好自己去加载类了。如果找到了这个类,就会进行下一个类的加载,如果没找到了就会回到委派的那个类加载器,即Extension ClassLoader
4.任务回到Exension ClassLoader，此时只能自己去搜索扩展库的类了。如果找到了这个类,就会进行下一个类的加载,如果没找到了就会回到委派的那个类加载器,即Application ClassLoader
5.任务回到Application ClassLoader，此时只能自己去搜索第三方库的类了。
如果找到了这个类,就会进行下一个类的加载,如果没找到了会抛出异常。

总结:双亲委派模型就是一个找.class文件的过程。平时如果我们创建一个跟标准库中名字一样的类,使用的时候依旧是标准库中的那一个,因为双亲委派模型机制,会优先使用标准库的类,这也是这个机制的意义。

类加载时机

类加载使用了懒汉模式,即当使用的时候才会进行加载。

大致可以分为三个时机:

构造类的实例
使用了类的静态方法/静态属性
子类的加载会触发父类

一旦类被加载好了,后续使用就不必再加载了,直接使用即可。

三、JVM垃圾回收机制

在C语言中使用malloc手动申请完内存后需要手动释放,如果光申请而不去释放的话,到达一定程度后,内存被耗尽,程序就会崩溃,但是通过程序猿来手动操作就非常考验个人水平了,无法保证可靠。

Java为了解决上述问题,就引入了垃圾回收机制,自动的把垃圾释放掉。

虽然这个垃圾回收(GC)这个机制非常香,但是也是需要付出代价的,即消耗额外的系统资源和性能开销,同时也出现STW问题。

STW问题:
Stop-The-World 简称 STW，是指在执行垃圾回收的过程冻结所有用户线程的运行，直到垃圾回收线程执行结束。

垃圾回收的主战场在堆区,进行垃圾回收需要两步:判断对象是否为”垃圾”; 释放对象的内存。

判断对象是否为”垃圾”

当一个对象,在后续代码中不会被继续使用了,即这个对象已经没有任何引用指向它了,就可以认为是垃圾了。

如何判断,有如下两种思路:引用计数和可达性分析。

引用计数

核心思路：给每个对象里面安排一个计数器,每当有引用指向它的时候,就把计数器的值+1,每当引用被销毁,计数器的值-1.当计数器为0的时候,表示这个对象为垃圾。

优点：简单，好实现。

缺点：空间利用率低,浪费内存空间(当对象本身比较小的时候,会大大降低空间利用率)；

存在循环引用问题,导致对象不能被正确识别为垃圾。如图:

JVM基础知识插图(3)

此时对象A,B在外部已经没有人指向了,即此时我们无法通过代码再去操作A和B了,按理来说已经成为了垃圾,但此时他们的计数器都不为0,无法正确的被识别为垃圾。

在Java中没有使用这种方式,但在Python,PHP的虚拟机中就是使用了引用计数的方式来完成的。

可达性分析

在Java中就采用了这个方案。

核心思路：JVM首先会从现有代码中的能直接访问到的引用出发,尝试遍历所有能访问的对象,只要对象能访问到,就会被标记为”可达”。完成整个遍历后,除开可达对象外,其它的也就是不可达对象,也就相当于是垃圾了。

优点：能够很好的解决引用计数中的循环引用问题。

缺点：需要消耗更多的时间。

释放对象内存

释放对象内存主要有三种方式:标记清除;复制算法;标记整理。

标记清除

标记清除是一种直接释放对象内存的方式。这种方式简单粗暴,但会遇到如下问题,即当GC对象是离散,空间不连续的时候：

JVM基础知识插图(4)

此时如果直接释放对象的话,就会引起”内存碎片”。在申请内存空间的时候都是申请一块连续的内存,当使用标记清除直接释放的话,此时如果申请的内存空间比正GC对象大的话,就无法使用这块已经被回收的内存。

例如:假设上图中的每个GC对象的大小是1MB,但我们此时要申请一个2MB的内存空间,由于每个GC对象内存的前后的内存被占用了,我们就无法申请到空间.

复制算法

复制算法的核心思路是将空间分成两份,把有效对象复制到另一部分内存空间,来避免内存空间。

JVM基础知识插图(5)

先是将左侧有效对象进行复制,放到右侧,然后再释放内存,当用了一段时间后,右侧也会有许多需要GC的对象,此时就将有效对象复制到左侧,循环往复。

虽然这种方式能有效的解决内存碎片问题,但当需要复制的对象内容比较多,就会引发不小的开销,并且由于会将内存进行划分,也会造成内存利用低的问题。

标记整理

标记整理是使用顺序表删除元素的思路。

每当要GC一个对象,会将后面的对象往前搬运。

JVM基础知识插图(6)

这种方式,不仅可以解决内存碎片问题,也解决了内存利用率低的问题,但是会涉及频繁搬运的问题,这就会带来不小的开销。

分代回收

设计JVM的大佬集百家之长,搞了一个综合性的解决方法:分代回收。

分代回收是基于”一个对象存在的越久,那么它将继续存在的可能性就越高”的事实,然后对每个对象使用”年龄”标记,根据年龄来制定不同的回收策略。

JVM基础知识插图(7)

分代回收将整个堆分成了两部分:新生代和老年代。在新生代中又划分了两个不同的区域:伊甸区和幸存区。

在新生代中以复制算法为主,在老年代中以标记整理算法为主。

伊甸区中存放的是新生的对象,在经过一轮的GC后,没有被回收的对象就会被通过复制算法，复制到幸存区中。

幸存区中又划分了两块不同的空间,用来针对后续的复制算法,当第二轮GC后,没有被回收的对象就会被复制到幸存区中另一块空间。

如果一个对象在幸存区中存活了好多轮都没有挂,这个对象的年龄就比较大了,就会被复制到老年代中。

在新生代中每一轮GC留下的对象并不会很多,所以进行复制算法的开销并不会很大,而在老年代中,对象比较重要,所以销毁的也很少，此时标记整理开销也不会很大。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30