深入JVM内核—原理、诊断与优化之:GC参数(五)

串行收集器

最古老，最稳定
效率高
可能会产生较长的停顿
-XX:+UseSerialGC
- 新生代、老年代使用串行回收
- 新生代复制算法
- 老年代标记-压缩

图片1.png

0.844: [GC 0.844: [DefNew: 17472K->2176K(19648K), 0.0188339 secs] 17472K->2375K(63360K), 0.0189186 secs] [Times: user=0.01 sys=0.00, real=0.02 secs]

老年代:

8.259: [Full GC 8.259: [Tenured: 43711K->40302K(43712K), 0.2960477 secs] 63350K->40302K(63360K), [Perm : 17836K->17836K(32768K)], 0.2961554 secs] [Times: user=0.28 sys=0.02, real=0.30 secs]

并行收集器

ParNew
- -XX:+UseParNewGC
  - 新生代并行
  - 老年代串行
Serial收集器新生代的并行版本
复制算法
多线程，需要多核支持
-XX:ParallelGCThreads 限制线程数量

图片2.png

多线程不一定快(看什么cpu),也会stop the world

0.834: [GC 0.834: [ParNew: 13184K->1600K(14784K), 0.0092203 secs] 13184K->1921K(63936K), 0.0093401 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]

Parallel收集器
- 类似ParNew
- 新生代复制算法
- 老年代标记-压缩
- 更加关注吞吐量
- -XX:+UseParallelGC
  - 使用Parallel收集器+ 老年代串行
- -XX:+UseParallelOldGC
  - 使用Parallel收集器+ 并行老年代

图片3.png

1.500: [Full GC [PSYoungGen: 2682K->0K(19136K)] [ParOldGen: 28035K->30437K(43712K)] 30717K->30437K(62848K) [PSPermGen: 10943K->10928K(32768K)], 0.2902791 secs] [Times: user=1.44 sys=0.03, real=0.30 secs]

并行收集器

-XX:MaxGCPauseMills
- 最大停顿时间，单位毫秒
- GC尽力保证回收时间不超过设定值
-XX:GCTimeRatio
- 0-100的取值范围
- 垃圾收集时间占总时间的比
- 默认99，即最大允许1%时间做GC
这两个参数是矛盾的。因为停顿时间和吞吐量不可能同时调优

CMS收集器

Concurrent Mark Sweep 并发标记清除(与用户线程一起执行)
标记-清除算法
与标记-压缩相比
并发阶段会降低吞吐量
老年代收集器（新生代使用ParNew）
-XX:+UseConcMarkSweepGC
CMS运行过程比较复杂，着重实现了标记的过程，可分为
- 初始标记
  - 根可以直接关联到的对象
  - 速度快
- 并发标记（和用户线程一起）
  - 主要标记过程，标记全部对象
- 重新标记
  - 由于并发标记时，用户线程依然运行，因此在正式清理前，再做修正
- 并发清除（和用户线程一起）
  - 基于标记结果，直接清理对象

图片4.png

1.662: [GC [1 CMS-initial-mark: 28122K(49152K)] 29959K(63936K), 0.0046877 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
1.666: [CMS-concurrent-mark-start]
1.699: [CMS-concurrent-mark: 0.033/0.033 secs] [Times: user=0.25 sys=0.00, real=0.03 secs] 
1.699: [CMS-concurrent-preclean-start]
1.700: [CMS-concurrent-preclean: 0.000/0.000 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
1.700: [GC[YG occupancy: 1837 K (14784 K)]1.700: [Rescan (parallel) , 0.0009330 secs]1.701: [weak refs processing, 0.0000180 secs] [1 CMS-remark: 28122K(49152K)] 29959K(63936K), 0.0010248 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
1.702: [CMS-concurrent-sweep-start]
1.739: [CMS-concurrent-sweep: 0.035/0.037 secs] [Times: user=0.11 sys=0.02, real=0.05 secs] 
1.739: [CMS-concurrent-reset-start]
1.741: [CMS-concurrent-reset: 0.001/0.001 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]

特点
- 尽可能降低停顿
- 会影响系统整体吞吐量和性能
  - 比如，在用户线程运行过程中，分一半CPU去做GC，系统性能在GC阶段，反应速度就下降一半
- 清理不彻底
  - 因为在清理阶段，用户线程还在运行，会产生新的垃圾，无法清理
- 因为和用户线程一起运行，不能在空间快满时再清理
  - -XX:CMSInitiatingOccupancyFraction设置触发GC的阈值
  - 如果不幸内存预留空间不够，就会引起concurrent mode failure

33.348: [Full GC 33.348: [CMS33.357: [CMS-concurrent-sweep: 0.035/0.036 secs] [Times: user=0.11 sys=0.03, real=0.03 secs] 
 (concurrent mode failure): 47066K->39901K(49152K), 0.3896802 secs] 60771K->39901K(63936K), [CMS Perm : 22529K->22529K(32768K)], 0.3897989 secs] [Times: user=0.39 sys=0.00, real=0.39 secs]

使用串行收集器作为后备

有关碎片:标记-清除和标记-压缩

搜狗截图17年04月10日1823_2.png

-XX:+ UseCMSCompactAtFullCollection Full GC后，进行一次整理
- 整理过程是独占的，会引起停顿时间变长
-XX:+CMSFullGCsBeforeCompaction
- 设置进行几次Full GC后，进行一次碎片整理
-XX:ParallelCMSThreads
- 设定CMS的线程数量

为减轻GC压力，我们需要注意些什么？

软件如何设计架构
代码如何写
堆空间如何分配

GC参数整理

-XX:+UseSerialGC：在新生代和老年代使用串行收集器
-XX:SurvivorRatio：设置eden区大小和survivior区大小的比例
-XX:NewRatio:新生代和老年代的比
-XX:+UseParNewGC：在新生代使用并行收集器
-XX:+UseParallelGC ：新生代使用并行回收收集器
-XX:+UseParallelOldGC：老年代使用并行回收收集器
-XX:ParallelGCThreads：设置用于垃圾回收的线程数
-XX:+UseConcMarkSweepGC：新生代使用并行收集器，老年代使用CMS+串行收集器
-XX:ParallelCMSThreads：设定CMS的线程数量
-XX:CMSInitiatingOccupancyFraction：设置CMS收集器在老年代空间被使用多少后触发
-XX:+UseCMSCompactAtFullCollection：设置CMS收集器在完成垃圾收集后是否要进行一次内存碎片的整理
-XX:CMSFullGCsBeforeCompaction：设定进行多少次CMS垃圾回收后，进行一次内存压缩
-XX:+CMSClassUnloadingEnabled：允许对类元数据进行回收
-XX:CMSInitiatingPermOccupancyFraction：当永久区占用率达到这一百分比时，启动CMS回收
-XX:UseCMSInitiatingOccupancyOnly：表示只在到达阀值的时候，才进行CMS回收

Tomcat实例

环境
- Tomcat 7
- JSP 网站
- 测试网站吞吐量和延时
工具
- JMeter
目的
- 让Tomcat有一个不错的吞吐量
系统结构

搜狗截图17年04月10日1828_3.png

Jmeter
- 性能测试工具
- 建立10个线程，每个线程请求Tomcat 1000次共10000次请求

图片5.png

JDK6：使用32M堆处理请求
参数：
set CATALINA_OPTS=-server -Xloggc:gc.log -XX:+PrintGCDetails -Xmx32M -Xms32M -XX:+HeapDumpOnOutOfMemoryError -XX:+UseSerialGC -XX:PermSize=32M

图片6.png

图片7.png

JDK6：使用最大堆512M堆处理请求
参数：
set CATALINA_OPTS=-Xmx512m -XX:MaxPermSize=32M -Xloggc:gc.log -XX:+PrintGCDetails
结果：FULL GC很少，基本上是Minor GC

图片8.png

图片9.png

图片10.png

从16M增长到60M

JDK6：使用最大堆512M堆处理请求
参数：
set CATALINA_OPTS=-Xmx512m -Xms64m -XX:MaxPermSize=32M -Xloggc:gc.log -XX:+PrintGCDetails -XX:+UseParallelGC -XX:+UseParallelOldGC -XX:ParallelGCThreads=4
结果：GC压力原本不大，修改GC方式影响很小

图片11.png

JDK 6
set CATALINA_OPTS=-Xmx40m -Xms40m -XX:MaxPermSize=32M -Xloggc:gc.log -XX:+PrintGCDetails
减小堆大小，增加GC压力，使用Serial回收器

图片12.png

JDK 6
set CATALINA_OPTS=-Xmx40m -Xms40m -XX:MaxPermSize=32M -Xloggc:gc.log -XX:+PrintGCDetails -XX:+UseParallelOldGC -XX:ParallelGCThreads=4
减小堆大小，增加GC压力，使用并行回收器

图片13.png

JDK 6
set CATALINA_OPTS=-Xmx40m -Xms40m -XX:MaxPermSize=32M -* Xloggc:gc.log -XX:+PrintGCDetails -XX:+UseParNewGC
减小堆大小，增加GC压力，使用ParNew回收器

图片14.png

启动Tomcat 7
使用JDK6
不加任何参数启动测试

图片15.png

启动Tomcat 7
使用JDK7
不加任何参数启动测试

图片16.png

升级JDK可能会带来额外的性能提升！

性能的根本在应用
GC参数属于微调
设置不合理，会影响性能，产生大的延时

Matrix42

深入JVM内核—原理、诊断与优化之:GC参数(五)

串行收集器

并行收集器

并行收集器

CMS收集器

GC参数整理

Tomcat实例

Matrix42

Record and Share!