35

Redis client 链接池配置不当引起的频繁 full gc

 5 years ago
source link: https://mp.weixin.qq.com/s/JTXMZqNp-8gN15J28ADZ1Q?amp%3Butm_medium=referral
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

现象

笔者负责的一个RPC服务就是简单的从Redis Cluster中读取数据,然后返回给上游。理论上该服务的对象大部分都应该是朝生夕死的,但是笔者查看gc log 的时候发现 age >=2 的对象还真有不少,甚至和age=1的对象差不多 。也就是说对象从eden晋升到 Survivor,之后的每次young gc 这些对象都是在 Survivor区域中移动,直到晋升到old 区域中。GC log 如下

qM7Vjq7.jpg!web

解决过程

因为只需要查看 Survivor中区域的对象,使用JVM自带的命令就不太合适。 笔者推荐用 唯品会开发 vjmap(他只支持CMS不支持G1) ,他能查看各个age的对象。笔者使用它查看age>=2的堆栈,堆内对象分布如下:

iYnUne6.jpg!web

其中最令人奇怪的就是deps.redis.clients.jedis.Jedis这个对象。因为这是链接Redis Cluster的对象,理论上 只要流量没有大的波动不会有大量的创建活动 。而且Jedis本身会持有 Sokect、OutputStream、byte[ ]等对象。

笔者找到了创建Jedis对象的地方进行埋点, 发现基本上每六分钟就会销毁和创建一批Jedis对象。因为知道Redis client 采用的是链接池的方式,就是看了一下GenericObjectPool代码,发现 有个定时任务检测对象。关键代码如下:

fIrInam.jpg!web

jaey2uz.jpg!web

VzAJfaq.jpg!web

AfumAba.jpg!web

从上面代码我们看出,每隔一段时间,就是检测对象池里面对象,要是发现对象空闲时间超过一定时间,就会强制回收;然后又发现链接少于minIdle了,开始创建对象,以满足mindle。笔者所在公司封装Redis client 设置的检测轮询时间为6分钟。

上面问题已经找到了,解决就比较简单了。因为配置的 mindle过大导致,导致链接池里有大量空闲。项目中配置的mindle为32,修改为3测试 上线 观察。之后gc log如下:

3YZnAzR.jpg!web

yAnAN3U.jpg!web

3IJRZ3q.jpg!web

上图中dx04是优化之后的,dx03是优化之前的,从图中我们可以看出f ull gc次数由一周20次降为一周4次, young gc的时间平均下降了1.5ms左右(毕竟能减少对象在 Survivor中的移动

总结

作为项目的ower,我们一定要清楚了解业务特征。看看gc log是否符合业务特征应该呈现的gc log。如果不符合,使用合适的工具是查找原因,你一定有所收获。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK