缓存实战二三事

丁浪技术琐话 2018-01-19 10:22 Posted on

上次列举了一些缓存相关的常见问题和解决思路，这些问题是在实际工作中可能会遇到的。很多系统在业务量不大时可能不会暴露出问题，但是遇到“高并发”就会产生很多问题，缓存也不例外。所以在选择缓存策略和使用缓存之前，我们非常有必要结合当前的业务场景和需求去分析设计。一般我会从访问频率、读写比例、一致性要求等几个维度去分析。

访问频度低，缓存的收益不明显。

访问频度高，缓存收益一般明显。

是否使用缓存，优先参考的是业务的访问频度和并发量，而不是执行速度。什么意思呢？比如某个业务执行需要3s才能完成，我们觉得有点慢，但它本身使用频度很低，也不存在什么并发，那我们肯定会优先去给那些执行1s但是存在并发的业务加缓存。

读多写少：

适合缓存，收益明显。

不太适合缓存，收益不明显，额外增加系统复杂度。

一致性要求低：

业务可以容忍（某段时间）出现不一致，可以最终一致。先天适合缓存，设计难度较低。

一致性要求高：

业务数据敏感，无法容忍不一致（或者可容忍时间非常短）。缓存设计难度相对较大。

面对的场景不同，缓存设计和处理策略也不同。我曾经见过一个系统的代码，为了避免上面提到的“缓存并发”问题，直接在缓存帮助类中公共的get方法上加了lock，这显然是不合理的。首先，并不是所有业务都会有“缓存穿透”的问题，其次，这种处理方式也太低级。

缓存并发导致的穿透问题如何解决

下面具体的聊聊我在实际工作中一般是如何应对解决“缓存并发穿透”问题的。

方案A（后台刷新）：

在缓存过期之前，通过后台线程或者job主动更新缓存。例如，缓存的过期时间为30分钟，而后台job则每隔29分钟执行一次（job中查询出最新的数据并写入到缓存中）。

这种方案比较容易理解，但会增加系统复杂度。比较适合那些key相对固定、cache粒度较大的业务，key比较分散的则不太适合，实现起来也比较复杂。

方案B（检查更新）：

将缓存key的过期时间（绝对时间）也一起保存到缓存中（可以拼接，也可以加新字段，也可以采用单独的key保存，反正需要两者建立好关联关系）。在每次执行get操作后，都将get出来的缓存过期时间与当前系统时间做一个对比，如果发现缓存过期时间-当前系统时间<=1分钟，则主动更新缓存。这样就能保证缓存中始终是最新的（和方案A的思路本质上一样，就是为了保证缓存“始终是最新的”且“永不过期”），不用担心缓存失效和一致性的问题。当然，这个1分钟只是举例，可以根据实际情况定义或者配置的。

这种方案在特殊情况下也会有问题。假设缓存过期时间是11:30分，而11:29到11:30这1分钟时间里恰好没有get请求过来，恰好请求都在11:30分的时候并发过来，那就悲剧了。这种情况比较极端，但并不是没有可能。因为“高并发”也可能是阶段性在某个时间点爆发。