前言

在分布式系统中,缓存和数据库同时存在时,若是有写操作,先操作数据库照样先操作缓存呢?本文将分5种方案睁开论述对比,谢谢阅读~

github地址,衷心感谢每一颗star


https://github.com/whx123/JavaHome

缓存维护方案一

若是是一读(线程B)一写(线程A)操作,「先操作缓存,再操作数据库」。流程图如下所示:

  • 1.线程A提议一个写操作,第一步del cache

  • 2.线程A第二步写入新数据到DB

  • 3.线程B提议一个读操作,cache miss缓存失效了。

  • 4.线程B从DB获取最新数据

  • 5.线程B执行set cache,把从DB读到的数据,更新到缓存。

「这样看,没啥问题」。我们再看第二个流程图,如下:

  • 1.线程A提议一个写操作,第一步del cache

  • 2.此时线程B提议一个读操作,cache miss

  • 3.线程B继续读DB,读出来一个老数据

  • 4.然后老数据设置入cache

  • 5.线程A写入DB最新的数据

OK,酱紫,就有问题了吧,老数据入到缓存了,「每次读都是老数据啦,缓存与数据与数据库数据不一致了」。

缓存维护方案二

上个方案是一读一写,若是是双写操作,「先操作缓存,在操作数据库」,会怎么样呢?

  • 1.线程A提议一个写操作,第一步set cache

  • 2.线程A第二步写入新数据到DB

  • 3.线程B提议一个写操作,set cache

  • 4.线程B第二步写入新数据到DB

「这样看,也没啥问题。」,然则有时刻可能事与愿违,我们再看第二个流程图,如下:

  • 1.线程A提议一个写操作,第一步set cache

    ,

    AllbetGmaing手机版下载

    欢迎进入AllbetGmaing手机版下载(Allbet Game):www.aLLbetgame.us,欧博官网是欧博集团的官方网站。欧博官网开放Allbet注册、Allbe代理、Allbet电脑客户端、Allbet手机版下载等业务。

    ,
  • 2.线程B提议一个写操作,第一步set cache

  • 3.线程B写入数据库到DB

  • 4.线程A写入数据库到DB

执行完后,缓存保留的是B操作后的数据,数据库是A操作后的数据,「缓存和数据库数据不一致了」。

缓存维护方案三

一写(线程A)一读(线程B)操作,「先操作数据库,再操作缓存」。

  • 1.线程A提议一个写操作,第一步write DB

  • 2.线程A第二步del cache

  • 3.线程B提议一个读操作,cache miss

  • 4.线程B从DB获取最新数据

  • 5.线程B同时set cache

有些同伙可能以为,在第2步删除缓存之前,线程B读过来呢?这时刻,读到的是缓存老数据,这个可以以为是正常营业逻辑呀,下次再读取就是准确数据了。

这种方案「没有显著的并发问题」,然则呢,「步骤二删除缓存失败」,照样个问题。不外概率比较小,「优于方案一和方案二」,平时事情中也是使用方案三。

综上对比,我们一样平常接纳方案三,然则有没有完善全解决方案三的坏处的方式呢?

缓存维护方案四

这个是方案三的改善方案,都是先操作数据库再操作缓存,我们来看一下流程图:

通过数据库的「binlog」来「异步镌汰key」,以mysql为例 可以「使用阿里的canal将binlog日志采集发送到MQ行列」内里,然后「通过ACK机制 确认处置」 这条更新新闻,删除缓存,保证数据缓存一致性。

然则呢另有个问题,「若是是主从数据库呢」?

缓存维护方案五

主从DB问题:由于主从DB同步存在延时时间。若是删除缓存之后,数据同步到备库之前已经有请求过来时,「会从备库中读到脏数据」,若何解决呢?解决方案如下流程图:

缓存维护总结

综上所述,在分布式系统中,缓存和数据库同时存在时,若是有写操作的时刻,「先操作数据库,再操作缓存」。如下:

  • 1.读取缓存中是否有相关数据
  • 2.若是缓存中有相关数据value,则返回
  • 3.若是缓存中没有相关数据,则从数据库读取相关数据放入缓存中key->value,再返回
  • 4.若是有更新写数据,则先操作数据库,再操作缓存
  • 5.为了保证第四步更新缓存乐成,使用binlog异步通知操作
  • 6.若是是主从数据库,binglog取自于从库
  • 7.若是是一主多从,每个从库都要采集binlog,然后消费端收到最后一台binlog数据才删除缓存

小我私家民众号

  • 迎接人人关注,人人一起学习,一起讨论哈。
  • 回复pdf,获得电子书学习