Java知识点详解——缓存

猿友 2021-07-14 10:08:28 浏览数 (6822)
反馈

如果没有缓存,当打开一个有大量内容的页面的时候,将会变得十分的卡顿,因为没有缓存,每次打开页面的时候都进行全部加载,而导致页面打开速度变得很慢,给用户的体验也就十分的不愉快了。有了缓存,则会让原本打开很慢的页面变得“秒开”。那么缓存除了能够加速数据的访问外,还有什么作用?本文将为您详细介绍 java 缓存的运放方式、缓存的类别以及缓存会出现的问题。

一、缓存能用来做什么?

大多数人对于缓存的理解就是,当我们打开一个页面或是一个APP,当它们打开的速度很慢的时候,都会想到引入缓存,这样打开就会更快。

从技术这一方面来说,缓存之所以能够提高访问速度,是因为缓存是基于内存去建立的。而内存的读写速度相对于硬盘是快很多的,所以用内存代替硬盘作为读写的介质,自然就会大大提升了访问数据的速度。

使用缓存的过程大致如下:

图片13

二、运用方式:预读取和延迟写

除了上述的过程之外,缓存另外两个重要的运用方式:预读取和延迟写。

2.1 预读取

从字面意思来看就是预先读取,实际意义也确实如此。预读取就是提前把将要读取的数据载入,也就是在系统中把硬盘中的一部分数据提前加载到内存中,然后对外提供服务。

图片12

那么这么做的意义是什么?

因为有些系统一旦启动就会有数以万计的请求涌进来,假设让这些请求直接打到数据库上,非常大的可能就是会让数据库的压力剧增,数据库就会被挂掉,而导致无法正常响应。

预读取就是为了解决这样的问题。

2.2 延迟写

如果说预读取就是在数据出口加一道缓冲区,那么延迟写则是在数据入口加一道缓冲区。

由于数据库的写入速度要比读取速度慢,因此在写入的时候就需要一系列的保证数据正确性的机制。所以,要想提升写入速度,或是分库分表,或是通过缓存加一道缓冲,再一次性批量写入磁盘。引入分库分表的复杂度远大于引入缓存,一般都是优先考虑引入缓存的方案。

这种缓存方案就是延迟写,它是预先将准备写入磁盘或数据库的数据,暂时写入到内存,然后返回成功,再定时分批将内存中的数据写入到磁盘。

图片11

三、哪些可以加缓存?

在缓存之前需要考虑我们要缓存的是什么?符合什么样特点的数据才需要加缓存?因为缓存算是一个额外的成本投入,所以加了缓存要体现它的价值。

先引入衡量数据的两个标准:

热点数据:被高频访问,如每秒几十次以上。

静态数据:很少变动,读取要大于写入。

以终端用户为起点,系统所使用的数据库为终点,这其中可以作为缓存设立点大致如下:

图片10

每个设立点都会挡掉一些流量,最终会形成以下的漏斗形效果,以此可以保护后面的系统以及最后的数据库。

图片9

这些设立点就像是红绿灯,如果没有红绿灯就容易发生事故,或是造成交通瘫痪等等。缓存设立点就是防止请求大量涌入,导致无法正常访问。

四、缓存类别

上文已经罗列了缓存的几种类别,接下我们将会对这些缓存类别进行介绍。

4.1 浏览器缓存

浏览器是离用户最近的,可以用来作为缓存的地方,而且借助的是用户的资源,性价比是几种里面最好的,可以让用户分担一些压力。

进入浏览器的开发者工具,有 ​from cache​ 、​from memory cache​ 和​ from disk cache​ 的时候,说明数据已经被缓存在用户的终端设备上,在没网的时候也可能访问到一部分的内容就是这个原因。

浏览器会帮助我们完成这个过程,一般适用于图片、 js 和 css等这些资源的缓存。

浏览器缓存的劣势就是我们对它的掌控力比较差,没有发起新的请求的情况下,是无法主动去更新数据。

4.2 CDN缓存

提供CDN服务的服务商,在全国乃至全世界部署了大量的服务节点。我们就可以将数据分发到遍布各地服务器上作为缓存,当用户访问时可以读取就近的服务器上的缓存数据。这样就可以分摊压力和提升了加速效果。

要注意的是,由于节点众多,更新缓存数据会比较慢,一般至少是分钟级别,所以该缓存适用于不经常变动的静态数据。

4.3 网关(代理)缓存

我们经常会在源站前面加上一层网管,目的是为了做一些安全机制或者作为同一分流策略的入口。

图片8

在这里设立一个缓存,能够拦下来请求,其背后的源站也是收益很大的,减少了大量的 CPU 运算。常用的网关缓存有 ​Varnish​、​Squid​、​Nginx​。

4.4 进程内缓存

一个请求能够到这里来,说明是“业务相关”,需要经过业务逻辑的运算。从这里开始,对缓存的引入成本相对于前三者而言,要大大的增加了,这是因为对缓存与数据库之间的‘数据一致性’要求更高了。

4.5 进程外缓存

这里是大多数程序员所熟悉的地方,就是 ​Redis​ 和​ Memcached​ 之类,或者也可以自己单独写一个程序来转存放缓存数据,提供给其他程序远程调用。

4.6 数据库缓存

数据库缓存是数据库的内部机制,一般都会给出设置缓存空间大小的配置来让你进行干预。

最后,磁盘本身也是有缓存的,所以能够让数据平稳地写入到磁盘,可谓是经历了一波三折。

五、缓存可能出现的问题

既然缓存作用如此大,那是不是就越多越好呢?只要速度慢就加缓存来解决?其实不然,缓存既有好的一面,也会有负面的一面。

5.1 缓存雪崩

问题:大量请求并发进入缓存时,可能由于某些原因缓冲效果未能正常执行,即便是在很短的时间内,就会导致请求全部转入数据库,从而造成数据库压力过重。

解决:可以通过“加锁排队”或者“缓存时间增加随机值”来解决此类问题。

5.2 缓存穿透

和缓存雪崩很相似,区别在于穿透会持续更长的时间。这是因为每次的​ cache miss​ 后依然无法从数据源把数据加载到缓存,导致持续产生cache miss​。

可以通过“布隆过滤器”或者“缓存空对象”来解决此类问题。

5.3 缓存并发

一个缓存 ​key ​下的数据被同时 ​set​,怎么保证业务的准确性?如果进程内、进程外、数据库三者的缓存一起用的情况下?

使用“先DB再缓存”的方式,并且缓存操作用 delete 而不是 set。

5.4 缓存无底洞

虽然分布式缓存是可以无线横向扩展的,但是,集群下的节点也不是越多越好。缓存也是符合“边际效用递减”规律的。

5.5 缓存淘汰

内存的容量是有限的,如果请求的数据量是大量的,那么根据具体情况进行一定的淘汰策略是必不可少的。例如:​LRU​、​LFU​和​FIFO​等等。

六、总结

本文主要介绍了Java缓存的运用方式的三种思路,Java缓存的类别,在系统中可以设立缓存的几个位置,以及最后总结了 Java 缓存中会遇到的问题。如果想对文章中的具体细节有更多的了解,请关注 w3cschool 或 编程狮APP


0 人点赞