作者:微信小助手
发布时间:2023-10-12T21:41:22
本篇主要内容如下: 首先我们来回顾下本地锁的问题: 目前题目微服务被拆分成了四个微服务。前端请求进来时,会被转发到不同的微服务。假如前端接收了 10 W 个请求,每个微服务接收 2.5 W 个请求,假如缓存失效了,每个微服务在访问数据库时加锁,通过锁( 这是一种 基于上面本地锁的问题,我们需要一种支持分布式集群环境下的锁:查询 DB 时,只有一个线程能访问,其他线程都需要等待第一个线程释放锁资源后,才能继续执行。 生活中的案例:可以把锁看成房门外的一把 我们来看下分布式锁的基本原理,如下图所示: 我们来分析下上图的分布式锁: 大白话解释:所有请求的线程都去同一个地方 Redis 作为一个公共可访问的地方,正好可以作为“占坑”的地方。 用 Redis 实现分布式锁的几种方案,我们都是用 SETNX 命令(设置 key 等于某 value)。只是高阶方案传的参数个数不一样,以及考虑了异常情况。 我们来看下这个命令, 在 Redis 命令行中是这样执行的: 我们可以进到 redis 容器中来试下 先进入容器: 然后执行 SETNX 命令:将 返回 我们先用 Redis 的 SETNX 命令来实现最简单的分布式锁。 我们来看下流程图: 代码示例如下,Java 中 setnx 命令对应的代码为 setIfAbsent 方法的第一个参数代表 key,第二个参数代表值。 一个小问题:那为什么需要休眠一段时间? 因为该程序存在递归调用,可能会导致栈空间溢出。 青铜之所以叫青铜,是因为它是最初级的,肯定会带来很多问题。 设想一种家庭场景:晚上小空一个人开锁进入了房间,打开了电灯💡,然后突然 从技术的角度看:setnx 占锁成功,业务代码出现异常或者服务器宕机,没有执行删除锁的逻辑,就造成了 那如何规避这个风险呢? 设置锁的 上面提到的青铜方案会有死锁问题,那我们就用上面的规避风险的方案来设计下,也就是我们的白银方案。 还是生活中的例子:小空开锁成功后,给这款智能锁设置了一个 和青铜方案不同的地方在于,在占锁成功后,设置锁的过期时间,这两步是分步执行的。如下图所示: 清理 redis key 的代码如下 完整代码如下: 白银方案看似解决了线程异常或服务器宕机造成的锁未释放的问题,但还是存在其他问题: 因为占锁和设置过期时间是分两步执行的,所以如果在这两步之间发生了异常,则锁的过期时间根本就没有设置成功。 所以和青铜方案有一样的问题:锁永远不能过期。 上面的白银方案中,占锁和设置锁过期时间是分步两步执行的,这个时候,我们可以联想到什么:事务的原子性(Atom)。 原子性:多条命令要么都成功执行,要么都不执行。 将两步放在一步中执行:占锁+设置锁过期时间。 Redis 正好支持这种操作: 然后可以通过如下命令查看 key 的变化 下面演示下如何设置 key 并设置过期时间。注意:执行命令之前需要先删除 key,可以通过客户端或命令删除。 执行结果如下图所示:每运行一次 ttl 命令,就可以看到 wukong 的过期时间就会减少。最后会变为 -2(已过期)。 黄金方案和白银方案的不同之处:获取锁的时候,也需要设置锁的过期时间,这是一个原子操作,要么都成功执行,要么都不执行。如下图所示: 设置 我们还是举生活中的例子来看下黄金方案的缺陷。 从上面的案例中我们可以知道,因为用户 A 处理任务所需要的时间大于锁自动清理(开锁)的时间,所以在自动开锁后,又有其他用户抢占到了锁。当用户 A 完成任务后,会把其他用户抢占到的锁给主动打开。 这里为什么会打开别人的锁?因为锁的编号都叫做 上面的黄金方案的缺陷也很好解决,给每个锁设置不同的编号不就好了~ 如下图所示,B 抢占的锁是蓝色的,和 A 抢占到绿色锁不一样。这样就不会被 A 打开了。 做了个动图,方便理解: 静态图更高清,可以看看: 与黄金方案的不同之处: 上面的方案看似很完美,但还是存在问题:第 4 步和第 5 步并不是原子性的。 时刻:0s。线程 A 抢占到了锁。 时刻:9.5s。线程 A 向 Redis 查询当前 key 的值。 时刻:10s。锁自动过期。 时刻:11s。线程 B 抢占到锁。 时刻:12s。线程 A 在查询途中耗时长,终于拿多锁的值。 时刻:13s。线程 A 还是拿自己设置的锁的值和返回的值进行比较,值是相等的,清理锁,但是这个锁其实是线程 B 抢占的锁。 那如何规避这个风险呢?钻石方案登场。 上面的线程 A 查询锁和删除锁的逻辑不是 如下图所示,红色圈出来的部分是钻石方案的不同之处。用脚本进行删除,达到原子操作。 那如何用脚本进行删除呢? 我们先来看一下这段 Redis 专属脚本: 这段脚本和铂金方案的获取key,删除key的方式很像。先获取 KEYS[1] 的 value,判断 KEYS[1] 的 value 是否和 ARGV[1] 的值相等,如果相等,则删除 KEYS[1]。 那么这段脚本怎么在 Java 项目中执行呢? 分两步:先定义脚本;用 redisTemplate.execute 方法执行脚本。 上面的代码中,KEYS[1] 对应 而这段 Redis 脚本是由 Redis 内嵌的 Lua 环境执行的,所以又称作 Lua 脚本。 那钻石方案是不是就完美了呢?有没有更好的方案呢? 之后我们再来介绍另外一种分布式锁的王者方案:Redisson。可以参考:最强分布式锁工具:Redisson 本篇通过本地锁的问题引申出分布式锁的问题。然后介绍了五种分布式锁的方案,由浅入深讲解了不同方案的改进之处。 从上面几种方案的不断演进的过程中,知道了系统中哪些地方可能存在异常情况,以及该如何更好地进行处理。 举一反三,这种不断演进的思维模式也可以运用到其他技术中。 下面总结下上面五种方案的缺陷和改进之处。 青铜方案: 白银方案: 黄金方案: 铂金方案: 钻石方案: 构建高质量的技术交流社群,欢迎从事编程开发、技术招聘HR进群,也欢迎大家分享自己公司的内推信息,相互帮助,一起进步! 文明发言,以 广告人士勿入,切勿轻信私聊,防止被骗本地加锁
的方式在分布式的场景下不适用,所以本文我们来探讨下如何引入分布式锁
解决本地锁的问题。本篇所有代码和业务基于我的开源项目 PassJava。一、本地锁的问题
synchronzied
或 lock
)来锁住自己的线程资源,从而防止缓存击穿
。本地加锁
的方式,在分布式
情况下会带来数据不一致的问题:比如服务 A 获取数据后,更新缓存 key =100,服务 B 不受服务 A 的锁限制,并发去更新缓存 key = 99,最后的结果可能是 99 或 100,但这是一种未知的状态,与期望结果不一致。流程图如下所示:二、什么是分布式锁
锁
,所有并发线程比作人
,他们都想进入房间,房间内只能有一个人进入。当有人进入后,将门反锁,其他人必须等待,直到进去的人出来。
“占坑”
,如果有坑位,就执行业务逻辑,没有坑位,就需要其他线程释放“坑位”。这个坑位是所有线程可见的,可以把这个坑位放到 Redis 缓存或者数据库,这篇讲的就是如何用 Redis 做“分布式坑位”
。三、Redis 的 SETNX
SETNX
是set If not exist
的简写。意思就是当 key 不存在时,设置 key 的值,存在时,什么都不做。set <key> <value> NX
SETNX
命令。docker exec -it <容器 id> redid-cli
wukong
这个 key 对应的 value 设置成 1111
。set wukong 1111 NX
OK
,表示设置成功。重复执行该命令,返回 nil
表示设置失败。四、青铜方案
3.1 青铜原理
setIfAbsent
。// 1.先抢占锁
Boolean lock = redisTemplate.opsForValue().setIfAbsent("lock", "123");
if(lock) {
// 2.抢占成功,执行业务
List<TypeEntity> typeEntityListFromDb = getDataFromDB();
// 3.解锁
redisTemplate.delete("lock");
return typeEntityListFromDb;
} else {
// 4.休眠一段时间
sleep(100);
// 5.抢占失败,等待锁释放
return getTypeEntityListByRedisDistributedLock();
}3.2 青铜方案的缺陷
断电
了,小空想开门出去,但是找不到门锁位置,那小明就进不去了,外面的人也进不来。死锁
。自动过期时间
,过一段时间后,自动删除锁,这样其他线程就能获取到锁了。四、白银方案
4.1 生活中的例子
沙漏倒计时⏳
,沙漏完后,门锁自动打开。即使房间突然断电,过一段时间后,锁会自动打开,其他人就可以进来了。4.2 技术原理图
4.3 示例代码
// 在 10s 以后,自动清理 lock
redisTemplate.expire("lock", 10, TimeUnit.SECONDS);// 1.先抢占锁
Boolean lock = redisTemplate.opsForValue().setIfAbsent("lock", "123");
if(lock) {
// 2.在 10s 以后,自动清理 lock
redisTemplate.expire("lock", 10, TimeUnit.SECONDS);
// 3.抢占成功,执行业务
List<TypeEntity> typeEntityListFromDb = getDataFromDB();
// 4.解锁
redisTemplate.delete("lock");
return typeEntityListFromDb;
}4.4 白银方案的缺陷
五、黄金方案
5.1 原子指令
# 设置某个 key 的值并设置多少毫秒或秒 过期。
set <key> <value> PX <多少毫秒> NX
或
set <key> <value> EX <多少秒> NXttl <key>
# 设置 key=wukong,value=1111,过期时间=5000ms
set wukong 1111 PX 5000 NX
# 查看 key 的状态
ttl wukong5.2 技术原理图
5.3 示例代码
lock
的值等于 123
,过期时间为 10 秒。如果 10
秒 以后,lock 还存在,则清理 lock。setIfAbsent("lock", "123", 10, TimeUnit.SECONDS);
5.4 黄金方案的缺陷
5.4.1 用户 A 抢占锁
123
。
5.4.2 用户 B 抢占锁
123
,并设置了过期时间
10 秒
。
产生了冲突
。
15 s
后,完成了任务,此时 用户 B 还在执行任务。
123
的锁。
5.4.3 用户 C 抢占锁
“123”
,用户 A 只认锁编号,看见编号为 “123”
的锁就开,结果把用户 B 的锁打开了,此时用户 B 还未执行完任务,当然生气了。六、铂金方案
6.1 生活中的例子
6.2 技术原理图
6.3 代码示例
// 1.生成唯一 id
String uuid = UUID.randomUUID().toString();
// 2. 抢占锁
Boolean lock = redisTemplate.opsForValue().setIfAbsent("lock", uuid, 10, TimeUnit.SECONDS);
if(lock) {
System.out.println("抢占成功:" + uuid);
// 3.抢占成功,执行业务
List<TypeEntity> typeEntityListFromDb = getDataFromDB();
// 4.获取当前锁的值
String lockValue = redisTemplate.opsForValue().get("lock");
// 5.如果锁的值和设置的值相等,则清理自己的锁
if(uuid.equals(lockValue)) {
System.out.println("清理锁:" + lockValue);
redisTemplate.delete("lock");
}
return typeEntityListFromDb;
} else {
System.out.println("抢占失败,等待锁释放");
// 4.休眠一段时间
sleep(100);
// 5.抢占失败,等待锁释放
return getTypeEntityListByRedisDistributedLock();
}
6.4 铂金方案的缺陷
七、钻石方案
原子性
的,所以将查询锁和删除锁这两步作为原子指令操作就可以了。7.1 技术原理图
7.2 代码示例
if redis.call("get",KEYS[1]) == ARGV[1]
then
return redis.call("del",KEYS[1])
else
return 0
end// 脚本解锁
String script = "if redis.call('get',KEYS[1]) == ARGV[1] then return redis.call('del',KEYS[1]) else return 0 end";
redisTemplate.execute(new DefaultRedisScript<Long>(script, Long.class), Arrays.asList("lock"), uuid);“lock”
,ARGV[1] 对应 “uuid”
,含义就是如果 lock 的 value 等于 uuid 则删除 lock。八、总结
交流技术
、职位内推
、行业探讨
为主