InnoDB 是如何解决幻读的
前言
大部分人在日常的业务开发中,其实很少去关注数据库的事务相关问题,基本上都是 CURD 一把梭。正好最近在看 MySQL 的相关基础知识,其中对于幻读问题之前一直没有理解深刻,今天就来聊聊「InnoDB 是如何解决幻读的」,话不多说,下面进入主题。
事务隔离级别
事务隔离是数据库处理的基础之一,是
ACID
中的
I
。在 MySQL 的 InnoDB 引擎中支持在
SQL:1992
标准中的四种事务隔离级别,如下图所示,其中 P1 表示脏读(Dirty read),P2 表示不可重复读(Dirty read),P3 表示幻读(Phantom)。
为什么需要定义这么多隔离呢?从上图中也能猜出一二了,InnoDB 提供多个隔离级别主要原因是:让使用者可以在
多个事务
同时进行更改和执行查询时微调性能与结果的可靠性、一致性和可再现性之间的平衡的设置。是一种性能与结果可靠性间的
trade off
。
什么是幻读
在聊「InnoDB 解决幻读方式」前我们需要先了解
幻读是什么
,
官方文档
的描述如下:
A row that appears in the
result set
of a query, but not in the
result set
of an earlier query.
其中我加粗的「result set」是关键的地方,两次查询返回的是结果集,说明必须是一个
范围查询
操作。总结下,幻读就是:在同一个事务中,在前后两次查询相同范围时,两次查询得到的结果是不一致的。所以幻读会产生数据一致性问题。
InnoDB 解决幻读方式
为了解决上述的幻读问题,InnoDB 引入了两种锁,分别是「间隙锁」和「next-key 锁」。下面通过一个示例来描述这两种锁的作用分别是什么。假如存在一个这样的 B+ Tree 的索引结构,结构中有 4 个索引元素分别是:9527、9530、9535、9540。
此时当我们使用如下 SQL 通过主键索引查询一条记录,并且加上 X 锁(排它锁)时:
select * from user where id = 9527 for update;
这时就会产生一个记录锁(也就是行锁),锁定
id = 9527
这个索引。
在被锁定的记录(这里是 id = 9527)的锁释放之前,其它事务无法对这条被锁定记录做任何操作。再回忆一下,前面说的幻读定义「在同一个事务中,在前后两次查询相同
范围
时,两次查询得到的结果是不一致」。注意,这里强调的是范围查询。
InnoDB 要解决幻读问题,就必须得保证在如果在一个事务中,通过如下这条语句进行锁定时:
select * from user where id > 9530 and id < 9535 for update;
此时,另外一个语句再执行一如下这条 insert 语句时,需要被阻塞,直到上面这个获得锁的事务释放锁后才能执行。
insert into user(id, name, age) values(9533, 'Jack', 44);
为此,InnoDB 引入了「间隙锁」,它的主要功能是
锁定一段范围内的索引记录
。比如上面查询
id > 9530 and id < 9535
的时候,对 B+ Tree 中的(9530,9535)这个开区间范围的索引加间隙锁。
在这种加了间隙锁的情况下,其它事务对这个区间的数据进行插入、更新、删除都会被锁住直到这个获取到锁的事务释放。
这种是在区间之间的情况,你可能想到另外的一种情况:锁定多个区间,如下的一条语句:
select * from user where id > 9530 for update;
上面这条查询语句是针对
id > 9530
这个条件加锁,那么此时它需要锁定多个索引区间,所以在这种情况下 InnoDB 引入了「next-key 锁」机制。其实 next-key 锁的效果相当于间隙锁和记录锁的合集,记录锁锁定存在的记录行,间隙锁锁住记录行之间的间隙,而 next-key 锁它锁住的是两者之和。
在 InnoDB 中,每个数据行上的
非唯一索引
列上都会存在一把 next-key 锁,当某个事务持有该数据行的 next-key 锁时,会锁住一段
左开右闭区间
的数据。因此,当通过
id > 9530
这样一种范围查询加锁时,会加 next-key 锁,锁定区间是范围是:
(9530,9535] (9535,9540] (9540,+∞]
间隙锁(也叫 Gap 锁)和 next-key 锁的区别在于
加锁的范围
,间隙锁只锁定两个索引之间的引用间隙,而 next-key 锁会锁定多个索引区间,它包含「记录锁」和「间隙锁」。所以,当我们使用了范围查询,不仅仅命中了已存在的 Record 记录,还包含了 Gap 间隙。
总结
虽然在 InnoDB 引擎中通过间隙锁和 next-key 锁的方式解决了幻读问题,但是加锁之后会影响到数据库的并发性能,因此,如果对性能要求较高的业务场景中,建议把隔离级别设置成 RC(READ COMMITTED),这个级别中不存在间隙锁,但是需要考虑到幻读问题会导致的数据一致性。