贝利信息

MySQL中如何实现数据的多版本并发控制_MVCC原理介绍?

日期:2025-07-23 00:00 / 作者:蓮花仙者

mvcc 是 mysql innodb 引擎用于提升并发性能的多版本并发控制机制。1. 它通过保留数据多个版本,使读操作无需加锁、写操作仅在必要时加锁,减少锁竞争;2. 实现依赖隐藏字段(如 db_trx_id、db_roll_ptr)、undo log(保存旧版本数据)和 read view(决定数据可见性);3. 在不同隔离级别下表现不同,默认的可重复读级别下 read view 在首次查询时创建并保持,而读已提交级别每次查询新建 read view;4. 优点包括提高并发效率、适合读多写少场景,缺点有存储开销增加和 undo log 可能膨胀。

MySQL 中的多版本并发控制(MVCC)是 InnoDB 存储引擎用来提升数据库并发性能的一种机制。它通过为数据保留多个版本,使得读操作不加锁、写操作只在必要时加锁,从而减少了锁竞争,提高了系统的并发能力。


什么是 MVCC?

MVCC 的全称是 Multi-Version Concurrency Control,中文叫“多版本并发控制”。它的核心思想是:一个数据可以有多个版本,每个事务看到的数据版本可能不一样。这样做的好处是,不同事务之间可以互不干扰地读取数据,避免了频繁加锁带来的性能损耗。

比如,当两个事务同时查询一张表时,其中一个事务正在修改某条记录,另一个事务仍然能看到这条记录的旧版本,而不是被阻塞等待。


MVCC 是如何实现的?

InnoDB 实现 MVCC 主要依赖以下几个机制:

隐藏字段

InnoDB 给每行记录自动添加几个隐藏字段,其中和 MVCC 相关的主要有两个:

还有一个是 DB_ROW_ID,用于生成聚簇索引,但不是 MVCC 的关键。

Undo Log

当一条记录被修改时,InnoDB 并不会直接覆盖原来的值,而是将旧值保存到 Undo Log 中。这样就可以根据 Undo Log 回溯出历史版本的数据。

例如:

Read View

当事务执行 SELECT 查询时,会创建一个 Read View。这个视图决定了事务能看到哪些数据版本。

Read View 包含以下信息:

通过比较这些信息与记录的 DB_TRX_ID,就能判断这条记录是否对当前事务可见。


不同隔离级别下 MVCC 的行为差异

MVCC 的具体表现还受到事务隔离级别的影响。常见的两个级别是:

1. 可重复读(REPEATABLE READ)

这是 InnoDB 默认的隔离级别。在这个级别下:

2. 读已提交(READ COMMITTED)

在这个级别下:

注意:MVCC 仅适用于普通的 SELECT 查询(即快照读),对于 SELECT ... FOR UPDATE 或 SELECT ... LOCK IN SHARE MODE 这类加锁查询,仍然需要使用锁机制来控制并发。

MVCC 的优缺点

优点:

缺点:


总结一下

MVCC 的本质是通过保存数据的历史版本,让不同事务看到各自合适的数据版本,从而实现高效的并发控制。它结合了隐藏字段、Undo Log 和 Read View 等机制,在 MySQL 的 InnoDB 引擎中发挥着重要作用。

理解 MVCC 的工作原理,有助于我们更好地优化数据库性能,特别是在处理高并发场景时。基本上就这些,说起来不复杂,但在实际应用中还是容易忽略细节。