贝利信息

SQL B+ 树索引的核心思想

日期:2026-01-24 00:00 / 作者:冷漠man
B+树是专为磁盘I/O优化的多叉树结构,非叶子节点仅存键值和指针以降低树高,所有数据存储在叶子层且通过双向链表连接,支持高效范围查询与顺序扫描;其联合索引依赖最左前缀原则,且索引失效源于破坏键值有序性的操作。

为什么B+树不是B树,也不是二叉树

B+树是专为磁盘I/O优化的结构,不是为了内存查找快而设计的。它放弃“每个节点存数据”的直觉,转而让非叶子节点只存键值子节点指针,这样一页(如InnoDB默认16KB)能塞下更多分支,树高自然压得更低——千万级数据通常只要3~4层,意味着最多4次磁盘读就能定位到记录。

叶子节点连成双向链表到底有什么用

这个设计不是锦上添花,而是解决真实场景问题的关键:比如SELECT * FROM orders WHERE create_time BETWEEN '2025-01-01' AND '2025-01-31',没有链表就得反复回树顶找下一个范围起点;有了next指针,查到第一个匹配叶子节点后,直接顺序往后扫,全程不跳回非叶子层。

联合索引为什么必须遵守最左前缀原则

因为B+树的搜索路径是单向递进的:从根节点开始,每一层都只按当前层级的键做二分查找,无法跳过某一层去“猜”下一层该比谁。联合索引(a, b, c)在内存中构建的是一棵以a为第一排序维度、b为第二、c为第三的树,a不等价于“过滤条件可选”,而是搜索入口的强制门槛。

索引失效的三个典型瞬间

不是建了索引就万事大吉。B+树依赖“值的有序性”工作,任何破坏这种有序性的操作都会让引擎弃用索引,退化为全表扫描。

这些不是配置问题,也不是版本bug,而是B+树结构本身决定的硬约束——它只认原始、有序、未加工的键值序列。