【20220502】Mysql 为什么使用B+Tree作为索引结构

从如下几个方面理解:

        1)常规的数据库存储引擎一般采用B树或B+树来实现索引的存储。

B树是一种多路平衡树。如下图:

······用这种存储结构来存储大量数据的情况下,它的整体高度比二叉树"矮"很多 。对于数据库,所有的数据必然是存储在磁盘上,而磁盘的IO效率很低,特别是在随机磁盘IO时效率更低,所以树的高度能够决定磁盘IO的次数,磁盘IO次数越少,对于数据库性能越高,因此采用B数作为存储结构。

        但是在MysqlInnodb存储引擎中,它采用的是一种增强的B树结构即B+树。

      2) 使用B+树作为索引和数据的一个存储结构。相比较B树,B+树做了几个优化:

1.B+树的所有数据都存储在叶子节点,非叶子节点只存储索引。

2.叶子节点中的数据使用双向链表的方式进行关联。

因此使用B+树作为索引结构优化点:

1.B+树非叶子几点不存储数据,所以每一层能够存储的索引数量会增加,意味着B+树在层高相同的情况下存储的数据量要比B树要更多,使得磁盘IO次数更少。

2.Mysql中,范围查询是一个比较常用的操作,而B+树的所有存储在叶子节点的数据使用了双向链表来关联,所以查询的时候只需查两个节点进行遍历就行,而B树需要获取所有节点,所以B+树在范围查询上效率更高。

3.在数据检索方面,由于所有的数据都存储在叶子节点,所以B+树的IO次数会更加稳定。

4.因为叶子节点存储所有数据,所以B+树的全局扫描能力更强一些,因为他只需要扫描叶子节点。但是B树需要遍历整个树。

另外基于B+树的结构,如果采用自增的整型数据作为主键,能够更好的去避免增加数据时带来的叶子节点分裂导致大量运算的问题。

mongoDB里面采用B树结构,本质上是关系型数据库和非关系型数据库的一个差异。

你可能感兴趣的