一，前言　

上一篇内容说到了MySQL存储引擎的相关内容，及数据类型的选择优化。下面再来说说索引的内容，包括对B-Tree和B+Tree两者的区别。

1.1，什么是索引

索引是存储引擎用于快速找到记录的一种数据结构，对性能的提升有很大的帮助，尤其当表中数量较大的情况下，索引正确的使用可以对性能提升几个数量级。
但是索引经常被忽略，不恰当的索引对性能可能还会带来负面效果。

1.2，什么时候添加索引

主键自动建立主键索引(唯一索引)
where字句中的列，频繁作为查询字段的列
表连接关联的列
排序用到的列
索引的基数越大(选择性大)，索引的效率就越高

什么叫基数越大，比如手机号，每个列都具有不同的值，非常好区别，这个就适合建立索引，而性别这样的字段，因为只有两个值，以不适合建立索引，就是区分度高低的问题。

1.3，不适合添加索引

表中数据太少
频繁修改的字段
数据重复且分布平均的字段

1.4，索引的分类

单值索引：即一个索引只包含单个列，一个表可以有多个单列索引。

唯一索引：索引列的值必须唯一，但是允许有空值。

复合索引：即一个索引包含多个列。

全文索引：使用fulltext创建全文索引。

在旧版MySQL中全文索引只能用在MyISAM表格的char、varchar和text的字段上。新版的MySQL5.6.24上InnoDB引擎也加入了全文索引。

使用方式：

创建索引：create [unique|fulltext] index 索引名 on 表名 (属性名[长度][asc|desc])。
删除索引：drop index 索引名 on 表名。
查看索引：show index from 表名。

具体使用方式这里就不详细说明，接下来就说说关于索引的实现原理，Tree，B-Tree，B+Tree。

二，Tree

在总结B-Tree和B+Tree之前，先看看最基本的二叉树结构吧，因为前两种树结构够可以算是二叉树的变种。

二叉树是n(n>=0)个结点的有限集合，该集合或者为空集（称为空二叉树），或者由一个根结点和两棵互不相交的、分别称为根结点的左子树和右子树组成。

二叉树的特点：

每个结点最多有两颗子树，所以二叉树中不存在度大于2的结点。
左子树和右子树是有顺序的，次序不能任意颠倒。
从根节点出发，左子树都是比根节点小的，而右子树都是比根节点大的。

因此对于较平衡的二叉树的查找性能，是几乎接近于二分查找的，但是如果存入的数据都比根节点小，或者都比根节点大，则会出现以下情况。

这两种情况分别是左斜树和右斜树，上述情况毫无疑问在二叉树搜索时，效率是非常低的。因为它已经失去了树的结构，不管是查询节点，还是添加删除等，都是对每个节点依次遍历，直到查出目标节点为止。

另外还有一点也是很重要，如果二叉树的字节点或多，一百万，一千万，甚至上亿数据。对于较大数据量的二叉树，会将其保存在磁盘中，那么问题来了。如果要查询的数据在树的底层，那么就势必会造成多次的磁盘IO，而磁盘IO的读取比内存读取的速度要低100倍左右。这种情况下，不管是从性能来说，还是效率这都不是一个好的结果。

接着再说B-Tree结构，是二叉树的一种升级版。