mysql索引

永远有福 · 发表于 2024-5-12 03:40:56

1. 概述
索引 (index) 是帮助 MySQL 高效获取数据的数据结构 (有序)。在数据之外，数据库系统还
维护着满足特定查找算法的数据结构，这些数据结构以某种方式引用（指向）数据，这样就可
以在这些数据结构上实现高级查找算法，这种数据结构就是索引。

2. 索引结构
MySQL的索引是在存储引擎层实现的，不同的存储引擎有不同的索引结构，主要包含以下几种：

上述是MySQL中所支持的所有的索引结构，接下来，我们再来看看不同的存储引擎对于索引结构的支持情况。

注意：我们平常所说的索引，如果没有特别指明，都是指B+树结构组织的索引。

3. 索引分类
在 MySQL 数据库，将索引的具体类型主要分为以下几类：主键索引、唯一索引、常规索引、全文索引。

而在在InnoDB存储引擎中，根据索引的存储形式，又可以分为以下两种：

聚集索引选取规则:

如果存在主键，主键索引就是聚集索引。
如果不存在主键，将使用第一个唯一（UNIQUE）索引作为聚集索引。
如果表没有主键，或没有合适的唯一索引，则InnoDB会自动生成一个rowid作为隐藏的聚集索引。

回表查询：这种先到二级索引中查找数据，找到主键值，然后再到聚集索引中根据主键值，获取数据的方式，就称之为回表查询。

思考题：

以下两条SQL语句，那个执行效率高? 为什么?

A. select * from user where id = 10 ;

B. select * from user where name = 'Arm' ;

备注: id为主键，name字段创建的有索引；

解答：

A 语句的执行性能要高于B 语句。

因为A语句直接走聚集索引，直接返回数据。而B语句需要先查询name字段的二级索引，然后再查询聚集索引，也就是需要进行回表查询。

4. 索引语法

创建索引

CREATE [ UNIQUE | FULLTEXT ] INDEX index_name ON table_name (
index_col_name,... ) ;

复制代码

查看索引

SHOW INDEX FROM table_name ;

复制代码

删除索引

DROP INDEX index_name ON table_name ;

复制代码

案例:

name 字段为姓名字段，该字段的值可能会重复，为该字段创建索引。

CREATE INDEX idx_user_name ON tb_user(name);

复制代码

phone手机号字段的值，是非空，且唯一的，为该字段创建唯一索引。

CREATE UNIQUE INDEX idx_user_phone ON tb_user(phone);

复制代码

为 profession、age、status 创建联合索引。

CREATE INDEX idx_user_pro_age_sta ON tb_user(profession,age,status);

复制代码

为 email 建立合适的索引来提升查询效率。

CREATE INDEX idx_email ON tb_user(email);

复制代码

完成上述的需求之后，我们再查看tb_user表的所有的索引数据。

show index from tb_user;

复制代码

5. SQL 性能分析
5.1 SQL执行频率
MySQL 客户端连接成功后，通过 show [session | global] status 命令可以提供服务器状态信息。通过如下指令，可以查看当前数据库的INSERT、UPDATE、DELETE、SELECT的访问频次：

-- session 是查看当前会话 ;
-- global 是查询全局数据 ;
SHOW GLOBAL STATUS LIKE 'Com_______';

复制代码

Com_delete: 删除次数
Com_insert: 插入次数
Com_select: 查询次数
Com_update: 更新次数

通过上述指令，我们可以查看到当前数据库到底是以查询为主，还是以增删改为主，从而为数据库优化提供参考依据。如果是以增删改为主，我们可以考虑不对其进行索引的优化。如果是以查询为主，那么就要考虑对数据库的索引进行优化了。

5.2 慢查询日志
慢查询日志记录了所有执行时间超过指定参数（long_query_time，单位：秒，默认10秒）的所有SQL语句的日志。
MySQL的慢查询日志默认没有开启，我们可以查看慢日志是否开启和日志文件位置

show variables like '%slow_query_log%';

复制代码

以及慢日志阈值

show variables like '%long_query_time%';

复制代码

临时开启慢查询日志

# 临时开启开启MySQL慢日志查询开关
set slow_query_log=1;
# 设置慢日志的时间为2秒，SQL语句执行时间超过2秒，就会视为慢查询，记录慢查询日志
set long_query_time=2;

复制代码

5.3 profile详情
show profiles 能够在做 SQL 优化时帮助我们了解时间都耗费到哪里去了。通过
have_profiling 参数，能够看到当前MySQL是否支持 profile 操作：

SELECT @@have_profiling ;
SELECT @@profiling ;

复制代码

可以看到，当前MySQL是支持 profile操作的，开关是打开的的。如果没打开，可以通过set语句在 session/global 级别开启profiling：

SET profiling = 1;

复制代码

执行 SQL 语句后，查看查看指令的执行耗时：

-- 查看每一条SQL的耗时基本情况
show profiles;
-- 查看指定query_id的SQL语句各个阶段的耗时情况
show profile for query query_id;
-- 查看指定query_id的SQL语句CPU的使用情况
show profile cpu for query query_id;

复制代码

5.4 explain
EXPLAIN 或者 DESC 命令获取 MySQL 如何执行 SELECT 语句的信息，包括在 SELECT 语句执行过程中表如何连接和连接的顺序。

-- 直接在select语句之前加上关键字 explain / desc
EXPLAIN SELECT 字段列表 FROM 表名 WHERE 条件 ;

复制代码

Explain 执行计划中各个字段的含义:

6. 索引使用
6.1 最左前缀法则
如果索引了多列（联合索引），要遵守最左前缀法则。最左前缀法则指的是查询从索引的最左列开始，并且不跳过索引中的列。如果跳跃某一列，索引将会部分失效(后面的字段索引失效)。
以 t_user 表为例，我们先来查看一下之前 t_user 表所创建的索引。

在 t_user 表中，有一个联合索引，这个联合索引涉及到三个字段，顺序分别为：name, age, email 。
对于最左前缀法则指的是，查询时，最左变的列，也就是 name须存在，否则索引全部失效。
而且中间不能跳过某一列，否则该列后面的字段索引将失效。

6.2 范围查询
联合索引中，出现范围查询(>,= 或或 < 。

6.3 索引失效情况

索引列运算

不要在索引列上进行运算操作，索引将失效。

字符串不加引号

字符串类型字段使用时，不加引号，索引将失效。

模糊查询

如果仅仅是尾部模糊匹配，索引不会失效。如果是头部模糊匹配，索引失效。

or 连接条件

用or分割开的条件，如果 or 前的条件中的列有索引，而后面的列中没有索引，那么涉及的索引都不会被用到。当or连接的条件，左右两侧字段都有索引时，索引才会生效。

数据分布影响

如果MySQL评估使用索引比全表更慢，则不使用索引。

6.4 SQL提示
SQL提示，是优化数据库的一个重要手段，简单来说，就是在SQL语句中加入一些人为的提示来达到优化操作的目的。

use index ：建议 MySQL 使用哪一个索引完成此次查询（仅仅是建议，mysql 内部还会再次进行评估）。

explain select * from tb_user use index(idx_user_pro) where profession = '软件工程';

复制代码

ignore index ：忽略指定的索引。

explain select * from tb_user ignore index(idx_user_pro) where profession = '软件工程';

复制代码

force index ：强制使用索引。

explain select * from tb_user force index(idx_user_pro) where profession = '软件工程';

复制代码

6.5 覆盖索引
尽量使用覆盖索引，减少select *。那么什么是覆盖索引呢？覆盖索引是指查询使用了索引，并且需要返回的列，在该索引中已经全部能够找到。

因为，在 t_user 表中有一个联合索引 idx_user_name_age_email，该索引关联了三个字段 name、age、email，而这个索引也是一个二级索引，所以叶子节点下面挂的是这一行的主键id。所以当我们查询返回的数据在 id、name、age、email 之中，则直接走二级索引直接返回数据了。如果超出这个范围，就需要拿到主键id，再去扫描聚集索引，再获取额外的数据了，这个过程就是回表。而我们如果一直使用select * 查询返回所有字段值，很容易就会造成回表查询（除非是根据主键查询，此时只会扫描聚集索引）。

思考题：

一张表, 有四个字段(id, username, password, status), 由于数据量大, 需要对
以下SQL语句进行优化, 该如何进行才是最优方案:

select id,username,password from tb_user where username ='itcast';
复制代码
答案: 针对于 username, password建立联合索引, sql为:
create index idx_user_name_pass on tb_user(username,password);
复制代码
这样可以避免上述的SQL语句，在查询的过程中，出现回表查询

6.6 前缀索引
当字段类型为字符串（varchar，text，longtext等）时，有时候需要索引很长的字符串，这会让索引变得很大，查询时，浪费大量的磁盘 IO，影响查询效率。此时可以只将字符串的一部分前缀，建立索引，这样可以大大节约索引空间，从而提高索引效率。

语法

create index idx_xxxx on table_name(column(n)) ;

复制代码

示例：

为 t_user 表的 email 字段，建立长度为5的前缀索引。

create index idx_email_5 on tb_user(email(5));

复制代码

前缀长度

可以根据索引的选择性来决定，而选择性是指不重复的索引值（基数）和数据表的记录总数的比值，索引选择性越高则查询效率越高，唯一索引的选择性是1，这是最好的索引选择性，性能也是最好的。

select count(distinct email) / count(*) from t_user ;
select count(distinct substring(email,1,5)) / count(*) from t_user ;

复制代码

前缀索引的查询流程

6.7 单列索引与联合索引

单列索引：即一个索引只包含单个列。
联合索引：即一个索引包含了多个列。

在业务场景中，如果存在多个查询条件，考虑针对于查询字段建立索引时，建议建立联合索引，
而非单列索引。

如果查询使用的是联合索引，具体的结构示意图如下：

7. 索引设计原则

针对于数据量较大，且查询比较频繁的表建立索引。
针对于常作为查询条件（where）、排序（order by）、分组（group by）操作的字段建立索
引。
尽量选择区分度高的列作为索引，尽量建立唯一索引，区分度越高，使用索引的效率越高。
如果是字符串类型的字段，字段的长度较长，可以针对于字段的特点，建立前缀索引。
尽量使用联合索引，减少单列索引，查询时，联合索引很多时候可以覆盖索引，节省存储空间，避免回表，提高查询效率。
要控制索引的数量，索引并不是多多益善，索引越多，维护索引结构的代价也就越大，会影响增删改的效率。
如果索引列不能存储 NULL 值，请在创建表时使用 NOT NULL 约束它。当优化器知道每列是否包含 NULL 值时，它可以更好地确定哪个索引最有效地用于查询。

来源:https://www.cnblogs.com/pine1203/p/18186128
免责声明：由于采集信息均来自互联网，如果侵犯了您的权益，请联系我们【E-Mail:cb@itdo.tech】我们会及时删除侵权内容，谢谢合作！

mysql索引

本帖子中包含更多资源