MySQL 回表查詢和索引覆蓋

mysql 回表查詢和索引覆蓋

什么是回表查詢和索引覆蓋？如何實現(xiàn)索引覆蓋？哪些場景，可以利用索引覆蓋來優(yōu)化sql？

測試數(shù)據(jù)庫表結(jié)構(gòu)：

create table user (
    id int primary key,
    name varchar(20),
    sex varchar(5),
    index(name)
)engine=innodb;

select id,name where name='yapf'
select id,name,sex where name='yapf'

一、什么是回表查詢

這先要從innodb的索引實現(xiàn)說起，innodb有兩大類索引：

聚集索引(clustered index)
普通索引(secondary index)

innodb聚集索引和普通索引有什么差異？

innodb聚集索引的葉子節(jié)點存儲行記錄，因此， innodb必須要有，且只有一個聚集索引：

（1）如果表定義了pk，則pk就是聚集索引；
（2）如果表沒有定義pk，則第一個not null unique列是聚集索引；
（3）否則，innodb會創(chuàng)建一個隱藏的row-id作為聚集索引；

所以pk查詢非?？?，直接定位行記錄。

innodb普通索引的葉子節(jié)點存儲主鍵值。

注意，不是存儲行記錄頭指針，myisam的索引葉子節(jié)點存儲記錄指針。

舉個栗子，不妨設(shè)有表：

　　t(id pk, name key, sex, flag);

id是聚集索引，name是普通索引。

表中有四條記錄：

　　1, yapf, m, a

　　3, zhangsan, m, a

　　5, lisi, m, a

　　9, wangwu, f, b

兩個b+樹索引分別如上圖：

（1）id為pk，聚集索引，葉子節(jié)點存儲行記錄；
（2）name為key，普通索引，葉子節(jié)點存儲pk值，即id；

既然從普通索引無法直接定位行記錄，那普通索引的查詢過程是怎么樣的呢？

通常情況下，需要掃碼兩遍索引樹。

例如：

select * from t where name='lisi';

是如何執(zhí)行的呢？

如粉紅色路徑，需要掃碼兩遍索引樹：

（1）先通過普通索引定位到主鍵值id=5；
（2）在通過聚集索引定位到行記錄；

這就是所謂的回表查詢，先定位主鍵值，再定位行記錄，它的性能較掃一遍索引樹更低。

二、什么是索引覆蓋(covering index)

樓主并沒有在mysql的官網(wǎng)找到這個概念。借用一下sql-server官網(wǎng)的說法。

mysql官網(wǎng)，類似的說法出現(xiàn)在explain查詢計劃優(yōu)化章節(jié)，即explain的輸出結(jié)果extra字段為using index時，能夠觸發(fā)索引覆蓋。

不管是sql-server官網(wǎng)，還是mysql官網(wǎng)，都表達了：只需要在一棵索引樹上就能獲取sql所需的所有列數(shù)據(jù)，無需回表，速度更快。

三、如何實現(xiàn)索引覆蓋

常見的方法是：將被查詢的字段，建立到聯(lián)合索引里去。

仍是之前中的例子：

create table user (
    id int primary key,
    name varchar(20),
    sex varchar(5),
    index(name)
)engine=innodb;

第一個sql語句：　　

select id,name from user where name='yapf';

能夠命中name索引，索引葉子節(jié)點存儲了主鍵id，通過name的索引樹即可獲取id和name，無需回表，符合索引覆蓋，效率較高。

畫外音，extra：using index。

第二個sql語句：

select id,name,sex from user where name='yapf';

能夠命中name索引，索引葉子節(jié)點存儲了主鍵id，但sex字段必須回表查詢才能獲取到，不符合索引覆蓋，需要再次通過id值掃碼聚集索引獲取sex字段，效率會降低。

畫外音，extra：using index condition。

如果把(name)單列索引升級為聯(lián)合索引(name, sex)就不同了。

create table user (
    id int primary key,
    name varchar(20),
    sex varchar(5),
    index(name, sex)
)engine=innodb;

可以看到：

select id,name ... where name='yapf';

select id,name,sex ... where name='yapf';

都能夠命中索引覆蓋，無需回表。

畫外音，extra：using index。

四、哪些場景可以利用索引覆蓋來優(yōu)化sql

場景1：全表count查詢優(yōu)化

原表為：

user(pk id, name, sex)；

直接：

select count(name) from user;

不能利用索引覆蓋。

添加索引：

alter table user add key(name);

就能夠利用索引覆蓋提效。

場景2：列查詢回表優(yōu)化

select id,name,sex ... where name='yapf';

這個例子不再贅述，將單列索引(name)升級為聯(lián)合索引(name, sex)，即可避免回表。

場景3：分頁查詢

select id,name,sex ... order by name limit 500,100;

將單列索引(name)升級為聯(lián)合索引(name, sex)，也可以避免回表。

下一節(jié)：mysql 存儲引擎 innodb 與 myisam 的區(qū)別

mysql 教程

相關(guān)文章

學(xué)習(xí)MySQL