mysql 回表查詢和索引覆蓋
什么是回表查詢和索引覆蓋?如何實現(xiàn)索引覆蓋?哪些場景,可以利用索引覆蓋來優(yōu)化sql?
測試數(shù)據(jù)庫表結(jié)構(gòu):
create table user ( id int primary key, name varchar(20), sex varchar(5), index(name) )engine=innodb;
select id,name where name='yapf' select id,name,sex where name='yapf'
一、什么是回表查詢
這先要從innodb的索引實現(xiàn)說起,innodb有兩大類索引:
- 聚集索引(clustered index)
- 普通索引(secondary index)
innodb聚集索引和普通索引有什么差異?
innodb聚集索引的葉子節(jié)點存儲行記錄,因此, innodb必須要有,且只有一個聚集索引:
- (1)如果表定義了pk,則pk就是聚集索引;
- (2)如果表沒有定義pk,則第一個not null unique列是聚集索引;
- (3)否則,innodb會創(chuàng)建一個隱藏的row-id作為聚集索引;
所以pk查詢非???,直接定位行記錄。
innodb普通索引的葉子節(jié)點存儲主鍵值。
注意,不是存儲行記錄頭指針,myisam的索引葉子節(jié)點存儲記錄指針。
舉個栗子,不妨設(shè)有表:
t(id pk, name key, sex, flag);
id是聚集索引,name是普通索引。
表中有四條記錄:
1, yapf, m, a
3, zhangsan, m, a
5, lisi, m, a
9, wangwu, f, b
兩個b+樹索引分別如上圖:
- (1)id為pk,聚集索引,葉子節(jié)點存儲行記錄;
- (2)name為key,普通索引,葉子節(jié)點存儲pk值,即id;
既然從普通索引無法直接定位行記錄,那普通索引的查詢過程是怎么樣的呢?
通常情況下,需要掃碼兩遍索引樹。
例如:
select * from t where name='lisi';
是如何執(zhí)行的呢?
如粉紅色路徑,需要掃碼兩遍索引樹:
- (1)先通過普通索引定位到主鍵值id=5;
- (2)在通過聚集索引定位到行記錄;
這就是所謂的回表查詢,先定位主鍵值,再定位行記錄,它的性能較掃一遍索引樹更低。
二、什么是索引覆蓋(covering index)
樓主并沒有在mysql的官網(wǎng)找到這個概念。借用一下sql-server官網(wǎng)的說法。
mysql官網(wǎng),類似的說法出現(xiàn)在explain查詢計劃優(yōu)化章節(jié),即explain的輸出結(jié)果extra字段為using index時,能夠觸發(fā)索引覆蓋。
不管是sql-server官網(wǎng),還是mysql官網(wǎng),都表達了:只需要在一棵索引樹上就能獲取sql所需的所有列數(shù)據(jù),無需回表,速度更快。
三、如何實現(xiàn)索引覆蓋
常見的方法是:將被查詢的字段,建立到聯(lián)合索引里去。
仍是之前中的例子:
create table user ( id int primary key, name varchar(20), sex varchar(5), index(name) )engine=innodb;
第一個sql語句:
select id,name from user where name='yapf';
能夠命中name索引,索引葉子節(jié)點存儲了主鍵id,通過name的索引樹即可獲取id和name,無需回表,符合索引覆蓋,效率較高。
畫外音,extra:using index。
第二個sql語句:
select id,name,sex from user where name='yapf';
能夠命中name索引,索引葉子節(jié)點存儲了主鍵id,但sex字段必須回表查詢才能獲取到,不符合索引覆蓋,需要再次通過id值掃碼聚集索引獲取sex字段,效率會降低。
畫外音,extra:using index condition。
如果把(name)單列索引升級為聯(lián)合索引(name, sex)就不同了。
create table user ( id int primary key, name varchar(20), sex varchar(5), index(name, sex) )engine=innodb;
可以看到:
select id,name ... where name='yapf'; select id,name,sex ... where name='yapf';
都能夠命中索引覆蓋,無需回表。
畫外音,extra:using index。
四、哪些場景可以利用索引覆蓋來優(yōu)化sql
場景1:全表count查詢優(yōu)化
原表為:
user(pk id, name, sex);
直接:
select count(name) from user;
不能利用索引覆蓋。
添加索引:
alter table user add key(name);
就能夠利用索引覆蓋提效。
場景2:列查詢回表優(yōu)化
select id,name,sex ... where name='yapf';
這個例子不再贅述,將單列索引(name)升級為聯(lián)合索引(name, sex),即可避免回表。
場景3:分頁查詢
select id,name,sex ... order by name limit 500,100;
將單列索引(name)升級為聯(lián)合索引(name, sex),也可以避免回表。