本节讨论可以对处理 WHERE
子句进行的优化。示例使用 SELECT
语句,但相同的优化也适用于 DELETE
和 UPDATE
语句中的 WHERE
子句。
由于 MySQL 优化器仍在不断开发中,因此这里并未记录 MySQL 执行的所有优化。
您可能会想重写查询以使算术运算更快,同时牺牲可读性。由于 MySQL 会自动执行类似的优化,因此您通常可以避免此工作,并将查询保留为更易于理解和维护的形式。MySQL 执行的一些优化如下所示
删除不必要的括号
((a AND b) AND c OR (((a AND b) AND (c AND d)))) -> (a AND b AND c) OR (a AND b AND c AND d)
常量折叠
(a<b AND b=c) AND a=5 -> b>5 AND b=c AND a=5
常量条件移除
(b>=5 AND b=5) OR (b=6 AND 5=5) OR (b=7 AND 5=6) -> b=5 OR b=6
这发生在准备阶段而不是优化阶段,这有助于简化连接。有关更多信息和示例,请参见 第 10.2.1.9 节,“外连接优化”。
索引使用的常量表达式只评估一次。
将数字类型的列与常量值进行比较时,会检查和折叠或删除无效或超出范围的值
# CREATE TABLE t (c TINYINT UNSIGNED NOT NULL); SELECT * FROM t WHERE c < 256; -≫ SELECT * FROM t WHERE 1;
有关更多信息,请参见 第 10.2.1.14 节,“常量折叠优化”。
COUNT(*)
在单个表上使用没有WHERE
子句时,会直接从MyISAM
和MEMORY
表的信息中获取。对于仅使用一个表的任何NOT NULL
表达式,也是如此。早期检测无效常量表达式。MySQL 会快速检测到某些
SELECT
语句是不可能的,并返回零行。如果您不使用
GROUP BY
或聚合函数(COUNT()
、MIN()
等),则HAVING
会与WHERE
合并。对于连接中的每个表,都会构建一个更简单的
WHERE
子句,以便对该表快速进行WHERE
评估,并尽可能早地跳过行。所有常量表都会在查询中的任何其他表之前读取。常量表可以是以下任何一种
空表或只有一行的表。
使用
WHERE
子句在PRIMARY KEY
或UNIQUE
索引上使用的表,其中所有索引部分都与常量表达式进行比较,并且定义为NOT NULL
。
以下所有表都用作常量表
SELECT * FROM t WHERE primary_key=1; SELECT * FROM t1,t2 WHERE t1.primary_key=1 AND t2.primary_key=t1.id;
通过尝试所有可能性来找到连接表的最佳连接组合。如果
ORDER BY
和GROUP BY
子句中的所有列都来自同一表,则在连接时,该表优先被选择为第一个表。如果有
ORDER BY
子句和不同的GROUP BY
子句,或者如果ORDER BY
或GROUP BY
包含来自连接队列中第一个表以外的表的列,则会创建一个临时表。如果您使用
SQL_SMALL_RESULT
修饰符,MySQL 将使用内存中的临时表。查询每个表索引,并使用最佳索引,除非优化器认为使用表扫描更有效。曾经根据最佳索引是否跨越超过 30% 的表来使用扫描,但现在不再使用固定百分比来确定使用索引还是扫描。现在,优化器更加复杂,并根据更多因素(例如表大小、行数和 I/O 块大小)来进行估计。
在某些情况下,MySQL 可以从索引中读取行,甚至无需查阅数据文件。如果从索引中使用的所有列都是数字类型的,则仅使用索引树来解析查询。
在输出每一行之前,会跳过那些不匹配
HAVING
子句的行。
一些执行速度非常快的查询示例
SELECT COUNT(*) FROM tbl_name;
SELECT MIN(key_part1),MAX(key_part1) FROM tbl_name;
SELECT MAX(key_part2) FROM tbl_name
WHERE key_part1=constant;
SELECT ... FROM tbl_name
ORDER BY key_part1,key_part2,... LIMIT 10;
SELECT ... FROM tbl_name
ORDER BY key_part1 DESC, key_part2 DESC, ... LIMIT 10;
假设索引列为数值型,MySQL 会仅使用索引树来解析以下查询
SELECT key_part1,key_part2 FROM tbl_name WHERE key_part1=val;
SELECT COUNT(*) FROM tbl_name
WHERE key_part1=val1 AND key_part2=val2;
SELECT MAX(key_part2) FROM tbl_name GROUP BY key_part1;
以下查询使用索引来按排序顺序检索行,无需单独的排序步骤
SELECT ... FROM tbl_name
ORDER BY key_part1,key_part2,... ;
SELECT ... FROM tbl_name
ORDER BY key_part1 DESC, key_part2 DESC, ... ;