一些关于加速 MyISAM
表查询的一般技巧
为了帮助 MySQL 更好地优化查询,请在加载数据后对表使用
ANALYZE TABLE
或运行 myisamchk --analyze。这将更新每个索引部分的值,该值指示具有相同值的平均行数。(对于唯一索引,该值始终为 1。)当您根据非常量表达式连接两个表时,MySQL 使用此值来决定选择哪个索引。您可以使用SHOW INDEX FROM
并检查tbl_name
Cardinality
值来检查表分析的结果。 myisamchk --description --verbose 显示索引分布信息。要根据索引对索引和数据进行排序,请使用 myisamchk --sort-index --sort-records=1(假设您想按索引 1 进行排序)。如果您有一个唯一索引,并且您希望根据该索引按顺序读取所有行,那么这是一种加快查询速度的好方法。第一次以这种方式对大型表进行排序时,可能需要很长时间。
尽量避免对频繁更新的
MyISAM
表执行复杂的SELECT
查询,以避免由于读者和写入者之间的争用而导致的表锁定问题。MyISAM
支持并发插入:如果一个表的数据文件中间没有空闲块,则可以在其他线程从表中读取数据的同时,向其中INSERT
新行。如果能够做到这一点很重要,请考虑以避免删除行的方式使用该表。另一种可能性是在从表中删除大量行后,运行OPTIMIZE TABLE
来对表进行碎片整理。此行为可以通过设置concurrent_insert
变量来更改。您可以强制将新行追加到表中(并因此允许并发插入),即使在已删除行的表中也是如此。请参阅 第 10.11.3 节,“并发插入”。对于频繁更改的
MyISAM
表,请尽量避免所有可变长度列(VARCHAR
、BLOB
和TEXT
)。如果表包含一个可变长度列,则该表将使用动态行格式。请参阅 第 18 章,*备用存储引擎*。通常,仅仅因为行变得很大就将表拆分为不同的表是没有用的。在访问一行时,最大的性能损失是找到该行的第一个字节所需的磁盘寻道。找到数据后,大多数现代磁盘都可以足够快地读取整行,以满足大多数应用程序的需求。拆分表唯一能产生明显差异的情况是,如果它是一个使用动态行格式的
MyISAM
表,您可以将其更改为固定行大小,或者如果您经常需要扫描该表但不需要大多数列。请参阅 第 18 章,*备用存储引擎*。如果您通常按
顺序检索行,请使用expr1
,expr2
, ...ALTER TABLE ... ORDER BY
。通过在对表进行大量更改后使用此选项,您可以获得更高的性能。expr1
,expr2
, ...如果您经常需要根据大量行的信息计算结果(例如计数),则最好引入一个新表并实时更新计数器。以下形式的更新速度非常快:
UPDATE tbl_name SET count_col=count_col+1 WHERE key_col=constant;
当您使用仅具有表级锁定(多个读取器,单个写入器)的 MySQL 存储引擎(例如
MyISAM
)时,这一点非常重要。这也为大多数数据库系统提供了更好的性能,因为在这种情况下行锁定管理器的工作量更少。定期使用
OPTIMIZE TABLE
以避免动态格式MyISAM
表的碎片化。请参见 第 18.2.3 节 “MyISAM 表存储格式”。使用
DELAY_KEY_WRITE=1
表选项声明MyISAM
表可以加快索引更新速度,因为在关闭表之前不会将它们刷新到磁盘。缺点是,如果在打开此类表时出现问题导致服务器关闭,则必须通过在设置myisam_recover_options
系统变量的情况下运行服务器或在重新启动服务器之前运行 myisamchk 来确保该表正常。(但是,即使在这种情况下,您也不应该因为使用DELAY_KEY_WRITE
而丢失任何数据,因为始终可以从数据行生成密钥信息。)字符串在
MyISAM
索引中自动进行前缀和尾部空格压缩。请参见 第 15.1.15 节 “CREATE INDEX 语句”。您可以通过在应用程序中缓存查询或答案,然后一起执行多个插入或更新来提高性能。在此操作期间锁定表可确保在所有更新之后仅刷新一次索引缓存。