文档首页
MySQL 9.0 参考手册
相关文档 下载本手册

12.3.5 列字符集和排序规则

每个 字符 列(即,CHARVARCHARTEXT 类型或任何同义词类型的列)都有一个列字符集和一个列排序规则。用于 CREATE TABLEALTER TABLE 的列定义语法包含可选的子句,用于指定列字符集和排序规则

col_name {CHAR | VARCHAR | TEXT} (col_length)
    [CHARACTER SET charset_name]
    [COLLATE collation_name]

这些子句也可以用于 ENUMSET

col_name {ENUM | SET} (val_list)
    [CHARACTER SET charset_name]
    [COLLATE collation_name]

示例

CREATE TABLE t1
(
    col1 VARCHAR(5)
      CHARACTER SET latin1
      COLLATE latin1_german1_ci
);

ALTER TABLE t1 MODIFY
    col1 VARCHAR(5)
      CHARACTER SET latin1
      COLLATE latin1_swedish_ci;

MySQL 按以下方式选择列字符集和排序规则

  • 如果同时指定了 CHARACTER SET charset_nameCOLLATE collation_name,则使用字符集 charset_name 和排序规则 collation_name

    CREATE TABLE t1
    (
        col1 CHAR(10) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci
    ) CHARACTER SET latin1 COLLATE latin1_bin;

    为该列指定了字符集和排序规则,因此使用它们。该列具有字符集 utf8mb4 和排序规则 utf8mb4_unicode_ci

  • 如果指定了 CHARACTER SET charset_name 但没有指定 COLLATE,则使用字符集 charset_name 及其默认排序规则。

    CREATE TABLE t1
    (
        col1 CHAR(10) CHARACTER SET utf8mb4
    ) CHARACTER SET latin1 COLLATE latin1_bin;

    为该列指定了字符集,但没有指定排序规则。该列具有字符集 utf8mb4utf8mb4 的默认排序规则,即 utf8mb4_0900_ai_ci。要查看每个字符集的默认排序规则,请使用 SHOW CHARACTER SET 语句或查询 INFORMATION_SCHEMA CHARACTER_SETS 表。

  • 如果指定了 COLLATE collation_name 但没有指定 CHARACTER SET,则使用与 collation_name 关联的字符集和排序规则 collation_name

    CREATE TABLE t1
    (
        col1 CHAR(10) COLLATE utf8mb4_polish_ci
    ) CHARACTER SET latin1 COLLATE latin1_bin;

    为该列指定了排序规则,但没有指定字符集。该列具有排序规则 utf8mb4_polish_ci,并且字符集是与排序规则关联的字符集,即 utf8mb4

  • 否则(既没有指定 CHARACTER SET,也没有指定 COLLATE),将使用表字符集和排序规则。

    CREATE TABLE t1
    (
        col1 CHAR(10)
    ) CHARACTER SET latin1 COLLATE latin1_bin;

    既没有为该列指定字符集,也没有指定排序规则,因此使用表的默认值。该列具有字符集 latin1 和排序规则 latin1_bin

CHARACTER SETCOLLATE 子句是标准 SQL。

如果使用 ALTER TABLE 将列从一个字符集转换为另一个字符集,MySQL 会尝试映射数据值,但如果字符集不兼容,则可能会丢失数据。