表 14.12 字符串函数和运算符
名称 | 描述 |
---|---|
ASCII() |
返回最左侧字符的数值 |
BIN() |
返回包含数字二进制表示形式的字符串 |
BIT_LENGTH() |
返回参数的位长度 |
CHAR() |
返回传递给每个整数的字符 |
CHAR_LENGTH() |
返回参数中的字符数 |
CHARACTER_LENGTH() |
CHAR_LENGTH() 的同义词 |
CONCAT() |
返回连接后的字符串 |
CONCAT_WS() |
返回使用分隔符连接后的字符串 |
ELT() |
返回索引号处的字符串 |
EXPORT_SET() |
返回一个字符串,对于值位中设置的每个位,您将获得一个 on 字符串,对于每个未设置的位,您将获得一个 off 字符串 |
FIELD() |
后续参数中第一个参数的索引(位置) |
FIND_IN_SET() |
第二个参数中第一个参数的索引(位置) |
FORMAT() |
返回格式化为指定小数位数的数字 |
HEX() |
十进制或字符串值的十六进制表示形式 |
INSERT() |
在指定位置插入子字符串,最多插入指定数量的字符 |
INSTR() |
返回子字符串第一次出现的索引 |
LCASE() |
LOWER() 的同义词 |
LEFT() |
返回指定数量的最左侧字符 |
LENGTH() |
返回字符串的字节长度 |
LIKE |
简单模式匹配 |
LOAD_FILE() |
加载命名文件 |
LOCATE() |
返回子字符串第一次出现的位置 |
LOWER() |
以小写形式返回参数 |
LPAD() |
返回字符串参数,左侧填充指定的字符串 |
LTRIM() |
删除开头空格 |
MAKE_SET() |
返回一组以逗号分隔的字符串,这些字符串在位中设置了相应的位 |
MATCH() |
执行全文搜索 |
MID() |
返回从指定位置开始的子字符串 |
NOT LIKE |
简单模式匹配的否定 |
NOT REGEXP |
REGEXP 的否定 |
OCT() |
返回包含数字八进制表示形式的字符串 |
OCTET_LENGTH() |
LENGTH() 的同义词 |
ORD() |
返回参数最左侧字符的字符代码 |
POSITION() |
LOCATE() 的同义词 |
QUOTE() |
转义参数以在 SQL 语句中使用 |
REGEXP |
字符串是否与正则表达式匹配 |
REGEXP_INSTR() |
匹配正则表达式的子字符串的起始索引 |
REGEXP_LIKE() |
字符串是否与正则表达式匹配 |
REGEXP_REPLACE() |
替换与正则表达式匹配的子字符串 |
REGEXP_SUBSTR() |
返回与正则表达式匹配的子字符串 |
REPEAT() |
将字符串重复指定次数 |
REPLACE() |
替换指定字符串的出现 |
REVERSE() |
反转字符串中的字符 |
RIGHT() |
返回指定数量的最右侧字符 |
RLIKE |
字符串是否与正则表达式匹配 |
RPAD() |
将字符串追加指定次数 |
RTRIM() |
删除结尾空格 |
SOUNDEX() |
返回 soundex 字符串 |
SOUNDS LIKE |
比较发音 |
SPACE() |
返回包含指定数量空格的字符串 |
STRCMP() |
比较两个字符串 |
SUBSTR() |
返回指定的子字符串 |
SUBSTRING() |
返回指定的子字符串 |
SUBSTRING_INDEX() |
返回分隔符指定出现次数之前的字符串中的子字符串 |
TRIM() |
删除开头和结尾空格 |
UCASE() |
UPPER() 的同义词 |
UNHEX() |
返回包含数字十六进制表示形式的字符串 |
UPPER() |
转换为大写 |
WEIGHT_STRING() |
返回字符串的权重字符串 |
如果结果的长度大于 max_allowed_packet
系统变量的值,则字符串值函数将返回 NULL
。请参阅 第 7.1.1 节,“配置服务器”。
对于对字符串位置进行操作的函数,第一个位置的编号为 1。
对于采用长度参数的函数,非整型参数将四舍五入到最接近的整数。
返回字符串
str
最左侧字符的数值。如果str
是空字符串,则返回0
。如果str
是NULL
,则返回NULL
。ASCII()
适用于 8 位字符。mysql> SELECT ASCII('2'); -> 50 mysql> SELECT ASCII(2); -> 50 mysql> SELECT ASCII('dx'); -> 100
另请参阅
ORD()
函数。返回
N
的二进制值的字符串表示形式,其中N
是 longlong(BIGINT
)数字。这等效于CONV(
。如果N
,10,2)N
是NULL
,则返回NULL
。mysql> SELECT BIN(12); -> '1100'
返回字符串
str
的位长度。如果str
是NULL
,则返回NULL
。mysql> SELECT BIT_LENGTH('text'); -> 32
CHAR(
N
,... [USINGcharset_name
])CHAR()
将每个参数N
解释为一个整数,并返回一个字符串,该字符串由这些整数的代码值给出的字符组成。NULL
值将被跳过。mysql> SELECT CHAR(77,121,83,81,'76'); +--------------------------------------------------+ | CHAR(77,121,83,81,'76') | +--------------------------------------------------+ | 0x4D7953514C | +--------------------------------------------------+ 1 row in set (0.00 sec) mysql> SELECT CHAR(77,77.3,'77.3'); +--------------------------------------------+ | CHAR(77,77.3,'77.3') | +--------------------------------------------+ | 0x4D4D4D | +--------------------------------------------+ 1 row in set (0.00 sec)
默认情况下,
CHAR()
返回一个二进制字符串。要生成给定字符集中的字符串,请使用可选的USING
子句mysql> SELECT CHAR(77,121,83,81,'76' USING utf8mb4); +---------------------------------------+ | CHAR(77,121,83,81,'76' USING utf8mb4) | +---------------------------------------+ | MySQL | +---------------------------------------+ 1 row in set (0.00 sec) mysql> SELECT CHAR(77,77.3,'77.3' USING utf8mb4); +------------------------------------+ | CHAR(77,77.3,'77.3' USING utf8mb4) | +------------------------------------+ | MMM | +------------------------------------+ 1 row in set, 1 warning (0.00 sec) mysql> SHOW WARNINGS; +---------+------+-------------------------------------------+ | Level | Code | Message | +---------+------+-------------------------------------------+ | Warning | 1292 | Truncated incorrect INTEGER value: '77.3' | +---------+------+-------------------------------------------+ 1 row in set (0.00 sec)
如果给出了
USING
并且结果字符串对于给定的字符集是非法的,则会发出警告。此外,如果启用了严格 SQL 模式,则CHAR()
的结果将变为NULL
。如果从 mysql 客户端内调用
CHAR()
,则二进制字符串将使用十六进制表示法显示,具体取决于--binary-as-hex
的值。有关该选项的更多信息,请参见 第 6.5.1 节“mysql - MySQL 命令行客户端”。大于 255 的
CHAR()
参数将转换为多个结果字节。例如,CHAR(256)
等效于CHAR(1,0)
,而CHAR(256*256)
等效于CHAR(1,0,0)
mysql> SELECT HEX(CHAR(1,0)), HEX(CHAR(256)); +----------------+----------------+ | HEX(CHAR(1,0)) | HEX(CHAR(256)) | +----------------+----------------+ | 0100 | 0100 | +----------------+----------------+ 1 row in set (0.00 sec) mysql> SELECT HEX(CHAR(1,0,0)), HEX(CHAR(256*256)); +------------------+--------------------+ | HEX(CHAR(1,0,0)) | HEX(CHAR(256*256)) | +------------------+--------------------+ | 010000 | 010000 | +------------------+--------------------+ 1 row in set (0.00 sec)
返回字符串
str
的长度,以代码点为单位。多字节字符计为一个代码点。这意味着,对于包含两个 3 字节字符的字符串,LENGTH()
返回6
,而CHAR_LENGTH()
返回2
,如下所示mysql> SET @dolphin:='海豚'; Query OK, 0 rows affected (0.01 sec) mysql> SELECT LENGTH(@dolphin), CHAR_LENGTH(@dolphin); +------------------+-----------------------+ | LENGTH(@dolphin) | CHAR_LENGTH(@dolphin) | +------------------+-----------------------+ | 6 | 2 | +------------------+-----------------------+ 1 row in set (0.00 sec)
如果
str
为NULL
,则CHAR_LENGTH()
返回NULL
。CHARACTER_LENGTH()
是CHAR_LENGTH()
的同义词。返回连接参数后得到的字符串。可以有一个或多个参数。如果所有参数都是非二进制字符串,则结果是非二进制字符串。如果参数中包含任何二进制字符串,则结果为二进制字符串。数字参数将转换为其等效的非二进制字符串形式。
如果任何参数为
NULL
,则CONCAT()
返回NULL
。mysql> SELECT CONCAT('My', 'S', 'QL'); -> 'MySQL' mysql> SELECT CONCAT('My', NULL, 'QL'); -> NULL mysql> SELECT CONCAT(14.3); -> '14.3'
对于带引号的字符串,可以通过将字符串彼此相邻放置来执行连接
mysql> SELECT 'My' 'S' 'QL'; -> 'MySQL'
如果从 mysql 客户端内调用
CONCAT()
,则二进制字符串结果将使用十六进制表示法显示,具体取决于--binary-as-hex
的值。有关该选项的更多信息,请参见 第 6.5.1 节“mysql - MySQL 命令行客户端”。CONCAT_WS(
separator
,str1
,str2
,...)CONCAT_WS()
代表 Concatenate With Separator(使用分隔符连接),是CONCAT()
的一种特殊形式。第一个参数是其余参数的分隔符。分隔符添加在要连接的字符串之间。分隔符可以是字符串,其余参数也可以是字符串。如果分隔符为NULL
,则结果为NULL
。mysql> SELECT CONCAT_WS(',', 'First name', 'Second name', 'Last Name'); -> 'First name,Second name,Last Name' mysql> SELECT CONCAT_WS(',', 'First name', NULL, 'Last Name'); -> 'First name,Last Name'
CONCAT_WS()
不会跳过空字符串。但是,它会跳过分隔符参数后的任何NULL
值。ELT()
返回字符串列表中的第N
个元素:如果N
=1
,则返回str1
;如果N
=2
,则返回str2
,依此类推。如果N
小于1
、大于参数个数或为NULL
,则返回NULL
。ELT()
是FIELD()
的补充。mysql> SELECT ELT(1, 'Aa', 'Bb', 'Cc', 'Dd'); -> 'Aa' mysql> SELECT ELT(4, 'Aa', 'Bb', 'Cc', 'Dd'); -> 'Dd'
EXPORT_SET(
bits
,on
,off
[,separator
[,number_of_bits
]])返回一个字符串,以便对于值
bits
中设置的每个位,您都会获得一个on
字符串,而对于值中未设置的每个位,您都会获得一个off
字符串。bits
中的位从右到左(从低位到高位)进行检查。字符串从左到右添加到结果中,并以separator
字符串(默认为逗号字符,
)分隔。检查的位数由number_of_bits
给出,如果未指定,则默认为 64。如果number_of_bits
大于 64,则会将其静默剪裁为 64。它被视为无符号整数,因此值 -1 实际上与 64 相同。mysql> SELECT EXPORT_SET(5,'Y','N',',',4); -> 'Y,N,Y,N' mysql> SELECT EXPORT_SET(6,'1','0',',',10); -> '0,1,1,0,0,0,0,0,0,0'
返回
str
在str1
、str2
、str3
、...
列表中的索引(位置)。如果未找到str
,则返回0
。如果
FIELD()
的所有参数都是字符串,则所有参数都将作为字符串进行比较。如果所有参数都是数字,则将它们作为数字进行比较。否则,将参数作为双精度值进行比较。如果
str
为NULL
,则返回值为0
,因为NULL
与任何值的相等性比较均失败。FIELD()
是ELT()
的补充。mysql> SELECT FIELD('Bb', 'Aa', 'Bb', 'Cc', 'Dd', 'Ff'); -> 2 mysql> SELECT FIELD('Gg', 'Aa', 'Bb', 'Cc', 'Dd', 'Ff'); -> 0
如果字符串
str
位于由N
个子字符串组成的字符串列表strlist
中,则返回 1 到N
范围内的值。字符串列表是由,
字符分隔的子字符串组成的字符串。如果第一个参数是常量字符串,而第二个参数是SET
类型的列,则FIND_IN_SET()
函数将优化为使用位运算。如果str
不在strlist
中,或者strlist
是空字符串,则返回0
。如果任一参数为NULL
,则返回NULL
。如果第一个参数包含逗号 (,
) 字符,则此函数无法正常工作。mysql> SELECT FIND_IN_SET('b','a,b,c,d'); -> 2
将数字
X
格式化为'#,###,###.##'
之类的格式,四舍五入到D
个小数位,并将结果作为字符串返回。如果D
为0
,则结果没有小数点或小数部分。如果X
或D
为NULL
,则该函数返回NULL
。可选的第三个参数允许指定一个区域设置,用于结果数字的小数点、千位分隔符和分隔符之间的分组。允许的区域设置值与
lc_time_names
系统变量的合法值相同(请参见 第 12.16 节“MySQL 服务器区域设置支持”)。如果区域设置为NULL
或未指定,则默认区域设置为'en_US'
。mysql> SELECT FORMAT(12332.123456, 4); -> '12,332.1235' mysql> SELECT FORMAT(12332.1,4); -> '12,332.1000' mysql> SELECT FORMAT(12332.2,0); -> '12,332' mysql> SELECT FORMAT(12332.2,2,'de_DE'); -> '12.332,20'
采用使用
TO_BASE64()
使用的 base-64 编码规则编码的字符串,并将解码后的结果作为二进制字符串返回。如果参数为NULL
或不是有效的 base-64 字符串,则结果为NULL
。有关编码和解码规则的详细信息,请参见TO_BASE64()
的说明。mysql> SELECT TO_BASE64('abc'), FROM_BASE64(TO_BASE64('abc')); -> 'JWJj', 'abc'
如果从 mysql 客户端内调用
FROM_BASE64()
,则二进制字符串将使用十六进制表示法显示。您可以通过在启动 mysql 客户端时将--binary-as-hex
的值设置为0
来禁用此行为。有关该选项的更多信息,请参见 第 6.5.1 节“mysql - MySQL 命令行客户端”。对于字符串参数
str
,HEX()
返回str
的十六进制字符串表示形式,其中str
中每个字符的每个字节都转换为两个十六进制数字。(因此,多字节字符将变为两个以上数字。)UNHEX()
函数执行此操作的逆操作。对于数字参数
N
,HEX()
返回N
的值的十六进制字符串表示形式,该值被视为 longlong (BIGINT
) 数字。这等效于CONV(
。N
,10,16)CONV(HEX(
执行此操作的逆操作。N
),16,10)对于
NULL
参数,此函数返回NULL
。mysql> SELECT X'616263', HEX('abc'), UNHEX(HEX('abc')); -> 'abc', 616263, 'abc' mysql> SELECT HEX(255), CONV(HEX(255),16,10); -> 'FF', 255
返回字符串
str
,将从位置pos
开始且长度为len
个字符的子字符串替换为字符串newstr
。如果pos
不在字符串长度范围内,则返回原始字符串。如果len
不在字符串其余部分的长度范围内,则替换从位置pos
开始的字符串的其余部分。如果任何参数为NULL
,则返回NULL
。mysql> SELECT INSERT('Quadratic', 3, 4, 'What'); -> 'QuWhattic' mysql> SELECT INSERT('Quadratic', -1, 4, 'What'); -> 'Quadratic' mysql> SELECT INSERT('Quadratic', 3, 100, 'What'); -> 'QuWhat'
此函数是多字节安全的。
返回子字符串
substr
在字符串str
中第一次出现的位置。这与LOCATE()
的双参数形式相同,只是参数的顺序相反。mysql> SELECT INSTR('foobarbar', 'bar'); -> 4 mysql> SELECT INSTR('xbar', 'foobar'); -> 0
此函数是多字节安全的,并且仅当至少一个参数是二进制字符串时才区分大小写。如果任一参数为
NULL
,则此函数返回NULL
。在存储视图定义时,视图中使用的
LCASE()
会被重写为LOWER()
。(错误号 #12844279)从字符串
str
返回最左边的len
个字符,如果任何参数为NULL
,则返回NULL
。mysql> SELECT LEFT('foobarbar', 5); -> 'fooba'
此函数是多字节安全的。
返回字符串
str
的长度(以字节为单位)。一个多字节字符计为多个字节。这意味着对于包含五个 2 字节字符的字符串,LENGTH()
返回10
,而CHAR_LENGTH()
返回5
。如果str
为NULL
,则返回NULL
。mysql> SELECT LENGTH('text'); -> 4
注意OpenGIS 空间函数
Length()
在 MySQL 中被命名为ST_Length()
。读取文件并将文件内容作为字符串返回。要使用此函数,文件必须位于服务器主机上,您必须指定文件的完整路径名,并且您必须具有
FILE
权限。该文件必须可由服务器读取,并且其大小小于max_allowed_packet
字节。如果secure_file_priv
系统变量设置为非空目录名,则要加载的文件必须位于该目录中。如果文件不存在或由于不满足上述条件之一而无法读取,则该函数返回
NULL
。character_set_filesystem
系统变量控制对作为文字字符串给出的文件名的解释。mysql> UPDATE t SET blob_col=LOAD_FILE('/tmp/picture') WHERE id=1;
LOCATE(
,substr
,str
)LOCATE(
substr
,str
,pos
)第一个语法返回子字符串
substr
在字符串str
中第一次出现的位置。第二个语法返回子字符串substr
在字符串str
中从位置pos
开始第一次出现的位置。如果substr
不在str
中,则返回0
。如果任何参数为NULL
,则返回NULL
。mysql> SELECT LOCATE('bar', 'foobarbar'); -> 4 mysql> SELECT LOCATE('xbar', 'foobar'); -> 0 mysql> SELECT LOCATE('bar', 'foobarbar', 5); -> 7
此函数是多字节安全的,并且仅当至少一个参数是二进制字符串时才区分大小写。
根据当前字符集映射,返回所有字符都变为小写的字符串
str
,如果str
为NULL
,则返回NULL
。默认字符集为utf8mb4
。mysql> SELECT LOWER('QUADRATICALLY'); -> 'quadratically'
当应用于二进制字符串(
BINARY
、VARBINARY
、BLOB
)时,LOWER()
(和UPPER()
)无效。要执行二进制字符串的大小写转换,请先使用适合存储在字符串中的数据的字符集将其转换为非二进制字符串。mysql> SET @str = BINARY 'New York'; mysql> SELECT LOWER(@str), LOWER(CONVERT(@str USING utf8mb4)); +-------------+------------------------------------+ | LOWER(@str) | LOWER(CONVERT(@str USING utf8mb4)) | +-------------+------------------------------------+ | New York | new york | +-------------+------------------------------------+
对于 Unicode 字符集的排序规则,
LOWER()
和UPPER()
根据排序规则名称中的 Unicode 排序规则算法 (UCA) 版本(如果有)和 UCA 4.0.0(如果未指定版本)工作。例如,utf8mb4_0900_ai_ci
和utf8mb3_unicode_520_ci
分别根据 UCA 9.0.0 和 5.2.0 工作,而utf8mb3_unicode_ci
根据 UCA 4.0.0 工作。请参阅 第 12.10.1 节“Unicode 字符集”。此函数是多字节安全的。
视图中使用的
LCASE()
会被重写为LOWER()
。返回字符串
str
,在其左侧使用字符串padstr
填充,使其长度达到len
个字符。如果str
的长度大于len
,则返回值将被截短为len
个字符。mysql> SELECT LPAD('hi',4,'??'); -> '??hi' mysql> SELECT LPAD('hi',1,'??'); -> 'h'
如果它的任何参数为
NULL
,则返回NULL
。返回已删除前导空格字符的字符串
str
。如果str
为NULL
,则返回NULL
。mysql> SELECT LTRIM(' barbar'); -> 'barbar'
此函数是多字节安全的。
返回一个集合值(一个包含由
,
字符分隔的子字符串的字符串),该值由在bits
中设置了相应位的字符串组成。str1
对应于位 0,str2
对应于位 1,依此类推。str1
、str2
、...
中的NULL
值不会附加到结果中。mysql> SELECT MAKE_SET(1,'a','b','c'); -> 'a' mysql> SELECT MAKE_SET(1 | 4,'hello','nice','world'); -> 'hello,world' mysql> SELECT MAKE_SET(1 | 4,'hello','nice',NULL,'world'); -> 'hello' mysql> SELECT MAKE_SET(0,'a','b','c'); -> ''
返回
N
的八进制值的字符串表示形式,其中N
是一个 longlong(BIGINT
)数字。这等效于CONV(
。如果N
,10,8)N
为NULL
,则返回NULL
。mysql> SELECT OCT(12); -> '14'
OCTET_LENGTH()
是LENGTH()
的同义词。如果字符串
str
最左边的字符是多字节字符,则返回该字符的代码,该代码使用以下公式根据其组成字节的数值计算得出(1st byte code) + (2nd byte code * 256) + (3rd byte code * 256^2) ...
如果最左边的字符不是多字节字符,则
ORD()
返回与ASCII()
函数相同的值。如果str
为NULL
,则该函数返回NULL
。mysql> SELECT ORD('2'); -> 50
引用字符串以生成可在 SQL 语句中用作正确转义数据值的结果。返回的字符串用单引号引起来,并且每个反斜杠 (
\
)、单引号 ('
)、ASCIINUL
和 Control+Z 字符前面都有一个反斜杠。如果参数为NULL
,则返回值是不带单引号的单词““NULL””。mysql> SELECT QUOTE('Don\'t!'); -> 'Don\'t!' mysql> SELECT QUOTE(NULL); -> NULL
有关比较,请参阅 第 11.1.1 节“字符串文字” 和 mysql_real_escape_string_quote() 中关于文字字符串和 C API 中的引用规则。
返回一个字符串,该字符串由重复
count
次的字符串str
组成。如果count
小于 1,则返回一个空字符串。如果str
或count
为NULL
,则返回NULL
。mysql> SELECT REPEAT('MySQL', 3); -> 'MySQLMySQLMySQL'
返回字符串
str
,其中所有出现的字符串from_str
都替换为字符串to_str
。REPLACE()
在搜索from_str
时执行区分大小写的匹配。mysql> SELECT REPLACE('www.mysql.com', 'w', 'Ww'); -> 'WwWwWw.mysql.com'
此函数是多字节安全的。如果它的任何参数为
NULL
,则返回NULL
。返回字符顺序颠倒的字符串
str
,如果str
为NULL
,则返回NULL
。mysql> SELECT REVERSE('abc'); -> 'cba'
此函数是多字节安全的。
从字符串
str
返回最右边的len
个字符,如果任何参数为NULL
,则返回NULL
。mysql> SELECT RIGHT('foobarbar', 4); -> 'rbar'
此函数是多字节安全的。
返回字符串
str
,在其右侧使用字符串padstr
填充,使其长度达到len
个字符。如果str
的长度大于len
,则返回值将被截短为len
个字符。如果str
、padstr
或len
为NULL
,则该函数返回NULL
。mysql> SELECT RPAD('hi',5,'?'); -> 'hi???' mysql> SELECT RPAD('hi',1,'?'); -> 'h'
此函数是多字节安全的。
返回已删除尾随空格字符的字符串
str
。mysql> SELECT RTRIM('barbar '); -> 'barbar'
此函数是多字节安全的,如果
str
为NULL
,则返回NULL
。从
str
返回一个 soundex 字符串,如果str
为NULL
,则返回NULL
。两个听起来几乎相同的字符串应该具有相同的 soundex 字符串。标准的 soundex 字符串长度为四个字符,但SOUNDEX()
函数返回一个任意长度的字符串。您可以对结果使用SUBSTRING()
来获取标准的 soundex 字符串。str
中的所有非字母字符都将被忽略。A-Z 范围外的所有国际字母字符都被视为元音。重要当使用
SOUNDEX()
时,您应该注意以下限制此函数,按照目前的实现,仅适用于英语字符串。其他语言的字符串可能无法产生可靠的结果。
此函数不能保证对使用多字节字符集(包括
utf-8
)的字符串提供一致的结果。有关更多信息,请参阅错误 #22638。
mysql> SELECT SOUNDEX('Hello'); -> 'H400' mysql> SELECT SOUNDEX('Quadratically'); -> 'Q36324'
注意此函数实现的是原始的 Soundex 算法,而不是更流行的增强版本(D. Knuth 也描述过)。区别在于原始版本首先丢弃元音,其次是重复项,而增强版本首先丢弃重复项,其次是元音。
返回一个由
N
个空格字符组成的字符串,如果N
为NULL
则返回NULL
。mysql> SELECT SPACE(6); -> ' '
SUBSTR(
,str
,pos
)SUBSTR(
,str
FROMpos
)SUBSTR(
,str
,pos
,len
)SUBSTR(
str
FROMpos
FORlen
)SUBSTR()
是SUBSTRING()
的同义词。SUBSTRING(
,str
,pos
)SUBSTRING(
,str
FROMpos
)SUBSTRING(
,str
,pos
,len
)SUBSTRING(
str
FROMpos
FORlen
)没有
len
参数的形式返回从字符串str
的位置pos
开始的子字符串。带有len
参数的形式返回从字符串str
的位置pos
开始的长度为len
个字符的子字符串。使用FROM
的形式是标准 SQL 语法。也可以为pos
使用负值。在这种情况下,子字符串的开头是字符串末尾的pos
个字符,而不是开头。在此函数的任何形式中,pos
都可以使用负值。pos
的值为 0 时返回空字符串。对于
SUBSTRING()
的所有形式,要提取子字符串的字符串中第一个字符的位置都计为1
。mysql> SELECT SUBSTRING('Quadratically',5); -> 'ratically' mysql> SELECT SUBSTRING('foobarbar' FROM 4); -> 'barbar' mysql> SELECT SUBSTRING('Quadratically',5,6); -> 'ratica' mysql> SELECT SUBSTRING('Sakila', -3); -> 'ila' mysql> SELECT SUBSTRING('Sakila', -5, 3); -> 'aki' mysql> SELECT SUBSTRING('Sakila' FROM -4 FOR 2); -> 'ki'
此函数是多字节安全的。如果它的任何参数为
NULL
,则返回NULL
。如果
len
小于 1,则结果为空字符串。SUBSTRING_INDEX(
str
,delim
,count
)返回字符串
str
中在分隔符delim
出现count
次之前的子字符串。如果count
为正数,则返回最后一个分隔符(从左开始计数)左侧的所有内容。如果count
为负数,则返回最后一个分隔符(从右开始计数)右侧的所有内容。SUBSTRING_INDEX()
在搜索delim
时执行区分大小写的匹配。mysql> SELECT SUBSTRING_INDEX('www.mysql.com', '.', 2); -> 'www.mysql' mysql> SELECT SUBSTRING_INDEX('www.mysql.com', '.', -2); -> 'mysql.com'
此函数是多字节安全的。
如果
SUBSTRING_INDEX()
的任何参数为NULL
,则返回NULL
。将字符串参数转换为 base-64 编码形式,并以具有连接字符集和排序规则的字符字符串形式返回结果。如果参数不是字符串,则在转换之前将其转换为字符串。如果参数为
NULL
,则结果为NULL
。可以使用FROM_BASE64()
函数解码 Base-64 编码的字符串。mysql> SELECT TO_BASE64('abc'), FROM_BASE64(TO_BASE64('abc')); -> 'JWJj', 'abc'
存在不同的 base-64 编码方案。以下是
TO_BASE64()
和FROM_BASE64()
使用的编码和解码规则字母值 62 的编码为
'+'
。字母值 63 的编码为
'/'
。编码后的输出由 4 个可打印字符组成。输入数据每 3 个字节使用 4 个字符进行编码。如果最后一组不完整,则用
'='
字符填充到长度为 4。在编码输出的每 76 个字符后添加一个换行符,以将长输出分成多行。
解码会识别并忽略换行符、回车符、制表符和空格。
TRIM([{BOTH | LEADING | TRAILING} [
,remstr
] FROM]str
)TRIM([
remstr
FROM]str
)返回删除了所有
remstr
前缀或后缀的字符串str
。如果没有给出BOTH
、LEADING
或TRAILING
说明符,则假定为BOTH
。remstr
是可选的,如果没有指定,则删除空格。mysql> SELECT TRIM(' bar '); -> 'bar' mysql> SELECT TRIM(LEADING 'x' FROM 'xxxbarxxx'); -> 'barxxx' mysql> SELECT TRIM(BOTH 'x' FROM 'xxxbarxxx'); -> 'bar' mysql> SELECT TRIM(TRAILING 'xyz' FROM 'barxxyz'); -> 'barx'
此函数是多字节安全的。如果它的任何参数为
NULL
,则返回NULL
。视图中使用的
UCASE()
被重写为UPPER()
。对于字符串参数
str
,UNHEX(
将参数中的每对字符解释为一个十六进制数,并将其转换为该数字表示的字节。返回值是一个二进制字符串。str
)mysql> SELECT UNHEX('4D7953514C'); -> 'MySQL' mysql> SELECT X'4D7953514C'; -> 'MySQL' mysql> SELECT UNHEX(HEX('string')); -> 'string' mysql> SELECT HEX(UNHEX('1267')); -> '1267'
参数字符串中的字符必须是合法的十六进制数字:
'0'
..'9'
、'A'
..'F'
、'a'
..'f'
。如果参数包含任何非十六进制数字,或者本身为NULL
,则结果为NULL
mysql> SELECT UNHEX('GG'); +-------------+ | UNHEX('GG') | +-------------+ | NULL | +-------------+ mysql> SELECT UNHEX(NULL); +-------------+ | UNHEX(NULL) | +-------------+ | NULL | +-------------+
如果
UNHEX()
的参数是BINARY
列,则也可能出现NULL
结果,因为值在存储时用0x00
字节填充,但在检索时不会删除这些字节。例如,'41'
存储到CHAR(3)
列中为'41 '
,并检索为'41'
(删除了尾随填充空格),因此列值的UNHEX()
返回X'41'
。相反,'41'
存储到BINARY(3)
列中为'41\0'
,并检索为'41\0'
(尾随填充0x00
字节未删除)。'\0'
不是合法的十六进制数字,因此列值的UNHEX()
返回NULL
。对于数值参数
N
,UNHEX()
不会执行HEX(
的逆运算。请改用N
)CONV(HEX(
。请参阅N
),16,10)HEX()
的说明。如果从 mysql 客户端内部调用
UNHEX()
,则二进制字符串将使用十六进制表示法显示,具体取决于--binary-as-hex
的值。有关该选项的更多信息,请参阅 第 6.5.1 节“mysql - MySQL 命令行客户端”。根据当前字符集映射,返回所有字符都更改为大写的字符串
str
;如果str
为NULL
,则返回NULL
。默认字符集为utf8mb4
。mysql> SELECT UPPER('Hej'); -> 'HEJ'
有关也适用于
UPPER()
的信息,请参阅LOWER()
的说明。这包括有关如何对这些函数无效的二进制字符串(BINARY
、VARBINARY
、BLOB
)执行字母大小写转换的信息,以及有关 Unicode 字符集的大小写折叠的信息。此函数是多字节安全的。
视图中使用的
UCASE()
被重写为UPPER()
。WEIGHT_STRING(
str
[AS {CHAR|BINARY}(N
)] [flags
])此函数返回输入字符串的权重字符串。返回值是一个表示字符串的比较和排序值的二进制字符串,如果参数为
NULL
,则返回NULL
。它具有以下属性如果
WEIGHT_STRING(
=str1
)WEIGHT_STRING(
,则str2
)
(str1
=str2
str1
和str2
被视为相等)如果
WEIGHT_STRING(
<str1
)WEIGHT_STRING(
,则str2
)
(str1
<str2
str1
排序在str2
之前)
WEIGHT_STRING()
是一个用于内部调试的函数。它的行为可能会在 MySQL 版本之间发生变化,恕不另行通知。它可用于测试和调试排序规则,尤其是在添加新排序规则时。请参阅 第 12.14 节“向字符集添加排序规则”。此列表简要总结了参数。更多详细信息将在列表后面的讨论中给出。
str
:输入字符串表达式。AS
子句:可选;将输入字符串转换为给定的类型和长度。flags
:可选;未使用。
输入字符串
str
是一个字符串表达式。如果输入是非二进制(字符)字符串,例如CHAR
、VARCHAR
或TEXT
值,则返回值包含字符串的排序权重。如果输入是二进制(字节)字符串,例如BINARY
、VARBINARY
或BLOB
值,则返回值与输入相同(二进制字符串中每个字节的权重是其字节值)。如果输入为NULL
,则WEIGHT_STRING()
返回NULL
。示例
mysql> SET @s = _utf8mb4 'AB' COLLATE utf8mb4_0900_ai_ci; mysql> SELECT @s, HEX(@s), HEX(WEIGHT_STRING(@s)); +------+---------+------------------------+ | @s | HEX(@s) | HEX(WEIGHT_STRING(@s)) | +------+---------+------------------------+ | AB | 4142 | 1C471C60 | +------+---------+------------------------+
mysql> SET @s = _utf8mb4 'ab' COLLATE utf8mb4_0900_ai_ci; mysql> SELECT @s, HEX(@s), HEX(WEIGHT_STRING(@s)); +------+---------+------------------------+ | @s | HEX(@s) | HEX(WEIGHT_STRING(@s)) | +------+---------+------------------------+ | ab | 6162 | 1C471C60 | +------+---------+------------------------+
mysql> SET @s = CAST('AB' AS BINARY); mysql> SELECT @s, HEX(@s), HEX(WEIGHT_STRING(@s)); +------+---------+------------------------+ | @s | HEX(@s) | HEX(WEIGHT_STRING(@s)) | +------+---------+------------------------+ | AB | 4142 | 4142 | +------+---------+------------------------+
mysql> SET @s = CAST('ab' AS BINARY); mysql> SELECT @s, HEX(@s), HEX(WEIGHT_STRING(@s)); +------+---------+------------------------+ | @s | HEX(@s) | HEX(WEIGHT_STRING(@s)) | +------+---------+------------------------+ | ab | 6162 | 6162 | +------+---------+------------------------+
前面的示例使用
HEX()
来显示WEIGHT_STRING()
的结果。因为结果是一个二进制值,所以当结果包含不可打印值时,HEX()
特别有用,可以以可打印的形式显示它。mysql> SET @s = CONVERT(X'C39F' USING utf8mb4) COLLATE utf8mb4_czech_ci; mysql> SELECT HEX(WEIGHT_STRING(@s)); +------------------------+ | HEX(WEIGHT_STRING(@s)) | +------------------------+ | 0FEA0FEA | +------------------------+
对于非
NULL
的返回值,如果其长度在VARBINARY
的最大长度范围内,则该值的类型为VARBINARY
,否则,该类型为BLOB
。可以使用
AS
子句将输入字符串转换为非二进制或二进制字符串,并将其强制转换为给定长度。AS CHAR(
将字符串转换为非二进制字符串,并在右侧用空格填充到N
)N
个字符的长度。N
必须至少为 1。如果N
小于输入字符串的长度,则字符串将被截断为N
个字符。截断时不会发出警告。AS BINARY(
类似,但会将字符串转换为二进制字符串,N
)N
以字节(而不是字符)为单位,并且填充使用0x00
字节(而不是空格)。
mysql> SET NAMES 'latin1'; mysql> SELECT HEX(WEIGHT_STRING('ab' AS CHAR(4))); +-------------------------------------+ | HEX(WEIGHT_STRING('ab' AS CHAR(4))) | +-------------------------------------+ | 41422020 | +-------------------------------------+ mysql> SET NAMES 'utf8mb4'; mysql> SELECT HEX(WEIGHT_STRING('ab' AS CHAR(4))); +-------------------------------------+ | HEX(WEIGHT_STRING('ab' AS CHAR(4))) | +-------------------------------------+ | 1C471C60 | +-------------------------------------+
mysql> SELECT HEX(WEIGHT_STRING('ab' AS BINARY(4))); +---------------------------------------+ | HEX(WEIGHT_STRING('ab' AS BINARY(4))) | +---------------------------------------+ | 61620000 | +---------------------------------------+
flags
子句当前未使用。如果从 mysql 客户端调用
WEIGHT_STRING()
,则二进制字符串将使用十六进制表示法显示,具体取决于--binary-as-hex
的值。有关该选项的更多信息,请参见 第 6.5.1 节“mysql - MySQL 命令行客户端”。