MySQL 8.4 发行说明
MySQL 还支持线性哈希,它与常规哈希的不同之处在于线性哈希使用线性 2 的幂算法,而常规哈希使用哈希函数值的模数。
语法上,线性哈希分区和常规哈希之间的唯一区别是在 PARTITION BY
子句中添加了 LINEAR
关键字,如下所示
Press CTRL+C to copyCREATE TABLE employees ( id INT NOT NULL, fname VARCHAR(30), lname VARCHAR(30), hired DATE NOT NULL DEFAULT '1970-01-01', separated DATE NOT NULL DEFAULT '9999-12-31', job_code INT, store_id INT ) PARTITION BY LINEAR HASH( YEAR(hired) ) PARTITIONS 4;
给定一个表达式 expr
,当使用线性哈希时,记录存储在分区号 N
中,该分区号来自 num
个分区,其中 N
根据以下算法得出
找到大于
num
的下一个 2 的幂。我们将此值称为V
;它可以计算为Press CTRL+C to copyV = POWER(2, CEILING(LOG(2, num)))
(假设
num
为 13。则LOG(2,13)
为 3.7004397181411。CEILING(3.7004397181411)
为 4,而V
=POWER(2,4)
,即 16。)设置
N
=F
(column_list
) & (V
- 1)。当
N
>=num
时设置
V
=V
/ 2设置
N
=N
& (V
- 1)
假设使用线性哈希分区并具有 6 个分区的表 t1
是使用以下语句创建的
Press CTRL+C to copyCREATE TABLE t1 (col1 INT, col2 CHAR(5), col3 DATE) PARTITION BY LINEAR HASH( YEAR(col3) ) PARTITIONS 6;
现在假设您要将两条记录插入到 t1
中,其 col3
列的值分别为 '2003-04-14'
和 '1998-10-19'
。第一个记录的分区号确定如下
Press CTRL+C to copyV = POWER(2, CEILING( LOG(2,6) )) = 8 N = YEAR('2003-04-14') & (8 - 1) = 2003 & 7 = 3 (3 >= 6 is FALSE: record stored in partition #3)
存储第二个记录的分区号计算如下所示
Press CTRL+C to copyV = 8 N = YEAR('1998-10-19') & (8 - 1) = 1998 & 7 = 6 (6 >= 6 is TRUE: additional step required) N = 6 & ((8 / 2) - 1) = 6 & 3 = 2 (2 >= 6 is FALSE: record stored in partition #2)
按线性哈希进行分区的优点是添加、删除、合并和拆分分区变得更快,这在处理包含极大量(TB 级)数据的表时非常有用。缺点是与使用常规哈希分区获得的分布相比,数据不太可能均匀分布在分区之间。