跳到主要内容

最小写入副本数

默认情况下,数据导入要求至少有超过半数的副本写入成功,导入才算成功。然而,这种方式不够灵活,在某些场景会带来不便。

举个例子,对于两副本情况,按上面的多数派原则,要想导入数据,则需要这两个副本都写入成功。这意味着,在导入数据过程中,不允许任意一个副本不可用。这极大影响了集群的可用性。

为了解决以上问题,Doris 允许用户设置最小写入副本数 (Min Load Replica Num)。对导入数据任务,当它成功写入的副本数大于或等于最小写入副本数时,导入即成功。

用法

单个表的最小写入副本数

可以对单个 OLAP 表,设置最小写入副本数,并用表属性 min_load_replica_num 来表示。该属性的有效值要求大于 0 且不超过表的副本数。其默认值为 -1,表示不启用该属性。

可以在创建表时设置表的 min_load_replica_num

CREATE TABLE test_table1
(
k1 INT,
k2 INT
)
DUPLICATE KEY(k1)
DISTRIBUTED BY HASH(k1) BUCKETS 5
PROPERTIES
(
'replication_num' = '2',
'min_load_replica_num' = '1'
);

对一个已存在的表,可以使用语句 ALTER TABLE 来修改它的 min_load_replica_num

ALTER TABLE test_table1
SET ( 'min_load_replica_num' = '1');

可以使用语句 SHOW CREATE TABLE 来查看表的属性 min_load_replica_num

SHOW CREATE TABLE test_table1;

输出结果的 PROPERTIES 中将包含 min_load_replica_num。例如:

Create Table: CREATE TABLE `test_table1` (
`k1` int(11) NULL,
`k2` int(11) NULL
) ENGINE=OLAP
DUPLICATE KEY(`k1`)
COMMENT 'OLAP'
DISTRIBUTED BY HASH(`k1`) BUCKETS 5
PROPERTIES (
"replication_allocation" = "tag.location.default: 2",
"min_load_replica_num" = "1",
"storage_format" = "V2",
"light_schema_change" = "true",
"disable_auto_compaction" = "false",
"enable_single_replica_compaction" = "false"
);

全局最小写入副本数

可以对所有 OLAP 表,设置全局最小写入副本数,并用 FE 的配置项 min_load_replica_num 来表示。该配置项的有效值要求大于 0。其默认值为 -1,表示不开启全局最小写入副本数。

对一个表,如果表属性 min_load_replica_num 有效(即大于 0),那么该表将会忽略全局配置min_load_replica_num。否则,如果全局配置 min_load_replica_num 有效(即大于 0),那么该表的最小写入副本数将等于 min(FE.conf.min_load_replica_num,table.replication_num/2 + 1)

对于 FE 配置项的查看和修改,可以参考这里

其余情况

如果没有开启表属性 min_load_replica_num(即小于或者等于 0),也没有设置全局配置 min_load_replica_num(即小于或等于 0),那么数据的导入仍需多数派副本写入成功才算成功。此时,表的最小写入副本数等于 table.replicatition_num/2 + 1