跳到主要内容
跳到主要内容

部署前准备

Doris 存算分离架构部署方式示意图如下,共需要 3 个模块参与工作:

  • FE:负责接收用户请求,负责存储库表的元数据,目前是有状态的,未来会和 BE 类似,演化为无状态。
  • BE:无状态化的 Doris BE 节点,负责具体的计算任务。BE 上会缓存一部分 Tablet 元数据和数据以提高查询性能。
  • MS:存算分离模式新增模块,Meta Service,它主要有两个功能:元数据操作,数据回收。
    • 元数据操作:元数据管理,提供元数据操作的服务,例如创建 Tablet,新增 Rowset,Tablet 查询以及 Rowset 元数据查询等功能。
    • 数据回收:通过定期对记录已标记删除的数据的元数据进行扫描,实现对数据的定期异步正向回收(文件实际存储在 S3 或 HDFS 上),而无须列举数据对象进行元数据对比。

apache-doris-in-compute-storage-decoupled-mode

Meta Service 是一种无状态化的服务,依赖了一个高性能分布式事务 KV(即 FoundationDB)来存储元数据,大幅简化了元数据管理流程,同时提供强大的横向的扩展能力。

deployment-of-compute-storage-decoupled-mode

Doris 存算分离架构依赖于两个外部开源项目,为确保部署顺利,请在开始前预先安装以下依赖:

  • FoundationDB (FDB)
  • OpenJDK17: 需要安装到所有部署 Meta Service 的节点上。

部署步骤

Doris 存算分离模式部署按照模块与分工"自下而上"部署:

  1. 存算分离模式机器规划,这一步骤在本文档介绍。
  2. 部署 FoundationDB 以及运行环境等基础的依赖,这一步骤不需要 Doris 的编译产出即可完成,在本文档介绍。
  3. 部署 Meta Service
  4. 部署 FE 以及 BE
备注

注意:一套 FoundationDB + Meta Service 基础环境可以支撑多个存算分离模式的 Doris 实例(即多套 FE + BE )。

部署规划

一般来说 Doris 存算分离模式适用于比较大型的集群(多台机器),机器越多,越能发挥存算分离模式的优势。 Doris存算分离模式推荐的方式是按照模块划分,尽量避免模块间相互影响。推荐的部署方式以及规划:

  • Meta Service 以及 FDB 使用同一批机器(前者消耗CPU,后者消耗IO)。要求大于等于3台。
    • 存算分离模式要正常运行至少要部署一个 Meta Service 进程。这两种进程是无状态的,可以按需增加部署数量,一般每种进程部署3个能够满足需求。
    • 为了保证 FDB 的性能,可靠性以及扩展性,FDB 需要使用多副本部署的方式。
  • FE单独部署,至少1台,可以按需实际查询需要多部署一些
  • BE单独部署,至少1台,可以按需实际查询需要多部署一些

我们也可以根据不同的部署需求进行不同的部署规划:

  1. 测试体验部署:体验存算分离的功能,多个模块混部在一台机器,不能用于生产环境。
  2. 小规模生产部署:最少 3 台机器部署,保证数据的可靠以及后续往规模的扩展性。部分模块混部。
  3. 大规模生产部署:最少 5 台机器部署,保证数据的可靠以及后续往规模的扩展性。最大限度保证模块的隔离。

接下来我们给出上述每个具体的部署示例。

测试体验部署

所有模块都混部在一个机器上。FDB 使用单机部署方案,具体参考本文档”安装 FoundationDB“章节,完成单机部署 FDB 部分即可。 注意:此方案一定不能用于生产环境。

                                  host1
.------------------.
| FE |
| BE |
| Meta Service |
| FDB |
'------------------'

小规模生产部署

如果机器数量有限,可以使用全混部的方式,但是最少也要求使用3台机器用于 FDB 的部署, 然后所有模块部署在同一批机器,如下是一种可行的规划:

  1. 3 台机器部署一个最小规模的 FDB 高可靠高可用集群
  2. 其中 1 台再混部上 FE + BE + Meta Service
  3. 另外 2 台再混部上 BE

注意:这个部署方案,BE 如果有大查询可能会影响到 FDB 的工作, CPU 内存 IO 资源。 这个部署保证了数据的可靠性和扩展性,我们后续可以根据需求增加机器逐渐横向扩展成大规模的部署

              host1                  host2                  host3
.------------------. .------------------. .------------------.
| FE | | BE | | BE |
| | | | | |
| Meta Service | | | | |
| FDB | | FDB | | FDB |
'------------------' '------------------' '------------------'

大规模生产部署

下图展示了一种比较大规模的部署方案,这个部署方式可以由小规模部署方案逐渐横向扩展形成。

  1. FE 使用 2 台独立机器部署(按需增加机器,可以使用多于 2 台机器,但是一般 2 台足够),保证请求的高可用(互备)。
  2. BE 使用 3 台独立机器部署(按需增加机器,可以使用多于 3 台机器),面对大查询 BE 产生的IO 以及 CPU 影响不会影响到其他模块。
  3. Meta Service 以及 FDB 混部在 3 台独立机器(可以使用多于 3 台机器,一般来说 3 台已经足够服务几十台以上的 FE+BE),充分利用这些机器的 CPU 内存 以及 IO 资源。
                      host1,2                  host3,4,5
.------------------. .------------------.
| .------------------. | .------------------.
| | | | | .------------------.
| | FE | | | | |
'-| | '-| | BE |
'------------------' '-| |
'------------------'

host6 host7 host8
.------------------. .------------------. .------------------.
| Meta Service | | Meta Service | | Meta Service |
| FDB | | FDB | | FDB |
'------------------' '------------------' '------------------'

注意:大规模生产如果对于 Meta Service 的在线(元数据操作)和离线(数据回收)功能有隔离性的需求可以参考 部署 Meta Service 的”将数据回收功能作为单独进程部署“ 章节。

安装 FoundationDB

机器要求

通常情况下,需要至少 3 台机器组成一个双副本、允许单机故障的 FoundationDB 集群。

提示

如果仅出于开发/测试需要,使用一台机器即可。

每台机器都需先安装 FoundationDB 服务。可通过以下地址选择一个版本下载 FoundationDB 安装包,目前通常推荐使用 7.1.38 版本。

对于 CentOS (Red Hat) 和 Ubuntu 用户,以下是下载链接

如果需要更高速的下载,也可使用如下镜像链接:

可以使用如下命令安装 FoundationDB 程序:

// Ubuntu 系统 user@host
$ sudo dpkg -i foundationdb-clients_7.1.23-1_amd64.deb \ foundationdb-server_7.1.23-1_amd64.deb

// CentOS 系统
user@host$ sudo rpm -Uvh foundationdb-clients-7.1.23-1.el7.x86_64.rpm \ foundationdb-server-7.1.23-1.el7.x86_64.rpm

安装完毕后,在命令行输入 fdbcli 查看是否安装成功。若返回结果显示如下 available 字样,则表示安装成功:

user@host$ fdbcli
Using cluster file `/etc/foundationdb/fdb.cluster'.

The database is available.

Welcome to the fdbcli. For help, type `help'.
备注

安装成功后:

  • 默认将启动一个 FoundationDB 服务。
  • 默认集群信息文件 fdb.cluster将存放在/etc/foundationdb/fdb.cluster,默认集群配置文件 foundationdb.conf 将存放在/etc/foundationdb/foundationdb.conf
  • 默认将数据和日志分别保存在/var/lib/foundationdb/data//var/log/foundationdb
  • 默认将新建一个 FoundationDB 的 usergroup,数据和日志的路径默认已具备 FoundationDB 的访问权限。

主机配置

从三台机器中选择一台作为主机。首先完成主机的配置,再配置其他机器。

更改 FoundationDB 配置

根据不同机型调整 FoundationDB 配置, 具体配置请参考 FoundationDB 系统要求

以下是一个基于 8 核 CPU、32GB 内存和一块 500GB SSD 数据盘的机器的foundationdb.conf示例(请确保正确设置 datalog 的存放路径;目前,数据盘一般挂载在 mnt 上):

# foundationdb.conf
##
## Configuration file for FoundationDB server processes
## Full documentation is available at
## https://apple.github.io/foundationdb/configuration.html#the-configuration-file

[fdbmonitor]
user = foundationdb
group = foundationdb

[general]
restart-delay = 60
## By default, restart-backoff = restart-delay-reset-interval = restart-delay
# initial-restart-delay = 0
# restart-backoff = 60
# restart-delay-reset-interval = 60
cluster-file = /etc/foundationdb/fdb.cluster
# delete-envvars =
# kill-on-configuration-change = true

## Default parameters for individual fdbserver processes
[fdbserver]
command = /usr/sbin/fdbserver
public-address = auto:$ID
listen-address = public
logdir = /mnt/foundationdb/log
datadir = /mnt/foundationdb/data/$ID
# logsize = 10MiB
# maxlogssize = 100MiB
# machine-id =
# datacenter-id =
# class =
# memory = 8GiB
# storage-memory = 1GiB
# cache-memory = 2GiB
# metrics-cluster =
# metrics-prefix =

## An individual fdbserver process with id 4500
## Parameters set here override defaults from the [fdbserver] section
[fdbserver.4500]
class = stateless
[fdbserver.4501]
class = stateless

[fdbserver.4502]
class = storage

[fdbserver.4503]
class = storage

[fdbserver.4504]
class = log

[backup_agent]
command = /usr/lib/foundationdb/backup_agent/backup_agent
logdir = /mnt/foundationdb/log

[backup_agent.1]

首先,按照已配置的 datadirlogdir 路径在主机上创建相应的目录,并使其具有 foundationdb 的访问权限:

chown -R foundationdb:foundationdb /mnt/foundationdb/data/ /mnt/foundationdb/log

然后将 /etc/foundationdb/foundationdb.conf 的内容替换为上述相应配置。

配置访问权限

先设置 /etc/foundationdb 目录的访问权限:

chmod -R 777 /etc/foundationdb

在主机中修改 /etc/foundationdb/fdb.cluster 中的 ip 地址,默认是本机地址,修改为内网地址,如:

3OrXp9ei:diDqAjYV@127.0.0.1:4500 -> 3OrXp9ei:diDqAjYV@172.21.16.37:4500

然后重启 FoundationDB 服务:

# for service
user@host$ sudo service foundationdb restart

# for systemd
user@host$ sudo systemctl restart foundationdb.service

配置新数据库

主机由于更改了 datalog 的存放路径,需新建 database。可在 fdbcli 中新建一个 以ssd 为存储引擎的 database

user@host$ fdbcli
fdb> configure new single ssd
Database created

最后通过 fdbcli 检测是否启动正常。

user@host$ fdbcli
Using cluster file `/etc/foundationdb/fdb.cluster'.

The database is available.

Welcome to the fdbcli. For help, type `help'.

至此,主机的配置完成。

构建 FoundationDB 集群

提示

如果仅部署一台机器进行开发/测试,可以跳过此步骤。

对于主机以外的机器,每台机器先按照主机配置步骤,创建 datalog 目录。

然后,设置 /etc/foundationdb 目录的访问权限:

chmod -R 777 /etc/foundationdb

将主机的 /etc/foundationdb/foundationdb.conf /etc/foundationdb/fdb.cluster 替换为本机的 /etc/foundationdb/foundationdb.conf /etc/foundationdb/fdb.cluster

随后在本机重启 FoundationDB 服务。

# for service
user@host$ sudo service foundationdb restart

# for systemd
user@host$ sudo systemctl restart foundationdb.service

待所有机器操作完毕后,所有机器都已连接在同一集群上(即同一 fdb.cluster)。此时登录主机,配置双副本模式:

user@host$ fdbcli
Using cluster file `/etc/foundationdb/fdb.cluster'.

The database is available.

Welcome to the fdbcli. For help, type `help'.
fdb> configure double
Configuration changed.

然后在主机配置 fdb.cluster 可被访问的机器和端口,用于容灾:

user@host$ fdbcli
Using cluster file `/etc/foundationdb/fdb.cluster'.

The database is available.

Welcome to the fdbcli. For help, type `help'.
fdb> coordinators ${主机ip}:4500 ${从机1ip}:4500 ${从机2ip}:4500(需要填写所有机器)
Coordinators changed

最后,通过 fdbcli 中的 status 检测模式是否配置成功:

[root@ip-10-100-3-91 meta-service]# fdbcli
Using cluster file `/etc/foundationdb/fdb.cluster'.

The database is available.

Welcome to the fdbcli. For help, type `help'.
fdb> status

Using cluster file `/etc/foundationdb/fdb.cluster'.

Configuration:
Redundancy mode - double
Storage engine - ssd-2
Coordinators - 3
Usable Regions - 1

Cluster:
FoundationDB processes - 15
Zones - 3
Machines - 3
Memory availability - 6.1 GB per process on machine with least available
Fault Tolerance - 1 machines
Server time - 11/11/22 04:47:30

Data:
Replication health - Healthy
Moving data - 0.000 GB
Sum of key-value sizes - 0 MB
Disk space used - 944 MB

Operating space:
Storage server - 473.9 GB free on most full server
Log server - 473.9 GB free on most full server

Workload:
Read rate - 19 Hz
Write rate - 0 Hz
Transactions started - 5 Hz
Transactions committed - 0 Hz
Conflict rate - 0 Hz

Backup and DR:
Running backups - 0
Running DRs - 0

安装 OpenJDK 17

OpenJDK 17 需安装到所有的节点上,可通过以下链接获取安装:OpenJDK 17

然后,将下载好的 OpenJDK 安装包直接解压到安装路径即可:

tar xf openjdk-17.0.1_linux-x64_bin.tar.gz  -C /opt/

# 启动 Meta Service 之前
export JAVA_HOME=/opt/jdk-17.0.1

注意事项

部署 FoundationDB 的机器同时也可部署 Meta Service,此为推荐部署方式,可节省机器资源。