1. 扩容硬盘#

2. 换源#

3. 时间时区配置#

4. 其他#

1
# 修改服务器名称
2
hostnamectl set-hostname
3

4
# 修改hosts配置
5
vim /etc/hosts
6

7
# -------chengyun-------
8
172.172.254.104  cydb01
9
172.172.254.105  cydb02
10
172.172.254.106  cydb03
11
172.172.254.107  cydata
12
172.172.254.100  cyweb
13
172.172.254.101  cyapp01
14
172.172.254.102  cyapp02
15
172.172.254.103  cymgr
16
# -------chengyun-------

5. 安装k8s集群#

1
# 配置config.yaml文件 当前文件配置为cy-config-k8s.yaml
2
# 将ks-core-1.1.3.tgz、kubesphere-4.1.tar.gz、kk、create_project_harbor.sh 和上面的文件上传到管理节点服务器
3

4
# 安装必要组件
5
apt install -y socat conntrack
6

7

8
# 修改docker配置
9
mkdir -p /etc/docker
10
vim /etc/docker/daemon.json
11

12
{
13
  "log-opts": {
14
    "max-size": "5m",
15
    "max-file":"3"
16
  },
17
  "exec-opts": ["native.cgroupdriver=systemd"],
18
  "data-root": "/opt/docker"
19
}
20

21

22
# 创建镜像仓库
23
./kk init registry -f cy-config-k8s.yaml -a kubesphere-4.1.tar.gz
24

25
# 创建仓库
26
sh create_project_harbor.sh
27

28
# 推送镜像至镜像仓库
29
./kk artifact image push -f cy-config-k8s.yaml -a kubesphere-4.1.tar.gz
30

31
# 创建Kubernetes集群
32
./kk create cluster -f cy-config-k8s.yaml -a kubesphere-4.1.tar.gz --with-local-storage
33

34
# 安装Kubesphere
35
helm upgrade --install -n kubesphere-system --create-namespace ks-core ks-core-1.1.3.tgz \
36
     --set global.imageRegistry=harbor.chengyun.local/ks \
37
     --set extension.imageRegistry=harbor.chengyun.local/ks \
38
     --set ksExtensionRepository.image.tag=v1.1.2 \
39
     --debug \
40
     --wait
41

42

43

44
---------------------------------
45
# 卸载集群
46
./kk delete cluster -f cy-config-k8s.yaml

6. 安装Minio#

资源地址：https://dl.min.io/server/minio/release/linux-amd64/archive/

使用版本：minio.RELEASE.2025-04-22T22-12-26Z

1
# 下载指定minio版本
2
wget https://dl.min.io/server/minio/release/linux-amd64/archive/minio.RELEASE.2025-04-22T22-12-26Z
3
# 改名
4
mv minio.RELEASE.2025-04-22T22-12-26Z ./minio
5
# 添加执行权限
6
chmod +x minio
7

8
# 配置 Systemd 服务
9
## minio.conf
10
## minio.service
11
cp minio.service /etc/systemd/system/minio.service
12

13
# ### 重载并启动服务
14
systemctl daemon-reload    # 重新刷新系统服务
15
systemctl enable minio     # 设置开机自启动
16
systemctl start minio      # 启动服务
17
systemctl status minio     # 查看MinIO状态，输出应显示 active (running)。
18
journalctl -u minio.service -f    # 查看实时日志

7. 搭建Redis集群#

1
wget http://172.172.254.107:9001/default-bucket/redis-7.4.6.tar.gz
2
tar -zxvf redis-7.4.6.tar.gz
3
# 安装gcc环境
4
apt install gcc make -y
5

6
# 编译
7
cd src/
8
make MALLOC=libc
9

10
# 运行
11
./redis-server ../redis.conf
12

13
# 修改redis密码
14
vim redis.conf
15
#找到901行，找到 requirepass
16
requirepass CyRedis
17

18
# 外部访问Redis
19
#找到75行，找到 bind 127.0.0.1
20
bind 0.0.0.0
21

22
# Redis以后台方式运行
23
#找到257行，找到 daemonize no
24
daemonize no
25

26
# 开机自启动
27
## 新建一个服务文件
28
vim /etc/systemd/system/redis.service
29
## 内容如下
30

31
[Unit]
32
Description=redis-server
33
After=network.target
34

35
[Service]
36
Type=forking
37
ExecStart=/opt/redis-7.4.6/src/redis-server /opt/redis-7.4.6/redis.conf
38
PrivateTmp=true
39

40
[Install]
41
WantedBy=multi-user.target
42

43
## 重载系统服务
44
systemctl daemon-reload
45
### 启动
46
systemctl start redis
47
### 停止
48
systemctl stop redis
49
### 重启
50
systemctl restart redis
51
### 查看状态
52
systemctl status redis
53

54

55

56

57
# -a 密码认证，若没写密码无效带这个参数
58
# --cluster create 创建集群实例列表 IP:PORT IP:PORT IP:PORT
59
# --cluster-replicas 复制因子1（即每个主节点需1个从节点）
60
./bin/redis-cli  --cluster create --cluster-replicas 1 192.168.100.101:8001 192.168.100.101:8002 192.168.100.102:8003 192.168.100.102:8004 192.168.100.103:8005 192.168.100.103:8006

1
wget http://172.172.254.107:9001/default-bucket/redis-7.4.6.tar.gz
2
tar -zxvf redis-7.4.6.tar.gz
3
# 安装gcc环境
4
apt install gcc make -y
5
# 编辑安装
6
make && sudo make install
7

8
# 创建 Redis 集群目录结构（每台机器）
9
sudo mkdir -p /opt/redis/cluster/{7001,7002}
10
cd /opt/redis/cluster/
11

12
# 配置 Redis 实例
13
## 创建 7001 配置文件
14
# /opt/redis/cluster/7001/redis.conf
15
port 7001
16
bind 0.0.0.0
17
daemonize no
18
pidfile /var/run/redis_7001.pid
19
cluster-enabled yes
20
cluster-config-file nodes-7001.conf
21
cluster-node-timeout 5000
22
dir /opt/redis/cluster/7001
23
dbfilename dump.rdb
24
save 900 1
25
save 300 10
26
save 60 10000
27
appendonly yes
28
appendfilename "appendonly.aof"
29
logfile /opt/redis/cluster/7001/redis.log
30
requirepass redisCy
31

32
## 创建 7002 配置文件
33
# /opt/redis/cluster/7002/redis.conf
34
port 7002
35
bind 0.0.0.0
36
daemonize no
37
pidfile /var/run/redis_7002.pid
38
cluster-enabled yes
39
cluster-config-file nodes-7002.conf
40
cluster-node-timeout 5000
41
dir /opt/redis/cluster/7002
42
dbfilename dump.rdb
43
save 900 1
44
save 300 10
45
save 60 10000
46
appendonly yes
47
appendfilename "appendonly.aof"
48
logfile /opt/redis/cluster/7002/redis.log
49
requirepass redisCy
50

51
# 启动所有 Redis 实例
52
## 启动 7001 实例
53
redis-server /opt/redis/cluster/7001/redis.conf
54
## 启动 7002 实例
55
redis-server /opt/redis/cluster/7002/redis.conf
56
## 关闭所有进程
57
pkill redis-server
58

59
# 创建 Redis 集群（使用 redis-cli）
60
## 在任意一台机器上执行（比如 cydb01）
61
## --cluster-replicas 1 表示每个主节点配一个从节点，共 3 主 3 从。
62
redis-cli --cluster create \
63
172.172.254.104:7001 \
64
172.172.254.105:7001 \
65
172.172.254.106:7001 \
66
172.172.254.104:7002 \
67
172.172.254.105:7002 \
68
172.172.254.106:7002 \
69
--cluster-replicas 1 \
70
-a redisCy
71

72
# 验证集群状态
73
redis-cli -c -h 172.172.254.104 -p 7001 cluster nodes
74
redis-cli -c -h 172.172.254.104 -p 7001 -a redisCy cluster nodes
75
## 你应该看到 6 个节点，3 个 master，3 个 slave，且 slave 指向正确的 master。
76
## 查看集群信息
77
redis-cli -c -h 172.172.254.104 -p 7001 cluster info
78

79
# 测试写入数据（自动重定向）
80
redis-cli -c -h 172.172.254.104 -p 7001
81
> set name "zhangsan"
82
> get name
83
## 使用 -c 参数启用集群模式，支持自动跳转。
84

85
# 开机自启
86
#/etc/systemd/system/redis-7001.service
87
[Unit]
88
Description=Redis 7001
89
After=network.target
90

91
[Service]
92
ExecStart=/usr/local/bin/redis-server /opt/redis/cluster/7001/redis.conf
93
ExecStop=/usr/local/bin/redis-cli -p 7001 shutdown
94
Restart=always
95
User=redis
96

97
[Install]
98
WantedBy=multi-user.target
99

100
#/etc/systemd/system/redis-7002.service
101
[Unit]
102
Description=Redis 7002
103
After=network.target
104

105
[Service]
106
ExecStart=/usr/local/bin/redis-server /opt/redis/cluster/7002/redis.conf
107
ExecStop=/usr/local/bin/redis-cli -p 7002 shutdown
108
Restart=always
109
User=redis
110

111
[Install]
112
WantedBy=multi-user.target
113

114
# 重载服务
115
systemctl daemon-reload
116
systemctl start redis-7001
117
systemctl start redis-7002
118

119
systemctl status redis-7001
120
systemctl status redis-7002
121

122
systemctl restart redis-7001
123
systemctl restart redis-7002

8. 搭建mysql单节点#

Mysql官网：https://downloads.mysql.com/archives/community/

1
# 下载8.1 ubuntu 的mysql
2
wget https://downloads.mysql.com/archives/get/p/23/file/mysql-server_8.1.0-1ubuntu22.04_amd64.deb-bundle.tar
3
tar -xf mysql-server_8.1.0-1ubuntu22.04_amd64.deb-bundle.tar
4

5
# 安装包
6
apt install ./mysql-common_8.1.0-1ubuntu22.04_amd64.deb \
7
           ./mysql-community-client-plugins_8.1.0-1ubuntu22.04_amd64.deb \
8
           ./libmysqlclient22_8.1.0-1ubuntu22.04_amd64.deb \
9
           ./libmysqlclient-dev_8.1.0-1ubuntu22.04_amd64.deb \
10
           ./mysql-community-client-core_8.1.0-1ubuntu22.04_amd64.deb \
11
           ./mysql-community-client_8.1.0-1ubuntu22.04_amd64.deb \
12
           ./mysql-client_8.1.0-1ubuntu22.04_amd64.deb \
13
           ./mysql-community-server-core_8.1.0-1ubuntu22.04_amd64.deb \
14
           ./mysql-community-server_8.1.0-1ubuntu22.04_amd64.deb \
15
           ./mysql-server_8.1.0-1ubuntu22.04_amd64.deb
16

17
## 如果报错，修复下，它会自动安装
18
apt --fix-broken install
19

20
# 修改存储位置
21
systemctl stop mysql
22
## 修改存储位置
23
vim /etc/mysql/mysql.conf.d/mysqld.cnf
24
#datadir         = /opt/mysql/data
25

26
## 编辑 MySQL 的 AppArmor 配置文件
27
vim /etc/apparmor.d/usr.sbin.mysqld
28
#找到类似这几行：
29
#/var/lib/mysql/ r,
30
#/var/lib/mysql/** rwk,
31
#在其下方添加：
32
/opt/mysql/ r,
33
/opt/mysql/** rwk,
34

35
# 然后重启服务
36
systemctl reload apparmor
37

38
## 创建存储位置
39
mkdir -p /opt/mysql
40
chown -R mysql:mysql /opt/mysql
41
chmod 700  /opt/mysql
42

43
## 初始化
44
sudo -u mysql mysqld --initialize-insecure  --user=mysql  --basedir=/usr  --datadir=/opt/mysql/data
45
## 重启mysql 并查看日志
46
systemctl start mysql
47
tail -f /var/log/mysql/error.log
48

49

50
# 修改密码
51
systemctl stop mysql
52
## 以 mysql 用户身份启动 mysql
53
sudo -u mysql mysqld --skip-grant-tables --skip-networking &
54
## 登录 MySQL
55
mysql -u root
56

57
## 修改密码
58
FLUSH PRIVILEGES;
59
ALTER USER 'root'@'localhost' IDENTIFIED WITH mysql_native_password BY 'CyDB@2025';
60
-- ALTER USER 'root'@'%' IDENTIFIED WITH mysql_native_password BY 'CyDB@2025';
61
CREATE USER 'root'@'%' IDENTIFIED WITH mysql_native_password BY 'CyDB@2025';
62
GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' WITH GRANT OPTION;
63
FLUSH PRIVILEGES;
64
EXIT;
65

66
## 停止临时进程
67
sudo -u mysql killall mysqld
68
## 启动mysql 并且开机自启
69
systemctl start mysql
70
systemctl enable mysql

9. 部署高可用PostgreSQL14集群#

https://blog.csdn.net/yezonggang/article/details/146415411

基础依赖包安装#

1
apt install -y postgresql-14
2
apt install -y consul
3
apt install -y patroni
4
apt install -y vip-manager
5
apt install -y dstat
6
apt install -y pgbouncer
7

8
apt install -y haproxy

consul配置#

1
# 创建数据目录
2
mkdir -p /opt/consul
3
# 添加配置文件
4
vim /etc/consul.d/consul.hcl
5
# 赋权限
6
chown -R consul:consul /opt/consul

放入下面内容

1
datacenter = "dc1"
2
data_dir = "/opt/consul"
3
server = true
4
bootstrap_expect = 3
5
bind_addr = "172.172.254.104"  # 当前节点 IP
6
client_addr = "0.0.0.0"
7
retry_join = ["172.172.254.104","172.172.254.104","172.172.254.104"]
8
ui = true

启动并查看是否正常

1
# 直接启动
2
systemctl start consul
3
systemctl enable consul
4

5
# 查看consul节点情况
6
consul members
7

8
-----------------------------
9
root@cydb01:/opt# consul members
10
Node    Address               Status  Type    Build  Protocol  DC   Segment
11
cydb01  172.172.254.104:8301  alive   server  1.8.7  2         dc1  <all>
12
cydb02  172.172.254.105:8301  alive   server  1.8.7  2         dc1  <all>
13
cydb03  172.172.254.106:8301  alive   server  1.8.7  2         dc1  <all>

打开web页面查看信息，包括后续patroni在consul中注册的k/v信息；

http://<服务器ip地址>:8500

Patroni配置#

安装环境

1
# 停止pg
2
systemctl stop postgresql
3
systemctl disable postgresql
4
# 安装python
5
apt install -y python3-pip
6
# 安装 Python Consul 客户端
7
pip3 install python-consul

配置文件

1
vim /etc/patroni/config.yml

db01

1
# 集群名称，所有节点的该配置项需保持一致，用于标识属于同一个 PostgreSQL 集群
2
scope: pg_cluster
3
# 节点的唯一名称，不同节点应使用不同的名称，例如 pg-node1、pg-node2、pg-node3
4
name: cydb01
5

6
# REST API 相关配置，用于外部程序与 Patroni 进行交互
7
restapi:
8
  # REST API 监听的地址和端口，0.0.0.0 表示监听所有可用的网络接口
9
  listen: 0.0.0.0:8008
10
  # 当前节点用于外部连接 REST API 的 IP 地址和端口
11
  connect_address: 172.172.254.104:8008
12

13
# Consul 相关配置，Consul 作为分布式协调系统，用于存储集群状态信息
14
consul:
15
  # Consul 服务的地址和端口，这里使用本地默认端口
16
  host: 127.0.0.1:8500
17

18
# 集群启动时的初始化配置
19
bootstrap:
20
  # 分布式协调系统（DCS）相关配置
21
  dcs:
22
    # Leader 锁的生存时间（Time To Live），单位为秒，超过该时间 Leader 锁将失效
23
    ttl: 30
24
    # 状态检查的时间间隔，单位为秒，Patroni 会按照该间隔检查集群状态
25
    loop_wait: 10
26
    # 操作重试的超时时间，单位为秒，如果操作在该时间内未完成则进行重试
27
    retry_timeout: 10
28
    postgresql:
29
      # 允许节点在重新加入集群时自动使用 pg_rewind 工具修复数据差异
30
      use_pg_rewind: true
31
      # 使用复制槽来确保流复制的可靠性，避免数据丢失
32
      use_slots: true
33
      # PostgreSQL 数据库的参数配置
34
      parameters:
35
        # 数据库允许的最大连接数
36
        max_connections: 100
37
        # WAL（Write-Ahead Logging）日志级别，replica 表示支持流复制
38
        wal_level: replica
39
        # 启用热备模式，允许在备库上进行只读查询
40
        hot_standby: "on"
41
  # 初始化数据库时的配置参数
42
  initdb:
43
    # 数据库的字符编码设置为 UTF8
44
    - encoding: UTF8
45
    # 数据库的区域设置为 en_US.UTF-8
46
    - locale: en_US.UTF-8
47
  # PostgreSQL 的客户端访问控制规则，用于限制哪些客户端可以连接到数据库
48
  pg_hba:
49
    # 允许所有子网内的客户端使用 replicator 用户进行复制连接，使用 md5 加密认证
50
    - host replication replicator all md5
51
    # 允许所有客户端使用任何用户连接到数据库，使用 md5 加密认证
52
    - host all all 0.0.0.0/0 md5
53

54
# PostgreSQL 数据库本身的配置
55
postgresql:
56
  # PostgreSQL 数据库监听的地址和端口，0.0.0.0 表示监听所有可用的网络接口
57
  listen: 0.0.0.0:5432
58
  # 当前节点用于外部连接 PostgreSQL 数据库的 IP 地址和端口
59
  connect_address: 172.172.254.104:5432
60
  # PostgreSQL 数据库的数据文件存储目录
61
  data_dir: /opt/postgresql/14/data
62
  # PostgreSQL 二进制可执行文件所在的目录
63
  bin_dir: /usr/lib/postgresql/14/bin
64
  parameters:
65
    password_encryption: md5
66
  # 数据库的认证配置，包括复制用户和超级用户的信息
67
  authentication:
68
    replication:
69
      # 用于流复制的用户名
70
      username: replicator
71
      # 用于流复制的用户密码
72
      password: huanfaCypatroni
73
    superuser:
74
      # 数据库超级用户的用户名
75
      username: postgres
76
      # 数据库超级用户的密码
77
      password: huanfaCypatroni

db02

1
# 集群名称，所有节点的该配置项需保持一致，用于标识属于同一个 PostgreSQL 集群
2
scope: pg_cluster
3
# 节点的唯一名称，不同节点应使用不同的名称，例如 pg-node1、pg-node2、pg-node3
4
name: cydb02
5

6
# REST API 相关配置，用于外部程序与 Patroni 进行交互
7
restapi:
8
  # REST API 监听的地址和端口，0.0.0.0 表示监听所有可用的网络接口
9
  listen: 0.0.0.0:8008
10
  # 当前节点用于外部连接 REST API 的 IP 地址和端口
11
  connect_address: 172.172.254.105:8008
12

13
# Consul 相关配置，Consul 作为分布式协调系统，用于存储集群状态信息
14
consul:
15
  # Consul 服务的地址和端口，这里使用本地默认端口
16
  host: 127.0.0.1:8500
17

18
# 集群启动时的初始化配置
19
bootstrap:
20
  # 分布式协调系统（DCS）相关配置
21
  dcs:
22
    # Leader 锁的生存时间（Time To Live），单位为秒，超过该时间 Leader 锁将失效
23
    ttl: 30
24
    # 状态检查的时间间隔，单位为秒，Patroni 会按照该间隔检查集群状态
25
    loop_wait: 10
26
    # 操作重试的超时时间，单位为秒，如果操作在该时间内未完成则进行重试
27
    retry_timeout: 10
28
    postgresql:
29
      # 允许节点在重新加入集群时自动使用 pg_rewind 工具修复数据差异
30
      use_pg_rewind: true
31
      # 使用复制槽来确保流复制的可靠性，避免数据丢失
32
      use_slots: true
33
      # PostgreSQL 数据库的参数配置
34
      parameters:
35
        # 数据库允许的最大连接数
36
        max_connections: 100
37
        # WAL（Write-Ahead Logging）日志级别，replica 表示支持流复制
38
        wal_level: replica
39
        # 启用热备模式，允许在备库上进行只读查询
40
        hot_standby: "on"
41
  # 初始化数据库时的配置参数
42
  initdb:
43
    # 数据库的字符编码设置为 UTF8
44
    - encoding: UTF8
45
    # 数据库的区域设置为 en_US.UTF-8
46
    - locale: en_US.UTF-8
47
  # PostgreSQL 的客户端访问控制规则，用于限制哪些客户端可以连接到数据库
48
  pg_hba:
49
    # 允许所有子网内的客户端使用 replicator 用户进行复制连接，使用 md5 加密认证
50
    - host replication replicator all md5
51
    # 允许所有客户端使用任何用户连接到数据库，使用 md5 加密认证
52
    - host all all 0.0.0.0/0 md5
53

54
# PostgreSQL 数据库本身的配置
55
postgresql:
56
  # PostgreSQL 数据库监听的地址和端口，0.0.0.0 表示监听所有可用的网络接口
57
  listen: 0.0.0.0:5432
58
  # 当前节点用于外部连接 PostgreSQL 数据库的 IP 地址和端口
59
  connect_address: 172.172.254.105:5432
60
  # PostgreSQL 数据库的数据文件存储目录
61
  data_dir: /opt/postgresql/14/data
62
  # PostgreSQL 二进制可执行文件所在的目录
63
  bin_dir: /usr/lib/postgresql/14/bin
64
  # 数据库的认证配置，包括复制用户和超级用户的信息
65
  authentication:
66
    replication:
67
      # 用于流复制的用户名
68
      username: replicator
69
      # 用于流复制的用户密码
70
      password: huanfaCypatroni
71
    superuser:
72
      # 数据库超级用户的用户名
73
      username: postgres
74
      # 数据库超级用户的密码
75
      password: huanfaCypatroni

db03

1
# 集群名称，所有节点的该配置项需保持一致，用于标识属于同一个 PostgreSQL 集群
2
scope: pg_cluster
3
# 节点的唯一名称，不同节点应使用不同的名称，例如 pg-node1、pg-node2、pg-node3
4
name: cydb03
5

6
# REST API 相关配置，用于外部程序与 Patroni 进行交互
7
restapi:
8
  # REST API 监听的地址和端口，0.0.0.0 表示监听所有可用的网络接口
9
  listen: 0.0.0.0:8008
10
  # 当前节点用于外部连接 REST API 的 IP 地址和端口
11
  connect_address: 172.172.254.105:8008
12

13
# Consul 相关配置，Consul 作为分布式协调系统，用于存储集群状态信息
14
consul:
15
  # Consul 服务的地址和端口，这里使用本地默认端口
16
  host: 127.0.0.1:8500
17

18
# 集群启动时的初始化配置
19
bootstrap:
20
  # 分布式协调系统（DCS）相关配置
21
  dcs:
22
    # Leader 锁的生存时间（Time To Live），单位为秒，超过该时间 Leader 锁将失效
23
    ttl: 30
24
    # 状态检查的时间间隔，单位为秒，Patroni 会按照该间隔检查集群状态
25
    loop_wait: 10
26
    # 操作重试的超时时间，单位为秒，如果操作在该时间内未完成则进行重试
27
    retry_timeout: 10
28
    postgresql:
29
      # 允许节点在重新加入集群时自动使用 pg_rewind 工具修复数据差异
30
      use_pg_rewind: true
31
      # 使用复制槽来确保流复制的可靠性，避免数据丢失
32
      use_slots: true
33
      # PostgreSQL 数据库的参数配置
34
      parameters:
35
        # 数据库允许的最大连接数
36
        max_connections: 100
37
        # WAL（Write-Ahead Logging）日志级别，replica 表示支持流复制
38
        wal_level: replica
39
        # 启用热备模式，允许在备库上进行只读查询
40
        hot_standby: "on"
41
  # 初始化数据库时的配置参数
42
  initdb:
43
    # 数据库的字符编码设置为 UTF8
44
    - encoding: UTF8
45
    # 数据库的区域设置为 en_US.UTF-8
46
    - locale: en_US.UTF-8
47
  # PostgreSQL 的客户端访问控制规则，用于限制哪些客户端可以连接到数据库
48
  pg_hba:
49
    # 允许所有子网内的客户端使用 replicator 用户进行复制连接，使用 md5 加密认证
50
    - host replication replicator all md5
51
    # 允许所有客户端使用任何用户连接到数据库，使用 md5 加密认证
52
    - host all all 0.0.0.0/0 md5
53

54
# PostgreSQL 数据库本身的配置
55
postgresql:
56
  # PostgreSQL 数据库监听的地址和端口，0.0.0.0 表示监听所有可用的网络接口
57
  listen: 0.0.0.0:5432
58
  # 当前节点用于外部连接 PostgreSQL 数据库的 IP 地址和端口
59
  connect_address: 172.172.254.105:5432
60
  # PostgreSQL 数据库的数据文件存储目录
61
  data_dir: /opt/postgresql/14/data
62
  # PostgreSQL 二进制可执行文件所在的目录
63
  bin_dir: /usr/lib/postgresql/14/bin
64
  # 数据库的认证配置，包括复制用户和超级用户的信息
65
  authentication:
66
    replication:
67
      # 用于流复制的用户名
68
      username: replicator
69
      # 用于流复制的用户密码
70
      password: huanfaCypatroni
71
    superuser:
72
      # 数据库超级用户的用户名
73
      username: postgres
74
      # 数据库超级用户的密码
75
      password: huanfaCypatroni

赋权并测试运行

1
mkdir -p /opt/postgresql/14/data
2
chown -R postgres:postgres /opt/postgresql
3
chmod 700 /opt/postgresql
4

5
# 切换用户运行
6
su - postgres
7
/usr/bin/patroni /etc/patroni/config.yml

命令

1
# 查看
2
patronictl -c /etc/patroni/config.yml list
3
# 使用 patronictl remove
4
patronictl -c /etc/patroni/config.yml remove pg-cluster
5
#pg-cluster
6
# 使用 patronictl 手动故障转移（推荐）
7
patronictl -c /etc/patroni/config.yml failover

运行

1
systemctl start patroni.service
2
systemctl status patroni.service
3
systemctl enable patroni.service

vip-manager配置#

patroni实现了集群的管理，并把leader信息保存在DSC/Consul中，那么就可以基于这个值来实现vip的管理，也就是consul中存的patroni的leader变动那么vip就跟着漂移，因此配置文件如下：

1
mv /etc/default/vip-manager /etc/default/vip-manager.bak
2
vim /etc/default/vip-manager

cydb01

1
# The keys below are mandatory
2

3
VIP_IP="172.172.254.200"
4

5
# Netmask for IP address
6
VIP_MASK=24
7

8
# Just use the normal interface name of the primary network interface
9
VIP_IFACE="enp4s1"
10

11
# This must match scope from Patroni postgres.yml
12
VIP_KEY="/service/pg_cluster/leader"
13

14
# This value must match the value used in Patroni postgres.yml
15
VIP_HOST="cydb01"
16

17
# Specify the type of endpoint (etcd|consul)
18
VIP_TYPE="consul"
19

20
VIP_ENDPOINT="http://172.172.254.104:8500,http://172.172.254.105:8500,http://172.172.254.106:8500"
21

22

23
# The keys below are optional
24

25
#VIP_HOSTINGTYPE="basic"
26
#VIP_ETCD_USER
27
#VIP_ETCD_PASSWORD
28

29
# These keys are optional if VIP_TYPE="etcd" is chosen
30
#
31
#
32
#VIP_ETCD_CA_FILE="/etc/etcd/ca.cert.pem"
33
#VIP_ETCD_CERT_FILE="/etc/etcd/host.cert.pem"
34
#VIP_ETCD_KEY_FILE="/etc/etcd/host.key.pem"

cydb02

1
# The keys below are mandatory
2

3
VIP_IP="172.172.254.200"
4

5
# Netmask for IP address
6
VIP_MASK=24
7

8
# Just use the normal interface name of the primary network interface
9
VIP_IFACE="enp4s1"
10

11
# This must match scope from Patroni postgres.yml
12
VIP_KEY="/service/pg_cluster/leader"
13

14
# This value must match the value used in Patroni postgres.yml
15
VIP_HOST="cydb02"
16

17
# Specify the type of endpoint (etcd|consul)
18
VIP_TYPE="consul"
19

20
VIP_ENDPOINT="http://172.172.254.104:8500,http://172.172.254.105:8500,http://172.172.254.106:8500"
21

22

23
# The keys below are optional
24

25
#VIP_HOSTINGTYPE="basic"
26
#VIP_ETCD_USER
27
#VIP_ETCD_PASSWORD
28

29
# These keys are optional if VIP_TYPE="etcd" is chosen
30
#
31
#
32
#VIP_ETCD_CA_FILE="/etc/etcd/ca.cert.pem"
33
#VIP_ETCD_CERT_FILE="/etc/etcd/host.cert.pem"
34
#VIP_ETCD_KEY_FILE="/etc/etcd/host.key.pem"

cydb03

1
# The keys below are mandatory
2

3
VIP_IP="172.172.254.200"
4

5
# Netmask for IP address
6
VIP_MASK=24
7

8
# Just use the normal interface name of the primary network interface
9
VIP_IFACE="enp4s1"
10

11
# This must match scope from Patroni postgres.yml
12
VIP_KEY="/service/pg_cluster/leader"
13

14
# This value must match the value used in Patroni postgres.yml
15
VIP_HOST="cydb03"
16

17
# Specify the type of endpoint (etcd|consul)
18
VIP_TYPE="consul"
19

20
VIP_ENDPOINT="http://172.172.254.104:8500,http://172.172.254.105:8500,http://172.172.254.106:8500"
21

22

23
# The keys below are optional
24

25
#VIP_HOSTINGTYPE="basic"
26
#VIP_ETCD_USER
27
#VIP_ETCD_PASSWORD
28

29
# These keys are optional if VIP_TYPE="etcd" is chosen
30
#
31
#
32
#VIP_ETCD_CA_FILE="/etc/etcd/ca.cert.pem"
33
#VIP_ETCD_CERT_FILE="/etc/etcd/host.cert.pem"
34
#VIP_ETCD_KEY_FILE="/etc/etcd/host.key.pem"

重启服务

1
systemctl start vip-manager
2
systemctl status vip-manager
3
systemctl enable vip-manager
4
#查看运行日志
5
journalctl -u vip-manager -f

pgbouncer配置#

以上其实已经完成了三节点PostgreSQL的高可用，如果在此基础上还想做些高并发/负载均衡的优化以应对复杂场景，就需要在每个节点再补充部署pgbouncer和haproxy；

前者进行pg的连接池化（pg是基于多进程的，每个connection消耗1个进程，进程的创建和销毁开销很大），后者在pgbouncer的基础上实现负载均衡（也就是将请求负载到每个主机的连接池上），haproxy还可以将读请求分发到从节点，写请求分发到主节点来实现读写分离（端口级别）；

编辑

1
vim /etc/pgbouncer/pgbouncer.ini

1
# [databases] 部分用于定义 Pgbouncer 可以连接的数据库及其连接信息
2
[databases]
3
# 使用通配符 * 表示匹配所有数据库连接请求
4
# host 指定 PostgreSQL 数据库服务器的 IP 地址
5
# port 指定 PostgreSQL 数据库服务器监听的端口号
6
# dbname 指定要连接的数据库名称
7
# user 指定连接数据库使用的用户名
8
# dbname=postgres user=postgres
9
* = host=127.0.0.1 port=5432
10

11
# [pgbouncer] 部分用于配置 Pgbouncer 本身的行为和参数
12
[pgbouncer]
13
# 忽略客户端在启动时发送的 extra_float_digits 参数，避免该参数对连接池的影响
14
ignore_startup_parameters = extra_float_digits
15
# 指定 Pgbouncer 监听的地址，0.0.0.0 表示监听所有可用的网络接口
16
listen_addr = 0.0.0.0
17
# 指定 Pgbouncer 监听的端口号，应用程序将通过该端口连接到 Pgbouncer
18
listen_port = 6432
19
# 指定 Pgbouncer 的日志文件路径，用于记录运行过程中的日志信息
20
logfile = /var/log/pgbouncer/pgbouncer.log
21
# 指定 Pgbouncer 的进程 ID 文件路径，用于管理 Pgbouncer 进程
22
pidfile = /var/run/pgbouncer/pgbouncer.pid
23
# 指定认证类型为 md5，即使用 MD5 加密的密码进行认证
24
auth_type = md5
25
# 指定存储用户认证信息的文件路径，该文件包含用户名和对应的加密密码
26
auth_file = /etc/pgbouncer/userlist.txt
27
# 指定连接池模式为 transaction，即事务级连接池模式
28
# 在该模式下，一个连接在一个事务结束后会被释放回连接池供其他事务使用
29
pool_mode = session
30
# 指定 Pgbouncer 允许的最大客户端连接数
31
max_client_conn = 1000
32
# 指定每个数据库的默认连接池大小，即每个数据库可以同时使用的连接数量
33
default_pool_size = 100
34
# 指定具有管理员权限的用户列表，这些用户可以执行 Pgbouncer 的管理命令
35
admin_users = pgbouncer,postgres
36
# 指定具有统计信息查看权限的用户列表，这些用户可以查看 Pgbouncer 的统计信息
37
stats_users = pgbouncer,postgres

userlist.txt存储用户名和密码

1
vim /etc/pgbouncer/userlist.txt
2
"postgres" "md5e0085d6b57778d1d376c9c870d7e68e7"

这里的密码需要校验下

1
# 查询默认的密码加密方式
2
SHOW password_encryption;
3
# 正确输出---------------------
4
md5
5

6
# 如果输出scram-sha-256
7
#需要修改默认的密码加密方式，因为是使用patroni
8

9
# 修改配置
10
patronictl -c /etc/patroni/config.yml edit-config
11
# 在 postgresql → parameters 中添加
12
postgresql:
13
  parameters:
14
    password_encryption: md5
15
# 然后再次查询试试
16
# 正确输出md5之后，进行重设用户密码
17
ALTER USER postgres WITH PASSWORD 'huanfaCypatroni';
18
SELECT usename, passwd FROM pg_shadow WHERE usename IN ('postgres');
19
#正确输出为   usename    |              passwd
20
#--------------+----------------------------------
21
 huanfaCypatroni | md5e0085d6b57778d1d376c9c870d7e68e7
22
#更新 Pgbouncer 的 userlist.txt
23
echo '"huanfaCypatroni" "md5e0085d6b57778d1d376c9c870d7e68e7"' > /etc/pgbouncer/userlist.txt
24
systemctl restart pgbouncer

启动服务查看有无异常

1
systemctl start pgbouncer
2
systemctl status pgbouncer
3
systemctl enable pgbouncer

haproxy配置#

三个节点上都要部署haproxy以保持冗余，对业务侧仅提供vip上的haproxy地址（如vip:5436），haproxy的crash与拉起机制是操作系统来保证的，确保vip漂移后每个haproxy可连接，虽然这里可能是一个出问题的点，总不能再把haproxy的健康状态注册到DCS来再绑定一个vip吧。

按照上面描述每个pgbouncer都是vip上的5432端口的池化，因此haproxy可以均匀的将请求转发到每个节点的pgbouncer上

1
vim /etc/haproxy/haproxy.cfg
2

3
[root@node1 ~]# cat /etc/haproxy/haproxy.cfg
4
#=====================================================================
5
# Document: https://www.haproxy.org/download/2.5/doc/configuration.txt
6
# 此注释指向 HAProxy 2.5 版本的配置文档链接，方便用户查阅详细配置说明
7
#=====================================================================
8
global
9
    daemon           # 以守护进程模式运行 HAProxy，使其在后台持续运行
10
    user        haproxy  # 指定 HAProxy 运行时使用的用户
11
    group       haproxy  # 指定 HAProxy 运行时使用的用户组
12
    node        haproxy  # 为当前 HAProxy 节点设置一个名称，用于标识
13
    #pidfile     /var/run/haproxy.pid  # 注释掉的配置项，指定 HAProxy 进程 ID 文件的路径
14
    # chroot      /var/lib/haproxy          # if chrooted, change stats socket above  # 注释掉的配置项，将 HAProxy 进程限制在指定的根目录下运行，若启用需修改统计信息套接字配置
15
    # stats socket /var/run/haproxy.socket user haproxy group haproxy mode 600 level admin  # 注释掉的配置项，定义统计信息套接字的路径、所属用户、用户组、权限和管理级别
16

17
    # spread-checks 3                       # add randomness in check interval  # 注释掉的配置项，在健康检查间隔中添加随机性
18
    # quiet                                 # Do not display any message during startup  # 注释掉的配置项，启动时不显示任何消息
19
    maxconn     65535                       # maximum per-process number of concurrent connections  # 每个进程允许的最大并发连接数
20

21
#---------------------------------------------------------------------
22
# default settings
23
# 以下是 HAProxy 的默认配置部分
24
#---------------------------------------------------------------------
25
defaults
26
    # log                global  # 注释掉的配置项，使用全局日志配置
27

28
    mode               tcp  # 设置默认的工作模式为 TCP 模式，适用于处理 TCP 流量
29
    retries            3            # max retry connect to upstream  # 连接到上游服务器的最大重试次数
30
    timeout queue      3s           # maximum time to wait in the queue for a connection slot to be free  # 客户端在队列中等待连接槽空闲的最大时间
31
    timeout connect    3s           # maximum time to wait for a connection attempt to a server to succeed  # 连接到服务器的最大等待时间
32
    timeout client     24h           # client connection timeout  # 客户端连接的超时时间
33
    timeout server     24h           # server connection timeout  # 服务器连接的超时时间
34
    timeout check      3s           # health check timeout  # 健康检查的超时时间
35

36
#---------------------------------------------------------------------
37
# default admin users
38
# 以下是默认的管理员用户配置部分
39
#---------------------------------------------------------------------
40
userlist STATS_USERS  # 定义一个用户列表，名为 STATS_USERS
41
        group admin users admin  # 在 STATS_USERS 用户列表中定义一个名为 admin 的用户组，包含用户 admin
42
        user stats  insecure-password pigsty  # 在 STATS_USERS 用户列表中定义一个名为 stats 的用户，使用明文密码 pigsty
43
        user admin  insecure-password pigsty  # 在 STATS_USERS 用户列表中定义一个名为 admin 的用户，使用明文密码 pigsty
44

45
#=====================================================================
46
# Service Definition
47
# 以下是服务定义部分
48
#=====================================================================
49
 listen default  # 定义一个名为 default 的监听部分
50
     bind *:5436  # 绑定到所有可用的网络接口，并监听 5436 端口
51
     mode tcp  # 设置该监听部分的工作模式为 TCP 模式
52
     maxconn 3000  # 该监听部分允许的最大并发连接数
53
     balance roundrobin  # 设置负载均衡算法为轮询，即依次将请求分发给后端服务器
54
     option httpchk  # 启用 HTTP 健康检查
55
     option http-keep-alive  # 启用 HTTP 长连接，保持客户端和服务器之间的连接
56
     http-check expect status 200  # 期望健康检查返回的 HTTP 状态码为 200
57
     default-server inter 3s fastinter 1s downinter 5s rise 3 fall 3 on-marked-down shutdown-sessions slowstart 30s maxconn 3000 maxqueue 128 weight 100  # 后端服务器的默认配置：健康检查间隔为 3 秒，快速检查间隔为 1 秒，服务器标记为故障后的检查间隔为 5 秒，连续 3 次检查成功则认为服务器恢复正常，连续 3 次检查失败则认为服务器故障，服务器被标记为故障时关闭现有会话，服务器启动时的慢速启动时间为 30 秒，每个服务器允许的最大并发连接数为 3000，最大队列长度为 128，服务器权重为 100
58
     server cydb01 172.172.254.104:6432 check port 8008 weight 100  # 定义一个名为 node1 的后端服务器，地址为 100.3.254.210:6432，对其 8008 端口进行健康检查，服务器权重为 100
59
     server cydb02 172.172.254.105:6432 check port 8008 weight 100  # 定义一个名为 node2 的后端服务器，地址为 100.3.254.211:6432，对其 8008 端口进行健康检查，服务器权重为 100
60
     server cydb03 172.172.254.106:6432 check port 8008 weight 100  # 定义一个名为 node3 的后端服务器，地址为 100.3.254.212:6432，对其 8008 端口进行健康检查，服务器权重为 100
61

62
#启动
63
systemctl start haproxy.service
64
systemctl status haproxy.service

端口整理一下

端口	组件	用途
8301	Consul 通信端口	每个节点的Consul内部通信端口
8500	Consul WEB UI	每个节点的Consul网页端端口
8008	Patroni REST API	每个节点的Patroni API端口
5432	PostgreSQL 端口	每个节点的pg服务端口
6432	Pgbouncer 端口	每个节点的pg连接池端口
5436	Haproxy 端口	高可用端口

最终客户端连接地址是：172.172.254.104:5436

链路如下

客户端 ↓ (连接 Haproxy:5436) Haproxy (VIP:172.172.254.200) ↓ (轮询转发到三节点 PgBouncer 的 6432) 节点1/2/3:

PgBouncer (6432) ↓ (通过 VIP 连接)

vip-manager 管理的 PostgreSQL 主节点 (VIP:172.172.254.104:5432)

Patroni

Consul

PostgreSQL
1
客户端
2
    ↓ (连接 Haproxy:5436)
3
+-------------------+
4
|   PgBouncer       | ← 监听 VIP:172.172.254.200:6432
5
+-------------------+
6
    ↓ (连接到主节点)
7
+-------------------+
8
|   PostgreSQL      | ← 由 vip-manager 管理 VIP
9
+-------------------+
10
    ↑↓ (复制流)
11
+-------------------+
12
|   Patroni         | ← 管理集群状态
13
+-------------------+
14
    ↑↓ (注册/发现)
15
+-------------------+
16
|   Consul          | ← DCS 存储
17
+-------------------+