Prepare
安装Helm
克隆percona-helm-charts这个项目
安装pxc-operator
安装pxc-db
更换私有仓库
选择MySQL版本
(可选) 开启pmm-client
密码及其他配置
备份配置
密码配置
安装集群
集群启动, 校验集群
查看集群资源状态
连接MySQL
容灾验证
Prepare安装Helm1234567cd /tmprm -rf linux-amd64wget https://get.helm.sh/helm-v3.8.1-linux-amd64.tar.gztar xzvf helm-v3.8.1-linux-amd6...
Docker 启动Pmm-server
等待健康检查Ready
修改内置的Grafana密码
Docker 启动Pmm-server123456# 拉取镜像docker pull registry.cn-hangzhou.aliyuncs.com/lcc-middleware/pmm-server:2# 创建存储卷docker create --volume /srv --name pmm-data registry.cn-hangzhou.aliyuncs.com/lcc-middleware/pmm-server:2 /bin/true# 运行docker run --detac...
Operator 通常将 Percona XtraDB 集群备份存储在 Kubernetes 集群外部的Amazon S3 或 S3 兼容存储上:
但是也可以在 Kubernetes 集群内的Persistent Volumes上存储备份:
Operator 允许以两种方式进行备份。 计划备份在 deploy/cr.yaml 文件中配置为在适当的时间自动执行。 可以随时手动进行按需备份。
模板yaml: https://github.com/percona/percona-xtradb-cluster-operator/blob/main/deploy/cr.yaml
计划备份
按...
新建存储池
创建存储池定义文件ssd500-pool
123456789101112131415<pool type='dir'> <!-- 存储池名称 --> <name>ssd500-pool</name> <source> </source> <target> <!--存储池实际存储目录--> <path>/ssd500g/kvm/</path> <permissions> <mod...
使用Helm安装Percona XtraDB Cluster
预备条件
安装
使用自定义参数安装 Percona XtraDB Cluster
使用Helm安装Percona XtraDB Cluster预备条件安装
添加 Percona 的 Helm 图表存储库并使用它使您的 Helm 客户端保持最新:
12helm repo add percona https://percona.github.io/percona-helm-charts/helm repo update
基于 Percona XtraDB Cluster 安装 Percona Distribution...
问题描述
解决办法
重置kubeadm
停止kubelet 和 docker
清空CNI 和 kubelet 文件
关闭CNI,flannel,docker网桥
重启Docker和kubelet
Node重新加入集群
检查节点加入
问题描述问题出现的原因是,Master崩了,然后没有办法只能重装集群, 但是节点都没有重装系统, 还存在一定的残留. 报错信息如下所示.
1network: failed to set bridge addr: "cni0" already has an IP address different from 10.244.3.1/24...
部署ingress
优化方案
使用hostNetwork
修改工作负载,并在master上运行ingress
测试
ingress-nginx.yaml
部署ingress这边没啥好说, 复制下面的ingress-nginx.yaml , 然后kubectl apply -f ingress-nginx.yaml就可以了
优化方案这边首先说一下背景, 我们的集群是在云上, node连接apiserver,都是走slb, 所以我们希望复用slb.
下面来说方案.
使用hostNetwork首先ingress部署使用hostNetwork网络模式,即ingress 容器的80,443...
问题描述在部署Flannel的过程中, 发现flannel部署成功, 但是总是突然的Error, 然后使用如下命令. 得到报错
1kubectl logs kube-flannel-ds-hnkvp -n kube-system
报错信息:
123...Failed to create SubnetManager: error retrieving pod spec dial tcp 10.0.0.1:443: i/o timeout...
修正办法最后排查到,是因为云上的多网卡环境, Flannel没有走内网IP的网卡,
遂在flannel.yaml中添加--iface=网卡如下配...
fail2ban安装epel
CentOS7
1wget -O /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo
CentOS8
123yum install -y https://mirrors.aliyun.com/epel/epel-release-latest-8.noarch.rpmsed -i 's|^#baseurl=https://download.example/pub|baseurl=https://mirrors.aliyun.com|' /etc/...
排查思路
思路1: 网络阻塞导致的丢包
思路2: dmesg排查
思路3: 禁止mac地址学习
问题描述: 物理机存在双网卡Bond, 宿主机Ping 内部桥接虚拟机IP丢包严重.
排查思路思路1: 网络阻塞导致的丢包查看网络连接数. 在我们的环境中存在大量的timewait.(当时timewait 高达几万).
1cat /proc/net/nf_conntrack | awk '/^.*tcp.*$/ {count[$6]++} END {for(state in count) print state, count[state]...