翼度科技»论坛 编程开发 mysql 查看内容

openEuler22+GreatSQL+dbops玩转MGR

6

主题

6

帖子

18

积分

新手上路

Rank: 1

积分
18
芬达,《芬达的数据库学习笔记》公众号作者,开源爱好者,擅长 MySQL、ansible。
背景

openEuler 是什么

openEuler22.03 LTS 是 openEuler 社区于 2022 年 3 月发布的开源操作系统(从系统版本的命名不难发现吧)。openEuler 社区的运营由华为为主导,社区以全球开源贡献者的合作,构建了这个高效、稳定和安全的操作系统。基于 Linux 内核的 openEuler 操作系统,支持 Kunpeng 以及其他处理器,旨在充分发挥计算芯片的潜力。它适用于数据库、大数据、云计算和人工智能等场景。通过社区合作,openEuler 构建了一个创新平台,创建了一个支持多处理器架构的统一开放操作系统,并推动了软件和硬件应用生态系统的繁荣。
openEuler22.03 LTS 带来了一系列关键功能,包括基于 Linux Kernel 5.10 的深度优化、新型媒体文件系统、分层内存扩展、用户模式协议栈、云原生调度增强、QEMU 热补丁、KubeOS、增强的轻量级安全容器、增强的 iSulad、双平面部署、边缘计算支持、嵌入式镜像,以及 secPaver 等。
openEuler22.03 LTS 可以被视为国产操作系统创新项目的首选系统版本之一。
GreatSQL 是什么

GreatSQL,作为 MySQL 分支 Percona 的延伸,立志成为中国广泛受欢迎的开源数据库。其上一版本基于 Percona Server 8.0.25 构建,而这次的新版本则使用 Percona Server 8.0.32 作为基础,引入了许多重要特性。新发布的 GreatSQL 8.0.32-24 版本增加了并行 load data、逻辑和 CLONE 备份加密、MGR 读写节点可动态绑定 VIP、SQL 兼容扩展、审计日志增强等重大特性。
GreatSQL 8.0.32-24 可以被视为国产开源数据库信创项目,并且解决 MySQL5.7 EOL 问题的重要替代方案之一。
关于 MySQL5.7 EOL 问题,可以翻阅我之前写的文章《阴谋论: MySQL 将死,国产数据库的春天?》
dbops 是什么

dbops 是一款提供生产级别 MySQL 部署的 playbook 工具,由芬达个人开发。
地址: https://gitee.com/fanderchan/dbops/
GreatSQL 官方并未提供专门针对 openEuler 的编译安装包,而我发现部署 GreatSQL、GreatSQL MGR、GreatSQL HA 等都有许多细节需要注意。本文主要讲述我如何思考并开发 dbops 的新功能,以在 openEuler22 上成功部署 GreatSQL,并运行其"MGR 读写节点可动态绑定 VIP"功能(以下简称"GreatSQL HA 功能")。
dbops 如何支持 GreatSQL

dbops 本来就支持 MySQL 和 Percona,所以对 GreatSQL 的支持并不需要大规模的改动。以下大部分是一些针对部署 GreatSQL 与 MySQL 或 Percona 的不同之处的调整。
1. 只对 Linux - Generic 包的支持

由于 dbops 的目标是支持大量的国产操作系统,与 MySQL 一样,GreatSQL 提供了针对各种操作系统的预编译二进制包,但有一个是通用的,那就是 Linux - Generic 包。在 dbops 为 MySQL 提供支持以及在实际生产中,都在使用这个包。
同时,为了支持更多的 Linux 系统,我选择了基于 glibc2.17 的包,而非 glibc2.28 的包。前者意味着包是在 glibc 公共库版本为 2.17 的系统下编译出来的,因此,它不会包含大于 2.17 的库函数,兼容性会更强。
我选择支持的是 minimal 包,这个版本剔除了与调试相关的二进制文件和调试符号,体积非常小,仅为常规包的三分之一,我认为非 minimal 包并无优势。
目前,dbops 仅支持 GreatSQL-8.0.32-24-Linux-glibc2.17-x86_64.tar.xz 的部署。
2. dbops 的 mysql_ansible 的配置文件 common_config.yml 的调整

dbops 可以很方便的配置执行 playbook 的变量,变量设置非常集中,一般只需要修改两个文件,一个是全局参数配置文件 common_config.yml,另外一个是当前需要执行的 playbook yaml 文件。

  • 新增了 db_type 参数,用于判断待部署的数据库类型,可选值为 MySQL、Percona、GreatSQL。根据 db_type 的不同,部署流程将有所区别。
  • 将 mysql_base_dir 参数和 mysql_data_dir_base 参数设定为根据 db_type 自动生成,这样可以得到不同的目录路径。我希望避免将 MySQL 和 GreatSQL 放置在同一目录下,以便于区分。
  • 对于 mysql_package 参数,即安装包的名称,如果是 MySQL,会根据 {{ mysql_version }} 自动生成;如果是 GreatSQL,将读取 greatsql_package 的设置。
  • 新增了 fcs_use_greatsql_ha 开关参数,其默认值为 1,即如果部署的是 GreatSQL 并且采用 MGR 架构(执行的 playbook==mgr.yml),那么默认会部署"MGR 读写节点可动态绑定 VIP"的功能插件。
  1. ## DB TYPE,suport mysql,percona,greatsql
  2. + db_type: greatsql
  3. #Directory of MySQL installation package
  4. mysql_packages_dir: ../downloads/
  5. + greatsql_package: GreatSQL-8.0.32-24-Linux-glibc2.17-x86_64-minimal.tar.xz
  6. + percona_package: Percona-Server-8.0.29-21-Linux.x86_64.glibc2.17.tar.gz
  7. ## do not modify
  8. - mysql_package: "{{ 'mysql-' + mysql_version + '-linux-' + ('glibc2.12' if mysql_version.startswith('5.') else 'glibc2.17') + '-x86_64' + ('.tar.gz' if mysql_version.startswith('5.') else '-minimal.tar.xz') }}"
  9. + mysql_package: "{% if db_type == 'mysql' %}{{ 'mysql-' + mysql_version + '-linux-' + ('glibc2.12' if mysql_version.startswith('5.') else 'glibc2.17') + '-x86_64' + ('.tar.gz' if mysql_version.startswith('5.') else '-minimal.tar.xz') }}{% elif db_type == 'percona' %}{{ percona_package }}{% elif db_type == 'greatsql' %}{{ greatsql_package }}{% endif %}"
  10. ## linux mysql run user name
  11. mysql_user: mysql
  12. mysql_group: mysql
  13. mysql_user_password: Dbops@9999
  14. ## mysql install directory
  15. - mysql_base_dir: /database/mysql/base/{{ mysql_version }}
  16. + mysql_base_dir: /database/{{ db_type }}/base/{{ mysql_version }}
  17. ## mysql_data_dir_base define mysql datadir base, real datadir= mysql_data_dir_base + /port
  18. - mysql_data_dir_base: /database/mysql
  19. + mysql_data_dir_base: /database/{{ db_type }}
  20. + fcs_use_greatsql_ha: 1
复制代码
3. 新增 GreatSQL 专属 my.cnf 模板,并对 GreatSQL HA 的新参数支持

在 mgr.yml 这个 playbook 里新增三个与 GreatSQL HA 相关的参数设置
  1. + greatsql_vip: 192.168.199.174
  2. + greatsql_net_work_interface: "ens33"
  3. + greatsql_netmast: "255.255.255.255"
复制代码
新增了 mysql_ansible/roles/mysql_server/templates/8.0/greatsql-my.cnf.j2 模板,此模板是从 percona-my.cnf.j2 模板克隆而来。为了支持 GreatSQL HA 的相关参数设置,我使用 jinja2 语法设置了判断逻辑,只有满足以下三个条件,才会添加这些参数:

  • 数据库类型为 'greatsql' (在 common_config.yml 中设置)
  • 设置了 fcs_use_greatsql_ha: 1 开关,要求部署 GreatSQL HA 功能(在 common_config.yml 中设置)
  • 在安装 MGR 时(运行 ansible-playbook mgr.yml 时)
  1. + {% if db_type == 'greatsql' and fcs_use_greatsql_ha == 1 and make_mgr_role_included is defined and make_mgr_role_included %}
  2. + #GreatSQL MGR vip
  3. + plugin-load-add=greatdb_ha.so
  4. + loose-greatdb_ha_enable_mgr_vip=1
  5. + loose-greatdb_ha_mgr_vip_ip={{ greatsql_vip }}
  6. + loose-greatdb_ha_mgr_vip_mask={{ greatsql_netmast }}
  7. + loose-greatdb_ha_mgr_vip_nic={{ greatsql_net_work_interface }}
  8. +
  9. + #single-primary mode
  10. + loose-group_replication_single_primary_mode=1
  11. + loose-group_replication_enforce_update_everywhere_checks=0
  12. + {% endif %}
复制代码
前面设置的三个参数值,greatsql_vip、greatsql_netmast、greatsql_net_work_interface 会对应传入到 my.cnf 里。
4. 支持自动下载 GreatSQL 安装包
  1. + - name: Download GreatSQL binary tarball if not found locally and auto download is enabled(local)
  2. +   ansible.builtin.get_url:
  3. +     url: "https://product.greatdb.com/{{ mysql_package[0:18] }}/{{ mysql_package }}"
  4. +     dest: "{{ mysql_packages_dir }}/{{ mysql_package }}"
  5. +     mode: '0644'
  6. +     timeout: 30
  7. +     headers:
  8. +       User-Agent: "Wget/1.21.1"
  9. +   when: not mysql_server__package_file.stat.exists and fcs_auto_download_mysql == 1 and db_type == 'greatsql'
  10. +   delegate_to: 127.0.0.1
复制代码
在正常情况下,您应该手动上传 GreatSQL 的包到 downloads/ 文件夹中。如果在 downloads/ 文件夹中没有找到对应的包,且在 common_config.yml 文件中设置了 fcs_auto_download_mysql == 1(允许从互联网下载安装包),并且 db_type == 'greatsql',那么将会自动从互联网下载安装包。
dbops 本身就支持下载 MySQL 安装包的功能。但由于 GreatSQL 的安装包下载路径不同,因此我额外添加了一个下载链接,以实现相同的下载功能。
5. 修改 GreatSQL 启动服务

为了让 GreatSQL HA 支持 mysqld 执行通常需要较高权限才能操作的挂载和卸载 VIP 操作,我们需要进行一些特殊设置。官方原先提供了两个方案,但我提出了新的解决方案。
在服务设置中,我们加入以下代码:
  1. [Service]
  2. + {% if db_type == 'greatsql' and fcs_use_greatsql_ha == 1 and make_mgr_role_included is defined and make_mgr_role_included %}
  3. + AmbientCapabilities=CAP_NET_ADMIN CAP_NET_RAW
  4. + {% endif %}
复制代码
只有当满足条件(需要部署 GreatSQL HA)时,系统会自动在启动服务中配置 "CAP_NET_ADMIN CAP_NET_RAW" 的权限。
![图片](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)
我设计的这种方法也得到了官方的采纳,成为首选推荐方法。
6. fix 部署 GreatSQL 有可能报错的问题

GreatSQL 在部署后可能在使用 mysqld 初始化时,或者初始化后使用 mysql 登录时,报告 libcrypto.so 或 libssl.so 找不到。
  1. [root@192-168-199-171 ~]# /usr/local/mysql/bin/mysqld --defaults-file=/database/mysql/etc/3306/my.cnf --initialize-insecure
  2. /usr/local/mysql/bin/mysqld: error while loading shared libraries: libcrypto.so: cannot open shared object file: No such file or directory
  3. [root@192-168-199-171 lib]# mysql -uroot -p -S /database/mysql/data/3307/mysql.sock
  4. mysql: error while loading shared libraries: libssl.so: cannot open shared object file: No such file or directory
复制代码
针对此问题,我们有两种解决方案。第一种方法是使用 yum install openssl-devel 安装,之后系统库就会包含这两个 so 库:
  1. /usr/lib64/libcrypto.so
  2. /usr/lib64/libssl.so
复制代码
然而,我们也有第二种解决方法。GreatSQL 的 Generic 包其实已经编译了这两个库,只是它们被命名为 libcrypto.so.10 和 libssl.so.10,而非 libcrypto.so 和 libssl.so。我们只需在 /usr/local/mysql/lib/private/ 文件夹内为这两个库创建软链接即可。
并且,我认为采用第二种方法,使用官方包内的 libcrypto.so 和 libssl.so,是最佳的解决方案。
改动代码如下:
mysql_ansible/roles/mysql_server/tasks/fix_greatsql_install.yml
  1. + - name: Create symbolic links for libssl.so and libcrypto.so
  2. +   file:
  3. +     src: "/usr/local/mysql/lib/private/{{ link.src }}"
  4. +     dest: "/usr/local/mysql/lib/private/{{ link.dest }}"
  5. +     state: link
  6. +     owner: "{{ mysql_user }}"
  7. +     group: "{{ mysql_group }}"
  8. +   loop:
  9. +     - { src: 'libssl.so.10', dest: 'libssl.so' }
  10. +     - { src: 'libcrypto.so.10', dest: 'libcrypto.so' }
  11. +   loop_control:
  12. +     loop_var: link
复制代码
mysql_ansible/roles/mysql_server/tasks/main.yml
  1.   - name: Install mysql to /usr/local/mysql
  2.     ansible.builtin.import_tasks: install_mysql.yml
  3. + - name: Fix libcrypto.so and libssl.so not find by create link if db_type is greatsql
  4. +   ansible.builtin.import_tasks: fix_greatsql_install.yml
  5. +   when: db_type == 'greatsql'
  6.   - name: Init mysql datadir
  7.     ansible.builtin.import_tasks: initialize_mysql_datadir.yml
复制代码
7. 检查网卡是否一致

在设定了 VIP 漂移的三台机器中,与 MHA 架构相同,我们可能会遇到一种状况:在一开始设置网卡绑定时,主机管理员可能会没注意,发生以下情况:
  1. 192.168.199.171  网卡名 bond1
  2. 192.168.199.172  网卡名 bond1
  3. 192.168.199.173  网卡名 bond0
复制代码
你可能已经发现了,第三台机器的网卡名与前两台不一致。因此,如果发生高可用漂移,MHA 或 MGR 在选择主机时,如果选择了第三台作为主机,那么根据 greatsql_net_work_interface: "bond1" 的设置,漂移操作可能会失败。虽然我还没有进行过测试,但这个问题在 MHA 架构中肯定会发生,而且在 GreatSQL HA 架构中也有很大可能发生!
因此,在运行 ansible-playbook 部署 mgr.yml 时,我已在第一步的 pre_check_and_set(检查和设置系统参数)中,加入了检查网卡名是否一致的步骤。如果网卡名不一致,playbook 将报错并终止运行,给出提示。代码如下:
  1. - name: Add network interface alias to a temporary file
  2.   ansible.builtin.lineinfile:
  3.     path: "/tmp/net_aliases.txt"
  4.     line: "{{ ansible_default_ipv4.alias }}"
  5.     create: true
  6.     mode: '0644'
  7. - name: Fetch copy
  8.   ansible.builtin.fetch:
  9.     src: /tmp/net_aliases.txt
  10.     dest: /tmp/ssh
  11. - name: Append file /tmp/net_aliases.txt (delegate to 127.0.0.1)
  12.   ansible.builtin.shell: set -o pipefail && find /tmp/ssh/ -name "*.txt" -type f -exec sh -c 'cat {}' \; | sort | uniq | wc -l
  13.   register: pre_check_and_set__shell_output
  14.   changed_when: false
  15.   run_once: true
  16.   delegate_to: 127.0.0.1
  17. - name: Check if shell output is 1
  18.   ansible.builtin.assert:
  19.     that: pre_check_and_set__shell_output.stdout | int == 1
  20.     fail_msg: "Network card names are different!"
  21.   run_once: true
  22.   delegate_to: 127.0.0.1
  23. - name: Delete /tmp/net_aliases.txt
  24.   ansible.builtin.file:
  25.     path: /tmp/net_aliases.txt
  26.     state: absent
  27. - name: Delete /tmp/ssh/ (delegate to 127.0.0.1)
  28.   ansible.builtin.file:
  29.     path: /tmp/ssh/
  30.     state: absent
  31.   run_once: true
  32.   delegate_to: 127.0.0.1
复制代码
8. 支持使用 jemalloc 内存分配器

GreatSQL 和 Percona 官方都推荐使用 jemalloc 替代默认的 malloc,我至今没有发现 MySQL 官方的类似建议。然而,在实践中,我曾经通过替换 malloc 为 jemalloc 内存管理器来解决内存泄露问题,尽管根本原因仍不清楚。因此,我之前已经在我的 dbops 工具中加入了在部署时选择使用 jemalloc 内存分配器的功能,它是在 systemd 服务中实现的。
以下是涉及的代码:
mysql_ansible/playbooks/common_config.yml
  1. # 配置文件中提供一个开关,决定是否使用 jemalloc 内存分配器,其默认值为 0,即不修改内存分配器
  2. fcs_mysql_use_jemalloc: 1
复制代码
mysql_ansible/roles/mysql_server/tasks/install_mysql_dependents.yml
  1. - name: Install libaio and numactl
  2.   ansible.builtin.yum:
  3.     name: "{{ package.name }}"
  4.     state: present
  5.   loop:
  6.     - { name: 'libaio' }
  7.     - { name: 'numactl' }
  8.   loop_control:
  9.     loop_var: package
  10.   tags:
  11.     - dependents
  12. - name: Install jemalloc
  13.   when: fcs_mysql_use_jemalloc == 1
  14.   tags:
  15.     - dependents
  16.   block:
  17.     - name: Install jemalloc using yum
  18.       ansible.builtin.yum:
  19.         name: jemalloc
  20.         state: present
  21.       register: mysql_server__jemalloc_install_result
  22.       ignore_errors: true
  23.     - name: Set jemalloc rpm file name based on OS
  24.       ansible.builtin.set_fact:
  25.         mysql_server__jemalloc_rpm_file: "{{ 'jemalloc-3.6.0-1.el8.x86_64.rpm' if os_type in ['openEuler22', 'openEuler20', 'CentOS8', 'BigCloud8', 'Anolis OS8'] else 'jemalloc-3.6.0-1.el7.x86_64.rpm' }}"
  26.     - name: Copy jemalloc rpm to target server
  27.       ansible.builtin.copy:
  28.         src: "../files/{{ mysql_server__jemalloc_rpm_file }}"
  29.         dest: "/tmp/{{ mysql_server__jemalloc_rpm_file }}"
  30.         mode: '0755'
  31.       when: mysql_server__jemalloc_install_result.failed
  32.     - name: Install jemalloc from local file
  33.       ansible.builtin.yum:
  34.         name: "/tmp/{{ mysql_server__jemalloc_rpm_file }}"
  35.         state: present
  36.         disable_gpg_check: true
  37.       register: mysql_server__jemalloc_local_install_result
  38.       when: mysql_server__jemalloc_install_result.failed
  39.       ignore_errors: true
  40.     - name: Check if jemalloc installation failed
  41.       ansible.builtin.fail:
  42.         msg: "Failed to install jemalloc"
  43.       when: mysql_server__jemalloc_install_result.failed and mysql_server__jemalloc_local_install_result.failed
复制代码
这段代码主要是用于安装 mysql_server 的依赖包,如果你在配置中设置了 fcs_mysql_use_jemalloc: 1,那么将会安装 jemalloc。默认情况下,它会尝试使用 yum 来安装。如果 yum 安装失败,那么它会尝试使用 dbops 自带的 jemalloc 包。
原因是,预备的 jemalloc 包只有两个版本:一个是针对 EL7,一个是针对 EL8。并没有专门为国产操作系统准备的专用包。在国产操作系统上,你应该优先使用 yum 来安装适合该系统的包。如果使用 yum 安装失败,你可以考虑使用 EL7 或者 EL8 的 jemalloc 包来进行兼容性安装。
mysql_ansible/roles/mysql_server/templates/mysql.service.j2
  1. [Service]
  2. ...
  3. {% if fcs_mysql_use_jemalloc == 1 %}
  4. {% if os_type in ['openEuler22','openEuler20'] %}
  5. Environment="LD_PRELOAD=/usr/lib64/libjemalloc.so.2"
  6. {% else %}
  7. Environment="LD_PRELOAD=/usr/lib64/libjemalloc.so.1"
  8. {% endif %}
  9. {% endif %}
复制代码
根据 yum 或者 rpm 包方式安装 libjemalloc 后,不同操作系统的 libjemalloc.so 路径可能会不同,我在服务配置里会做判断和正确加载。
结语与反馈征集

如果你对 dbops 感兴趣,欢迎你使用,并提出宝贵的建议或问题。如果在使用过程中遇到任何问题,或有任何改进的建议,欢迎在 dbops 的 gitee 项目页面上提交 issue。你的反馈将帮助我不断改进,使其更好地服务于所有开源数据库用户。
我会认真处理每一个提交的 issue,力求在第一时间给出解答或解决方案。同时,我们也欢迎你为 dbops 的开发做出贡献,无论是提交代码,还是参与讨论,我都非常欢迎。感谢你的支持!

Enjoy GreatSQL
来源:https://www.cnblogs.com/greatsql/p/17468214.html
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!

举报 回复 使用道具