翼度科技»论坛 编程开发 mysql 查看内容

如何进行MySQL源码调试(一条select语句的执行流程)

8

主题

8

帖子

24

积分

新手上路

Rank: 1

积分
24
一、背景
MySQL是当今世上最受欢迎的使用最广泛的开源数据库,它的繁荣离不开它的开源特性。放在过去商业数据库的时代,大家都没有机会接触到数据库的源代码,但在如今开源数据库的时代,越来越多的人开始研究数据库的源码,并给社区贡献代码,MySQL官方每次发布新版本都要感谢一些在社区上贡献代码的程序员。现在新的数据库时代也给DBA提出了更高的要求,学会调试源码,通过源码定位问题,这是DBA进阶的方向。MySQL的源码有几百上千万行,想全部搞懂几乎是不可能的,研究源码一般推荐从某个功能点入手。而学会调试源码,不管对研究源码或通过源码定位问题,都是必备的技能。本文将介绍Linux平台下如何通过gdb进行MySQL源码调试,并简单介绍通过调试源码定位一条select语句的执行流程。
二、源码调试方法
关于源码的编译及调试,不同的平台可以通过不同的工具来进行:windows平台下可以通过visual studio来进行,https://www.cnblogs.com/huangxincheng/p/13084736.html 按照这篇文章的方法可以进行5.7的调试,通过cmake生成mysql.sln文件,然后给打开sln文件编译成功后,就可以进入调试模式了。在某个函数处打下断点,F5进入调试模式后,就可以对数据库进行操作了,命中断点后就可以查看堆栈的函数调用关系。一般在实际应用中,MySQL都是运行在Linux平台下,在Linux平台下一般是通过GDB(GNU symbolic debugger)工具进行调试,C/C++ 项目的开发和调试包括故障排查都是利用 GDB 完成的。此外,VsCODE这种IDE工具可以在本地的windows操作系统下,通过ssh远程调试Linux平台下的MySQL,https://mp.weixin.qq.com/s/RO_Ipa9_SH8_DuVholrgvg,姜老师这篇文章也简单讲了一下如何操作。
三、GDB调试MySQL源码
3.1 MySQL源码下载
首先需要在MySQL官网上下载MySQL源码,操作系统选择为source code,OS版本选择为ALL OPERATING SYSTEM,下载带boost头文件的源码包。如果对MySQL的版本没有特别要求的话,一般推荐下载最新版本的,因为老版本中存在bug的概率较大,编译过程需要解决这些bug,比如在8.0.23版本中编译过程中报了这个错:buf0buf.cc:1227:44: error: ‘SYS_gettid’ was not declared in this scope。参考MySQL官方论坛:https://forums.mysql.com/read.php?117,674410,676378#msg-676378,在storage/innobase/buf/buf0flu.cc文件代码中加上声明#include ,解决了这个报错。
3.2 编译安装环境准备
源码编译需要gcc等基础软件支持,MySQL8.0版本 gcc至少需要7.1以上,一般推荐直接升级到最高版本,在线环境比较好办直接通过yum安装即可。离线环境的下载及安装可以参考这两篇文章分别升级gcc和cmake:
https://mp.weixin.qq.com/s/kWPD1o5fWTAxUNETGsXA7ghttps://mp.weixin.qq.com/s/5sHPJ0Kxkmj2llW-UvEbkg。把gcc和cmake搞定后,就可以开始编译安装mysql了。
3.3 编译和安装MySQL
参考官方文档通过源码安装mysql这一章可以完成mysql的编译和安装:

实际cmake加上这几个参数,其中-DWITH_DEBUG=1是为了开启调试模式。
  1. cmake .. -DCMAKE_INSTALL_PREFIX=/usr/local/mysql -DWITH_BOOST=/root/gdb_mysql/mysql-8.0.23/boost/boost_1_73_0 -DWITH_DEBUG=1
复制代码
接着make install成功后,配置好配置文件/etc/my.cnf,就可以初始化数据库并启动数据库了。
  1. mysqld --initialize --user=mysql
  2. mysqld_safe --user=mysql &
复制代码
启动完数据库后,登录数据库可以发现现在已经是debug模式了。

3.4 gdb调试源码
完成MySQLdebug版本的安装和启动后,gdb命令下attach mysql的进程号,就可以对mysql进程进行打断点调试了。

 gdb调试过程中常用的命令可以参考如下:
  1. attach 进程号 #进入调试模式
  2. b Sql_cmd_insert::mysql_insert  #在某个函数打下断点
  3. b filename:linenum  #在文件的某行打下断点   
  4. clear function  #在某个函数处删除断点
  5. bt   #查看堆栈信息
  6. n    #next 单步调试,每次只执行往下一行代码,对于调用的函数来说,next 命令只会将其视作一行代码。 #n 3 往下执行三行代码
  7. s    #step 单步调试,当 step 命令所执行的代码行中包含函数时,会进入该函数内部,并在函数第一行代码处停止执行。
  8. c    #continue 当程序在某一断点处停止运行后,使用该指令可以继续执行,直至遇到下一个断点或者程序结束。
  9. l    #list 显示源程序代码的内容,包括各行代码所在的行号。
  10. p xxx  #print 打印指定xxx变量的值
  11. info breakpoint   #查看断点信息
复制代码
 
四、一条select语句的调试
在handle_connection函数处打下断点,然后在mysql客户端执行一条select语句,可以在gdb里面看到,程序很快命中了断点,接下来便可以通过单步调试,一步一步定位select语句的执行流程。
  1. #客户端连接的线程处理函数
  2. handle_connection (arg=0xb998240) at /gdb/mysql-8.0.23/sql/conn_handler/connection_handler_per_thread.cc
  3. #读取连接发来的命令,然后执行
  4. do_command (thd=0x7f5a3815d3c0) at /gdb/mysql-8.0.23/sql/sql_parse.cc:1320
  5. #THD类,描述每个客户端连接产生的后台进程
  6. #发出命令
  7. dispatch_command (thd=0x7f5a3815d3c0, com_data=0x7f5afc7adb00, command=COM_QUERY)
  8. #根据command=COM_QUERY,调用alloc_query函数(读取查询语句并存在thd->query中)
  9. if (alloc_query(thd, com_data->com_query.query,com_data->com_query.length))
  10. #执行到dispatch_sql_command(thd, &parser_state); 解析sql语句,然后把结果发给executor
  11. dispatch_sql_command(thd, &parser_state);
  12. #进入dispatch_sql_command函数,执行到mysql_execute_command函数(Execute command saved in thd and lex->sql_command)
  13. error = mysql_execute_command(thd, true);
  14. #在mysql_execute_command函数中,执行到case SQLCOM_SELECT,res = lex->m_sql_cmd->execute(thd),进入到execute函数
  15. #在mysql_execute_command函数中,switch (lex->sql_command)通过case SQLCOM_XXX,转到不同语句的执行器
  16. #这时候就进入到了lex的公共属性m_sql_cmd类下面的execute函数;
  17. #通过单步调试,此时程序进入到了Sql_cmd_dml::execute (this=0x7f5a38bee0b0, thd=0x7f5a3815d3c0) at /gdb/mysql-8.0.23/sql/sql_select.cc:517
  18. #此时可以看到,解析SQL是在dispatch_sql_command和mysql_execute_command函数中完成的,Sql_cmd_dml::execute的函数主要有6步
  19. Prelocking;Preparation;Locking of tables;Optimization;Execution or explain;Cleanup
  20. #lock_tables(thd, lex->query_tables, lex->table_count, 0) 锁表
  21. #execute_inner(thd) 执行
  22. #进入execute阶段
  23. Sql_cmd_dml::execute_inner (this=0x7f1ca0011858, thd=0x7f1ca0005ed0) at /gdb/mysql-8.0.23/sql/sql_select.cc:809
  24. if (unit->optimize(thd, /*materialize_destination=*/nullptr, /*create_iterators=*/true)) #优化
  25. if (unit->execute(thd)) return true; #执行
  26. #此时执行到了SELECT_LEX_UNIT::execute (this=0x7f1ca0023e48, thd=0x7f1ca0005ed0) at /gdb/mysql-8.0.23/sql/sql_union.cc:1267
  27. return ExecuteIteratorQuery(thd);
  28. #执行ExecuteIteratorQuery这个函数
  29. SELECT_LEX_UNIT::ExecuteIteratorQuery (this=0x7f1ca0023e48, thd=0x7f1ca0005ed0) at /gdb/mysql-8.0.23/sql/sql_union.cc:1125
  30. #执行完成后返回查询语句的结果值 return query_result->send_eof(thd);
  31. #这个时候Sql_cmd_dml::execute_inner函数也执行完成了,进而Sql_cmd_dml::execute,mysql_execute_command也接着执行完成
  32. #执行到dispatch_command函数的thd->send_statement_status(); 这一行,看到客户端执行的查询语句也输出了结果
  33. #执行到handle_connection的while (thd_connection_alive(thd)) {if (do_command(thd)) break;}; 意味着mysql连接结束了,这时候调试也随之结束。
复制代码
select语句的执行流程可以总结如下,这些函数可以方便以后打断点,更快的定位问题:
  1. 1. 客户端连接线程处理函数
  2. handle_connection (arg=0xb998240) at /gdb/mysql-8.0.23/sql/conn_handler/connection_handler_per_thread.cc:301
  3. 2. 读取连接发来的命令,然后执行
  4. do_command (thd=0x7f5a3815d3c0) at /gdb/mysql-8.0.23/sql/sql_parse.cc:1320
  5. 3. 发出命令,并将查询语句存在thd->query中
  6. dispatch_command (thd=0x7f1ca0011100, com_data=0x7f1d644d3b00, command=COM_QUERY) at /gdb/mysql-8.0.23/sql/sql_parse.cc:1836
  7. 4. 解析sql语句,然后把结果发给executor
  8. dispatch_sql_command (thd=0x7f1ca0011100, parser_state=0x7f1d644d2a60) at /gdb/mysql-8.0.23/sql/sql_parse.cc:4988
  9. 5. 执行存在thd中的语句
  10. mysql_execute_command (thd=0x7f1ca0011100, first_level=true) at /gdb/mysql-8.0.23/sql/sql_parse.cc:4407
  11. 6. SELECT语句的:准备,锁表,优化,执行
  12. Sql_cmd_dml::execute (this=0x7f1ca09feb28, thd=0x7f1ca0011100) at /gdb/mysql-8.0.23/sql/sql_select.cc:612
  13. 7. SELECT语句的优化和执行
  14. Sql_cmd_dml::execute_inner (this=0x7f1ca0011858, thd=0x7f1ca0005ed0) at /gdb/mysql-8.0.23/sql/sql_select.cc:809
  15. 8. SELECT语句的执行
  16. SELECT_LEX_UNIT::execute (this=0x7f1ca0023e48, thd=0x7f1ca0005ed0) at /gdb/mysql-8.0.23/sql/sql_union.cc:1267
  17. 9. 执行语句,返回结果
  18. SELECT_LEX_UNIT::ExecuteIteratorQuery (this=0x7f1ca0023e48, thd=0x7f1ca0005ed0) at /gdb/mysql-8.0.23/sql/sql_union.cc:1125
复制代码
五、总结
不管是研究MySQL源码还是通过源码定位问题,学会调试MySQL源码都是必备的基础技能,MySQL源码体系十分庞大,调试源码可以更快更清晰从源码中定位问题。

来源:https://www.cnblogs.com/coygfly/p/17379482.html
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

举报 回复 使用道具