MySQL教程 / 第 100 节

第10章：MySQL架构与执行流程

深入理解MySQL的整体架构和SQL执行流程，是成为MySQL专家的必经之路

10.1 MySQL整体架构 ⭐⭐⭐⭐⭐

10.1.1 MySQL架构分层

┌─────────────────────────────────────────┐
│         客户端（Client）                 │
│   MySQL Workbench、Navicat、应用程序     │
└─────────────────────────────────────────┘
                    ↓
┌─────────────────────────────────────────┐
│         连接层（Connection Layer）       │
│   连接处理、认证、安全                   │
└─────────────────────────────────────────┘
                    ↓
┌─────────────────────────────────────────┐
│         服务层（SQL Layer）              │
│   ┌──────────────────────────────────┐  │
│   │  查询缓存（Query Cache）         │  │
│   └──────────────────────────────────┘  │
│   ┌──────────────────────────────────┐  │
│   │  解析器（Parser）                │  │
│   └──────────────────────────────────┘  │
│   ┌──────────────────────────────────┐  │
│   │  优化器（Optimizer）             │  │
│   └──────────────────────────────────┘  │
│   ┌──────────────────────────────────┐  │
│   │  执行器（Executor）              │  │
│   └──────────────────────────────────┘  │
└─────────────────────────────────────────┘
                    ↓
┌─────────────────────────────────────────┐
│      存储引擎层（Storage Engine Layer）  │
│   InnoDB、MyISAM、Memory等               │
└─────────────────────────────────────────┘
                    ↓
┌─────────────────────────────────────────┐
│         文件系统（File System）          │
│   数据文件、日志文件、配置文件           │
└─────────────────────────────────────────┘

10.1.2 各层功能详解

1. 连接层（Connection Layer）

客户端连接处理
用户认证和权限验证
连接池管理
线程管理

2. 服务层（SQL Layer）

查询缓存（MySQL 5.7有，8.0移除）
SQL解析和语法分析
SQL优化
SQL执行

3. 存储引擎层（Storage Engine Layer）

数据存储和读取
索引管理
事务管理
锁管理

4. 文件系统层

数据文件存储
日志文件存储
配置文件管理

10.2 连接器（Connector）

10.2.1 连接过程

-- 1. 客户端发起连接
mysql -h localhost -u root -p

-- 2. 服务器验证用户名和密码
-- 3. 验证成功后，查询用户权限
-- 4. 建立连接，分配连接ID

-- 查看当前连接
SHOW PROCESSLIST;

-- 查看连接数
SHOW STATUS LIKE 'Threads_connected';
SHOW STATUS LIKE 'Max_used_connections';

10.2.2 连接管理

-- 查看最大连接数
SHOW VARIABLES LIKE 'max_connections';

-- 设置最大连接数
SET GLOBAL max_connections = 500;

-- 查看连接超时时间
SHOW VARIABLES LIKE 'wait_timeout';
SHOW VARIABLES LIKE 'interactive_timeout';

-- 设置连接超时时间（秒）
SET GLOBAL wait_timeout = 28800;  -- 8小时
SET GLOBAL interactive_timeout = 28800;

10.2.3 连接池

-- MySQL没有内置连接池，需要应用层实现
-- 常用连接池：
-- - Java: HikariCP、Druid、C3P0
-- - Python: SQLAlchemy、PyMySQL
-- - PHP: PDO、MySQLi

-- 连接池的好处：
-- 1. 减少连接创建和销毁的开销
-- 2. 控制并发连接数
-- 3. 提高性能

10.3 查询缓存（Query Cache）⚠️

10.3.1 查询缓存概述

-- ⚠️ 注意：MySQL 8.0已移除查询缓存
-- MySQL 5.7仍然支持，但不推荐使用

-- 查询缓存的工作原理：
-- 1. 客户端发送SQL
-- 2. 服务器计算SQL的hash值
-- 3. 查找缓存中是否有相同的hash
-- 4. 如果有，直接返回缓存结果
-- 5. 如果没有，执行SQL并缓存结果

-- 查看查询缓存配置
SHOW VARIABLES LIKE 'query_cache%';

-- 查看查询缓存状态
SHOW STATUS LIKE 'Qcache%';

10.3.2 查询缓存的问题

-- 问题1：缓存失效频繁
-- 表数据发生任何变化，该表的所有缓存都会失效
UPDATE users SET age = 26 WHERE id = 1;  -- 所有users表的缓存失效

-- 问题2：SQL必须完全相同
-- 以下两个SQL不会命中同一个缓存
SELECT * FROM users WHERE id = 1;
SELECT * FROM users WHERE id=1;  -- 空格不同

-- 问题3：性能问题
-- 缓存的维护成本高于收益

-- 建议：
-- ✅ MySQL 5.7：关闭查询缓存
-- ✅ MySQL 8.0：已移除
-- ✅ 使用Redis等外部缓存

10.3.3 关闭查询缓存

# my.cnf配置文件
[mysqld]
query_cache_type = 0
query_cache_size = 0

10.4 解析器（Parser）⭐⭐⭐⭐

10.4.1 词法分析

-- SQL: SELECT id, username FROM users WHERE id = 1;

-- 词法分析：将SQL分解为token
-- SELECT  -> 关键字
-- id      -> 标识符
-- ,       -> 分隔符
-- username-> 标识符
-- FROM    -> 关键字
-- users   -> 标识符
-- WHERE   -> 关键字
-- id      -> 标识符
-- =       -> 运算符
-- 1       -> 数字
-- ;       -> 结束符

10.4.2 语法分析

-- 语法分析：检查SQL语法是否正确
-- 构建语法树（Parse Tree）

-- ✅ 正确的SQL
SELECT id, username FROM users WHERE id = 1;

-- ❌ 语法错误
SELECT id, username users WHERE id = 1;  -- 缺少FROM
-- ERROR 1064: You have an error in your SQL syntax

-- ❌ 语法错误
SELECT id, username FROM WHERE id = 1;  -- 缺少表名
-- ERROR 1064: You have an error in your SQL syntax

10.4.3 语义分析

-- 语义分析：检查SQL是否有意义

-- ❌ 表不存在
SELECT * FROM non_exist_table;
-- ERROR 1146: Table 'database.non_exist_table' doesn't exist

-- ❌ 列不存在
SELECT non_exist_column FROM users;
-- ERROR 1054: Unknown column 'non_exist_column' in 'field list'

-- ❌ 权限不足
SELECT * FROM mysql.user;
-- ERROR 1142: SELECT command denied to user

10.5 优化器（Optimizer）⭐⭐⭐⭐⭐

10.5.1 优化器的作用

-- 优化器的任务：
-- 1. 选择最优的执行计划
-- 2. 选择使用哪个索引
-- 3. 决定表的连接顺序
-- 4. 优化子查询
-- 5. 优化排序和分组

-- 示例：多个索引选择
CREATE TABLE users (
    id INT PRIMARY KEY,
    username VARCHAR(50),
    age INT,
    city VARCHAR(50),
    INDEX idx_age (age),
    INDEX idx_city (city)
);

-- SQL: SELECT * FROM users WHERE age = 25 AND city = '北京';
-- 优化器需要决定：
-- 1. 使用idx_age索引？
-- 2. 使用idx_city索引？
-- 3. 使用全表扫描？

10.5.2 查看执行计划

-- 使用EXPLAIN查看优化器的选择
EXPLAIN SELECT * FROM users WHERE age = 25 AND city = '北京';

-- 关键字段：
-- type: 访问类型（ALL、index、range、ref、const等）
-- key: 使用的索引
-- rows: 预计扫描的行数
-- Extra: 额外信息

10.5.3 优化器的优化策略

-- 1. 索引选择
-- 优化器会根据统计信息选择最优索引

-- 2. 表连接顺序优化
-- 小表驱动大表
SELECT * FROM small_table s
INNER JOIN large_table l ON s.id = l.small_id;

-- 3. 子查询优化
-- 将子查询转换为JOIN
-- 优化前：
SELECT * FROM users WHERE id IN (SELECT user_id FROM orders);
-- 优化后（优化器自动转换）：
SELECT DISTINCT u.* FROM users u INNER JOIN orders o ON u.id = o.user_id;

-- 4. 排序优化
-- 使用索引避免排序
CREATE INDEX idx_age ON users(age);
SELECT * FROM users ORDER BY age;  -- 使用索引，避免filesort

-- 5. 分组优化
-- 使用索引优化GROUP BY
CREATE INDEX idx_city ON users(city);
SELECT city, COUNT(*) FROM users GROUP BY city;  -- 使用索引

10.5.4 优化器统计信息

-- 优化器依赖统计信息做决策
-- 统计信息包括：
-- 1. 表的行数
-- 2. 索引的基数（cardinality）
-- 3. 数据分布

-- 查看表统计信息
SHOW TABLE STATUS LIKE 'users';

-- 查看索引统计信息
SHOW INDEX FROM users;

-- 更新统计信息
ANALYZE TABLE users;

-- 强制使用指定索引
SELECT * FROM users FORCE INDEX(idx_age) WHERE age = 25;

-- 忽略指定索引
SELECT * FROM users IGNORE INDEX(idx_age) WHERE age = 25;

10.6 执行器（Executor）⭐⭐⭐⭐

10.6.1 执行器的作用

-- 执行器的任务：
-- 1. 检查用户权限
-- 2. 调用存储引擎接口
-- 3. 返回结果集

-- 执行流程：
-- 1. 检查用户是否有查询权限
-- 2. 打开表
-- 3. 调用存储引擎接口读取数据
-- 4. 过滤数据（WHERE条件）
-- 5. 返回结果

10.6.2 执行过程示例

-- SQL: SELECT * FROM users WHERE age = 25;

-- 执行步骤：
-- 1. 检查用户是否有users表的SELECT权限
-- 2. 调用InnoDB引擎接口
-- 3. 如果有索引，使用索引查找
-- 4. 如果没有索引，全表扫描
-- 5. 对每一行判断age是否等于25
-- 6. 将符合条件的行返回给客户端

-- 查看执行过程
SHOW PROFILES;  -- 需要先开启profiling
SET profiling = 1;
SELECT * FROM users WHERE age = 25;
SHOW PROFILES;
SHOW PROFILE FOR QUERY 1;

10.7 SQL执行流程详解 ⭐⭐⭐⭐⭐

10.7.1 查询语句执行流程

-- SQL: SELECT * FROM users WHERE id = 1;

-- 完整执行流程：
-- 1. 客户端发送SQL到服务器
-- 2. 连接器：验证用户身份和权限
-- 3. 查询缓存：检查是否有缓存（MySQL 5.7）
-- 4. 解析器：词法分析、语法分析、语义分析
-- 5. 优化器：生成执行计划，选择索引
-- 6. 执行器：调用存储引擎接口
-- 7. 存储引擎：读取数据
-- 8. 执行器：返回结果给客户端

10.7.2 更新语句执行流程

-- SQL: UPDATE users SET age = 26 WHERE id = 1;

-- 完整执行流程：
-- 1. 连接器：验证用户身份和权限
-- 2. 解析器：词法分析、语法分析、语义分析
-- 3. 优化器：生成执行计划
-- 4. 执行器：调用存储引擎接口
-- 5. 存储引擎（InnoDB）：
--    a. 查找id=1的记录（使用主键索引）
--    b. 将旧值写入undo log（用于回滚）
--    c. 更新记录
--    d. 将新值写入redo log（用于崩溃恢复）
--    e. 写入binlog（用于主从复制）
-- 6. 提交事务
-- 7. 返回影响的行数

10.7.3 两阶段提交

-- InnoDB的两阶段提交（2PC）
-- 保证redo log和binlog的一致性

-- 执行流程：
-- 1. 写入redo log（prepare状态）
-- 2. 写入binlog
-- 3. 提交事务，redo log改为commit状态

-- 为什么需要两阶段提交？
-- 保证redo log和binlog的一致性
-- 详见第15章：MySQL日志系统

10.8 InnoDB架构详解 ⭐⭐⭐⭐⭐

10.8.1 InnoDB整体架构

┌─────────────────────────────────────────┐
│         InnoDB内存结构                   │
│  ┌────────────────────────────────────┐ │
│  │  Buffer Pool（缓冲池）              │ │
│  │  - 数据页缓存                       │ │
│  │  - 索引页缓存                       │ │
│  │  - undo页缓存                       │ │
│  └────────────────────────────────────┘ │
│  ┌────────────────────────────────────┐ │
│  │  Change Buffer（写缓冲）            │ │
│  └────────────────────────────────────┘ │
│  ┌────────────────────────────────────┐ │
│  │  Adaptive Hash Index（自适应哈希）  │ │
│  └────────────────────────────────────┘ │
│  ┌────────────────────────────────────┐ │
│  │  Log Buffer（日志缓冲）             │ │
│  └────────────────────────────────────┘ │
└─────────────────────────────────────────┘
                    ↓
┌─────────────────────────────────────────┐
│         InnoDB磁盘结构                   │
│  ┌────────────────────────────────────┐ │
│  │  System Tablespace（系统表空间）    │ │
│  │  - ibdata1                          │ │
│  └────────────────────────────────────┘ │
│  ┌────────────────────────────────────┐ │
│  │  File-Per-Table Tablespace          │ │
│  │  - table_name.ibd                   │ │
│  └────────────────────────────────────┘ │
│  ┌────────────────────────────────────┐ │
│  │  Redo Log（重做日志）               │ │
│  │  - ib_logfile0, ib_logfile1         │ │
│  └────────────────────────────────────┘ │
│  ┌────────────────────────────────────┐ │
│  │  Undo Tablespace（undo表空间）      │ │
│  └────────────────────────────────────┘ │
└─────────────────────────────────────────┘

10.8.2 Buffer Pool（缓冲池）

-- Buffer Pool是InnoDB最重要的内存结构
-- 作用：缓存数据页和索引页，减少磁盘I/O

-- 查看Buffer Pool配置
SHOW VARIABLES LIKE 'innodb_buffer_pool_size';

-- 设置Buffer Pool大小（建议物理内存的50%-70%）
-- my.cnf
[mysqld]
innodb_buffer_pool_size = 1G

-- 查看Buffer Pool状态
SHOW ENGINE INNODB STATUS;

-- Buffer Pool的管理：
-- 1. 使用LRU算法管理页面
-- 2. 分为young区和old区
-- 3. 预读机制
-- 4. 刷脏页机制

10.8.3 Change Buffer（写缓冲）

-- Change Buffer：缓存对二级索引的修改
-- 作用：减少随机I/O，提高写入性能

-- 适用场景：
-- ✅ 二级索引的INSERT、UPDATE、DELETE
-- ❌ 主键索引（直接写入Buffer Pool）
-- ❌ 唯一索引（需要检查唯一性）

-- 查看Change Buffer配置
SHOW VARIABLES LIKE 'innodb_change_buffer%';

-- 配置Change Buffer
[mysqld]
innodb_change_buffer_max_size = 25  -- 占Buffer Pool的百分比

10.8.4 Redo Log（重做日志）

-- Redo Log：保证事务的持久性
-- 作用：崩溃恢复

-- 查看Redo Log配置
SHOW VARIABLES LIKE 'innodb_log%';

-- 配置Redo Log
[mysqld]
innodb_log_file_size = 512M  -- 单个日志文件大小
innodb_log_files_in_group = 2  -- 日志文件数量
innodb_flush_log_at_trx_commit = 1  -- 刷新策略

-- Redo Log的写入流程：
-- 1. 事务修改数据
-- 2. 写入redo log buffer
-- 3. 根据innodb_flush_log_at_trx_commit刷新到磁盘
-- 4. 提交事务

-- 详见第15章：MySQL日志系统

10.8.5 Undo Log（回滚日志）

-- Undo Log：保证事务的原子性
-- 作用：
-- 1. 事务回滚
-- 2. MVCC（多版本并发控制）

-- Undo Log的作用：
-- 1. 记录数据的旧版本
-- 2. 事务回滚时恢复数据
-- 3. 实现MVCC的快照读

-- 详见第08章：事务与并发控制

10.9 MySQL执行流程实战

10.9.1 查询执行分析

-- 开启profiling
SET profiling = 1;

-- 执行查询
SELECT * FROM users WHERE age = 25;

-- 查看执行时间
SHOW PROFILES;

-- 查看详细执行过程
SHOW PROFILE FOR QUERY 1;

-- 查看CPU、IO等信息
SHOW PROFILE CPU, BLOCK IO FOR QUERY 1;

10.9.2 慢查询分析

-- 开启慢查询日志
SET GLOBAL slow_query_log = 1;
SET GLOBAL long_query_time = 1;  -- 超过1秒的查询

-- 查看慢查询日志位置
SHOW VARIABLES LIKE 'slow_query_log_file';

-- 分析慢查询
-- 使用pt-query-digest工具
-- pt-query-digest /var/lib/mysql/slow.log

10.9.3 执行计划分析

-- 使用EXPLAIN分析执行计划
EXPLAIN SELECT * FROM users WHERE age = 25;

-- 使用EXPLAIN FORMAT=JSON获取详细信息
EXPLAIN FORMAT=JSON SELECT * FROM users WHERE age = 25;

-- 详见第18章：SQL优化实战

10.10 本章总结

本章学习内容：

✅ MySQL整体架构（连接层、服务层、存储引擎层）⭐⭐⭐⭐⭐
✅ 连接器（连接管理、权限验证）
✅ 查询缓存（MySQL 5.7有，8.0移除）
✅ 解析器（词法分析、语法分析、语义分析）⭐⭐⭐⭐
✅ 优化器（执行计划、索引选择）⭐⭐⭐⭐⭐
✅ 执行器（权限检查、调用存储引擎）⭐⭐⭐⭐
✅ SQL执行流程（查询和更新）⭐⭐⭐⭐⭐
✅ InnoDB架构（内存结构、磁盘结构）⭐⭐⭐⭐⭐

重点掌握：

MySQL分为连接层、服务层、存储引擎层
SQL执行流程：连接器→解析器→优化器→执行器→存储引擎
优化器负责选择最优执行计划和索引
InnoDB的Buffer Pool是最重要的内存结构
Redo Log保证持久性，Undo Log保证原子性
两阶段提交保证redo log和binlog的一致性

SQL执行流程：

客户端 → 连接器 → 查询缓存 → 解析器 → 优化器 → 执行器 → 存储引擎 → 返回结果

InnoDB核心组件：

Buffer Pool：缓存数据页和索引页
Change Buffer：缓存二级索引的修改
Redo Log：保证持久性
Undo Log：保证原子性和MVCC

面试重点：

MySQL的架构分层
SQL的执行流程
优化器如何选择索引
InnoDB的Buffer Pool作用
Redo Log和Binlog的区别
两阶段提交的原理

下一章预告： 视图、存储过程与函数

练习题

说明MySQL的架构分层
SQL执行流程是怎样的？
优化器的作用是什么？
什么是两阶段提交？为什么需要？
InnoDB的Buffer Pool有什么作用？
Redo Log和Undo Log的区别是什么？
如何查看SQL的执行计划？
如何分析慢查询？
Change Buffer适用于什么场景？
为什么MySQL 8.0移除了查询缓存？

继续学习： 第11章：视图、存储过程与函数