mysql菜鸟教程

首页 >> mysql菜鸟教程

专栏导航

20.5 性能优化建议

在完成了博客系统的数据库设计、数据初始化以及复杂查询的实现后，你可能已经注意到某些查询随着数据量增长会变慢。性能优化是数据库应用开发中持续且重要的环节。本节将结合博客系统的特点，提供一套实用的性能优化建议，涵盖索引优化、查询优化、表结构设计和系统配置等方面。

一、索引优化

索引是提升查询性能最直接有效的手段，但也要避免过度索引。针对博客系统，建议如下：

1.1 为常用查询条件添加索引

用户登录验证：users 表的 username 和 email 字段已有索引，很好。
文章列表查询：posts 表的 status 和 published_at 复合索引 idx_status_published 可以加速按状态和时间排序的查询。
作者文章查询：posts 表的 user_id 索引，加速特定作者的文章列表。
分类文章查询：posts 表的 category_id 索引。
评论查询：comments 表的 post_id 和 user_id 索引。

1.2 复合索引的列顺序

对于 posts 表经常出现的查询 WHERE status = 'published' ORDER BY published_at DESC，我们创建的复合索引 (status, published_at) 是合适的，因为先过滤状态再排序可以利用索引的有序性。
如果经常有查询按 category_id 过滤并排序，可以考虑复合索引 (category_id, published_at)。

1.3 避免冗余索引

已有 (status, published_at) 索引，就不需要再单独为 status 建索引（除非 status 单独查询频率极高且该索引可被覆盖）。
定期使用 pt-duplicate-key-checker 等工具检查重复索引。

1.4 使用覆盖索引

如果某个查询只需要读取索引就能返回结果（即索引覆盖了所有需要查询的列），可以大幅减少回表 I/O。
例如，查询文章标题和浏览量时，可考虑在 posts 表上建立 (id, title, views) 的覆盖索引，但需权衡存储成本。

1.5 监控索引使用情况

使用 SHOW INDEX FROM table_name 查看索引基数。
开启慢查询日志，结合 EXPLAIN 分析未使用索引的查询，及时添加缺失的索引。

二、查询优化

2.1 避免 SELECT *

只查询需要的列，减少数据传输量。例如，文章列表页可能只需要 id, title, excerpt, published_at，而不是全部列。

2.2 分解复杂查询

对于特别复杂的报表查询，可以考虑拆分成多个简单查询，或在应用层做数据聚合。例如，统计每个用户的文章数和评论数，可以分别查询两个聚合结果然后在应用层合并，避免大表的笛卡尔积连接。

2.3 优化分页查询

使用 LIMIT offset, size 时，随着 offset 增大，性能会急剧下降。可以采用“延迟关联”或“游标分页”优化：

-- 传统方式（offset 大时慢）
SELECT * FROM posts ORDER BY id LIMIT 100000, 20;

-- 优化后（先取 id，再关联）
SELECT p.* FROM posts p
JOIN (SELECT id FROM posts ORDER BY id LIMIT 100000, 20) tmp ON p.id = tmp.id;

更好的方法是使用“游标分页”，基于上次查询的最后一条记录的 id 进行过滤：

SELECT * FROM posts WHERE id > last_id ORDER BY id LIMIT 20;

2.4 使用 EXPLAIN 分析查询

养成习惯，对复杂查询先用 EXPLAIN 观察 type、key、rows、Extra 等指标，确认是否使用了预期索引，有无文件排序（Using filesort）或临时表（Using temporary）。

2.5 避免在 WHERE 子句中对列使用函数

错误示例：WHERE DATE(published_at) = '2025-01-01' 会使索引失效。
正确做法：WHERE published_at >= '2025-01-01' AND published_at < '2025-01-02'。

2.6 优化全文搜索

对于博客系统的标题和内容搜索，我们已建立全文索引。使用 MATCH() AGAINST() 比 LIKE '%keyword%' 高效得多。
注意全文索引的最小词长（ft_min_word_len）和停用词配置，确保搜索符合预期。

三、表结构优化

3.1 数据类型选择

尽量使用最紧凑的数据类型。例如，posts 表的 views 可以使用 INT UNSIGNED 而不是 BIGINT；状态字段使用 ENUM 而不是 VARCHAR。
对于文本内容，TEXT 足够，但如果预计内容极大（超过 64KB），考虑 MEDIUMTEXT。

3.2 适度反规范化

在博客系统中，可以适当反规范化以减少 JOIN。例如，在 posts 表中增加 author_name 和 category_name 字段，通过触发器或应用逻辑维护。但需权衡更新复杂度和查询性能。
另一种常见做法是使用缓存（如 Redis）存储热点数据，如热门文章列表。

3.3 分区表

如果 posts 表数据量极大（如百万级以上），可以考虑按 published_at 进行范围分区，将不同年份的文章放在不同分区，查询时只扫描特定分区。
例如：PARTITION BY RANGE (YEAR(published_at))。

3.4 归档历史数据

将很久以前的文章、评论移出主表，存入归档表，减小主表体积，提升查询效率。

四、配置优化

4.1 InnoDB 缓冲池

InnoDB 的数据和索引缓存在内存中，适当增大 innodb_buffer_pool_size 可显著提升性能。建议设为物理内存的 70%~80%（如果服务器专用于 MySQL）。

4.2 查询缓存（MySQL 5.7 及以下）

MySQL 8.0 已移除查询缓存，不再有效。如果是 5.7 版本，可考虑开启查询缓存，但需注意碎片化和失效问题。

4.3 临时表大小

对于涉及大量分组排序的查询，适当调大 tmp_table_size 和 max_heap_table_size，减少磁盘临时表的使用。

4.4 连接数

根据并发需求调整 max_connections，避免连接数过少导致拒绝服务，也避免过多占用资源。

五、定期维护

5.1 更新统计信息

ANALYZE TABLE 更新索引统计信息，帮助优化器生成更准确的执行计划。

5.2 碎片整理

随着数据更新删除，表会产生碎片。使用 OPTIMIZE TABLE 重建表和索引，回收空间（InnoDB 会重建表，期间可能锁表，需在低峰期执行）。

5.3 慢查询日志

开启慢查询日志（slow_query_log），设置合适的 long_query_time（如 1 秒），定期分析慢查询并进行优化。

六、实战：针对博客系统的优化清单

优化项	具体操作	预期效果
索引	确认 posts 表已有 (status, published_at) 复合索引；为 comments 表的 post_id 加索引（已建）。	加速文章列表和评论查询。
分页	将文章列表分页改为“游标分页”方式。	避免深分页性能问题。
查询	将文章详情页的标签获取合并为子查询的 GROUP_CONCAT ，减少 N+1 查询。	减少数据库请求次数。
数据类型	检查各字段是否可使用更小类型，如 views 改为 INT UNSIGNED 。	节省存储，提升缓存效率。
归档	定期将一年前的文章归档到历史表。	减小主表体积，提升活跃数据查询性能。
配置	调整 innodb_buffer_pool_size 为内存的 70%。	提升缓存命中率。

总结

性能优化没有银弹，需要根据实际业务场景和数据量不断调整。建议遵循以下原则：

先分析，后优化：使用 EXPLAIN 和慢查询日志定位瓶颈。
从索引和查询入手：这是性价比最高的优化手段。
适度反规范化：在读写平衡中寻找最佳点。
监控与持续改进：随着业务发展，优化方案也需要迭代。

mysql菜鸟教程

20.5 性能优化建议

一、索引优化

1.1 为常用查询条件添加索引

1.2 复合索引的列顺序

1.3 避免冗余索引

1.4 使用覆盖索引

1.5 监控索引使用情况

二、查询优化

2.1 避免 SELECT *

2.2 分解复杂查询

2.3 优化分页查询

2.4 使用 EXPLAIN 分析查询

2.5 避免在 WHERE 子句中对列使用函数

2.6 优化全文搜索

三、表结构优化

3.1 数据类型选择

3.2 适度反规范化

3.3 分区表

3.4 归档历史数据

四、配置优化

4.1 InnoDB 缓冲池

4.2 查询缓存（MySQL 5.7 及以下）

4.3 临时表大小

4.4 连接数

五、定期维护

5.1 更新统计信息

5.2 碎片整理

5.3 慢查询日志

六、实战：针对博客系统的优化清单

总结

发表评论

所有评论

mysql菜鸟教程

20.5 性能优化建议

一、 索引优化

1.1 为常用查询条件添加索引

1.2 复合索引的列顺序

1.3 避免冗余索引

1.4 使用覆盖索引

1.5 监控索引使用情况

二、 查询优化

2.1 避免 SELECT *

2.2 分解复杂查询

2.3 优化分页查询

2.4 使用 EXPLAIN 分析查询

2.5 避免在 WHERE 子句中对列使用函数

2.6 优化全文搜索

三、 表结构优化

3.1 数据类型选择

3.2 适度反规范化

3.3 分区表

3.4 归档历史数据

四、 配置优化

4.1 InnoDB 缓冲池

4.2 查询缓存（MySQL 5.7 及以下）

4.3 临时表大小

4.4 连接数

五、 定期维护

5.1 更新统计信息

5.2 碎片整理

5.3 慢查询日志

六、 实战：针对博客系统的优化清单

总结

发表评论

所有评论

一、索引优化

二、查询优化

三、表结构优化

四、配置优化

五、定期维护

六、实战：针对博客系统的优化清单