小菜鸟

MySQL系统调优

发表于 2021-06-24 更新于 2025-08-16 分类于 MySQL 阅读次数： Valine：
本文字数： 3k 阅读时长 ≈ 3 分钟

MySQL 系统调优：基准测试工具与实践指南

MySQL 系统调优的前提是精准评估当前性能瓶颈，而基准测试（Benchmark）是定位瓶颈的核心手段。通过模拟真实负载，可量化数据库在不同配置下的性能表现，为调优提供数据支撑。本文介绍三款主流的 MySQL 基准测试工具及其使用场景。

sysbench：多场景通用性能测试工具

sysbench 是一款模块化、跨平台的多线程性能测试工具，支持 CPU、内存、文件 IO、数据库等多种场景，尤其适合 MySQL 的读写性能、并发能力测试。

核心特点

支持多引擎：兼容 MySQL、PostgreSQL 等数据库。
场景丰富：包含 OLTP 读写、只读、删除、插入等多种测试模式。
可定制参数：支持调整并发数、测试时长、数据量等。

安装（以 Linux 为例）

# 源码安装
git clone https://github.com/akopytov/sysbench.git
cd sysbench
./autogen.sh
./configure --with-mysql --with-mysql-includes=/usr/include/mysql --with-mysql-libs=/usr/lib64/mysql
make && make install

# 验证安装
sysbench --version  # 输出版本号即安装成功

常用测试流程

以 MySQL OLTP 读写测试为例：

（1）准备测试数据

阅读全文 »

MySQL索引结构

发表于 2021-06-22 更新于 2025-08-16 分类于 MySQL 阅读次数： Valine：
本文字数： 2.1k 阅读时长 ≈ 2 分钟

MySQL 索引结构详解

MySQL 索引的核心设计目标是减少磁盘 IO 次数—— 因为磁盘 IO 是查询性能的主要瓶颈。通过合理的索引结构（如树结构），可将磁盘 IO 次数控制在 O (logN) 级别，显著提升查询效率。以下从索引设计逻辑、结构类型、核心特性及主键设计原则展开说明。

不同存储引擎的索引实现差异

MySQL 的索引实现与存储引擎强相关，不同引擎对索引技术的支持不同：

存储引擎	主要索引类型	说明
InnoDB	B+Tree 索引	5.6 后支持 FullText 全文索引，5.7 后通过 ngram 插件支持中文全文索引
MyISAM	FullText 全文索引、B+Tree 索引	支持 R-Tree 空间索引（但 MySQL 对 GIS 支持有限）
Memory	Hash 索引	数据存于内存，索引基于 Hash 表实现

索引结构核心解析

为什么不使用二叉树或红黑树？

索引设计需避免高深度（减少磁盘 IO），而二叉树和红黑树存在明显缺陷：

二叉树：可能退化为链表（如有序插入时），导致磁盘 IO 次数变为 O (N)，完全失去索引价值。
红黑树：虽能保证 O (logN) 的查询复杂度，但仅支持 2 个子节点，数据量大时树深度过高（如 100 万条数据需约 20 层），磁盘 IO 次数过多。

B 树（多路搜索树）

为减少树深度，B 树采用 “多路分支” 设计（允许一个节点有多个子节点），其结构定义如下：

阅读全文 »

内存溢出和内存泄漏

发表于 2021-06-22 更新于 2025-08-07 分类于 JVM 阅读次数： Valine：
本文字数： 4.3k 阅读时长 ≈ 4 分钟

内存溢出与内存泄漏：JVM 内存问题的根源与解决方案

在 Java 程序运行中，内存管理是核心挑战之一。内存溢出（OOM） 和内存泄漏是最常见的内存问题，两者紧密相关却又本质不同。内存泄漏会逐渐消耗内存资源，最终可能导致内存溢出，而内存溢出也可能由不合理的内存配置直接引发。本文将深入解析这两种问题的成因、常见场景及解决方案，帮助开发者规避和排查内存相关故障。

内存溢出（OutOfMemoryError，OOM）

内存溢出是指 JVM 无法为新对象分配内存，且垃圾收集器也无法释放足够空间的情况，最终抛出 OutOfMemoryError 异常。

产生原因

内存溢出的核心原因可归结为 “内存供需失衡”：

内存分配不足：JVM 堆内存设置过小（如 -Xmx 参数值远小于应用实际需求），无法容纳程序运行时产生的对象。
对象增长失控：代码中创建大量大对象（如巨型数组、超大集合），或对象生命周期过长（如长期缓存未清理），导致内存占用持续增长，超过堆内存上限。

常见 OOM 类型及场景

JVM 不同内存区域的溢出表现不同，常见类型包括：

OOM 类型	对应内存区域	典型场景
`Java heap space`	堆内存	创建大量对象且未及时回收（如无限循环创建对象）。
`PermGen space`/`Metaspace`	方法区（元空间）	加载过多类（如动态生成大量类、依赖包冲突）。
`StackOverflowError`	虚拟机栈	方法递归调用过深（栈帧耗尽）。
`Native memory allocation`	本地内存（如 DirectMemory）	NIO 直接内存使用过量（`ByteBuffer.allocateDirect`）。

解决方案

调整 JVM 参数：根据应用需求增大堆内存（-Xms 初始堆、-Xmx 最大堆），如 -Xms2G -Xmx4G。
优化对象创建：减少大对象生成（如拆分巨型集合），避免不必要的对象持有（如及时设为 null）。
排查内存泄漏：若 OOM 由内存泄漏引发，需先定位泄漏点（见下文 “内存泄漏排查”）。

内存泄漏（Memory Leak）

内存泄漏是指不再被程序使用的对象无法被 GC 回收，导致其占用的内存长期无法释放，逐渐耗尽内存资源。内存泄漏是 OOM 的常见诱因，但本身不会直接抛出异常，而是通过程序性能下降（如 GC 频繁）最终表现为 OOM。

阅读全文 »

MySQL查询缓存

发表于 2021-06-18 更新于 2025-08-16 分类于 MySQL 阅读次数： Valine：
本文字数： 2k 阅读时长 ≈ 2 分钟

MySQL 查询缓存：机制、优缺点与最佳实践

MySQL 的查询缓存（Query Cache）是一项旨在通过缓存 SELECT 语句的结果集来提升查询性能的机制。然而，它的适用场景有限，且在 MySQL 8.0 中已被移除。以下详细解析其工作原理、失效机制及使用建议。

查询缓存的工作原理

查询缓存的核心逻辑是缓存 SELECT 语句的结果集，当相同查询再次执行时直接返回缓存结果，跳过 SQL 解析、执行计划生成和实际执行步骤。

缓存触发流程：
- 执行 SELECT 语句时，MySQL 首先对 SQL 进行大小写敏感的哈希计算，生成缓存键。
- 检查缓存中是否存在该键对应的结果集：
  - 若命中（缓存有效），则验证用户权限后直接返回结果。
  - 若未命中，则执行完整查询流程（解析、优化、执行），并将结果存入缓存。
缓存存储形式：
- 以键值对形式存储，键为 SQL 语句的哈希值，值为查询结果集。
- 缓存空间由 query_cache_size 控制，默认分配一块连续内存，按固定大小的块（query_cache_min_res_unit）分配给结果集。

查询缓存的失效机制

查询缓存的最大局限在于极易失效，任何与缓存相关的表发生变更时，关联的所有缓存都会被清空。具体触发条件包括：

阅读全文 »

MySQL系统配置

发表于 2021-06-18 更新于 2025-08-16 分类于 MySQL 阅读次数： Valine：
本文字数： 3.4k 阅读时长 ≈ 3 分钟

MySQL 系统配置详解

MySQL 的系统配置直接影响数据库性能、稳定性和安全性。以下从内存、线程、IO、主从复制、网络连接等多个维度，详细解析核心配置参数的作用、调整依据及最佳实践。

内存相关配置

内存配置是 MySQL 性能优化的核心，直接影响数据读写效率。以下参数多为按线程分配（实际占用内存 = 参数值 × 线程数），需避免过大导致内存耗尽。

排序与连接缓冲区

sort_buffer_size
- 作用：每个线程执行排序操作（如ORDER BY）时使用的缓冲区大小，当索引无法满足排序需求时触发（执行计划中显示using filesort）。
- 特点：排序时会直接分配全部参数值的内存，而非按需分配。
- 调整依据：通过show global status like 'sort%'查看排序状态：
  - sort_merge_passes：排序需写入临时文件的次数（值越高，说明内存不足，需增大参数）。
  - sort_rows：总排序行数。
- 注意：高并发场景下不可过大，建议默认值（2M）基础上根据排序需求微调。
join_buffer_size
- 作用：线程执行表连接（JOIN）时，当索引无法满足连接条件时使用的缓冲区（执行计划中显示using join buffer）。
- 调整依据：通过select_scan（全表扫描连接数）和select_full_range_join（范围搜索连接数）判断，若值过高需增大参数。

读写缓冲区

read_buffer_size
- 作用：线程进行全表顺序扫描时，用于暂存读取的数据块（按存储顺序读取），减少磁盘 IO。
- 要求：必须为 4K 的倍数，默认值 8K，顺序扫描频繁时可适当增大（如 16K-64K）。
read_rnd_buffer_size
- 作用：线程进行随机读或排序查询时，暂存数据以避免重复磁盘搜索（如排序后按随机顺序读取行）。
- 调整依据：排序场景多且数据量大时，可适当调高（默认 256K）。

阅读全文 »