小菜鸟

MySQL使用自增主键的原因

发表于 2021-06-04 更新于 2025-08-16 分类于 MySQL 阅读次数： Valine：
本文字数： 1.2k 阅读时长 ≈ 1 分钟

MySQL 选择自增主键的核心原因：基于 B+Tree 索引的性能优化

在 MySQL InnoDB 引擎中，主键不仅是数据的唯一标识，更是聚簇索引（主索引）的核心。自增主键之所以成为默认推荐方案，本质上是因为它完美适配了 B+Tree 索引的有序存储特性，能最大限度减少插入操作的性能损耗。

B+Tree 索引的存储特性与自增主键的契合度

InnoDB 的聚簇索引以 B+Tree 结构存储，叶子节点直接存放完整的数据记录，且同一叶子节点内的记录必须按主键顺序排列（叶子节点大小通常为 16KB，对应一个磁盘页）。

当使用自增主键时，新记录的插入呈现天然有序性：

每次插入的新记录主键值递增，会直接追加到当前叶子节点的末尾；
当当前叶子节点写满（达到 InnoDB 默认的 15/16 装载因子，预留少量空间供后续修改），会自动创建新的叶子节点，形成 “顺序扩展”；
整个过程无需调整已有数据的位置，插入效率极高，接近 “append” 操作。

这种特性与 B+Tree 的设计逻辑完全匹配，避免了额外的性能开销。

非自增主键的插入缺陷：无序性导致的性能损耗

若使用非自增主键（如 UUID、随机字符串、业务字段等），由于主键值随机且无序，新记录需插入到现有索引页的随机位置，会引发一系列连锁问题：

阅读全文 »

kafka事务

发表于 2021-06-04 更新于 2025-08-12 分类于 kafka 阅读次数： Valine：
本文字数： 3.8k 阅读时长 ≈ 3 分钟

Kafka 事务详解：跨分区的原子性消息处理

Kafka 事务机制旨在实现跨分区、跨会话的原子性消息处理，确保一组消息要么全部成功提交，要么全部失败回滚，即使中间发生生产者或 Broker 故障也能保证数据一致性。这一机制主要面向需要 Exactly-Once 语义（精确一次处理）的场景，如金融交易、数据同步等。本文将详细解析 Kafka 事务的核心概念、实现机制及生产者 / 消费者的事务处理流程。

事务核心概念

核心目标

Kafka 事务解决的核心问题是：确保生产者在多个分区中发送的消息具有原子性（要么全成功，要么全失败），同时保证消费者能正确处理这些事务消息（避免读取部分提交的消息）。

关键组件与术语

术语	定义	作用
Transaction ID（TxnID）	全局唯一的生产者标识，由用户指定	绑定生产者实例，确保生产者重启后能恢复未完成的事务，避免重复处理。
Producer ID（PID）	Kafka 为生产者分配的临时唯一标识	每个生产者启动时由 Transaction Coordinator 分配，用于跟踪生产者的事务状态（PID 会随生产者重启变化，需与 TxnID 绑定以恢复事务）。
Transaction Coordinator	事务协调器，运行在 Broker 上的组件	管理事务全生命周期：分配 TxnID、跟踪事务状态（开始 / 提交 / 中止）、存储事务元数据。
__transaction_state	内部主题，存储事务元数据	记录所有事务的状态（如活跃事务、提交 / 中止标记），确保事务状态可恢复（类似数据库的事务日志）。

事务语义

Kafka 事务支持两种核心语义：

原子写入：生产者向多个分区发送的消息，要么全部可见（提交），要么全部不可见（中止）。
事务恢复：生产者故障重启后，可通过 TxnID 恢复未完成的事务，避免重复提交或丢失。

Transaction Coordinator：事务的 “管理者”

Transaction Coordinator（事务协调器）是 Kafka 事务的核心组件，负责协调生产者的事务流程、管理事务状态，并与 Broker 协作完成事务提交。

主要职责

分配与绑定 TxnID：为生产者分配唯一 TxnID，并绑定其 PID（确保生产者重启后 TxnID 不变，PID 可重新关联）。
跟踪事务状态：记录事务的生命周期（BEGIN→COMMIT/ABORT），存储在内部主题 __transaction_state 中。
协调事务提交：在事务提交阶段，向所有涉及的分区发送 “事务标记”（TxnMarker），通知 Broker 确认事务完成。
故障恢复：当 Coordinator 或 Broker 故障时，通过 __transaction_state 恢复事务状态，确保事务可继续处理。

阅读全文 »

MySQL数据类型

发表于 2021-06-03 更新于 2025-08-15 分类于 MySQL 阅读次数： Valine：
本文字数： 3.1k 阅读时长 ≈ 3 分钟

MySQL 数据类型全解析：选择合适类型优化存储与性能

MySQL 提供了丰富的数据类型，涵盖数值、日期时间、字符串等类别。选择合适的数据类型不仅能节省存储空间，还能提升查询性能和数据准确性。本文详细解析各类数据类型的特性、适用场景及最佳实践。

数值类型：整数与浮点数的精确选择

数值类型用于存储数字，按精度和范围可分为整数类型、浮点类型和定点类型。

整数类型（精确值）

整数类型适用于存储没有小数部分的数字，支持有符号（默认）和无符号（UNSIGNED）两种模式。

类型	字节数	有符号范围	无符号范围（`UNSIGNED`）	适用场景
`TINYINT`	1	`-128 ~ 127`	`0 ~ 255`	状态标识（如 0/1 表示开关）
`SMALLINT`	2	`-32768 ~ 32767`	`0 ~ 65535`	小范围计数（如订单状态码）
`MEDIUMINT`	3	`-8388608 ~ 8388607`	`0 ~ 16777215`	中等范围计数（如用户等级）
`INT`/`INTEGER`	4	`-2147483648 ~ 2147483647`	`0 ~ 4294967295`	常规计数（如 ID、数量）
`BIGINT`	8	`-9223372036854775808 ~ 9223372036854775807`	`0 ~ 18446744073709551615`	极大范围计数（如雪花 ID）

示例：

-- 存储用户年龄（0~120，用 UNSIGNED TINYINT 更节省空间）
CREATE TABLE users (
  age TINYINT UNSIGNED  -- 范围 0~255，足够存储年龄
);

浮点类型（近似值）

浮点类型用于存储带小数的数字，但精度有限（存在舍入误差），适用于无需精确计算的场景。

阅读全文 »

MySQL权限

发表于 2021-06-03 更新于 2025-08-15 分类于 MySQL 阅读次数： Valine：
本文字数： 4k 阅读时长 ≈ 4 分钟

MySQL 权限管理详解：从系统表到用户授权

MySQL 的权限管理是保障数据库安全的核心机制，通过精细化控制用户对数据库的操作权限，可防止未授权访问和误操作。MySQL 的权限信息存储在 mysql 系统库的 5 个专用表中，权限控制粒度从全局到列级不等。本文详细解析权限存储机制、授权方法及生效规则。

权限存储的系统表

MySQL 的权限信息按粒度分层存储在以下 5 个系统表中，权限范围从大到小依次为：全局 → 数据库 → 表 → 列 → 存储过程 / 函数。

1. `user` 表：全局级别权限

作用：存储用户账户信息及全局权限（对所有数据库生效）。
核心字段：
- Host：允许访问的主机（支持 % 通配符，如 192.168.1.% 表示 192.168.1 网段）。
- User：用户名（与 Host 共同构成唯一用户标识 User@Host）。
- 权限字段：如 Select_priv（查询权限）、Insert_priv（插入权限）等，值为 Y 表示拥有该权限。
特点：若用户在 user 表中有某权限，则对所有数据库默认拥有该权限（除非被更细粒度的权限限制）。

2. `db` 表：数据库级别权限

作用：控制用户对特定数据库的操作权限（仅对指定数据库生效）。
核心字段：
- Db：数据库名（指定权限生效的数据库）。
- Host、User：与 user 表一致，标识用户及来源主机。
- 权限字段：与 user 表类似（如 Select_priv、Create_priv 等），但仅作用于 Db 字段指定的数据库。
特点：数据库级权限优先级高于全局权限（若用户对某数据库有更严格的权限限制，以 db 表为准）。

3. `tables_priv` 表：表级别权限

阅读全文 »

CPU飙升

发表于 2021-06-03 更新于 2025-08-07 分类于线上问题阅读次数： Valine：
本文字数： 2.5k 阅读时长 ≈ 2 分钟

Java 应用 CPU 飙升问题排查全指南

CPU 飙升是 Java 应用常见的性能问题，可能导致应用响应缓慢、超时甚至崩溃。本文将详细介绍 CPU 飙升的常见原因及系统化的排查步骤，帮助开发者快速定位并解决问题。

CPU 飙升的常见原因

Java 应用 CPU 使用率过高通常与以下因素相关：

频繁的垃圾回收（GC）
- 内存分配不合理（如堆内存过小）导致 GC 频繁触发；
- 内存泄漏导致老年代占满，引发 Full GC 循环。
无限循环或低效循环
- 代码中存在 while(true) 等未正确退出的循环；
- 循环内执行耗时操作（如复杂计算、大量字符串拼接）。
线程竞争与阻塞
- 大量线程争夺同一把锁，导致上下文切换频繁；
- 死锁或活锁导致线程持续空转。
频繁的 IO 操作
- 同步 IO 操作未设置超时，导致线程长期阻塞在 IO 等待；
- 大量无效的网络请求或磁盘读写。
第三方库或框架问题
- 某些组件在特定场景下存在性能缺陷（如低效的序列化 / 反序列化）。

CPU 飙升排查步骤

步骤 1：定位 CPU 占用最高的进程

使用 top 命令查看系统中 CPU 使用率最高的进程，记录其 PID（进程 ID）：

阅读全文 »

MySQL 选择自增主键的核心原因：基于 B+Tree 索引的性能优化

B+Tree 索引的存储特性与自增主键的契合度

非自增主键的插入缺陷：无序性导致的性能损耗

Kafka 事务详解：跨分区的原子性消息处理

事务核心概念

核心目标

关键组件与术语

事务语义

Transaction Coordinator：事务的 “管理者”

主要职责

MySQL 数据类型全解析：选择合适类型优化存储与性能

数值类型：整数与浮点数的精确选择

整数类型（精确值）

浮点类型（近似值）

MySQL 权限管理详解：从系统表到用户授权

权限存储的系统表

1. user 表：全局级别权限

2. db 表：数据库级别权限

3. tables_priv 表：表级别权限

Java 应用 CPU 飙升问题排查全指南

CPU 飙升的常见原因

CPU 飙升排查步骤

步骤 1：定位 CPU 占用最高的进程

1. `user` 表：全局级别权限

2. `db` 表：数据库级别权限

3. `tables_priv` 表：表级别权限