小菜鸟

kafka之网络通信

发表于 2020-09-22 更新于 2025-08-12 分类于 kafka 阅读次数： Valine：
本文字数： 5.8k 阅读时长 ≈ 5 分钟

Kafka 网络通信机制详解：从连接到请求处理的全流程

Kafka 的高性能很大程度上依赖于其高效的网络通信模型。Kafka 基于 Java NIO 实现了一套分层的线程模型，通过 SocketServer 组件协调连接接收、请求处理和响应发送，支撑了高并发、低延迟的消息传输。本文将深入解析 Kafka 网络通信的核心组件（Acceptor、Processor、RequestChannel、KafkaRequestHandler）及其协作流程。

网络通信模型总览

Kafka 的网络通信采用 “分层分离” 的设计思想，将连接管理、IO 操作和业务处理解耦，核心线程模型分为三层：

Acceptor 线程：负责接收客户端新连接，通过轮询策略分配给 Processor。
Processor 线程：处理连接的读写事件，将请求放入缓冲队列，并负责发送响应。
KafkaRequestHandler 线程：从缓冲队列中获取请求，通过业务逻辑处理后生成响应。

三者通过 RequestChannel 实现通信，形成 “接收→缓冲→处理→响应” 的完整流程。这种设计充分利用了 NIO 的非阻塞特性，避免了传统阻塞 IO 的性能瓶颈，支持高并发请求处理。

核心组件详解

Acceptor：连接接收者

Acceptor 是 Kafka 网络通信的 “入口”，负责监听客户端的新连接请求，其核心职责是接收连接并分发到 Processor，实现负载均衡。

工作原理：

单线程监听：Acceptor 是一个独立线程，通过 ServerSocketChannel 监听指定端口（如 9092），注册 SelectionKey.OP_ACCEPT 事件（接收连接事件）。
轮询分配连接：当新连接到来时，Acceptor 接收连接（SocketChannel），并通过轮询策略将其分配给某个 Processor（避免单个 Processor 负载过高）。
无业务处理：Acceptor 仅负责连接分发，不参与请求读写，最大限度减少自身开销。

核心代码与逻辑：

阅读全文 »

tomcat之web配置文件

发表于 2020-09-21 更新于 2025-08-01 分类于 tomcat 阅读次数： Valine：
本文字数： 8.5k 阅读时长 ≈ 8 分钟

Web 应用部署核心：`web.xml` 配置文件详解

web.xml 是 Java Web 应用的核心部署描述文件，用于定义应用的初始化参数、Servlet 映射、过滤器、安全约束等配置。它分为两个层级：Tomcat 全局默认配置（conf/web.xml）和应用自定义配置（WEB-INF/web.xml），后者会覆盖前者的同名配置。本文将系统解析 web.xml 的核心配置项及用法。

配置文件结构概览

web.xml 的配置项按功能可分为以下类别，本文将逐一详解：

ServletContext 初始化参数
会话配置（Session）
Servlet 声明与映射
生命周期监听器（Listener）
过滤器（Filter）定义与映射
MIME 类型映射
欢迎文件列表
错误页面配置
本地化与编码映射
安全配置
JNDI 资源配置

核心配置项详解

1. ServletContext 初始化参数

通过 <context-param> 定义全局参数，所有 Servlet 和过滤器可通过 ServletContext.getInitParameter() 获取。适用于存储应用级常量（如版本号、配置路径）。

配置示例：

<context-param>
  <param-name>app.version</param-name>
  <param-value>1.0.0</param-value>
</context-param>
<context-param>
  <param-name>api.endpoint</param-name>
  <param-value>https://api.example.com</param-value>
</context-param>

获取方式：

1 2	// 在 Servlet 中 String version = getServletContext().getInitParameter("app.version");

2. 会话配置（`<session-config>`）

用于配置 HTTP 会话的全局属性，包括超时时间、Cookie 策略、会话追踪模式等。

配置示例：

阅读全文 »

tomcat管理

发表于 2020-09-20 更新于 2025-08-01 分类于 tomcat 阅读次数： Valine：
本文字数： 3k 阅读时长 ≈ 3 分钟

Tomcat 管理功能详解：host-manager 与 manager

Tomcat 提供了两套内置的管理工具 ——host-manager 和 manager，分别用于管理虚拟主机和 Web 应用。这些工具通过网页界面或脚本方式操作，简化了 Tomcat 的日常运维工作。本文将详细介绍这两个工具的配置与使用。

访问控制配置：tomcat-users.xml

host-manager 和 manager 均需通过角色权限控制访问，配置文件为 conf/tomcat-users.xml。需在该文件中定义用户及对应的角色，才能登录管理页面。

核心角色说明

工具	角色名称	权限描述
host-manager	`admin-gui`	允许访问 host-manager 的 HTML 页面。
	`admin-script`	允许通过文本接口（如 curl）操作 host-manager。
manager	`manager-gui`	允许访问 manager 的 HTML 页面。
	`manager-script`	允许通过文本接口操作 manager。
	`manager-jmx`	允许通过 JMX 方式管理 Tomcat。
	`manager-status`	仅允许查看服务器状态页面。

配置示例

在 tomcat-users.xml 中添加如下配置（需放在 <tomcat-users> 标签内）：

阅读全文 »

tomcat之过滤器

发表于 2020-09-19 更新于 2025-08-01 分类于 tomcat 阅读次数： Valine：
本文字数： 7.4k 阅读时长 ≈ 7 分钟

Tomcat 内置过滤器详解

Tomcat 提供了多种内置过滤器（Filter），用于处理跨域请求、安全防护、编码设置等常见场景。这些过滤器通过配置 web.xml 即可生效，无需手动编码实现。本文将详细介绍常用的 Tomcat 内置过滤器及其配置方式。

CorsFilter：跨域资源共享过滤器

org.apache.catalina.filters.CorsFilter 实现了 W3C 跨域资源共享（CORS）规范，用于解决前端跨域请求被浏览器拦截的问题。其核心功能是在 HTTP 响应中添加 Access-Control-* 系列头信息，允许指定域的请求访问资源。

配置示例

<filter>
  <filter-name>CorsFilter</filter-name>
  <filter-class>org.apache.catalina.filters.CorsFilter</filter-class>
  <!-- 允许访问的源域名（多个用逗号分隔，* 表示允许所有） -->
  <init-param>
    <param-name>cors.allowed.origins</param-name>
    <param-value>https://example.com,http://localhost:3000</param-value>
  </init-param>
  <!-- 允许的 HTTP 方法 -->
  <init-param>
    <param-name>cors.allowed.methods</param-name>
    <param-value>GET,POST,PUT,DELETE,OPTIONS</param-value>
  </init-param>
  <!-- 允许的请求头 -->
  <init-param>
    <param-name>cors.allowed.headers</param-name>
    <param-value>Content-Type,Authorization,X-Requested-With</param-value>
  </init-param>
  <!-- 允许暴露给客户端的响应头 -->
  <init-param>
    <param-name>cors.exposed.headers</param-name>
    <param-value>Access-Control-Allow-Origin</param-value>
  </init-param>
  <!-- 是否支持带凭据的请求（如 Cookie、Authorization） -->
  <init-param>
    <param-name>cors.support.credentials</param-name>
    <param-value>true</param-value>
  </init-param>
  <!-- 预检请求（OPTIONS）结果的缓存时间（秒） -->
  <init-param>
    <param-name>cors.preflight.maxage</param-name>
    <param-value>3600</param-value> <!-- 1小时 -->
  </init-param>
</filter>
<filter-mapping>
  <filter-name>CorsFilter</filter-name>
  <url-pattern>/*</url-pattern> <!-- 对所有请求生效 -->
</filter-mapping>

关键参数说明

cors.allowed.origins：限制允许跨域的源（避免滥用 *，生产环境建议指定具体域名）。
cors.support.credentials：设为 true 时，cors.allowed.origins 不能为 *，需指定具体域名。
cors.preflight.maxage：减少预检请求次数，提升性能。

CsrfPreventionFilter：跨站请求伪造防护

CsrfPreventionFilter 用于防御跨站请求伪造（CSRF）攻击，原理是：

阅读全文 »

Bigtable

发表于 2020-09-16 更新于 2025-07-23 分类于 hadoop 阅读次数： Valine：
本文字数： 3.7k 阅读时长 ≈ 3 分钟

Google Bigtable深度解析：分布式存储的设计典范

Google Bigtable 作为分布式结构化数据存储的里程碑技术，其设计理念深刻影响了 HBase、Cassandra 等开源分布式数据库。Bigtable 以高扩展性、高可用性和灵活的数据模型为核心，通过双层架构（GFS 持久化 + 分布式索引）支撑 PB 级数据存储与高效访问。本文将从数据模型、系统架构、核心组件及技术特点等方面全面解析 Bigtable，揭示其成为分布式存储标杆的底层逻辑。

Bigtable 核心定位与设计目标

Bigtable 是 Google 为解决大规模结构化数据存储问题开发的分布式数据库，主要目标包括：

高扩展性：支持从 TB 到 PB 级数据的无缝扩展，单表可容纳数万亿行数据；
高可用性：通过多副本、故障自动恢复等机制，确保数据不丢失且服务持续可用；
灵活的数据模型：支持半结构化数据存储，适应多样化的应用场景（如搜索索引、日志存储、用户数据）；
高效读写：优化随机读写性能，支持按行键范围的批量操作。

Bigtable 数据模型：灵活的三维有序映射

Bigtable 的数据模型不同于传统关系型数据库，它是一种 稀疏的、分布式的、持久化的多维有序映射，核心结构可表示为：

1	(row:string, column:string, timestamp:int64) → string

核心概念解析

行（Row）
- 每行通过 Row Key（行键） 唯一标识，按字典序全局排序，这是 Bigtable 高效范围查询的基础；
- 行的读写操作是 原子性的（无论操作涉及多少列），适合存储实体的完整信息（如一个用户的所有属性）。
列（Column）
- 列名由 列族（Column Family） 和 限定符（Qualifier） 组成，格式为 family:qualifier（如 user:name、log:error）；
- 列族是访问控制、存储和压缩的基本单元，需在表创建时预先定义，数量不宜过多（通常不超过数百个）；
- 限定符 无需预先定义，可动态添加，使数据模型具备极强的灵活性（如 user:email、user:phone 可随时扩展）。
时间戳（Timestamp）
- 每个单元格（Cell）可存储多个版本的数据，通过时间戳区分（默认精确到毫秒）；
- 版本管理策略可自定义（如保留最近 N 个版本、保留指定时间范围内的版本），适合存储历史数据（如用户操作日志的变更记录）。
单元格（Cell）
- 由 (Row Key, Column, Timestamp) 唯一标识的最小数据单元，存储的值为字符串（二进制安全，可存储任意数据）。

数据模型示例

以存储用户行为日志为例，Bigtable 的数据结构如下：

Row Key（用户 ID）	Column: `log:login`（登录日志）	Column: `log:action`（操作日志）
`user_001`	`t1: "2023-10-01 08:00"`	`t1: "view_page"`
	`t2: "2023-10-02 09:30"`	`t2: "click_button"`
`user_002`	`t1: "2023-10-01 10:15"`	`t1: "submit_form"`

阅读全文 »

Kafka 网络通信机制详解：从连接到请求处理的全流程

网络通信模型总览

核心组件详解

Acceptor：连接接收者

工作原理：

核心代码与逻辑：

Web 应用部署核心：web.xml 配置文件详解

配置文件结构概览

核心配置项详解

1. ServletContext 初始化参数

2. 会话配置（<session-config>）

Tomcat 管理功能详解：host-manager 与 manager

访问控制配置：tomcat-users.xml

核心角色说明

配置示例

Tomcat 内置过滤器详解

CorsFilter：跨域资源共享过滤器

配置示例

关键参数说明

CsrfPreventionFilter：跨站请求伪造防护

Google Bigtable深度解析：分布式存储的设计典范

Bigtable 核心定位与设计目标

Bigtable 数据模型：灵活的三维有序映射

核心概念解析

数据模型示例

Web 应用部署核心：`web.xml` 配置文件详解

2. 会话配置（`<session-config>`）