小菜鸟

tomcat之server配置文件

发表于 2020-09-14 更新于 2025-08-01 分类于 tomcat 阅读次数： Valine：
本文字数： 5k 阅读时长 ≈ 5 分钟

Tomcat `server.xml` 配置文件详解

server.xml 是 Tomcat 最核心的配置文件，定义了服务器的整体结构、组件关系及运行参数。本文将逐节点解析其配置细节，帮助理解 Tomcat 的工作机制及优化配置。

配置文件整体结构

Tomcat 的 server.xml 采用 XML 格式，核心节点层级关系如下：

<Server>                 <!-- 整个 Tomcat 服务器 -->
  <Listener />           <!-- 生命周期监听器 -->
  <GlobalNamingResources /> <!-- 全局命名资源 -->
  <Service>              <!-- 服务（连接器 + 引擎） -->
    <Executor />         <!-- 共享线程池 -->
    <Connector />        <!-- 连接器（接收请求） -->
    <Engine>             <!-- 引擎（处理请求） -->
      <Host>             <!-- 虚拟主机 -->
        <Context />      <!-- Web 应用上下文 -->
      </Host>
    </Engine>
  </Service>
</Server>

每个节点代表 Tomcat 的一个核心组件，负责特定功能。

核心节点解析

`<Server>`：整个 Tomcat 实例的根节点

<Server> 是配置文件的根元素，代表整个 Tomcat 服务器，负责启动和管理所有组件。

主要属性

port：服务器监听的关闭端口（默认 8005），用于接收关闭命令。
shutdown：关闭服务器的指令字符串（默认 SHUTDOWN）。

示例：通过 telnet 发送关闭命令：
1
2
telnet 127.0.0.1 8005
> SHUTDOWN # 输入后 Tomcat 会关闭

子节点

<Listener>：生命周期监听器，用于监控服务器启动、停止等事件（如 VersionLoggerListener 记录版本信息）。
<GlobalNamingResources>：全局 JNDI 资源配置（如数据源），供所有应用共享。
<Service>：一个或多个服务组件，每个服务包含连接器和引擎。

`<Service>`：连接器与引擎的组合

<Service> 将多个连接器（Connector）与一个引擎（Engine）绑定，形成一个独立的服务单元。

属性

name：服务名称（默认 Catalina），用于标识服务。

子节点

<Executor>：配置共享线程池，供多个连接器复用（优化性能）。
<Connector>：连接器，负责接收客户端请求。
<Engine>：引擎，负责处理连接器接收的请求。

`<Executor>`：共享线程池（性能优化关键）

<Executor> 定义全局线程池，多个连接器可共享该线程池，避免重复创建线程，提升性能。默认不配置，需手动添加。

配置示例

阅读全文 »

tomcat之JSP引擎

发表于 2020-09-14 更新于 2025-08-01 分类于 tomcat 阅读次数： Valine：
本文字数： 4.5k 阅读时长 ≈ 4 分钟

Tomcat JSP 引擎：Jasper 工作机制详解

在 Java Web 开发中，JSP（JavaServer Pages）是一种动态网页技术，它允许在 HTML 中嵌入 Java 代码。Tomcat 作为主流的 Servlet 容器，内置了专门的 JSP 引擎 ——Jasper，负责将 JSP 文件编译为 Servlet 类并执行。本文将详细解析 Jasper 的工作原理，包括运行时编译和预编译两种模式。

Jasper 引擎概述

Jasper 是 Tomcat 处理 JSP 的核心组件，其主要功能包括：

JSP 解析：将 JSP 文件中的 HTML 标签、JSP 指令（如 <%@ page %>）、脚本片段（如 <% ... %>）等解析为 Java 代码。
编译：将解析后的 Java 代码编译为 Class 文件（Servlet 实现类）。
执行：通过生成的 Servlet 类处理 HTTP 请求，生成动态响应。

Jasper 集成在 Tomcat 中，无需额外配置即可工作。其入口是 Tomcat 内置的 JspServlet，该 Servlet 在 conf/web.xml 中默认配置，用于处理所有以 .jsp 或 .jspx 结尾的请求。

运行时编译：首次请求触发

Tomcat 并不会在 Web 应用启动时自动编译所有 JSP 文件，而是采用惰性编译策略 —— 仅在客户端第一次请求某个 JSP 页面时才触发编译。这一过程由 JspServlet 主导，具体流程如下：

1. JspServlet 配置

Tomcat 的 conf/web.xml 中默认配置了 JspServlet，负责拦截 JSP 请求：

<servlet>
    <servlet-name>jsp</servlet-name>
    <servlet-class>org.apache.jasper.servlet.JspServlet</servlet-class>
    <init-param>
        <param-name>fork</param-name>
        <param-value>false</param-value> <!-- 是否使用独立进程编译 -->
    </init-param>
    <init-param>
        <param-name>xpoweredBy</param-name>
        <param-value>false</param-value>
    </init-param>
    <load-on-startup>3</load-on-startup> <!-- 启动时加载，优先级 3 -->
</servlet>

<servlet-mapping>
    <servlet-name>jsp</servlet-name>
    <url-pattern>*.jsp</url-pattern>
    <url-pattern>*.jspx</url-pattern>
</servlet-mapping>

阅读全文 »

GFS

发表于 2020-09-14 更新于 2025-07-23 分类于 hadoop 阅读次数： Valine：
本文字数： 3.8k 阅读时长 ≈ 3 分钟

Google GFS 深度解析：分布式文件系统的开山之作

Google 文件系统（GFS）作为分布式存储领域的里程碑技术，其设计理念深刻影响了 HDFS、TFS 等后续系统。GFS 专为大规模数据处理场景优化，通过创新的架构设计和租约机制，解决了海量数据存储的可靠性、扩展性和性能难题。本文将从系统架构、核心组件、租约机制及技术特点等方面全面解析 GFS，揭示其成为分布式文件系统标杆的底层逻辑。

GFS 核心定位与设计目标

GFS 是 Google 为内部大规模数据处理场景（如搜索索引、日志分析、机器学习训练）设计的分布式文件系统，核心目标包括：

海量存储：支持 PB 级数据存储，单集群可容纳数万台服务器；
高容错性：基于普通硬件构建，通过多副本和故障自动恢复确保数据不丢失；
高吞吐量：优化批量读写性能，满足大数据处理场景的高 IO 需求；
简单实用：针对 Google 内部应用特点定制，放弃部分 POSIX 接口以换取更高效率。

GFS 系统架构：三角色的协同设计

GFS 采用 主从架构（Master-Slave），由三种核心角色构成：主控服务器（GFS Master）、数据块服务器（ChunkServer） 和 客户端（Client）。三者分工明确，通过协同工作实现分布式文件存储与访问。

graph TD
    A[客户端 Client
应用程序接口] -->|1. 获取元数据| B[主控服务器 Master
元数据管理]
    A -->|2. 直接读写数据| C[数据块服务器 ChunkServer1] & D[ChunkServer2] & E[ChunkServer3]
    B -->|3. 心跳/元数据同步| C & D & E
    C & D & E -->|存储数据| F[本地磁盘
Chunk 副本]
    note[核心思想 Master 管元数据,ChunkServer 存数据,Client 直接访问数据节点]

核心角色详解

1. 主控服务器（GFS Master）

Master 是 GFS 的 “大脑”，负责全局元数据管理和系统协调，但不直接参与数据读写，以避免成为性能瓶颈。

阅读全文 »

未命名

发表于 2020-09-08 更新于 2025-08-12 分类于 kafka 阅读次数： Valine：
本文字数： 3.3k 阅读时长 ≈ 3 分钟

Kafka 控制器（Controller）详解：集群的 “大脑”

Kafka 控制器是集群的核心协调者，负责管理分区状态、副本同步、代理（Broker）上下线、主题创建 / 删除等关键操作。它通过 ZooKeeper 实现集群元数据的管理与同步，确保整个 Kafka 集群的一致性和可用性。本文将深入解析控制器的核心功能、初始化过程、选举机制及关键管理流程。

控制器的核心角色

控制器是 Kafka 集群中唯一的 Leader 协调节点，与分区的 Leader 副本（负责单分区读写）不同，它统筹整个集群的全局状态。其核心职责包括：

分区与副本管理：
- 监控分区状态（如 Online/Offline），在 Leader 故障时触发重新选举。
- 管理副本同步（ISR 列表维护），确保数据可靠性。
代理 lifecycle 管理：
- 处理 Broker 上线 / 下线事件，更新集群元数据。
- 在 Broker 故障时触发故障转移（Failover），重新分配分区所有权。
主题操作协调：
- 处理主题创建、删除、分区扩展等请求。
- 确保主题配置在集群中同步。
元数据同步：
- 向所有 Broker 广播元数据更新（如分区 Leader 变更、新 Broker 加入）。

核心概念与术语

理解控制器需先掌握以下关键概念：

术语	定义
controller_epoch	控制器世代号，记录控制器变更次数（初始为 0，每次选举新控制器加 1），用于区分过期请求。
leader_epoch	分区 Leader 世代号，记录单分区 Leader 变更次数，确保请求顺序性。
AR（Assigned Replicas）	分区的所有副本集合（包含 Leader 和 Follower）。
ISR（In-Sync Replicas）	与 Leader 保持同步的副本集合，只有 ISR 中的副本可被选为新 Leader。
优先副本（Preferred Replica）	AR 列表中的第一个副本，理想情况下应作为分区 Leader，用于负载均衡。
状态机	控制器通过 `PartitionStateMachine` 和 `ReplicaStateMachine` 管理分区和副本的状态变迁。

控制器初始化过程

每个 Broker 启动时都会实例化 KafkaController 对象，但最终只有一个会成为 Leader 控制器。初始化步骤如下：

阅读全文 »

tomcat之web请求处理

发表于 2020-09-06 更新于 2025-08-01 分类于 tomcat 阅读次数： Valine：
本文字数： 3.6k 阅读时长 ≈ 3 分钟

Tomcat Web 请求处理流程详解

Tomcat 作为 Servlet 容器，其核心功能是接收并处理客户端的 HTTP 请求。从请求进入服务器到响应返回客户端，涉及多个组件的协同工作。本文将详细解析 Tomcat 处理 Web 请求的完整流程，重点关注核心组件的交互逻辑。

请求处理总体流程

Tomcat 处理请求的入口是 org.apache.catalina.connector.CoyoteAdapter.service() 方法，该方法串联起从协议解析到 Servlet 执行的全流程。整体可分为以下步骤：

请求接收与协议适配
客户端请求通过 Connector 进入 Tomcat，Connector 根据协议类型（如 HTTP/1.1、AJP）创建对应的 org.apache.coyote.Request（Coyote 请求对象）和 org.apache.coyote.Response（Coyote 响应对象），并转换为 Tomcat 内部的 org.apache.catalina.connector.Request 和 org.apache.catalina.connector.Response。
容器层级匹配
- Engine：根据请求的主机名（如 localhost）匹配对应的虚拟主机（Host）。
- Host：根据请求路径（如 /myapp）匹配对应的 Web 应用（Context）。
- Context：通过 URL 映射找到对应的 Servlet（由 StandardWrapper 管理）。
请求处理与响应生成
- 执行认证、授权等预处理。
- 调用目标 Servlet 的 service() 方法处理请求。
- 将处理结果通过 Response 对象封装，反向传递给客户端。
资源清理
- 同步请求：关闭输入流和输出流。
- 异步请求：触发 ReadListener 事件，处理剩余数据。

HTTP Connector 请求处理细节

Connector 是请求进入 Tomcat 的第一道关卡，负责底层网络通信和协议解析。以 HTTP 协议的 NIO 连接器为例，其处理流程如下：

1. 连接器启动与端口监听

当 Connector 启动时，会初始化并启动 Endpoint（如 NioEndpoint），主要包含以下组件：

阅读全文 »

Tomcat server.xml 配置文件详解

配置文件整体结构

核心节点解析

<Server>：整个 Tomcat 实例的根节点

主要属性

子节点

<Service>：连接器与引擎的组合

属性

子节点

<Executor>：共享线程池（性能优化关键）

配置示例

Tomcat JSP 引擎：Jasper 工作机制详解

Jasper 引擎概述

运行时编译：首次请求触发

1. JspServlet 配置

Google GFS 深度解析：分布式文件系统的开山之作

GFS 核心定位与设计目标

GFS 系统架构：三角色的协同设计

核心角色详解

1. 主控服务器（GFS Master）

Kafka 控制器（Controller）详解：集群的 “大脑”

控制器的核心角色

核心概念与术语

控制器初始化过程

Tomcat Web 请求处理流程详解

请求处理总体流程

HTTP Connector 请求处理细节

1. 连接器启动与端口监听

Tomcat `server.xml` 配置文件详解

`<Server>`：整个 Tomcat 实例的根节点

`<Service>`：连接器与引擎的组合

`<Executor>`：共享线程池（性能优化关键）