小菜鸟

struts2工作流程

发表于 2020-12-21 更新于 2025-08-22 分类于 struts 阅读次数： Valine：
本文字数： 2.3k 阅读时长 ≈ 2 分钟

Struts2 工作流程详解：从请求到响应的完整生命周期

Struts2 作为基于 MVC 模式的 Web 框架，其核心工作流程围绕拦截器链和Action 处理展开，通过分层设计实现请求的接收、处理与响应。以下是对其工作流程的详细拆解：

Struts2 工作流程总览

Struts2 的工作流程可概括为 “拦截器预处理→Action 业务处理→拦截器后处理→结果响应”，具体步骤如下：

客户端发送请求（如http://localhost:8080/struts/userAction/test.action）；
请求被核心过滤器StrutsPrepareAndExecuteFilter拦截；
框架解析请求，匹配struts.xml中对应的 Action 配置；
请求经过拦截器链的预处理（如参数封装、校验、日志记录等）；
创建 Action 实例，调用指定方法（如test()）执行业务逻辑；
Action 返回结果标识（如"success"）；
框架根据结果标识匹配struts.xml中的<result>，生成响应视图；
请求再次经过拦截器链的后处理（如资源清理、事务提交等）；
响应结果返回给客户端。

核心步骤详解

1. 请求拦截与初始化（`StrutsPrepareAndExecuteFilter`）

阅读全文 »

struts2第一个示例

发表于 2020-12-21 更新于 2025-08-22 分类于 struts 阅读次数： Valine：
本文字数： 5.3k 阅读时长 ≈ 5 分钟

Struts2 入门示例：从配置到请求处理的完整流程

Struts2 是一款经典的 Java Web MVC 框架，通过拦截器机制处理请求，将业务逻辑与视图展示分离。本文基于提供的示例代码，详细讲解 Struts2 的第一个应用如何搭建，包括核心依赖、配置文件、Action 类编写及请求访问流程。

环境准备与核心依赖

1. 导入 Struts2 核心包

使用 Maven 构建项目时，需在pom.xml中添加 Struts2 核心依赖：

<dependency>
  <groupId>org.apache.struts</groupId>
  <artifactId>struts2-core</artifactId>
  <version>2.5.22</version> <!-- 版本需根据实际需求选择 -->
</dependency>

该依赖包含 Struts2 的核心类（如拦截器、Action 支持类）和默认配置文件（如struts-default.xml）。

Web.xml 配置：Struts2 拦截器的注册

Struts2 通过拦截器接收所有 Web 请求，因此需在web.xml中配置其核心过滤器StrutsPrepareAndExecuteFilter：

阅读全文 »

验证xml格式

发表于 2020-12-20 更新于 2025-08-03 分类于 xml 阅读次数： Valine：
本文字数： 6.9k 阅读时长 ≈ 6 分钟

XML 格式验证：DTD 与 XML Schema 详解

XML（可扩展标记语言）的灵活性使其广泛应用于数据交换和存储，但这种灵活性也带来了格式混乱的风险。为确保 XML 文档的结构合法性和数据有效性，需要通过语义约束机制进行验证。目前主流的 XML 验证方式有两种：DTD（文档类型定义） 和XML Schema（XML 模式）。

DTD（Document Type Definition，文档类型定义）

DTD 是最早的 XML 语义约束标准，通过定义元素、属性、实体等规则，规范 XML 文档的结构。它语法简单，易于理解，但功能有限。

DTD 的引入方式

DTD 可以嵌入 XML 文档内部，或作为外部文件引用，主要有三种引入方式：

（1）内部 DTD

DTD 规则直接定义在 XML 文档内部，仅对当前文档有效。

语法格式：

<?xml version="1.0"?>
<!DOCTYPE 根元素 [
  <!-- DTD规则定义 -->
]>
<!-- XML文档内容 -->

示例：

<?xml version="1.0"?>
<!DOCTYPE note [
  <!ELEMENT note (to, from, body)>  <!-- note元素必须包含to、from、body子元素，顺序固定 -->
  <!ELEMENT to (#PCDATA)>          <!-- to元素只能包含文本 -->
  <!ELEMENT from (#PCDATA)>        <!-- from元素只能包含文本 -->
  <!ELEMENT body (#PCDATA)>        <!-- body元素只能包含文本 -->
]>
<note>
  <to>ll</to>
  <from>zh</from>
  <body>hello</body>
</note>

（2）外部 DTD

DTD 规则存储在独立的.dtd文件中，可被多个 XML 文档共享，便于维护。

语法格式：

1
2
3

<?xml version="1.0"?>
<!DOCTYPE 根元素 SYSTEM "外部DTD文件路径">
<!-- XML文档内容 -->

阅读全文 »

数据清洗

发表于 2020-12-20 更新于 2025-07-26 分类于 hadoop 阅读次数： Valine：
本文字数： 5.3k 阅读时长 ≈ 5 分钟

MapReduce 数据清洗（ETL）：从杂乱数据到可用信息

数据清洗是大数据处理的前置关键步骤，旨在去除无效、错误或冗余数据，为后续分析提供高质量输入。在 MapReduce 中，数据清洗通常只需通过 Mapper 程序实现，无需 Reduce 阶段，大幅提升效率。本文将详细解析数据清洗的原理、实现方式及实战案例。

数据清洗的核心目标与场景

核心目标

数据清洗（ETL 中的 “Extract-Transform” 环节）的核心是 “去伪存真”，具体包括：

去除无效数据：过滤格式错误、缺失关键字段或不符合业务规则的数据；
标准化格式：将数据转换为统一格式（如日期、数值格式统一）；
去除冗余数据：删除重复记录或无用字段；
数据补全：对缺失的非关键字段进行合理填充（如默认值）。

典型应用场景

日志清洗：从用户行为日志中过滤爬虫数据、格式错误的日志；
数据校验：验证订单数据中的金额、日期等字段合法性；
格式转换：将非结构化文本转换为结构化键值对；
重复数据删除：去除数据库同步过程中产生的重复记录。

MapReduce 数据清洗的实现原理

为何无需 Reduce 阶段？

数据清洗的核心是 过滤和转换，通常无需聚合操作，因此可省略 Reduce 阶段：

Mapper 负责清洗：读取原始数据，按规则过滤或转换后直接输出；
无 Shuffle 开销：不设置 ReduceTask（job.setNumReduceTasks(0)），避免中间数据传输和排序；
效率更高：数据直接从 Mapper 输出到 HDFS，减少磁盘 I/O 和 CPU 消耗。

阅读全文 »

ReduceTask工作机制

发表于 2020-12-19 更新于 2025-07-26 分类于 hadoop 阅读次数： Valine：
本文字数： 3.7k 阅读时长 ≈ 3 分钟

ReduceTask工作机制深度解析：从数据聚合到最终结果

ReduceTask 是 MapReduce 框架中执行 Reduce 阶段计算的核心组件，负责将 Map 阶段输出的中间结果进行 聚合、排序和最终计算。其执行效率直接影响整个作业的完成速度。本文将详细拆解 ReduceTask 的工作流程、核心机制及优化策略。

ReduceTask 工作流程总览

ReduceTask 的执行过程可分为 4 个核心阶段，依次为：Copy（复制）→ Merge（合并）→ Sort（排序）→ Reduce（计算）。整体流程如下：

flowchart TD  
    A[Map 输出文件] -->|Copy 阶段| B[ReduceTask 拉取分区数据]  
    B -->|Merge 阶段| C[内存/磁盘合并数据]  
    C -->|Sort 阶段| D[按 Key 分组排序]  
    D -->|Reduce 阶段| E[执行 reduce 函数输出结果]  
    E --> F[写入 HDFS 最终结果]

ReduceTask 各阶段详细解析

1. Copy 阶段：数据复制与拉取

Copy 阶段是 ReduceTask 的起点，负责从多个 MapTask 所在节点 并行拉取 属于当前分区的中间结果数据。

阅读全文 »

Struts2 工作流程详解：从请求到响应的完整生命周期

Struts2 工作流程总览

核心步骤详解

1. 请求拦截与初始化（StrutsPrepareAndExecuteFilter）

Struts2 入门示例：从配置到请求处理的完整流程

环境准备与核心依赖

1. 导入 Struts2 核心包

Web.xml 配置：Struts2 拦截器的注册

XML 格式验证：DTD 与 XML Schema 详解

DTD（Document Type Definition，文档类型定义）

DTD 的引入方式

（1）内部 DTD

（2）外部 DTD

MapReduce 数据清洗（ETL）：从杂乱数据到可用信息

数据清洗的核心目标与场景

核心目标

典型应用场景

MapReduce 数据清洗的实现原理

为何无需 Reduce 阶段？

ReduceTask工作机制深度解析：从数据聚合到最终结果

ReduceTask 工作流程总览

ReduceTask 各阶段详细解析

1. Copy 阶段：数据复制与拉取

1. 请求拦截与初始化（`StrutsPrepareAndExecuteFilter`）