小菜鸟

实现创意轮播

发表于 2020-11-13 更新于 2025-08-02 分类于广告阅读次数： Valine：
本文字数： 5.9k 阅读时长 ≈ 5 分钟

广告创意轮播实现：从 Redis 到 HBase 的方案详解

在广告投放中，创意轮播是一种常见策略，通过让同一广告单元下的多个创意按顺序或比例交替展示，帮助广告主对比不同创意的效果（如点击率、转化率），优化投放策略。本文将详细介绍基于 Redis 和 HBase 的创意轮播实现方案，分析其适用场景与优化思路。

创意轮播的核心需求

创意轮播的核心目标是让多个创意 “雨露均沾”，确保各创意的曝光量尽可能均衡。具体需求包括：

顺序轮播：按固定顺序循环展示创意（如创意 A→创意 B→创意 C→创意 A…）。
状态记录：记住用户最后一次看到的创意，确保下次展示下一个。
高并发支持：在百万级 QPS 的广告请求中，快速判断并返回下一个创意。
数据持久化：长期保存用户的创意展示记录，支持历史数据分析。

基于 Redis 的创意轮播实现（高并发场景）

Redis 凭借内存存储的高效性，适合作为创意轮播的实时存储方案，尤其适用于对响应速度要求高的场景（如信息流广告、开屏广告）。

数据结构设计

Key：采用 用户ID:广告单元ID（uid:dealId）的格式，唯一标识 “用户 - 广告单元” 组合。
Value：使用 Redis List 存储用户对该广告单元的创意曝光记录，按时间倒序排列（最新记录在最前），或仅存储最后一次曝光的创意 ID（简化版）。

阅读全文 »

AIO介绍

发表于 2020-11-13 更新于 2025-08-11 分类于 java基础阅读次数： Valine：
本文字数： 7.1k 阅读时长 ≈ 6 分钟

Java AIO 详解：异步非阻塞 IO 的实现与实践

Java AIO（Asynchronous IO，异步 IO）是 JDK 1.7 引入的 IO 模型，基于 “异步非阻塞” 思想，通过 Proactor 模式实现，将 IO 操作的全过程（数据准备 + 内核到用户缓冲区的复制）交由操作系统完成，最终通过回调函数通知应用程序结果。相比 NIO 的 “同步非阻塞”，AIO 进一步解放了应用程序的 CPU 资源，适用于高并发、IO 密集型场景。

AIO 的核心概念与优势

核心思想：Proactor 模式

AIO 采用 Proactor 模式（与 NIO 的 Reactor 模式相对），核心特点是：

应用程序：发起 IO 操作后立即返回，无需阻塞或轮询。
操作系统：负责完成整个 IO 流程（包括数据从设备到内核缓冲区、再到用户缓冲区的复制）。
通知机制：操作系统完成 IO 后，通过回调函数或Future 对象通知应用程序处理结果。

与 NIO 的核心区别

维度	NIO（同步非阻塞）	AIO（异步非阻塞）
操作方式	应用程序需主动轮询或处理事件队列	操作系统完成全流程后通知应用程序
核心模式	Reactor（反应器模式）	Proactor（前摄器模式）
数据复制	应用程序主动调用 `read`/`write` 完成	操作系统自动完成，应用程序直接使用结果
性能开销	需遍历事件队列，存在一定 CPU 消耗	无轮询开销，CPU 利用率更高
适用场景	高并发网络通信（如服务器）	IO 密集型场景（如大文件传输、异步通信）

AIO 的核心类与接口

AIO 的核心类位于 java.nio.channels 包中，主要包括：

类 / 接口	功能描述	典型方法
`AsynchronousChannel`	异步通道的根接口，定义异步关闭方法	`close()`
`AsynchronousServerSocketChannel`	异步服务器套接字通道，用于监听客户端连接	`open()`、`bind()`、`accept()`
`AsynchronousSocketChannel`	异步客户端套接字通道，用于数据传输	`open()`、`connect()`、`read()`、`write()`
`CompletionHandler`	异步操作的回调接口，处理成功 / 失败结果	`completed(V result, A attachment)`、`failed(Throwable exc, A attachment)`

AIO 编程实践

AIO 操作通常通过两种方式获取结果：回调函数（CompletionHandler） 和 Future 对象。以下以网络通信为例，展示 AIO 的核心用法。

阅读全文 »

传输层网络协议

发表于 2020-11-01 更新于 2025-08-03 分类于网络阅读次数： Valine：
本文字数： 2.7k 阅读时长 ≈ 2 分钟

传输层网络协议：TCP 与 UDP 的深度解析

传输层是网络通信的核心枢纽，其中TCP（传输控制协议） 和UDP（用户数据报协议） 是两种最核心的协议。TCP 以可靠性著称，适用于需要精确数据传输的场景；UDP 以高效性为亮点，适合实时性要求高的应用。以下从协议细节、连接机制到核心特性进行全面解析。

TCP：面向连接的可靠传输协议

TCP（Transmission Control Protocol）是一种基于连接、可靠、有序的传输协议，通过复杂的控制机制确保数据准确无误地从发送方交付到接收方。

TCP 的核心标识：序号、确认号与标志位

TCP 报文通过序号、确认号和标志位实现可靠传输，这些字段是理解 TCP 工作机制的关键：

序号（seq）：
TCP 将传输的数据流视为字节序列，每个字节都有唯一序号。seq表示当前报文段第一个字节的序号（如发送 100 字节数据，seq=1000，则该报文包含 1000-1099 字节）。
确认号（ack）：
接收方用于告知发送方 “已成功接收数据的截止位置”，值为期望接收的下一个字节序号。例如，若接收方已收到 1000-1099 字节，则 ack=1100，表示 “请发送从 1100 开始的数据”。
标志位：
控制 TCP 连接与数据传输的关键标识，核心包括：
- ACK：确认位。ACK=1时，确认号（ack）有效；ACK=0时，ack 无效（仅在第一次握手时使用）。
- SYN：同步位。用于建立连接时同步序号，SYN=1表示 “请求建立连接”，此时报文不携带数据。
- FIN：终止位。用于释放连接，FIN=1表示 “发送方已完成数据传输，请求关闭连接”。

TCP 连接建立：三次握手

TCP 是面向连接的协议，通信前必须通过 “三次握手” 建立连接，确保双方收发能力正常。

阅读全文 »

MySQL安装

发表于 2020-10-30 更新于 2025-08-15 分类于 MySQL 阅读次数： Valine：
本文字数： 3.6k 阅读时长 ≈ 3 分钟

MySQL 全平台安装指南（Mac/Linux/Windows）

MySQL 是目前最流行的关系型数据库之一，其安装过程因操作系统而异。本文详细介绍 Mac、Linux、Windows 三大平台的安装步骤、配置方法及常用命令，帮助你快速搭建 MySQL 环境。

Mac 平台安装（Homebrew 方式）

Mac 推荐使用 Homebrew 安装，步骤简单且便于管理。

安装 MySQL

# 安装最新版本
brew install mysql

# 如需指定版本（如 8.0）
brew install mysql@8.0

启动 MySQL 服务

# 启动服务（后台运行）
mysql.server start

# 停止服务
mysql.server stop

# 重启服务
mysql.server restart

安全配置（首次安装必做）

阅读全文 »

spark简介

发表于 2020-10-28 更新于 2025-07-29 分类于 spark 阅读次数： Valine：
本文字数： 3k 阅读时长 ≈ 3 分钟

spark全面解析：从核心优势到架构与运行模式

Apache Spark 作为大数据领域的主流计算引擎，以其 “快速、通用” 的特性颠覆了传统 MapReduce 的计算范式，成为企业级大数据分析的首选工具。本文从 Spark 的核心优势出发，深入解析其架构组成、核心概念及运行模式，帮助读者建立对 Spark 的系统性认知。

Spark 核心优势：为何超越 MapReduce？

Spark 相较于 Hadoop MapReduce 的革命性提升，源于对大数据计算痛点的精准解决，核心优势体现在以下四方面：

中间结果内存存储，减少磁盘 IO

MapReduce 的瓶颈：每轮 Map 任务的中间结果必须写入 HDFS 磁盘，Reduce 任务需从磁盘读取，大量磁盘 IO 导致效率低下。
Spark 的优化：将中间结果存储在内存中（仅在内存不足时写入磁盘），通过 DAG（有向无环图）引擎串联多阶段任务，避免重复读写 HDFS。例如，一个包含 3 个阶段的任务，MapReduce 需要写 2 次磁盘，而 Spark 可全程内存流转，效率提升 10~100 倍。

高效的数据格式与内存布局

MapReduce 的局限：采用 “Schema On Read” 模式，每次读取数据需重新解析格式，开销大。
Spark 的优化：
- 抽象出 RDD（弹性分布式数据集），支持粗粒度写、细粒度读，减少格式解析开销；
- 允许用户自定义数据分区策略，将关联数据放入同一分区，降低 Shuffle 成本。

灵活的执行策略，避免不必要排序

MapReduce 的强制排序：Reduce 阶段默认对数据排序，即使业务无需排序也会产生额外开销。
Spark 的优化：支持基于 Hash 的分布式聚合（如 groupByKey），无需排序，适合非排序场景（如计数、求和）；通过 DAG 调度器动态优化执行计划，合并相邻任务。

轻量级任务调度，降低启动开销

MapReduce 的进程级调度：每个任务启动独立 JVM 进程，启动和切换成本高，适合长任务（小时级）。
Spark 的线程级调度：基于 AKKA 事件驱动框架，通过线程池复用线程，任务启动毫秒级响应，支持短任务（分钟级甚至秒级）和迭代计算（如机器学习）。

Spark 生态圈与核心组件

Spark 不仅是一个计算引擎，更是一个完整的大数据处理生态系统，涵盖批处理、流处理、SQL 分析、机器学习等场景。

阅读全文 »