小菜鸟

scala数据类型

发表于 2021-04-27 更新于 2025-08-04 分类于 scala 阅读次数： Valine：
本文字数： 2.1k 阅读时长 ≈ 2 分钟

Scala 数据类型：面向对象的类型系统

Scala 作为纯粹的面向对象语言，其数据类型系统与 Java 有显著差异 ——所有类型都是对象，不存在 Java 中的 “基本数据类型” 与 “引用类型” 的严格区分。Scala 类型系统以 Any 为根，分为 AnyVal（值类型）和 AnyRef（引用类型）两大分支，形成层次清晰的类型体系。

类型体系概览

Scala 类型系统的核心层次结构如下：

根类型：Any（所有类型的父类）
- 值类型：AnyVal（包括数值类型、布尔型等）
- 引用类型：AnyRef（包括类、特质、数组等，对应 Java 的 Object）
特殊类型：Null（所有 AnyRef 的子类）、Nothing（所有类型的子类）

AnyVal：值类型

AnyVal 代表值类型，对应 Java 中的 “基本数据类型”，但在 Scala 中仍是对象，拥有方法和属性。常见的 AnyVal 类型包括：

类型	描述	示例
`Int`	32 位整数	`val a: Int = 10`
`Long`	64 位整数（后缀 L）	`val b: Long = 100L`
`Float`	32 位浮点数（后缀 f）	`val c: Float = 3.14f`
`Double`	64 位浮点数（默认小数类型）	`val d: Double = 3.14159`
`Boolean`	布尔值（true/false）	`val e: Boolean = true`
`Char`	16 位字符（单引号包裹）	`val f: Char = 'A'`
`Byte`	8 位整数	`val g: Byte = 0x10`
`Short`	16 位整数	`val h: Short = 32767`
`Unit`	无返回值标记（类似 void）	`def hello(): Unit = println("hi")`

值类型的特性

默认类型：

整数默认是 Int（超出范围自动推断为 Long）
小数默认是 Double（需显式加 f 声明 Float）

val num1 = 100      // 推断为Int
   val num2 = 10000000000L  // 显式声明Long
val num3 = 3.14     // 推断为Double
   val num4 = 3.14f    // 显式声明Float

自动类型转换：
- 低精度类型可自动转换为高精度类型（类似 Java 的 “拓宽转换”）
- 转换方向：Byte → Short → Int → Long → Float → Double

阅读全文 »

scala变量

发表于 2021-04-27 更新于 2025-08-04 分类于 scala 阅读次数： Valine：
本文字数： 1.7k 阅读时长 ≈ 2 分钟

Scala 变量：声明、特性与命名规则

变量是编程语言的基础构建块，Scala 作为一门多范式语言，其变量声明方式与 Java 有显著差异，尤其体现在不可变性和类型推断上。本文详细介绍 Scala 变量的核心特性。

变量声明语法

Scala 变量声明必须初始化，基本语法如下：

1 2	// 完整语法：关键字变量名[: 类型] = 初始值 var\|val 变量名[: 变量类型] = 变量值

示例解析

// 1. 显式指定类型
var age: Int = 10  // 可变变量，类型为Int
val score: Double = 95.5  // 不可变变量，类型为Double

// 2. 省略类型（依赖编译器的类型推导）
var name = "Alice"  // 推导为String类型
val pi = 3.14159    // 推导为Double类型

类型推导：Scala 编译器能根据初始值自动推断变量类型，通常无需显式声明，简化代码。
必须初始化：与 Java 不同，Scala 不允许声明未初始化的变量（如 var x: Int; 会报错），确保变量始终有明确的值。

var 与 val：可变与不可变

Scala 变量分为两种类型，核心区别在于是否可重新赋值：

var（可变变量）

允许后续重新赋值
类似 Java 中未用 final 修饰的变量

阅读全文 »

HBase读数据过程

发表于 2021-04-27 更新于 2025-07-27 分类于 hbase 阅读次数： Valine：
本文字数： 2.3k 阅读时长 ≈ 2 分钟

HBase读数据流程深度解析

HBase 的读数据过程涉及客户端、ZooKeeper、元数据表（hbase:meta）、RegionServer 等多个组件的协同，核心目标是高效定位数据位置并优化读取性能。以下从客户端发起请求到数据返回的全流程进行详细拆解。

读数据核心流程概述

HBase 读操作的本质是从分布式存储中快速定位并获取目标数据，流程可概括为 “定位 Region → 读取数据 → 优化缓存” 三个阶段，具体步骤如下：

客户端通过 ZooKeeper 获取元数据表（hbase:meta）的位置；
访问 hbase:meta 表，查询目标数据所在的 Region 及对应的 RegionServer；
客户端直接与目标 RegionServer 建立连接，请求读取数据；
RegionServer 在本地 Region 中按 “内存 → 缓存 → 磁盘” 的顺序查找数据；
读取结果返回客户端，同时热点数据写入缓存以优化后续访问。

详细流程拆解

第一步：获取元数据表（hbase:meta）位置

HBase 的元数据（Region 分布信息）存储在 hbase:meta 表中，而该表的位置由 ZooKeeper 维护，这是读流程的起点。

客户端操作：客户端启动时，首先向 ZooKeeper 的 /hbase/meta-region-server 节点发送请求，获取 hbase:meta 表所在的 RegionServer 地址（包括主机名和端口）。
作用：ZooKeeper 作为集群协调中心，提供了元数据的统一入口，确保客户端能快速定位元数据表。

第二步：查询 hbase:meta 表，定位目标 Region

hbase:meta 表是 HBase 的 “目录索引”，存储了所有用户表的 Region 分布信息，每条记录包含以下关键信息：

阅读全文 »

HBase命令

发表于 2021-04-26 更新于 2025-07-27 分类于 hbase 阅读次数： Valine：
本文字数： 4.4k 阅读时长 ≈ 4 分钟

HBase Shell 核心命令全解析

HBase 提供了丰富的 Shell 命令用于表管理、数据操作和集群监控，是日常运维和开发调试的重要工具。本文将详细介绍 HBase 常用命令的语法、功能及使用场景，帮助读者快速掌握 HBase 操作。

表管理命令

1. 创建表（create）

创建 HBase 表时需指定表名和列族（Column Family），列族是表结构的核心组成部分。

语法：

1	create '表名', '列族1', '列族2', ...

示例：

# 创建表 test，包含列族 cf  
create 'test', 'cf'  

# 创建表 user，包含列族 info 和 data  
create 'user', 'info', 'data'

2. 查看表列表（list）

查看当前 HBase 集群中的所有表，或验证指定表是否存在。

语法：

# 查看所有表  
list  

# 查看指定表（支持模糊匹配）  
list '表名'  # 精确匹配  
list 'test.*'  # 模糊匹配以 test 开头的表

阅读全文 »

HBase部署启动

发表于 2021-04-25 更新于 2025-07-27 分类于 hbase 阅读次数： Valine：
本文字数： 4.1k 阅读时长 ≈ 4 分钟

HBase部署与启动全指南

使用的版本为2.2.7

HBase 的部署模式分为单机模式（Standalone）和集群模式（Distributed），本文将详细介绍两种模式的部署步骤、配置要点及常见问题解决方案，帮助读者快速搭建 HBase 环境。

单机模式部署

单机模式适合开发测试环境，部署简单，主要用于功能验证和学习。

环境准备

Java 环境：确保已安装 JDK 8+，并配置 JAVA_HOME 环境变量。
HDFS 依赖：单机模式下 HBase 可直接使用本地文件系统，但若配置 hbase.rootdir 为 HDFS 路径（如示例），需先启动 Hadoop。

配置文件修改

hbase-env.sh

配置 JDK 路径，关闭 HBase 内置 ZooKeeper（使用独立 ZooKeeper）：

1 2	export JAVA_HOME=/usr/1.8 # 替换为实际 JDK 路径 export HBASE_MANAGES_ZK=false # 启用独立 ZooKeeper（需提前启动）

hbase-site.xml

核心配置如下：

<configuration>  
  <!-- HBase 数据存储根路径，可使用 HDFS 或本地文件系统 -->  
  <property>  
    <name>hbase.rootdir</name>  
    <value>hdfs://localhost:9000/hbase</value>  <!-- 若使用本地文件系统，改为 file:///path/to/hbase -->  
  </property>  

  <!-- ZooKeeper 数据目录 -->  
  <property>  
    <name>hbase.zookeeper.property.dataDir</name>  
    <value>/usr/local/myself/hbase-2.2.7/zkData</value>  
  </property>  

  <!-- 单机模式标识 -->  
  <property>  
    <name>hbase.cluster.distributed</name>  
    <value>false</value>  
  </property>  
</configuration>

启动与验证

启动顺序

# 若使用 HDFS，先启动 Hadoop  
$ start-dfs.sh  

# 启动 HBase（自动启动 HMaster 和 RegionServer）  
$ bin/start-hbase.sh  

# 验证进程是否正常运行  
$ jps  
12345 HMaster  # HBase 主节点  
12346 HRegionServer  # HBase 区域服务器  
12347 Jps  # 进程监控工具

访问 Web UI

通过浏览器访问 http://localhost:16010，查看 HBase 管理界面（仅 HMaster 节点提供）。

进入 HBase Shell

1
2
3

$ bin/hbase shell  
hbase(main):001:0> status  # 查看集群状态  
hbase(main):002:0> list  # 查看所有表

阅读全文 »