0%

NoSQL简介

发表于 2021-02-19 更新于 2025-08-13 分类于 NoSQL 阅读次数： Valine：
本文字数： 1.7k 阅读时长 ≈ 2 分钟

NoSQL 简介：非关系型数据库的崛起与分类

NoSQL（全称为 “Not Only SQL”，也常被解释为 “non-relational”）是一类非关系型数据库的统称，旨在解决大规模数据存储、高并发访问和灵活数据结构等传统关系型数据库难以应对的挑战。它并非要取代关系型数据库，而是作为补充，在特定场景中发挥优势。

NoSQL 的核心特点

与传统关系型数据库（如 MySQL、Oracle）相比，NoSQL 具有以下显著特征：

无固定 schema（模式自由）：无需预先定义表结构，数据格式可动态调整，适合半结构化或非结构化数据（如日志、文档、社交关系）。
分布式架构：天然支持水平扩展，可通过增加节点应对数据量和访问量的增长，适合大数据场景。
高吞吐量：优化了读写性能，尤其擅长处理高并发的简单查询（如键值查询）。
灵活的数据模型：根据业务场景提供多种数据结构（如键值对、文档、列族、图），而非单一的二维表。

NoSQL 的四大分类及代表产品

根据数据模型和应用场景，NoSQL 可分为四大类：

1. 键值存储数据库（Key-Value Store）

核心特点：

以键值对（Key-Value）形式存储数据，Key 唯一，Value 为任意格式（字符串、二进制等）。
读写性能极高，适合简单的查询场景。

代表产品：

Redis：支持字符串、哈希、列表等多种数据结构，提供持久化、过期策略和分布式锁，广泛用于缓存、会话存储。
Tokyo Cabinet/Tyrant：轻量级键值数据库，适合嵌入式场景。
Voldemort：分布式键值存储，强调高可用性和分区容错性。

应用场景：

缓存系统（如热点数据缓存）。
会话管理（存储用户登录状态）。
计数器、排行榜等简单高频操作。

2. 列存储数据库（Column-Family Store）

核心特点：

数据按 “列族”（Column Family）组织，列族内包含多个列，可动态添加，适合存储稀疏数据。
擅长分布式存储和批量读写，支持海量数据扩展。

代表产品：

HBase：基于 Hadoop 的分布式列存储数据库，适合 PB 级数据存储，常用于日志分析、时序数据。
Cassandra：高可用、高扩展的分布式数据库，结合了 Dynamo 的分布式策略和 BigTable 的数据模型。
Riak：简单易用的分布式列存储，支持容错和自动分区。

应用场景：

海量时序数据（如传感器数据、用户行为日志）。
分布式文件系统元数据存储。
需要高写入吞吐量的场景（如日志收集）。

3. 文档型数据库（Document Store）

核心特点：

以 “文档” 为基本单位（类似 JSON/BSON 格式），文档内可包含嵌套结构和数组，支持复杂数据类型。
保留了数据的自描述性，无需预定义结构，适合半结构化数据。

代表产品：

MongoDB：最流行的文档型数据库，支持丰富的查询语法、索引和聚合操作，广泛用于内容管理、电商商品数据。
CouchDB：采用 REST API 交互，支持版本控制和增量复制，适合离线优先应用。

应用场景：

内容管理系统（如博客、新闻平台的文章存储）。
电商商品信息（字段多变的商品属性）。
日志和文档存储（保留原始数据结构）。

4. 图形数据库（Graph Database）

核心特点：

以 “节点”（Node）和 “边”（Edge）表示数据及关系，擅长处理复杂的关联关系（如社交网络、知识图谱）。
支持高效的关系查询（如路径查找、邻居分析）。

代表产品：

Neo4j：最成熟的图形数据库，提供直观的图形查询语言（Cypher），用于社交网络分析、推荐系统。
Infinite Graph：分布式图形数据库，支持大规模图形数据存储。

应用场景：

社交网络（如用户关系、好友推荐）。
知识图谱（如实体关联、语义分析）。
路径规划（如物流路线优化）。

NoSQL 与关系型数据库的对比

维度	NoSQL	关系型数据库（如 MySQL）
数据模型	多样（键值、文档、列族等）	二维表（行 / 列），严格 Schema
扩展性	水平扩展为主（增加节点）	垂直扩展为主（升级硬件）
事务支持	部分支持（如 Redis 单命令事务）	强事务 ACID 特性
查询能力	适合简单查询，复杂查询有限	支持复杂 join、子查询
适用场景	大数据、高并发、灵活结构	结构化数据、强事务需求（如金融）

欢迎关注我的其它发布渠道