CreateArtTechnology
/ Blog
Login
最新文章
Java
语言相关
库相关
虚拟机相关
CreateArtTechnology
项目搭建
使用的工具
自研的工具
开源工具
ELK
ElasticSearch
Jenkins
Markdown
GraphQL
Arthas
生产工具
Linux
Nginx
VersionControl
Subversion
Git
Redis
Archiva
Maven
Zookeeper
Spring
SpringBoot
MySql
HBase
Cassandra
容器化
Docker
Kubernetes
服务容器化从零开始
未分类笔记
算法相关
概念相关
豆知识
机器学习
机器学习从零开始
HBase简介
17
2020-01-17 19:17:56
生产工具
HBase
![](/img/pic/2020011719174308300_png_470_120_21379) > HBase ### HBase是什么 > HBase是一個開源的非關係型分散式資料庫,它參考了Google的BigTable建模,實現的程式語言為 Java。它是Apache軟體基金會的Hadoop專案的一部分,執行於HDFS檔案系統之上,為 Hadoop 提供類似於BigTable 規模的服務。因此,它可以對稀疏檔案提供極高的容錯率。 ——维基百科 简而言之,HBase是一种基于Hadoop HDFS的列式的分布式NoSql数据库,可以用于大数据的半结构化存储与查询。 ### 为什么使用HBase 1. 海量数据 这可能是使用常见NoSql数据库最大的优势,当数据量达到一定程度时,常用的关系型数据库的性能已经成为很明显的瓶颈,而基于Hadoop的HBase天生就适合做大数据的处理 2. 分布式 由于分布式系统的架构设计,通常可以以较低的成本实现弹性扩容,避免单点故障,但也因此带来了一些问题 **与关系型数据库对比** ||HBase|RDBMS| |---|---|---| |硬件架构|类似于 Hadoop 的分布式集群,硬件成本低廉|传统的多核系统,硬件成本昂贵| |容错性|由软件架构实现,由于由多个节点组成,所以不担心一点或几点宕机|一般需要额外硬件设备实现 HA 机制| |数据库大小|PB|GB、TB| |数据排布方式|稀疏的、分布的多维的 Map|以行和列组织| |数据类型|Bytes|丰富的数据类型| |事物支持|ACID 只支持单个 Row 级别|全面的 ACID 支持,对 Row 和表| |查询语言|只支持 Java API (除非与其他框架一起使用,如 Phoenix、Hive)|SQL| |索引|只支持 Row-key,除非与其他技术一起应用,如 Phoenix、Hive|支持| |吞吐量|百万查询/每秒|数千查询/每秒| **与Cassandra对比(部分)** ||HBase|Cassandra| |---|---|---| |出发点|BigTable|BigTable and Dynamo| |数据分布|表划分为多个region存在不同region server上|改进的一致性哈希(虚拟节点)| |一致性|强一致性|最终一致性| |架构|master/slave|p2p| |读写性能|数据读写定位可能要通过最多6次的网络RPC,性能较低。|数据读写定位非常快| |高可用性|NameNode是HDFS的单点故障点|P2P和去中心化设计,不会出现单点故障| |CAP|1,强一致性,0数据丢失。2,可用性低。3,扩容方便。|1,弱一致性,数据可能丢失。2,可用性高。3,扩容方便。| 实际选用原因:公司有针对HBase的解决方案:) ### 推荐资料 [一条数据的HBase之旅,简明HBase入门教程-开篇 | NoSQL漫谈](http://www.nosqlnotes.com/technotes/hbase/hbase-overview-concepts/) [一条数据的HBase之旅,简明HBase入门教程-Write全流程 | NoSQL漫谈](http://www.nosqlnotes.com/technotes/hbase/hbase-overview-writeflow/) [一条数据的HBase之旅,简明HBase入门教程-Flush与Compaction](http://www.nosqlnotes.com/technotes/hbase/flush-compaction/) [一条数据的HBase之旅,简明HBase入门教程-Read全流程 | NoSQL漫谈](http://www.nosqlnotes.com/technotes/hbase/hbase-read/) ### 官网 [https://hbase.apache.org/](https://hbase.apache.org/) ### 参考资料 [HBase和Cassandra比较-云栖社区-阿里云](https://yq.aliyun.com/articles/25706)
发布文章 101
文章被阅读 1820
最近修改
什么是“丝滑”的曲线
2021-12-08 15:19:20
高效空间数据索引R树及其批量加载方法STR简介
2021-09-29 20:33:37
关于分库分表的一些事儿
2021-06-25 11:51:25
获得诺奖的稳定匹配理论之TTC算法与GS算法
2021-03-14 23:04:48
算法小白的机器学习入门实践,从零到上线
2021-01-13 14:28:27
分站宗旨
一站式资料平台,减少重复检索,减少重复采坑。