HBASE、HDFS、Redis、传统数据库、Hive的区别
发布日期:2022-02-27 02:38:01 浏览次数:36 分类:技术文章

本文共 773 字,大约阅读时间需要 2 分钟。

1、HDFS

  • 为分布式存储提供文件系统
  • 针对存储大尺寸的文件进行优化,不需要对HDFS上的文件进行随机读写
  • 直接使用文件
  • 数据模型不灵活
  • 使用文件系统和处理框架
  • 优化一次写入,多次读取的方式

2、HBase

  • 提供表状的面向列的数据存储
  • 针对表状数据的随机读写进行优化
  • 使用key-vale操作数据
  • 提供灵活的数据模型
  • 使用表状存储,支持MapReduce,依赖HDFS
  • 优化了多次读,以及多次写
  • 主要用来存储非结构化数据和半结构化的数据

3、Redis

  • 分布式缓存
  • 基于内存
  • 强调缓存
  • 支持数据的持久化
  • 支持事务的操作
  • NoSql类型的Key/value数据库
  • 支持List、Set等丰富的类型

4、Hive

  • hive是基于Hadoop的数据仓库工具
  • 可以将结构化数据文件映射为数据库表
  • 并提供sql功能,可以将sql转化为mr任务运行
  • sql学习成本低,不必专门开发mr应用
  • 十分适合数据仓库的统计分析。

区别

关系型数据和Hive都是支持SQL引擎的数据库;Redis和Hbase都是NoSQL 类型的Key/vale数据库,支持简单的行列操作,不支持SQL引擎。Redis因为存储在内存中所以数据量较小,而Hbase的存储远远超出内存的大小。HBase适合做大数据的持久存储,而Redis比较适合做缓存。RDBMS一般用来做支撑业务系统提供事物或者查询。hive是面相分析的分析型工具,作为海量数据的分析工具。Hive和HBase是两种基于Hadoop的不同技术:Hive是一种类SQL的引擎,并且运行MapReduce任务,HBase是一种在Hadoop之上的NoSQL 的Key/vale数据库,只支持简单的行列操作。当然,这两种工具是可以同时使用的。Hive可以用来进行统计查询,HBase可以用来进行快速的实时查询,二者可进行整合。

转载地址:https://blog.csdn.net/weixin_43401381/article/details/104598669 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:Sqoop中常见的问题
下一篇:PyHive(遇到的坑)以及一些ETl使用函数

发表评论

最新留言

很好
[***.229.124.182]2024年04月01日 00时47分39秒