HBASE、HDFS、Redis、传统数据库、Hive的区别
发布日期:2022-02-27 02:38:01
浏览次数:36
分类:技术文章
本文共 773 字,大约阅读时间需要 2 分钟。
1、HDFS
- 为分布式存储提供文件系统
- 针对存储大尺寸的文件进行优化,不需要对HDFS上的文件进行随机读写
- 直接使用文件
- 数据模型不灵活
- 使用文件系统和处理框架
- 优化一次写入,多次读取的方式
2、HBase
- 提供表状的面向列的数据存储
- 针对表状数据的随机读写进行优化
- 使用key-vale操作数据
- 提供灵活的数据模型
- 使用表状存储,支持MapReduce,依赖HDFS
- 优化了多次读,以及多次写
- 主要用来存储非结构化数据和半结构化的数据
3、Redis
- 分布式缓存
- 基于内存
- 强调缓存
- 支持数据的持久化
- 支持事务的操作
- NoSql类型的Key/value数据库
- 支持List、Set等丰富的类型
4、Hive
- hive是基于Hadoop的数据仓库工具
- 可以将结构化数据文件映射为数据库表
- 并提供sql功能,可以将sql转化为mr任务运行
- sql学习成本低,不必专门开发mr应用
- 十分适合数据仓库的统计分析。
区别
关系型数据和Hive都是支持SQL引擎的数据库;Redis和Hbase都是NoSQL 类型的Key/vale数据库,支持简单的行列操作,不支持SQL引擎。Redis因为存储在内存中所以数据量较小,而Hbase的存储远远超出内存的大小。HBase适合做大数据的持久存储,而Redis比较适合做缓存。RDBMS一般用来做支撑业务系统提供事物或者查询。hive是面相分析的分析型工具,作为海量数据的分析工具。Hive和HBase是两种基于Hadoop的不同技术:Hive是一种类SQL的引擎,并且运行MapReduce任务,HBase是一种在Hadoop之上的NoSQL 的Key/vale数据库,只支持简单的行列操作。当然,这两种工具是可以同时使用的。Hive可以用来进行统计查询,HBase可以用来进行快速的实时查询,二者可进行整合。
转载地址:https://blog.csdn.net/weixin_43401381/article/details/104598669 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
很好
[***.229.124.182]2024年04月01日 00时47分39秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
Platinum Maestro运动控制器 ——速度位置等数据的获取
2019-04-28
Platinum Maestro运动控制器 ——Ssh登录控制器
2019-04-28
基础笔记2 —— 不损失精度的前提下浮点数拆分成整型的方法浅析
2019-04-28
数据类型在内存中的存储
2019-04-28
循环神经网络(LSTM)实现股票预测-深度学习100例 | 第10天
2019-04-28
Python3--爬取数据之911网站信息爬取
2019-04-28
Python--format()学习记录
2019-04-28
Python--切片学习记录
2019-04-28
Python--判断一个字符串是否包含某子串的几种方法
2019-04-28
pandas包
2019-04-28
Python爬虫之图片爬取
2019-04-28
Python--音频文件分类代码
2019-04-28
Python3--baby网的数据爬取
2019-04-28
Python--读取csv文件的整列
2019-04-28
Python3--有道音频下载
2019-04-28
Python3--爬取海词信息
2019-04-28
我的微信公众号
2019-04-28
搭建 Linux C 编程环境 --- 使用配置好的Ubuntu系统1
2019-04-28
搭建 Linux C 编程环境 --- 使用配置好的Ubuntu系统2
2019-04-28
linux项目 -- 图书管理系统(链表版)
2019-04-28