
问:Hbase知识点总结?
- 答: hbase概念:
非结构化的分布式的面向列存储非关系型的开源的数据库,根据谷歌的三大论文之一的bigtable
高宽厚表
作用:
为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。
能干什么:
存储大量结果集数据,低延迟的随机查询。
sql:
结构化查询语言
nosql:
非关系型数据库,列存储和文档存储(查询低延迟),hbase是nosql的一个种类,其特点是列式存储。
灶如敏 非关系型数据库--列存储(hbase)
非关系型数据库--文档存储(MongoDB)
非关系型数据库隐枝--内存式存储(redis)
非关系型数据库--图形模型(graph)
hive和hbase区别?
Hive的定位是数据仓库,虽然也有增删改查,但其删改查对应的是整张表而不是单行数据,查询的延迟较高。其本质是更加方便的使用mr的威力来进行离线分析的一个数据分析工具。
HBase的定位是hadoop的数据库,电脑培训发现是一个典型的Nosql,所以HBase是用来在大量数据中进行低延迟的随机查询的。
hbase运行方式:
standalonedistrubited
单节点和伪分布式橡枣?
单节点:单独的进程运行在同一台机器上
hbase应用场景:
存储海量数据低延迟查询数据
hbase表由多行组成
hbase行一行在hbase中由行健和一个或多个列的值组成,按行健字母顺序排序的存储。
问:谷歌大数据三篇论文什么时候发表的
- 答:你磨备携说的可能是这三个吧:瞎伏
2003年发表了《The Google File System》
2004年发表了《MapReduce: Simplified Data Processing on Large Clusters 》
2006年发滚春表了《Bigtable: A Distributed Storage System for Structured Data》 - 答:等会让他赶紧染发剂对人体
问:为什么说谷歌三件宝是大数据的技术起源
- 答:因为,Google是大数据鼻祖。很多人提起大数据,必然会想起Google 的“三驾马车”(也称谷歌三宝):GFS、MapReduce、BigTable。正所谓三篇论文定大数据之江山,它激发了大数据技术开源时代的到来,百花齐放,争相斗艳,成就了Hadoop的辉煌十载。尤其是近年来,大数据技术的发展,不论是袭郑凳技术的迭代,还是生态圈的繁荣,都远超人们的想象。从 Spark 超越 Hadoop 勇攀高峰,到 Flink 横空出世挑战 Spark 成为大数据处理领域一颗耀丛瞎眼的拍旅新星,再到如今 Google 又决心用 Apache Beam 一统天下。大数据开源技术的发展可谓是继往开来,跌宕起伏,波澜壮阔,俨然一副绵绵不断的辉煌画卷。
- 答:因为,Google是大数据鼻祖。
很多人提起大数据,必然会想起Google 的“三驾马车”(也称谷歌三宝):GFS、MapReduce、BigTable。正所谓三篇论文定大数据粗衫之江山,它激发了大数据技术开源时代的到来,百花齐放,争相斗艳岩基腔,成就了Hadoop的辉煌十载。尤其是近年来,大数据技术的发展,不论是技术的迭代,还是生态圈的繁荣,都远锋正超人们的想象。