Hadoop Hadoop简介(二)

in Hadoop read (820)

Hadoop简介 Apache开源软件,Doug Cutting(Luncene) 计算框架 分布式 可靠 可伸缩 搜索引擎 海量数据存储 Hadoop发展史 2002年Apache Nutch 抓取网页,数十亿存储瓶颈 2003年 GFS论文 ...

Continue reading

Hadoop 大数据基础信息(一)

in Hadoop read (905)

大数据生态系统 Java-大数据的基石 Hadoop生态圈 Hive Hive依赖HDFS进行存储,表是逻辑表 Hive的SQL翻译成MR执行 Hive可以将结构化数据映射成一张单表 OLAP,重在分析和统计 不支持低延迟操作 不提供row...

Continue reading

Matrix42

Record and Share!