《Hadoop大明白》【1】Hadoop的核心组件-白红宇

《Hadoop大明白》【1】Hadoop的核心组件

阅读量：5951 次

发布时间：2019-06-19

本文共 420 字，大约阅读时间需要 1 分钟。

本书适用于想对大数据平台Hadoop有深入了解的程序员朋友，会帮助你以后在应用开发方面趟平一些坑。

1，Hadoop 是一个系列大数据组件构成的应用平台，可由多个廉价机器搭建集群，提供分布式存储和计算。

2，MapReduce 分为map和reduce。 map是将一系列数据转换N个k-v reduce是将k-v经过分布式并行计算，并将结果合并处理得到目的。

3，Hive 是一个元数据存储于关系型数据库，数据集存于HDFS的数据仓库；可用HiveQL进行MapReduce计算。

4，Impala

5, Spark 是摆脱MapReduce，使用新型内存计算框架的计算引擎。

6，HBase是NoSql(not only sql)的实现，rowkey,列组，region,regionServer,MasterServer是要自行了解的内容。

转载于:https://my.oschina.net/cn0512/blog/2962533

你可能感兴趣的文章

配置Eclipse使用maven构建项目默认JDK为1.8

CMake与动态链接库(dll, so, dylib)

查看>>

myeclipse(eclipse)乱码处理

查看>>

SpringBoot 过滤器, 拦截器, 监听器对比及使用场景

快速添加百度网盘文件到Aria2 猴油脚本

查看>>

mac 无法登录mysql的解决办法

查看>>

Shiro权限判断异常之命名导致的subject.isPermitted 异常

查看>>

Hello world travels in cpp - 字符串(2)

查看>>

struts2自定义拦截器

查看>>

Eclipse安装adt插件后之后看不到andorid manger

查看>>

Kafka服务端脚本详解(1)一topics

查看>>

Zookeeper 集群安装配置，超详细，速度收藏！