标签 MapReduce 下的文章 - 张恒的网络日志

标签 MapReduce 下的文章

Hive安装步骤及HQL使用学习

作者: 张恒
时间: 2021-03-20
分类: 笔记
评论

Hive是一个使用类SQL管理分布式存储上大规模数据集的数据仓库，它提供了命令行工具和JDBC驱动程序帮助用户使用Hive。

hive基于hadoop，它的具体功能如下：

通过SQL轻松访问数据的工具，从而实现数据仓库任务，例如提取/转换/加载（ETL），报告和数据分析。
一种将结构强加于各种数据格式的机制
访问直接存储在Apache HDFS ™ 或其他数据存储系统（例如Apache HBase ™）中的文件
通过Apache Tez ™， Apache Spark ™或 MapReduce执行查询
HPL-SQL的过程语言
通过Hive LLAP，Apache YARN和Apache Slider进行亚秒级查询检索。

以上内容来自Apache Hive官网，hive在1.x版本中只支持MapReduce，从2.x开始开始支持其他分布式计算引擎。

- 阅读剩余部分 -

记Hadoop MapReduce入门学习

作者: 张恒
时间: 2021-02-17
分类: 笔记
3 条评论

在之前的文章记hadoop伪分布式安装中，我们已经成功地安装了Hadoop，并且在文章在java中通过API读写hdfs入门学习中实现了通过java代码访问hdfs文件系统，接下来就进入到了MapReduce的学习。

- 阅读剩余部分 -