博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
hive
阅读量:7111 次
发布时间:2019-06-28

本文共 503 字,大约阅读时间需要 1 分钟。

hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。

Hive定义

Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言,称为 HQL,它允许熟悉 SQL 的用户查询数据。同时,这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和 reducer 无法完成的复杂的分析工作。
Hive 没有专门的数据格式。 Hive 可以很好的工作在 Thrift 之上,控制分隔符,也允许用户指定数据格式。

转载于:https://www.cnblogs.com/xtdxs/p/6618926.html

你可能感兴趣的文章
[LeetCode] Detect Capital 检测大写格式
查看>>
HDU 2037 今年暑假不AC(贪心,区间更新,板子题)
查看>>
Zookeeper~Linux环境下的部署
查看>>
配置IP
查看>>
C#线程访问winform窗体控件
查看>>
apiCloud中的数据库操作mcm-js-sdk的使用
查看>>
Java系列之EJB
查看>>
change和onchange、click和onclick的区别
查看>>
EF架构~有时使用SQL更方便
查看>>
Docker部署zabbix3.2监控系统
查看>>
[zt]OpenCV如何获取视频当前的一帧图像
查看>>
Jenkins内置环境变量的使用
查看>>
《微信生活白皮书》发布微信用户数据
查看>>
The frequent used operation in Linux system
查看>>
PyQt5 结合 matplotlib 时,如何显示其 NavigationToolbar
查看>>
★一名“标题党”自我修炼的10…
查看>>
Redis基础知识之————使用技巧(持续更新中.....)
查看>>
python 反模式
查看>>
企业级LNMP架构搭建实例(基于Centos6.x)
查看>>
(转) 深度强化学习综述:从AlphaGo背后的力量到学习资源分享(附论文)
查看>>