hive-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

hive

阅读量：7111 次

发布时间：2019-06-28

本文共 503 字，大约阅读时间需要 1 分钟。

hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能，可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。

Hive定义

Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具，可以用来进行数据提取转化加载（ETL），这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言，称为 HQL，它允许熟悉 SQL 的用户查询数据。同时，这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和 reducer 无法完成的复杂的分析工作。

Hive 没有专门的数据格式。 Hive 可以很好的工作在 Thrift 之上，控制分隔符，也允许用户指定数据格式。

转载于:https://www.cnblogs.com/xtdxs/p/6618926.html

你可能感兴趣的文章

[LeetCode] Detect Capital 检测大写格式

HDU 2037 今年暑假不AC(贪心，区间更新,板子题)

Zookeeper~Linux环境下的部署

C#线程访问winform窗体控件

apiCloud中的数据库操作mcm-js-sdk的使用

Java系列之EJB

change和onchange、click和onclick的区别

EF架构~有时使用SQL更方便

Docker部署zabbix3.2监控系统

[zt]OpenCV如何获取视频当前的一帧图像

Jenkins内置环境变量的使用

《微信生活白皮书》发布微信用户数据

The frequent used operation in Linux system

PyQt5 结合 matplotlib 时，如何显示其 NavigationToolbar

★一名“标题党”自我修炼的10…

Redis基础知识之————使用技巧（持续更新中.....）

python 反模式

企业级LNMP架构搭建实例(基于Centos6.x)

(转) 深度强化学习综述：从AlphaGo背后的力量到学习资源分享（附论文）

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-02-09 03:14:45 当前IP: 3.149.242.75 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我