数仓工具 Hive进阶之SerDe

2022-08-16 08:07:17

Hive SerDe

SerDe是Serializer/Deserializer的缩写。序列化是对象转换成字节序列的过程。反序列化是字节序列转换成对象的过程。

对象的序列化主要有两种用途：

对象的持久化，即把对象转换成字节序列后保存到文件。
对象数据的网络传输。

Hive使用SerDe接口完成IO操作也就是数据的读取和写入，hive本身并不存储数据，它用的是hdfs上存储的文件，在与hdfs的文件交互读取和写入的时候需要用到序列化和反序列化。

Hive Serde用来做序列化和反序列化，构建在数据存储和执行引擎之间，对两者实现解耦。 org.apache.hadoop.hive.serde 已经被淘汰了，现在主要使用 org.apache.hadoop.hive.serde2 ，SerDe允许Hive从表中读入数据，然后以任何自定义格式将数据写回HDFS。任何人都可以为自己的数据格式编写自己的SerDe。

所以序列化(serialize)是将导入的数据转成hadoop的Writable格式，反序列化就是将HDFS 上的数据导入到内存中形成row object，每个SQL都会有这个操作explain select count(1) from ods_user_log group byid;

Hive 的读写流程

其实SerDe就是Hive 的序列化和反序列化的组件，主要用在读写数据上，下面就是Hive 读

作者：不二人生
原文链接：https://blog.csdn.net/king14bhhb/article/details/112541876
更新时间：2022-08-16 08:07:17

相关文章

spring-boot-start原理分析
源码分析了解springboot的都知道启动类上经常又个@SpringBootApplication注解，这个
2022-06-19

实时数仓Druid从kafka摄取数据
准备搭建好kafka可正常访问查询节点的8888端口: http://hadoop04:8888按部就班新建一
2022-06-19

YOLOv5尝试修改backbone
本博文记录第一次修改yolov5，只是尝试，不做工程效率的考虑最近尝试修改yolov5的网络结构，在这里记录一
2022-06-19

jupyter加载文件失败问题
遇到个小白常见的问题，发现度娘里面没有记录，翻墙谷歌了下，解决问题，在此写个说明。事情起因：在jupyter
2022-06-19

随机文章

前端常用加密处理vue使用md5加密
md5 ：1.安装依赖npm install --save js-md52.在main.js中引入import
2022-07-24

盒子模型塌陷的问题，和解决方案
盒子模型塌陷的问题，和解决方案
2022-07-24

CSS盒子塌陷及解决方法
CSS盒子塌陷及解决方法1 盒子塌陷的原因2 如何清除塌陷1 盒子塌陷的原因什么是盒子塌陷？外部的盒子没有包裹
2022-07-24

深入理解SpringBoot中的事件监听器
1.写在前面前面我写过spring的源码的专栏，其中有一行代码，我没有解释，就是spring中事件的监听器，也
2022-07-24

文章导航

热门标签

VPN BGP 华为 DHCP 组播 ISIS NAT 交换机 H3C 交换 TCP RADIUS LDP 链路聚合网络工程师小助手路由 QOS IPV6 IGMP CCNA视频教程 MPLS Vlan STP Wireshark PIM BGP选路 LACP IP GPON OSPF

最新文章

PHP范围解析运算符（：:)
介绍在PHP中，双冒号::定义为Scope Resolution Operator。
2023-11-18

完全删除数组中的多余元素-JavaScript
我们需要编写一个函数，该函数接受一个数组并返回一个新数组，该数组已删除了所有重复值。
2023-11-18

在不使用库函数的情况下使用真实/伪造的值展平数组-JavaScript
我们需要编写一个JavaScript数组函数，该函数接受具有伪造值的嵌套数组，并返回
2023-11-18

JavaScript在数组的伪索引处插入元素方法详解
我们需要编写一个Array函数，比如pushAtFalsy()，该函数应该包含一个数
2023-11-18

PHP整数数据类型
定义和用法在PHP中，Integer是标量数据类型，代表数字常量，代表整数，不带任何
2023-11-18

PHP错误控制运算符
介绍在PHP中，将@符号定义为错误控制运算符。当它以任何表达式为前缀时，PHP解析器
2023-11-18

PHP类型杂耍详解
定义和用法PHP被称为动态类型语言。在PHP中既不需要也不支持变量的显式类型声明。与
2023-11-18

PowerShell版本7中引入了哪些新的Null运算符？
PowerShell版本7引入了一些新的空运算符。它们如下。空合并运算符-??空条件
2023-11-18

PowerShell中$ ErrorView的用途是什么？
$Errorview变量确定PowerShell中错误消息的显示格式。在PowerS
2023-11-18

PHP执行运算符
介绍PHP中定义了一个执行运算符。一个字符串内部背蜱S（``）被视为一个DOS命令（
2023-11-18

Copyright © 2022 忙忙碌碌网
把实用的技术和经验，分享给最需要的读者，希望每一位来访的朋友都能有所收获！

文章目录