Spark综合学习笔记SparkSQL整合Hive-2 SparkSQL代码中整合hive

2022-09-01 11:46:57

学习致谢

https://www.bilibili.com/video/BV1Xz4y1m7cv?p=65

代码实现

（1）pom文件导入spark-hive依赖

<dependency><groupId>org.apache.spark</groupId><artifactId>spark-hive_2.12</artifactId><version>2.3.2</version></dependency>

（2）注意：需要先启动Hive的metastore

nohup /export/server/hive/bin/hive --service metastore&

（3）编写代码

packagesqlimportorg.apache.spark.sql.expressions.UserDefinedFunctionimportorg.apache.spark.sql.{Dataset, SparkSession}/**
  * Author itcast
  * Desc 演示spark-SQL-使用SparkSQL-UDF将数据转为大写
  * */object Demo09_Hive{def main(args: Array[String]):Unit={//TODO 0.准备环境---需要增加参数配置和开启hivesql语法支持val spark= SparkSession.builder().appName("sparksql").master("local[*]").config("spark.sql.shuffle.partitions","4").config("spark.sql.warehouse.dir","hdfs://node1:8020/user/hive/warehouse")//指定Hive数据库在HDFS上的位置.config("hive.metastore.uris","thrift://node2:9083").enableHiveSupport()//开启对Hive语法的支持.getOrCreate()//本次测试时分区数设置小一点，实际开发中可以根据集群规模设置大小val sc= spark.sparkContext
    sc.setLogLevel("WARN")importspark.implicits._//TODO 1.操作Hive
      spark.sql( sqlText="show databases").show( truncate=false)
      spark.sql( sqlText="show tables").show( truncate=false)
      spark.sql(sqlText="CREATE TABLE person4(id int，name string, age int)row format delimited fields terminated by ' '")
      spark.sql( sqlText="LOAD DATA LOCAL INPATH 'file:///D:/person.txt’ INTO TABLE person4")
      spark.sql( sqlText="show tables").show( truncate=false)
      spark.sql( sqlText="select * from person4").show( truncate=false)

      spark.close()}}

演示

（1）运行代码之前查看hdfs hive中的表只有三个，如图
在这里插入图片描述
（2）运行程序
可以依次看到hivesql的执行结果
查看数据库和表

新建表person4并查看

插入数据并查询

（3）在HDFS端查看hive中的表，可以看到已经新增表person4

作者：斯特凡今天也很帅
原文链接：https://blog.csdn.net/weixin_41311528/article/details/121638540
更新时间：2022-09-01 11:46:57

相关文章

提交multipart/form-data类型数据
提交multipart/form-data类型数据举例：工行签名证书上传保存说明：框架使用的是spring m
2022-07-27

java反射机制
1. 什么是反射机制？首先大家应该先了解两个概念，编译期和运行期，编译期就是编译器帮你把源代码翻译成机器能识别
2022-07-27

Java 使用Socket实现简易聊天室（新手控制台版）
一.服务器端思路整理想要实现聊天室，对于服务器端由于需要一直监听用户的连接以及用户的消息发送，所以需要
2022-07-27

java实现PDF转图片功能，附实例源码！
本文整理了一个java实现PDF转图片的工具类，支持单页及多页的转换！
2022-07-27

随机文章

systemctl命令启动mysql_关于mysql启动不了的心得，使用system
自己使用了如下命令905 mkdir -p var/run/mysqld906 ls -ld /var/r
2022-10-18

设计模式(21) 状态模式
状态模式允许一个对象在其内部状态改变时改变它的行为。用电梯来举例，电梯可以认为具有开门、关门、运行、停止四种状
2022-10-18

深入理解Java中的不可变对象
二哥，你能给我说说为什么 String 是 immutable 类（不可变对象）吗？我想研究它，想知道为什么它
2022-10-18

使用命令esxcli为ESXi主机安装补丁
使用命令esxcli为ESXi主机安装补丁Step1. 首先确保ESXi主机开启SSH服务，可以使用两种方法进
2022-10-18

文章导航

热门标签

VPN BGP 华为 DHCP 组播 ISIS NAT 交换机 H3C 交换 TCP RADIUS LDP 链路聚合网络工程师小助手路由 QOS IPV6 IGMP CCNA视频教程 MPLS Vlan STP Wireshark PIM BGP选路 LACP IP GPON OSPF

最新文章

PHP范围解析运算符（：:)
介绍在PHP中，双冒号::定义为Scope Resolution Operator。
2023-11-18

完全删除数组中的多余元素-JavaScript
我们需要编写一个函数，该函数接受一个数组并返回一个新数组，该数组已删除了所有重复值。
2023-11-18

在不使用库函数的情况下使用真实/伪造的值展平数组-JavaScript
我们需要编写一个JavaScript数组函数，该函数接受具有伪造值的嵌套数组，并返回
2023-11-18

JavaScript在数组的伪索引处插入元素方法详解
我们需要编写一个Array函数，比如pushAtFalsy()，该函数应该包含一个数
2023-11-18

PHP整数数据类型
定义和用法在PHP中，Integer是标量数据类型，代表数字常量，代表整数，不带任何
2023-11-18

PHP错误控制运算符
介绍在PHP中，将@符号定义为错误控制运算符。当它以任何表达式为前缀时，PHP解析器
2023-11-18

PHP类型杂耍详解
定义和用法PHP被称为动态类型语言。在PHP中既不需要也不支持变量的显式类型声明。与
2023-11-18

PowerShell版本7中引入了哪些新的Null运算符？
PowerShell版本7引入了一些新的空运算符。它们如下。空合并运算符-??空条件
2023-11-18

PowerShell中$ ErrorView的用途是什么？
$Errorview变量确定PowerShell中错误消息的显示格式。在PowerS
2023-11-18

PHP执行运算符
介绍PHP中定义了一个执行运算符。一个字符串内部背蜱S（``）被视为一个DOS命令（
2023-11-18

Copyright © 2022 忙忙碌碌网
把实用的技术和经验，分享给最需要的读者，希望每一位来访的朋友都能有所收获！

文章目录