使用pyspark读写hive数据表

2022-12-30 13:55:50

spark 版本 2.1.0

1、读Hive表数据

pyspark提供了操作hive的接口，可以直接使用SQL语句从hive里面查询需要的数据，代码如下：

# -*- coding: utf-8 -*-

import sys
from pyspark.sql import SparkSession, HiveContext

reload(sys)
sys.setdefaultencoding("utf-8")

#_SPARK_HOST = "spark://spark-master:7077"
_APP_NAME = "test"
spark = SparkSession.builder.enableHiveSupport().appName(_APP_NAME).getOrCreate()

# 使用拼接sql语句的方式查询hive 表,返回dataFrame格式数据
hive_database = "test"             #  要操作的数据库
hive_table = "table_01"            #  要操作的数据表
hive_read_sql = "select * from {}.{}".format(hive_database, hive_table)

read_df = spark.sql(hive_read_sql)
# hive_context = HiveContext(spark)
# hive_context.setLogLevel("WARN") # 或者INFO等
# read_df = hive_context.sql(hive_read_sql)
print(read_df.show(10))
print('

作者：MusicDancing
原文链接：https://blog.csdn.net/MusicDancing/article/details/107958990
更新时间：2022-12-30 13:55:50

相关文章

Defaulting to user installation because no
出错情况：pip install XXXpip3 install XXX改成：python -m instal
2022-10-26

python库matplotlib之plt画子图
文章目录plt_index：表示子图的序号。应该初始化为１，表示第一张图fig = plt.figure(fi
2022-10-26

【Python】变量的多次赋值与使用
先导知识这也是截取的一个内存分析图：将有利于下面代码的理解。代码# 变量的多次赋值与使用name = '寻觅
2022-10-26

Java并发多线程编程——Volatile原理与使用
目录一、volitile的理解二、多个线程获取值案例（没有使用同步的情况）三、多个线程获取值案例（使用Vola
2022-10-26

随机文章

SpringBoot实战之异常处理篇
在互联网时代，我们所开发的应用大多是直面用户的，程序中的任何一点小疏忽都可能导致用户的流失，而程序出现异常往往
2022-09-23

SpringBoot+Mockito的简单使用
SpringBoot+Mockito的简单使用引入依赖 <dependency>
2022-09-23

python black_如何使用Black自动格式化Python代码
python blackWriting Python code is one thing and writin
2022-09-23

Pytorch如何使用多块GPU同时训练
Pytorch使用多块GPU训练数据
2022-09-23

文章导航

热门标签

VPN BGP 华为 DHCP 组播 ISIS NAT 交换机 H3C 交换 TCP RADIUS LDP 链路聚合网络工程师小助手路由 QOS IPV6 IGMP CCNA视频教程 MPLS Vlan STP Wireshark PIM BGP选路 LACP IP GPON OSPF

最新文章

PHP范围解析运算符（：:)
介绍在PHP中，双冒号::定义为Scope Resolution Operator。
2023-11-18

完全删除数组中的多余元素-JavaScript
我们需要编写一个函数，该函数接受一个数组并返回一个新数组，该数组已删除了所有重复值。
2023-11-18

在不使用库函数的情况下使用真实/伪造的值展平数组-JavaScript
我们需要编写一个JavaScript数组函数，该函数接受具有伪造值的嵌套数组，并返回
2023-11-18

JavaScript在数组的伪索引处插入元素方法详解
我们需要编写一个Array函数，比如pushAtFalsy()，该函数应该包含一个数
2023-11-18

PHP整数数据类型
定义和用法在PHP中，Integer是标量数据类型，代表数字常量，代表整数，不带任何
2023-11-18

PHP错误控制运算符
介绍在PHP中，将@符号定义为错误控制运算符。当它以任何表达式为前缀时，PHP解析器
2023-11-18

PHP类型杂耍详解
定义和用法PHP被称为动态类型语言。在PHP中既不需要也不支持变量的显式类型声明。与
2023-11-18

PowerShell版本7中引入了哪些新的Null运算符？
PowerShell版本7引入了一些新的空运算符。它们如下。空合并运算符-??空条件
2023-11-18

PowerShell中$ ErrorView的用途是什么？
$Errorview变量确定PowerShell中错误消息的显示格式。在PowerS
2023-11-18

PHP执行运算符
介绍PHP中定义了一个执行运算符。一个字符串内部背蜱S（``）被视为一个DOS命令（
2023-11-18