pyspark 本地远程连接hive

2022-12-30 09:46:57

#配置本地spark的环境，必须放在最前面
import findspark
findspark.init()
print(findspark.find())

from pyspark.sql import SparkSession

#新建sparksession
sparksession = SparkSession.builder.master("local[*]").appName("hive_test_1") \
    .config("hive.metastore.uris","thrift://158.158.4.49:9083") \
    .enableHiveSupport().getOrCreate()

#从hive读数据
sql_1="select * from test.biao_4"
df1 = sparksession.sql(sql_1)
df1.show()

#数据写入到hive中
df2 = sparksession.createDataFrame((
    (1, "asf"),
    (2, "2143"),
    (3, "rfds")
)).toDF("label", "sentence")
df2.write.mode("overwrite").saveAsTable("test.biao_6")

有些文章说，需要hdfs，hive的xml文件到项目中，奇怪，本人测试都不需要，非常轻松，比java spark本地操作hive要简单的多
java spark本地操作hive可查看博文
https://blog.csdn.net/qq_41712271/article/details/103206827

作者：小哇666
原文链接：https://blog.csdn.net/qq_41712271/article/details/116991415
更新时间：2022-12-30 09:46:57

相关文章

深入学习SpringBoot中的应用事件和监听器
1 引言在项SpringBoot目中我们经常需要一些监听器，通过监听一些事件做出相应的反应，并确保组件在生命周
2022-07-25

Javascript如何实现继承？各种继承方法的优缺点是什么？
一、继承是什么？继承（inheritance）是面向对象软件技术当中的一个概念。如果一个类别B“继承自”另一个
2022-07-25

前端深拷贝
前端深拷贝最直白的
2022-07-25

使用CSS隐藏元素滚动条
如何隐藏滚动条，同时仍然可以在任何元素上滚动？首先，如果需要隐藏滚动条并在内容溢出时显示滚动条，只需要设置ov
2022-07-25

随机文章

聚类算法及python实现——层次聚类
聚类算法及python实现——层次聚类构建二叉树步骤step1：将每个样品都看作一类step2：计算每个样品两
2023-03-28

jdk命令行工具（jps+jstat+jinfo+jmap+jstack）
jps：虚拟机进程状况工具可以列出正在运行的虚拟机进程，并显示虚拟机执行主类（main class，cl
2023-03-28

java获取spring配置文件_Spring读取配置文件 @Value
最近在学习spring如何读取配置文件，记录下方便自己也方便别人；大致分为两类吧，一种的思路是利用spring
2023-03-28

用JS简单实现一个计算器
JS点击事件具体要求如下：（1）单击“计算”按钮后，删除两个文本框左右两边的空格，删除空格后，判断输入框中是否
2023-03-28

文章导航