使用python连接hive数仓

妚簫尐 · 发表于 2024-3-8 03:28:06

1 版本参数

查看hadoop和hive的版本号

复制代码

查看java版本号

复制代码

查看mysql版本号

复制代码

2 启动环境

启动hadoop集群

start-all.sh
# WARNING: HADOOP_SECURE_DN_USER has been replaced by HDFS_DATANODE_SECURE_USER. Using value of HADOOP_SECURE_DN_USER.
# Starting namenodes on [ml]
# 上一次登录：三 3月 6 23:34:59 CST 2024tty1 上
# Starting datanodes
# 上一次登录：三 3月 6 23:37:56 CST 2024pts/0 上
# Starting secondary namenodes [ml]
# 上一次登录：三 3月 6 23:38:01 CST 2024pts/0 上
# Starting resourcemanager
# 上一次登录：三 3月 6 23:38:30 CST 2024pts/0 上
# Starting nodemanagers
# 上一次登录：三 3月 6 23:39:01 CST 2024pts/0 上

复制代码

查看hadoop集群状态

复制代码

启动hiveserver2服务

复制代码

检测hiveserver2状态

复制代码

检测thrift端口号状态

复制代码

3 安装环境

安装python第三方库

复制代码

使用everything检索sasl2文件夹并打开该文件夹
在open git bash here窗口查看sasl2里面的文件

复制代码

创建C:/CMU/bin/sasl2文件夹
拷贝当前文件夹的dll文件到C:/CMU/bin/sasl2文件夹中

复制代码

4 读取数据

编写python脚本连接hive数仓

复制代码

能看到数据库名记录就证明连接成功

来源:https://www.cnblogs.com/mlcode/p/18060136/pyhive
免责声明：由于采集信息均来自互联网，如果侵犯了您的权益，请联系我们【E-Mail:cb@itdo.tech】我们会及时删除侵权内容，谢谢合作！