首页 最新 热门 推荐

  • 首页
  • 最新
  • 热门
  • 推荐

保姆式 Hadoop之hive数据仓库的搭建与使用

  • 25-01-18 13:23
  • 4466
  • 7465
blog.csdn.net

一、准备工作

1、打开VMware Workstation里的Hadoop1、Hadoop2、Hadoop3这三台虚拟机;

2、需要hive的压缩包,apache-hive-3.1.1-bin.tar.gz;

3、需要以下有关MySQL的压缩包,

mysql-community-common-5.7.36-1.el7.x86_64.rpm、

mysql-community-libs-5.7.36-1.el7.x86_64.rpm、

mysql-community-client-5.7.36-1.el7.x86_64.rpm 、

mysql-community-server-5.7.36-1.el7.x86_64.rpm

mysql-connector-java-5.1.46;

4、远程连接工具Xftp8,Xftp-8.0.0057p.exe;

5、保证主机网络通畅。

二、实验步骤

1、环境为Hadoop

如果有搭建HA-Hadoop,那么请回到刚搭建完Hadoop的快照那里。因为HA-Hadoop环境并不稳定,我们并不需要这个环境。

        (以下为例子:)

19d26d25e8cd41f0808eb48e5d90e4b0.jpeg

2、安装Hive

(1)上传hive安装包

        首先打开xftp8,其次将xftp8与Hadoop1相连接,然后将hive的安装包拖动到Hadoop1中。

7c48e425f6354105aa59884bc8af26b7.png

(2)解压hive安装包

解压命令如下:

tar -zxvf /root/apache-hive-3.1.1-bin.tar.gz -C /export/servers/

重命名hive解压后的文件,命令如下:

  1. cd /export/servers/
  2. mv apache-hive-3.1.1-bin hive-3.1.1

(3)同步jar包

将 Hive 中的 guava-19.0.jar 替换为 Hadoop 中的 guava-27.0-jre.jar

A.切换到Hadoop 中的 guava-27.0-jre.jar所在的文件目录

cd /export/servers/hadoop-3.3.1/share/hadoop/common/lib/

B.复制guava-27.0-jre.jar到hive相应的文件目录

cp guava-27.0-jre.jar /export/servers/hive-3.1.1/lib/

C.然后删除guava-19.0.jar

rm /export/servers/hive-3.1.1/lib/guava-19.0.jar

39a801373cd94d63b7ed9bda804e508c.png

(4)配置环境变量

vi /etc/profile

进入文件后shift+g到达文件底部,然后添加以下内容:

  1. export HIVE_HOME=/export/servers/hive-3.1.1
  2. export PATH=$PATH:$HIVE_HOME/bin

0b0308660da14091935558a1af3b0595.png

配置完毕后,初始化环境变量:

source /etc/profile

(5)初始化

命令如下,

schematool -initSchema -dbType derby

(出现如下图所示,即为初始化成功)

89035229503c4a239254ab70e8ec5112.png

(6)连接hive服务

A.启动Hadoop集群

B.启动hive

  1. start-all.sh
  2. hive

(下图为启动成功的图片)

20b4e2ecb1424e8fa9c6709c601bc7c4.png

3、安装MySQL

(1)卸载 MariaDB

查看mariadb的版本号并卸载:

  1. rpm -qa | grep mariadb
  2. rpm -e --nodeps mariadb-libs-5.5.68-1.el7.x86_64

1a13608ab4f244c3aff3a0aba073fbcc.png

(2)安装mysql

A.上传MySQL文件

74c7bc42578d4c94a14d8854cbde035c.png

B.使用 rpm 安装 mysql

  1. rpm -ivh mysql-community-common-5.7.36-1.el7.x86_64.rpm
  2. rpm -ivh mysql-community-libs-5.7.36-1.el7.x86_64.rpm
  3. rpm -ivh mysql-community-client-5.7.36-1.el7.x86_64.rpm
  4. rpm -ivh mysql-community-server-5.7.36-1.el7.x86_64.rpm

(下图为安装成功的图示)

6404f46a5ae6406fb28c53ad8a56da74.png

C.添加中文支持

  1. vi /etc/my.cnf
  2. # 添加内容如下:
  3. default-storage-engine=innodb
  4. innodb_file_per_table
  5. collation-server=utf8_general_ci
  6. init-connect='SET NAMES utf8'
  7. character-set-server=utf8

(3)启动 mysql 服务

  1. # 启动 mysql 服务
  2. systemctl start mysqld
  3. # 查看状态
  4. systemctl status mysqld

 ad45ba8636a640c9b10a753db29696fd.png

(4)获取初始密码

cat /var/log/mysqld.log | grep password

(下图为获取初始密码的图示)

f11dbdf374a14d7b84c6f12aad0ddd98.png

(5)登录MySQL

  1. mysql -uroot -p’--wRd+JB4oh-’
  2. # 修改密码:
  3. alter user 'root'@'localhost' identified by 'Password@123';
  4. Flush privileges;

28f470d3252d4d08b9d933c99f980f0e.png

(6)修改 hive-site.xml(直接创建 hive-site.xml文件就行)

A.切换目录:cd /export/servers/hive-3.1.1/conf/

B.vi编辑配置文件:vi hive-site.xml

C.添加内容如下:

  1. <configuration>
  2. <property>
  3. <name>javax.jdo.option.ConnectionURL</name>
  4. <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true&amp;useSSL=false</value>
  5. </property>
  6. <property>
  7. <name>javax.jdo.option.ConnectionDriverName</name>
  8. <value>com.mysql.jdbc.Driver</value>
  9. </property>
  10. <property>
  11. <name>javax.jdo.option.ConnectionUserName</name>
  12. <value>root</value>
  13. </property>
  14. <property>
  15. <name>javax.jdo.option.ConnectionPassword</name>
  16. <value>Password@123</value>
  17. </property>
  18. </configuration>

(7)上传 connector

cp /root/mysql-connector-java-5.1.46.jar /export/servers/hive-3.1.1/lib/

(8)初始化数据库

schematool -initSchema -dbType mysql

4、Hive shell 命令行的使用

(1)连接 hive

hive

(2)创建/查看/使用数据库

  1. create database testDB; # 创建数据库
  2. show databases; # 查看数据库
  3. desc database testDB; # 使用数据库
  4. drop database testDB; # 删除数据库

 bbacd29d13044e37b3a981d103cba8e0.png

(3)创建表

  1. # A.创建数据库itcast,
  2. create database itcast;
  3. # B.创建表managed_table,
  4. create table if not exists
  5. itcast.managed_table(
  6. dept_id INT comment "This is deptid",
  7. staff_id INT comment "This is staffid",
  8. staff_name STRING comment "This is staffname",
  9. staff_age INT comment "This is staffage",
  10. salary FLOAT comment "This is staff salary",
  11. hobby ARRAY<STRING> comment "This is staff hobby",
  12. base_info MAP<STRING, INT> comment "Record height and weight",
  13. person_info STRUCT<marry:STRING,children:STRING>)
  14. row format delimited
  15. fields terminated by ','
  16. collection items terminated by '_'
  17. map keys terminated by ':'
  18. lines terminated by '\n'
  19. tblproperties("comment"="This is a managed table");

 79e245c7636f42f7aa9c1f5434c704f5.png

(4)在HDFS文件系统中查看表的目录

(也就是在浏览器中搜索:http://192.168.1.132:9870)

eac13a691c444703a367e3ee72665cf5.png

注:本文转载自blog.csdn.net的章鱼皇子的文章"https://blog.csdn.net/2301_80279730/article/details/144650631"。版权归原作者所有,此博客不拥有其著作权,亦不承担相应法律责任。如有侵权,请联系我们删除。
复制链接
复制链接
相关推荐
发表评论
登录后才能发表评论和回复 注册

/ 登录

评论记录:

未查询到任何数据!
回复评论:

分类栏目

后端 (14832) 前端 (14280) 移动开发 (3760) 编程语言 (3851) Java (3904) Python (3298) 人工智能 (10119) AIGC (2810) 大数据 (3499) 数据库 (3945) 数据结构与算法 (3757) 音视频 (2669) 云原生 (3145) 云平台 (2965) 前沿技术 (2993) 开源 (2160) 小程序 (2860) 运维 (2533) 服务器 (2698) 操作系统 (2325) 硬件开发 (2492) 嵌入式 (2955) 微软技术 (2769) 软件工程 (2056) 测试 (2865) 网络空间安全 (2948) 网络与通信 (2797) 用户体验设计 (2592) 学习和成长 (2593) 搜索 (2744) 开发工具 (7108) 游戏 (2829) HarmonyOS (2935) 区块链 (2782) 数学 (3112) 3C硬件 (2759) 资讯 (2909) Android (4709) iOS (1850) 代码人生 (3043) 阅读 (2841)

热门文章

111
大数据
关于我们 隐私政策 免责声明 联系我们
Copyright © 2020-2025 蚁人论坛 (iYenn.com) All Rights Reserved.
Scroll to Top