數據倉庫工具,可以把Hadoop下的原始結構化數據變成Hive中的表。
支持一種與SQL幾乎完全相同的語(yǔ)言HiveQL,除了不支持更新、索引和事務(wù)。
可以看成是從SQL到Map-Reduce的映射器。
提供shell、JDBC/ODBC、thrift、Web等接口。
一、內嵌模式安裝
這樣安裝的元數據保持在內嵌的Derby數據庫中,只能允許一個(gè)會(huì )話(huà)連接,只適用于簡(jiǎn)單的測試。
1、解壓Hive
[coder@h1 ~]$ tar -zxvf hive-0.10.0.tar.gz
2、配置環(huán)境變量/etc/profile
加入Hive的安裝目錄,并把Hive的bin目錄配置到PATH
HIVE_HOME=/home/coder/hive-0.10.0 PATH=$HADOOP_INSTALL/bin:$PIG_INSTALL/bin:$JAVA_HOME/bin:$HIVE_HOME/bin:$PATH
執行 source /etc/profile命令,使得配置生效
3、新建Hive所需目錄
在HDFS上建立/tmp和/user/hive/warehouse目錄,并賦予組用戶(hù)寫(xiě)權限。這是Hive默認的數據文件存放目錄,可以在hive-site.xml文件中配置。
[coder@h1 hadoop-0.20.2]$ bin/hadoop fs -mkdir /tmp [coder@h1 hadoop-0.20.2]$ bin/hadoop fs -mkdir /user/hive/warehouse [coder@h1 hadoop-0.20.2]$ bin/hadoop fs -chmod g+w /tmp [coder@h1 hadoop-0.20.2]$ bin/hadoop fs -chmod g+w /user/hive/warehouse
4、輸入hive命令,出現類(lèi)似下面的內容,說(shuō)明安裝成功。
[coder@h1 hadoop-0.20.2]$ hive
Logging initialized using configuration in jar:file:/home/coder/hive-0.10.0/lib/hive-common-0.10.0.jar!/hive-log4j.properties
Hive history file=/tmp/coder/hive_job_log_coder_201305072118_1272944282.txt
hive>
hive> show tables; OK Time taken: 24.479 seconds hive> exit;
二、獨立模式安裝
支持多用戶(hù)會(huì )話(huà),需要一個(gè)獨立的元數據庫,常用的是使用MySQL作為元數據庫。
1、啟動(dòng)MySQL
[root@h1 ~]# service mysqld start Starting mysqld: [ OK ] [root@h1 ~]#
2、為Hive建立相應的MySQL賬號
[root@h1 ~]# mysql Welcome to the MySQL monitor. Commands end with ; or g. Your MySQL connection id is 2 Server version: 5.1.66 Source distribution Copyright (c) 2000, 2012, Oracle and/or its affiliates. All rights reserved. Oracle is a registered trademark of Oracle Corporation and/or its affiliates. Other names may be trademarks of their respective owners. Type 'help;' or 'h' for help. Type 'c' to clear the current input statement. mysql> create user 'hive' identified by '123456'; Query OK, 0 rows affected (0.00 sec) mysql> GRANT ALL PRIVILEGES ON *.* TO 'hive'@'localhost' IDENTIFIED BY '123456' WITH GRANT OPTION; Query OK, 0 rows affected (0.00 sec) mysql> flush privileges; Query OK, 0 rows affected (0.00 sec) mysql> exit Bye [root@h1 ~]#
然后從客戶(hù)端用hive賬號登陸MySQL
3、建立Hive專(zhuān)用元數據庫
mysql> create database hive; |
4、配置Hive
在Hive安裝目錄的conf目錄下,將hive-default.xml.template復制一份命名為:hive-site.xml
修改以下內容,配置上mysql數據連接、驅動(dòng)、用戶(hù)名和密碼
<property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value> </property> <property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.jdbc.Driver</value> </property> <property> <name>javax.jdo.option.ConnectionUserName</name> <value>hive</value> </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value>123456</value> </property>
5、把mysql的驅動(dòng)包拷貝到Hive安裝路徑下的lib目錄
6、進(jìn)入Hive,沒(méi)報錯說(shuō)明獨立模式安裝成功
[coder@h1 ~]$ hive Logging initialized using configuration in jar:file:/home/coder/hive-0.10.0/lib/hive-common-0.10.0.jar!/hive-log4j.properties Hive history file=/tmp/coder/hive_job_log_coder_201305072212_717503278.txt hive> show tables; OK Time taken: 24.783 seconds hive> exit;