Sqoop2 설치 1.99.4 with Hadoop 2.9.0 (CentOS 7.4)


=========스쿱2 웹에서 다운로드 경로=========
처음에 1.99.7을 설치했었는데 mariadb 혹은 mysql과 연결시 warnning이 나면서 잘안됐다jdbc 문제인가 싶었는데 1.99.6으로 내리니깐 잘됨...쩝..
그런데 한가지 더  HUE랑 연동하려니 1.99.6도 커넥터는 보이나 잡을 생성 할 수 없다고 에러가 남
이것저것 해보니 1.99.4가 커넥터도 나오고 잡도 수행이 된다.


주소 : sqoop.apache.org

=========터미널 다운로드 경로=========

su - root (/home에 write 권한을 root만 주었기 때문에)

cd /home

wget https://archive.apache.org/dist/sqoop/1.99.6/sqoop-1.99.6-bin-hadoop200.tar.gz


=========압축 제거=========

tar -zxvf ./sqoop-1.99.6-bin-hadoop200.tar.gz 

=========/home/sqoop으로 이관=========
mv ./soop* /home/sqoop
chown -R hadoop:hadoop /home/sqoop

========환경파일 수정==========

.bashrc  에 넣어도 되겠지만 난 그냥 /etc/profile에 모두 때려 넣었다.

vi /etc/profile

난 아래 내용이 이미 hadoop 설치할때 들어가 있다.

export HADOOP_HOME=/home/hadoop
export HADOOP_COMMON_HOME=${HADOOP_HOME}
export HADOOP_HDFS_HOME=${HADOOP_HOME}
export HADOOP_MAPRED_HOME=${HADOOP_HOME}
export HADOOP_YARN_HOME=${HADOOP_HOME}

스쿱을 위해 아래 3줄을 더 추가한다

export SQOOP_HOME=/home/sqoop

export SQOOP_SERVER_EXTRA_LIB=/var/lib/sqoop2

/export PATH=$PATH:$SQOOP_HOME/bin

=========하둡 환경 파일 수정=========
su - hadoop


cd ~

cd etc/hadoop

vi core-site.xml 

아래 내용을 추가 한다.
 hadoop 부분에 sqoop을 기동시키는 user로 작성

<property>
        <name>hadoop.proxyuser.hadoop.hosts</name>
        <value>*</value>
</property>
<property>
        <name>hadoop.proxyuser.hadoop.groups</name>
        <value>*</value>
</property>
</configuration>

vi container-executor.cfg

아래와 같이 수정한다.

allowed.system.users=hadoop##comma separated list of system users who CAN run applications



####=========jar 파일 복사========= 

(1.99.6에서는 이걸 안하고 카탈리나를 수정한다..)

#su - root
#mkdir /var/lib/sqoop2
#cp -R $HADOOP_HOME/share/hadoop/common/*.jar /var/lib/sqoop2/
#cp -R $HADOOP_HOME/share/hadoop/common/lib/*.jar /var/lib/sqoop2/
#cp -R $HADOOP_HOME/share/hadoop/hdfs/*.jar /var/lib/sqoop2/
#cp -R $HADOOP_HOME/share/hadoop/hdfs/lib/*.jar /var/lib/sqoop2/
#cp -R $HADOOP_HOME/share/hadoop/mapreduce/*.jar /var/lib/sqoop2/
#cp -R $HADOOP_HOME/share/hadoop/mapreduce/lib/*.jar /var/lib/sqoop2/
#cp -R $HADOOP_HOME/share/hadoop/yarn/*.jar /var/lib/sqoop2/
#cp -R $HADOOP_HOME/share/hadoop/yarn/lib/*.jar /var/lib/sqoop2/
#chown -R hadoop:hadoop /var/lib/sqoop2

==================카탈리나 수정

vi /home/sqoop/server/conf/catalina.properties

common.loader=${catalina.base}/lib,${catalina.base}/lib/*.jar,/home/sqoop/server/lib,/home/sqoop/server/lib/*.jar,/home/sqoop/server/lib/../lib/*.jar,/home/hadoop/share/hadoop/common/*.jar,/home/hadoop/share/hadoop/common/lib/*.jar,/home/hadoop/share/hadoop/hdfs/*.jar,/home/hadoop/share/hadoop/hdfs/lib/*.jar,/home/hadoop/share/hadoop/mapreduce/*.jar,/home/hadoop/share/hadoop/mapreduce/lib/*.jar,/home/hadoop/share/hadoop/yarn/*.jar,/home/hadoop/share/hadoop/yarn/lib/*.jar,/home/hive/lib/*.jar

===========================

vi /home/sqoop/server/conf/sqoop.properties

org.apache.sqoop.submission.engine.mapreduce.configuration.directory=/home/hadoop/etc/hadoop

=========구동=========

su - hadoopcd /home/sqoop

업그레이드

./bin/sqoop2-tool upgrade

검증

./bin/sqoop2-tool verify

시작

./bin/sqoop2-server start



./bin/sqoop2-shell

종료

./bin/sqoop2-server stop


댓글

이 블로그의 인기 게시물

LSF (GPU 스케쥴링) 명령어 사용법

CentOS 7 리부팅 없이 새 디스크 인식 (find a new disk without reboot)

python에서 hive 사용