2023.06.20 (Mon) ํ์ต์ ๋ฆฌ
#Zeppelin #Spark
์ด์ ๊ธ์์ spark, zeppelin์ docker๋ก ์ค์นํ์ฌ ๊ฐ๋จํ ํ์ฉํด๋ดค๋๋ฐ,
์ด๋ฒ์๋ hdfs์์ ์ฐ๋์ ์ํด ๋ก์ปฌ (ubuntu) ํ๊ฒฝ์์ ์ค์นํ๊ณ ์ ํจ
1. Zeppelin ์ค์น
- ์ค์น ํ์ผ ๋ค์ด ๋ฐ ์์ถ ํด์
cd tmp # ์์ํ์ผ๋ก ์ด๋ ํ ์ค์นํ์ผ ๋ค์ด๋ก๋
wget https://dlcdn.apache.org/zeppelin/zeppelin-0.10.1/zeppelin-0.10.1-bin-all.tgz
tar zxvf zeppelin-0.10.1-bin-all.tgz # ์์ถ ํด์ ๋ฐ ์ค์น ์งํ
mv zeppelin-0.10.1-bin-al /home/app/ # ๊ฒฝ๋ก ์ด๋
- (์ฐธ๊ณ ) path ์ค์
server port ๋ณ๊ฒฝ ์ํ ์, zeppelin-site.xml์ ์๋ ๋ด์ฉ ์์
cd /home/app/zeppelin-0.10.1-bin-al/conf
cp zeppelin-site.xml.template zeppelin-site.xml
vi zeppelin-site.xml
# zeppelin-site.xml
<property>
<name>zeppelin.server.addr</name>
<value>0.0.0.0</value>
<description>Server binding address</description>
</property>
<property>
<name>zeppelin.server.port</name> # port ๋ณ๊ฒฝ
<value>7777</value>
<description>Server port.</description>
</property>
- ์คํ
# zeppelin-0.10.1-bin-all/bin/
zeppelin-daemon.sh start
2. Spark ์ค์น
2-1. spark ์ค์น ๋ฐ ์คํ
- ์ค์น ํ์ผ ๋ค์ด ๋ฐ ์์ถ ํด์
cd tmp # ์์ํ์ผ๋ก ์ด๋ ํ ์ค์นํ์ผ ๋ค์ด๋ก๋
wget https://archive.apache.org/dist/spark/spark-2.4.0/spark-2.4.0-bin-hadoop2.7.tgz
tar zxvf spark-2.4.0-bin-hadoop2.7.tgz # ์์ถ ํด์ ๋ฐ ์ค์น ์งํ
mv spark-2.4.0-bin-hadoop2.7 /home/app/ # ๊ฒฝ๋ก ์ด๋
- configure ํ์ผ ์์ฑ
cd /home/app/spark-2.4.0-bin-hadoop2.7/conf
cp spark-env.sh.template spark-env.sh
- path ์ค์
vi ~/.zshrc # vim ํ์ผ์ ์ด์ด ์๋ ๋ด์ฉ ์ถ๊ฐ
# spark env
export SPARK_HOME=/home/app/spark-2.4.0-bin-hadoop2.6
export PATH=$SPARK_HOME/bin:$SPARK_HOME/sbin:$PATH
- ์คํ
# /home/app/spark-2.4.0-bin-hadoop2.6/sbin
start-master.sh
start-slaves.sh
2-2. Spark Web UI (Spark Master) Port ๋ณ๊ฒฝ
Spark Master Web UI์ port ๋ฒํธ๋ ๊ธฐ๋ณธ์ ์ผ๋ก 8080์ผ๋ก, ๊ธฐ์กด์ ์ค์น๋์ด์๋ airflow์ ์ค๋ณต๋๋ฏ๋ก port๋ฅผ ๋ณ๊ฒฝํ์์
์์์ template๋ฅผ ๋ณต์ฌํ์ฌ ์์ฑํ spark-env.sh์ ์๋ ๋ด์ฉ์ ์์ฑํ์ฌ ๋ณ๊ฒฝ ๊ฐ๋ฅ
cd $SPARK_HOME/conf
vi spark-env.sh
# spark-env.sh์ ์๋ ๋ด์ฉ ์์ฑ
export SPARK_MASTER_WEBUI_PORT=80801
'๐ Data > Engineering' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
| [Hive] Hive table์์ partition ์ฌ์ฉํ๊ธฐ (0) | 2023.06.14 |
|---|---|
| [Pig] Pig ์ค์น ๋ฐ ๊ฐ์ (0) | 2023.06.13 |
| [Airflow] HiveServer2Hook, HiveCliHook ์ฌ์ฉํ์ฌ Hive์ ์ ๊ทผํ๊ธฐ (0) | 2023.06.12 |
| [Airflow] Airflow์ Python Operator / Hive Operator ์ฌ์ฉํ๊ธฐ (0) | 2023.06.09 |
| [Sqoop] Sqoop ์ค์น ๋ฐ ๊ฐ์ (0) | 2023.06.08 |