Hadoop 為 Apache 基金會的開源頂級專案,為軟體框架做為分散式儲存及運算,無論是增減加機器都能處理,另具備高可用性、數據副本等能力
機器基本訊息:
- 準備五台機器 (兩台主節點、三台工作節點)
IP |
FQDN |
HOSTNAME |
用途 |
192.168.1.30 |
test30.example.org |
test30 |
Master 節點 (Namenode) |
192.168.1.31 |
test31.example.org |
test31 |
Master 節點 (ResourceManager) |
192.168.1.32 |
test32.example.org |
test32 |
Worker 節點 |
192.168.1.33 |
test33.example.org |
test33 |
Worker 節點 |
192.168.1.34 |
test34.example.org |
test34 |
Worker 節點 |
-
OS : Ubuntu 18.04
-
資源配置 :
- Cpu : 4 core
- Ram : 8 G
- Disk : 50 G
建置步驟 - 基礎系統初始化:
1. 停用IPv6(管理者身份)
- 檢查一下網路跟監聽的狀態(切換管理者)
1
2
|
ip addr show
lsof -nPi
|
- 修改開機設定檔
- 更新開機設定檔
1
|
update-grub # update-grub2
|
- 重新開機
- 檢查一下IPv6是否已經停用了
1
2
|
ip addr show
lsof -nPi
|
2. 安裝pip(管理者身份) <– 如不使用 Jupyter 可跳過此步驟
- 安裝python開發工具箱
1
2
|
sudo apt update
sudo apt install python3-dev
|
- 安裝pip
1
2
3
|
#取得最新版pip腳本
wget https://bootstrap.pypa.io/get-pip.py
python3 get-pip.py
|
3. 建立hadoop帳號(管理者身份)
1.hadoop帳號
- 檢查是否已經創立
1
2
3
4
|
grep 'hadoop' /etc/passwd
grep 'hadoop' /etc/group
grep 'hadoop' /etc/shadow
ls -l /home
|
4. 安裝OpenJDK8(管理者身份)
- 更新倉庫清單
- 安裝openjdk
1
|
apt install openjdk-8-jdk
|
- 確認jdk及jre版本
1
2
|
java -version
javac -version
|
- 建立openjdk環境變數腳本
1
|
nano /etc/profile.d/jdk.sh
|
- 編輯openjdk環境變數
1
|
export JAVA_HOME='/usr/lib/jvm/java-8-openjdk-amd64'
|
- 重新載入設定檔,並檢查設定是否正確
1
|
source /etc/profile.d/jdk.sh # . /etc/profile.d/jdk.sh
|
5. 建立無密碼login(Hadoop身份)
- 切換hadoop帳號
- 打造ssh公鑰及私鑰
- 將打造好的公鑰複製一份給hadoop
1
|
ssh-copy-id hadoop@localhost
|
- 測試一下無密碼登入(不用輸入密碼代表成功了)
6. 建立Linux hotsts名單(管理者身份)