Hadoop - 基礎架設步驟
Contents
Hadoop 為 Apache 基金會的開源頂級專案,為軟體框架做為分散式儲存及運算,無論是增減加機器都能處理,另具備高可用性、數據副本等能力
機器基本訊息:
- 準備五台機器 (兩台主節點、三台工作節點)
| IP | FQDN | HOSTNAME | 用途 |
|---|---|---|---|
| 192.168.1.30 | test30.example.org | test30 | Master 節點 (Namenode) |
| 192.168.1.31 | test31.example.org | test31 | Master 節點 (ResourceManager) |
| 192.168.1.32 | test32.example.org | test32 | Worker 節點 |
| 192.168.1.33 | test33.example.org | test33 | Worker 節點 |
| 192.168.1.34 | test34.example.org | test34 | Worker 節點 |
-
OS : Ubuntu 18.04
-
資源配置 :
- Cpu : 4 core
- Ram : 8 G
- Disk : 50 G
Tip
如沒有那麼多資源可以使用,偽分布方式建置
建置方式請參考Hadoop - 偽分布式安裝步驟
建置步驟 - 基礎系統初始化:
1. 停用IPv6(管理者身份)
- 檢查一下網路跟監聽的狀態(切換管理者)
|
|

- 修改開機設定檔
|
|

- 更新開機設定檔
|
|

- 重新開機
|
|
- 檢查一下IPv6是否已經停用了
|
|
2. 安裝pip(管理者身份) <– 如不使用 Jupyter 可跳過此步驟
- 安裝python開發工具箱
|
|
- 安裝pip
|
|
3. 建立hadoop帳號(管理者身份)
1.hadoop帳號
|
|
- 檢查是否已經創立
|
|

4. 安裝OpenJDK8(管理者身份)
- 更新倉庫清單
|
|
- 安裝openjdk
|
|
- 確認jdk及jre版本
|
|

- 建立openjdk環境變數腳本
|
|
- 編輯openjdk環境變數
|
|

- 重新載入設定檔,並檢查設定是否正確
|
|

5. 建立無密碼login(Hadoop身份)
- 切換hadoop帳號
|
|
- 打造ssh公鑰及私鑰
|
|


- 將打造好的公鑰複製一份給hadoop
|
|

- 測試一下無密碼登入(不用輸入密碼代表成功了)
|
|
6. 建立Linux hotsts名單(管理者身份)
|
|

Success
如上述步驟都完成,可以下一步驟Hadoop - 安裝及設定
如果你還沒有註冊 Like Coin,你可以在文章最下方看到 Like 的按鈕,點下去後即可申請帳號,透過申請帳號後可以幫我的文章按下 Like,而 Like 最多可以點五次,而你不用付出任何一塊錢,就能給我寫這篇文章的最大的回饋!