Tagged "hadoop"

Hadoop SecondaryNameNode 、CheckpointNode 與 Backup Node 觀念整理

為了要管理 lab 裡的 Hadoop cluster,針對 Hadoop 的 NameNode、SecondaryNameNode、CheckpointNode 與 BackupNode 做個了survay。

NameNode

Hadoop 的 metadata 是存放在運行 Namenode 的 server 的 memory 裡面,而 Namenode 的工作就是將 clients 對 metadata 的讀寫修改紀錄在edits裡。

當 Namenode 被啟動的時候,會先合併 HDFS 上的 fsimage 與 edits,取得完整的 metadata。此時,原本的 fsimage 會被更新。

之後,在 NameNode 運作的期間,client 對 metadata 的 access 還是只會記錄在新的 edits 裡,直到下一次 NameNode restart 的時候,周而復始的更新 fsimage、產生新的 edits。

Read more...