本文共 3301 字,大约阅读时间需要 11 分钟。
HDFS������������������������������������������������������
HDFS���Hadoop Distributed File System���������������������������������������������������������������������������������������������������������������������������������������������������������HDFS���������������������
HDFS������������
HDFS������������������������������������
- Client������������������������������������������������������������������������
- NameNode������������������������������������������������������������������������������������
- DataNode������������������������������������������������
- Secondary NameNode���������������������������������NameNode��������������� Fault tolerance���
������������������
HDFS������������������������������������������3������������������������������������������������������������������������������
���������������������������������Client���������DataNode��� ���������������������������������������������DataNode��� ��������������������������������������������������������������������������������������������� ������������������
1. ���������������������������
������������������������������������������������������������������������������
Client���������������������������������������NameNode��������������������� NameNode������������������������������������������������������������������������������ NameNode���������������������������������������������������������DataNode��������� Client���DataNode������������������������������������������DataNode��� DataNode������������������������������������������������DataNode��������������������������������������� 2. ���������������������������
������������������������������������������������������������
NameNode���������������������������������������������������������������NameNode��������������������������������������������������� Client������������������������������������������������������������������������DataNode��������������������� ���������������������
NameNode������HDFS���������������������������������������������������������
client������������������NameNode��������������������� NameNode���������editslog��������������������������������������� editslog ��������� client������������������������������������������������NameNode��� NameNode������������������������������������editslog���������������������������������������������fsimage������������������������������������ ���������������������������
���HDFS������NameNode������������������������������������
- editslog������������������������������������
- fsimage������������������ stabilize ���������������
���editslog������������
NameNode���Secondary NameNode������������ checkpoint ��������� onStop���NameNode������������(editslog)��������� Secondary NameNode������NameNode���fsimage���������editslog��� ������������������ fsimage ��������������������� Upload���fsimage���NameNode������������������editslog��������� ���������������
HDFS������������������������������
������������������������������������������������������ ��������������������������������������������� ������������������������������������������ ������������DataNode���������������������������������DataNode��������� ���������������������������������������HDFS������������������������������������(NameNode������������)���������NameNode��������������������� leftovers���������������������������������������������������������