時髦館

位置:首頁 > 生活 > 經驗

hadoop是做什麼的 hadoop的資料

經驗2.06W
hadoop是做什麼的 hadoop的資料

1、Hadoop主要是分佈式計算和存儲的框架,所以Hadoop工作過程主要依賴於HDFS(Hadoop Distributed File System)分佈式存儲系統和Mapreduce分佈式計算框架。

2、分佈式存儲系統HDFS中工作主要是一個主節點namenode(master)(hadoop1.x只要一個namenode節點,2.x中可以有多個節點)和若干個從節點Datanode(數據節點)相互配合進行工作。

3、HDFS主要是存儲Hadoop中的大量的數據,namenode節點主要負責的是:接收client用戶的操作請求,這種用戶主要指的是開發工程師的Java代碼或者是命令客戶端操作。維護文件系統的目錄結構,主要就是大量數據的關係以及位置信息等。管理文件系統與block的關係。

4、Hadoop中大量的數據爲了方便存儲和管理主要是以block塊(64M)的形式儲存。一個文件被分成大量的block塊存儲之後,block塊之間都是有順序關係的,這個文件與block之間的關係以及block屬於哪個datanode都是有namenode來管理。

標籤:hadoop