
1、Hadoop是一個由Apache基金會所開發的分布式系統基礎架構 。用戶可以在不了解分布式底層細節的情況下,開發分布式程序 。充分利用集群的威力進行高速運算和存儲 。Hadoop實現了一個分布式文件系統(Hadoop Distributed File System),簡稱HDFS 。HDFS有高容錯性的特點,并且設計用來部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)來訪問應用程序的數據 , 適合那些有著超大數據集(large data set)的應用程序 。【Hadoop是什么?其核心由兩大部分組成,分別是什么? hadoop是什么】
2、HDFS放寬了(relax)POSIX的要求,可以以流的形式訪問(streaming access)文件系統中的數據 。Hadoop的框架最核心的設計就是:HDFS和MapReduce 。HDFS為海量的數據提供了存儲,而MapReduce則為海量的數據提供了計算 。
