enter link description here

导读:Hadoop是一个免费的,基于Java的编程框架。它能在分布式计算环境下支持处理大型数据集。

关键词:Hadoop

【TechTarget中国原创】Hadoop是一个免费的,基于Java的编程框架。它能在分布式计算环境下支持处理大型数据集。Hadoop是由Apache软件基金会赞助开发的Apache项目的一部分。    

Hadoop使用map-reduce编程模式,它可以将一个应用程序分解成许多小部分。这些小部分(也称为碎片或块)可以在集群中的任何节点上运行。 Hadoop使应用软件能在有成千上万个节点和数千个太字节的系统中运行。分布式文件系统(DFS)有利于节点间快速的数据传输,并使系统在某个节点运行 失败的情况下能不受干扰继续运行。即使相当数量的节点不运行,灾难性系统出故障的风险也很低。

Hadoop框架的主要参与者包括谷歌, 雅虎和IBM公司,它主要用于应用程序,包括搜索引擎和广告。

Hadoop首选的操作系统是Windows和Linux,但它也可以在BSD和OSX中运 行。Hadoop原来是填充毛绒玩具大象的名字,是由框架创建者的孩子,Doug Cutting,所取。

翻译:徐艳