Hadoop是一个可以实现google,baidu等运算能力的分布式运算技术,可以使用成千上万个计算机协同工作,实现非常强大的运算功能。
Hadoop是一个是分布式云计算机平台,可以使用开源平台实现功能非常强大的企业应用。
大量的计算机在一起时,可以实现非常强大的数据存储功能。
在实际应用中,Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的,因为它假设计算元素和存储会失败,因此它维护三个或以上的工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。Hadoop 还是可伸缩的,可以实现数百到几万台计算机的协同工作,能够处理 PB 级数据。