Apache Hadoop — это программная среда с открытым исходным кодом, которая поддерживает распределенные приложения, интенсивно использующие данные, под лицензией Apache v2. Он позволяет приложениям работать с тысячами вычислительных независимых компьютеров и петабайтами данных.