Что такое Apache Hadoop?

Apache Hadoop - это название для набора алгоритмов больших данных, распределенного хранения и программного обеспечения для распределенной обработки, созданного Apache Software Foundation. Он предназначен для поддержки приложений обслуживания больших объемов данных; автоматическая обработка аппаратных сбоев без потери обслуживания.

Hadoop использует распределенную файловую систему, известную как HDFS, и программное обеспечение для обработки больших наборов данных, известных как MapReduce. Чрезвычайно большие файлы разбиты на части, обычно по 64 или 128 МБ каждый. Программное обеспечение в основном написано на Java, а некоторый низкоуровневый код написан на C.

Сервер Apache, Большие данные, Сервис, Программное обеспечение