Загалом типи ключа та значення введення карти (K1 і V1) відрізняються від типів виводу карти (K2 і V2). Проте вхідні дані зменшення повинні мати ті самі типи, що й вихідні дані карти, хоча типи вихідних даних скорочення можуть знову відрізнятися ( K3 і V3 ).
Формат виводу в MapReduce TextOutputFormat, наприклад, є вихідним форматом за замовчуванням, який виводить записи як звичайні текстові файли, хоча ключові значення можуть бути будь-якого типу та перетворюються на рядки за допомогою методу toString().
MapReduce є структура для обробки розпаралелюваних проблем у великих наборах даних з використанням великої кількості комп’ютерів (вузлів), які спільно називаються кластером (якщо всі вузли знаходяться в одній локальній мережі та використовують подібне обладнання) або сіткою (якщо вузли спільно використовуються географічно та адміністративно…
в основному, Map-Reduce 1.0 було розділено на два великі компоненти – YARN і MapReduce 2.0. YARN відповідає лише за керування та узгодження ресурсів у кластері, а MapReduce 2.0 має лише обчислювальну структуру, також звану робочим циклом, яка виконує логіку на дві частини – відображення та зменшення.
Map-Reduce складається з трьох основних кроків: Відображення, перетасування та скорочення. Простий спосіб подумати про роботу Map-Reduce — це порівняти її з актом «делегування» великого завдання групі людей, а потім об’єднання результатів зусиль кожної людини для отримання остаточного результату.