Однак сортування по відрах має кілька обмежень менш підходить для деяких типів даних. Наприклад, припустимо, що дані розподілені нерівномірно. У цьому випадку деякі сегменти можуть містити велику кількість елементів, а інші — дуже мало, що призводить до неефективності процесу сортування.20 квітня 2023 р.
«Коли ми занадто сильно зосереджуємось на своєму списку відер, він привертає нашу увагу до всього того, чого ми не маємо в даний момент, що, у свою чергу, змушує нас почуватися погано щодо нашого життя та невдячними за те, що ми маємо.”
Відро Сортування є не підходить для сортування довільних рядків, наприклад; однак його можна використовувати для сортування набору рівномірно розподілених чисел з плаваючою комою в діапазоні [0,1).
мінуси
- Доступ до цих місць ускладнений. Вийти та зайти в машину може бути складно.
- Ковшоподібні сидіння можуть дратувати та бути незручними під час довгих поїздок.
- Вони настільки вийшли з моди, що ви можете почуватися трохи старими, керуючи ними.
Обмеження сегментування Spark SQL: сегментування Spark SQL вимагає сортування за часом читання, що значно погіршує продуктивність. Коли Spark записує дані в таблицю групування, він може генерувати десятки мільйонів маленьких файлів, які не підтримуються HDFS.
Недоліки Bucket Sort: Включає висока складність простору завдяки створенню окремих «бакетів», різної складності часу залежно від того, як дані розподіляються по сегментах, і залежності від розподілу вхідних елементів.