Яка найшвидша реалізація випадкового лісу?

рейнджер це швидка реалізація випадкових лісів (Breiman 2001) або рекурсивного розбиття, особливо підходить для даних великої розмірності. Підтримуються класифікація, регресія та ліси виживання.

Якщо ви хочете прискорити свій випадковий ліс, зменшити кількість оцінювачів. Якщо ви хочете підвищити точність вашої моделі, збільште кількість дерев. Укажіть максимальну кількість функцій, які мають бути включені до кожного розділу вузла. Це дуже залежить від вашого набору даних.

Need for Speed в тренуваннях: XGBoost було оптимізовано, щоб бути швидшим і ефективнішим, ніж Random Forest, особливо при використанні графічних процесорів. Він також добре підходить для розподілених обчислень.

Одна річ, яку слід враховувати під час запуску моделей випадкового лісу на великому наборі даних, це потенційно тривалий час навчання. Наприклад, час, необхідний для запуску цієї першої базової моделі, був приблизно 30 секунд, що не так уже й погано, але, як я незабаром покажу, цей час може швидко зрости.

Крім того, Випадковий ліс має більший час навчання, ніж одне дерево рішень. Ви повинні враховувати це, тому що, коли ми збільшуємо кількість дерев у випадковому лісі, час на навчання кожного також збільшується. Це часто може бути вирішальним, коли в проекті машинного навчання працюють у стислі терміни.

Основне обмеження випадкового лісу полягає в тому Велика кількість дерев може зробити алгоритм надто повільним і неефективним для прогнозів у реальному часі. Загалом ці алгоритми швидко навчаються, але досить повільно створюють прогнози після їх навчання.