Zalety i wady wypróbowywania

Jaki jest problem z nadpróbkowaniem?
Dlaczego powinniśmy używać nadpróbkowania?
Czy to dobry pomysł, aby nadmiernie próbować?
Omadza się dobrze w uczeniu maszynowym?

Jaki jest problem z nadpróbkowaniem?

Losowe nadpróbkowanie może zwiększyć prawdopodobieństwo wystąpienia nadmiernego dopasowania, ponieważ wykonuje dokładne kopie przykładów klasy mniejszościowej. W ten sposób symboliczny klasyfikator może na przykład konstruować reguły, które są najwyraźniej dokładne, ale w rzeczywistości obejmować jeden powtórzony przykład.

Dlaczego powinniśmy używać nadpróbkowania?

Oversampling to praktyka wyboru respondentów, aby niektóre grupy stanowią większy udział w próbie ankiety niż w populacji. Ponowne pobieranie małych grup może być trudne i kosztowne, ale pozwala ankietom rzucić światło na grupy, które w przeciwnym razie byłyby zbyt małe, aby się zgłosić.

Czy to dobry pomysł, aby nadmiernie próbować?

Oversampling to znany sposób na potencjalną poprawę modeli przeszkolonych w zakresie niezrównoważonych danych. Ale ważne jest, aby pamiętać, że nieprawidłowe nadpróbkowanie może prowadzić do myślenia, że model uogólni się lepiej niż w rzeczywistości.

Omadza się dobrze w uczeniu maszynowym?

Losowe nadmierne próbkowanie

W przypadku algorytmów uczenia maszynowego dotkniętych dystrybucją, takimi jak sztuczne sieci neuronowe i SVM, jest to wysoce skuteczna technika.