- Jaki jest problem z nadpróbkowaniem?
- Dlaczego powinniśmy używać nadpróbkowania?
- Czy to dobry pomysł, aby nadmiernie próbować?
- Omadza się dobrze w uczeniu maszynowym?
Jaki jest problem z nadpróbkowaniem?
Losowe nadpróbkowanie może zwiększyć prawdopodobieństwo wystąpienia nadmiernego dopasowania, ponieważ wykonuje dokładne kopie przykładów klasy mniejszościowej. W ten sposób symboliczny klasyfikator może na przykład konstruować reguły, które są najwyraźniej dokładne, ale w rzeczywistości obejmować jeden powtórzony przykład.
Dlaczego powinniśmy używać nadpróbkowania?
Oversampling to praktyka wyboru respondentów, aby niektóre grupy stanowią większy udział w próbie ankiety niż w populacji. Ponowne pobieranie małych grup może być trudne i kosztowne, ale pozwala ankietom rzucić światło na grupy, które w przeciwnym razie byłyby zbyt małe, aby się zgłosić.
Czy to dobry pomysł, aby nadmiernie próbować?
Oversampling to znany sposób na potencjalną poprawę modeli przeszkolonych w zakresie niezrównoważonych danych. Ale ważne jest, aby pamiętać, że nieprawidłowe nadpróbkowanie może prowadzić do myślenia, że model uogólni się lepiej niż w rzeczywistości.
Omadza się dobrze w uczeniu maszynowym?
Losowe nadmierne próbkowanie
W przypadku algorytmów uczenia maszynowego dotkniętych dystrybucją, takimi jak sztuczne sieci neuronowe i SVM, jest to wysoce skuteczna technika.