- Jak radzisz sobie z niezrównoważonymi danymi szeregów czasowych?
- Jaki jest problem z niezrównoważonymi danymi?
- Jakie jest najlepsze podejście do obsługi niezrównoważonego zestawu danych?
Jak radzisz sobie z niezrównoważonymi danymi szeregów czasowych?
Powszechnym rozwiązaniem ogólnego problemu wydobywania niezrównoważonych zestawów danych jest uciekanie się do strategii ponownego próbkowania. Strategie te zmieniają dystrybucję danych uczenia się w celu zrównoważenia liczby rzadkich i normalnych przypadków, próbując zmniejszyć skośność danych.
Jaki jest problem z niezrównoważonymi danymi?
Nierówne dane są powszechnym problemem w uczeniu maszynowym, co stanowi wyzwania w zakresie korelacji, separacji i oceny klas oraz wynika z słabej wydajności modelu.
Jakie jest najlepsze podejście do obsługi niezrównoważonego zestawu danych?
Powszechnie przyjęta i być może najprostsza metoda radzenia sobie z wysoce równoważonymi zestawami danych nazywa się ponownym próbkowaniem. Polega na usunięciu próbek z klasy większościowej (niedostateczne próbkowanie) i/lub dodania kolejnych przykładów z klasy mniejszościowej (nadmierne próbkowanie).