Niezrównoważone dane szeregów czasowych

Jak radzisz sobie z niezrównoważonymi danymi szeregów czasowych?
Jaki jest problem z niezrównoważonymi danymi?
Jakie jest najlepsze podejście do obsługi niezrównoważonego zestawu danych?

Jak radzisz sobie z niezrównoważonymi danymi szeregów czasowych?

Powszechnym rozwiązaniem ogólnego problemu wydobywania niezrównoważonych zestawów danych jest uciekanie się do strategii ponownego próbkowania. Strategie te zmieniają dystrybucję danych uczenia się w celu zrównoważenia liczby rzadkich i normalnych przypadków, próbując zmniejszyć skośność danych.

Jaki jest problem z niezrównoważonymi danymi?

Nierówne dane są powszechnym problemem w uczeniu maszynowym, co stanowi wyzwania w zakresie korelacji, separacji i oceny klas oraz wynika z słabej wydajności modelu.

Jakie jest najlepsze podejście do obsługi niezrównoważonego zestawu danych?

Powszechnie przyjęta i być może najprostsza metoda radzenia sobie z wysoce równoważonymi zestawami danych nazywa się ponownym próbkowaniem. Polega na usunięciu próbek z klasy większościowej (niedostateczne próbkowanie) i/lub dodania kolejnych przykładów z klasy mniejszościowej (nadmierne próbkowanie).