- Jak radzisz sobie z brakującymi danymi w klasyfikacji?
- Ile brakujących danych jest dopuszczalne w uczeniu maszynowym?
- Jak obsługiwać brakujące dane kategoryczne w uczeniu maszynowym?
- Czy KNN działa z brakującymi wartościami?
Jak radzisz sobie z brakującymi danymi w klasyfikacji?
Jednym ze sposobów obsługi brakujących wartości jest usunięcie wierszy lub kolumn z wartościami zerowymi. Jeśli jakieś kolumny mają więcej niż połowę wartości jako null, możesz upuścić całą kolumnę. W ten sam sposób wiersze można również upuścić, jeśli mają jedną lub więcej wartości kolumn jako null.
Ile brakujących danych jest dopuszczalne w uczeniu maszynowym?
Ile brakuje danych? Ważny jest ogólny procent braku danych. Zasadniczo, jeśli brakuje mniej niż 5% wartości, dopuszczalne jest ich ignorowanie (Ref).
Jak obsługiwać brakujące dane kategoryczne w uczeniu maszynowym?
Zastępowanie brakujących danych najczęstszymi wartościami
Gdy brakujące wartości pochodzą z kategorycznych kolumn, takich jak ciąg lub numeryczne, brakujące wartości można zastąpić najczęstszą kategorią. Jeśli liczba brakujących wartości jest bardzo duża, można ją zastąpić nową kategorią.
Czy KNN działa z brakującymi wartościami?
KNN jest algorytmem, który jest przydatny do dopasowywania punktu do najbliższych k sąsiedzi w przestrzeni wielowymiarowej. Można go używać do danych, które są ciągłe, dyskretne, porządkowe i kategoryczne, co sprawia, że jest to szczególnie przydatne do radzenia sobie z wszelkiego rodzaju brakującymi danymi.