Ile współczynników MFCC powinienem użyć?
W praktyce pierwsze 8–13 współczynników MFCC są używane do przedstawienia kształtu widma. Jednak niektóre aplikacje wymagają więcej współczynników wyższego rzędu, aby przechwytywać informacje o skoku i tonie. Na przykład w chińskim rozpoznawaniu mowy do 20 współczynników cepstralnych może być korzystne [130].
Jakie jest wyjście MFCC?
Wyjście po zastosowaniu MFCC to macierz z wektorami cech wyodrębnionych ze wszystkich ramek. W tej macierzy wyjściowej wiersze reprezentują odpowiednie liczby ramek i kolumny reprezentują odpowiednie współczynniki wektora funkcji [1-4]. Wreszcie ta macierz wyjściowa jest używana do procesu klasyfikacji.
Jaka jest długość chmielu w MFCC?
MFCC ma dwa argumenty (które faktycznie przechodzą do podstawowego STFT). Win_length to liczba próbek zawartych w każdym ramie czasowej; Domyślnie jest 2048 lub ~ 93 ms przy 22 kHz Sr. Hop_length to liczba próbek między kolejnymi oknami; jego domyślnie wynosi 512, czyli 23 ms obliczone.