- Jak działa Mel Scale?
- Co reprezentują współczynniki MFCC?
- Jak przekonwertować na Mel Scale?
- Jak czytać spektrogram MEL?
Jak działa Mel Scale?
Skala MEL to skala wysokości ocenianych przez słuchaczy jako równa w odległości od drugiej. Punkt odniesienia między tą skalą a normalną pomiarem częstotliwości jest zdefiniowany przez zrównanie tonu 1000 Hz, 40 dB powyżej progu słuchacza, z wysokim poziomem 1000 melów.
Co reprezentują współczynniki MFCC?
Składniki MFCC są pierwszymi kilkoma współczynnikami DCT, które opisują gruby kształt widmowy. Pierwszy współczynnik DCT reprezentuje średnią moc w widmie. Drugi współczynnik zbliża się do szerokiego kształtu widma i jest związany z spektralnym środkiem ciężkim.
Jak przekonwertować na Mel Scale?
Obliczenia odbywa się przy użyciu wzorów mel = 1/log (2) * (log (1 + (Hz/1000))) * 1000, gdzie Hz jest częstotliwością w Hz.
Jak czytać spektrogram MEL?
Logarytmicznie spektrogram MEL oddaje częstotliwości powyżej określonego progu (częstotliwość narożnika). Na przykład w spektrogramie skalowanym liniowym przestrzeń pionowa między 1000 a 2000 Hz to połowa pionowej przestrzeni między 2000 Hz a 4000 Hz.