- Co to jest spektrogram logów?
- Jaka jest różnica między MFCC a Melsectrogramem?
- Co to jest funkcje logu?
- Czy logarytmiczny jest Mel Scale?
Co to jest spektrogram logów?
Logarytmicznie spektrogram MEL oddaje częstotliwości powyżej określonego progu (częstotliwość narożnika). Na przykład w spektrogramie skalowanym liniowym przestrzeń pionowa między 1000 a 2000 Hz to połowa pionowej przestrzeni między 2000 Hz a 4000 Hz.
Jaka jest różnica między MFCC a Melsectrogramem?
Spekrogram MEL jest często rozstrzygany logarytmicznie. MFCC jest bardzo ściśliwą reprezentacją, często wykorzystującymi zaledwie 20 lub 13 współczynników zamiast 32-64 pasm w spektrogramie Mel. MFCC jest nieco bardziej dekorerelarowany, co może być korzystne w przypadku modeli liniowych, takich jak modele mieszanki Gaussa.
Co to jest funkcje logu?
Funkcje spektrogramu log-melodii są wyodrębnione z pliku audio wejściowego. Wejście klipu audio jest wstępnie przetwarzane z pełną częstotliwością próbkowania 44 100 Hz. Po uzyskaniu LMS macierz współwystępowania poziomu szarości (GLCM) jest wyodrębniana z LMS, a następnie statystyki obliczane są z GLCM.
Czy logarytmiczny jest Mel Scale?
Skala MEL jest quasi-logarytmiczną funkcją częstotliwości akustycznej zaprojektowanej tak, że percepcyjnie podobne odstępy skoku (e.g. oktawy) wydają się równe szerokości w pełnym zakresie słuchu.