- Jak czytać spektrogram MEL?
- Co to jest Mel Scale w audio?
- Co to jest spektrogram mocy Mel?
- Dlaczego Mel Scale jest ważna?
Jak czytać spektrogram MEL?
Logarytmicznie spektrogram MEL oddaje częstotliwości powyżej określonego progu (częstotliwość narożnika). Na przykład w spektrogramie skalowanym liniowym przestrzeń pionowa między 1000 a 2000 Hz to połowa pionowej przestrzeni między 2000 Hz a 4000 Hz.
Co to jest Mel Scale w audio?
Skala MEL to skala wysokości ocenianych przez słuchaczy jako równa w odległości od drugiej. Punkt odniesienia między tą skalą a normalną pomiarem częstotliwości jest zdefiniowany przez zrównanie tonu 1000 Hz, 40 dB powyżej progu słuchacza, z wysokim poziomem 1000 melów.
Co to jest spektrogram mocy Mel?
Spektrogram MEL jest wynikiem następującego rurociągu: Oddziel od Windows: Wypróbuj wejście z oknami rozmiaru n_fft = 2048, powodując chmiel rozmiaru hop_length = 512 za każdym razem, aby wypróbować następne okno. Oblicz FFT (szybka transformacja Fouriera) dla każdego okna, aby przekształcić z domeny czasowej w domenę częstotliwości.
Dlaczego Mel Scale jest ważna?
Skala MEL
Jesteśmy lepsi w wykrywaniu różnic w niższych częstotliwościach niż wyższe częstotliwości. Na przykład możemy z łatwością odróżnić różnicę między 500 a 1000 Hz, ale prawie nie będziemy w stanie odróżnić od 10 000 do 10 500 Hz, mimo że odległość między dwiema parami jest taka sama.