- Dlaczego używamy DCT w MFCC?
- Co ma ekstrakt MFCC?
- Jakie jest wyjście MFCC?
- W jaki sposób MFCC jest używany w rozpoznawaniu mowy?
Dlaczego używamy DCT w MFCC?
DCT jest ostatnim krokiem głównego procesu ekstrakcji funkcji MFCC. Podstawową koncepcją DCT jest koreluje wartość spektrum MEL, aby uzyskać dobrą reprezentację lokalnych lokalnych właściwości. Zasadniczo koncepcja DCT jest taka sama jak odwrotna transformacja Fouriera.
Co ma ekstrakt MFCC?
Technika ekstrakcji funkcji MFCC obejmuje zasadniczo okno sygnału, zastosowanie DFT, przyjmowanie dziennika wielkości, a następnie wypaczenie częstotliwości w skali MEL, a następnie zastosowanie odwrotnego DCT.
Jakie jest wyjście MFCC?
Wyjście po zastosowaniu MFCC to macierz z wektorami cech wyodrębnionych ze wszystkich ramek. W tej macierzy wyjściowej wiersze reprezentują odpowiednie liczby ramek i kolumny reprezentują odpowiednie współczynniki wektora funkcji [1-4]. Wreszcie ta macierz wyjściowa jest używana do procesu klasyfikacji.
W jaki sposób MFCC jest używany w rozpoznawaniu mowy?
MFCC są popularnymi funkcjami wyodrębnionymi z sygnałów mowy do użytku w zadaniach rozpoznawalnych. W modelu mowy z filtrem źródłowym MFCC reprezentuje filtr (przewód głosowy). Odpowiedź częstotliwości przewodu głosowego jest stosunkowo płynna, podczas gdy źródło mowy głosowej można modelować jako pociąg impulsowy.