- W jaki sposób MFCC jest używany w rozpoznawaniu mowy?
- Czy sieci neuronowe można wykorzystać do rozpoznawania mowy?
- Do czego służy MFCC?
W jaki sposób MFCC jest używany w rozpoznawaniu mowy?
MFCC są popularnymi funkcjami wyodrębnionymi z sygnałów mowy do użytku w zadaniach rozpoznawalnych. W modelu mowy z filtrem źródłowym MFCC reprezentuje filtr (przewód głosowy). Odpowiedź częstotliwości przewodu głosowego jest stosunkowo płynna, podczas gdy źródło mowy głosowej można modelować jako pociąg impulsowy.
Czy sieci neuronowe można wykorzystać do rozpoznawania mowy?
Sieci neuronowe są bardzo potężne do uznania mowy. Istnieją różne sieci tego procesu. RNN, LSTM, głęboka sieć neuronowa i hybrydowa HMM-LSTM są używane do rozpoznawania mowy.
Do czego służy MFCC?
MFCC są powszechnie stosowane jako funkcje w systemach rozpoznawania mowy, takie jak systemy, które mogą automatycznie rozpoznać liczby wypowiadane w telefonie. MFCC coraz częściej znajdują zastosowania w aplikacjach wyszukiwania informacji muzycznych, takich jak klasyfikacja gatunku, miary podobieństwa audio itp.