- Co to jest STFT w audio?
- Do czego służy STFT?
- Jaka jest różnica między FFT i STFT?
- Dlaczego mielibyśmy używać spektrogramu STFT do analizy mowy ludzkiej?
Co to jest STFT w audio?
DFT przekształca sekwencję (sygnał dyskretny) w okręgi częstotliwości, podobnie jak FT dla sygnału ciągłego. W naszym przypadku mamy sekwencję amplitud, które zostały pobrane z ciągłego sygnału audio. Algorytm DFT lub FFT może przekonwertować ten dyskretny sygnał w dziedzinie czasu na domenę częstotliwości.
Do czego służy STFT?
Krótka transformacja Fouriera (STFT) jest używana do analizy, w jaki sposób zmienia się zawartość częstotliwości sygnału niestacjonarnego. Wielkość kwadratu STFT jest znana jako spektrogram reprezentacja częstotliwości czasu sygnału.
Jaka jest różnica między FFT i STFT?
FFT ma rozdzielczość 2048 linii, okno Blackmana i 50% nakładania się, a STFT ma również rozmiar bloku 2048, rozmiar FFT 16K, użyty okno Blackmana i 50% nakładania się. Jak widzimy, STFT działa lepiej z tym samym rozmiarem bloku (ale bardziej obliczonymi liniami). Poprawiliśmy rozdzielczość częstotliwości dla tej samej ilości zgarnianych danych.
Dlaczego mielibyśmy używać spektrogramu STFT do analizy mowy ludzkiej?
STFT jest jednym z najczęściej używanych narzędzi w analizie mowy i przetwarzaniu. Opisuje ewolucję składników częstotliwości w czasie. Podobnie jak samo spektrum, jedną z zalet STFT jest to, że jego parametry mają fizyczną i intuicyjną interpretację.