- Co to jest wektor X w rozpoznawaniu mowy?
- Co to jest I-Vector i D-Vector?
- Co to jest Ivectors?
- Jaki jest uniwersalny model tła?
Co to jest wektor X w rozpoznawaniu mowy?
Wektory x to osadzone wyodrębnione z pierwszej warstwy na poziomie segmentu DNN. Są reprezentacją segmentu audio i są reprezentacją głośnika, gdy są uśrednione w różnych segmentach audio tego samego głośnika.
Co to jest I-Vector i D-Vector?
D-vector to uśredniona aktywacja z ostatniej ukrytej warstwy tego DNN. Tak więc w przeciwieństwie do frameworka I-Vector, nie ma to żadnych założeń dotyczących rozkładu funkcji (ramy I-Vector zakładają, że I-Vector lub zmienna utajona ma rozkład Gaussa).
Co to jest Ivectors?
jego ivector [1], wektor o niskiej wymiaru wskazujący koordynowanie tej wypowiedzi w modelu akustycznym podprzestrzeni. Pokazujemy. że rozkład ivektorów może scharakteryzować zestaw danych i. umożliwia wyróżnienie podzbiorów wypowiedzi od różnych DO-
Jaki jest uniwersalny model tła?
Uniwersalny model tła (UBM) to model stosowany w biometrycznym systemie weryfikacji do reprezentowania ogólnych, niezależnych od osoby cechy cech, które należy porównać z modelem charakterystyk cech specyficznych dla osoby przy podejmowaniu decyzji o akceptacji lub odrzuceniu.