- Co to jest wymiar w sieci neuronowej?
- Co to jest wymiar w CNN?
- Co jest nie tak z CNN i spektrogramami do przetwarzania audio?
- Co to jest spektrum i spektrogram?
Co to jest wymiar w sieci neuronowej?
Powierzchnia straty sieci neuronowej jest funkcją każdego z jej parametrów, więc „wymiar” to liczba parametrów (wag, uprzedzenia) w modelu.
Co to jest wymiar w CNN?
Warstwy CNN mają neurony ułożone w 3 wymiary: szerokość, wysokość i głębokość. Gdzie każdy neuron wewnątrz warstwy splotowej jest połączony tylko z małym regionem warstwy przed nią, zwany polem odbiorczym.
Co jest nie tak z CNN i spektrogramami do przetwarzania audio?
Dźwięki są „przezroczyste”
Jednym wyzwaniem, które stanowi w porównaniu obrazów wizualnych i spektrogramów, jest fakt, że obiekty wizualne i zdarzenia dźwiękowe nie gromadzą się w ten sam sposób. Aby użyć analogii wizualnej, można powiedzieć, że dźwięki są zawsze „przezroczyste” [4], podczas gdy większość obiektów wizualnych jest nieprzezroczysta.
Co to jest spektrum i spektrogram?
Spektrogram daje działający wyświetlacz sygnału dźwiękowego, który występuje w czasie rzeczywistym; Z drugiej strony spektrum daje nam migawkę dźwięku w określonym momencie. Spektrum może umożliwić na przykład rozkład energii na różnych częstotliwościach pojedynczej samogłoski, takich jak [i].