- Qu'est-ce que la dimension dans le réseau neuronal?
- Quelle est la dimension dans CNN?
- Quel est le problème avec CNNS et spectrogrammes pour le traitement audio?
- Qu'est-ce que le spectre et le spectrogramme?
Qu'est-ce que la dimension dans le réseau neuronal?
La surface de perte d'un réseau neuronal est fonction de chacun de ses paramètres, donc la "dimension" est le nombre de paramètres (poids, biais) dans le modèle.
Quelle est la dimension dans CNN?
Les couches d'un CNN ont des neurones disposés en 3 dimensions: largeur, hauteur et profondeur. Où chaque neurone à l'intérieur d'une couche convolutionnelle n'est connecté qu'à une petite région de la couche avant elle, appelée champ réceptif.
Quel est le problème avec CNNS et spectrogrammes pour le traitement audio?
Les sons sont «transparents»
Un défi posé dans la comparaison entre les images visuelles et les spectrogrammes est le fait que les objets visuels et les événements sonores ne s'accumulent pas de la même manière. Pour utiliser une analogie visuelle, on pourrait dire que les sons sont toujours «transparents» [4] alors que la plupart des objets visuels sont opaques.
Qu'est-ce que le spectre et le spectrogramme?
Un spectrogramme donne un affichage en cours d'exécution d'un signal sonore au fur et à mesure qu'il se produit en temps réel; Un spectre, en revanche, nous donne un instantané du son à un moment précis dans le temps. Un spectre peut vous permettre de voir, par exemple, la distribution d'énergie sur les différentes fréquences d'une seule voyelle, comme [i].