- Comment lisez-vous un spectrogramme Mel?
- Qu'est-ce que l'échelle Mel en audio?
- Qu'est-ce que le spectrogramme de puissance Mel?
- Pourquoi l'échelle Mel est-elle importante?
Comment lisez-vous un spectrogramme Mel?
Un spectrogramme MEL rend logarithmiquement des fréquences au-dessus d'un certain seuil (la fréquence d'angle). Par exemple, dans le spectrogramme à l'échelle linéairement, l'espace vertical entre 1 000 et 2 000 Hz est la moitié de l'espace vertical entre 2 000 Hz et 4 000 Hz.
Qu'est-ce que l'échelle Mel en audio?
L'échelle MEL est une échelle de hauteurs jugées par les auditeurs à être égaux à distance l'un des autres. Le point de référence entre cette échelle et la mesure de fréquence normale est défini en assimilant une tonalité de 1000 Hz, 40 dB au-dessus du seuil de l'auditeur, avec une hauteur de 1000 mels.
Qu'est-ce que le spectrogramme de puissance Mel?
Le spectrogramme MEL est le résultat du pipeline suivant: Séparer à Windows: Échantillonnez l'entrée avec des fenêtres de taille n_fft = 2048, en faisant du houblon de taille hop_length = 512 à chaque fois pour goûter la fenêtre suivante. Calculez FFT (Fast Fourier Transform) pour chaque fenêtre pour se passer du domaine temporel au domaine de fréquence.
Pourquoi l'échelle Mel est-elle importante?
L'échelle MEL
Nous sommes meilleurs pour détecter les différences de fréquences plus basses que les fréquences plus élevées. Par exemple, nous pouvons facilement faire la différence entre 500 et 1000 Hz, mais nous ne pourrons guère faire une différence entre 10 000 et 10 500 Hz, même si la distance entre les deux paires est la même.