Quelle est la signification du MFCC?
Les MFCC sont couramment utilisés comme fonctionnalités dans les systèmes de reconnaissance vocale, tels que les systèmes qui peuvent reconnaître automatiquement les nombres parlées dans un téléphone. Les MFCC trouvent également de plus en plus des utilisations dans des applications de récupération d'informations musicales telles que la classification des genres, les mesures de similitude audio, etc.
Pourquoi utilisons-nous DCT dans MFCC?
DCT est la dernière étape du processus principal de l'extraction des fonctionnalités MFCC. Le concept de base de DCT est la valeur corrélée du spectre MEL afin de produire une bonne représentation de la propriété Spectral local. Fondamentalement, le concept de DCT est le même que la transformée de Fourier inverse.