- Pourquoi le MFCC est-il important dans la reconnaissance de la parole?
- Comment les fonctionnalités MFCC sont extraites pour la reconnaissance vocale?
- Pourquoi le MFCC est-il si populaire?
- Quels sont les avantages de MFCC?
Pourquoi le MFCC est-il important dans la reconnaissance de la parole?
Les MFCC sont des fonctionnalités populaires extraites des signaux de la parole pour une utilisation dans les tâches de reconnaissance. Dans le modèle de discours à filtre source, le MFCC représente le filtre (voies vocales). La réponse en fréquence du tractus vocal est relativement fluide, tandis que la source de la parole exprimée peut être modélisée comme un train impulsif.
Comment les fonctionnalités MFCC sont extraites pour la reconnaissance vocale?
La technique d'extraction des caractéristiques MFCC comprend essentiellement la fenêtre du signal, l'application du DFT, la prise du journal de l'ampleur, puis la déformation des fréquences sur une échelle MEL, suivie par l'application du DCT inverse.
Pourquoi le MFCC est-il si populaire?
La technique du MFCC est un plus populaire, a une réalisation énorme et largement utilisée dans les systèmes de reconnaissance du haut-parleur et de la parole [35, 36]. Il est basé sur une échelle logarithmique et est capable d'estimer la réponse auditive humaine mieux que les autres techniques d'extraction de caractéristiques Cepstral [37,38]. ...
Quels sont les avantages de MFCC?
L'avantage du MFCC est qu'il est bon dans la réduction des erreurs et capable de produire une fonctionnalité robuste lorsque le signal est affecté par le bruit. La technique SVD / PCA est utilisée pour extraire les caractéristiques importantes de la représentation de la distribution B.