MFCC

Reconnaissance vocale - MFCC

Reconnaissance vocale - MFCC
  1. Qu'est-ce que le MFCC dans la reconnaissance de la parole?
  2. À quoi sert MFCC pour?
  3. Quelles sont les fonctionnalités MFCC?
  4. Pourquoi le MFCC est-il si populaire?

Qu'est-ce que le MFCC dans la reconnaissance de la parole?

Coefficients de cepstrum Mel-Frequency (MFCC)

Dans le modèle de discours à filtre source, le MFCC représente le filtre (voies vocales). La réponse en fréquence du tractus vocal est relativement fluide, tandis que la source de la parole exprimée peut être modélisée comme un train impulsif.

À quoi sert MFCC pour?

Les MFCC sont couramment utilisés comme fonctionnalités dans les systèmes de reconnaissance vocale, tels que les systèmes qui peuvent reconnaître automatiquement les nombres parlées dans un téléphone. Les MFCC trouvent également de plus en plus des utilisations dans des applications de récupération d'informations musicales telles que la classification des genres, les mesures de similitude audio, etc.

Quelles sont les fonctionnalités MFCC?

La technique d'extraction des caractéristiques MFCC comprend essentiellement la fenêtre du signal, l'application du DFT, la prise du journal de l'ampleur, puis la déformation des fréquences sur une échelle MEL, suivie par l'application du DCT inverse. La description détaillée des différentes étapes impliquées dans l'extraction des fonctionnalités MFCC est expliquée ci-dessous.

Pourquoi le MFCC est-il si populaire?

La technique du MFCC est un plus populaire, a une réalisation énorme et largement utilisée dans les systèmes de reconnaissance du haut-parleur et de la parole [35, 36]. Il est basé sur une échelle logarithmique et est capable d'estimer la réponse auditive humaine mieux que les autres techniques d'extraction de caractéristiques Cepstral [37,38]. ...

Convolution de 2 signaux temporels discrets
Qu'est-ce que la convolution des signaux de temps discrets?Quelle est la convolution de deux signaux?Comment calculer la convolution linéaire de deux...
Quelle est cette réponse impulsive similaire mais pas tout à fait vide?
Qu'est-ce que le filtre sinc fenêtré?Quelle est la réponse impulsive du filtre à passe-bas idéal? Qu'est-ce que le filtre sinc fenêtré?Des filtres à...
Que se passera-t-il lorsque nous inverserons un système d'analyse / synthèse?
Que se passe-t-il pendant la phase de transcription inverse?Quel est le but de la réaction de transcription inverse?Quel est le principal inconvénien...