Différence entre le MFCC de la parole et la reconnaissance des conférenciers

Qu'est-ce que le MFCC dans la reconnaissance de la parole?
Combien de types de systèmes de reconnaissance vocale existe-t-il?
Combien de fonctionnalités MFCC y a-t-il?

Qu'est-ce que le MFCC dans la reconnaissance de la parole?

Coefficients de cepstrum Mel-Frequency (MFCC)

Dans le modèle de discours à filtre source, le MFCC représente le filtre (voies vocales). La réponse en fréquence du tractus vocal est relativement fluide, tandis que la source de la parole exprimée peut être modélisée comme un train impulsif.

Combien de types de systèmes de reconnaissance vocale existe-t-il?

Il existe deux types de reconnaissance vocale. L'un est appelé dépendant du locuteur et l'autre est indépendant du locuteur. Le logiciel dépendant du locuteur est couramment utilisé pour les logiciels de dictée, tandis que les logiciels indépendants du locuteur se trouvent plus couramment dans les applications téléphoniques.

Combien de fonctionnalités MFCC y a-t-il?

MFCC a 39 fonctionnalités.