Parole

Différence entre le MFCC de la parole et la reconnaissance des conférenciers

Différence entre le MFCC de la parole et la reconnaissance des conférenciers
  1. Qu'est-ce que le MFCC dans la reconnaissance de la parole?
  2. Combien de types de systèmes de reconnaissance vocale existe-t-il?
  3. Combien de fonctionnalités MFCC y a-t-il?

Qu'est-ce que le MFCC dans la reconnaissance de la parole?

Coefficients de cepstrum Mel-Frequency (MFCC)

Dans le modèle de discours à filtre source, le MFCC représente le filtre (voies vocales). La réponse en fréquence du tractus vocal est relativement fluide, tandis que la source de la parole exprimée peut être modélisée comme un train impulsif.

Combien de types de systèmes de reconnaissance vocale existe-t-il?

Il existe deux types de reconnaissance vocale. L'un est appelé dépendant du locuteur et l'autre est indépendant du locuteur. Le logiciel dépendant du locuteur est couramment utilisé pour les logiciels de dictée, tandis que les logiciels indépendants du locuteur se trouvent plus couramment dans les applications téléphoniques.

Combien de fonctionnalités MFCC y a-t-il?

MFCC a 39 fonctionnalités.

Qu'arrive-t-il aux bandes latérales lorsqu'ils entrent des fréquences négatives?
Quelle est la signification de la fréquence négative dans la transformée de Fourier?Quelles sont les fréquences de bande latérale?Avez-vous besoin d'...
Une grande goutte dans le PSD peut-elle indiquer la présence d'un bruit périodique?
Qu'est-ce que la densité spectrale de puissance PSD?Comment le PSD est-il calculé?Comment trouvez-vous le PSD d'un signal dans Matlab?Pourquoi la den...
Comment calculer l'amplitude à partir d'un fichier wav?
Qu'est-ce que l'amplitude dans le fichier WAV?Comment trouver la fréquence d'un fichier wav?Quelle est l'unité d'un fichier wav? Qu'est-ce que l'amp...