Définition d'identification de l'orateur

Quelle est la signification de l'identification de l'orateur?
Quelle est la base de l'identification vocale?
Comment classez-vous un haut-parleur?
Comment fonctionne la reconnaissance des conférenciers?
Quelles sont les quatre façons différentes d'effectuer la reconnaissance des conférenciers?

Quelle est la signification de l'identification de l'orateur?

L'identification est le processus de détermination de laquelle des locuteurs enregistrés un énoncé donné vient. La vérification est le processus d'acceptation ou de rejet de l'identité revendiquée par un orateur. La plupart des applications dans lesquelles la voix est utilisée pour confirmer l'identité est classée comme vérification des haut-parleurs.

Quelle est la base de l'identification vocale?

Pour vérifier l'identité d'une personne inscrite, le système de reconnaissance vocale biométrique capture un nouvel échantillon de discours, crée un modèle à partir de l'échantillon et le compare au modèle d'inscription. Une forte correspondance entre les modèles indique que la même personne parlait les deux échantillons, vérifiant ainsi l'identité de la personne.

Comment classez-vous un haut-parleur?

La classification des conférenciers nécessite une description fonctionnelle suffisamment précise des attributs du locuteur et des ressources utilisées dans la parole, pour pouvoir produire de nouveaux énoncés imitant l'état physique, émotionnel et cognitif actuel de l'orateur, avec le dialecte correct, les marqueurs de classe sociale et les habitudes de la parole de.

Comment fonctionne la reconnaissance des conférenciers?

La reconnaissance des conférenciers est basée sur le son de la voix. La reconnaissance des conférenciers a deux formes: dépendant du texte - avec le sujet prononçant un mot de passe ou une phrase de passe spécifique. Texte indépendant - avec le sujet parlant d'une manière sans contrainte.

Quelles sont les quatre façons différentes d'effectuer la reconnaissance des conférenciers?

La reconnaissance des conférenciers est un problème de reconnaissance de modèle. Les différentes technologies utilisées pour traiter et stocker les impressions vocales incluent l'estimation de la fréquence, les modèles de Markov cachés, les modèles de mélange gaussien, les algorithmes de correspondance de motifs, les réseaux de neurones, la représentation matricielle, la quantification vectorielle et les arbres de décision.