- Qu'est-ce que DTW dans la reconnaissance de la parole?
- Pourquoi la déformation du temps dynamique est-elle utile?
- Comment fonctionne l'algorithme DTW?
Qu'est-ce que DTW dans la reconnaissance de la parole?
DTW est une méthode pour mesurer la similitude d'un modèle avec des fuseaux horaires différents. Plus la distance est produite, plus les deux modèles sonores sont similaires. Les deux modèles sonores sont similaires, donc les deux voix seraient les mêmes.
Pourquoi la déformation du temps dynamique est-elle utile?
La déformation du temps dynamique est utilisée pour comparer la similitude ou calculer la distance entre deux tableaux ou séries chronologiques avec une longueur différente. Comment faire ça? Une façon évidente consiste à correspondre à A et B de manière 1 à 1 et à résumer la distance totale de chaque composant.
Comment fonctionne l'algorithme DTW?
Dynamic Time Warping (DTW) est un algorithme d'alignement des séries chronologiques développé à l'origine pour la reconnaissance vocale(1). Il vise à aligner deux séquences de vecteurs de caractéristiques en déformant l'axe temporel de manière itérative jusqu'à ce qu'une correspondance optimale (selon une métrique appropriée) entre les deux séquences est trouvée.