- Comment les caractéristiques visuelles du sac de mots sont extraites?
- Comment fonctionne le sac de mots visuels?
- Quelle phase dans le framework des caractéristiques génère des mots visuels?
- Comment utilisons-nous le clustering pour calculer un sac de mots représentation d'image?
Comment les caractéristiques visuelles du sac de mots sont extraites?
Son concept est adapté de la récupération de l'information et du sac de mots de PNL (arc). Dans Bag of Words (Bow), nous comptons le nombre de chaque mot apparaît dans un document, utilisons la fréquence de chaque mot pour connaître les mots clés du document et en faire un histogramme de fréquence. Nous traitons un document comme un sac de mots (arc).
Comment fonctionne le sac de mots visuels?
L'objet BagOffeatures définit les fonctionnalités ou les mots visuels, en utilisant l'algorithme de clustering K-Means (statistiques et d'apprentissage automatique) sur les descripteurs de fonctionnalités extraits de TrainingSetS . L'algorithme regroupe itérativement les descripteurs en k clusters mutuellement exclusifs.
Quelle phase dans le framework des caractéristiques génère des mots visuels?
Après avoir trouvé les points clés optimaux de la nouvelle méthode GKS, la phase de construction du livre de codes de BOF (comme décrit dans la section «Méthode de traits du sac») est effectuée qui utilise le clustering K-means pour générer divers mots visuels.
Comment utilisons-nous le clustering pour calculer un sac de mots représentation d'image?
Le nombre de clusters est la taille du livre de codes (analogue à la taille du mot dictionnaire). Ainsi, chaque patch d'une image est mappé à un certain mot de code à travers le processus de clustering et l'image peut être représentée par l'histogramme des mots de code.