Apprentissage d'une distance entre deux i-vectors via des réseaux de neurones à convolution
From LRDE
- Auteurs
- Valentin Iovene
- Type
- techreport
- Année
- 2015
- Numéro
- 1903
- Projects
- Speaker ID
Résumé
Ce travail applique les réseaux de neurones artificiels à convolution (CNN) à la reconnaissance du locuteur. Le CNN est utilisé pour approximer une mesure de la distance entre deux i-vectors (vecteurs représentant les composantes de la voix d'une personne). Contrairement à la distance cosinus, fréquemment utilisée comme mesure de distance entre deux vecteurs, la fonction approximée par un CNN peut être non-linéaire. La performance de ce modèle sera comparée à celles de la distance cosinus et du classificateur PLDA.