Apprentissage d'une distance entre deux i-vectors via des réseaux de neurones à convolution

From LRDE

Revision as of 18:05, 9 January 2018 by Bot (talk | contribs) (Created page with "{{CSIReportFR | authors = Valentin Iovene | titre = Apprentissage d'une distance entre deux i-vectors via des réseaux de neurones à convolution | year = 2015 | number = 1903...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Résumé

Ce travail applique les réseaux de neurones artificiels à convolution (CNN) à la reconnaissance du locuteur. Le CNN est utilisé pour approximer une mesure de la distance entre deux i-vectors (vecteurs représentant les composantes de la voix d'une personne). Contrairement à la distance cosinus, fréquemment utilisée comme mesure de distance entre deux vecteurs, la fonction approximée par un CNN peut être non-linéaire. La performance de ce modèle sera comparée à celles de la distance cosinus et du classificateur PLDA.