Apprentissage d'une distance entre deux i-vectors via des réseaux de neurones à convolution

The printable version is no longer supported and may have rendering errors. Please update your browser bookmarks and please use the default browser print function instead.

Auteurs: Valentin Iovene
Type: techreport
Année: 2015
Numéro: 1903
Projects: Speaker ID

Résumé

Ce travail applique les réseaux de neurones artificiels à convolution (CNN) à la reconnaissance du locuteur. Le CNN est utilisé pour approximer une mesure de la distance entre deux i-vectors (vecteurs représentant les composantes de la voix d'une personne). Contrairement à la distance cosinus, fréquemment utilisée comme mesure de distance entre deux vecteurs, la fonction approximée par un CNN peut être non-linéaire. La performance de ce modèle sera comparée à celles de la distance cosinus et du classificateur PLDA.

Apprentissage d'une distance entre deux i-vectors via des réseaux de neurones à convolution

From LRDE

Résumé