Projection non-linéaire pour l'attribution de score selon la distance en cosinus dans le contexte des systèmes de vérification du locuteur à base d'i-vectors.

From LRDE

Revision as of 18:07, 9 January 2018 by Bot (talk | contribs) (Created page with "{{CSIReportFR | authors = Benjamin Roux | titre = Projection non-linéaire pour l'attribution de score selon la distance en cosinus dans le contexte des systèmes de vérifica...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Résumé

À l'heure actuelle, l'espace des i-vectors est considéré comme le modèle standard pour la représentation d'information vocale dans le contexte des systèmes de vérification du locuteur. De récents progrès ont pu être accomplis grâce à ce modèle qui permet de représenter les données dans un nombre réduit de dimensions et également grâce à l'utilisation de nouvelles méthodes de classification comme l'Analyse Discriminante Linéaire Probabiliste (PLDA) ou encore le classifieur à base de distance cosinus (CD). L'idée du scoring avec le CD est de projetter les caractéristiques évoluant dans un nombre de dimensions élevé sur une hypersphère de dimension plus faible. Aujourd'hui, tous les sytèmes utilisent d'abord une Analyse Discriminante Linéaire (LDA) classique afin de trouver la meilleure projection dans l'espace de dimension inférieure avant de projetter sur l'hypersphère. Le but de ce travail est de proposer une projection non linéaire directement de l'espace des i-vectors vers une hypersphère en minimisant la corrélation inter-classe tout en maximisant la corrélation intra-classe. Il sera question de comparer les résultats obtenus avec d'autres solutions comme : le CD classique, le PLDA et l'approximation de mesure de distance avec le perceptron multicouche et les machines de Bolzmann.