Domain Mismatch Compensation for Text-Independant Speaker Recognition

From LRDE

Revision as of 18:05, 9 January 2018 by Bot (talk | contribs) (Created page with "{{CSIReportFR | authors = Valentin Iovene | titre = Domain Mismatch Compensation for Text-Independant Speaker Recognition | year = 2016 | number = 1610 | resume = Bien que le ...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Résumé

Bien que le développement des systèmes d'analyse discriminante linéaire probabiliste (PLDA) basés sur les i-vecteurs a donné lieu à des résultats prometteurs en reconnaissance du locuteur, l'impact du domain mismatch lorsque les données d'entraînement du système et les données d'évaluation proviennent de sources différentes reste un défi. Le workshop de reconnaissance du locuteur de 2013 de l'Université Johns Hopkins (JHU), pour lequel un corpus d'adaptation du domaine (DAC13) a été crééa travaillé à trouver des solutions pour résoudre ce problème. Ce rapport de recherche présente les techniques de pointe utilisées pour la compensation du domain mismatch ; comme une combinaison de plusieurs transformées de blanchiment, et la normalisation de la covariance indépendante du jeu de données pour obtenir des représentations des données d'entraînement de la PLDA invariantes par rapport au domaine. Ces techniques sont évaluées sur le corpus DAC13 et comparées.