Modèle du monde à base de réseaux de neurones à délai temporel pour la reconnaissance du locuteur

From LRDE

Revision as of 18:05, 9 January 2018 by Bot (talk | contribs) (Created page with "{{CSIReportFR | authors = Valentin Iovene | titre = Modèle du monde à base de réseaux de neurones à délai temporel pour la reconnaissance du locuteur | year = 2017 | numb...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Résumé

Dans le domaine de la reconnaissance du locuteur, les réseaux de neurones profonds (DNN) ont récemment été montrés plus efficaces pour collecter des statistiques Baum-Welch utilisables pour l'extraction d'i-vector que les modèles de mélanges gaussiens traditionnels. Cependant, ce type d'architecture peut être trop lent au moment de l'évaluation, demandant l'utilisation d'un processeur graphique pour atteindre des performances "temps-réel". Nous montrons que les statistiques produites par un réseau de neurones à délai temporel (TDNN) peuvent être utilisées pour construire un GMM supervisé plus léger servant de modèle du monde (UBM) dans un système i-vector classique. L'erreur obtenue avec cette approche est comparée à celles obtenues avec des modèles du monde basés sur des GMM classiques.