Difference between revisions of "CSI Seminar 2015-01-28"

From LRDE

Line 8: Line 8:
 
<div class="center" style="width: auto; margin-left: auto; margin-right: auto;"><big><span style="color:#0000FF">'''du 28 Janvier 2015'''</span></big>
 
<div class="center" style="width: auto; margin-left: auto; margin-right: auto;"><big><span style="color:#0000FF">'''du 28 Janvier 2015'''</span></big>
 
</div>
 
</div>
<div class="center" style="width: auto; margin-left: auto; margin-right: auto;"><big><span style="color:#0000FF">'''10h30-11h30, Amphi 1'''</span></big>
+
<div class="center" style="width: auto; margin-left: auto; margin-right: auto;"><big><span style="color:#0000FF">'''11h00-12h00, Amphi 1'''</span></big>
 
</div>
 
</div>
 
<div class="center" style="width: auto; margin-left: auto; margin-right: auto;">'''http://www.lrde.epita.fr'''
 
<div class="center" style="width: auto; margin-left: auto; margin-right: auto;">'''http://www.lrde.epita.fr'''
Line 21: Line 21:
   
 
===== <span style="color:#00FF00">OLENA </span>=====
 
===== <span style="color:#00FF00">OLENA </span>=====
10h30 <span style="color:#0000FF">Amélioration de la base d'entraînement d'un classifieur k-NN d'OCR</span> – <span style="color:#00FF00">ANTHONY SEURE</span>
+
11h00 <span style="color:#0000FF">Amélioration de la base d'entraînement d'un classifieur k-NN d'OCR</span> – <span style="color:#00FF00">ANTHONY SEURE</span>
   
 
Une des parties d'une chaîne de reconnaissance de caractères est la
 
Une des parties d'une chaîne de reconnaissance de caractères est la
Line 35: Line 35:
   
 
===== <span style="color:#00FF00">SPEAKER ID </span>=====
 
===== <span style="color:#00FF00">SPEAKER ID </span>=====
10h50 <span style="color:#0000FF">Compensation d'i-vecteur spécifique aux locuteurs dans la reconnaissance du locuteur</span> – <span style="color:#00FF00">JEAN-LUC BOUNTHONG</span>
+
11h20 <span style="color:#0000FF">Compensation d'i-vecteur spécifique aux locuteurs dans la reconnaissance du locuteur</span> – <span style="color:#00FF00">JEAN-LUC BOUNTHONG</span>
   
 
Les i-vecteurs représentent actuellement l'état de l'art dans le domaine de
 
Les i-vecteurs représentent actuellement l'état de l'art dans le domaine de
Line 49: Line 49:
   
   
11h10 <span style="color:#0000FF">Compensation locale du canal dans les systèmes de reconnaissance du locuteur</span> – <span style="color:#00FF00">JIMMY YEH</span>
+
11h40 <span style="color:#0000FF">Compensation locale du canal dans les systèmes de reconnaissance du locuteur</span> – <span style="color:#00FF00">JIMMY YEH</span>
   
 
A l'heure actuelle, l'espace des i-vecteurs est devenu l’état de
 
A l'heure actuelle, l'espace des i-vecteurs est devenu l’état de

Revision as of 11:53, 15 January 2015

Lrde.png
Laboratoire de Recherche et Développement de l’EPITA
Séminaire des étudiants-chercheurs
du 28 Janvier 2015
11h00-12h00, Amphi 1
EPITA / LRDE
14-16 rue Voltaire
94276 Le Kremlin-Bicêtre


OLENA

11h00 Amélioration de la base d'entraînement d'un classifieur k-NN d'OCRANTHONY SEURE

Une des parties d'une chaîne de reconnaissance de caractères est la classification des caractères à proprement parler : ils peuvent être en majuscules, minuscules ou bien être des chiffres. Dans notre cas, notre OCR calcule un descripteur à base d'ondelettes pour chacune des images de caractère. Ce sont ces descripteurs que nous classifions. L'étape de classification est actuellement basée sur un algorithme des k plus proches voisins (k-NN) multi-classe. Sachant que l'étape d'évaluation dépend fortement de la taille de la base d'entraînement, cette dernière peut être modifiée afin d'améliorer les scores. Notre travail se concentre sur ces possibles améliorations de la base d'entraînement.

SPEAKER ID

11h20 Compensation d'i-vecteur spécifique aux locuteurs dans la reconnaissance du locuteurJEAN-LUC BOUNTHONG

Les i-vecteurs représentent actuellement l'état de l'art dans le domaine de la vérification du locuteur. Des résultats intéressants sont obtenus à partir de classifieur tel que la Distance Cosinus (CD). Cependant, le classifieur travaille sur des i-vecteurs après une compensation globale du canal. Dans cette étude, nous explorerons la possibilité de définir une compensation de canal spécifique à chaque locuteur. L'objectif est d'améliorer les performances du classifieur en se basant sur nos derniers travaux sur les cartes auto-organisatrice de Kohonen pour la sélection des i-vecteurs adaptés. Nous allons aussi comparer l'efficacité de notre méthode avec la méthode de compensation de canal globale.


11h40 Compensation locale du canal dans les systèmes de reconnaissance du locuteurJIMMY YEH

A l'heure actuelle, l'espace des i-vecteurs est devenu l’état de l’art pour les systèmes de reconnaissance du locuteur. La distance cosinus (CD) est la méthode de décision la plus utilisée. Elle utilise l'analyse discriminante linéaire (LDA) et la Within-Class Covariance Normalization (WCCN) afin de compenser globalement le canal. Le but de ce travail est de compenser localement le canal avant d'appliquer la CD. L'idée est de créer un graphe des i-vecteurs partitionné à l'aide d'algorithmes de détection de communautés, puis de projeter les segments test et target dans ce dernier. On sélectionne uniquement leur voisinage pour entrainer la LDA et la WCCN. Les résultats seront comparés avec la méthode de compensation globale.