Difference between revisions of "CSI Seminar 2015-01-28"

Revision as of 15:25, 14 January 2015

Laboratoire de Recherche et Développement de l’EPITA

Séminaire des étudiants-chercheurs

du 28 Janvier 2015

10h30-11h30, Amphi 1

http://www.lrde.epita.fr

EPITA / LRDE

14-16 rue Voltaire

94276 Le Kremlin-Bicêtre

OLENA

10h30 Amélioration de la base d'entraînement d'un classifieur k-NN d'OCR – ANTHONY SEURE

Une des parties d'une chaîne de reconnaissance de caractères est la classification des caractères à proprement parler : ils peuvent être en majuscules, minuscules ou bien être des chiffres. Dans notre cas, notre OCR calcule un descripteur à base d'ondelettes pour chacune des images de caractère. Ce sont ces descripteurs que nous classifions. L'étape de classification est actuellement basée sur un algorithme des k plus proches voisins (k-NN) multi-classe. Sachant que l'étape d'évaluation dépend fortement de la taille de la base d'entraînement, cette dernière peut être modifiée afin d'améliorer les scores. Notre travail se concentre sur ces possibles améliorations de la base d'entraînement.

SPEAKER ID

10h50 (titre fr) – JEAN-LUC BOUNTHONG

(abstract fr)

11h10 Compensation locale du canal dans les systèmes de reconnaissance du locuteur – JIMMY YEH

A l'heure actuelle, l'espace des i-vecteurs est devenu l’état de l’art pour les systèmes de reconnaissance du locuteur. La distance cosinus (CD) est la méthode de décision la plus utilisée. Elle utilise l'analyse discriminante linéaire (LDA) et la Within Class Covariance (WCCN) afin de compenser globalement le canal. Le but de ce travail est de compenser localement le canal avant d'appliquer la CD. L'idée est de créer un graphe des i-vecteurs partitionné à l'aide d'algorithmes de détection de communauté, puis de projeter les segments test et target dans ce dernier. On sélectionne uniquement leur voisinage pour entrainer la LDA et la WCCN. Les résultats seront comparés avec la méthode de compensation globale.

@@ Line 24: / Line 24: @@
 Une des parties d'une chaîne de reconnaissance de caractères est la
-classification des caractères à proprement parlé : ils peuvent être en
+classification des caractères à proprement parler : ils peuvent être en
 majuscules, minuscules ou bien être des chiffres. Dans notre cas, notre OCR
 calcule un descripteur à base d'ondelettes pour chacune des images de
 caractère. Ce sont ces descripteurs que nous classifions. L'étape de
-classification est actuellement basé sur un algorithme de k plus proches
+classification est actuellement basée sur un algorithme des k plus proches
 voisins (k-NN) multi-classe. Sachant que l'étape d'évaluation dépend
 fortement de la taille de la base d'entraînement, cette dernière peut être

Difference between revisions of "CSI Seminar 2015-01-28"

From LRDE

Revision as of 15:25, 14 January 2015

OLENA

SPEAKER ID