Amélioration de la base d'entraînement d'un classifieur k-nn d'OCR

From LRDE

Revision as of 18:07, 9 January 2018 by Bot (talk | contribs) (Created page with "{{CSIReportFR | authors = Anthony Seure | titre = Amélioration de la base d'entraînement d'un classifieur k-nn d'OCR | year = 2015 | resume = Une des parties d'une chaîne d...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Résumé

Une des parties d'une chaîne de reconnaissance de caractères est la classification des caractères à proprement parler : ils peuvent être en majusculesminuscules ou bien être des chiffres. Dans notre casnotre OCR calcule un descripteur à base d'ondelettes pour chacune des images de caractère. Ce sont ces descripteurs que nous classifions. L'étape de classification est actuellement basée sur un algorithme des k plus proches voisins (k-NN) multi-classe. Sachant que l'étape d'évaluation dépend fortement de la taille de la base d'entraînement, cette dernière peut être modifiée afin d'améliorer les scores. Notre travail se concentre sur ces possibles améliorations de la base d'entraînement. vspace*1.05cm