Extraction de texte avec des ondelettes

From LRDE

Revision as of 18:03, 9 January 2018 by Bot (talk | contribs) (Created page with "{{CSIReportFR | authors = Raphael Boissel | titre = Extraction de texte avec des ondelettes | year = 2012 | resume = Nous allons présenter une méthode permettant de différe...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Résumé

Nous allons présenter une méthode permettant de différencier le texte du non-texte dans une image en utilisant des descripteurs inspirés des algorithmes de compression de données. L'objectif principal de cette approche est de calculer un signal qui va permettre à des systèmes d'apprentissage supervisés (comme des kppv ou des machines à vecteurs de support) de classifier le texte et le fond d'une image. Afin de calculer ce signalnous utiliserons des méthodes à base d'ondelettes similaires à celles utilisées dans les formats de compression jpeg ou png. Nous allons également étudier quelles ondellettes produisent les meilleurs résultatsavec quel système d'apprentissage et comparer cela avec d'autres descripteurs, qui ne sont pas à base d'ondelettes. Enfin, nous verrons comment il est possible de diminuer le temps de calcul néscessaire pour ces descripteurs en utilisant l'élévation en ondelette et des méthodes optimisées pour calculer l'image polaire.