Analyse de la mise en page d'un document dans SCRIBO

From LRDE

Revision as of 18:06, 9 January 2018 by Bot (talk | contribs) (Created page with "{{CSIReportFR | authors = Julien Marquegnies | titre = Analyse de la mise en page d'un document dans SCRIBO | year = 2011 | number = 1102 | resume = L'extraction des différen...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Résumé

L'extraction des différentes structures d'un document numérisé se base sur la mise en place d'une chaîne de traitements constituée d'un certain nombre d'étapes primordiales afin d'optimiser la qualité du rendu final. L'étude de la mise en page du document, à savoir la localisation des lignes de texte et des paragraphesconstitue le coeur même de la chaîne puisque le rendu obtenu est étroitement corrélé avec les zones de texte données en entrée à l'OCR. Ainsi, nous présenterons une méthode hybride d'analyse de mise en page développée dans le cadre du projet SCRIBO.