Outils pour la dématérialisation dans SCRIBO

From LRDE

Revision as of 18:06, 9 January 2018 by Bot (talk | contribs) (Created page with "{{CSIReportFR | authors = Julien Marquegnies | titre = Outils pour la dématérialisation dans SCRIBO | year = 2010 | resume = SCRIBO, pour Semi-automatic and Collaborative Re...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Résumé

SCRIBO, pour Semi-automatic and Collaborative Retrieval of Information Based on Ontologies, est un projet de dématérialisation ayant pour finalité la mise en place d'algorithmes visant à extraire des connaissances à partir de textes et d'images. Le redressement de l'image, en amont de la chaîne de traitements, est une phase nécessaire afin de corriger l'éventuel angle dû à la numérisation du document. De plus, l'extraction et l'étude des informations des caractères composant le texte permet non seulement de réaliser une reconstitution la plus fidèle possible du texte mais également de préparer ce dernier à son passage dans l'OCR. Ainsinous présenterons dans un premier temps un algorithme permettant de détecter l'inclinaison d'un document pour de petits angles, puis l'étude menée sur l'extraction des différentes caractéristiques des caractères.