Analyse structurelle haut-niveau de document dans le module Scribo d'Olena

From LRDE

Revision as of 18:04, 9 January 2018 by Bot (talk | contribs) (Created page with "{{CSIReportFR | authors = Christophe Escobar | titre = Analyse structurelle haut-niveau de document dans le module Scribo d'Olena | year = 2013 | number = 1309 | resume = L'ex...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Résumé

L'extraction de structures dans un document numérisé se base sur la mise en place d'une chaîne de traitements constituée de briques élémentaires. L'analyse haut-niveau d'un document nécessite des informations structurelles sur celui-ci et se basera donc sur cette chaîne de traitements. Elle consistera à extraire des informations plus abstraites de nature structurelle sur un document, pour obtenir des "indices" sur la structure du document. À l'aide de ces indices et de schémas de structure, il est ensuite possible de réaliser des traitements de haut-niveau tels que l'identification du flot de lecture, l'extraction d'éléments spécifiques ou la reconstruction d'un document dans un autre format.