SWT

From LRDE

Revision as of 15:32, 4 October 2013 by Daniela Becker (talk | contribs)


La collaboration avec SWT (maintenant http://france.emc.com/enterprise-content-management/captiva/captiva.htm EMC CAPTIVA) entre 1999 et 206 a porté sur la reconnaissance de types de documents numérisés. Le but était de traiter le courrier entrant des entreprises (lettres, factures, formulaires) une fois numérisé. Pour cela, en s’appuyant sur des mesures de similarité, nous avons mis au point un classifieur automatique qui permet de connaître les différents types de documents reçus. Une étude statistique permet alors d’extraire des descripteurs de chaque type de documents sous la forme de sous-parties (vignettes) pertinentes. Nous avons enfin mis au point un moteur de reconnaissance basé sur la théorie de l’évidence pour réaliser le tri à la volée du courrier entrant.

Ce travail a fait l’objet du dépôt de deux brevets en 2005 et 2008 et a mené à un prix européen de l’innovation IST 2004.