Courses/MLRF

From LRDE

Titre

Machine learning pour la reconnaissance des formes

Sigle

MLRF

Enseignant

Chazalon

Période

S4, Ing2

Public

Majeure, SCIA, IMAGE

Contrôle
Durée

24h

Optionnel

non

Module
Prérequis
Objectifs

Donner aux étudiants les moyens techniques, théoriques et méthodologiques nécessaires à l’optimisation dans un cadre probabiliste de systèmes modernes de vision par ordinateur pour répondre à des problèmes de détection, de segmentation, de classification et de recherche d’image.

L’apprentissage artificiel (Machine Learning) est nécessaire dans de nombreux problèmes de vision par ordinateur (Computer Vision) car il permet l’optimisation dans un cadre probabiliste des paramètres d’un système en tirant profit des données disponibles. Au travers de plusieurs études de cas, les étudiants seront initiés à différentes techniques modernes permettant de résoudre des problèmes de :

  • détection (recherche d’un motif dans une image) ;
  • segmentation (délimitation du contour d’un objet dans une image) ;
  • classification (reconnaître la classe d’un motif ou d’une image) ;
  • recherche (retrouver les images les plus semblables à une requête parmi une base d’image).

Les étudiants apprendront également comment évaluer rigoureusement la performance des solutions considérées. Les étudiants acquerront alors les bases scientifiques qui leur permettront de comprendre et de réutiliser (voire d’étendre) les méthodes les plus performantes jusqu’en 2012 – date du début de l’essor de l’apprentissage profond (Deep Learning). Ces bases seront un point de départ utile pour comprendre, plus tard, les techniques les plus récentes avec un regard d’expert en analyse d’images. Les étudiants utiliseront des outils modernes en Python pour prototyper et évaluer rapidement les technique étudiées.

Plan
  • Cours 1: Introduction, Décrire et reconnaître un motif (1/2) : Classification simple avec apprentissage supervisé ou non (KNN, SVM, Random Forest, ANN …) ; espace de représentation et descripteurs : descripteurs de Fourier, de Gabor, moments de Zernike, codage de Freeman, HOG, Affine-Hessian, LBP…
  • TP 1 (2 heures) : Détecter un motif – Où est Charlie ?
  • Cours 2 (2 heures) : Décrire et reconnaître un motif (2/2) : Framework de Viola-Jones, point d’intérêt et détecteurs : laplacian, hessian, harris, MSER ; Validation géométrique (RANSAC…)
  • TP 2 (2 heures) : Détecter et suivre un motif – Augmented Reality
  • Cours 3 (2 heures) : Classification d’images : Pooling (average/max pooling, BoVW, Filter-learning, VLAD, Fisher kernels), spatial pooling, hierarchical pooling
  • TP 3 (2 heures) : Classification d’images : caractères imprimés, images naturelles
  • Cours 4 (2 heures) : Segmentation d’images : classification dense et régularisation (CRF…)
  • TP 4 (2 heures) : Segmentation d’images de documents : séparation texte/fond
  • Cours 5 (2 heures) : Recherche d’images (1/2) et Débruitage d’image : Approximate Nearest Neighbor ; architecture FLANN ; quantification, binarisation, hashing ; patch-based denoising
  • TP 5 (2 heures) : Débruitage d’image avec une banque de filtres appris
  • Cours 6 (2 heures) : Indexation et recherche d’images (2/2) : relevance feedback et query rewriting ; metric learning (malhanobis) ; embedding learning
  • TP 6 (2 heures) : Recherche d’images : implémentation d’un moteur de recherche capable de traiter 1 million d’images
Documentation
Support
Journaux