Courses/MLRF

Titre	Machine learning pour la reconnaissance des formes
Sigle	MLRF
Enseignant	Chazalon
Période	S4, Ing2
Public	Majeure, SCIA, IMAGE
Contrôle
Durée	24h
Optionnel	non
Module
Prérequis
Objectifs	Donner aux étudiants les moyens techniques, théoriques et méthodologiques nécessaires à l’optimisation dans un cadre probabiliste de systèmes modernes de vision par ordinateur pour répondre à des problèmes de détection, de segmentation, de classification et de recherche d’image. L’apprentissage artificiel (Machine Learning) est nécessaire dans de nombreux problèmes de vision par ordinateur (Computer Vision) car il permet l’optimisation dans un cadre probabiliste des paramètres d’un système en tirant profit des données disponibles. Au travers de plusieurs études de cas, les étudiants seront initiés à différentes techniques modernes permettant de résoudre des problèmes de : détection (recherche d’un motif dans une image) ; segmentation (délimitation du contour d’un objet dans une image) ; classification (reconnaître la classe d’un motif ou d’une image) ; recherche (retrouver les images les plus semblables à une requête parmi une base d’image). Les étudiants apprendront également comment évaluer rigoureusement la performance des solutions considérées. Les étudiants acquerront alors les bases scientifiques qui leur permettront de comprendre et de réutiliser (voire d’étendre) les méthodes les plus performantes jusqu’en 2012 – date du début de l’essor de l’apprentissage profond (Deep Learning). Ces bases seront un point de départ utile pour comprendre, plus tard, les techniques les plus récentes avec un regard d’expert en analyse d’images. Les étudiants utiliseront des outils modernes en Python pour prototyper et évaluer rapidement les technique étudiées.
Plan	Cours 1: Introduction, Décrire et reconnaître un motif (1/2) : Classification simple avec apprentissage supervisé ou non (KNN, SVM, Random Forest, ANN …) ; espace de représentation et descripteurs : descripteurs de Fourier, de Gabor, moments de Zernike, codage de Freeman, HOG, Affine-Hessian, LBP… TP 1 (2 heures) : Détecter un motif – Où est Charlie ? Cours 2 (2 heures) : Décrire et reconnaître un motif (2/2) : Framework de Viola-Jones, point d’intérêt et détecteurs : laplacian, hessian, harris, MSER ; Validation géométrique (RANSAC…) TP 2 (2 heures) : Détecter et suivre un motif – Augmented Reality Cours 3 (2 heures) : Classification d’images : Pooling (average/max pooling, BoVW, Filter-learning, VLAD, Fisher kernels), spatial pooling, hierarchical pooling TP 3 (2 heures) : Classification d’images : caractères imprimés, images naturelles Cours 4 (2 heures) : Segmentation d’images : classification dense et régularisation (CRF…) TP 4 (2 heures) : Segmentation d’images de documents : séparation texte/fond Cours 5 (2 heures) : Recherche d’images (1/2) et Débruitage d’image : Approximate Nearest Neighbor ; architecture FLANN ; quantification, binarisation, hashing ; patch-based denoising TP 5 (2 heures) : Débruitage d’image avec une banque de filtres appris Cours 6 (2 heures) : Indexation et recherche d’images (2/2) : relevance feedback et query rewriting ; metric learning (malhanobis) ; embedding learning TP 6 (2 heures) : Recherche d’images : implémentation d’un moteur de recherche capable de traiter 1 million d’images
Documentation
Support
Journaux

Courses/MLRF

From LRDE