Difference between revisions of "Seminar/2011-06-15"
From LRDE
(2 intermediate revisions by the same user not shown) | |
(No difference)
|
Latest revision as of 19:04, 26 March 2014
Mercredi 15 juin 2011, 14h-17h, Amphi masters
Modèle basé-contexte pour l'annotation automatique du multimédia
Nicolas Ballas
Ces dernières années ont vu exploser le nombre de vidéos disponibles
sur internet. Pour permettre leur exploitation, il est nécessaire de
mettre en place des systèmes analysant automatiquement ces données
multimédia. De tels systèmes permettent notamment d'indexer
automatiquement des vidéos en fonction de leurs contenus. Durant
cette présentation, je m'intéresserai aux récentes avancées effectuées
dans ce domaine. Je présenterai des descripteurs vidéos, développés
dans le cadre de ma thèse, qui capturent le mouvement et l'apparence
d'une vidéo pour les résumer dans une courte signature. Ces
signatures peuvent être utilisées a posteriori pour détecter
différents évènements ou concepts dans les vidéos.
Nicolas Ballas effectue sa thèse entre le laboratoire LVIC du CEA/List
et le laboratoire CAOR de l'école des Mines de Paris. Il s'intéresse
principalement au problème de perception automatique à travers l'étude
d'algorithmes combinant vision par ordinateur et apprentissage
automatique.
http://www.kalisteo.fr/en/index.htm, http://caor.mines-paristech.fr/
Traitement d'images sur processeur graphique avec CUDA et C++
- Documents
- garrigues.pdf
Matthieu Garrigues
Conçus à l'origine pour le rendu 2D et 3D, les processeurs graphiques (GPU) peuvent aujourd'hui être considérés comme des processeurs génériques massivement parallèles. Mais ce parallélisme impose des contraintes sur les algorithmes implantés et les types de données utilisés. D'autre part, le bus de communication entre le processeur central (CPU) et le GPU peut être un goulot d'étranglement.
Ce séminaire débutera par un aperçu des avantages et inconvénients de
la programmation GPU, puis je présenterai l'implantation d'un
algorithme temps réel de suivi de points dans une vidéo. Je terminerai
par l’introduction de deux petites boîtes à outils : Cuimg et Dige.
Cuimg utilise C++ pour simplifier l'écriture d'algorithmes de
traitement d'images avec CUDA, tandis que Dige, basée sur le framework
Qt, permet le prototypage rapide d'interfaces graphiques.
Matthieu Garrigues est diplômé de la promotion CSI 2009 de
l'EPITA. Depuis, il s'intéresse au développement et l'implantation
d'applications de vision par ordinateur sur des architectures
parallèles. Il est actuellement ingénieur de recherche à l'unité
d'électronique et d'informatique de l'ENSTA.
http://uei.ensta-paristech.fr