Difference between revisions of "Jobs/M2 RL 2014 problematiques-performance"

From LRDE

Line 1: Line 1:
 
{{Job
 
{{Job
 
|Title=Étude de problématiques de performance en traitement d'images dans un contexte générique
 
|Title=Étude de problématiques de performance en traitement d'images dans un contexte générique
|Dates=5 - 6 mois en 2014
+
|Dates=5 - 6 mois en 2014
 
|Research field=Image Processing
 
|Research field=Image Processing
 
|Related project=Olena
 
|Related project=Olena
Line 63: Line 63:
 
permettant de généraliser les améliorations de performance mentionnées
 
permettant de généraliser les améliorations de performance mentionnées
 
ci-avant.
 
ci-avant.
 
 
 
|Contact=roland.levillain-at-lrde.epita.fr (Ne pas oublier de mentioner la référence du stage figurant au début de cette annonce.)
 
|Contact=roland.levillain-at-lrde.epita.fr (Ne pas oublier de mentioner la référence du stage figurant au début de cette annonce.)
 
|Compensation=800 € brut/mois
 
|Compensation=800 € brut/mois
Line 70: Line 68:
 
|Type=Internship
 
|Type=Internship
 
}}
 
}}
= Proposition de stage de Master 2 Recherche : Étude de problématiques de performance en traitement d'images dans un contexte générique =
 
 
__NOTOC__
 
 
* Référence du stage : '''M2_RL_2014_problematiques-performance'''
 
 
=== Présentation du laboratoire ===
 
 
Fondé en 1998, le [https://www.lrde.epita.fr Laboratoire de Recherche et Développement de l'EPITA (LRDE)] est un laboratoire sous tutelle de l'[http://www.epita.fr École Pour l'Informatique et les Techniques Avancées (EPITA)]. À l'instar du laboratoire, l'équipe est jeune et dynamique ; fin 2013, elle est composée d'une dizaine d'enseignant-chercheurs, d'une administratrice, de 5 doctorants et d'une dizaine d'étudiants-chercheurs de l'école. Les travaux de recherche fondamentale effectués au LRDE s'articulent autour de deux thématiques :
 
 
* la reconnaissance des formes ;
 
* les automates et la vérification formelle.
 
 
Par ailleurs, la recherche applicative s'inscrit dans un axe transverse dit de « généricité et performance ».
 
 
=== Description du stage ===
 
 
Ce stage se s'inscrit dans l'axe « généricité et performance » du
 
laboratoire.
 
 
On peut constater d'une part que de nombreux outils logiciels pour le
 
traitement d'image sont conçus en prenant en compte des problématiques
 
de performance relatives aux données (images ou vidéos volumineuses ou
 
nombreuses), au contexte (contraintes de temps réel, besoins d'obtenir
 
une réponse dans un temps « raisonnable ») ou encore liée au matériel
 
(puissance de calcul ou capacité mémoire limitée(s)).
 
 
Par ailleurs, de plus en plus de bibliothèques logicielles pour le
 
traitement d'images sont construite d'après une modélisation avancée
 
mettant en œuvre des ''abstractions'' représentant les différentes
 
notions du domaine (image, point, valeur, voisinage, etc.). Cette
 
approche permet une écriture « haut niveau » d'algorithmes de
 
traitement d'images, réutilisables (non limités à un unique cas
 
d'utilisation) et souvent plus simples. Les cadres logiciels
 
(''software frameworks'') entrant dans cette catégorie s'appuient le
 
plus souvent sur la programmation orientée objet ou la programmation
 
générique (templates du C++, generics de Java ou C#).
 
 
Il est cependant beaucoup plus rare d'observer des outils qui
 
cherchent à répondre aux deux préoccupation précédentes (être
 
performant tout en fournissant une écriture générale via des
 
abstractions). Le projet [[Olena]], développé depuis une quinzaine
 
d'années au LRDE, propose une bibliothèque de traitement
 
d'images générique en C++, Milena, permettant l'écriture d'algorithmes
 
réutilisables et performants. Elle s'appuie à la fois sur la
 
programmation générique et la programmation orientée objet. Le stage
 
proposé a pour objet l'exploration de pistes pour étendre les capacités
 
de Milena dans le domaine du calcul performant (notamment dans le
 
contexte des « Big Data »), tout en préservant ses caractéristiques de
 
généricité et d'abstraction actuelles.
 
 
Les pistes de travail proposées incluent notamment les idées
 
suivantes :
 
 
* la conception et l'ajout de structures de données destinées à de gros volumes de données ;
 
* l'utilisation d'instructions de vectorisation (SIMD) pour accélérer les calculs ;
 
* l'utilisation de programmation parallèle (multicœur) pour répartir les calculs.
 
* la réalisation d'algorithmes (ou de familles d'algorithmes) en utilisant une approche déclarative, permettant de découpler leur définition et leur implémentation bas-niveau dans un contexte matériel donné ;
 
* l'utilisation de la programmation générique (par exemple, des canevas d'algorithmes) et/ou la programmation générative (génération et assemblage de code basés sur des modèles) ;
 
* l'introduction d'optimisations dirigées par les profils (Profile-Guided Optimizations), tirant parti de données réelles pour améliorer un code via des technique d'apprentissage introduites dans la compilation.
 
 
Dans tous les cas, les travaux de recherche devront être menés en
 
gardant à l'esprit une intention de réutilisabilité / généricité (même
 
partielle) des solutions proposées, en s'appuyant par exemple sur un
 
raffinement (''lifting'') incrémental d'une première proposition. À
 
terme, l'objectif est en effet de poser les premières briques d'une
 
formalisation d'un ensemble de propriétés et de types de données
 
permettant de généraliser les améliorations de performance mentionnées
 
ci-avant.
 
 
Mots-clefs : calcul scientifique, Big Data, C++, programmation parallèle.
 
 
=== Pré-requis ===
 
 
Des connaissances en traitement d'images sont nécessaires à la
 
réalisation de ce stage. Le candidat devra être familiarisé avec le
 
langage C++ ou avoir un moins un bon niveau de connaissance du langage
 
C. Le travail à effectuer devra s'intégrer dans la plate-forme
 
logicielle libre de traitement d'images du LRDE,
 
[[Olena]], écrite en C++.
 
 
Des connaissances en modélisation objet, programmation générique,
 
vectorisation ou en programmation parallèle ou multicœur seraient
 
bénéfiques.
 
 
=== Débouchés ===
 
 
Si le déroulement du stage est satisfaisant, nous souhaiterions qu'il
 
soit suivi d'une thèse de doctorat.
 
 
=== Informations pratiques ===
 
 
* Personnes à contacter :
 
** Roland Levillain &lt;roland.levillain-at-lrde.epita.fr&gt;<br />(Ne pas oublier de mentioner la référence du stage figurant au début de cette annonce.)
 
* [[Contact|Lieu du stage]] : Laboratoire de Recherche et Développement de l'EPITA (LRDE)<br />18, rue Pasteur<br />94270 Le Kremlin-Bicêtre<br />(Porte d'Italie)
 
* Rémunération : environ 800 &euro; brut/mois
 
 
 
Annonce diffusée à partir du 13/11/2013.
 

Revision as of 19:12, 14 November 2013

Étude de problématiques de performance en traitement d'images dans un contexte générique
Reference id
Dates

5 - 6 mois en 2014

Research field

Image Processing

Related project

Olena

Advisor

Roland Levillain

General presentation of the field

Ce stage se s'inscrit dans l'axe « généricité et performance » du laboratoire.

On peut constater d'une part que de nombreux outils logiciels pour le traitement d'image sont conçus en prenant en compte des problématiques de performance relatives aux données (images ou vidéos volumineuses ou nombreuses), au contexte (contraintes de temps réel, besoins d'obtenir une réponse dans un temps « raisonnable ») ou encore liée au matériel (puissance de calcul ou capacité mémoire limitée(s)).

Par ailleurs, de plus en plus de bibliothèques logicielles pour le traitement d'images sont construite d'après une modélisation avancée mettant en œuvre des abstractions représentant les différentes notions du domaine (image, point, valeur, voisinage, etc.). Cette approche permet une écriture « haut niveau » d'algorithmes de traitement d'images, réutilisables (non limités à un unique cas d'utilisation) et souvent plus simples. Les cadres logiciels (software frameworks) entrant dans cette catégorie s'appuient le plus souvent sur la programmation orientée objet ou la programmation générique (templates du C++, generics de Java ou C#).

Il est cependant beaucoup plus rare d'observer des outils qui cherchent à répondre aux deux préoccupation précédentes (être performant tout en fournissant une écriture générale via des abstractions). Le projet Olena, développé depuis une quinzaine d'années au LRDE, propose une bibliothèque de traitement d'images générique en C++, Milena, permettant l'écriture d'algorithmes réutilisables et performants. Elle s'appuie à la fois sur la programmation générique et la programmation orientée objet. Le stage proposé a pour objet l'exploration de pistes pour étendre les capacités de Milena dans le domaine du calcul performant (notamment dans le contexte des « Big Data »), tout en préservant ses caractéristiques de généricité et d'abstraction actuelles.

Prerequisites

Mots-clefs : calcul scientifique, Big Data, C++, programmation parallèle.

Objectives

Les pistes de travail proposées incluent notamment les idées suivantes :

  • la conception et l'ajout de structures de données destinées à de gros volumes de données ;
  • l'utilisation d'instructions de vectorisation (SIMD) pour accélérer les calculs ;
  • l'utilisation de programmation parallèle (multicœur) pour répartir les calculs.
  • la réalisation d'algorithmes (ou de familles d'algorithmes) en utilisant une approche déclarative, permettant de découpler leur définition et leur implémentation bas-niveau dans un contexte matériel donné ;
  • l'utilisation de la programmation générique (par exemple, des canevas d'algorithmes) et/ou la programmation générative (génération et assemblage de code basés sur des modèles) ;
  • l'introduction d'optimisations dirigées par les profils (Profile-Guided Optimizations), tirant parti de données réelles pour améliorer un code via des technique d'apprentissage introduites dans la compilation.

Dans tous les cas, les travaux de recherche devront être menés en gardant à l'esprit une intention de réutilisabilité / généricité (même partielle) des solutions proposées, en s'appuyant par exemple sur un raffinement (lifting) incrémental d'une première proposition. À terme, l'objectif est en effet de poser les premières briques d'une formalisation d'un ensemble de propriétés et de types de données permettant de généraliser les améliorations de performance mentionnées ci-avant.

Benefit for the candidate
References
Place LRDE: How to get to us
Compensation

800 € brut/mois

Future work opportunities

Si le déroulement du stage est satisfaisant, nous souhaiterions qu'il soit suivi d'une thèse de doctorat.

Contact

(Ne pas oublier de mentioner la référence du stage figurant au début de cette annonce.) roland.levillain-at-lrde.epita.fr (Ne pas oublier de mentioner la référence du stage figurant au début de cette annonce.)


"Internship" is not in the list (Master Internship, Engineering Internship, Spe Internship, PhD position, Postdoc position, Engineer position, Research assistant position) of allowed values for the "Job type" property.