Abstract
From LRDE
L
Ces dernières années, de nombreuses recherches ont été faîtes sur la séparation de sources audio. Lors de réunions ou dans des lieux publics bruyants, il arrive souvent que plusieurs personnes parlent en même temps. Ainsi, chaque voix doit être extraîte des audio en contenant plusieurs, afin d'être correctement reconnue. Un algorithme efficace pour ceci est celui de l'Analyse en Composantes Indépendantes (ACI). L'ACI modélise un mélange de signaux comme une forme standard de superposition linéaire des signaux sources. Même dans des conditions environnementales difficiles, le résultat de l'ACI contiendra toujours de fortes composantes résiduelles du mélange de voix. Nous allons utiliser cet algorithme pour la segmentation du locuteur dans le système de vérification du locuteur. Nous obtiendrons de meilleurs résultats, particulièrement dans le cas de données audio avec plusieurs orateurs, comme dans les interviews ou les enregistrements de microphones de l'évaluation de reconnaissance du locuteur de NIST. +
Le model checking est un domaine de la vérification formelle permettant de vérifier le comportement d'un système à travers des formules logiques. Spot est une bibliothèque de model checking qui repose sur une des techniques du domaine : l'approche automate. Dans cette approche du model checking, le système et les formules sont représentés sous forme d'automates acceptant des mots de longueur infinie, et plus particulièrement des automates de Büchi. Spot propose de nombreux algorithmes aux utilisateurs de la bibliothèque pour manipuler ce type d'automates, en vue d'applications au model checking. Pourtant, un algorithme est manquant : celui de la complémentation d'automates de Büchi (qui produit un automate reconnaissant la négation du langage initialement reconnu). Cet algorithme est peu utilisé dans la pratique à cause de sa forte complexité, mais il ne manque pas d'intérêt du point de vue théorique. Nous présenterons une implémentation d'un tel algorithme dans Spot. +
Le model checking est un domaine de la vérification formelle, qui permet de vérifier le comportement d'un système avec l'aide de formules logiques temporelles. Spot est une bibliothèque de model checking qui repose sur une des techniques du domaine : l'approche automate. Dans cette approche du model checking, le système et les formules sont représentés sous forme d'automates acceptant des mots de longueur infinie, et plus particulièrement des automates de Büchi. Spot propose de nombreux algorithmes aux utilisateurs de la bibliothèque pour manipuler ce type d'automates, en vue d'applications au model checking. Une opération sur ces automates a récemment été ajoutée dans Spot : la complémentation. La recherche d'algorithmes effectuant cette opération est toujours d'actualité puisqu'il n'existe toujours pas d'algorithme atteignant les bornes théoriques optimales. Nous présenterons deux algorithmes récents de complémentation que nous venons d'ajouter dans Spot, qui se basent sur des automates alternants. +
La généricité par propriétés est un paradigme qui étend la programmation orientée objet et l'adapte à certains systèmes pathologiques. Elle a été introduite au LRDE par le paradigme orienté C++ SCOOP. Le principe est de caractériser une classe par les propriétés de ses instances au lieu de ses relations d'héritage. Nous présenterons ce paradigme et montrerons qu'il peut être utilisé indépendamment du langage et du domaine d'application. Nous introduirons ensuite un exemple d'implémentation en Common Lisp. +
La programmation orientée contexte est un paradigme permettant de prendre en compte les problématiques transverses et les variations de comportement d'un programme dépendantes du contexte. Ce paradigme permet ainsi d'exprimer des aspects du comportement d'un programme qui sont orthogonaux à sa modélisation objet, tout en maintenant son abstraction et sa modularité. Dans le domaine du traitement d'images, par exemple, la programmation orientée contexte peut être utilisée pour prendre en compte des aspects qui traitent à la fois de la structure de l'image, de son contenu, ou encore sa représentation mémoire. Nous présentons la programmation orientée contexte, puis nous analysons ensuite les problématiques transverses présentes dans Climb, une bibliothèque de traitement d'images écrite en Common Lisp. Nous expliquons ensuite comment la programmation orientée contexte permet de résoudre ces problématiques. Enfin, nous analysons les avantages de la programmation orientée contexte dans le domaine du traitement d'images. +
Les automates alternants ajoutent un branchement universel au branchement existentiel des automates non-déterministes. Les automates alternants de Büchi sont exponentiellement plus concis que les automates de Büchi non-déterministes. De plus, ils conviennent bien à la traduction de la logique temporelle linéaire car leur taille est proportionnelle à la taille de la formule traduite. Ce travail vise à ajouter le support des automates alternants à Spot. Cela rendra Spot compatible avec les outils produisant et utilisant des automates alternants, et permettra à de futurs algorithmes travaillant sur les automates alternants d'être implémentés. +
Image Segmentation is the process of identifying the outline of objects in the composition of an image. In recent years, the use of Deep Convolutional Neural Networks for the purpose of Image Segmentation has spiked, with results outperforming more classical approaches. We will explore the implementation and potential applications of integrating filters from the theory of Mathematical Morphology within the structure of a Deep Convolutional Neural Network. +
L'espace Total Variability (TV) représente actuellement l'état de l'art dans le domaine de la vérification du locuteur. Des progrès significatifs ont été réalisés grâce aux nouvelles méthodes de classification comme l'Analyse discriminante linéaire probabiliste (PLDA) ou la Distance Cosinus (CD). Dans cette étude, nous explorons une nouvelle méthode pour déterminer la distance entre deux i-vecteurs en utilisant une variante des Machines de Boltzmann, ces nouvelles approches ont montré des résultats satisfaisants dans le domaine du traitement d'images. Nous allons aussi comparer les performances en terme de fiabilité avec les méthodes classiques comme PLDA ou CD. +
La détection des formes et la reconnaissance d'objets font partie des enjeux les plus importants du traitement d'images. Différentes stratégies ont déjà vu le jour; néanmoins celle basée sur l'utilisation des arbres de composantes semble particulièrement prometteuse. En effet, l'arbre de composantes permet d'établir puis de mettre en relation les composantes à différents niveaux de gris de l'image. À partir de cet arbre, il devient alors possible d'appliquer des attributs qui serviront de critères pour filtrer ces composantes et mettre en évidence les objets de l'image. Nous présenterons donc l'implémentation de ces arbresl'utilisation des attributs et des politiques de propagation pour filtrer les composantes, ainsi que la chaîne de traitement qui permettra d'identifier ces objets. +
Jusqu'à présent, Vaucanson s'adressait essentiellement à la communauté des automaticiens. Cependant, il existe d'autres domaines où les automates sont utilisés. Dans ce rapport prospectif, nous nous orienterons vers la communauté des linguistes et, plus précisément, vers le domaine du traitement automatique des langues naturelles car les besoins de ce domaine diffèrent de nos utilisations habituelles. Nous observerons diverses spécialités et dresserons un bilan des besoins en automates. Ainsi, nous pourrons évaluer l'adéquation de Vaucanson pour ce domaine et en dégager des pistes d'évolutions éventuelles pour le projet. +
Avoir de hautes performances tout en conservant la généricité est un des domaines de recherche prépondérant au sein du LRDE. Milena, la bibliothèque de la plate-forme Olena, confronte ce problème au domaine du traitement d'image. De plus, Milena a aussi pour objectif de rester simple à utiliser. Une solution à ces problèmes, utilisée depuis plusieurs annéesrepose sur les propriétés. Les propriétés sont un ensemble de caractéristiques associées statiquement à un type particulier. Par exemple, les types d'images de Milena possèdent une propriété speed qui indique les temps d'accès aux valeurs des images. Durant ce séminaire, nous nous intéresserons aux propriétés des types d'images. Nous détaillerons les définitions de ces propriétées. Nous montrerons aussi comment les propriétés aident à améliorer les performances tout en maintenant la généricité. Pour cela, nous prendrons en illustration l'implémentation des routines bas niveau dans la bibliothèque. +
La famille des relations rationnelles synchrones est la plus grande famille de relations rationnelles, définie jusqu'ici, qui est une algèbre de Boole effective. Fournir des outils permettant de les manipuler peut donc s'avérer intéressant pour leur étude. Le récent support des alphabets de paires dans Vaucanson nous permet une nouvelle approche pour travailler avec les relations rationnelles synchrones, représentées par des transducteurs lettre à lettre, pour lesquels nous fournissons les outils nécessaires à leur manipulation. +
Le projet Olena fournit une bibliothèque générique pour le traitement d'images, Milena. Nous voulons que cette bibliothèque procure de nombreux types de valeur tels que l'utilisateur puisse toujours choisir le type adapté pour son application. Par exemple, nous fournissons de nombreux encodages en niveau de gris, de nombreux espaces de couleur, etc. Nous présentons la manière dont nous mettons en uvre les types de couleurs dans Milena. Il existe différents espaces de couleur (RGB, HSI, et bien d'autres) et il existe plusieurs encodages possibles pour les mêmes espaces de couleur (rgb_3x8, rgb_f, etc.). Nous voulons rendre les choses plus faciles pour l'utilisateur. Donc, notre objectif est de rendre possible l'utilisation des espaces de couleur sans se soucier des mécanismes internes. Par exemple, dans les formules de conversion, on ne veut pas faire apparaître les détails d'implémentation (division par 255). +
Segmenter une image consiste à en extraire les régions d'intérêt, par exemple pour séparer des cellules cancéreuses en imagerie médicale. L'approche par transformation de la ligne de partage des eaux (LPE) ou Watershed Transform permet d'obtenir une telle segmentation. Il en existe de nombreuses définitionsainsi que diverses implémentations, dont certaines sont à la fois performantes et produisent un résultat avec de bonnes propriétés, comme le emphTopological Watershed. Cet exposé présentera l'implémentation d'un algorithme calculant cette LPE au sein de Milena, la bibliothèque C++ générique de traitement d'image de la plate-forme Olena, développée au LRDE. Nous nous intéresserons tout d'abord aux formats d'images “classiques”, puis à la généralisation à des formats d'images plus inhabituels (images à support de graphe généraux, etc.). +
Currently, i-vectors become the standard representation of speech context in speaker and language recognition method. Cosine Distance (CD) is the most popular scoring method. It uses Linear Discriminant Analysis (LDA) and Within Class Covariance Normalization (WCCN) to reduce the channel variabilities. The aim of this work is to reduce channel variabilities locally before applying the CD. The idea is to create a large i-vector graph from a training dataset. After clustering it with community detection algorithmsthe target and the test i-vectors are projected into this graph. Only their neighborhood are selected to train the LDA and WCCN. Results will be compared with the global channel compensated method. +
The detection of logotypes and invariants inside an image aims to find within an image (or a sequence of images) a new or already known graphical element which pertains to a brand, a company, somebody, etc. Such elements could be found in many real-life pictures but also in advertising pictures. The detection challenge is to compare elements with those which have been already seen but also to set up a machine learning approach in order to determine if there are new logotypes. The integration of such a tool inside the Olena image processing platform and possibly inside the Terra Rush project could lead to a better content indexing and to invalidate specific areas in other processing toolchains. In this report, we will mainly explain a generic method to locate invariants keypoints of an image : the SIFT descriptor. +
Discriminating factor detection inside images is a very active area of research in computer vision. Current applications are widely used, from robotic to assisted digital photography. Our presentation will be focused on logotype detection from natural images. Using Olena, an open-sourced, generic and efficient image processing platform, we have implemented our own SIFT descriptor detector. +
Training a convolutional neural network relies on the use of loss functions, which provide an evaluation of the performance that allows the network's optimisation. Different loss functions evaluate performance in different ways, and thus affect the training differently. This report aims to share our progress in evaluating the performance of various loss functions in the training of convolutional neural networks for brain tumour segmentation. +