Abstract
From LRDE
I
A timed automaton is an '"`UNIQ--math-00000003-QINU`"'-automaton which describe a model containing continue time conditions. Without treatments, those automata can have an infinite states space. However, we can translate them in finite automatacalled zone graph, to analyze their properties. In this report, we show how the timed automata have been integrated at Spot. We use TChecker, a program created at the LaBRI. We explain then how we integrate the representation of those TChecker's zone graph in Spot. Then we show how Spot's algorithms can read this translation to work on timed automata and zone graphes. We then explain how inconvenients of TChecker have been adapted to make simpler its utilisation by Spot. +
Pictures have noise and to reduce it, some algorithms are applied. One of them is the NL-Mean algorithm, implemented as a patch-based strategy. The main idea is to denoise a local region based on other similar neighboring patches. A spatial metric (the Euclidian distance) is used to determine the similarity between patches. The main objective of this project is to incorporate the information related to the statistical distribution of colors within a patch, thanks to the use of histograms, to potentially highlight characteristics that have been missed with the standard strategy. It may give some interesting information which could be helpful to improve picture denoising. This method adds robustness regarding any transformation which does not affect the shape of histograms (overall change of luminance or rotation) and can allow the use of patches which could have been discarded by the standard strategyafter proper post-processing of the patch. +
Vaucanson est une plateforme de manipulation d'automates finis. Débuté en 2002, le projet attire de plus en plus d'utilisateurs. De ce fait, une interface utilisateur efficace est nécessaire.par Pour l'utilisateur non expert, la manipulation d'automates peut s'effectuer via taf-kit, une suite d'outils accessible en ligne de commande. Une première interface graphique avait été esquissée en 2005, mais son fonctionnement était lent et compliqué car elle s'appuyait sur taf-kit pour réaliser chaque opération.par Cette nouvelle interface graphique, branchée directement sur le cur de la bibliothèque pour plus d'efficacité, simplifie la manipulation d'automates et rend accessible les algorithmes génériques de Vaucanson. +
Les images ont du bruit et pour le réduire, certains algorithmes sont appliqués. L'un d'entre eux est l'algorithme NL-Mean et qui se base sur une stratégie de patchs. L'idée principale est de débruiter une région locale en se basant sur d'autres régions similaires. Une métrique spatiale (la distance euclidienne) est utilisée pour déterminer la similarité entre les régions. L'objectif principal de ce projet est d'incorporer l'information liée à la distribution statistique des couleurs grâce à l'utilisation d'histogrammes, pour potentiellement mettre en valeur des caractéristiques qui n'ont pas été prises en compte dans la stratégie standard. Cela peut fournir des informations intéressantes qui pourraient être utiles pour améliorer la qualité du débruitage. Cette méthode ajoute de la robustesse en ce qui concerne toute transformation qui n'affecte pas la forme des histogrammes et peut permettre l'utilisation de régions qui auraient pu ne pas être prise en compte, en effectuant un post-traitement approprié de la région. +
Un automate temporisé est un ω-automate représentant un modèle comportant des conditions de temps continu, ce qui peut aboutir à un espace d'états infini. Cependant, il est possible de le ramener à un automate fini, appelé graphe de zones, afin d'étudier ses propriétés. Dans ce rapport, nous montrons comment les automates temporisés sont intégrés à Spot. Nous utilisons TChecker, qui est un programme conc cu au LaBRI. Nous expliquons comment sont intégrés les représentations des graphes de zones qu'utilise TChecker pour travailler sur les automates temporisés dans Spot. Nous montrons ensuite comment les algorithmes de Spot lisent cette adaptation pour travailler sur des automates temporisés et des graphes de zones. Nous montrons enfin comment sont contournés certains inconvénients de TChecker afin de rendre plus simple son utilisation par Spot. +
La segmentation d'image est le processus d'identification du contour des objets qui composent une image. Ces dernières années, l'utilisation de Réseaux Neuronaux Convolutionnels Profonds à des fins de segmentation d'image a fortement augmenté, avec des résultats supérieurs à ceux d'approches plus classiques. Nous explorerons l'implémentation et les applications potentielles des filtres de la théorie de la Morphologie Mathématique dans la structure d'un Réseau Neuronal Convolutionnel Profond. +
Tiger est un langage utilisé à des fins pédagogiques dans l'étude des compilateurs. Écrite en C++, notre implémentation d'un compilateur Tiger profite de techniques éprouvées dans la transformation de programmes. L'ère du multi-cur a rendu la parallélisation indispensable dans le cursus d'un étudiant en informatique. Utilisé comme support de cours, notre compilateur doit évoluer et tirer profit des nouvelles techniques de parallélisme. Ce rapport présente une solution pour distribuer le travail au sein d'un modèle de programmation concurrente par tâche. Nous utiliserons Intel Threading Building Blocks pour nous détacher des problématiques matérielles. +
Text in document images that is subject to extraction through document analysis can be present in two forms: dark text over light background (conventional form) or light text over dark background (Inverse Video). This report introduces the problematic of extracting inverse video text using an existing toolchain, its integration in Scribo, the problems it involves and solutions to better results that we have explored. +
Le traitement d'image est un domaine d'étude très vaste qui englobe une multitude d'opérations, chacune ayant des spécificités, des circonstances d'utilisation, des meilleurs résultats pour l'étude automatique des images complexités et des résultats différents. Aujourd'hui, les meilleurs résultats pour l'étude automatique des images (segmentation d'imagesclassification d'images, détection des objets, etc.) sont obtenus en utilisant l'apprentissage profond, et plus spécifiquement les réseaux neuronaux convolutifs. Nous explorons et menons des expériences sur une partie spécifique du traitement d'image, la morphologie mathématique, en recherchant la meilleure façon de contourner les complexités des opérations concernant leur intégration dans un pipeline d'apprentissage supervisé. +
K
Lorsque l'on cherche à obtenir plusieurs plus courts chemins d'un graphe, il n'est pas intéressant de lancer plusieurs fois un algorithme de plus court chemin puisqu'il retournerait toujours le même chemin. Plusieurs algorithmes existent pour pallier ce problème. L'un d'eux, l'algorithme de Yen, cache des transitions dans le graphe entre chaque calcul de plus court chemin. Ce travail présentera l'implementation de cet algorithme dans Vcsn ainsi que les différentes techniques d'optimisations envisagées (notamment l'implementation d'un ensemble creux). +
Le calcul des K plus courts chemins dans un automate peut être très coûteux, surtout sur des automates énormes comme ceux utilisés en linguistique. Ainsiaprès avoir implémenté l'une des solutions considérée comme l'état de l'art (appelée l'algorithme de Yen) dans Vcsn, l'étape suivante était l'implémentation de la meilleure solution pour ce calcul sur des automates avec des cycles: Eppstein. Ce travail va décrire nos différentes implementations et comparer leurs performances. +
When trying to retrieve multiple shortest paths in a graph, we cannot simply run a shortest path algorithm multiple times as it would always retrieve the same. Some algorithms exist to solve this problem. One of them, the Yen algorithm hides transitions in the graph between each calculation to retrieve the correct paths. This work will present how it was implemented in Vcsn and the optimization techniques we tried on this algorithm (including the implementation of a sparse set). +
The K shortest paths computation can be very time consuming especially when applied to the enormous automata used in linguistics. Hence, after having implemented one of the state-of-the-art solution to the problem (namely Yen's algorithm) in Vcsn, the next step was to implement the best known solution for automata with cycles: Eppstein. This work will describe our different implementations and compare their performances. +
L
L'arbre de partition binaire est, en traitement d'imagesune structure qui permet la segmentation et la recherche efficace d'information dans une image. Il peut être créé à partir de différents modèles de région et fonctions de calcul de distance entre ces régions. La construction de cet arbre se fait habituellement à partir d'une image pré-segmentée pour des questions de performance et de gain de temps. La sensibilité de l'arbre au bruit dans l'image peut aussi être étudiée, pour trouver par exemple quels niveaux de l'arbre sont influencés par ce dernier. +
L'algorithme Union-Find de Tarjan (TUFA) produit, à partir d'une image, un arbre reprèsentant des classes d'èquivalences dans une image ètant donnèe une relation. Cette reprèsentation peut être utilisèe pour dèfinir des filtres. Cette mèthode est actuellement utilisèe dans Milena, notre bibliothèque de traitement d'image, pour implèmenter des filtres connectès comme par exemple l'ouverture et la fermeture d'aire, de volume ou encore de hauteur. Ces filtres sont utilisès pour filtrer une image tout en prèservant les contours. Cette propriètè est un avantage par rapport à l'ouverture et la fermeture basèes sur l'èrosion et la dilatation. TUFA peut être utilisè par des algorithmes conservant les domaines disjoints, ce qui est un second avantage intèressant. Ce document prèsente une mèthode pour implèmenter une sèrie de nouveaux filtres, notamment auto duaux. +
La représentation des i-vectors dans le cadre de la locution représente l'état de l'art dans le domaine de la vérification du locuteur. Grâce à des méthodes d'apprentissage supervisé (la Distance Cosinus avec l'Analyse Discriminante Linéaire et la méthode de Covariance intra-classe), des progrès significatifs ont été réalisés dans ce domaine. Cependant, de récentes recherches proposent d'utiliser une base de données non étiquetées d'i-vectors, afin d'augmenter la taille de l'ensemble des données d'entraînement et de réduire le coût de constitution de cette base. C'est pourquoi nous basons notre étude sur l'espace des i-vectors, et travaillons ainsi avec des méthodes d'apprentissage non supervisé. Dans cette étude, nous utilisons une méthode de partitionnement, le processus de Markov Clustering (MCL), afin de regrouper de façon naturelle les i-vectors qui représentent un même locuteur dans un ensemble d'entités. L'algorithme MCL est un algorithme de partitionnement non supervisé rapide et extensible, basé sur la simulation de flux stochastiques dans les graphes. Le résultat du partitionnement est utilisé dans le système supervisé standard de vérification du locuteur pour évaluer les performances. Nous allons aussi comparer celle-ci avec d'autres méthodes de regroupement comme l'Infomap, le Self-Organizing Map et Newman-Girvan. +
We present a new tool for circuit synthesis from LTL specifications. It reduces the synthesis problem to a parity game using Spot's efficient algorithms on '"`UNIQ--math-00000003-QINU`"'-automata. Two methods have been implemented for the resolution of the game: a recent algorithm by Calude et al. which has the best known theoretical complexity for the problem, and Zielonka's recursive algorithm known for its good practical performances. Finally, the winning strategy is translated to an And-Inverter Graph that models the original LTL formula. +
La séparation du locuteur est un sujet important dans le domaine de la recherche. Il s'agit de savoir qui parle à quel moment dans un enregistrement audio, c'est-à-dire que nous aimerions connaître les intervalles de temps durant lesquels chaque locuteur parle. En calculant les Coefficients Cepstraux sur l'échelle de Mel (MFCC) de notre enregistrement audio, et en utilisant l'Analyse en Composantes Principales (ICA), nous pouvons avec l'aide de chaînes de Markov cachées (HMM), segmenter l'enregistrement. Nous utiliserons cet algorithme pour la segmentation du locuteur dans le système de vérification du locuteur, avec des enregistrements audio où plusieurs personnes parlent, comme dans les enregistrements d'entretiens ou bien les enregistrements microphone de l'évaluation de reconnaissance du locuteur de NIST. +