Property

Abstract

From LRDE

Showing 20 pages using this property.
S
La séparation de locuteur et la détection de voix jouent un important rôle dans les systèmes de reconnaissance du locuteur, principalement dans le cas d'un signal à plusieurs locuteurs.Nous allons présenter une méthode de séparation de locuteur basée sur des méthodes variationnelles et sur les speaker factors tel que décrite dans l'état de l'art de systèmes de reconnaissance du locuteur. Afin de tester les performances de cette méthode un ensemble de tests sera effectué sur les données interview de NIST-SRE 2010.  +
During the last years, sound source separation has been a subject of intense research. In meetings or noisy public places, often a number of speakers are active simultaneously and the sources of interest need to be separated from interfering speech in order to be robustly recognized. An effective algorithm is the Independent Component Analysis (ICA). ICA models the mixture signal as a standard form of linear superposition of source signals. Under difficult environmental conditions, ICA outputs may still contain strong residual components of the interfering speakers. We will use this algorithm for speaker diarization in verification system. We will obtain better results especially in the case of multi-speaker audio datasuch as interview or microphone segment of NIST Speaker Recognition Evaluation.  +
Speaker diarization has emerged as an increasingly important and dedicated domain of speech research. It relates to the problem of determining "who spoke when ?". It means that we would like to find the intervals during which eachspeaker is active. By computing the Mel Frequency Cepstral Coefficients (MFCC) features from a given speech signal and using the Independent Component Analysis (ICA) on these features, we are able to segment the speech, with the help of a Hidden Markov Model (HMM). We will use this algorithm for speaker diarization in verification systemwith multi-speaker audio data, such as interview of microphone segment of NIST Speaker Recognition Evaluation.  +
The i-vector is actually the state of the art in speaker verification. Efficient result was achieved using classifier such as Cosine Distance (CD). Howeverclassification is performed on a global channel compensated i-vector. In this study, we explore the possibility to enroll a speaker and define a speaker specific channel compensation using i-vector. The objective is to improve the classifier performance using our previous work on Self-Organizing Map to select suitable i-vector. We will compare the performance of our solution with the global channel compensated method.  +
To represent a system by an automaton, we have to save the values of all variables of this system in each state. This can take a lot of memory when there is a lot of variables and/or a lot of states, and also can grow the execution time due to cache misses. To avoid this problem in Spot, we compress the array of variables of each state, which already reduces the memory consumption and the execution time. In this report, we present a datastructure for a better compression of variables in states, using the redundancy of the values in each states of the automatonand the different constraints encounter to add it in Spot.  +
Emptiness-checks enable to know if the language of an automaton is empty or not. These checks are often used in model checking: unfortunately, they are very expensiveparticularly if the automaton is neither weak nor terminal. In order to reduce this expensive check, this work implements an option that permits the extraction of three smaller automata capturing the terminal, weak, and remaining strong components from the original automaton, so that the three corresponding emptiness checks can be performed independently using the most appropriate algorithm.  +
The Transformers project aims at providing source to source transformations for C and C++ languages. This consists in parsing the input source, a C/C++ source code extended to accept new syntactic rules. The input code is then transformed into standard C/C++. This is similar to the process used by the C++ ancestor, “C with classes”which was an extension of C and which was transformed into C before being compiled. We will show how to write an extension of the C++ grammar using the Transformers project, and to transform the extended C++ input into standard C++. For this purpose, we will use extensions that have already been implemented (ContractC++class-namespaces) as examples. We will analyse to what extent the technologies like attribute grammars used in Transformers help us.  +
The discrimination of characters is an important domain of optical characters recognition. The goal is to determine if a delimited surface of an image is a character or not, with rotation invariance. We are able to reduce the redundant information by doing a principal component analysis (PCA) on the training data set. Then, we use the probabilistic linear discriminant analysis (PLDA) algorithm to models both intra-class and inter-class variance as mutli-dimensional Gaussians. The performance of the new model will be compared with the one currently used in the optical characters recognition application of Olena.  +
Ce rapport expose des fac c ons performantes et génériques d'implémenter la suppression de transitions spontanées dans un varepsilon-NFA. Nous comparons deux approches : l'algorithme d'varepsilon-clôture de J. Sakarovitch et S. Lombardyet l'algorithme d'varepsilon-suppression de M. Mohri. Nous discutons de la fac c on dont ces algorithmes peuvent être implémentés dans le cas d'automates pondérés génériques, ainsi que de leur performance, en comparant des résultats empiriques obtenus dans Vcsn.  +
Lors de cette présentation, un algorithme de resynchronisation sera décrit ainsi que son implémentation dans Vaucanson. De plus, des explications sont données sur l'ajout des transducteurs a délai borné, ainsi que sur les difficultés qui peuvent être rencontrées lors de l'extension de la hierarchie de classes de Vaucanson.  +
Synchronous rational relations is the largest subfamily of rational relations so far defined that is an effective Boolean algebra. It can be therefore of some interest to provide manipulation tools which might help in their study. With the recently added support of pair-alphabets in Vaucanson, we suggest a new approach to deal with synchronous rational relations represented as letter-to-letter transducers and provide the necessary tools to work with them.  +
Nous présentons un nouvel outil de synthèse de circuit à partir de spécifications LTL. Il réduit le problème de synthèse à un jeu à parité en exploitant la bibliothèque Spot pour manipuler efficacement les ω-automates. Deux méthodes ont été implémentées pour la résolution du jeu: l'algorithme récemment découvert par Calude et al., qui a la meilleure compléxité théorique connue pour ce problème, et l'algorithme récursif de Zielonka, connu pour ses bonnes performances pratique. Finalement, la stratégie gagnante est traduite en un circuit Et-Inverseur qui modélise la formule LTL d'origine.  +
Dans la reconnaissance du locuteur, les modèles GMM occupent une place très importante dans le développement des systèmes performants. Les méthodes de discrimination linéaire à base de SVM donnent actuellement de meilleurs résultats. On s'intéressera ici à un système de discriminant linéaire (le SVM-GLDS). Celui-ci utilise directement, sans passer par un modèle GMM, des statistiques issues de l'ensemble des paramètres de la parole pour définir le modèle de reconnaissance. On évaluera les performances d'un tel système sur la base de données NIST-SRE en le comparant avec les autres systèmes à base de SVM-GMM.  +
La séparation de locuteur et la détection de voix jouent un important rôle dans les systèmes de reconnaissance du locuteur, principalement dans le cas d'un signal à plusieurs locuteurs.Nous allons présenter une méthode de séparation de locuteur basée sur des méthodes variationnelles et sur les speaker factors tel que décrite dans l'état de l'art de systèmes de reconnaissance du locuteur. Afin de tester les performances de cette méthode un ensemble de tests sera effectué sur les données interview de NIST-SRE 2010.  +