Modèles de déformation de processus stochastiques généralisés. Application à l’estimation des non stationnarités dans les signaux audio

Harold Omer
I2M, Aix-Marseille Université

Date(s) : 18/06/2015 iCal
14 h 00 min - 16 h 00 min

Soutenance de thèse

–
Cette thèse porte sur la modélisation et l’estimation de certaines non-stationnarités dans les signaux audio. Nous nous intéressons particulièrement à une classe de modèles de sons que nous nommons timbre -dynamique dans lesquels un signal stationnaire, associé au phénomène physique à l’origine du son, est déformé au cours du temps par un opérateur linéaire unitaire, appelé opérateur de déformation, associé à l’évolution temporelle des caractéristiques de ce phénomène physique. Le timbre du son est alors caractérisé par le spectre du processus stationnaire initial tandis que la composante dynamique du son est complètement caractérisée par l’opérateur de déformation.
–
Les signaux audio sont modélisés comme des processus gaussiens généralisés et nous donnons dans un premier temps un ensemble d’outils mathématiques qui étendent certaines notions classiques utilisées en traitement du signal (transformation de Fourier, transformation de Mellin, signal analytique…) au cas des processus stochastiques généralisés.
–
Nous introduisons ensuite les deux opérateurs de déformations étudiés dans ce manuscrit (modulation de fréquence et changement d’horloge et nous donnons des conditions suffisantes pour que ces opérateurs soient des endomorphismes sur l’espace des distributions tempérées.
L’opérateur de modulation fréquentielle est l’opérateur de multiplication par une fonction à valeurs complexes de module unité, et l’opérateur de changement d’horloge est la version unitaire de l’opérateur de composition par une fonction bijective.
–
Lorsque ces opérateurs agissent sur des processus stationnaires généralisés, les processus déformés sont des processus généralisés non-stationnaires, qui possèdent localement des propriétés de stationnarité lorsque les déformations varient lentement. Les transformées temps-fréquence et temps-échelle permettent alors d’exploiter ces propriétés de stationnarité locale, car sous certaines conditions, ils peuvent être approximés par des opérateurs de translation dans les plans temps-fréquence et temps-échelle, respectivement.
Nous donnons des versions précises de ces approximations, ainsi que des bornes pour les erreurs d’approximation correspondantes. Plus précisément, certains théorèmes portent sur l’approximation des champs stochastiques non stationnaires eux mêmes tandis que d’autres portent sur l?approximation de leurs fonctions de covariances. Dans ce dernier cas, nous montrons que la déformation se ramène à une translation le long des diagonales des covariances des transformée temps-fréquence et temps-échelle des processus déformés.
–
En nous basant sur ces approximations, nous développons un estimateur de maximum de vraisemblance approché des fonctions de dilatation et de modulation, ainsi que des caractéristiques du processus stationnaire sous-jacent. Appliqué à des signaux audio non stationnaires, cet algorithme fournit une estimation conjointe des composantes timbre et dynamique du son. L’algorithme proposé est testé et validé sur des signaux synthétiques. Son application à des sons naturels permet de confirmer la validité du modèle timbre-dynamique dans ce contexte.
–

*Membres du jury :

–
{{Rapporteurs :}}
– Roland BADEAU (Télécom ParisTech)
– Valérie PERRIER (ENSIMAG-Grenoble)
–
{{Examinateurs :}}
– Patrick FLANDRIN (ENS Lyon)
– Frédéric RICHARD (Aix-Marseille Université)
– Richard KRONLAND-MARTINET (CNRS)
–
{{Directeur de thèse :}}
– Bruno TORRESANI (Aix-Marseille Université)
–
–
Lien : theses.fr

Catégories