Journée
"Temps-Fréquence et Non-Stationnarité"
19 juin 2015


Programme

9.30 Accueil
10.00 Patrick Flandrin Time-frequency filtering based on spectrogram zeros
Résumé/Abstract.
[Slides]
Résumé
Pour un choix convenable de la fenêtre d'analyse, on sait qu'une transformée de Fourier à court-terme est complètement caractérisée par ses zéros, qui coïncident avec ceux du spectrogramme associé. Une représentation simplifiée de la structure temps-fréquence d'un signal peut alors être donnée par la triangulation de Delaunay définie sur les zéros du spectrogramme. Dans le cas de signaux AM-FM multicomposantes bruités, il s'avère que chaque région temps-fréquence attachée à une composante donnée peut se voir comme l'union de triangles de Delaunay adjacents dont au moins un côté est anormalement long en comparaison avec la distribution dans le cas bruit seul. Identifier de telles régions offre une nouvelle possibilité de séparer les différentes composantes dans le plan temps-fréquence et de reconstruire les signaux correspondants.

Abstract
For a proper choice of the analysis window, a short-time Fourier transform is known to be completely characterized by its zeros, which coincide with those of the associated spectrogram. A simplified representation of the time-frequency structure of a signal can therefore be given by the Delaunay triangulation attached to spectrogram zeros. In the case of multicomponent AM-FM signals embedded in white Gaussian noise, it turns out that each time-frequency domain attached to a given component can be viewed as the union of adjacent Delaunay triangles whose edge length is an outlier as compared to the distribution in noise-only regions. Identifying such domains offers a new way of disentangling the different components in the time-frequency plane, as well as of reconstructing the corresponding waveforms.
11.00 Roland Badeau Modèles probabilistes de représentations temps-fréquence
Résumé/Abstract.
[Slides]
[Full version avec sons (zip)]
Résumé
Dans diverses applications de traitement de signaux audio comme le débruitage, la séparation de sources ou la restauration de données manquantes, un nombre croissant de méthodes mettent en œuvre des modèles probabilistes de transformées temps-fréquence (TF), comme ceux bases sur la désormais célèbre NMF ( Nonnegative Matrix Factorisation ) et ses variantes. Or la plupart des modèles existant, dont Itakura-Saito NMF (IS-NMF), supposent que les points TF sont décorrelés, ce qui revient à ignorer les phases de la transformée TF observée. Partant de ce constat, nous allons essayer de répondre aux questions suivantes :
* Peut-on construire des transformations TF qui satisfassent au mieux l’hypothèse de non corrélation ?
* Pour quelle classe de processus stochastiques cette hypothèse peut-elle être vérifiée et dans quelle mesure ?
* Dans le cas de processus dont les corrélations TF ne peuvent être estompées (comme les signaux sinusoïdaux ou impulsionnels), comment étendre le modèle IS- NMF de façon à les prendre en compte ?
* Quelles améliorations peut-on espérer en modélisant ces corrélations dans des applications comme celles mentionnées ci-dessus ?

Abstract
In various audio signal processing applications such as denoising, source separation and audio inpainting, an increasing number of methods involve probabilistic models of time-frequency (TF) transforms, including those based on the famous NMF (nonnegative matrix factorization) and its variants. However most of existing models, such as Itakura-Saito NMF (IS-NMF), assume that TF bins are uncorrelated, which results in ignoring the phases in the observed TF transform. Bearing this in mind, we will try to answer the following questions:
* Can we design TF transforms such that the assumption of uncorrelated TF bins is best satisfied?
* For which class of stochastic processes can this assumption be satisfied, and how well?
* For stochastic processes whose TF correlations cannot be withdrawn (like sinusoidal or impulse signals), is it possible to extend the IS-NMF model in order to best take these correlations into account?
* What kind of improvement can we expect from modeling these correlations in the above-mentioned applications?
12.00 Déjeuner (inscription obligatoire)
14.00 Valérie Perrier Transformée de Riesz multi-échelle et applications à l'image
Résumé.
[Slides]
Résumé
En traitement d'image, la transformée de Riesz est introduite comme une extension de la transformée de Hilbert en dimension quelconque. C'est ainsi le moyen d'associer à une image réelle son signal monogénique, qui est l'extension naturelle du signal analytique mono-dimensionnel. Ainsi à chaque image on peut associer de manière unique et en chaque point une amplitude, une phase et une orientation locales, trouvant des applications pour l'extraction de caractéristiques locales ou la démodulation de franges d'interférence.
Dans cet exposé nous passons en revue les différentes méthodes de calcul de la transformée de Riesz, en passant par les domaines de Fourier, de Radon, ou une décomposition multi-échelles. Nous présentons ensuite deux applications récentes, pour le calcul d'orientations dans des données de Radon incomplètes, ou pour la décomposition/démodulation d'image de type AM-FM.
15.00 Vincent Lostanlen Scattering en spirale temps-chroma-octave
Résumé.
[Slides]
Résumé
Dans le cadre de l'analyse de sons, je définirai une extension non-stationnaire du modèle source-filtre harmonique à l'aide de deux difféomorphismes temporels. Le premier correspond à un mouvement rigide sur l'axe log-fréquentiel du scalogramme en ondelettes, tandis que le second agit sur l'enveloppe spectrale des partiels. Je mettrai en évidence cette distinction en enroulant l'axe log-fréquentiel selon une spirale des hauteurs, de sorte qu'un intervalle d'octave corresponde à un tour complet. Les attributs perceptifs de hauteur tonale (*pitch chroma*) et hauteur spectrale (*pitch height*) apparaissent respectivement comme une variable angulaire et une variable radiale. De plus, les variations relatives des difféomorphismes de source et de filtre peuvent être linéarisées indépendamment, puis reliées par une équation de flot optique. Afin d'en caractériser les termes de façon stable, j'introduirai un opérateur multi-échelles agissant sur le scalogramme, défini comme une cascade de trois transformées en ondelettes en temps, log-fréquence, et octave. Je conclurai mon intervention avec des illustrations numériques en analyse-synthèse de signaux bioacoustiques et musicaux.
16:00 Discussions et conclusion