Accueil > Manifestations scientifiques > Séminaires/Journées d'étude

Séminaire Lordat : Présentation des projets ANR CIESS et PhonIACog

le 13 décembre 2012
16h - 18h

Pascal Gaillard
MCF, IUFM, UTM, URI Octogone-Lordat

« CIESS : Constitution, Indexation et Enrichissement d'un corpuS de Sons de l’environnement »

Les corpus sonores de sons environnementaux sont nécessaires aux études scientifiques sur la perception humaine ainsi qu’à la création d’environnements immersifs (simulation, réalité virtuelle, jeux vidéo, ...). L’utilisation de ces corpus est limitée par deux types de problème. D’une part les difficultés liées à l’annotation rendent difficile la diffusion des corpus, l’échange de données entre scientifiques, et la recherche de sons. D’autre part les corpus existants ne répondent pas toujours aux besoins des utilisateurs.
Le projet CIESS, « Constitution, Indexation et Enrichissement d'un corpuS de Sons de l’environnement » vise à apporter des solutions concrètes pour la création, l’utilisation, et l’adaptation des corpus de son de l’environnement. Ce projet ambitieux a la volonté de créer une forte interaction entre les domaines de la perception, de l’analyse et de la synthèse sonore. Ces trois composantes, rarement réunis, sont en effet nécessaires pour appréhender l’ensemble des problématiques liées à la création et à l’utilisation de tels corpus. CIESS adopte une approche systémique en considérant le problème en intégralité et propose une innovation importante par la mise au point de technologies d’enrichissements des corpus. Le projet rassemble trois partenaires spécialisés respectivement dans chacun de ces domaines :
•    l’Unité de Recherche Interdisciplinaire OCTOGONE,
•    l’Institut de Recherche en Informatique de Toulouse (IRIT),
•  la société AUDIOGAMMING, accompagnée par l’incubateur Midi-Pyrénées et lauréate du concours de création d’entreprise innovante du ministère de la recherche.
Le projet CIESS vise d’une part à créer un corpus de sons environnementaux très annoté et mis à la disposition de la communauté scientifique et des industriels par l’intermédiaire du Très Grand Equipement (TGE) ADONIS.
D’autre part le projet CIESS sera le premier à proposer une maquette d’infrastructure destinée à l’enrichissement des Corpus. Cette infrastructure utilisera des outils d’analyse automatiques et de synthèse sonore spécifiquement créés pour le projet. L’URI OCTOGONE (et la plateforme PETRA) coordonnera ce développement de façon itérative afin de garantir que les avancées et outils proposés répondent aux exigences des études perceptives.
Des outils robustes d’annotation automatique seront développés par l’IRIT. Ces outils adaptés aux fortes contraintes liées à l’étude de prises de sons effectuées dans la vie réelle seront développés par l’IRIT. Ils permettront d’une part une annotation en évènements sonores, et d’autre part l’identification de descripteurs acoustiques pertinents par rapport aux critères perceptifs étudiés.
La société AUDIOGAMMING, spécialisée dans la synthèse et le design sonore, assurera la partie enrichissement du corpus. Une maquette fonctionnelle d’infrastructure sera créée. Celle-ci permettra et la conception de synthèses sonores ad-hoc utilisant les annotations automatiques et perceptives qui permettront d’agir et de modifier directement les éléments du corpus sonore. L’infrastructure s’appuiera également sur les recommandations d’ordre perceptives établies par l’URI OCTOGONE dans le cadre de la plateforme PETRA.
Des étapes d’évaluation sont prévues tout au long du projet pour tester la robustesse et l’efficacité des outils développés.
---------------------------------------------------------------------------------------------------------

Corine Astésano
MCF, Département de Sciences du Langage, UTM, URI Octogone-Lordat
En délégation au Laboratoire Parole et Langage (LPL) - UMR 6057 - CNRS

« PhonIACog : Rôle de l'Accentuation Initiale dans la structuration prosodique en français - de la phonologie au traitement de la parole »

Ce projet vise à décrire les caractéristiques accentuelles du français afin de mettre en lumière la structure phonologique sous-jacente caractérisant cette langue. Cette question est abordée au travers du patron bipolaire AI-AF (Accent Initial - Accent Final), envisagé comme structure métrique de base en français.
Une originalité du projet est d’aborder la question en combinant deux approches phonologiques complémentaires : la théorie métrique auto-segmentale (AM) actuellement dominante pour décrire la prosodie de nombreuses langues sur son versant tonal ; et l’approche métrique et fonctionnaliste (MF) qui permet non seulement de pallier les lacunes de la première en tenant compte des aspects rythmiques tout aussi cruciaux que les aspects intonatifs pour comprendre la prosodie des langues, mais aussi d’étudier la parole dans diverses situations de communication. Une telle combinaison d’approches est nécessaire afin de rendre compte au mieux de la spécificité prosodique du français, encore trop souvent considérée comme ‘langue sans accent’ ou ‘langue de frontière’. Notre proposition principale concerne la dissociation entre les notions de frontière et de proéminence, permettant d’embrasser toutes les règles d’occurrence du patron bipolaire /AI AF/.
Nous proposons d’appliquer une même grille d’analyse sur une série de corpus allant de la parole de laboratoire à la parole semi-contrôlée et l’interaction dialogique spontanée. Des expériences de production et de perception tant comportementale que d’imagerie cérébrale (EEG) nous permettront de montrer que ce patron bipolaire a une réalité phonologique certaine, qu’il est perçu et produit par les locuteurs français, et qu’il résiste aux nombreuses sources de variabilité inhérente à chaque situation de parole. Nous proposons de centrer davantage notre investigation sur AI, moins décrit que AF, et de montrer qu’il est non seulement produit et perçu par les auditeurs naïfs, mais qu’il joue un rôle fondamental dans la structuration de la parole et dans la segmentation et l’accès au sens. Les expériences de production sur divers styles de parole nous permettront d’affiner la caractérisation acoustico-phonétique de AI et AF afin d’améliorer les systèmes de détection automatique des événements prosodiques sur de larges corpus.
Le choix du consortium déployé dans ce projet s’avère particulièrement judicieux puisqu’il regroupe des membres experts pour chacune des disciplines (linguistique, psycholinguistique) et chacune des approches envisagées (phonologie de laboratoire, analyse de corpus, etc.). Ce consortium permettra de faire émerger une vision nouvelle de la prosodie du français, totalement en phase avec les débats internationaux actuels qui cherchent à établir des liens entre l’approche phonologique - cantonnée jusqu’ici à la parole de laboratoire - et les grands corpus de parole qui requièrent d’autres approches. L’approche MF défendue par le porteur de ce projet apporte ainsi une contribution essentielle aux débats qui ont cours sur la scène internationale, au travers de deux points principaux. Le premier est lié au fait qu’une telle approche prend en compte la variabilité prosodique induite par les différents types de parole en permettant de déterminer les invariants dans la parole. Le second fait écho aux discussions internationales relatives à la nécessité de dépasser le seul niveau intonatif sur lequel l’approche AM a fait porter ses efforts. L’approche MF apporte en effet les dimensions métrique et rythmique, tout aussi cruciales que la dimension intonative, pour la description de la prosodie d’une langue.

Lieu(x) :
Salle OBM 4

 

Vers page d'accueil de l'Université Fédérale Toulouse Midi-Pyrénées

 

 

Unité de Recherche Interdisplinaire Octogone-Lordat EA4156

Version PDF | Mentions légales | Conseils d'utilisation | Lien vers RSSSuivre les actualités | haut de la page