recherche et action en sciences sociales

La modélisation mathématique des dialogues : expérimentation et implémentation.

Ce projet de recherche est mené par Francesca Ferrante, chercheuse doctorante à Résurgences, en partenariat avec l’Institut de Mathématiques de Marseille et l’Università Roma Tre, et le soutien de l’ANRT. Elle est codirigée par Myriam Quatrini (I2M), Michele Abrusci (Roma Tre) et Samuel Tronçon (Résurgences).

Présentation

Cette thèse vient en prolongement des travaux développés par le consortium de recherche issu du projet LOCI (Locativité et Interactivité en logique, linguistique et informatique), soutenu par l’Agence Nationale pour la Recherche de 2010 à 2014. En tant que projet de recherche pluridisciplinaire, LOCI réunit des spécialistes d’informatique, de logique mathématique, de linguistique, de sciences humaines et sociales et de philosophie.

Ce projet a notamment pour objectif de valoriser les travaux menés et la pluridisciplinarité du groupe en développant une synthèse des principales tentatives de modélisation et de formalisation des dialogues. L’objet ’dialogue’ sera d’ailleurs traité de manière très générale, à la fois comme lieu de l’interaction langagière (le dialogue comme suite d’interventions langagières), mais aussi comme modèle abstrait de l’interaction (le dialogue comme rencontre entre stratégies d’actions).

L’objectif du projet est développer de nouveaux outils et de nouvelles approches pour l’étude du langage et des interactions sociales en s’inspirant de concepts novateurs en informatique théorique et logique mathématique apparus en 2000 sous l’impulsion de Jean-Yves Girard. Cette théorie, nommée la Ludique, procède à une reconstruction totale de la logique mathématique en se basant uniquement sur l’interaction entre agents. C’est une conception non seulement dialogique, mais surtout stratégique, du fondement logique, qui permet de voir les démons\-trations mathématiques comme le résultat d’un processus coopératif par lequel un schéma de preuve est testé jusqu’à épuisement des possibilités de mise-à-l’épreuve.

Dans le cadre de LOCI, la Ludique aura été utilisée essentiellement en tant que modèle abstrait des interactions, permettant de développer un modèle formel du dialogue et de jeter les bases d’une approche non-référentialiste de la sémantique, tranchant ainsi avec les approches courantes. Ainsi, l’essentiel des travaux menés repose sur le développement des cadres formels pour l’étude des actes de langages, la sémantique, les ontologies, l’apprentissage des langues et la théorie de l’argumentation.

Par ailleurs, le Groupe Résurgences a développé un système d’information et un framework de développement dédié aux mathématiques appliquées aux sciences sociales. Plus particulièrement, le framework intègre des outils d’analyse du langage, de cartographie du web et des réseaux sociaux. Un module de ce système d’information a pour objet la formalisation d’interactions à l’aide de la ludique. Ce système d’information sera mis en production en 2014, notamment pour la réalisation d’évaluation des politiques publiques à partir de données issues des institutions et des partenaires économiques.

Malgré la cohérence des approches développées par les membres du projet LOCI, il va de soi que la diversité des objets et des modes d’appréhension engendre une certaine hétérogénéité dans le traitement formel et conceptuel des objets. Le développement, la convergence, et la consolidation des méthodes de formalisation est donc un enjeu important pour le consortium.

Description du sujet

Analyser un dialogue consiste à mettre en évidence le processus d’interaction dont il est la trace. La Ludique fournit donc un cadre formel permettant de redéployer de nombreux concepts dans une perspective dialogique et ouvrant la voie à une nouvelle théorie du dialogue. On commence par décomposer l’interaction en éléments primitifs, les actions, qui permettent d’interpréter les interventions en rendant compte de l’articulation des propositions sur lesquelles les locuteurs s’engagent. Il est alors possible de donner un statut formel à un dialogue réalisé, ou aux stratégies des locuteurs participant à un dialogue en train de se dérouler. Cette formalisation a été réalisée pour l’analyse des énoncés ambigus, des argumentations fallacieuses, des figures discursives et des actes de langage.

L’implémentation des méthodes de la ludique dans un système informatique ne nécessite pas simplement d’être capable de reproduire des objets mathématiques avec des outils informatiques, il s’agit aussi de savoir à quoi appliquer les outils développés, comment extraire les structures mathématiques à partir de données brutes, et quelle marge de manœuvre peut être exercée entre le modèle mathématique et son utilisation pratique. Le système d’information développé par Résurgences permet de travailler sur des grands corpus de données issues du web et des réseaux sociaux. Il comprend notamment un module capable d’extraire des arbres de stratégies à partir de flux de données, dont on estime qu’il est une approximation raisonnable des objets de la ludique.

Au regard de ces deux résultats, il apparaît nécessaire et opportun de développer une approche systématique de la formalisation ludique des dialogues, tant pour stabiliser le modèle formel que pour permettre une implémentation informatique adaptée. Du côté des mathématiques, cette réflexion permettrait d’aboutir à une méthodologie d’analyse des dialogues reproductible et partageable par la communauté, passant du modèle à une formalisation aboutie. Du côte de la modélisation informatique, cela ouvrirait la voie à une automatisation de l’analyse des dialogues avec des outils logiciels basés sur le modèle de la Ludique.

Objectifs de la thèse

Le travail de thèse sera centré sur l’enrichissement du modèle formel et sa déclinaison en un modèle informatique, sur la base du logiciel déjà réalisé, à partir d’un double travail sur un corpus de développement (basé sur des textes littéraires) et un corpus expérimental (basé sur des discussions extraites du web et des réseaux sociaux).

Notons que le modèle des dialogues esquissé dans les travaux antérieurs a été développé à partir d’éléments suffisamment primitifs pour être adapté à différents contextes de communication. Il peut donc s’appliquer aussi bien à des dialogues extraits de la littérature qu’à ceux extraits du web.

Le démarrage de la thèse nécessitera de recenser les propositions de modél-sation réalisées au cours du projet LOCI, et de produire une présentation et une méthodologie permettant d’unifier les pratiques et les concepts dans un premier modèle.

Parallèlement, il s’agira de constituer un corpus de développement, permettant d’éprouver et élargir cette formalisation. Ce corpus sera constitué de dialogues argumentatifs typiques, ainsi que d’échantillons de dialogues réels. L’accent sera mis sur l’identification de termes de l’argumentation jouant le rôle d’invariants sur lesquels baser le découpage des dialogues.

Dans un second temps, il sera nécessaire de préciser la spécification du logiciel implémentant l’analyse ludique, afin de s’assurer que le modèle implémenté correspond bien au modèle formel développé. Il sera nécessaire d’expliciter les méthodes permettant un traitement automatisé du corpus, notamment concernant le taggage (manuel ou automatique) des dialogues permettant de travailler sur des objets plus primitifs. Ce travail devra permettre de passer à une automatisation de plus en plus large, en articulation avec le point suivant.

Enfin, un second corpus sera constitué à partir de dialogues récupérés de manière automatique dans les médias sociaux et sur le web. Ce corpus permettra de tester à grande échelle l’efficacité du modèle, pour identifier des dialogues, les formaliser et en rendre compte à travers des cartographies.

Résurgences collabore sur le projet "La modélisation mathématique des dialogues : expérimentation et implémentation." avec :
Résurgences est soutenu sur le projet "La modélisation mathématique des dialogues : expérimentation et implémentation." par :

ANR PRELUDE

Le projet PRELUDE est financé par l’Agence Nationale de la Recherche (ANR), sur le programme ANR-Blanc. Quatre équipes y collaborent : Logique de la Programmation, une équipe de recherche de l’Institut de Mathématiques (...)

ANR LOCI

Résurgences prend une part active dans le projet ANR "LOCI" : Locativité et Interaction en Logique, Linguistique et Informatique. Ce projet est porté par : le laboratoire ’Structures Formelles du Langage" de (...)

LIBEAC : Liberalism in Between Europe and (...)

Reflecting on the issues of EU-China relationships, the program aims at developing a new understanding of liberalism in its economic, political and social dimensions. It involves a comparative analysis of the (...)

Dynamique d’insertion professionnelle et (...)

Déborah Romain étudie dans cette recherche, les « visions du monde » développées par trois populations entretenant des rapports différents avec la "réalité du travail" et le "travail idéal". Pour ce faire, on s’attache d’une (...)

Interfaces collégiale pour l’économie de la (...)

L’objet de cette thèse est de développer le cloud management et de créer des outils pour la caractérisation, la visualisation et la mise en réseau de la connaissance. Ce projet, particulièrement intéressant, a donc à la (...)

Comment se construisent les parcours d’insertion

L’objectif de la recherche de Laura Spica est de conduire une enquête de terrain de type qualitatif auprès de bénéficiaires de mesures d’insertion et des agents qui les accompagnent au sein des structures IAE. Il s’agit (...)
Site propulsé par l'Atelier du code et du data, chantier d'insertion numérique