Axe 3 : Perception & interaction

L’un des principaux objectifs de l’intelligence artificielle est d’améliorer la capacité des humains à interagir avec leur environnement. Cela implique la résolution de divers problèmes, notamment la perception, l'analyse et l'apprentissage de la structure informationnelle de cet environnement, ainsi que le traitement correct et efficace de celui-ci. Il est important de noter que l'environnement humain est également composé d'autres êtres humains, ce qui soulève des questions spécifiques sur l'analyse automatique du comportement humain et la conception de systèmes efficaces pour améliorer l'interaction entre les humains. Les équipes grenobloises ont une compétence de longue date en matière d'interaction homme-machine et homme-homme, avec un recours croissant aux techniques d'apprentissage automatique et le maintien de liens anciens et forts entre l'informatique et la psychologie cognitive. Cela conduit à trois programmes abordant séparément les questions de l'analyse visuelle du monde extérieur, de l'interaction avec des humains et des objets dans le "sensori-motor framework" associé à la robotique et de la communication avec l'homme par la parole et le langage.

3.1. Robotique

La possibilité d'agir sur l'environnement pose des problèmes spécifiques et de nouveaux défis pour les techniques d'apprentissage et de traitement, classiquement abordées dans le cadre sensori-moteur fourni par la robotique. Ce programme étudiera comment l'interaction avec le monde extérieur permet de modifier et d'optimiser activement le processus d'acquisition d'informations, et étudiera comment les techniques d'apprentissage automatique peuvent être associées à la théorie du contrôle pour concevoir des systèmes robotiques à la fois efficaces et sûrs. La robotique humaine est également un élément central de ce programme, axé sur l’élaboration de robots compagnons et de systèmes intelligents collaboratifs offrant de puissantes extensions et un support à l’intelligence humaine.

  • Audio-visual machine perception and interaction for companion robots - Alameda-Pineda & Horaud
  • Collaborative Intelligent Systems - Bailly (Electronics) & Crowley (AI)
  • AI and dynamical systems: new paradigms for control and robots - Prieur

3.2. Langage naturel et traitement de la parole

La parole et le langage constituent le support le plus naturel pour l'interaction entre humains. Les équipes grenobloises possèdent une solide expertise dans le couplage des technologies de traitement de la parole et du langage pilotées par les données avec l'élaboration de modèles physiques et cognitifs de production de la parole et d'acquisition du langage. Ce programme étendra cette expertise pour développer des technologies vocales et langagières plus polyvalentes, capables de tirer des enseignements avec moins de données, de s’adapter à divers types de perturbations et de s’étendre à de nouveaux langages, dialectes ou contextes sociaux. Les produits attendus ont des applications dans divers domaines, notamment la communication homme-machine, l’éducation et les produits cliniques.

  • Artificial Intelligence & Language - Besacier
  • Bayesian Cognition and Machine Learning for Speech Communication - Perrier

3.3. Vision par ordinateur

L'analyse de scènes visuelles implique des problèmes complexes d'apprentissage machine liés à l'extraction de caractéristiques et à la représentation d'objets et de trajectoires. Les grands défis sur le terrain concernent l'analyse de structures complexes dans l'espace et le temps, liées à des problèmes tels que le traitement et la représentation d'images 3D, l'analyse d'actions humaines complexes, la reconnaissance contextuelle de séquences d'actions ou de relations complexes entre objets. Ce programme vise à associer des algorithmes d'apprentissage à des développements innovants sur la représentation physique et biologique des objets et leur dynamique, en mettant l'accent sur l'analyse des activités humaines.
  • Data Driven 3D Vision - Boyer
  • Towards self-supervised visual learning - Schmid