Comme de nombreux domaines du traitement de l’information, le traitement automatique de la parole a été révolutionné par l’apprentissage automatique profond (deep learning). Dans cette présentation, j’aborderai différents problèmes de génération de la parole au travers des paradigmes de synthèse à partir du texte (Text-to-Speech), de rehaussement et de conversion de la voix. Je présenterai un état de l’art sur ces technologies ainsi que leurs applications (voicebot, deepfake, aide au handicap, etc.). Je présenterai enfin quelques travaux menés récemment dans le cadre de l’institut MIAI visant à améliorer l’expressivité, la réactivité et la contrôlabilité des systèmes de génération de la parole.
Intervenant
Thomas Hueber, Directeur de recherche CNRS, Chercheur au GIPSA-lab (CNRS/Univ. Grenoble Alpes)
Revoir le webinaire
Published on March 21, 2024
Updated on April 8, 2024
You areYou wishSubmitShare the linkCopyCopiedClose the modal windowShare the URL of this pageI recommend:Consultable at this address:La page sera alors accessible depuis votre menu "Mes favoris".Stop videoPlay videoMutePlay audioChat: A question? Chatbot Robo FabricaMatomo traffic statisticsX (formerly Twitter)