FIDLE : Deep Reinforcement Learning : Tactiques et Stratégies ?
on the April 20, 2023
La prochaine séquence Fidle aura lieu ce Jeudi 20 avril, à 14h :
Deep Reinforcement Learning : Tactiques et Stratégies ?
Séquence animée Bertrand Cabot (INRIA/IDRIS) et Léo Hunout (CNRS/IDRIS)
�� Après le supervisé et le non supervisé, la révolution du Deep Learning s'est également étendue à "l'apprentissage par renforcement", occasionnant une accélération du développement de la robotique et en permettant aux IA de remporter des victoires face à la plupart des meilleurs joueurs humains (AlphaGo), d'élaborer des stratégies ou des tactiques, ou encore dernièrement, en participant au succès de ChatGPT (grâce au RLHF).
Le sujet est très vaste et cette séquence mériterait de très nombreuses heures, compte tenue de la complexité et de la richesse du domaine :-)
Durant ces 3 petites heures, nous essayerons de retracer, rapidement et ensemble, le chemin parcouru au XXe et XXIe siècle, et de comprendre les enjeux et les différentes techniques derrière ces IA qui ont (elles aussi) changées la donne !
�� Au menu de cette séquence :
- Introduction au Reinforcement Learning
- Q-learning vs Sarsa
- Du RL au DQN, ou comment passer à des espaces à hautes dimensionnalités via des fonctions d'approximation
- Policy Gradient, pour être directement dans l'action
- Cas d'usage, résultats et perspectives
�� Durée : 3h
"A smiling robot", by https://lnkd.in/eNpnCDHK
�� Paramètres de diffusion :
Diffusion en direct sur YouTube (Zoom n'est plus utilisé)
Date: Jeudi 20 avril, 14h
Lien : https://lnkd.in/deJ4qT6x
ou : https://lnkd.in/d3ppf5hq
Liens utiles :
Site Fidle : https://fidle.cnrs.fr
Chaine YouTube : https://lnkd.in/deJ4qT6x
Pour installer l'environnement des travaux pratiques : https://lnkd.in/dTkXWkmr
S'abonner/désabonner de la liste d'info : https://lnkd.in/d4AubUQZ
En vous attendant nombreuses et nombreux !
Deep Reinforcement Learning : Tactiques et Stratégies ?
Séquence animée Bertrand Cabot (INRIA/IDRIS) et Léo Hunout (CNRS/IDRIS)
�� Après le supervisé et le non supervisé, la révolution du Deep Learning s'est également étendue à "l'apprentissage par renforcement", occasionnant une accélération du développement de la robotique et en permettant aux IA de remporter des victoires face à la plupart des meilleurs joueurs humains (AlphaGo), d'élaborer des stratégies ou des tactiques, ou encore dernièrement, en participant au succès de ChatGPT (grâce au RLHF).
Le sujet est très vaste et cette séquence mériterait de très nombreuses heures, compte tenue de la complexité et de la richesse du domaine :-)
Durant ces 3 petites heures, nous essayerons de retracer, rapidement et ensemble, le chemin parcouru au XXe et XXIe siècle, et de comprendre les enjeux et les différentes techniques derrière ces IA qui ont (elles aussi) changées la donne !
�� Au menu de cette séquence :
- Introduction au Reinforcement Learning
- Q-learning vs Sarsa
- Du RL au DQN, ou comment passer à des espaces à hautes dimensionnalités via des fonctions d'approximation
- Policy Gradient, pour être directement dans l'action
- Cas d'usage, résultats et perspectives
�� Durée : 3h
"A smiling robot", by https://lnkd.in/eNpnCDHK
�� Paramètres de diffusion :
Diffusion en direct sur YouTube (Zoom n'est plus utilisé)
Date: Jeudi 20 avril, 14h
Lien : https://lnkd.in/deJ4qT6x
ou : https://lnkd.in/d3ppf5hq
Liens utiles :
Site Fidle : https://fidle.cnrs.fr
Chaine YouTube : https://lnkd.in/deJ4qT6x
Pour installer l'environnement des travaux pratiques : https://lnkd.in/dTkXWkmr
S'abonner/désabonner de la liste d'info : https://lnkd.in/d4AubUQZ
En vous attendant nombreuses et nombreux !
Published on April 20, 2023