GAUTRON Romain

Apprentissage par Renforcement pour supporter la prise de décision des petits agriculteurs du Sud dans la conduite des cultures (thèse soutenue le 9 décembre 2022)

2019-2022

Ecole doctorale

ED Gaïa (Montpellier, France)

Objectives

Nous proposons d'appliquer les méthodes de l'Apprentissage par Renforcement (AR) pour supporter la prise de décision des petits paysans du Sud dans la conduite des cultures. Les objectifs de la thèse sont de :

  • Développer des méthodes d'Apprentissage par Renforcement et de Bandits Manchots pour la prise de décision dans la conduite des cultures.
  • Créer des synergies entre Agronomie et RL/bandits: créer un environnement pour les chercheurs en AR et bandits pour expérimenter sur la prise de décision dans les itinéraires techniques.
  • Poser les plans d'un système opérationel d'aide à la prise de décision basé sur l'AR/bandits pour une future application au Malawi.

Location

Lille (Inria), Cali (CIAT Colombie), Montpellier (Cirad / Aïda)

Description

L'Apprentissage par Renforcement (AR) est une discipline qui s'intéresse à la prise de décision dans l'incertain pour maximiser un critère donné. En 2016, le meilleur joueur mondial du jeu de Go devient une intelligence artificielle basée sur l'Apprentissage par Renforcement, fait élu comme avancée de l'année par Science. La conduite des cultures peut être envisagée comme un problème d'AR. En effet, la conduite des cultures peut se concevoir comme une suite de décisions (e.g. choix de variété, date de semis, fertilisation) dans un environnement incertain (e.g; climat, ravageurs, ...), afin de maximiser un but donné (e.g. rendement et conservation du sol). L'AR a été appliqué à la prise de décision dans la conduite des cultures dans les années 90.  Aujourd'hui un nouveau contexte technologique émerge, par exemple avec les réseaux mobiles, smartphones, une puissance calculatoire accrue. Ce nouveau contexte technologique combiné aux récents progrès théoriques en AR/bandits semble pouvoir apporter des solutions pour améliorer la conduite des cultures, dans un environnement de moins en moins prévisible. C'est ce que nous proposons d'investiguer en collaboration avec l'équipe SequeL de l'Inria spécialisée dans la prise de décision séquentielle dans l'incertain.

Encadrement

Marc Corbeels (Cirad / Aïda / Equipe ESTIME) ; Philippe Preux (Inria) ; Odalric Maillard (Inria)

Funding

50% CGIAR, 50% Cirad