Abstract:
La planification de trajectoire est l’une des technologies clés pour faciliter la manoeuvrabilité autonome des robots mobiles. Cette problématique devient plus complexe dans les domaines qui nécessitent une structure multi-agent afin d’être en mesure d’effectuer des tâches trop complexes pour un agent unique. Le but est d’obtenir des trajectoires optimales sans collision qui garantissent l’accomplissement de l’objectif commun selon des critères particuliers. Dans notre mémoire, nous présentons deux solutions différentes : l’apprentissage centralisé à base de Reinforcement Learning (DQN), et l’exploration décentralisée à base de RRT*. Nous avons fini par proposer une solution plus performante basée sur l’optimalité de Pareto dans la structure décentralisée, ainsi qu’une amélioration de l’apprentissage dans la solution centralisée. Ces solutions ont été calculées sous Python, puis simulées sous MATLAB sur des robots différentiels mobiles.