Pour la première fois, une intelligence artificielle domine les meilleurs humains dans de véritables courses de drones
L‘intelligence artificielle (IA) a surpassé les meilleurs joueurs humains dans divers jeux et compétitions. Des échecs au jeu de Go, en passant par des jeux vidéo comme Gran Turismo et DOTA 2, l’IA a démontré ses prouesses. Aujourd’hui, des chercheurs de l’université de Zurich sont passés à la vitesse supérieure avec un remarquable système de drone autonome baptisé « Swift ».
Image d’entête : le drone de l’IA Swift (tracé bleu) affronte le drone (tracé rouge) d’Alex Vanover, champion du monde 2019 de la Drone Racing League. (Leonard Bauersfeld/ Université de Zurich)
Si vous avez déjà assisté à une course de drones de haut niveau dans une perspective à la première personne (FPV pour First Person View), vous savez à quel point il faut de l’habileté, de la vitesse, de la précision et un contrôle dynamique. Comme lorsqu’on regarde la Formule 1 du point de vue du pilote, il est difficile d’imaginer comment un cerveau humain peut faire des calculs aussi rapidement et répondre à des situations changeantes en temps réel.
Lorsque Deep Blue a marqué la domination du silicium sur le monde des échecs et qu’AlphaGo a établi la domination de l’IA sur le jeu de Go, il s’agissait de contextes stratégiques, dans lesquels la capacité d’un ordinateur à analyser des millions de parties passées et des millions de mouvements et de stratégies potentiels lui donnait l’avantage.
Mais aujourd’hui, pour la première fois, une IA a battu quelques-uns des meilleurs au monde dans un sport physique du monde réel. Un système d’IA appelé Swift, mis au point par des chercheurs de l’université de Zurich et d’Intel, a rapidement appris à connaître un circuit de course en 3D étroit et technique, puis il a dominé deux champions du monde humains et un triple champion national suisse dans une course en tête-à-tête, réalisant également le temps de course le plus rapide.
A partir de l’étude : à gauche, vue rapprochée de Swift, éclairé par des LED bleues, et d’un drone piloté par un humain, éclairé par des LED rouges. Les drones autonomes utilisés dans ce travail reposent uniquement sur des mesures sensorielles embarquées, sans aucun soutien d’une infrastructure externe, telle que des systèmes de capture de mouvements. Dans l’image de droite, de gauche à droite : Thomas Bitmatta, Marvin Schaepper et Alex Vanover font courir leurs drones sur la piste. Chaque pilote porte un casque qui affiche un flux vidéo transmis en temps réel par une caméra à bord de son aéronef. Les casques offrent une expérience immersive de « vue à la première personne ». (Regina Sablotny/ E. Kaufmann et col./ Nature)
Le système Swift a utilisé la même configuration de vision à caméra unique que les pilotes humains pour se repérer sur le parcours et franchir les portes, mais il avait l’avantage d’utiliser également des données d’accélération, de vitesse et d’orientation en temps réel provenant d’une unité de mesure inertielle embarquée.
L’apprentissage de la piste assez complexe à sept portes, avec un virage acrobatique en épingle à cheveux, s’est fait en entraînant 100 drones simultanément sur le parcours dans un environnement virtuel. Les drones simulés ont commencé par explorer l’environnement de la piste de course, puis ils ont trouvé des trajectoires à travers celle-ci et les ont finalement optimisées pour trouver le chemin le plus rapide. Ce processus a duré moins d’une heure, mais a permis de simuler l’équivalent d’un mois ininterrompu d’entraînement en temps réel avec un seul drone.
Ensuite, l’IA a affiné ses stratégies de contrôle en utilisant les données recueillies lors de vols réels, afin de tenir compte de facteurs tels que les turbulences de l’air, la dégradation du signal visuel et d’autres facteurs qui créent une incertitude entre les simulations et le monde réel.
Puis, elle s’est imposée dans le monde physique, sur une piste de 25 x 25 mètres construite à cet effet dans un hangar d’aéroport près de Zurich.
Un parcours de 25 x 25 m a été assemblé dans un hangar à avions à Zurich. (Université de Zurich)
« C’était de la folie », s’est exclamé Thomas Bitmatta, double champion international de la Coupe du monde MultiGP, alors que l’IA Swift lui échappait, prenant des virages plus serrés que tous les concurrents humains et faisant preuve d’une précision inhumaine entre les tours.
Son tour le plus rapide a été réalisé une demi-seconde plus vite que le meilleur tour réalisé par un humain, une éternité dans une course à grande vitesse. Cela dit, les humains étaient mieux à même de s’adapter à un environnement changeant. Lorsque la lumière du soleil a éclairé le hangar au-delà de ce à quoi le drone était habitué, il a échoué. Il est difficile de comprendre comment un entraînement plus poussé ne pourrait pas éliminer ce type d’angle mort, mais le fait est que le cerveau humain a une capacité d’adaptation presque infinie.
L’étude publiée dans Nature : Champion-level drone racing using deep reinforcement learning et présentée sur le site de l’Université de Zurich : Challenge Accepted: High-speed AI Drone Overtakes World-Champion Drone Racers.