Étudiante au doctorat en ingénierie, Teena Sharma a effectué sa soutenance de thèse le vendredi 4 octobre dernier.
Titre de la thèse : Object detection for autonomous vehicules operating under varying weather conditions.
- Direction de recherche : Issouf Fofana, UQAC
- Codirection de recherche : Abdellah Chehri, Royal Military College of Canada
- Présidence du jury : Alexandre Robichaud, UQAC
- Membres du jury : Yacine Yaddaden, UQTR et Imran Ahmed, Anglia Ruskin University
Résumé de la thèse
Le développement rapide des véhicules autonomes nécessite l’intégration d’un système de détection sophistiqué pour répondre efficacement aux différents obstacles posés par le trafic routier. La population croissante des grandes villes provoque des embouteillages. L’entretien du réseau routier de la ville nécessite une surveillance, une croissance et une modernisation continues. La surveillance intelligente du trafic pendant la conduite comprend l’identification et le suivi des véhicules sur les routes et les autoroutes. De nos jours, les véhicules autonomes sont de plus en plus répandus dans le monde, il est devenu essentiel de disposer d’un système de détection de véhicules intelligent pour répondre aux problèmes de circulation routière dans des conditions météorologiques défavorables.
Bien que plusieurs ensembles de données soient disponibles pour prendre en charge la détection d’objets dans les véhicules autonomes, il est crucial d’évaluer soigneusement l’adéquation de ces ensembles de données aux différentes conditions météorologiques à travers le monde. Les ensembles de données existants tels que Roboflow et KITTI sont accessibles au public, mais montrent moins de diversité en termes de conditions d’éclairage ou météorologiques, de scénarios de conduite et de couverture géographique. De plus, ces ensembles de données comportent des annotations limitées en termes de tâches et de plage. Ces problèmes peuvent conduire à des solutions trop spécialisées, qui peuvent ne pas être généralisées au domaine de conception opérationnelle complet des systèmes de conduite autonome (AD) du monde réel. De plus, la détection d’objets dans un environnement normal ou autonome peut être affectée par de mauvaises conditions météorologiques.
Cette recherche aborde les limites mentionnées ci-dessus, identifie les défis associés aux ensembles de données accessibles au public et leur utilité dans la détection d’objets dans des conditions de conduite autonome. L’étude présentée comble les lacunes pour vérifier l’adéquation des solutions développées pour un pays pour la détection d’objets dans de mauvaises conditions météorologiques dans d’autres pays.
Pour répondre à l’exigence susmentionnée, l’étude propose un nouvel ensemble de données sur les véhicules canadiens (CVD), avec 8 388 images annotées. Le CVD comprend des vidéos de rue enregistrées par Thales inc. Canada. Ces vidéos ont été collectées avec des caméras RVB de haute qualité montées sur un véhicule dans la province canadienne du Québec. Les enregistrements ont été réalisés de jour comme de nuit, capturant les conditions météorologiques telles que les jours brumeux, enneigés, pluvieux, sombres, nocturnes et ensoleillés au cours des quatre saisons. Un total de 10 000 images de véhicules et autres actifs routiers sont extraites des vidéos collectées sur 8388 images annotées avec les étiquettes générées correspondantes 27 766 avec leurs 11 classes différentes respectives (motard, voiture, piéton, «trafficLight», «trafficLight-Green», «trafficLight-GreenLeft», «trafficLight-Red», «trafficLight-RedLeft», «trafficLight-Yellow», «trafficLight-YellowLeft» et «camion»). L’ensemble de données présenté est à grande échelle, très diversifié et plus hétérogène, ayant été collecté dans des environnements changeants ainsi que dans des situations météorologiques. De plus, le modèle formé sur cet ensemble de données diversifié présente une robustesse accrue et convient à l’exploitation de véhicules autonomes et conventionnels, ce qui le rend applicable non seulement au Canada, mais également dans d’autres pays présentant des conditions météorologiques comparables.
Reconnaissant le potentiel de la science des données, de la vision par ordinateur et des techniques d’apprentissage en profondeur dans la DA, les ensembles de données nouvellement préparés sont utilisés pour former des modèles d’apprentissage en profondeur prenant en compte différents scénarios pour une reconnaissance efficace des véhicules et d’autres actifs routiers au Canada. Nous avons utilisé des approches de modélisation pure et de modélisation mixte dans la formation des modèles. En modélisation pure, un modèle est d’abord formé et testé uniquement sur un ensemble de données capturées dans un pays. Dans la modélisation mixte, les ensembles de données nouvellement préparés sont mélangés aux ensembles de données accessibles au public et de nouveaux modèles sont introduits. Dans la présente étude, le modèle a subi une formation et des tests sur deux ensembles de données distincts, à savoir RoboFlow, et a combiné RoboFlow et CVD, afin de déterminer l’opportunité d’intégrer deux bases de données d’images différentes.
L’approche d’apprentissage par transfert est utilisée pour réduire la taille d’un ensemble de données. Cette technique implique l’utilisation d’un grand ensemble de données génériques pour la formation initiale, suivie d’un ensemble de données plus petit approprié à une application spécifique pour la formation complémentaire. Le pré-entraînement du réseau en dehors de l’ensemble d’identification peut améliorer les performances de classification en initiant des modèles particuliers qui sont également présents dans l’ensemble de détection. Le modèle est d’abord entraîné à l’aide de l’ensemble de données Robolflow en utilisant les poids de YOLOv8 pré-entraînés sur l’ensemble de données MSCOCO. Ensuite, l’apprentissage par transfert est appliqué pour entraîner YOLOV8 à l’aide d’une combinaison de Roboflow et d’un ensemble de données CVD. La formation supplémentaire améliore la robustesse du modèle et augmente la précision du système de détection des véhicules.
Les performances des modèles d’apprentissage profond sont évaluées à l’aide du score F1 et de la précision moyenne moyenne (mAP), et le modèle formé en intégrant CVD et l’ensemble de données Roboflow accessible au public est identifié comme le modèle le plus performant dans des conditions météorologiques difficiles.
Félicitations à Teena Sharma pour la soutenance de sa thèse de doctorat!