Étudiant au doctorat en sciences et technologies de l’information, Carlos Alberto dos Santos a effectué sa soutenance de thèse le 16 avril 2025. Sous la direction de recherche de Kevin Bouchard, sa thèse a pour titre « Leveraging text generation for enhanced user story quality ».
Sous la présidence de Bruno Bouchard, le jury d’évaluation était composé de Hubert Kenfack Ngankam (Université de Sherbrooke) et Yannick Francillette (UQAC)
Résumé de la thèse
Contexte: Les récits d’utilisateurs jouent un rôle crucial dans le développement de logiciels agiles en raison de leur format structuré et de leur facilité de mise en œuvre. Cependant, les équipes de développement sont confrontées à la tâche difficile de gérer la variété des informations requises à partir de sources multiples pour rédiger manuellement les récits d’utilisateurs. En outre, des récits d’utilisateur de mauvaise qualité peuvent entraver la communication entre les membres de l’équipe, ce qui peut entraîner des retards ou des erreurs dans le processus de développement.
Objectif: Cette thèse étudie l’état de l’art dans la génération automatique d’histoires d’utilisateurs et propose divers modèles de génération de texte pour aider à la rédaction d’histoires d’utilisateurs dans le cadre de projets de développement de logiciels agiles. Nous émettons l’hypothèse que l’utilisation de ces modèles peut aider les praticiens du logiciel à écrire des histoires d’utilisateurs plus efficacement et avec une meilleure qualité.
Méthode: Plusieurs méthodes de recherche ont été utilisées pour élaborer et évaluer cette thèse. Tout d’abord, nous avons effectué une revue systématique de la littérature pour résumer les preuves sur le sujet. Sur la base des résultats de cette analyse, nous avons présenté nos deux premiers modèles de génération de texte pour les récits d’utilisateurs (N-gram et GPT) et nous avons utilisé un cadre quantitatif de mesures pour les comparer. Par la suite, nous avons amélioré le modèle N-gram créé et réalisé une expérience contrôlée suivie d’une enquête destinée à évaluer l’utilisation des modèles de génération de texte pour les récits d’utilisateurs.
Résultats: La revue a constaté qu’il y a une pénurie de corpus de récits d’utilisateurs pour soutenir la mise en œuvre de modèles de génération de texte pour les récits d’utilisateurs, ainsi qu’une grande variété de techniques de traitement du langage naturel et d’algorithmes d’apprentissage automatique pour spécifier automatiquement les récits d’utilisateurs. Seules quelques études s’intéressent à la qualité des récits d’utilisateurs générés par les approches présentées. L’évaluation quantitative du modèle N-gram initial à l’aide des métriques BLEU, ROUGE et BERTScore a montré que si les modèles GPT ont excellé dans l’élaboration de récits d’utilisateurs plus complets, les modèles N-gram ont fait preuve d’un degré plus élevé de sensibilité sémantique. Enfin, notre expérience contrôlée a révélé que la version améliorée du modèle N-gram améliorait la consistance et l’uniformité des récits d’utilisateurs par rapport à la méthode de rédaction manuelle et apportait des informations importantes sur l’emploi des récits d’utilisateurs.
Conclusion: L’utilisation de modèles de génération de texte pour soutenir la rédaction d’histoires d’utilisateurs est prometteuse. Ces modèles ont accéléré le processus de composition et amélioré la qualité des récits d’utilisateurs qui en résultent. Nous encourageons la poursuite des recherches en vue d’affiner la technique des modèles N-grammes ou d’entraîner d’autres grands modèles de langage pour aider à la rédaction de récits d’utilisateurs dans différents contextes avec des modèles variés.
Félicitations à Carlos Alberto dos Santos pour la soutenance de sa thèse de doctorat!