Liminaires

Introduction

L’Observatoire de la liberté d’expression publie ici son premier Portrait annuel de la liberté d’expression dans les médias du Québec et du Canada. Ce portrait est le fruit de trois années de recherche et de développement d’un système d’analyse des contenus médiatiques visant à recenser et analyser les articles relatifs à la liberté d’expression.

Cette infrastructure de recherche collecte et traite en temps réel la production médiatique canadienne (hors médias sociaux), en mobilisant des outils de traitement automatique du langage, d’intelligence artificielle et de visualisation de données pour catégoriser les articles, extraire des entités sémantiques et détecter les tendances. Elle se distingue par sa double vocation académique et grand public. Elle offre à sa communauté de recherche une interface unique permettant d’extraire des corpus personnalisés, tout en assurant un accès large de ses analyses à travers des revues de presse quotidiennes et des rapports réguliers. Ce système s’appuie sur une requête bilingue de plus de 2 000 mots-clés permettant de cibler avec précision les contenus liés à la liberté d’expression dans les médias canadiens et québécois (plus de 300 recensés à ce jour).

Ce Portrait 2026, le premier du genre, est une analyse d’un corpus composé de plus de 84 000 articles recensés dans les médias traditionnels canadiens (presse, radio et télévision). Il propose une analyse structurée en trois volets : une cartographie thématique de la liberté d’expression, un panorama des temps forts de l’actualité canadienne et québécoise, et une mise en perspective internationale. Le deuxième volet s’appuie sur une analyse de contenu de 644 articles (269 pour les médias francophone set 375 pour les médias anglophones), échantillon statistiquement représentatif du corpus pour l’année 2025, avec une marge d’erreur de 4% et un niveau de confiance de 95%.

En tant qu’étude scientifique, ce Portrait est un baromètre des expressions et représentations de la liberté d’expression dans les sociétés québécoise et canadienne, révélant les sujets qui la cristallisent, les tensions qui la traversent, les mots par lesquels elle se dit, les termes dans lesquels elle se discute, et les acteurs qui la négocient et la définissent. On ne saurait sous-estimer l’importance que prennent les expressions de ce pilier fondamental des démocraties libérales, particulièrement dans le contexte actuel. C’est pourquoi nous espérons que ce Portrait contribuera à mieux comprendre les enjeux qui la composent.

Méthodologie

Ce rapport repose sur une approche de recherche quantitative et qualitative utilisant diverses techniques de traitement automatique du langage (TAL) appliquées à un vaste corpus d’articles de presse recueillis par l’Observatoire de la circulation de l’information (OCI) La démarche méthodologique se décline en quatre phases : la constitution du corpus, l’enrichissement sémantique, l’analyse thématique et la visualisation des données.

1. Constitution du corpus Les données ont été extraites d’une base de données regroupant des articles de presse canadienne collectés par l’OCI au cours de l’année 2025 (N= 84 403) Les médias recensés ont été choisis sur la base de l’encyclopédie collaborative « Wikipédia », complétée par les bases de données de Bibliothèque et Archives nationales du Québec et de Bibliothèque et Archives Canada. Le corpus a été filtré selon des critères linguistiques (français et anglais) et géographiques (Québec et reste du Canada) afin de permettre une analyse comparative (ratio structurel de 1,7 article anglophone pour 1 article francophone) Une attention particulière a été portée à la pertinence des articles en s’assurant de la présence de mots-clés spécifiques à la liberté d’expression (notre corpus contient moins de 4,4% de faux positifs, avec un niveau de confiance de 95% et une marge d’erreur de 3%). Au fil de nos recherches, nous avons créé une ontologie permettant d’établir une arborescence thématique de la liberté d’expression

      2. Enrichissement sémantique Chaque article a fait l’objet d’un traitement automatique pour en extraire les métadonnées pertinentes. Ce processus inclut l’identification d’entités nommées (personnes, organisations, lieux, etc ) et l’attribution de mots-clés thématiques à partir de notre ontologie Parallèlement, les articles ont été classés selon la nomenclature internationale de l’IPTC (International Press Telecommunications Council) et des catégories propres à l’étude de la liberté d’expression, permettant ainsi de situer les enjeux dans des domaines précis

      3. Analyse thématique Pour identifier les événements marquants de l’année, une analyse de la densité temporelle des publications a été effectuée, permettant de détecter les « pics » d’actualité. Ces moments de forte production médiatique ont été analysés à l’aide d’algorithmes de groupement (« clustering ») et de modèles de langage pour synthétiser les principaux sujets de discussion et identifier les acteurs dominants au sein de chaque thématique.

      4. Visualisation des données Les données ont été synthétisées sous forme de visualisations graphiques Ces outils permettent d’illustrer la distribution des thématiques liées à la liberté d’expression, l’évolution temporelle de l’intérêt médiatique ou la répartition géographique des enjeux Cette approche rigoureuse permet de transformer un volume massif de données textuelles brutes en indicateurs structurés, offrant une vision d’ensemble des dynamiques de l’espace médiatique québécois et canadien en lien avec la liberté d’expression

        Faits saillants

        • Mésinformation et désinformation: deux langues, deux vocabulaires. Les fausses informations constituent un enjeu d’importance comparable dans les médias anglophones et francophones (19,2 % et 19 %), bien que les premiers parlent davantage de « mésinformation » (54 % du sous- corpus, ratio normalisé1 6,2 pour 1) et les seconds de « désinformation » (67 % du sous-corpus, ratio normalisé 0,82 pour 1).

        • Surreprésentation de figures politiques états-uniennes et prédominance de Donald Trump dans nos médias. 48 % et 52 % des dix personnalités les plus citées dans les médias québécois et du reste du Canada sont états-uniennes; Trump est mentionné respectivement 3,4 et 3,6 fois plus que Carney, 4,4 fois plus que François Legault et 8,3 fois plus que Danielle Smith.

        • La droite conservatrice, référent politique dominant des médias canadiens. La droite conservatrice domine la couverture médiatique des deux corpus : 71,5 % au Québec et 72 % dans le reste du Canada. Cet écart s’estompe en excluant les articles sur Trump (51/49 et 50/50), mais se creuse dès qu’on retranche ceux mentionnant les chefs d’État et de gouvernement (ou de l’opposition) (66 % au Québec et 85 % dans le reste du Canada).

        • La liberté d’expression au Québec, sujet marginal des médias anglophones. Le Québec est mentionné dans 56 % des articles francophones, contre 15 % des articles anglophones Les articles mentionnant uniquement le Québec représentent 1 % des articles anglophones contre 19 % des articles francophones; les articles faisant référence à la fois au Canada et au Québec représentent 17 % des articles francophones contre 2,5 % des articles anglophones.

        • Les médias francophones et l’ancrage québécois de l’actualité internationale. Alors que les médias anglophones situent l’actualité internationale sur la liberté d’expression dans un cadre canadien ou mondial, les médias francophones tendent à l’ancrer dans la réalité québécoise Le fait que 56 % des articles francophones mentionnent le Québec comme référent territorial et que les manifestations contre l’équipe Israël-Premier Tech au Grand Prix cycliste de Montréal représentent le 3e pic de publication francophone sur les mobilisations autour de la guerre à Gaza illustrent cette tendance structurelle.

        • La mort de journalistes, point de bascule éditorial des la couverture anglophone sur les mobilisations autour de la guerre à Gaza. Le bombardement de l’hôpital Khan Younès le 25 août, qui a coûté la vie à 5 journalistes, est abordé de manière factuelle3 (87 %) Sept jours plus tard, les médias anglophones se font le relais de la vague d’indignation mondiale : 83 % des articles évoquant la Flottille Global Sumud la situent dans le contexte de violation des droits humains (génocide, famine) Ce basculement, exclusivement anglophone, se double d’une polarisation : tous les articles d’opinion4 publiés ce jour-là, le 1e septembre, dénoncent la campagne de désinformation anti-israélienne.

        • Plus de prises de position dans les médias anglophones, des contenus plus orientés dans les médias francophones. Les médias anglophones et francophones publient un pourcentage équivalent d’articles factuels sur les sujets relatifs à la liberté d’expression (autour de 67 %) Si les médias anglophones recourent plus volontiers à l’opinion explicite (7 % contre 4,5 %) tandis que les médias francophones privilégient l’orientation5 tacite (29 % contre 25 %), les deux corpus convergent en faisant des grèves un sujet qui génère davantage d’articles d’opinion (14 % et 10 %).


        L’état de la liberté d’expression dans les médias du Québec et du Canada