Jeux de Paris 2024 et discrimination des athlètes : ce que nous disent les réseaux sociaux
Les principaux enseignements de l'analyse des discussions en ligne autour des athlètes lors des Jeux de Paris 2024
- 869 000 mentions ont été collectées lors des Jeux Olympiques et Paralympiques de Paris 2024.
- Les athlètes olympiques ont attiré une attention sept fois supérieure à celle de leurs homologues paralympiques. Il y a une nette domination des athlètes valides et para-athlètes masculins, qui représentent près de 60 % des conversations autour des Jeux.
- La majorité des commentaires ont été publiés sur X (anciennement Twitter), suivi de YouTube. Sur X, les Jeux Olympiques ont été commentés par un public plus jeune que celui ayant réagi aux Jeux paralympiques : les 18-34 ans représentent 62 % des internautes actifs autour des JO sur la plateforme, contre 44 % pour les Jeux Paralympiques.
- Les pics de conversation ont été principalement générés par les victoires des athlètes masculins français, tandis que les mentions des athlètes féminines étaient moins fréquentes ou liées à des controverses.
- La question des polémiques liées aux athlètes (au regard de leur sexe, de leur genre, de leur religion…) a émergé dans les conversations en ligne de manière significative : 22% des publications publiées ont abordé ce sujet, qu'il s'agisse d'attaques ou au contraire de messages de soutien. Cependant, le poids des publications offensantes voire potentiellement discriminatoires publiées envers les athlètes est plus mineur (3% des conversations Jeux Olympiques et Paralympiques).
Quelle place des différents types de discriminations au sein des discussions en ligne autour des athlètes ?
La question du sexisme, celle du racisme et de l’identité de genre ont toutes les trois émergé de manière notable sur les réseaux sociaux durant les Jeux : polémiques, discours offensants partagés envers les athlètes, intervention d’internautes pour défendre certains athlètes visés,... Si l’on s’intéresse plus spécifiquement aux publications offensantes voire potentiellement discriminatoires dirigées contre les athlètes, ces trois catégories sont également les plus représentées.
La thématique de l'identité de genre, en particulier, s'est démarquée avec un indice discriminatoire particulièrement élevé (attaques directes, débats virulents et viraux en ligne, etc.). Des propos potentiellement sexistes et racistes ont également émergé tout au long des Jeux, ciblant un éventail plus large d'athlètes en fonction, par exemple, de leur apparence physique ou de leur origine, ... Les discussions sur l'islam et le judaïsme, bien que représentant une plus petite partie des conversations, ont également montré des indices discriminatoires élevés.
Le cas d'Imane Khelif, cible de commentaires virulents en ligne sur son identité de genre et sa nationalité, illustre l'intersection et l'amplification de récits offensants ou potentiellement discriminatoires. La boxe a d’ailleurs été le sport le plus cité, principalement en raison des discours et controverses entourant la boxeuse algérienne.
A noter : les Jeux Paralympiques ont suscité moins de débats polémiques et de discours haineux que les Jeux Olympiques, probablement en raison d'une atmosphère plus positive et d'un focus sur les réussites des para-athlètes, ou peut-être d’une moindre attention médiatique globale.
Cerner les sujets sensibles et les propos supposément discriminatoires en ligne : une méthodologie innovante
Pour cette étude, nous avons utilisé une méthode de data science innovante basée sur l’intelligence artificielle générative.
Cette méthode permet, dans un premier temps, d’identifier et de quantifier les conversations liées à différentes catégories sensibles (sexisme, racisme, identité de genre, religion…) au sein des publications, qu’il s’agisse de propos offensants ou non. Puis elle nous a permis de repérer plus finement les publications effectivement offensantes au regard de ces catégories (discrimination supposée, insultes…).
Cette méthode s'appuie sur une équipe d' « agents » (des programmes informatiques basés sur l'intelligence artificielle) alimentés par de puissants modèles de traitement du langage (LLMs, large language models). A chacun de ces agents était assignée une tâche particulière à réaliser sur le corpus de conversation autour des Jeux.
Trois agents principaux ont été utilisés :
- Le classificateur a passé en revue les publications publiées autour des Jeux, et a identifié ceux liés à une liste de catégories sensibles préalablement définie (sexisme, racisme, etc.).
- Le vérificateur a revu le travail effectué par le classificateur pour s'assurer que le texte avait été catégorisé correctement, selon les définitions établies.
- L’identificateur de discours offensants a ensuite examiné de plus près les publications attribuées à chacune des catégories sensibles pour y repérer les propos offensants.
Les avantages de cette méthode sont nombreux. Chaque agent a une spécialité, ce qui permet une analyse précise et détaillée. Ils travaillent ensemble pour assurer que le système global fonctionne correctement. Procéder étape par étape permet de réduire les erreurs et d’augmenter la précision des résultats finaux.
A propos de l'Arcom
L’Arcom est une autorité publique indépendante garante de la liberté de communication. Elle a notamment pour mission de permettre l’accès des publics à une offre audiovisuelle pluraliste et respectueuse des droits et libertés, de défendre la création, de contribuer à créer un internet de confiance et de lutter contre les contenus illicites.
A propos de cette étude
Enquête Ipsos pour l'Arcom menée du 26 juillet au 14 août et du 28 août au 11 septembre 2024. Ipsos Synthesio a collecté et analysé 869 000 conversations sociales publiques autour des Jeux Olympiques et Paralympiques de 2024. Le détail des requêtes et des réseaux étudiés est disponible dans le rapport complet.