Collecte et usages de données issues de Wikipédia et Wikidata dans les recherches en SHS

Prévue le 17 Juin 2025

Organisateur·rices

Camille Dabestani

Mégane Fernandez

Thomas Louail

Date (iCal)

17 juin 2025

L’originalité de cette journée d’étude réside dans une organisation en deux demi-journées, alliant présentations de problématiques scientifiques et de résultats et enjeux méthodologiques. Le matin sera dédié à la présentation de résultats de recherches sur Wikipédia, tandis que l’après-midi les mêmes intervenant·es développeront un aspect plus méthodologique et technique des traitements ayant permis d’aboutir aux résultats qu’elles et ils auront présentés le matin, de l’extraction des données à leurs analyses quantitatives et qualitatives.

Programme détaillé

Matinée (9h30–12h30) : Résultats de recherches

  • Quantifier le conflit sur Wikipédia au-delà de la “guerre d’édition” Guillaume Collain (Pacte / Univ. Grenoble Alpes)

  • Autobiopedia : détecter les scientifiques autobiographes sur Wikipédia Hadrien Commenges (Géographie-cités / Université Paris 1)

  • Biais spatiaux et de genre dans la représentation des groupes sociaux sur Wikipédia : les géographes et espérantistes Mégane Fernandez & Camille Dabestani (Géographie-cités / Université Paris 1)

  • Wikipedia et Wikidata comme sources pour l’étude des représentations des inondations à travers le monde Lise Vaudor (EVS / CNRS)

  • De quoi est faite Wikipédia ? Quelques pistes pour une analyse de sa régulation au prisme des effacements réciproques Léo Joubert (Dysolab / Université de Rouen)

Après-midi (14h–17h30) : Atelier méthodologique

Présentations et discussions autour des outils R, Python, SPARQL, avec focus sur l’extraction et l’exploitation de données issues de Wikipédia.

Pas de prérequis techniques exigés : les exposés seront accessibles à tous. Une première expérience de la programmation rendra les présentations plus expressives.

Pourquoi y participer ?

  • Découvrir des cas concrets d’analyse de Wikipédia en SHS (représentations sociales, biais géographiques, conflictualité éditoriale).

  • Échanger sur les enjeux éthiques et méthodologiques des données collaboratives.

  • Explorer des modes de collecte et outils (SPARQL, Python) possiblement utiles pour vos propres recherches.

Thématiques transversales

  • Études des communs numériques

  • Analyse de données

  • Éthique et régulation des contenus en ligne

Mots-clés

Humanités numériques, open data, Wikipédia, méthodes mixtes, SHS.

Inscription

L’inscription est gratuite mais obligatoire. Participation sur place dans la limite des 90 places disponibles. Participation en visio possible. Inscription sur ce formulaire

Accès

La journée d’étude se déroulera au centre des colloques du campus condorcet.