Wikipédia:Étiquetage/À propos

Wiki labels est à la fois le nom d'une suite logicielle et un projet wiki. Dans ce projet, nous produisons des jeux de données d’artefacts wiki étiquetées (labels) et la suite logicielle est conçu pour faciliter ce travail. Dans le nom du projet le terme étiquette peut être interprété comme nom

Nous travaillons tous ensemble afin de produire une wiki étiquette pour toutes les données importantes.

ou comme un verbe (à l’instar des expressions à « Wiki aime… »)

Pour obtenir les données dont nous avons besoin, wiki étiquette la qualité des contributions.

Objectifs et portée modifier

Labels logo
Labels logo

Notre but dans ce projet est de produire des données étiquetées pour les besoins pressants de la communauté Wikipédia. Les sets de données labellisées ont un large champ d'application comme la recherche (analyses qualitatives des arrivants [1] et l'interaction des éditeurs [2]) et le développement d'outils avancés (par exemple les modèles utilisés par User:ClueBot NG et WP:STiki). Généralement, obtenir ce genre d'informations est difficile car il demande un investissement conséquent de temps et d'efforts par un petit groupe de personnes de "coder à la main" ces sets de données.

Nous sommes intéressés par (1), identifier les opportunités de produire un grand nombre de sets de données, (2) de distribuer ce travail le plus possible et, (3), de le rendre facile et efficace aux sets de données "codés à la main". Regardez notre liste de campagnes pour prendre connaissance de nos récentes actions. Si vous souhaitez aider, rendez-vous sur la liste des membres. Si vous avez une idée de set de données labellisées que vous aimeriez produire, rendez-vous sur la page de discussions.

Comment puis-je aider ? modifier

Il y a différentes façons de participer aux projets.

Labeling
Ce projet a pour but d'ajouter des labels aux artefacts de Wikipédia. Pour la plupart des campagnes de labellisation, un grand nombre d'observations a besoin d'être labellié pour être utilisé en dehors d'un set de données. L'idée est donc de distribuer de manière plus efficace ce genre de travaux.
Si vous êtes intéressé pour contribuer, ajoutez votre nom dans la liste des participants.
Programmation
Fixer les bugs, implémenter de nouvelles fonctionnalités et améliorer les performances système. Les Pull Request sont les bienvenues !
Regardez du coté du dépôt.
Administration
Démarrer les campagnes, se battre avec les bugs système et aider les nouveaux arrivants à démarrer avec le travail de labellisation.
Si vous êtes intéressé pour aider sur ce point là, contactez EpochFail ou He7d3r

Projets partenaires modifier

Mesure de révisions en tant que service modifier

Revision scoring logo
Revision scoring logo

Un certain nombre des plus puissants outils de Wikipédia sont liés à la qualité des éditions. Dans ce projet, nous allons construire une API publique de scores classés des révisions. C'est notre but, en fournissant ce service, de rendre plus facile de construire des outils pour le wiki ainsi qu'améliorer ceux déjà existants. Pour mettre en place ces outils, nous devons commencer par des données labelées de haute qualité.
C'est la raison de l'arrivée de Wiki Labels. Regardez Wikipédia:Étiquetage/Edit quality

ORES logo
ORES logo

L'avantage principal de cet outil pour les développeurs est via un webservice RESTFul et un système de qualification appelé ORES (Objective revision evaluation service). ORES offre un webservice qui va générer des scores pour les révisions, sur demande.
Par exemple http://ores.wmflabs.org/scores/enwiki?revids=34854258&models=reverted demande le score du modèle "reverted" pour la révision #34854258 sur le wikipédia Anglais.

References modifier

  1. Halfaker, A., Geiger, R. S., Morgan, J. T., & Riedl, J. (2012). The rise and decline of an open collaboration system: How Wikipedia’s reaction to popularity is causing its decline. American Behavioral Scientist, 0002764212469365. summary full paper
  2. m:Grants:IEG/Editor_Interaction_Data_Extraction_and_Visualization