Wikipédia:Étiquetage/À propos
Wiki labels est à la fois le nom d'une suite logicielle et un projet wiki. Dans ce projet, nous produisons des jeux de données d’artefacts wiki étiquetées (labels) et la suite logicielle est conçu pour faciliter ce travail. Dans le nom du projet le terme étiquette peut être interprété comme nom
- Nous travaillons tous ensemble afin de produire une wiki étiquette pour toutes les données importantes.
ou comme un verbe (à l’instar des expressions à « Wiki aime… »)
- Pour obtenir les données dont nous avons besoin, wiki étiquette la qualité des contributions.
Objectifs et portée modifier
Notre but dans ce projet est de produire des données étiquetées pour les besoins pressants de la communauté Wikipédia. Les sets de données labellisées ont un large champ d'application comme la recherche (analyses qualitatives des arrivants [1] et l'interaction des éditeurs [2]) et le développement d'outils avancés (par exemple les modèles utilisés par User:ClueBot NG et WP:STiki). Généralement, obtenir ce genre d'informations est difficile car il demande un investissement conséquent de temps et d'efforts par un petit groupe de personnes de "coder à la main" ces sets de données.
Nous sommes intéressés par (1), identifier les opportunités de produire un grand nombre de sets de données, (2) de distribuer ce travail le plus possible et, (3), de le rendre facile et efficace aux sets de données "codés à la main".
Regardez notre liste de campagnes pour prendre connaissance de nos récentes actions. Si vous souhaitez aider, rendez-vous sur la liste des membres.
Si vous avez une idée de set de données labellisées que vous aimeriez produire, rendez-vous sur la page de discussions.
Comment puis-je aider ? modifier
Il y a différentes façons de participer aux projets.
- Labeling
- Ce projet a pour but d'ajouter des labels aux artefacts de Wikipédia. Pour la plupart des campagnes de labellisation, un grand nombre d'observations a besoin d'être labellié pour être utilisé en dehors d'un set de données. L'idée est donc de distribuer de manière plus efficace ce genre de travaux.
- Si vous êtes intéressé pour contribuer, ajoutez votre nom dans la liste des participants.
- Programmation
- Fixer les bugs, implémenter de nouvelles fonctionnalités et améliorer les performances système. Les Pull Request sont les bienvenues !
- Regardez du coté du dépôt.
- Administration
- Démarrer les campagnes, se battre avec les bugs système et aider les nouveaux arrivants à démarrer avec le travail de labellisation.
- Si vous êtes intéressé pour aider sur ce point là, contactez EpochFail ou He7d3r
Projets partenaires modifier
Mesure de révisions en tant que service modifier
Un certain nombre des plus puissants outils de Wikipédia sont liés à la qualité des éditions.
Dans ce projet, nous allons construire une API publique de scores classés des révisions.
C'est notre but, en fournissant ce service, de rendre plus facile de construire des outils pour le wiki ainsi qu'améliorer ceux déjà existants.
Pour mettre en place ces outils, nous devons commencer par des données labelées de haute qualité.
C'est la raison de l'arrivée de Wiki Labels. Regardez Wikipédia:Étiquetage/Edit quality
L'avantage principal de cet outil pour les développeurs est via un webservice RESTFul et un système de qualification appelé ORES (Objective revision evaluation service).
ORES offre un webservice qui va générer des scores pour les révisions, sur demande.
Par exemple http://ores.wmflabs.org/scores/enwiki?revids=34854258&models=reverted demande le score du modèle "reverted" pour la révision #34854258 sur le wikipédia Anglais.
References modifier
- Halfaker, A., Geiger, R. S., Morgan, J. T., & Riedl, J. (2012). The rise and decline of an open collaboration system: How Wikipedia’s reaction to popularity is causing its decline. American Behavioral Scientist, 0002764212469365. summary full paper
- m:Grants:IEG/Editor_Interaction_Data_Extraction_and_Visualization