OpenRefine

logiciel de nettoyage et mise en forme de données

OpenRefine est un logiciel libre de nettoyage et de mise en forme de données. Il est similaire dans son apparence à un tableur mais fonctionne en fait comme une base de données.

OpenRefine
Description de l'image OpenRefine logo (2018-present).svg.
Description de l'image 06 match with wikidata screenshot slides.png.
Informations
Développé par Google, Metaweb (en) et Antonin Delpeuch (d)Voir et modifier les données sur Wikidata
Première version
Dernière version 3.7.9 ()[1]Voir et modifier les données sur Wikidata
Dépôt github.com/OpenRefine/OpenRefineVoir et modifier les données sur Wikidata
Assurance qualité Intégration continueVoir et modifier les données sur Wikidata
Écrit en Java et JavaScriptVoir et modifier les données sur Wikidata
Système d'exploitation Microsoft Windows, macOS et LinuxVoir et modifier les données sur Wikidata
Formats lus TSV, comma-separated values, XLSX, RDF/XML, Machine-Readable Cataloging, JavaScript Object Notation et Notation3Voir et modifier les données sur Wikidata
Langues Anglais, italien, langues chinoises, japonais et françaisVoir et modifier les données sur Wikidata
Type Outil de Wikidata (d)Voir et modifier les données sur Wikidata
Licence Licence BSDVoir et modifier les données sur Wikidata
Documentation openrefine.org/docsVoir et modifier les données sur Wikidata
Site web openrefine.orgVoir et modifier les données sur Wikidata

Historique modifier

Ancien logo
Nouveau logo

Openrefine a pour origine le logiciel Freebase Gridworks qui fut développé à partir de 2009 par la société Metaweb (en) afin de faciliter la préparation des données à importer dans sa base de connaissances Freebase basée sur les principes du web sémantique et qui publiait ses données en licence ouverte.

Le , est annoncé la sortie de la version 1.0 de Freebase Gridworks[2].

Le , Google a racheté la société Metaweb[3].

Le , Google annonce la version 2.0 du projet qui a été renommé Google Refine[4].

En 2012, le développement n'est plus assuré par Google. Le nom est changé en OpenRefine.

En , Google News Initiative offre 100 000 USD pour permettre le développement d'OpenRefine, qui permit entre autres d'effectuer les versions 2.8 et 3.0[5].

Fin 2019, l'Initiative Chan Zuckerberg a attribué, dans le cadre de son programme « Essential Open Source Software for Science », à OpenRefine 200 000 USD pour permettre son développement en 2020[6].

Fonctionnalités modifier

  • Nettoyage de données.
  • Manipulation de données, d'un format à un autre.
  • Moissonnage de données d'un site web.
  • Ajout de données depuis un service web.
  • Alignement avec une Wikibase (dont Wikidata).

Références modifier

  1. « Release 3.7.9 », (consulté le )
  2. (en) Unknown, « Freebase Gridworks 1.0 released! » [html], sur freebase-gridworks.blogspot.com, (consulté le ).
  3. (en) Jack Menzel, « Deeper understanding with Metaweb » [html], sur googleblog.blogspot.com, Google, (consulté le ).
  4. (en) David Huynh, « Announcing Google Refine 2.0, a power tool for data wranglers » [html], sur opensource.googleblog.com, Google, (consulté le ).
  5. (en) Unknown, « Update: Google News Initiative and technical road map » [html], sur openrefine.org, (consulté le ).
  6. (en) Unknown, « OpenRefine funded by the Chan Zuckerberg Initiative as an Essential Open Source Software for Science »(Archive.orgWikiwixArchive.isGoogleQue faire ?) [html], sur openrefine.org, (consulté le ).

Voir aussi modifier

Sur les autres projets Wikimedia :

Bibliographie modifier

Articles connexes modifier

Liens externes modifier