Fichier:Rating averages for users who rated all four categories during AFTv4.svg

Fichier d’origine(Fichier SVG, nominalement de 960 × 564 pixels, taille : 47 kio)

Ce fichier et sa description proviennent de Wikimedia Commons.

Description

Description
English: Quick plot showing the averages for users who rated all four categories during the AFTv4 public data period. A user could rate anywhere from 1-4 categories and those who rated four tended to apply the same rating to all four categories (usually all 1s or 5s).

Code to reproduce this plot is available on Github. A copy is reproduced below for convenience only:

library(ggplot2)

# sort of a waste to download all of them from within R. 
# much easier to download and then run something like:
#      sed "1q" 20110523.csv > names.txt
#  This batch has some undocumented fields which aren't worth figuring out atm
#      rm 20110620.csv
#      cat *.csv > temp
#      grep -v "aa_page" temp > out.csv
#      rm temp

header <- scan("/Users/protonk/R/AFT Dump/names.txt", what = "character", sep = ",")

in.classes <- c(rep("numeric", 2), "character", rep("numeric", 2), "character", rep("numeric", 13))

indrat <- read.csv("/Users/protonk/R/AFT Dump/out.csv",
                   header = FALSE, colClasses = in.classes,
                   nrows = 2508605)
names(indrat) <- header

# we only want the ratings
reduced <- indrat[, c("aa_rating_wellsourced", "aa_rating_neutral", "aa_rating_complete", 
                        "aa_rating_readable")]

# We are only interested in rows where the user rated all 4 categories
reduced[reduced == 0] <- NA
rating.avgs <- rowMeans(reduced[complete.cases(reduced), ])

count.table <- table(rating.avgs)

# Builds factors of the rating avgs (ordered by count)
# and another factor for just the integers (this is a ggplot2 thing)
count.out <- actor(rating.avgs, levels = names(count.table), ordered = TRUE)
integers <- factor(count.out, levels = as.character(1:5))
# placed into a data frame for easier plotting
preplot <- data.frame(count.out, integers)

# Plot frequency of averages
qplot(count.out, fill = integers, geom = "bar", data = preplot) + 
  opts(legend.position = "none", title = expression("Averages of ratings where users rated all four categories")) + 
  scale_y_continuous(name = "") +  scale_x_discrete(name = "")
Date
Source Travail personnel
Auteur Protonk

Conditions d’utilisation

Moi, en tant que détenteur des droits d’auteur sur cette œuvre, je la publie sous la licence suivante :
w:fr:Creative Commons
paternité partage à l’identique
Ce fichier est disponible selon les termes de la licence Creative Commons Attribution – Partage dans les Mêmes Conditions 3.0 (non transposée).
Vous êtes libre :
  • de partager – de copier, distribuer et transmettre cette œuvre
  • d’adapter – de modifier cette œuvre
Sous les conditions suivantes :
  • paternité – Vous devez donner les informations appropriées concernant l'auteur, fournir un lien vers la licence et indiquer si des modifications ont été faites. Vous pouvez faire cela par tout moyen raisonnable, mais en aucune façon suggérant que l’auteur vous soutient ou approuve l’utilisation que vous en faites.
  • partage à l’identique – Si vous modifiez, transformez, ou vous basez sur cette œuvre, vous devez distribuer votre contribution sous la même licence ou une licence compatible avec celle de l’original.
 
Ce graphique a été créé avec R.

Légendes

Ajoutez en une ligne la description de ce que représente ce fichier

Éléments décrits dans ce fichier

dépeint

Historique du fichier

Cliquer sur une date et heure pour voir le fichier tel qu'il était à ce moment-là.

Date et heureVignetteDimensionsUtilisateurCommentaire
actuel3 mai 2012 à 20:00Vignette pour la version du 3 mai 2012 à 20:00960 × 564 (47 kio)ProtonkMuch better display of the disparity.
3 mai 2012 à 10:29Vignette pour la version du 3 mai 2012 à 10:29960 × 564 (47 kio)Protonkupdated for all ratings.
3 mai 2012 à 07:03Vignette pour la version du 3 mai 2012 à 07:03960 × 564 (46 kio)Protonk

Les 2 pages suivantes utilisent ce fichier :