Projet:Communes de France/actualisation de la population (Insee 2014)

La section « Démographie » d'un grand nombre d'articles de communes françaises comporte des tableaux et des graphiques qui sont générés grâce à des modèles utilisant des modèles de données, comme par exemple {{Données/Artenay/évolution population}} pour Artenay.

Ces modèles de base de données permettent de stocker toutes les informations concernant l'évolution de la population de la commune. Ces modèles doivent être actualisés chaque année avec les nouvelles données. L'actualisation nécessite de changer plusieurs de ces paramètres, car il convient de prendre en compte les nouvelles données démographiques, mais aussi la convention d'affichage des données.

Les populations légales millésimées 2011 entrent en vigueur le 1er janvier 2014 et ont été mises en ligne par l'Insee le 31 décembre 2013. L'actualisation 2014 des modèles de données consiste à intégrer ces nouvelles données dans les modèles et à procéder à l'ajout de nouveaux paramètres, dont le sourçage direct dans le modèle de toutes les données.

Parallèlement sont créés les modèles de données pour les DOM et COM. Il conviendra ensuite d'adapter les modèles de tableaux pour permettre un affichage correct des sources.

Convention d'affichage

modifier

Des différentes discussions qui ont eu lieu au sein du Projet:Communes de France, la convention d'affichage retenue, pour tenir compte de la réforme du recensement entrée en vigueur en 2006 (mais commencée en 2004), est la suivante :

  • jusqu'à 2006, affichage de tous les populations issues de recensements et sourcées ;
  • année 2006 : affichage systématique ;
  • après 2006 : pour les communes de population inférieure à 10 000 habitants, affichage uniquement des recensements « exhaustifs » et de la dernière année de recensement (2011 pour l'actualisation 2014).

Situation des modèles de données avant actualisation

modifier

Ces modèles utilisent les paramètres suivants :

  • max : indique le nombre maximal d'habitants qu'a connu la commune. Ce paramètre permet entre autre de calculer automatiquement les hauteurs des colonnes des graphiques.
  • source1, 2 et 3 : permet d'ajouter l'url de différentes sources telles que Cassini, l'Insee, etc.
  • sources : les sources sont normalement ajoutées automatiquement. Cependant il est possible d'ajouter d'autres sources en utilisant ce paramètre, comme par exemple : |sources=Archives départementales
  • nombre : indique le nombre d'années de recensement que compte le modèle de données.
  • an 1 à ~ : ajoute une date de recensement. Lorsque l'on renseigne une année de recensement, celle-ci s'accompagne obligatoirement du paramètre « pop » correspondant.
  • pop 1 à ~ : indique le nombre d'habitants pour une année définie
  • an : indique la dernière année de recensement. Cette dernière année doit également, pour des raisons techniques, être ajoutée dans les paramètres « an » numérotés (voir exemple ci-dessous avec l'année 2009).
  • pop : indique le nombre d'habitants pour le dernier recensement.

Les modèles de données ne sont pas protégés et peuvent donc être modifiés. Ainsi de nombreux contributeurs — croyant bien faire — ont ajouté des données nouvelles, parfois de manière exhaustive (années 2007, 2008, 2009, 2010), parfois de manière incomplète.

L'actualisation devra, tant que faire se peut, rétablir la convention d'affichage.

Une macro en VBA pour traiter le sujet

modifier

En 2014, est expérimentée une nouvelle macro (dans Excel) permettant de rétablir une situation conforme à la convention d'affichage et prenant en compte les données 2014 (recensement 2011).

La situation étant déjà complexe, viennent se superposer les cas suivants :

  • les communes dont les noms dans WP ont été renommés depuis la création des modèles de données ;
  • les communes qui n'ont pas de modèle de données.

Principe de fonctionnement

modifier

La macro fonctionne de la façon suivante :

  1. récupération sur le web du corps de l'article « modèle de donnée de la commune xx » ;
  2. identification des différents paramètres définis ci-dessus, par traitement des chaînes de caractères ;
  3. récupération de l'année de recensement de la commune en question et du dernier recensement ;
  4. modification du corps de l'article ;
  5. chargement du corps de texte modifié sur le web et sauvegarde.

Actions réalisées

modifier
  • Ajout du code insee. Ce nouveau paramètre permet d'identifier la commune sans avoir recours au modèle et permettra différents traitements sur les données.
  • Ajout des populations 2011 :

ex1 : Communes de moins de 10 000 habitants ayant une ou plusieurs données entre 2006 et 2010 (2007, 2008, 2009 ou 2010)

Pour une commune dont le recensement 2008 a été saisi, la question se pose de savoir si 2008 est bien un recensement exhaustif, selon le cas, les corrections sont les suivantes (en gras) :

Situation actuelle Actualisation 2014
2006 = recensement exhaustif 2007 = recensement exhaustif 2008 = recensement exhaustif 2009 = recensement exhaustif 2010 = recensement exhaustif
nombre = 35
an34=2006|pop34=1257
|an35=2008|pop35=1301
|an=2010|pop=1317
nombre = 35
an34=2006|pop34=1257
|an35=2011|pop35=1368
|an=2011|pop=1368
nombre = 36
an34=2006|pop34=1257
|an35=2007|pop35=xxx
|an36=2011|pop36=1368
|an=2011|pop=1368
nombre = 36
an34=2006|pop34=1257
|an35=2008|pop35=1301
|an36=2011|pop36=1368
|an=2011|pop=1368
nombre = 36
an34=2006|pop34=1257
|an35=2009|pop35=xxx
an36=2011|pop36=1368
|an=2011|pop=1368

nombre = 36
an34=2006|pop34=1257
|an35=2010|pop35=xxx
|
an36=2011|pop36=1368
|an=2011|pop=1368

Pour effectuer ces corrections, il convient de disposer des bases de données démographiques de 2006 à 2011, préalablement récupérées sur le site de l'Insee.

ex2 : Communes de plus de 10 000 habitants : par convention, ne seront affichés que les recensements 2006, 2011, 2016 et la dernière population légale.

  • Ajout des premiers recensements 2004 et 2005 : lorsque le premier recensement de la commune a été fait en 2004 ou 2011, les données sont ajoutées dans les paramètres ann et popn.
  • Correction du max : si la population 2011 est supérieure au paramètre max, ce dernier est mis à jour.
  • Ajout des paramètres recens n et source-recens n : ces paramètres permettent de sourcer en direct toutes les données post-2006.
  • Corrections de l'année 2008 : une erreur de manipulation lors de la création des modèles de données en 2012, avait conduit à des valeurs erronées de certaines populations 2008. Bien que peu nombreuses, il en subsiste encore quelques-unes. Le programme rétablira les bonnes valeurs, lorsque 2008 est un recensement exhaustif.
  • Actualisation de la documentation : la documentation du modèle est modifiée pour tenir compte des nouveaux paramètres.

Création modèles de données DOM et COM

modifier

Fait en semi-automatique pour Guadeloupe, Martinique, Guyane, La Réunion (période 1961-2011 pour les 4 départements, soit 112 communes), pour la Polynésie française (1971-2012, 48 communes). Modèle de données à jour et modèles d'affichage dans les articles aussi. Reste néanmoins à modifier le modèle {{Section démographie d'article de commune de France}} afin qu'apparaissent correctement les sources (supprimer Cassini et supprimer bug sur la note « à partir de 200098747 »). Reste à faire St Pierre-et-Miquelon, St-Barth, St-Martin, la Nouvelle-Calédonie et Mayotte. — t a r u s¡Dímelo! 16 janvier 2014 à 15:37 (CET)[répondre]

Avancement de l'actualisation

modifier

Chronologie

modifier

3-4 janvier : départements 45 à 59

Cas particulier à résoudre en fin de processus

modifier

Notes et références

modifier

Voir aussi

modifier