OpenStreetMap

OSM: chasseurs, cueilleurs et jardiniers

Posted by cquest on 6 January 2021 in French (Français).

Une nouvelle année démarre et c’est l’occasion d’imaginer les voeux à souhaiter pour OpenStreetMap et sa communauté.

OpenStreetMap a démarré à partir d’une feuille blanche il y a plus de 15 ans pour créer le plus grand commun cartographique qui soit.

Ce commun existe par l’engagement de personnes aux profils et motivations diverses.

Les Chasseurs

Petit à petit, cette carte blanche s’est remplie avec des données collectées par des contributeurs “chasseurs”. À l’époque préhistorique d’OSM, il fallait en effet aller sur le terrain, équipé d’un GPS, d’un bloc-note et d’un crayon, pour prendre des notes puis reporter ça sur la feuille blanche, sans autre point de repère.

OpenStreetMap au 1er janvier 2007 OpenStreetMap au 1er Janvier 2007

Les contributeurs qui ont connu cette époque sont rares, moins de 500 contributeurs apparaissent dans les données au 1er janvier 2007 (un peu moins de 5000 un an plus tard), les comptes les plus actifs étant ceux utilisés pour l’import des traits de côte (source=PGS, vous vous souvenez ?)… afin de séparer terre et mer !

Le nombre de contributeurs a fortement augmenté depuis, on compte désormais régulièrement plus de 6000 contributeurs actifs quotidiennement. Ces 500 (444 pour être précis) sont désormais 1 177 633 au décompte du 27 décembre 2020 fait par Pascal Neis.

L’ajout de nouvelles données reste l’activité principale, comme l’indique ces autres statistiques :

Statstiques décembre 2020 https://osmstats.neis-one.org/?item=elements

Les Cueilleurs

Nos cueilleurs dans OpenStreetMap sont les réutilisateurs des données. Des réutilisateurs de deux natures : directs ou indirects.

Les réutilisateurs directs, sont ceux qui manipulent des données géographiques directement pour leur compte ou pour produire des outils et services pour d’autres.

En général ils savent qu’ils utilisent des données OpenStreetMap, les ont téléchargées, retraitées. Parfois, ils contribuent aussi et sont donc des chasseurs-cueilleurs.

Les réutilisateurs indirects, ce sont toutes ces personnes qui sur un site web ou dans une appli ont un fond de carte sous les yeux produits à partir de données OSM. Ils ne le savent souvent pas soit parce qu’ils n’ont pas remarqué l’attribution visible au coin de cette carte, ou soit parce qu’elle est absente ou cachée derrière un “i”.

Ces cueilleurs là, sont plus rarement des chasseurs-cueilleurs, car ils ne sont que rarement conscient qu’ils peuvent contribuer, le lien “improve this map” n’est en effet pas généralisé dans l’attribution et pourrait l’être plus systématiquement.

Les Jardiniers

Le jardinage dans OSM consiste en l’entretien des données, c’est-à-dire leur mise à jour régulière, la suppression d’informations obsolètes, la correction d’erreurs, le maintien de la cohérence.

La motivation principale est la qualité qui se décline sur :

  • l’exhaustivité (viser 100% de complétude sur tel ou tel type d’objet)
  • l’homogénéité (utiliser les mêmes tags partout, combler des trous sur le niveau de détail, etc)
  • la précision géométrique (par exemple recaler des éléments anciens tracés sur des sources peu précises à partir de nouvelles sources plus précises)

Ce rôle de jardinier est souvent ingrat car peu visible et moins valorisé que celui de chasseur. L’entretien d’un édifice est pourtant gage de longévité de la construction !

Le besoin vital de jardinage

Les données géographiques ont cette particularité de décrire un monde en perpétuel changement sur le terrain et doivent donc être entretenues au risque de devenir rapidement obsolètes et de moins en moins fiables.

Ce rôle de jardinier est donc très important pour l’avenir d’OpenStreetMap si l’on ne veut pas que le commun ne soit qu’une accumulation de données allant toujours plus dans le détail mais sans l’indispensable entretien de l’ensemble.

Revenons au début… les lignes de côte PGS. Leur tracé était très approximatif, car basé sur une analyse automatique d’images satellitaires de moyenne résolution. L’import fait en 2006 a été régulièrement affiné, mais il reste quelques zones sur les côtes françaises non retouchées depuis, alors que des données opendata précises des traits de côte sont disponibles et que nous avons maintenant des photos aériennes récentes de haute-résolution.

Noeuds PGS résiduels Encore quelques noeuds issus de PGS 2006

Valoriser les jardiniers

Pour mettre en avant leur travail, certains “projets du mois” pourraient être orientés sur le jardinage.

Le bouclage de certains chantiers (ex: tous les noeuds PGS version 1 ont été revus), pourrait être l’occasion d’une communication comme nous avions pu le faire lors de la fin du chantier sur les limites de communes (à revoir elles aussi car tracées à l’époque dans bien des endroits sur des plans raster du cadastre calés tant bien que mal dans JOSM).

Recruter des jardiniers

Les deux viviers immédiats sont les chasseurs et les cueilleurs.

Comment motiver les chasseurs à se mettre au jardinage, à corriger et entretenir plutôt que d’accumuler de nouveaux objets ou tags de détail ?

qui va entretenir ce que j’ajoute

Le simple fait de se poser régulièrement cette question pourrait permettre de prendre conscience de l’intérêt de l’entretien.

Les cueilleurs sont l’autre vivier et ont besoin d’outils encore plus simples pour contribuer à l’entretien comme le simple fait de confirmer qu’une information est toujours valable.

Aider les jardiniers

Vue la masse actuelle de données, il n’est pas évident de repérer ce qui a besoin d’être revu, amélioré, mis à jour voire supprimé car obsolète. C’est là où des outils sont indispensables pour que la marche à l’entrée du jardinage ne soit pas trop haute.

Osmose est un outil formidable pour cela. Il permet par ses analyses de repérer ce qui a besoin d’entretien. De nouvelles analyses plus orientées sur la fraicheur des données pourraient venir compléter l’existant qui s’est beaucoup développé ces dernières années autour de l’intégration de données opendata toujours plus nombreuses.

Quelques idées:

  • les bâtiments disparus du cadastre, ceux qui sont nouveaux
  • l’aide au repérage des landuse de Corine Land Cover non mis à jour en se basant sur d’autres sources comme le RPG, ou OCS-GE

La détection de divergences entre les données OSM et l’opendata est une approche possible, sûrement pas la seule.

L’ouverture de la BD Topo et l’accès à ces nouvelles données, doit être l’occasion de prendre un peu de temps pour repenser les outils pouvant faciliter le jardinage.

De la binette au motoculteur

Les jardiniers ont besoin d’aide, d’outils adaptés facilitant l’entretien pour passer de la binette au motoculteur voire au tracteur !

Avec l’ouverture de la BD Topo par l’IGN, une grosse masse de donnée géographique est désormais utilisable pour compléter et améliorer les données OpenStreetMap.

Comparer automatiquement les données OSM et IGN permet de gagner du temps et de concentrer les efforts de mise à jour là où ils sont nécessaire plutôt que de chercher l’aiguille dans la meule de foin.

Depuis quelques jours, nous pouvons enfin comparer le filaire des voies avec celui de la BD Topo ce qui, par exemple, permet de détecter les départementales rurales tracées au GPS il y a des années et pas trop revues depuis !

Le résultat est disponible dans osmose et pour aider à se repérer, un rendu “technique” de la voirie de la BD Topo est accessible depuis nos éditeurs habituels. Osmose couplé au mode télécommandé de JOSM permet de gagner énormément de temps !

Exemple de route décalée Exemple de route décalée

En rouge, c’est l’objet actuel dans OpenStreetMap, en magenta, le tracé provenant de la BD Topo.

Un peu plus de 30000 tronçons ont été repérés par l’analyse automatique, quelques centaines par département, ce qui devrait pouvoir être corrigé assez rapidement par les jardiniers volontaires !

Bon jardinage pour cette nouvelle année !

Comment from Verdy_p on 6 January 2021 at 19:58

Il semble y avoir des désaccords sur les numéros de référence (par exemple Osmose signale une “D106E”, idem le cadastre, mais les deux ont tord car sur le terrain c’est en fait “D 106E1”. Omose signale alors une erreur de “décalage” alors que ce n’est pas du tout un problème de géométrie (vérifiée très précisément sur BD Ortho et parfaitement au milieu de la route visible sans jamais sortir de la largeur de chaussée ni même de plus de quelques centimètres car on voit précisément les points centraux) mais de désaccord sur le numéro de référence.

Se peut-il que le cadastre ait tronqué les numéros de référence en admettant une seule lettre après un numéro de base, et aucun indice numérique après ?

Si Osmose ne trouve pas une ref mais trouve une route précisément bien positionnée, le message devrait être différent pour indiquer une différence de numéro de ref (et parfois, souvent même, c’est le cadastre qui a tord et n’est pas à jour avec les indications sur le terrain!)

L’absence ou la présence d’un indice ne semble pas être un facteur limitant (je ne parle pas d’un écart entre ref=”D 108” et ref=”D 106” (qui devrait être corrigé en old_ref=*) mais bien d’une différence entre ref=”D 108” et ref=”D 108E” (toujours faux à mon avis) ou ref=”D 108E1” (la lettre doit être souvent suivie d’un indice sauf quand cette lettre est A ou B, mais la lettre E désigne un “écart”, une petite branche locale de la route principale et ces écarts ont leur indice propre).

Comment from atabaraud on 6 January 2021 at 23:43

Bonjour Christian,

Est ce que tu penses qu’il serait possible/faisable de revenir en arrière sur des imports de masse de mauvaise qualité en 2021 ?

Dans les Antilles françaises la qualité de l’import du cadastre est vraiment de très mauvaise qualité, c’est vraiment contre productif; achever le jardinage est beaucoup trop complexe.

En effet il semble plus rapide de tout retracer à la main sur l’imagerie satellite plutôt que de sélectionner manuellement les features à conserver/à retoucher/à supprimer

Il y a beaucoup de bâtiments qui n’ont jamais été touchés depuis l’import du cadastre, le volume de contributeurs reste en effet limité.

L’IGN a des contours de bâtiments bien plus fiables que le cadastre dans la BD Topo d’après ce que j’ai pu voir, je ne sais pas trop comment a été produit leur dataset.

Je me posais donc la question de savoir si il serait possible de lancer en 2021 un chantier dans les Antilles françaises pour supprimer les imports de masse sur les bâtiments au niveau des zones vierges de modifications pour refaire un import avec les données de bâti de la BDTopo qui viennent d’être libérées par l’IGN.

Aurélien

Comment from cquest on 6 January 2021 at 23:58

Bonsoir Aurélien,

C’est sûr que par endroit, remplacer un import ancien de qualité médiocre par des données plus récentes et de meilleure qualité peut être le mieux à faire. Ce qui ne sera pas simple, c’est de conserver les enrichissements qui avaient pu être faits, et de conserver la cohérence topologique d’ensemble…

Rien d’infaisable, mais c’est un sacré chantier, qui peut valoir le coup !

Il faut de toute façon prendre du recul et assez de temps pour évaluer l’apport d’un remplacement massif de données et la complexité de l’opération.

Comment from Thomas IdGeo on 7 January 2021 at 05:48

Bonjour Christian, merci pour cet article. Je me sers beaucoup de ce genre d’éléments comme contenu de cours auprès de stagiaires formés. Je suis essentiellement un cueilleur qui recrute régulièrement du nouveau contributeur (dont je ne connaît pas le taux de conversion :D ). Merci à bientôt

Comment from cquest on 7 January 2021 at 07:49

Bonjour Thomas,

Profites-en pour les sensibiliser au jardinage !

C’est moins gratifiant de corriger, de nettoyer que d’ajouter toujours plus de données, mais c’est indispensable si on ne veut pas que la base ressemble à terme à une jungle de données.

Comment from Cyrille37 on 7 January 2021 at 08:49

Merci pour ce chouette article et pour ces fabuleux outils que sont Osmose et les couches TMS allumés par des ingénieux bénévoles <3

et Bonne année aux jardini·ère·er·s !

Comment from polo0000 on 7 January 2021 at 14:29

Merci pour cette article, ça donne envie de jardiner. Bonne année à tous.

Comment from olivier devillers on 8 February 2021 at 17:47

Pour continuer la métaphore, OSM n’a t-il pas besoin d’engrais ? (je sais les gros chimistes ne sont pas ni sexy ni très dans l’air du temps…) Néanmoins je pense à ces quelques collectivités qui connectent leur SIG à OSM et mettent à jour en masse du linéaire de réseau, du mobilier urbain, toutes sortes d’objets qui sont générateur d’usages, de feedback et donnent envie de jardiner !


Login to leave a comment