OpenStreetMap

polo0000's diary

Recent diary entries

Silos à verre Grand Lyon

Posted by polo0000 on 22 December 2020 in French (Français).

photo silo à verre

Analyses du référencement des silos à verre de la Métropole de Lyon

78% c’est le taux de recyclage du verre en France. Et la principale façon de recycler ses déchets en verre est de les apporter aux fameux silos à verre (photo ci-dessus).

Les données de la Métropole de Lyon

La métropole via son site data.grandlyon.com nous fourni un jeu de données avec tous les silos à verre géoréférencés.

On y apprend qu’il y a 2758 silos répartis sur les 59 communes de la métropole.

Carte interactive disponible sur le site :
aperçu carte interactive

Il s’avère qu’il y a 58 points en doublons qui ont été retiré donc il nous reste un nombre étrangement rond 2700.

Les données OpenStreetMap

Extraction réalisé le 12/12/2020 via un script python inspiré de ce dépôt github. La zone définie est la Métropole de Lyon (4850450). Et seul les nœuds contenant les clés :
“recycling_type”=”container”
“recycling:glass_bottles”=”yes”
On été sélectionnés.

Il en ressort 906 silos à verre, répartis comme ceci : aperçu carte avec point silos à verre OSM

Comparaison des deux sources de données

Pour cela je suis parti des données OSM, pour chaque point j’ai cherché s’il y avait un point dans les données du Grand Lyon à moins de 100m aux alentours.

Résultat :
- 851 points avec une correspondance
- 55 points sans correspondance
- 86 points OSM à mois d’un mètre du point des données du Grand Lyon (9.5%)
- 162 points OSM à mois d’un mètre du point des données du Grand Lyon (17.9%)
- 50% des points sont à 9m ou mois d’un point des données du Grand Lyon

Répartition par pas de 5 mètres :
histogramme répartition du nombre de points pas pas de 5 mètre

Si on estime que tous les points qui sont à moins de 100m sont les bon (ce qui n’est pas le cas). On observe également une très grande disparité par commune du nombre de silos référencés dans OSM : histogramme du taux d'enregistrement des silos dans OSM par commune Oullins est en top position avec 49 silos sur 52 (94.2%) enregistré dans OSM alors que Meyzieu est bon dernier avec seulement 1 silo sur 58 d’enregistré (1.7%).

Observation qualitative

En regardant plusieurs points au hasard de chacun des jeux de données et en les cherchant sur la vue aérienne il en ressort que :
-OSM est plus précis sur la position mais n’est pas exhaustif, seulement 33% du nombre total théorique de silos. De plus il y a des silos à verre sur OSM qui n’existe plus réellement ainsi que des points enregistrés comme des silos à verre qui n’en sont pas.

-Les données du Grand Lyon sont plus exhaustives mais il y a des silos à verre physiquement vérifiés qui ne sont tout de même pas dans ce jeux de données. De plus le positionnement n’est pas précis pour un grand nombre de points, plusieurs mètres (voir dizaines) avec la réalité parfois.

Conclusion

Il nous reste pas mal de boulot pour enregistrer tous les silos à verre. On ne peut malheureusement pas importer les données du Grand Lyon dans OSM car elles ne sont pas assez précises. Toutefois à l’aide de ces données ainsi que des photos aériennes il est possible de retrouver facilement certains silos car ils sont bien reconnaissable vu du haut : photomontage de 4 photos aériennes de silos à verre source : Lyon orthophoto 2018

N’hésitez pas à laisser vos remarques et bon mappage!

Boites aux lettres La Poste

Posted by polo0000 on 7 December 2020 in French (Français).

photo boite aux lettres jaune La Poste

Analyse du référencement des boites aux lettres de La Poste en France

De moins en moins utilisé de nos jours le courrier est encore parfois indispensable. Connaitre les emplacements des boites aux lettres jaune de La Poste peut être bien pratique. Dans cet article nous allons analyser l’état d’avancement du référencement des boites aux lettres (que nous nommerons désormais BAL) dans OSM et que nous comparerons aux données mises à disposition par La Poste.

Données OSM

Une BAL est identifiée par l’attribut amenity=post_box auquel on peut y ajouter les horaires de relevé (collection_times : ), l’exploitant (operator : ) en France il ne doit y avoir que La Poste à ma connaissance. Et la référence de la BAL (ref : ) car on le verra plus bas, toutes ces gentilles BAL ont un petit nom unique.

Les chiffres

Nombre total : 30 991 (31 066 avec les DOM) Dont 20 094 (64.8%) avec une référence
Et dont 6 692 (21.6%) avec les heures de relevé.
Répartition :
carte de la France avec des points rouges qui représente les BAL présentes dans OSM

source : https://taginfo.openstreetmap.fr

Données La Poste

Jeu de données disponible sur le site datanova de La Poste ou sur le site data.gouv.fr.

La description de ce jeu de données est téléchargeable ici.

Les chiffres

Nombre total : 135 655
Nombre de BAL avec un “positionnement fin” : 93 539 (69%)

Les coordonnées (X,Y) peuvent être obtenues par repositionnement manuel : l’agent repositionne la BAL directement sur la carte et le jeu de données indique alors « positionnement fin » comme type de géocodage.

Pas grand chose de plus intéressant à dire si ce n’est que Nantes est ville avec le plus de BAL (327) :
histogramme barre nombre de BAL par ville Ceci s’explique par le fait que les villes plus grandes sont divisées en arrondissements.

Sur le site de La Poste il existe également une carte (utilisant OSM ;-) ) :
capture ecran carte avec point des BAL

Ces données sont également accessible via une API toujours sur leur site datanova.

Comparaison des données

Passons aux choses sérieuses comparons ces données pour voir si elles concordent bien. Et éventuellement voir comment pourrions nous en profiter dans OSM.

Comparaison des coordonnées GPS

Via un petit script python j’ai pu récupéré toutes les points BAL d’OSM. Pour chaque point via ses coordonnées je suis allé rechercher la BAL la plus proche dans les données fournies par La Poste.

27848 (89.6%) des BAL d’OSM ont une BAL du fichier La Poste à moins de 500 mètres de distance. J’ai fixé arbitrairement la limite à 500 mètres qui me parait beaucoup mais on trouve des BAL avec la même référence à 496m pourtant enregistré comme “positionnement fin”.

Voici la répartition des distances entres les BAL OSM et BAL La Poste : Histogramme répartition des distances entre BAL par classe de 10 m Une grande partie, 9859 (35%) sont à moins de 10 mètre de distance. Cependant il y a 1609 (5.8%) BAL qui sont à plus de 200 mètres de distance.

Si on regarde plus précisément dans les BAL de 0 à 10 mètres : Hitogramme répartition des distance entre BAL par classe de 1m jusqu'à 10 Il y a 460 BAL qui sont à moins de 1 mètre de distance. Et c’est entre 5 et 6 mètres de distance où il y a le plus de BAL 1220.

Autre élément intéressant, pour chaque BAL trouvé j’ai comparé si la référence de la BAL d’OSM correspondait à celle de La Poste : Hitogramme répartition distance pas de 10 mètres avec proportion des références correstes La proportion de références correctes décroit avec la distance 75% de 0 à 10 mètres et graduellement on arrive à 14% pour > 200 mètres.

Comparaison des références

Cette fois à partir des points BAL d’OSM avec une référence, je suis allé cherché cette référence dans les données de La Poste pour voir si ça correspondait.

19477 BAL d’OSM ont une référence correspondante avec les données de La Poste soit 63% des points.

Pour les distances entre les deux points de même référence on va de 0m à 787km. Il y a donc certainement des erreurs de référence dans OSM. A noter que les références sont des chaines alphanumérique de 6 caractères, le zéro et le O peuvent facilement se confondre.

Il y en a 962 (3.1%) qui sont à moins de 2m de distances.

Graphique : Histogramme répartition du nombre de points par classe de distance

Difficile de savoir à partir de quelle distance il s’agit d’une erreur de saisie, mais il y a environ 150 points qui sont à plus d’1,5km de distance.

Quelle source de données est la plus fiable?

Les résultats m’ont quelques peut surpris, des distances de plus de 200 mètres alors que la référence correspond et que c’est indiqué “positionnement fi”. Je suis donc allé voir sur le terrain autour de chez moi, et je n’ai pas vu d’erreur sur OSM alors que les positionnements de La Poste sont vraiment aléatoires.

Globalement on peut dire que :

  • Exhaustivité des BAL : La Poste
  • Exactitude des références : La Poste
  • Précision du placement : OSM
  • Horaires de la relève : OSM

Conclusion

  • Il reste encore beaucoup de BAL à positionner sur OSM, environ 77%.
  • Nous ne pouvons pas utiliser les données fournis par La Poste directement dans OSM car elles ne sont pas précises.
  • Le “positionnement fin” des données La Poste n’est pas très fin, car il peut y avoir plusieurs dizaines de mètres entre leur positionnement et la réalité.
  • Il y a quelques erreurs de référence de BAL dans OSM.

Si vous connaissez quelqu’un qui gère les données à La Poste n’hésitez pas à leur faire passer le message. Un positionnement plus précis serait top pour placer les BAL automatiquement sur OSM, surtout qu’il y a un employé de la poste qui passe généralement 6 jours sur 7 pour relever le courrier.
Quand vous passez devant une BAL n’hésitez pas à regarder si elle est sur OSM : logo BAL OSM

et à la rajouter ainsi que les horaires de relevé du courrier.

Merci pour votre lecture. Ceci est mon premier article donc n’hésitez pas à me faire des remarques, même si c’est pour mes dire que c’est nul ou inutile.

Bon mappage!