OpenStreetMap logo OpenStreetMap

Boites aux lettres La Poste

Posted by polo0000 on 7 December 2020 in French (Français).

photo boite aux lettres jaune La Poste

Analyse du référencement des boites aux lettres de La Poste en France

De moins en moins utilisé de nos jours le courrier est encore parfois indispensable. Connaitre les emplacements des boites aux lettres jaune de La Poste peut être bien pratique. Dans cet article nous allons analyser l’état d’avancement du référencement des boites aux lettres (que nous nommerons désormais BAL) dans OSM et que nous comparerons aux données mises à disposition par La Poste.

Données OSM

Une BAL est identifiée par l’attribut amenity=post_box auquel on peut y ajouter les horaires de relevé (collection_times : ), l’exploitant (operator : ) en France il ne doit y avoir que La Poste à ma connaissance. Et la référence de la BAL (ref : ) car on le verra plus bas, toutes ces gentilles BAL ont un petit nom unique.

Les chiffres

Nombre total : 30 991 (31 066 avec les DOM) Dont 20 094 (64.8%) avec une référence
Et dont 6 692 (21.6%) avec les heures de relevé.
Répartition :
carte de la France avec des points rouges qui représente les BAL présentes dans OSM

source : https://taginfo.openstreetmap.fr

Données La Poste

Jeu de données disponible sur le site datanova de La Poste ou sur le site data.gouv.fr.

La description de ce jeu de données est téléchargeable ici.

Les chiffres

Nombre total : 135 655
Nombre de BAL avec un “positionnement fin” : 93 539 (69%)

Les coordonnées (X,Y) peuvent être obtenues par repositionnement manuel : l’agent repositionne la BAL directement sur la carte et le jeu de données indique alors « positionnement fin » comme type de géocodage.

Pas grand chose de plus intéressant à dire si ce n’est que Nantes est ville avec le plus de BAL (327) :
histogramme barre nombre de BAL par ville Ceci s’explique par le fait que les villes plus grandes sont divisées en arrondissements.

Sur le site de La Poste il existe également une carte (utilisant OSM ;-) ) :
capture ecran carte avec point des BAL

Ces données sont également accessible via une API toujours sur leur site datanova.

Comparaison des données

Passons aux choses sérieuses comparons ces données pour voir si elles concordent bien. Et éventuellement voir comment pourrions nous en profiter dans OSM.

Comparaison des coordonnées GPS

Via un petit script python j’ai pu récupéré toutes les points BAL d’OSM. Pour chaque point via ses coordonnées je suis allé rechercher la BAL la plus proche dans les données fournies par La Poste.

27848 (89.6%) des BAL d’OSM ont une BAL du fichier La Poste à moins de 500 mètres de distance. J’ai fixé arbitrairement la limite à 500 mètres qui me parait beaucoup mais on trouve des BAL avec la même référence à 496m pourtant enregistré comme “positionnement fin”.

Voici la répartition des distances entres les BAL OSM et BAL La Poste : Histogramme répartition des distances entre BAL par classe de 10 m Une grande partie, 9859 (35%) sont à moins de 10 mètre de distance. Cependant il y a 1609 (5.8%) BAL qui sont à plus de 200 mètres de distance.

Si on regarde plus précisément dans les BAL de 0 à 10 mètres : Hitogramme répartition des distance entre BAL par classe de 1m jusqu'à 10 Il y a 460 BAL qui sont à moins de 1 mètre de distance. Et c’est entre 5 et 6 mètres de distance où il y a le plus de BAL 1220.

Autre élément intéressant, pour chaque BAL trouvé j’ai comparé si la référence de la BAL d’OSM correspondait à celle de La Poste : Hitogramme répartition distance pas de 10 mètres avec proportion des références correstes La proportion de références correctes décroit avec la distance 75% de 0 à 10 mètres et graduellement on arrive à 14% pour > 200 mètres.

Comparaison des références

Cette fois à partir des points BAL d’OSM avec une référence, je suis allé cherché cette référence dans les données de La Poste pour voir si ça correspondait.

19477 BAL d’OSM ont une référence correspondante avec les données de La Poste soit 63% des points.

Pour les distances entre les deux points de même référence on va de 0m à 787km. Il y a donc certainement des erreurs de référence dans OSM. A noter que les références sont des chaines alphanumérique de 6 caractères, le zéro et le O peuvent facilement se confondre.

Il y en a 962 (3.1%) qui sont à moins de 2m de distances.

Graphique : Histogramme répartition du nombre de points par classe de distance

Difficile de savoir à partir de quelle distance il s’agit d’une erreur de saisie, mais il y a environ 150 points qui sont à plus d’1,5km de distance.

Quelle source de données est la plus fiable?

Les résultats m’ont quelques peut surpris, des distances de plus de 200 mètres alors que la référence correspond et que c’est indiqué “positionnement fi”. Je suis donc allé voir sur le terrain autour de chez moi, et je n’ai pas vu d’erreur sur OSM alors que les positionnements de La Poste sont vraiment aléatoires.

Globalement on peut dire que :

  • Exhaustivité des BAL : La Poste
  • Exactitude des références : La Poste
  • Précision du placement : OSM
  • Horaires de la relève : OSM

Conclusion

  • Il reste encore beaucoup de BAL à positionner sur OSM, environ 77%.
  • Nous ne pouvons pas utiliser les données fournis par La Poste directement dans OSM car elles ne sont pas précises.
  • Le “positionnement fin” des données La Poste n’est pas très fin, car il peut y avoir plusieurs dizaines de mètres entre leur positionnement et la réalité.
  • Il y a quelques erreurs de référence de BAL dans OSM.

Si vous connaissez quelqu’un qui gère les données à La Poste n’hésitez pas à leur faire passer le message. Un positionnement plus précis serait top pour placer les BAL automatiquement sur OSM, surtout qu’il y a un employé de la poste qui passe généralement 6 jours sur 7 pour relever le courrier.
Quand vous passez devant une BAL n’hésitez pas à regarder si elle est sur OSM : logo BAL OSM

et à la rajouter ainsi que les horaires de relevé du courrier.

Merci pour votre lecture. Ceci est mon premier article donc n’hésitez pas à me faire des remarques, même si c’est pour mes dire que c’est nul ou inutile.

Bon mappage!

Discussion

Comment from Cdrik_69 on 23 December 2020 at 14:41

Je vois que tu te spécialises dans les analyses de données, top !

Pourrais-tu aussi partager tes scripts python ? Cela me donne des idées :)

Merci !

Comment from polo0000 on 23 December 2020 at 19:40

J’adore triturer des données!^^ Oui j’y ai pensé à partager mes scripts mais je ne suis pas vraiment un bon codeur et c’est souvent des bouts de codes fait à la vas vite mais effectivement ça peut servir. Je partagerai un github dans ces prochains jour avec tous les scripts.

Comment from Lisapple on 13 July 2023 at 02:33

Analyse très intéressante (pour les amateurs de données et/ou de boites aux lettres), cela dit, et La Poste semble vouloir continuer d’ignorer le problème (j’ai déjà pu les contacter par message via Datanova, ils étaient déjà surpris de telles erreurs) que environ 2% des 120k boites aux lettres actuellement dans l’Open Data de La Poste ont une erreur de plus de 5 km avec les coordonnées de l’adresse selon la Base d’Adresses Locales.

J’ai créé une page listant les plus grandes erreurs : https://opendatamap.fr/post-boxes/france/invalids

Malheureusement, aucune des positions des ces environ 2000 boites aux lettres fautives n’a été corrigé (depuis environ un an). Je trouve le problème principalement gênant concernant les erreurs affichées par osmose pour les boites aux lettres manquantes, alors que la boîte peut se situer à des centaines de kilomètres de distance.

Log in to leave a comment