OpenStreetMap

Opening_hours Statistik-porn

Posted by MKnight on 7 February 2016 in German (Deutsch)

Ok, eher Softporno, hab diesmal nicht alles durchgezählt, sonst hätt ich 3 Tage statt einen gebraucht.

In den letzten 4 Wochen wurden deutschlandweit 12.500 Objekte erstellt oder geändert die (zum heutigen Stand) Öffnungszeiten beinhalten. Das ist recht dehnbar, aufgrund solch diffuser Daten ne Statistik zu bauen (wenn wer ne vernünftige Overpass-abfrage parat hat, wo opening_hours hinzukamen, nur her damit), ich versuchs trotzdem:

Da ich etwa einmal monatlich opening_hours korrigiere, kann ich grob übern Daumen abschätzen, dass bei den ("neuen") Objekten etwa 50-80% dabei sind, wo die Öffnungszeiten wirklich neu sind. Bei sage und schreibe 460 Warnungen und Fehlern hab ich ein wenig das Gefühl, dass die Sensibilität endlich etwas steigt und das Abkippen von Phantasie- und "aus-dem-Bauch"-Murx stark abgenommen hat. (Ok, 460 neue Fehler in 4 Wochen ist kein Pappenstiel, das sind etwa 2-5% Abfall aber naja...)

Was wollte ich?

Achja, grobe Fehlerverteilung frei aus dem Kopf und völlig unwissenschaftlich unstatistisch:

  • 40% falsche Wochentage
  • 10% falsch gesetzte Komma oder Semikoli
  • 20% fehlende Komma oder Semikoli
  • 2% Verwendung von Komma statt Semikolon (in aller Regel korrekt und sinnvoll renderbar aber schematisch falsch)
  • 10% Verwendung komischer Zeichen wie langen oder anderen exotischen Bindestrichen etc.
  • 5% Verwendung von Klartext a la: "Küchenzeiten" oder "Auf Anfrage" etc.
  • 2% vertan im Tag a la website (opening_hours=www.example.org) oder Strasse etc.
  • diverse andere

Nach Korrektur aller Werte bleiben etwa 2-5% übrig, die inhaltlich und schematisch korrekt sind, aber nicht "schön". also 9:00 statt 09:00.

Comment from MKnight on 30 June 2016 at 14:17

mal bisschen weiche Zahlen für Juni:

Deutschlandweit gibt es 1506 Objekte die angefasst oder erstellt wurden, die opening_hours enthielten oder wo diese hinzugefügt wurden. Stichprobe meint, dass hauptsächlich hinzugefügt wurde.

Davon sind (bzw. waren) 170 Warnungen und 20 Fehler.

(in der Anzahl der Warnungen sind Doppelungen enthalten, wenn mehrere Fehler pro Poi sind. Stichprobe meint, dass die (doppelten) Warnungen sich um etwa 50% verringern).

Korrigiert habe ich 65 Fehler und Warnungen.

Die Bundesländer halten sich im Vergleich richtig/falsch in etwa die Waage.

Login to leave a comment