Format der Hausnummern mit Zusatz (z.B. Musterstraße 1b)
Posted by is-zUser on 15 December 2014 in German (Deutsch).Bei der Betrachtung der Link-Quellen aus einem meiner Blog-Kommentare ist mir aufgefallen, dass das Hausnummernformat bei Zusätzen (Buchstaben a, b, c, …) durch DIN 5008 seit 2011 folgendermaßen festgelegt ist: Leerstelle zwischen Zahl und Buchstabe.
Inzwischen hatte ich viele Adress-Angaben in OSM (addr:housenumber=) in alter und auch einige in neuer Schreibweise gefunden. Allerdings hat die Suche (Nominatim) damit ein Problem, man findet nur die Adresse, wenn man sie im Suchfeld so eingibt, wie sie am Hausnummern-Tag steht.
Nach Beratung mit einem erfahrenen Mapper hab ich mich entschlossen, die fehlertolerante Hausnummern-Suche vorzuschlagen und als Ticket zur Verbesserung einzureichen. Ich denke aber, dass es bis zur Antwort / Umsetzung noch eine Weile dauern wird.
Ihr könnt gerne eure Erfahrungen / Meinungen hier posten.
Discussion
Comment from flohoff on 15 December 2014 at 15:01
Alles andere ist auch Wunschdenken. Egal was in der DIN steht viele Menschen sind dran gewöhnt kein Lehrzeichen dazwischen zu machen. Und das vermutlich auch noch ein paar Jahrzehnte bis Jahrhunderte so bleiben. D.h. es wird beliebige Schreibweisen geben und damit muss die suche klarkommen.
Ich vermute das Nominatim da so seine schwierigkeiten haben wird. Für “Fuzzy” matches ist das dingen einfach nicht gebaut. Das funtioniert da ja schon nicht bei “-“ vs “ “ in den Straßennamen oder “ö” vs. “oe” - alles schwierig.
Flo
Comment from Sanderd17 on 15 December 2014 at 15:47
I see BIN (Belgian instead of Deutsch) has the same recommendations.
But BIN also requires small letters (b instead of B).
This is one of the most stupid recommendation I’ve ever seen. It makes it hard to parse in software, and isn’t needed at all to be readable. In contrary, capital letters are a lot easier to read, and spaces after numbers don’t matter a lot.
It becomes extremely irritating when bus numbers are added. Like “Bornstraat 48 a bus 5” vs “Bornstraat 48 bus 5”. That “a” just looks like a lost letter.
In this case, I just hope people will never start using the BIN/DIN norms.
Comment from is-zUser on 15 December 2014 at 22:50
Besten Dank!
In Deutschland wird der Großbuchstabe zumindest bevorzugt. Manche schreiben, es wäre festgelegt, aber andere sagen, das ist nicht so. Nominatim unterscheidet aber (zum Glück) keine Groß-Kleinschreibung.
Ich gehe stark davon aus, dass es um die maschinelle Lesbarkeit bei dieser DIN 5008 ging (besonderes Interesse: POST!)! Das ist allerdings für OSM nicht relevant. Nur muss man mit dem Einfluss dieser Normen rechnen. Auch, wenn man im Wiki ein festes Format vorgeben würde. Es bleibt immer noch die Möglichkeit des “falschen” Such-Strings.
Ich würde die extrahierte Hausnummer aus dem Such-String bei zusätzlichen Buchstaben mit einer 2. Suche verbinden, in der die Buchstaben durch “Leerstelle”+”Buchstabe” ersetzt wird. Alternativ wäre es auch kein Problem, nur nach der Nummer zu suchen. Im Ergebnis steht dann eben die Liste aller Nummern (z.B. 1, 1a, 1 B, 1c, …).
Was wir allerdings nicht wissen: Wie kompliziert die Abfrage schon ausgebaut ist! Wer sich mal zu diesem Thema umhört, ist schockiert, welche verrückten Hausnummern-Systeme es weltweit gibt.
Gruß is-zUser
Best Thanks!
In Germany, the capital letter is at least preferred. Some write, it would be fixed, but others say this is not so. But Nominatim makes no distinction between upper and lower case (thankfully).
I’m strongly believe, in DIN 5008, this is for the machine readability (special interest: POST!)! However, this is not relevant to OSM. Only you have to expect the effect of these standards. Also, if you would provide a fixed format in the wiki. That still leaves the possibility of “false” search strings.
I would link the extracted housenumber of the search string with additional letters with a 2nd search in which the letter is replaced by “space” + “letter”. Alternatively, it would’t be a problem, just look for the number only. This will result in just a list of all housenumbers (eg 1, 1a, 1b, 1c, …).
What we don’t know: How complicated is the query already expanded! Who asks around on this issue, they are shocked, which crazy house numbers systems are available worldwide.
Greetings is-zUser
Comment from Ogmios on 17 December 2014 at 11:31
Für das erfassen in OSM halte ich die Norm für irrelevant – sie regelt nur die Schreibweise im Schriftverkehr. Für das Anbringen von Hausnummern an Gebäuden ist sie m.E. nicht relevant und ebenso wenig für OSM. Die meisten Gemeinden regeln die Schreibweise von HNR in eigenen Verordnungen. Für ein paar Gemeinden im Harz habe ich diese Verordnungen abgefragt und die Information im Wiki mit einer Vorlage dokumentiert. Mit dieser lässt sich leicht angeben wie die Nummerierung geregelt ist (Beispiel: Sankt Andreasberg.
Soweit möglich, erfasse ich die HNR wie in der Verordnung angegeben. Wenn ich diese nicht kenne, Mappe ich grundsätzlich ohne Leerzeichen und übernehme den Buchstaben so wie am Gebäude angegeben.
Wenn es die Verordnung so vorgibt, sollte das Leerzeichen m.E. übernommen werden. Für die Suche kann das Problem leicht umgangen werden. Der Datensatz auf den die Suchengine zugreift wird eh vorverarbeitet. In diesem Vorgang könnte man die Leerzeichen der HNR-Tags einfach rauswerfen.
Comment from butrus_butrus on 23 December 2014 at 19:22
Schlimm, schlimm, schlimm, dass DIN gegen die typographischen Gewohnheiten verstößt.
Comment from is-zUser on 1 July 2015 at 09:57
Einheitliche Schreibweise anstreben?
Richtig, DIN 5008 regelt den Schriftverkehr, während für die Anbringung der Hausnummer am Gebäude örtliche Verordnungen der lokalen Verwaltungen gelten.
Die Übernahme lokaler Vorschriften in ein Gesamtprojekt wie OSM halte ich nicht für nutzbringend. Wie unterschiedlich Verwaltungsvorschriften sein können, zeigt folgende Seite:
http://www.zuhause.de/vorschriften-zu-hausnummern-regelungswut-und-behoerden-irrsinn/id_52169734/index
Sollten einzelne Mitarbeiter eines Amtes vorschreiben, wie in OSM die Hausnummern formatiert werden?
LÖSUNG
Das Ticket #5256 wird inzwischen bearbeitet.
Trotzdem entsteht die Frage, ob eine einheitliche Formatierung (wie z.B. bei Angaben zu Öffnungszeiten) hier nicht nutzbringend wäre. Fehlerhafte Eingaben werden damit natürlich nicht ausgeschlossen. Allerdings könnten die entsprechenden Regeln im Wiki bei Adressen aufgeführt werden, womit ein Großteil der unterschiedlichen Schreibweisen vermieden würde.
Ich würde persönlich die “alte” Schreibweise ohne Leerstelle und mit Kleinbuchstaben vorschlagen, da wohl der größte Datenbestand bereits so formatiert ist.
Suggest uniform spelling?
That’s right, DIN 5008 regulates the correspondence, while local regulations of local governments apply for attaching the house number on the building.
The acquisition of local regulations in an overall project like OSM I do not consider profitable. How different can be administrative provisions, shows the following page:
http://www.zuhause.de/vorschriften-zu-hausnummern-regelungswut-und-behoerden-irrsinn/id_52169734/index
Should any employee of the administrative Office dictate how the house numbers are formatted in OSM?
SOLUTION
The Ticket #5256 is now under way.
Nevertheless, the question of whether a uniform format (as with information on opening times) is suggest here is usefully. Incorrect entries are therefore naturally not excluded. However, maybe in the rules in the wiki at address this insert, thus much of the different notation would be avoided.
Personally, I would suggest the “old” format with no space and with lower case letters, because the largest dataset is already formatted so.