Большинству “картографов” ОСМ совершенно чуждо понятие ответственности в плане поддержания чистоты, полноты, корректности и актуальности данных. У некоторых оно есть, но сильно в однобокой и не всегда адекватной форме. Когда вторые - это новички, а первые - “опытные” маперы, то ничего не происходит, потому что первым влом. Когда “опытные” маперы - это вторые, а первые новички, то начинаются массовые правки пустого в порожнее.
Когда чувство обострённой картографической справедливости обостряется не у картографов, а у программистов, а полноты восприятия всей системы, как единого набора данных нет - рождаются сферические валидаторы в вакууме. Основная причина отсутствия полноты восприятия - закостенелость мышления и видение только одной, сугубо прикладной стороны применения всех данных. Чаще всего это звучит так: “в моём конвертере под мой конкретный навигатор это работает только так, значит так должно быть везде”.
По настоящему полноценно и в комплексе увидеть всю картину геоданных в проекте способны не многие, отсюда и основная проблема ОСМ в плане привнесения новых данных - каждый несёт что-то полезное и бросает в общую кучу, не имея совершенно никаких представлений о классификации тех объектов, которые вносит. Даже среди наиболее активных участников иногда проскакивают отдельные элементы тотальной безграмотности в плане базовых основ картографии, геодезии, планометри, особенно в части типизации, классификации и генерализации данных.
Мой личный эксперимент показал, что группа из 5-8 школьников старших классов, после 20-ти минутной устной лекции об основах классификации и генерализации геопространственных данных и 10-ти минутным знакомством с GIS инструментом, способна за один факультативный час (одна пара уроков по 45 минут) обрисовать больше чем десяток опытных участников проекта ОСМ за тот же период времени, совершив при этом на порядок меньше логических, структурных и взаимосвязанных ошибок.
Почему же тот же гугл очень не охотно идёт на контакт в плане обмена технологиями и методами работы в своих пользовательских картопроектах с участниками других проектов, а предпочитает организовывать регулярные семинары для полных нубов, разжёвывая каждый раз с нуля то, что казалось бы не нужно было бы объяснять тем, кто уже был знаком с основами “пользовательской картографии”? Всё просто - обучить правильно группу школьников проще и результат в итоге будет качественней, чем передалбливать сомны догматических заблуждений закоренелым маперам, которые уже завесили свой мозг непробиваемыми шорами и подписали свои все свои догмы как “аксиома №1, №2” и т.д., даже не предпринимая более попыток анализировать картину абстрагируясь от устоев.
Сразу замечу, что при более правильном и экономичном подходе в организации работ, у того же гугла в районе пользовательской картографии есть свои, специфичные ему родовые травмы, которые тоже не делают из него конфетку, но речь не об этом.
Можно ли сейчас использовать проект ОСМ как полноценный и достоверный источник геопространственных и справочных данных? Напрямую - нет. Ни как достоверный, ни как полноценный. По крайней мере актуально нельзя получить. Требуется процесс несколькоуровневой ревалидации данных на реальных, а не синтетических тестах, построенных по реальному шаблону применения данных. Это и полнота и взаимосвязанность данных и роутинговые тесты и логические структурные тесты. Чем больше тестов - тем больше времени, зачастую ручного времени, тем меньше актуальность данных. По статистике и общей практике 80% времени тратится на приведение косяков в норму, откат вандализма, структурирование данных, 15% на обработку отвалидированных данных с целью получения конечного результата и только 5% на добавление новой информации в проект.
Если нужны самые актуальные данные, то ни о какой достоверности уже речи не может идти. Сам по себе этот компромисс в проекте ОСМ смещён строго в сторону актуальности. Т.е. беря данные напрямую из проекта, вы всегда берёте самые актуальные данные с всем самым актуальным вандализмом, без какой либо претензии на адекватность данных.
Если ваш проект чуть крупнее чем маленькая самосборка на коленке, то для вас такая актуальность уже не так важна как качество выходных данных, а значит вы уже по определению будете тратить время на постобработку и ревалидацию данных, почти независимо от сроков выполнения этой процедуры. Такая модель (модель ступенчатых фриз-релизов после серии QC тестов) знакома разработчикам ПО и стандартна в рамках работы любого крупного издателя конечного продукта. Модель же роллингового развития продукта характерна для большинства децентрализованных, не-production-ориентированных проектов.
Что делать, если всё таки есть желание использовать ОСМ как источник данных? Вводить двухуровневую систему. Брать данные из ОСМ, определять для себя и своих потребностей два вида критериев достоверности данных:
1) структурные ошибки, которые могут быть исправлены только в самой базе ОСМ;
2) нормализация и генерализация даннных, не требующая внесения изменения даннных в самом проекте ОСМ, а выполняемая на копии локальных данных.
После проведения этих двух этапов необходимо определить перечень и объём QC тестов и планомерно достигать полного их прохождения, путём внесения изменений в сам проект ОСМ и копии изменений в локальные данные, а так же возможно и внесение изменений в методы нормализации и генерализации. Если же объём изменений самих данных велик, то возможно придётся спустя некоторое время заново взять полный объём данных из ОСМ и заново запустить процесс итераций по нормализации локальной копии данных.
Почему это нельзя сделать в проекте целиком? Потому что ОСМ - это всего лишь набор данных, без привязки к конкретному конечному использованию, а методы нормализации данных всегда жёстко завязаны на конечный выходной продукт, следовательно все постобработки возможны только персонально под каждый конкретный конечный продукт, т.е. говоря другими словами: ОСМ - всегда только полуфабрикат без этикетки, остальное - самостоятельно напильником, газовым ключём и изолентой.
Что нужно проекту сейчас от его активных участников?
-
Самое главное, давайте периодически постараемся быть школотой и забудем ненадолго о придуманных нами же догмах, а подумаем о предмете нашего труда абстрактно, в целом, с нуля. Что бы увидеть главное, иногда надо отойти в сторону и взглянуть издалека. Многие аксиомы в таком случае теряют свой определяющий фактор и начинают казаться искусственными.
-
Давайте не будем превращать базу ОСМ в “локальную копию данных” под свой конечный продукт, доводя до абсурда некоторые вещи и вводя в аксиомы искусственные ограничения отдельных продуктов и распространяя это на весь набор данных.