OpenStreetMap logo OpenStreetMap

Higashimado's Diary

Recent diary entries

本文是2025 年中国大陆乡镇 OSM 要素完备度分析报告(一)的续篇,展示了中国大陆内 31 个省、区、市内的乡镇 OSM 要素完备度分布情况。关于本文所述的 OSM 要素完备度及其统计规则,前篇已有介绍,本篇就不再赘述。本文吸纳前篇发表后的诸多建议所作修改,也展示在了前篇的对应部分中。所以,在阅读本篇的结果之前,请先对前篇中的说明有所了解

本篇的结果分为六个部分。前五部分是各个省级行政单位的平均结果,按其平均完备度的排名顺序排列,先期结果中已有的北京、广东、江苏等省份不再重复介绍。最后一部分介绍全国的整体情况。


说明:

  • 本文所述的“完备度”分数是在特定规则下得到的定量指标,不应该作为该区域绘图质量的认可或否定,也不应当作为唯一的绘图目标

  • 本文统计时使用的统计脚本统计数据已开源于 GitHub,感兴趣的读者可以自行取用,并以 GPL-3.0 协议进行二次开发

  • 本文统计时使用的乡镇名单数据来源于中国统计局,时效是 2023 年。在此之后的 2025 年,中国大陆重启了乡镇级的行政区划调整工作,这几年可能会有频繁的行政区划变更。遗憾的是,由于统计局从 2024 年 10 月之后不再公开行政用的统计代码,这份名单可能会就此冻结。希望各位 Mapper 在标注近几年的行政区划调整注意保留节点中的 old_name 标签

  • 本文绘图时使用的行政边界来自于中国国家地理信息平台,与 OSM 的绘图标准会有所差异,仅作参考;平台数据的时效推测是在 2019 年前;在展示县级行政单位的平均完备度时,拆分后新设立的行政区(如杭州市钱塘区)的数据会被映射到拆分前的行政区上,而县区级黑区则因缺少相应的行政边界而无法展示


第一部分:上海/北京/天津/广东/江苏/浙江/内蒙古

第一部分中,排名前三的均为直辖市,其乡级行政单位的数量仅为 200–350,只略多于普通的省会城市(通常在 150–200 之间),平均完备度在省级行政单位中排名较高也是可以预期的;随后的则是先期结果中评价过的,OSM Mapper 较为活跃的广东江苏浙江,平均完备度在 52–57 之间,与其他省级行政单位有明显的差距。

内蒙古自治区排名第 7,平均完备度为 49.33,位居分数密集段的头部。内蒙古中部临近陕西、山西一带,以及东北部的呼伦贝尔市一带的乡镇都有不错的完备度。同时,其乡级行政单位的数量较少,仅 1022 个,使草原、戈壁上相对空白的地区没有太过拉低平均水平。

上海市(1)

See full entry

在中国大陆,OSM 要素的缺失是众所周知的事实。然而,具体的缺失程度如何?哪些要素相对完善、哪些要素更加稀少?“一片空白”的区域又主要分布在哪里?当前,社区对此的认识大多是定性的,少有具体的数据支撑。自己动手,丰衣足食。为此,本文旨在尝试构建一种定量化的评价指标,用于界定某个地区的“空白”程度,比较不同类型要素的缺失程度,此即该地区 OSM 要素的完备性

然而,何为“完备”实际上是非常主观的判断,对于相同的地理区域,不同需求的数据使用者可能会有不同的判断。例如,一个城市的路网和公共交通被绘制得十分详尽,或是植被和用地类型被划分得尤其清晰,就足够“完备”了么?对 POI 有兴趣的数据使用者可能不会这么觉得。然而,调查的进行仍是需要一个标准,哪怕是比较粗略的标准。

思考过后,本文决定将“完备”的定义对象设定在中国大陆具有一定工商业活动和人口聚集规模的最小行政单位——乡、镇和街道等——所应当存在的设施,如道路、学校、医院、建筑等,设定由行政节点和边界道路交通公共和商业设施建筑和土地利用四个维度构成的 OSM 基础要素“完备度”评价指标。这些基础要素既与当地居民的日常生活息息相关,亦与不同绘图者的兴趣有所重合,希望能给各位社区同好寻找补充目标提供小小帮助。

此项工作由个人一时兴起完成,思虑不周之处,还请各位海涵。本文展示的是此项工作的先期结果,涵盖中国大陆 31 个省、市、自治区中的 9 个。后续工作倘若顺利预计会在农历新年前后完成。待全部工作完成以后,本文使用的脚本、示例及数据将会以 GPL-3.0 协议共享于 GitHub,有相关兴趣的读者可以自行取用。报告本身欢迎以 CC BY 4.0 协议转载 。如有不当之处,敬请通过评论和私信指出,我会尽量及时更正。


2026/01/25 更新:

  • 本文的续篇2025 年中国大陆乡镇 OSM 要素完备度分析报告(二)已经发布,本篇中展示的结果已和全国结果同步更新

  • 根据评论区和其他群组中的讨论,更新后的结果采纳了部分意见,主要修订了判定行政节点相关的结果,具体参见本篇的章节 2.1

  • 本文统计时使用的脚本统计脚本统计数据已开源于 GitHub,感兴趣的读者可以自行取用,并以 GPL-3.0 协议进行二次开发


1 统计对象

1.1 乡镇中心

本文的统计对象限于中国大陆各乡级行政区划行政中心周边区域,而非整个乡级行政区划的下辖范围,其原因是:

  1. 乡级行政中心通常集中了整个区划范围内最多的人口和基础设施,应当作为 OSM 要素和公众兴趣点最多的区域
  2. 比较未被普遍标注的乡级行政边界,乡级行政中心的位置容易界定,周边区域范围较小,统计难度较低

具体地,考虑中国大陆普通乡镇的规模,本文将周边区域限定在行政中心所在节点1 km3 km 之内,前者用于搜寻人口密集区所需要的建筑、居民道路、医院、学校和商店等设施,后者则用于搜寻可能离行政中心更远的政府机关、大型道路和各种用地类型等。对于行政中心所在坐标,根据 中国大陆地区行政区划标注指北 的建议,其在 OSM 应以 place=suburbplace=town 标注,因此本文的想法是通过 overpass 接口进行匹配。然而,由于存在 place 节点未被标记,或 name 标签中名称不清晰的情况,完全依赖 OSM 获取乡镇列表及其坐标显然是不合适的。为此,本文将 GitHub 上存档的 2024 年中国全国 5 级行政区划 列表作为参考,使用 overpass 接口尝试匹配 OSM 数据库中相应的节点并从中获取行政中心的位置信息。对于未能匹配到相应节点的乡镇,则由其他地理信息平台(如高德 API)补充其行政中心的位置信息。

在中国大陆,乡级行政区划涵盖街道民族乡苏木民族苏木县辖区共 8 种类型,但在这 8 种“由民政部门确认的单位”之外,中国大陆还存在数量可观的“类似乡级行政单位”,如开发区、产业园、农场、林场、牧场、兵团等,即俗称的“黑区”。考虑到此类“黑区”的种类较为多样,并不一定满足人类定居点的定义,本文并不将其通常意义上的“乡镇”,在统计时会将其大部排除在外。具体的排除方法则以行政代码为准,即剔除掉列表中乡级行政代码为 400–999 的条目。唯一的例外是占据相当比例,且正在实行“团镇合一”体制的新疆生产建设兵团,其因符合人类定居点的定义而被纳入统计范围中。

See full entry