2025 年中国大陆乡镇 OSM 要素完备度分析报告(一):指标设计和先期结果
Posted by Higashimado on 26 December 2025 in Chinese (China) (中文(中国大陆)). Last updated on 29 December 2025.在中国大陆,OSM 要素的缺失是众所周知的事实。然而,具体的缺失程度如何?哪些要素相对完善、哪些要素更加稀少?“一片空白”的区域又主要分布在哪里?当前,社区对此的认识大多是定性的,少有具体的数据支撑。自己动手,丰衣足食。为此,本文旨在尝试构建一种定量化的评价指标,用于界定某个地区的“空白”程度,比较不同类型要素的缺失程度,此即该地区 OSM 要素的完备性。
然而,何为“完备”实际上是非常主观的判断,对于相同的地理区域,不同需求的数据使用者可能会有不同的判断。例如,一个城市的路网和公共交通被绘制得十分详尽,或是植被和用地类型被划分得尤其清晰,就足够“完备”了么?对 POI 有兴趣的数据使用者可能不会这么觉得。然而,调查的进行仍是需要一个标准,那怕是比较粗断的标准。
思考过后,本文决定将“完备”的定义对象设定在中国大陆具有一定工商业活动和人口聚集规模的最小行政单位——乡、镇和街道等——所应当存在的设施,如道路、学校、医院、建筑等,设定由行政节点和边界、道路交通、公共和商业设施、建筑和土地利用四个维度构成的 OSM 基础要素“完备度”评价指标。这些基础要素既与当地居民的日常生活息息相关,亦与不同绘图者的兴趣有所重合,希望能给各位社区同好寻找补充目标提供小小帮助。
此项工作由个人一时兴起完成,思虑不周之处,还请各位海涵。本文展示的是此项工作的先期结果,涵盖中国大陆 27 个省/市/自治区中的 9 个。后续工作倘若顺利预计会在农历新年前后完成。待全部工作完成以后,本文使用的脚本、示例及数据将会以 GPL-3.0 协议共享于 GitHub,有相关兴趣的读者可以自行取用。报告本身欢迎以 CC BY 4.0 协议转载 。如有不当之处,敬请通过评论和私信指出,我会尽量及时更正。
1 统计对象
1.1 乡镇中心
本文的统计对象限于中国大陆各乡级行政区划的行政中心周边区域,而非整个乡级行政区划的下辖范围,其原因是:
- 乡级行政中心通常集中了整个区划范围内最多的人口和基础设施,应当作为 OSM 要素和公众兴趣点最多的区域
- 比较未被普遍标注的乡级行政边界,乡级行政中心的位置容易界定,周边区域范围较小,统计难度较低
具体地,考虑中国大陆普通乡镇的规模,本文将周边区域限定在行政中心所在节点的 1 km 和 3 km 之内,前者用于搜寻人口密集区所需要的建筑、居民道路、医院、学校和商店等设施,后者则用于搜寻可能里行政中心更远的政府机关、大型道路和各种用地类型等。对于行政中心所在坐标,根据 中国大陆地区行政区划标注指北 的建议,其在 OSM 应以 place=suburb 或 place=town 标注,因此本文的想法是通过 overpass 接口对齐进行匹配。然而,由于存在 place 节点未被标记,或 name 标签中名字不清晰的情况,完全依赖 OSM 获取乡镇列表及其坐标显然是不合适的。为此,本文将 GitHub 上存档的 2024 年中国全国 5 级行政区划 列表作为参考,使用 overpass 接口尝试匹配 OSM 数据库中相应的节点并从中获取行政中心的位置信息。对于未能匹配到相应节点的乡镇,则由其他地理信息平台(如高德 API)补充其行政中心的位置信息。
在中国大陆,乡级行政区划涵盖街道、镇、乡、民族乡、苏木、民族苏木及县辖区共 8 种类型,但在这 8 种“由民政部门确认的单位”之外,中国大陆还存在数量可观的“类似乡级行政单位”,如开发区、产业园、农场、林场、牧场、兵团等,即俗称的“黑区”。考虑到乡镇级的此类“黑区”在 OSM 中被准确标注的情况寥寥,同时部分“黑区”还可能涉及敏感内容,本文会将其排除在统计范围之外。具体的排除方法则以行政代码为准,即剔除掉列表中乡级行政代码为 400–999 的条目,存在行政代码和下辖单位的县级及以上黑区则予以保留。
截止 2024 年 6 月,中国大陆地区共设有 38672 个乡级行政区划,相关数据的下载、校对周期漫长。因此,本文作为工作的第一部分,选取了北京、山西、吉林、江苏、浙江、湖北、广东、四川、甘肃共 9 个省份展开试验。这 9 个省份的乡级行政区划数量恰好也占到了全国的三分之一,相信对整个中国大陆地区有充分的代表意义。
1.2 基础要素
“基础要素”在本文中是指被纳入统计标准的,应当被标记的各类 OSM 要素,数据类型包含节点、路径和关系。考虑到是在乡镇水平上的统计,以及中国大陆各乡镇现实的标注情况,本文认为“基础要素”的选取既要考虑其内容的普遍性,同时标准还不能设立得太高 (全是零分的话就没有意义了)。因此,本文的设计思路是:对于中国大陆内陆地区的普通乡镇,里面有什么要素是普遍存在,且当地居民、外地访客、研究学者会共通关注的?基于这个标准,本文目前能想到的有如下内容:
- 行政节点和行政边界
- 普通道路、公交站(客运站)、加油站、停车场、各种小型道路
- 政府机关、医院、学校、派出所、邮局、银行、生活与消费设施
- 建筑、用地类型与自然类型、公园、旅游名胜等
相对地,一些本文认为在中国大陆地区并不普遍存在于乡镇水平,或是被关注程度较低的要素,则不被纳入统计范围内,如:
- 铁路、高速铁路、轨道交通、和高速公路等 (铁路迷和高速迷们应该有自己的完备度统计吧)
- 公共厕所、消防站、垃圾站等标注数量过少,且关注程度较低的公共服务设施
- 在“基础要素”以外的,单纯的 OSM 要素种类和要素数量 (本文不是“要素密度”分析报告)
- 在“最低要求”以上的,建筑和 POI 数量 (即便在本文所设的“最低要求”下,大部分的乡镇在此方面依旧只能得到零分)
- 中国大陆相关法律法规所规定的不适合在公开地图上标识的内容
所以,如果读者是想要了解上述几个方面的内容,那么这项工作可能对你来说意义不大。总得来说,这项工作所描述的“完备度”还是非常主观、与商业需求脱节,只适用于中国大陆乡镇地区的评价标准。
2 统计方法
2.1 指标设计
本文设定的完备度指标总分 100 分,分为行政节点和边界(20 分)、道路交通(30 分)、生活和消费设施(30分)以及建筑和土地利用(20 分)四个组成部分,每个部分内按各基础要素及其种类的存在与否或是数量线性积分。
2.1.1 行政节点和边界(20 分)
乡镇级别的行政节点和行政边界会在 OSM-Carto 上被直接渲染出来,其存在与否、名称有无被正确标记,则决定了使用者能否准确搜索到其目标区域。本文认为其具有足够的重要性,在节点和边界的存在上都分别设定了 8 分的占比。此外,下级地名(通常是各村庄和社区)的标注程度也能体现出该地区行政关系的完整程度,占比 4 分。
| 行政节点/存在 | 行政边界/存在 | 其他地名/个 | |
|---|---|---|---|
| 3 km | 8 | 8 | ×1 |
| 最高 | 8 | 8 | 4 |
说明:
- 行政节点指被匹配到名称且含有 place 标签的节点,对行政节点是否存在于行政关系内没有要求
- 行政边界指被匹配到名称且含有 boundary=administrative 标签的关系
- 其他地名指同时含有 name 和 place 标签的节点
- 表中的 “3 km”指以行政节点为中心的搜索范围大小,仅计算搜索范围内存在的要素,下同
关于节点/边界存在与否的判定条件
在存在与否的判定条件上,本文考虑了对 name,alt_name,official_name,old_name 和 short_name 五个常用标签进行匹配,匹配规则为上述标签的值包含用于匹配的名称即可。对于被判定不存在相应 place 节点的乡镇,作者在统计时大多进行了核查,并对官方名称唯一且和原列表中不一致的情况进行了更正。然而,对于下列存在对应节点,但在 overpass 中未被匹配到的情况,本文不会对其被判定为不存在的结果进行修正:
- 在政府文件和官办媒体的新闻报道中可见多个正式或通用名称,但在对应节点中仅标注了其中一个(此时有必要对各类 name 标签进行补充),这又可细分为四种情况:
- 通假:舟山市定海区干览镇/干𬒗镇,十堰市郧西县马鞍镇/马安镇,天门市候口街道/侯口街道,咸宁市嘉鱼县牌洲湾镇/簰洲湾镇,荆门市沙洋县官垱镇/官当镇,揭阳市揭东区玉窖镇/玉滘镇,天水市秦州区藉口镇/耤口镇,天水市秦州区华歧镇/华岐镇,临夏回族自治州东乡族自治县风山乡/凤山乡,等等
- 异体:汕头市金平区鮀江街道/𬶍江街道等
- 通名重复:大同市平城区开源街道/开源街街道等
- 通名混用:北京市朝阳区南磨房地区/南磨房乡,北京市朝阳区于家务回族乡/于家务乡,等等
- 对应节点中标注的名称含有错别字,该错误名称在民间或自媒体中偶尔可见,但从未出现在政府文件中 (此时应当对 name 标签进行更正),如温州市文成县黄坦镇/黄坛镇
- 部分乡/镇/街道被认为不具地名属性而不应存在对应节点,这种做法合乎道理,如吉林省延吉市小营镇,但其数量较少、情况特殊,本文暂未设计好对这种情况的排除算法,算是“误伤”
- 部分乡/镇/街道的节点与政府机关重合且未添加 place 标签,如杭州市拱墅区潮鸣街道,这种做法是否属于上一种情况、是否合适仍有争议,暂且保留
说明:上述并列的地名分别表示该地点在列表中的名称/在 OSM 中的名称
2.1.2 道路交通(30 分)
与连接各县市中心的高速公路和铁路不同,对于乡镇居民及目的地为乡镇的游客来说,最普遍、最重要的道路交通设施莫过于普通公路,以及相关的停车场、加油站等相关设施。因此,本文优先考虑县道及以上等级的公路在各乡镇的通达情况和乡镇中心居民道路的完备程度,此部分一共占比 20 分;另外判断公交站、停车场、加油站等公路出行设施的存在与否,其各占 2 分;最后兼顾小型道路和自行车道、人行道、小径等其他道路的种类丰富程度,此部分占比 4 分。
考虑到县道及以上等级的公路并不一定会抵达乡镇的中心区域,甚至不一定会连接到每个乡镇,上述设施的搜索范围主要设定为 3 km,且并未要求一定存在。另外,由于乡镇中心附近的居民道路对于当地居民有更重要的意义,同时也是为了鼓励将乡镇的 place 节点放在建成区中心的做法,1 km 以内的小型道路被赋予了额外的权重。
| 道路/条 | 公交站/个 | 停车场/个 | 加油站/个 | 小型及其他道路/类 | |
|---|---|---|---|---|---|
| 1 km | 小型 ×0.3 | ||||
| 3 km | 次级及以上 ×5 (最高 5.0) 三级 ×1 (最高 5.0) 小型 ×0.2 |
×2 | ×2 | ×2 | ×1 |
| 最高 | 20 | 2 | 2 | 2 | 4 |
说明:
- 次级及以上道路指含有 highway=trunk/primary/secondary 标签的路径
- 三级道路指含有 highway=tertiary 标签的路径
- 小型道路指含有 highway=residential/unclassified 标签的路径
- 公交站指含有 bus=*,highway=bus_stop 或 public_transport=* 标签的要素
- 停车场指含有 amenity=parking 标签的要素
- 加油站指含有 amenity=fuel 标签的要素
- 小型及其他道路仅指含有 highway=residential/unclassified/service/track/cycleway/pedestrian/footway/path/steps 标签的路径,标签中每种不同的值算作一类,另 highway=living_street 由于其在中国大陆的适用争议而被排除在外
- 由于 1 km 范围内的要素同时也处在 3 km 范围内,1 km 范围内每条小型道路的得分实际上是 0.3+0.2=0.5 分
2.1.3 公共和商业设施(30 分)
对于公共和商业设施,本文优先考虑对本地居民至关重要的政府机关、医院、学校和派出所,其分别用于满足行政、医疗、教育和治安方面的相关需求,是百人以上的永久定居点存在的基础,每个占比 5 分。即便是在如达里雅布依乡这样身处沙漠中央的乡镇,也能一个不落地找到上述四类设施。此外,银行和邮局作为金融邮电设施用于保证居民与外界信息流通,也有一定的重要性,其每个占比 2 分。在此之后,还要考虑商店、餐馆和旅店这样等外地游客也有相当需求的生活消费设施 POI,其每个占比 1 分。考虑到城镇的规模不一,本文设计的指标只要求除生活消费设施以外的设施至少存在,不做额外的数量要求。
在搜索范围的设置上,本文考虑了 OSM 对用于渲染地名的 place 节点的放置的通行习惯:其被推荐放置在建成区中心——或者至少不那么偏僻的地方,而非和政府驻地绑定。因此,除了政府机关的搜索范围被设定为 3 km 外,医院、学校、派出所等通常存在于建成区中心的设施的搜索范围都被设定为 1 km。
| 政府机关/个 | 医院/个 | 学校/个 | 派出所/个 | 邮局/个 | 银行/个 | 生活消费设施/个 | |
|---|---|---|---|---|---|---|---|
| 1 km | ×5 | ×5 | ×5 | ×2 | ×2 | ×1 | |
| 3 km | ×5 | ||||||
| 最高 | 5 | 5 | 5 | 5 | 2 | 2 | 6 |
说明:
- 政府机关指含有 amenity=townhall 或 office=government 标签的要素
- 医院指含有 amenity=hospital/clinic 标签的要素
- 学校指含有 amenity=school 标签的要素
- 派出所指含有 amenity=police 标签的要素
- 邮局指含有 amenity=post_office 标签的要素
- 银行指含有 amenity=bank 标签的要素
- 生活消费设施指含有 shop=*,cuisine=* 或 tourism=hotel/apartment 标签的要素,即商店、餐馆、酒店及公寓
2.1.4 建筑和土地利用(20 分)
从直观感受上看,建筑和土地利用的详细程度,实际上才是决定一个城镇的地图绘制是否“精细”的关键因素。然而,诚如之前提到的,对目前中国大陆的普通乡镇而言,不宜在此方面设置过高的标准。另外,建筑要素实际上比较容易提取,该方面其他的相关统计分析应当也不少,不问就不在此赋予过高的关注了。在本文的标准中,3 km 范围内的建筑或人造物每个占比 0.1 分,1 km 范围内再加权 0.1 分,换算下来 1 km 范围内存在 60 个 建筑或人造物即可满分,这个标准不高但也不容易达到;土地利用类型按数量算和建筑有一定关联(主要指画有建筑的住宅小区通常通常也会被同时标记为居住区),因此转而按种类计算,每类占 1 分;渲染上和土地利用类型相似的自然要素、公园或体育场,以及旅游设施等也按照土地利用类型计算。
| 建筑或人造物/个 | 土地利用/类 | |
|---|---|---|
| 1 km | ×0.1 | |
| 3 km | ×0.1 | ×1 |
| 最高 | 12 | 8 |
说明:
- 建筑指含有 building=* 标签的路径
- 人造物指含有 man_made=* 标签的要素
- 土地利用指含有 landuse=* 或 *natural=* 标签的路径,标签中每种不同的值算作一类;另外,考虑到有些不含有土地利用标签的要素也会被单独渲染,且在公众的认知中也常作为重要的土地利用或自然要素,本文将含有 leisure=*、tourism=* 或 waterway=* 标签的路径各单独算作一类土地利用
- 由于 1 km 范围内的要素同时也处在 3 km 范围内,1 km 范围内每个建筑或人造物的得分实际上是 0.1+0.1=0.2 分
2.1.5 满分标准
总地来说,一个要素完备度为 100 分的乡级行政区,其行政中心附近的要素应当满足下列标准:
- 存在可被匹配到官方名称的行政中心和其相应的行政关系
- 1 公里内存在医院、学校、派出所、银行以及至少 5 个生活消费设施
- 1 公里内存在至少 60 个建筑或人造物
- 3 公里内存在至少 4 个标有名称的行政村、自然村等其他地名,存在至少 1 个政府机关
- 3 公里内存在至少 1 条次级及以上道路或 5 条三级道路,至少 30 条小型道路、 1 个公交站、1 个停车场、1个加油站,以及 4 种不同的小型及其他道路类型(通常是 residential/unclassified/service/track/cycleway/footway/path 中的 4 种)
- 3 公里内存在 8 种不同的土地利用类型,例如:
- 居住用地,即 landuse=residential
- 商业或零售用地,即 landuse=commercial/retail
- 工业或农业用地,即 landuse=industrial/farmland
- 森林/灌木/草原,即 natrual=forest/scrub/grass
- 水域/荒漠/沙地,即 natrual=water/bare_rock/sand
- 河流/山峰,即 waterway=river 或 natural=peak
- 公园/运动场,即 leisure=park/pitch
- 旅游名胜 tourism=attraction/museum 或宗教场所 landuse=religious
可见,这样的满分标准对于中国大陆的普通乡镇来说还是挺高的,但对于大部分中小城市来说又非常地低——然而真的如此么?各位观众可以事先预期下心目中的“满分”地区有没有达到这一标准。另外要事先说明的是,这样的“满分”不代表该地区的 OSM 要素真的满足了一般公共地图对于“完备”的要求,更不代表其是社区公认的“完备”标准。如果有读者对上述标准有所疑问或是建议,欢迎在评论区和私信进行讨论。
2.2 应用实例
为方便各位社区朋友理解,本文在此挑选出了各分数段几个具有代表性的实例,说明其在上述标准下处于此分数段的原因。但要说明的是,此处的“分数”不代表本人对此区域绘图质量的认可或否定,也就是说:
-
对于要素完备度达到 100 分的区域,本文认为其拥有足够数量和种类的基础要素,在一定程度上有“标杆”作用;但这不代表本文对该区域的绘图质量、标签规范等本文不涉及的评价标准有完全的认可,请各位绘图者仔细甄别
-
对于要素完备度不足 100 分的区域,本文认为其在基础要素的数量和种类上需要某种程度的查漏补缺,但这不代表本文对相关绘图者工作有所批评;每个 OSM 贡献者都是宝贵的,每个贡献者有自己独特的兴趣也是非常自然的事情 (包括本文的作者在内)。无论其贡献多少、贡献在哪个方面,都是填补中国大陆地区的空白的一份力量
-
本文的要素完备度是基于 2025 年当前的 OSM 中国大陆社区发展状况,以及本文作者的主观目标设定的指标,因此并不客观,和其他采用了不同标准的类似研究也不能直接比较;不过,考虑到这方面的需求,本文会将统计时使用到的 .osm 存档于 GitHub,有兴趣的朋友可以用来测试自己设计的评价标准,考察下结果有何不同
注:该章节仅描述本文发表时(2025 年 12 月)各地区的要素完备程度,若未来的读者发现链接中地区的情况与描述不符时,请留意该区域内各要素的变更历史
2.2.1 分数段实例:100 分
这个分数段的乡级行政区占全体的 1%,主要是城市中心的街道,仅有少数几个乡、镇类型的行政区上榜。
例 1:宿迁市宿豫区皂河镇/深圳市南山区招商街道/襄阳市樊城区汉江街道
- 兼具绘图质量和要素完备程度的城市案例,各类要素的完备程度远远超出了本文设立的满分标准
例 2:北京市通州区中仓街道/吕梁市离石区凤山街道/张掖市甘州区东街街道
- 要素完备程度刚好达到了本文满分标准的城市案例,也是较能说明本文讨论的“完备度”并非绘图完善程度的区域
例 3:连云港市东海县张湾乡/潮州市饶平县三饶镇
- 要素完备程度达到本文满分标准的乡镇案例,可以用来回答“中国大陆目前完备度最高的非城市区域是怎么样的情况?”这个问题
2.2.2 分数段实例:95–98 分
这个分数段的乡级行政区占全体的 2%;达到该分数段的区域,单从绘图的详细程度上讲可能不弱于满分段的部分案例,离满分标准通常只差一两个社区内的 Mapper 不常画的要素,例如邮局或派出所。
- 大型城市的中心,各类要素基本齐全,前者离满分标准差一个生活消费设施和一个加油站,后者离满分标准差一个邮局
例 2:泰州市泰兴市延令街道/茂名市信宜市东镇街道
- 小型城市的中心,各类要素基本齐全,前者离满分标准差一个派出所,后者离满分标准差一个邮局和一个生活消费设施
2.2.3 分数段实例:70–80 分
这个分数段的乡级行政区占全体的 8%,其对道路交通和土地利用的标注通常仍然满足标准,但对各类 POI 和建筑的标注的缺失变得明显,行政节点和关系没有被恰当标记的情况也开始出现。
例 1:杭州市余杭区良渚街道
- 大型城市的外围,道路和用地类型的标注较为完备,但缺少学校、医院以外的设施,严重缺少 POI
- 由于是在大型城市的外围,3 km 范围内仍然搜索到了不少建筑
例 2:大同市平城区开源街道
- 中型城市的外围,用地类型的标注较为完备,但小型道路的数量不足,严重缺少 POI 和建筑,1 km 范围内的建筑甚至缺少到了个位数
- 该街道有“开源街道”“开源街街道”两个常用名称,但没有设置相应的 alt_name 标签,导致其被判定为行政节点不存在
例 3:宜宾市筠连县巡司镇
- 有国道和铁路经过的乡镇,道路、建筑、用地和自然的的标注都相对完备,但和城市相比起来数量较少,同样严重缺少 POI
2.2.4 分数段实例:20–40 分
这个分数段的乡级行政区占全体的 39%,是中国大陆大部分乡镇的常态,其通常会有县道及以上的大型道路经过,并绘制有一定种类的小型道路和河流、山峰等自然要素,另外还有标示乡镇中心范围的住宅用地等。
- 城郊例子,存在大型道路和小型道路,存在工业用地、河流和树林、存在下级村庄的名称,完全没有公共和商业设施
- 乡镇例子,存在大型道路和小型道路,存在住宅用地、河流和树林、存在下级村庄的名称,完全没有公共和商业设施
2.2.5 分数段实例:<20 分
这个分数段的乡级行政区占全体的 6%,其通常至少有个节点和道路,但缺少除水域以外的其他要素;不过有些出乎意料的是,在调研的九个省市内,连道路都不通、完全“一片空白”的乡镇还真不好找,看来道路还是中国大陆范围内里最受欢迎的 OSM 内容之一。
例 1:盐城市滨海县八巨镇
- 省道经过的平原乡镇,有节点、水域且小型道路相对丰富的例子
例 2:丽水市景宁畲族自治县家地乡
- 县道尽头的山区乡镇,有节点、水域且自然要素相对丰富的例子
例 3:巴中市通江县胜利乡
- 仅有三级道路和河流经过的乡镇
3 统计结果
注 1:方便起见,本章节的“全国”均指先期工作中涵盖的 9 个省/市,并非完整的全国范围的统计结果
注 2:本章节展示的行政边界及行政关系均来自于中国国家地理信息平台,与 OSM 的绘图标准会有所差异;平台数据的时效推测是在 2019 年前,一些拆分后新设立的行政区(如杭州市钱塘区)的平均数据会被映射到拆分前的行政区上,另外一些新设立的行政区(如温州市龙港市)则缺少对应数据,还请各位见谅
注 3:本章节对县/市及更高等级的平均完备度计算方式为简单平均,县/市的行政等级上未排除”黑区“,乡级行政区的上级单位以行政代码为准;然而,由于国家地理信息平台不提供”黑区“的行政边界,因此会出现章节 3.3 中列出的县/市级”黑区“未在章节 3.2 中出现的情况,同样请各位见谅
3.1 完备度的总体分布
从直方图上看,完备度的总体分布较为均匀、合理(至少像是难度较大的课堂测试中会得到的分布)。全国乡镇平均完备度得分为 47.68,各省(不含北京市)的平均完备度得分则在 39 到 58 之间。完备度得分的高峰在 35 分左右。得分在 98–100 分的乡级行政区,同时即各位社区同好最为活跃的地区,则占全体数量的 2.5%,主要由各大城市中心区域的街道组成。
观察各类别要素的得分,可以看出道路交通是全国乡镇要素中最为完备的一个类别,缺失最为严重的则是公共和商业设施。具体到各个类别:
- 行政节点和边界:全国约 30% 的乡级行政区划有完整的 place 节点和行政关系;只有 place 节点,但缺少行政关系的乡级行政区则占到了 65%;另有 5% 的乡级行政区因各种因素而没被恰当标注
- 道路交通:全国约 25% 的乡镇中心接近了本文设立的满分标准;余下分数段的频率分布较为均匀,但在 20 分前后分化成两个群体,其分别代表在单纯的公路以外有无标注相关交通设施的乡镇,各占约 40%
- 公共和商业设施:全国仅有约 3% 的乡镇中心标有数量充足的公共和商业设施,而有约 57% 的乡镇在此方面是完全的“一片空白”,另有约 22% 的乡镇只标注了常见的政府机关、医院和学校
- 建筑和土地利用:该类型的数据分布呈现两级分化,约 20% 的乡镇中心有充足的建筑和用地类型,但占比达 51% 的完备度在 8 分及以下的乡镇则只被标注了用地类型而缺少建筑
3.2 完备度的空间分布
3.2.1 北京市
除去作为首都的特殊因素,北京在地理条件上其实颇具中国大陆地级市的典型特征:位居平原的中心市辖区,以及外围的丘陵山地各县(尽管现已改制为区)。从区划数量上看,北京共有 343 个乡级行政区,大致是省会城市的 2–3 倍,且高度集中在城市中心区域。因此,北京市内达到满分标准的乡级行政区数量是全国最多的,共有 32 个。当然,除去数量差异,北京地区和其他地区的绘图者的兴趣差异可能也是原因之一。城市中心之外,昌平、大兴等各区仍有待完善,尤其是存在感最为薄弱的平谷区。受这些相对“偏僻”的乡镇影响,北京乡镇的平均完备度为 77.47,仅相当于珠三角一带的平均水平。公共和商业设施的缺失是主要原因,但除此之外,乡级行政关系的缺失也是北京相对于珠三角和苏南各市的一个弱点。
![]() |
![]() |
3.2.2 广东省
广东整体的要素完备度领先全国各省,其下辖各地级市的要素完备度整体都有较高水平,主要体现在行政关系和道路交通方面。然而,在此之上,公共和商业设施,以及建筑和用地类型,决定了地级市之间的完备程度的相对差距。深圳以 91 的分数取得了全国地级行政区平均完备度的榜首,除了各类要素确实齐全之外,相较于北京、上海、广州这样的大城市还有着管辖面积较小,没有乡村包袱的特殊原因。和珠三角各市同时超出省内平均水平的有粤西的江门市和粤东的汕头市,地处山区的韶关市、清远市和河源市的下辖各县则是全省要素最不完备的区域,急需补充各类建筑、用地以及设施。
![]() |
![]() |
3.2.3 江苏省
江苏整体的要素完备度仅次于广东,虽然没有如深圳这样面积小又精的地级市,但胜在面积较大的苏南各市下辖乡镇都有不错的完备水平。和广东的情况类似,江苏各市的行政关系和道路交通都较为完备,缺少的是公共和商业设施以及建筑和用地类型。值得称道的是,当地 OSM 爱好者的日常维护使得位于苏北的宿迁市市辖区有明显超出周边地区的完备水平。江苏急需补充的地区主要是苏中、苏北各县的下辖乡镇。
![]() |
![]() |
3.2.4 浙江省
浙江整体的要素完备度较粤、苏差了半档,主要原因在于浙南的金华、丽水两市的下辖乡镇拉低了平均水平。与前两个省份中完备度较低的乡镇相比,丽水的乡镇在建筑和用地方面的缺失颇为严重。另外,行政节点和行政边界的缺失也是拉低浙江整体完备度的重要原因,其中仅温州市文成县就有 11 个乡镇(如大峃镇、周壤镇等)未匹配到相应的行政节点。
![]() |
![]() |
3.2.5 甘肃省
甘肃整体的要素完备度恰好和全国平均水平相当,比较意外的是甘肃的各地级市中心的要素完备水平都还不错,如兰州、天水、张掖和定西,没有特别明显的地域差异。市区外的各个乡镇的基础要素相对匮乏,但也就只是和苏、粤两地完备度较低的区域相当,产生区别的原因在于甘肃各市的市区较小、街道类型的乡级行政区不多。甘肃也有不少需要补充的行政关系。
![]() |
![]() |
3.2.6 吉林省
吉林整体的要素完备度也和全国平均水平相近,但内部差异较甘肃更大。朝鲜族聚居的延边、白山的完备度水平接近苏南、浙北各市,随后是长春、吉林两大城市。然而,吉林的中部、西部地区,如白城、四平、松原等,其乡镇则严重缺少行政关系、建筑、用地和 POI ,“空白”区域连绵成片。
![]() |
![]() |
3.2.7 山西省
山西整体的要素完备度较甘肃、吉林又低了一挡,区别在于山西没有成片的、完备度较高的区域,全省各市的完备度相对均匀地偏低。各市的人口密集区完备度都尚可,人口密集区外的乡镇则都接近“空白”,因此决定平均水平的是各市下辖的县乡行政区数量。具体到各市,阳泉市因其较小的管辖面积而位居山西完备度榜首,随后是省会太原,临近北京的大同完备度也相对较高。晋西北的忻州、朔州、吕梁三市是山西 OSM 要素最为匮乏的区域,其中公共和商业设施的匮乏尤其严重。
![]() |
![]() |
3.2.8 湖北省
湖北整体的要素完备度在先期调查的 9 个省市中位居倒数第二,这是有些让作者意外的结果。从空间分布上,可以看到湖北“强省会”战略的显著成果:武汉市以 70.82 的平均完备度超过苏州、杭州,但排名第二的黄石则直接到了 47.73,差距之大为各省之最。不过在武汉以外,黄石、襄阳、天仙潜三县和宜昌的城区也有很高的完备度,尤其是襄阳城区的完备水平远超过了本文的满分标准。观察得分构成,除了之前提到过的建筑、用地、公共和商业设施,以及行政关系以外,道路数量的缺失成为了新的显著问题。湖北的“空白”区域遍布全省,广大的江汉平原及四周山区上,是远在全国平均线之下的“空白”乡镇。
![]() |
![]() |
3.2.9 四川省
四川的整体情况和湖北有些相似,同样有成都这样的“强省会”,且不是一般地“强”:在建成面积位居全国前列的条件下,成都四环内的平均完备程度甚至在北京之上 。在成都之后,自贡这样较为完备、下辖面积又较小的地级市还补上了档次之间的空白。然而,四川的乡级行政区是全国最多的,仅按本文统计到了其中的 3101 个乡镇(政府公布的统计名单上有 4633 个),就比位居第二的河北多了接近一半。因此,即便个别市镇中心较为完备,大量填满背景的“空白”乡镇也将四川的平均完备度拉到了全国最低的位置 (当然,感觉上更加空白的贵州等省还没有被纳入统计,大家可以预测下贵州处在哪个位置)。另外,川西高原各市的平均完备度甚至稍高于川东岭谷各市,这可能有川西高原各市的乡镇主要集中在干线公路附近且少数民族聚居、所受关注度较高的原因。
![]() |
![]() |
3.3 完备度最高/最低的重点地区
各省县级行政区平均完备度的 Top 5:
| 排名 | 北京市 | 广东省 | 江苏省 | 浙江省 | 甘肃省 | 吉林省 |
|---|---|---|---|---|---|---|
| 1 | 东城区 98.65 |
广州市越秀区 97.11 |
宿迁市宿迁经济技术开发区 94.00 |
杭州市上城区 93.43 |
兰州市城关区 96.28 |
长春市南关区 89.86 |
| 2 | 西城区 95.87 |
深圳市福田区 97.00 |
南京市秦淮区 93.92 |
杭州市拱墅区 91.78 |
临夏回族自治州临夏市 87.31 |
延边朝鲜族自治州延吉市 88.01 |
| 3 | 石景山区 92.78 |
深圳市南山区 96.38 |
南京市玄武区 91.86 |
嘉兴市嘉善县 91.44 |
兰州市安宁区 85.21 |
长春市朝阳区 83.30 |
| 4 | 海淀区 92.10 |
肇庆市端州区 95.00 |
苏州市姑苏区 89.51 |
杭州市西湖区 91.17 |
兰州市七里河区 85.09 |
延边朝鲜族自治州珲春市 79.62 |
| 5 | 丰台区 90.54 |
广州市海珠区 94.89 |
无锡市梁溪区 88.78 |
宁波市江北区 89.00 |
兰州市西固区 82.58 |
长春市长春高新技术产业开发区 79.28 |
| 排名 | 山西省 | 湖北省 | 四川省 |
|---|---|---|---|
| 1 | 太原市迎泽区 89.36 |
武汉市江汉区 96.46 |
成都市成华区 95.64 |
| 2 | 阳泉市城区 86.50 |
武汉市江岸区 89.18 |
成都市锦江区 95.18 |
| 3 | 长治市潞州区 82.31 |
武汉市武昌区 88.71 |
成都市金牛区 94.31 |
| 4 | 太原市杏花岭区 81.75 |
黄石市铁山区 86.00 |
成都市青羊区 93.58 |
| 5 | 大同市平城区 77.07 |
襄阳市樊城区 84.23 |
成都市武侯区 92.93 |
各省县级行政区平均完备度的 Bottom 5:
| 排名 | 北京市 | 广东省 | 江苏省 | 浙江省 | 甘肃省 | 吉林省 |
|---|---|---|---|---|---|---|
| 5 | 门头沟区 68.08 |
河源市和平县 31.96 |
连云港市灌云县 29.72 |
温州市泰顺县 27.16 |
酒泉市玉门市 31.97 |
白城市镇赉县 29.76 |
| 4 | 密云区 67.90 |
清远市阳山县 31.95 |
徐州市邳州市 28.62 |
丽水市龙泉市 25.77 |
酒泉市金塔县 31.66 |
辽源市东辽县 26.79 |
| 3 | 房山区 65.33 |
河源市连平县 28.69 |
徐州市贾汪区 28.51 |
丽水市庆元县 25.09 |
武威市古浪县 30.75 |
松原市长岭县 25.48 |
| 2 | 延庆区 63.48 |
河源市龙川县 28.41 |
盐城市射阳县 27.68 |
丽水市景宁畲族自治县 21.29 |
张掖市民乐县 28.32 |
长春市农安县 23.72 |
| 1 | 平谷区 50.52 |
河源市东源县 27.60 |
徐州市沛县 27.48 |
温州市文成县 19.91 |
张掖市临泽县 27.81 |
四平市梨树县 21.98 |
| 排名 | 山西省 | 湖北省 | 四川省 |
|---|---|---|---|
| 5 | 运城市万荣县 25.36 |
恩施土家族苗族自治州来凤县 22.56 |
达州市万源市 25.05 |
| 4 | 吕梁市岚县 24.52 |
宜昌市当阳市 22.16 |
内江市资中县 25.04 |
| 3 | 运城市闻喜县 24.44 |
宜昌市远安县 21.97 |
巴中市通江县 24.98 |
| 2 | 吕梁市交口县 24.36 |
黄冈市罗田县 21.84 |
甘孜藏族自治州炉霍县 23.95 |
| 1 | 吕梁市兴县 24.18 |
咸宁市通城县 19.94 |
乐山市沐川县 23.79 |
4 总结
回到开头的几个问题,中国大陆的乡镇“空白”到了什么程度?看到这里已经可以得出一个定量化的答案——即便是在先期试验中的 9 个省市,在并不算高的完备标准下,依然仅有 2.5% 的乡级行政区能达到接近满分的标准,全体样本的平均得分则仅 47.64,且这 9 个省市中已经涵盖了北京、广东、江苏等热点区域,真实的全国平均数据还会更低。大部分城市建成区外的乡级行政区的完备度得分都在 20–40 之间,仅有节点、道路和河流要素被绘制在 OSM 中。
接下来要回答的问题则是:哪些要素的缺失情况最少,哪些要素的缺失情况更加严重?这个答案相信符合大家的直观感受:行政关系和道路的缺失情况最少,公共和商业设施的缺失情况最为严重。按照满分标准,全国有 30% 的乡级行政区有完整的行政关系,有 25% 的乡镇中心有接近满分标准的道路和交通设施,有 20% 的乡镇中心有较为充足的建筑和用地类型,但仅有 3% 的乡镇中心标注有足够的公共和商业设施;相对地,按照零分标准,大部分乡镇在其他标准下多多少少都有一些得分,真正的“一片空白”在乡镇中心非常罕见——至少基本都有道路连接和居民用地的标注——但有高达 57% 的乡镇中心没有标注任何的公共和商业设施,如政府机构、医院、学校、商店等。
最后的问题则是,中国大陆的“空白”区域主要分布在哪些地方?(可能会有人说:“任何地方”,某种意义上乡镇以外的“乡村”确实是这样)只看乡镇中心的完备度分布,尽管上面提到的要素在全国范围内的缺失是普遍的,但我们确实能在调查样本中找到一些更加显眼的、少有人关注的连片“空白”区域,例如:
- 山西:西北部的吕梁、朔州
- 吉林:中西部的白城、四平、松原
- 江苏:中北部的盐城、连云港、徐州
- 浙江:南部的丽水、温州
- 湖北、四川全省
至此,感谢您阅读这篇稍微有些冗长的报告,欢迎各位留言反馈。希望这能作为 2026 年的新年礼物给社区同好们作为一些参考,也期待能在明年的年度报告中看到不一样的新气象,谢谢!


















Discussion
Comment from laobider on 27 December 2025 at 15:01
太厉害了哥
Comment from Kisarazu Funya on 28 December 2025 at 06:49
我个人以为在计算省/市/县的完备值时,简单的平均值可能并不是个好主意,希望可以引入对街道乡镇基于它们的七普人口的加权。
对于简单的平均计算来说:一个四百人的乡和七万人的街道,它们在计算中占的比重是相同的。
这有可能导致在两个完备值相同的市/县中,一个是城市完备值较高而乡村完备值较低的市/县,而另一个是城市和乡村的完备值都介于前者的城市完备值和乡村完备值之间的市/县。 倘若这两个市/县的城镇化率均为中国大陆的城镇化率(67%),那么显然前者有更多的人口居住在完备值较高的地区。 在这种情况下,这两个市/县的完备值相等就会使我们的判断出现偏差,我窃以为应当是前者较高而后者较低比较好。
Comment from Kisarazu Funya on 28 December 2025 at 11:44
另外,在3.3中,您在「各省县级行政区平均完备度的 Top 5 」中列出了长春市长春高新技术产业开发区和宿迁市宿迁经济技术开发区。它们都是非法定行政区(即所谓「黑区」),而且宿迁经济技术开发区是乡镇级黑区( admin_level=9 )。
在所有的法定的县级行政区的关系中,都应当有 admin_level=6 。反之亦然,所有拥有 admin_level=6 的行政区关系,都是法定的县级行政区。
希望您可以明确3.3中排名的标准,我认为有两种更改的方法:或是只使用法定县级行政区(这需要删除黑区的排名);又或是使用所有法定及非法定的性质区(这需要改变「县级行政区」的描述)。
Comment from 快乐的老鼠宝宝 on 28 December 2025 at 12:24
很高兴能终于有人系统性的分析到底中国的OSM缺少数据缺少到了什么样的程度,经常会在mapper群体里面听到说“一个县城消耗一个mapper/你这地图百平方公里耗几个mapper啊”之类的讨论或者是“中国大部分地方就是这个(配图一张纯白)”的自嘲,因为中国真的很大,世界上面积前列,但因为法律和网络上的限制,活跃的mapper又太少了。 之前在各个国内平台的群聊经常接待到需要做作业的学生,那一般就问一下是要什么类型的数据,如果是公交一般就定向推荐济南上海,路网北京,micromapping靖西,或者说“北京和山东占了国服OSM起码三分之一江山”,但对哪里的mapper多到底有多么多,分别又是多么的能画,确实也是主观先验在前的(当然本宝宝似乎也确实为部分刻板印象添砖加瓦了,很遗憾) 而对国外社区来说,经常系统性的忽视中国意见,和对中国编辑者提出太多质量上和协作上的要求,以及更严格的审视标准,我觉得也是严重忽略了“对中国来说只是画图不要乱画,只要不到编辑战的程度,哪怕有争议都是有贡献”这件事的。这篇报告也适合给“洋大人”看看的。 总之,很感谢有人做这样的工作,具体内容可能还需要拿出时间慢慢去阅读,因此这里没有什么意见。
Comment from jimmygu0611 on 28 December 2025 at 13:42
感谢作者的采集和分析!关于兵团,我以为兵团严格来说不是很算“黑区”,不论兵团是省级单位,兵团各师也已经建制化了(除十二师与建工师)。另外,新疆-兵团的一些区划还有边界错误的问题,比如乌鲁木齐市乌鲁木齐县永丰镇被错误地划为沙依巴克区和十二师。希望作者如果有统计新疆数据的计划的话多注意一下相关的区划,目前这一块比较的……错漏百出。
Comment from Higashimado on 28 December 2025 at 15:33
非常感谢各位的评论和建议,在此就统一回复了:
关于黑区表述问题:本文排除黑区的方式简单粗暴,仅在乡镇级上排除了乡级行政代码为 400–999 的条目;在行政代码上前面被提到的长春高新技术产业开发区和宿迁经济技术开发区的等级都为区县级(等级为 3),所以没有被排除,不知其在 OSM 中标记为不同的 admin_level 有何原因?关于此问题,我会在章节 1.1 中改正相关表述
关于新疆兵团问题:新、藏、川等地区的区划有其特殊性,似乎四川也存在相当比例被排除的乡级行政区划,关于这方面我后面会看看这些特殊单位占全部单位的比例,适时调整统计的对象和区域;本文统计时匹配的只有行政中心节点,计算县/市级平均是看的则是行政代码上其归属哪个单位,绘制地图是使用的更是法定行政区的 .shp 文件,边界错误的这个估计没法核实
关于省/市/县的整体完备值计算问题:这个建议很非常合理,但我感觉目前暂时没有这个必要 (给偷懒找借口),原因是
目前本文的完备度满分标准很低,除了少数的建筑、道路部分有按数量计分以外,指标的主体部分都是按存在与否计分,这个“最低要求”实在是不合适再按人口或城镇化率调整了;也许等到过几年发展情况不同了,制定了新的标准后,再按人口或城镇化率加权也不迟
作为上条的补充,我认为在这个“最低要求”下,不同人口/城镇化率地区的乡镇应当是“平等”的,都应当补充有足够的道路、建筑和设施
还有一条在群里看到的关于本文不太适用于寻找绘图示例的评论,这确实没错哈,本文关注的更多是空白乡镇,寻找满分乡镇只是顺带的;不过个人认为真正有示例作用数据确实不多,就像在 2.2.1 中列出的那样,用列表列出来都够用了
总之,谢谢大家的意见,也欢迎转载链接,如果这篇文章能帮助 OSM 社区对中国分社区有所了解那就再好不过了。另外,包含 9 个省/市数据 .csv 我也公开在了 GitHub 中,欢迎各位继续批评!
Comment from meongseolin on 28 December 2025 at 16:30
总结还可以吗,希望作者能继续完成。(不知道下篇能不能见到湖南)
Comment from Kisarazu Funya on 28 December 2025 at 17:45
长春高新技术产业开发区和宿迁经济技术开发区确实都是县级黑区,它们的 admin_level 值理应都为7。我认为是宿迁的编辑错误地标注了宿迁经济技术开发区的缘故。
我注意到甘肃省白银市白银区的所有街道和王岘镇的行政节点和边界得分均为13。这令人费解:它们的关系刻意地没有使用 label 和 admin_centre 成员,所以此项的最高得分应是12。
另外还需要提醒的是,行政区域关系中的 label 可以不加 place= ,因为 label 点只是希望数据使用者将行政区名字渲染到这个点上;但是 admin_centre 需要加 place= ,admin_centre 点是指示行政机关所在的城市、城镇、村庄,而不是大楼。
所以可能会产生这种情况(虽然我个人认为它在中国的几率接近于零):一个乡镇级行政区只有 label 而没有 admin_centre ,这个 label 没有加 place= (可能是由于编辑认为这个应当渲染的点不是一个地名),从而使它的行政节点被错误地判定为不存在。 (或者您认为这样的 label 并不能被看作行政节点?毕竟由于它的语义,它一般被用于标志几何中心或是文化中心。)
Comment from Higashimado on 28 December 2025 at 18:38
多谢评论区的仔细核查和补充提醒!
关于行政节点和边界得分为 13,是因为本人编写脚本时取了个巧:一般认为为行政中心节点肯定是有 name 和 place 标签的,那么计算“其他节点”时肯定会计算到行政中心节点,所以并没有刻意去对比其他节点是否是行政中心;即,行政节点一项的满分实际上是 7 分,“其他节点”的满分实际上是 5 分(好吧,就是 bug 被抓包)
根据 Kisarazu Funya 的补充,我想到了一种对这种特殊行政关系的补充判断机制:
Comment from Kisarazu Funya on 28 December 2025 at 19:48
我个人认为这一新机制是可以接受的。不过我个人建议先查一下 Overpass API ,看一下有多少乡级行政区已经拥有关系。这一新机制事实上使得这些乡级行政区绝大部分都可以拿到至少15分。(虽然我认为这些乡级行政区之前几乎都拿到了至少15分。)
还有,至少浙江省杭州市拱墅区潮鸣街道的 admin_centre 本来是正常的,但是一周之前被一位编辑错误地删掉了 place= ,所以造成了特殊的情况。而在新机制下,潮鸣街道因为有关系,所以也将恢复正常。
另外,甘肃省白银市靖远县若笠乡在 OSM 上是有一个 place=town 的点( node/4305763686 )(虽然没有关系),但是 node 列却错误地标为 -1(即未识别到)。希望能对匹配的算法进行核查。
最后我想额外说明的是,有部分乡镇因为政治中心的人口不足(在甘肃省来说是乡政府所在的村委会只有1500人左右,极端的如前文所述的若笠乡全乡人口仅有475人),使得它们没有足够多的生活消费设施。我无意就此提出标准的更改,但是我想请大家注意,无论我们多么努力地绘图,总是存在着一些乡镇不能完全满足这极低的标准。我对此感到深切的遗憾。
Comment from Higashimado on 28 December 2025 at 20:32
感谢您的继续讨论,我再补充一些:
新机制下仍会对有 admin_center 的角色进行检查,所以潮鸣街道仍然会因作为 admin_center 角色的节点却没有 place 标签而被判断为错误标记(额,最好还是有哪位热心人快点它改回来吧)
国内人口极端稀缺的乡镇确实存在这种情况,对此我也感觉非常遗憾。然而,尽管我本人很不鼓励这么做,也不希望这项工作被用来当作骗算法凑满分的工具,不过硬凑 micro mapping 其实还是能凑出足够数量人造物和生活消费设施的 (毕竟 man_made=water_well 什么的也是人造物,政府、学校的食堂也可以标个 cuisine=chinese)
关于您提到的节点缺失问题我会进一步核查,但对目前已发布的数据和结果的更新估计得要半个月后了,期间还请各位稍作等待,在此期间我会继续收集问题和反馈的
Comment from Kisarazu Funya on 28 December 2025 at 20:59
好的,感谢您的回复。
我注意到您使用 admin_center 而不是 admin_centre 。虽然我不认为您会在 Overpass API 或其他 OSM 中这样写,但是我还是要(没事找事地)提醒您:在绝大多数情况下,OSM 的 tag 和 value 使用 en-GB 而不是 en-US 。
另外,我注意到您在「2.1.5 满分标准」中的最后一段的「各位观众可以实现预期下心目中的“满分”地区有没有达到这一标准。」一句中,「实现」可能应改为「事先」。
考虑到今天是工作日,我还是需要睡眠。所以我不得不以此结束和您的讨论,我深表歉意。
Comment from Kisarazu Funya on 30 December 2025 at 07:24
我注意到在发布的数据中,甘肃省白银市白银区纺织路街道的一千米内的银行数量为0。但是存在一个银行,且距离数据中该街道的行政中心800米 ( relation/19436229 )。希望您能进行核查。
另外,自今年起, education=* 已经被批准,目的是在未来让所有教育机构不再使用较为宽泛的 amenity=* 。希望您能将含有 education=school 的对象也加入学校的判断。
Comment from Higashimado on 30 December 2025 at 16:38
您好,感谢您的提醒,我会将 education=school 和 amenity=school 并列作为学校的判断条件。
关于白银市白银区纺织路街道的中心问题,我重新统计了该区域的要素,对比后发现 1 km 范围的对应文件与统计时使用的有较大差异,我估计这是因为 overpass 不稳定而导致下载到文件中存在缺失。之后,我会再对之前的数据重新过几遍 overpass 直至结果稳定,但这可能仍不能保证每个地点的数据都没有缺失。
总之,谢谢您的意见,欢迎继续反馈。