OpenStreetMap

State of the Map Asia 2016參與記實

Posted by Supaplex on 26 November 2016 in Chinese (Taiwan) (‪中文(台灣)‬)

這次去馬尼拉,參與 State of the Map Asia 其實是很倉促的決定,看到有 scholarship 可申請,就想說談談臺灣社群狀況,順便會會一些相關公司、社群的人。這次決定並沒有讓我失望,除了見到朋友 Wular,還碰到 Mapbox data team印度團隊的人,以及久聞大名的 Manning。

Manning Opening

Mapbox 的團隊最近在幫忙對齊臺灣的道路網路,採用新出爐的 Mapbox 衛星影像,還有 Strava GPS 軌跡。先前我只有跟 Manning 和 Mapbox data team 線上打過交道而已,見到面感謝他們的貢獻,發聲說說臺灣的狀況,能夠配合遠端鍵盤繪圖的人做些什麼事情。

這是我的演講Slide,由於時間有限,刪減不少內容。在這邊大略敘述我講了什麼,留下文字記錄。

My slide

臉書使用 OSM 資料對臺灣的影響

我談到臉書採用 OSM 資料的部分沒講太清楚,蠻多人在演講後有疑問有跑來跟我聊聊。臉書在兩個地方用 OSM 資料:用 OSM 資料訓練 AI 畫地圖;用 OSM 資料當地標資料的底圖。前者不少關心 OSM 的人都知道,也觀察到臉書的 AI 有重覆畫既有的道路網,這麼就不累敘了。

Facebook landmark page

臉書目前在日本、南韓都有用 OSM 當地標資料的底圖,而地標位置則在臉書手上,當然是使用者給他們的資料。但在去年臉書有在中國、臺灣、越南試驗把地標點底圖換成 OSM,結果在臺灣引起相當大的風波。一來是 OSM 未必在每個地方每條巷弄都畫出來,給人一種地圖很不精細粗糙的使用體驗;二來是很多人搞不清楚地標的位置由使用者建立,所以如果當初建立時輸入錯誤的訊息,那臉書拿到的資料也就錯誤了。建錯的地標連同被換掉的底圖,被怪罪到OSM,其實就不是 OSM 的問題,地標放錯位置是Facebook問題。

有一個最誇張的例子是有人興沖沖的回報他們地標位置標錯了,而且指責附近一帶的地圖上沒畫出多少巷弄,語言用詞相當的沒禮貌。當時臉書有把使用者回報導向 OSM 的 Note 系統,所以許多大大小小的抱怨湧入,有些可能是 OSM 問題,有些臉書的問題,像地標位置設錯了。這些回報包括這位沒禮貌的回報者,也就沒意識到寫出來的內容是公開的,永遠存在網路上。

Complain from Facebook user

最後臉書大概也煩了,沒人力可以處理本來他們應該處置的使用者抱怨,臺灣這邊的地標底圖改用 Here 圖資,也結束臺灣OSM社群的困擾。

需要訂定能用在臺灣的tagging標準

OSM 強調可以實作多語言地圖,照顧不同語言使用者的需求。於是我們看到除了 name 欄位填入在地社群的慣用名,其他像是 name:en、name:de、name:ja、name:fr、name:zh 表示對應的語言名稱,採用 alpha-2 code of ISO 639-1 的語言代碼後綴。

但儘管有辦法能夠實現多語言共存的狀況,仍然要先制訂標準出來。實際上在中文世界這邊,OSM 目前訂定的name:zh並不夠,不能妥善涵蓋用到繁體、簡體中文字的人,需要另行制訂繁體中文、簡體中文對應的 tag。

還有一問題是誰的中文才是中文name:zh,在中國和臺灣等用中文的地區之外,究竟要用中國的中文代表中文,還是臺灣的中文代表中文呢?誰的中文才是中文?

於是 Rex 大大依據 IETF language tag  (BCP 47) 的語言規範,制訂適用臺灣、中國、香港、澳門,以及其使用中文的地方,或者有用到中文譯名的地方。

Chinese name tag proposed

除了字體之外,把地區不同用詞也考量進去。比如說,在臺灣、中國各自用慣用的繁體、簡體在name:zh欄位沒什麼大問題,但在這兩個地方以外,有些地方不只簡繁體的差異,而是用詞完全不同,像是Mt. Everest,臺灣用的是聖母峰,而中國那邊採用喜马拉亚山。

也許提 Mt. Everest 對菲律賓人來說很遙遠,因此在演講時反應不強。我應該提一些菲律賓的知名地名或旅遊景點,比較讓菲律賓和外國人有點印象,像是民答那峨 (Mindanao)、薄荷島 (Bohol)。兩者在臺灣和中國分別是如下稱呼:

  • 英文 臺灣繁體中文 中国简体中文
  • Mindanao 民答那峨 棉兰老
  • Bohol 薄荷 保和

由此可見,除了繁簡體中文字問題,還有不同的慣用翻譯,影響 OSM 的在地化和體驗。

除了中文的標示問題以外,臺灣還有使用南島語系福爾摩沙語言的原住民,結合先前有關原住民地圖的討論,曾談到該使用那些語言代碼當後綴,也一併在這一次納入。

Tagging for the Formosan language of Taiwan Aborigines

對臺灣的社群來說,長期目標是希望各個使用 OSM 圖資的開發者,能夠逐步採用這套語言標示服務各地中文使用者,解決臺灣、中國等地繁、簡字體差異,還有用詞不一的問題,提供各地用戶更客製化、在地化的體驗。未來臺灣的 OSM 社群在提出這套方案之後,也將通知各個用到 OSM 資料的地圖 app 開發者,希望他們能夠採用。

與歐美主流宗教不同的宗教崇拜場所標示問題

現行在 OSM 的宗教教派標示方式,像是佛教、基督教、天主教、道教、回教的分別,對於標示臺灣的宗教和民間信仰並不精確,容易帶來誤解。臺灣很多廟宇祭拜的對象以歷史人物為主,分辦是屬於那個宗教教派其實沒意義。應當更聚焦在這間宗教崇拜場所是供奉那位神祗。

小時候我學到依廟宇名稱後面來分辨是佛教還是道教,xx宮被歸為道教廟宇,而xx寺則是佛教廟宇。有一陣子我會依據前述提到的原則來標示。但後來仔細鑽研之後發現並不精確,因為前面提到區別主要拜那位神才更精確更有意義。

Taiwan traditional religion tagging

因此Rex提出傳統信仰標注方式 (草案),希望提出一套標準來解決前面提到如何標示臺灣多元宗教教派的面貌,解決現行OSM上臺灣宗教歸類的亂像。除了前面提到應當用主祠神為主要區別,應該另立獨立的臺灣傳統宗教信仰標籤,下面有例子解釋。

臺灣漢人傳統信仰:

  • religion=folk
  • denomination=TaiwaneseFolkReligion

為了兼顧非漢人信仰,像是西拉雅族的阿立祖公廨標法:

  • religion=folk
  • denomination=SirayaFolkReligion

廟宇標法範例:

慈惠堂 (仍須依據其運作模式來判斷)

  • religion=folk
  • denomination=TaiwaneseFolkReligion
  • dedication:principal=瑤池金母
  • dedication:principal:wikidata=Q1064059

其他的標籤問題

其他還有其他問題,像是中文地址書寫習慣,在線上編輯器iD欄位設計時主要考慮英文地址書寫方式,造成中文排列問題,會在 iD 2.0 版獲得改善。

不同的廠商、組織的交流

我在演講時刻意提到 Mapbox 團隊在臺灣依據 Strava GPS 軌跡,重新對齊臺灣道路網。演講完也與他們團隊有相當密切的交流。原先只有在網路平臺交換意見,能在實體空間碰面交談,類似第一次面對面見到網友的體驗,相當新奇。

Mapbox works

我也遇到 Maps.me CEO,跟他交換不少意見。他在演講時提到 OSM 需要輕量的參與者,增加在地的商家,因此就需要能夠很簡單就能增加資訊的 App,他們的 Maps.me就是這樣一套工具,不然靠重量級的圖客觸腳永遠都碰不到所有地方。

我跟他說有些用戶有很有創意的使用 Maps.me 的方法:除了加店名,還用 $ 符號的數量表示該店家的價位區間,$$$$ 表示貴,而 $ 是便宜。不得不說選餐廳時這價位區間是重要資訊,但到底在 OSM 要怎麼標示。他提到未來改版會加入增加道路名稱的功能,讓 Maps.me 廣大的使用群眾,貢獻最在地也最基本的資訊,那就是用戶活動地區的道路名稱,聽他說我覺得這很重要。

Eugene talk from Mapbox

期待下次在尼泊爾舉行的大會

尼伯爾的Nama博士說他被念煩了,一直被人詢問,或是被邀請談論尼泊爾地震的急難繪圖經驗,該來辦個活動完整記錄這事情,免得過個幾年記憶模糊,細節沒記下來。另外就是很多當時的要角沒辦法輕易出國談那次經驗。下一年 2017 年,State of the Map Asia 大會,有極高可能在尼泊爾舉行,大家可以來參加會議,然後去登喜馬拉雅山。

Nama talk

儘管只有2個小時的飛機,大多數台灣人不大會往南飛,而是選擇往前往文化上比較熟悉的日本。要不是這次主辦單位的邀請,我也不會來臺灣南方的鄰國菲律賓。除了會議上與其他參與者的交流,也當地風土民情有深刻體驗。很感謝主辦單位的安排,很高興能到菲律賓分享臺灣經驗。

Location: Village B, UP Campus, Quezon City, District IV, Quezon City, Metro Manila, 1101, 菲律賓

Login to leave a comment