自2009/01/01 以來已有 人次上線瀏覽         Feed on Posts or Comments

Google Map &報導 廖泫銘 on 25 九月 2012 01:37 下午

Google 是如何構建地圖的?

譯稿轉載自:ifanr網站
英文報導:How Google Builds Its Maps—and What It Means for the Future of Everything (The Atlantic)

對於許多人來說,Google 地圖已經成為日常生活的一部分,但是你知道 Google 地圖是如何構建的嗎?在我們能夠看到的地圖背後,其實還有一個更加複雜的地圖,包括了現實世界中獲取的龐大數據,而地圖的構建中投入了大量的人力。最近,Google 向 Atlantic 網站的 Alex C. Madrigal 展示了深層的地圖及其構建過程。這是公司第一次向外人展示 Ground Truth 計劃。

一個搜索公司為何要去製造世界上最好的電子地圖?在 Google 看來,地圖同樣與 Google 的使命密切相關。Manik Gupta 是 Google 地圖高級產品經理,他告訴 Atlantic,「如果你觀察下線下世界,會發現在我們真實生活的世界里,信息並不全是在線的。隨著我們生活需求的增加,我們試圖填補所看到的真實世界和在線世界的鴻溝,地圖就是起這個作用的」。

Google 開發地圖的辦公室並不起眼,只是山景城郊區一棟低層建築。在那裡 Alexis 見到了 Gupta 以及地圖團隊的技術主管 Micheal Weiss-Malik。Micheal 原來是 NASA 的工程師,他 20% 的時間用在了 Google 火星地圖上。

Micheal Weiss-Malik 向 Alexis 講述了他們構建地圖的過程。這需要許多步驟,從合作者那裡獲取數據,將它處理成合適的格式,然後和其它源頭那裡獲得的數據合併。做完這些工作后,還需要進行其它操作,使用工具來傳入數據,最終產出高質量的地圖。

當他們構建美國地區的地圖時,首先使用了美國審計局的 TIGER 資料庫。但是那些地圖並一定完全符合實際情況。為此,Google 會把這些數據與其他來源的數據進行比對,比如美國地質調查局的數據,以及 Google 街景車獲取的數據。現在,Google 街景是非常重要的數據源。街景車的行程已經達到 500 萬公里,每次行駛都會帶來有用的數據,包括實際路況和大量的圖片。Google 會通過演算法從拍攝的圖片中提取出交通標識,甚至將它們貼到深層的地圖上面。

我們可以把這些街景車和網路上的爬蟲做類比,只是它們可以爬取真實世界的文字信息。通過計算機圖片識別技術,Google 能夠為現實世界做索引。Google 地圖副總裁 Brian McClendon 認為,通過 OCR 技術,Google 能夠將世界上各種真實文字信息組織起來。目前構建地圖的過程中,Google 會從圖片中提取街道名稱和地址,但是這隻是個起步。Brain McClendon 說他們有 600 萬商業機構和 2000 萬個地址的「視覺代碼」(View codes),通過 logo 配對,可以找出公司標識所在的位置。他們能夠對獲取的圖片進行辨識,進行語義化的了解。

不過,將街景地圖直接轉換為可用的信息仍然是未來的事情。要對地圖的實際意義進行理解,仍然需要人工投入。比如要了解某個交叉口是否可以拐彎,仍然需要有人去看,可能是實際駕駛,也可能是通過觀察街景車拍攝的圖片。

Alexis 了解到,Google 地圖中投入的人工是非常大的。根據 Micheal Weiss-Malik 的說法,要製作一個國家的地圖,需要上百個操作員來處理數據,對地圖進行實時更新。每天都有上千的用戶報告問題,對於那些能夠解決的問題,地圖團隊在幾分鐘內處理掉大部分。一個例子:某個用戶報告說 Google 地圖上沒有顯示某個邊遠地區新建的環形路。這時候,衛星地圖仍然沒有顯示這個改變,但是一輛 Google 街景車最近從那裡路過,拍下了這條新路。於是,Google 的操作員開始快速繪出這條新道路,並且和地圖上已經存在的結構連接。這隻需要幾分鐘時間。

在了解到 Google 地圖的構建過程之後, Alexis 認為沒有其它公司能夠像Google 一樣獲取如此大量的地理數據。這不僅是因為 Google 處理數據的能力,而且因為它能夠投入大量的人力,去組合和清理數據。

可以想象,如此龐大的數據處理,對於任何公司都是不可能完成的任務。除了公司內部的操作員之外,Google 還要利用更廣大的用戶來幫忙。Google 的 MapMaker 產品就是一個這樣的產物。通過 MapMaker,公眾可以對 Google 地圖進行編輯,這可以最大限度的利用人腦中的知識,將其變為互聯網上的數據,Open Street 地圖也是這樣利用大眾智力投入的。

未來的世界將是虛擬和現實結合的世界。這使得 Google 的地理數據成為最有價值的資產。對此,科幻小說家 Robin Sloan 是這樣說的,「我認為這是 Google 的核心資產。在 50 年內,Google 將是一個自動駕駛汽車公司(由這個世界的深層地圖驅動),哦,另外,他們在某個地方還有一個搜索引擎。」

相關報導:

Trackback This Post | Subscribe to the comments through RSS Feed

Leave a Reply