衛星大數據應用成下一個風口,另類數據如何切入主流市場

在本篇文章中,我們采訪了RS Metrics公司的創始人兼CEO Tom Diamond,討論了目前的熱門話題——衛星圖像數據應用的崛起以及地理分析的前景,並研究了其商業價值以及投資價值。

Tom Diamond, RS Metrics公司創始人兼CEO2019-04-04

RS Metrics這家公司是如何創立的?

在2010年創建RS Metrics之前,我在一家名為Stax Inc.的管理咨詢公司工作,曾與Prudential,H&R Block以及American Express等公司合作,主要工作是對客戶或商家進行定量調查和分析(曾經的客戶包括從達美航空、百思買到便利店到加油站等),以支持企業戰略和增長。我還與私募股權公司和對沖基金合作,對他們感興趣或已投資的市場或公司進行盡職調查。

這一切都始於一家尋求投資的私募股權公司,希望獲得投資標的海外業務的數據,但卻無法對過去幾年中該地點的運營情況進行盡職調查。我的兄弟Alex當時正在與一家衛星公司Digital Globe合作,他能夠獲得該工廠的一些圖像,證明它已按照應有的方式運行。當客戶看到圖像的時間序列,並看到卡車和員工車輛情況時,他立即從地板上拉了20個人。每個人都頭暈目眩,大笑著鼓掌,因為他們可以毫無疑問地看到離岸地點發生的事情。正是在那一刻,所以我在那一刻意識到那裡有一些東西。

如今,RS Metrics是一家面向企業和投資者提供衛星圖像數據和地理空間分析公司。利用先進的計算機視覺和機器學習,我們從各種基於位置的資源中提取富有洞察力的即用型數據,為金融服務,房地產,零售,工業,金屬,政府和學術研究決策提供預測分析,信號,警報和最終用戶應用程序。

在剛成立公司的時候,衛星圖像研究是怎樣的?

剛開始的時候,所有的東西幾乎都是100%人工制作的。早在2010年,大規模使用衛星圖像進行地理空間分析還處於早期階段,這意味著我們必須與衛星公司一起研究如何向我們交付批量訂單。空中客車(Airbus)和數字地球(DigitalGlobe)都從未這樣做過。谷歌Earth和RS Metrics是數字地球(DigitalGlobe)最大的衛星圖像消費者。不像今天,企業可以直接去DigitalGlobe,注冊他們的GBDX平台,然後開始提取成批的圖像。在當時,我們必須自己建造它。

當我在Stax工作的時候,我已經和H&R Block這樣的大型零售商合作過了。所以我對零售很在行,我知道對沖基金對零售業很感興趣,而且零售業方面有足夠的衛星圖像。所以我們決定從零售開始,涵蓋並測試了沃爾瑪,家得寶,勞氏和麥當勞等公司。我們提取了上千張商店的圖片,我們使用非常老式的計數方法來測量來進行我們最初的測試。我們看到的是它們之間存在關聯,即停車場的汽車數量確實與整個連鎖店的收入有關。

當時衛星運行的數量較少,所以大型零售連鎖店的樣本規模相對較小,但仍足以進行定量分析。現在有更多的衛星在運行,這使得樣本量更大,結果更細粒度和更准確。

在你的創業過程中,什麼時候最具挑戰性,迫使你重新思考業務?

在2015-16年衛星發射數量沒有實現的時候,我們面臨了業務上的轉變。雖然我們有大型量化公司和像Lowe 's、Target、Kroger這樣的大客戶,但當手機和GPS數據開始出現,從衛星數據中吸引注意力時,我們面臨了激烈的競爭。當然,現在有更多的衛星和更多的數據可以用來測量零售交通趨勢,隱私法正在限制從手機/GPS獲取個人數據,所以事情變得更加現實,衛星數據再次成為零售業的焦點。但那時候,人們才開始意識到手機數據的顆粒度有多大。盡管它只捕獲了一個地點的一小部分客戶,但它每分鐘都在收集信息。而我們的數據只在每個地點每隔幾天收集一次。

所以我們真的需要更多的衛星圖像來增加樣本大小,使零售產品更強大。理想情況下,我們需要每天測量每家商店。但為了生存, 我們不得不增加其他不需要這種數字頻率的產品。

所以我們決定把更多的精力放在大宗商品上。具體來說,MetalSignals是一個全球范圍的戶外金屬儲存調查,調查對象包括金屬冶煉廠、熔毀精礦的地方,以及港口和碼頭等儲存和運輸賤金屬、鋼鐵、煤炭和鐵礦石的地方,當然還有礦山本身。

我們仍在做零售業數據。但我們將在今年年底以其他方式重新推出它。隨著更多衛星的可用,我們現在能夠以客戶需要CRE的頻率和准確性,提供全球范圍內的零售和商業地產類數據。

MetalSignal是一款什麼樣的產品?

MetalSignals是一個平台、一款應用也是一個數據流,可以提供以衛星影像為基礎的數據、趨勢以及根據每天、每周和每月度增長金屬精礦和成品儲存提供全球鋁、銅、鋅、鋼產量的分析。這些精礦通常都是在幾百個人冶煉廠和儲存的,這些設施主要國家包塊中國、智利、俄羅斯、美國、澳大利亞等等。

MetalSignals不僅預測金屬本身的期貨價格和庫存,而且對100多種股票、貨幣和利率的價格也具有很強的預測能力。例如,銅通常被稱為「金屬之王」。眾所周知與經濟關系密切。因此,我們的銅信號——在全球冶煉廠和倉庫測量銅的數據——預測了歐元、英鎊、澳元和日元的價格,5年期和10年期美國國債的利率以及諸如嘉能可(Glencore)、美國鋁業(Alcoa)、COPX等數百種股票和指數的表現。

許多MetalSignals客戶是對沖基金和宏觀/外匯公司,以及金屬行業的的交易商。但也有一些公司,你甚至不會想到它們會與金屬行業有關,如一些消費品公司正在與我們合作,為他們的鋁罐和其他產品包裝進行了鋁金屬的對沖。這樣做是因為他們可以觀察到世界上有多少鋁在生產,並預測價格,找出它們的去向。在RS Metrics,雖然我們仍然為許多金融機構提供服務,但我們也擁有廣泛的企業客戶。我們還與彭博企業數據(Bloomberg Enterprise Data)、CME數據胺(CME Datamine)和Quandl/納斯達克(Quandl/Nasdaq)建立了良好的分銷合作關系,為全球用戶提供訪問我們產品的渠道。

獲得的金屬信號有多准確?

我們覆蓋了全球約500個地點,並且范圍還在不斷擴大。我們測量了這些地點的金屬成品、精礦和車輛的數量……比如阿布扎比的Al Taweelah冶煉廠或智利的Escondida。為了確保99%的准確率,我們會有人工控制工作流保證質量,他們可以糾正人工智能/機器學習中的錯誤。我們對預先測量的圖像進行檢查和糾正,然後為系統提供訓練和反饋。

我們從圖像中提取的數據聚合成一個指數,對倫敦金屬交易所(LME)、芝加哥商品交易所(CME)和上海期貨交易所(SHFE)等交易所的庫存和期貨價格具有高度預測性。大約70%到80%的定向准確預測價格和一個月,兩個月和三個月內的庫存變化。

這就有點像冰山。冰山的頂部露出水面,你能看到的只是冰山一角,這就是目前LME、CME、以及上海交易所等交易所的情況。這些都是有擔保的合同,但是水下的一切都沒有人知道。我們可以觀察到從來沒有人報道過的俄羅斯一家冶煉廠的鋁,並且在上市前三個月觀察到在中國銅冶煉廠和存儲設施。盡管這讓人震驚,但是我們數據的效果就是如此之好

人工智能是如何賦能這項業務?會存在哪些局限?


人工智能/機器學習的功能強大,但仍不成熟,對我們來說,它確實是一種達到目的的手段。它確實幫助我們完成了大部分工作,但它仍然需要人類的互動才能達到99%的准確率。

多年來,RS Metrics將計算機視覺和機器學習與嚴格的采樣技術相結合,來訓練底層的機器學習模型,這些模型為MetalSignal提供動力,並大規模生成高質量的數據。該平台是我們獨有的,並擁有相關專利,其中包括一個縮放的QC工作流程,以產生高質量、有預測的和並且可供消費的信息。

「如果有人告訴你,他們可以用人工智能100%精確地獲取衛星圖像,他們就會給你看一張有關沃爾瑪(Walmart)的照片,照片上每輛汽車都閃耀著光芒。」

但在大多數情況下,特別是冶煉廠,霧很大,地上有樹、水坑和雪。當我們看到中國,一些城市有霧霾,冶煉廠一開始就很髒,你真的必須讓人參與到工作流程中來。

隨著更多的衛星圖像數據可用,它將像消防水管一樣噴向我們,我們需要電腦來幫助規模化處理,同時它必須是准確的。

所以這對整個行業的每個人來說都是一個挑戰。你不會聽到很多人談論它,因為幾乎每個人,就像我說的,在這個空間裡都來自像素世界,他們的整個聲譽都建立於此。但事實上還有很長的路要走。但未來是非常光明的。

你所接觸的金融機構,它們是否能迅速接受這種形式的另類數據?

一張圖片所能傳達的信息勝過千言萬語,這是千真萬確的。地理空間分析是基於事實的,人們喜歡它。它把風險和「意見」帶出了情境。在很多情況下,僅僅看圖片就能回答某些問題,但在大多數情況下,所有客戶需要做的就是看數據和從圖片中發出的信號。圖片簡潔、易於理解和使用。我們並不是僅僅說「這是原始數據。接下來祝你好運!」這些數據可以通過易於使用的終端用戶應用程序、警報、信號和工具獲得,也可以作為客戶的日常數據提要,為客戶提供定量關注和功能。

以MetalSignal為例。客戶需要進行運行演示預測模型的所有內容都在一個壓縮文件中。我們提供白皮書,也提供了完整的代碼;我們從市場和衛星圖像中獲取信息,然後運行一個KNN,這是一個最近鄰的算法或預測模型,輸出所有金屬類型提前一個月到三個月的方向預測。RS指標通過結合人工智能和人類監督的最佳功能,目前達到70-90%的准確率。即使在今天,我們也是唯一一家能夠大規模生產這種數據的公司。

我們已經走了這麼遠,因為即使是擁有數據科學家的公司,他們也沒有太多的時間和資源來測試和解釋數據。這就是為什麼我們不只是制作數據,而是將贏利點和洞察力直接送到他們眼前。

RS指標一直由那些出身商界和投資界的人來管理。在這個空間裡,任何你和別人談論衛星圖像或地理空間數據的人,幾乎所有的人,他們的專業領域都是關於圖像處理的,都是關於像素的。例如,如何使用人工智能檢測飛機。根據我們的經驗,這可能是問題的10%。沒有人能用這些信息做任何事。你需要把它放在具體環境中,或者一個可以與自身進行比較的指數中,這個指數可以產生洞察力或預測信號。

這就是人們在行業中使用它的方式。必須有一個基准線,並能夠根據基准線做出反應。因此,從衛星圖像中生成原始數據,使其准確,然後將其應用於被證明可以生成贏利點的模型之間,有很多步驟。

對於希望采用這些另類數據的企業,您有什麼建議嗎?

我推薦閱讀Geoffrey A. Moore 《跨越鴻溝》(Crossing the gap)一書,該書闡述了新技術的早期采用者(空想家)和早期大多數人(實用主義者)之間的差距,並提出了成功跨越「鴻溝」的方法。

根據我的觀察,美國最大的投資者和公司,它們應用這種另類數據的速度仍然很慢。但最近,隨著彭博(Bloomberg)、芝加哥商業交易所(CME)、納斯達克(NASDAQ)、Quandl、Factset和IHS等公司紛紛大舉進軍,所有這些公司都在建設另類數據中心。隨著衛星圖像的進步或總體技術的進步,隨著行業進入壁壘的降低,技術采用的必然性越來越高。所以當我們和大機構談論我們所做的事情時,每個人都明白這就是未來。它會來的,如果他們不使用它,其他人會。

十年來,我與這些世界上最聰明的人開展合作,我明白了一個事情,那就是如果要使用或測試這些另類數據,無論是衛星圖像或信用卡數據或銷售點數據,又或是輿情數據,你必須離開現有的局面。

我想舉一個零售數據的例子。有時有人會打電話給我們說,「我有一個模型,它試圖預測50家零售連鎖店的確切收入數字,精確到一美元。我能用你的數據使我的模型更精確嗎?」答案是否定的。也許有辦法,但我們還沒試過,因為這不是使用它的方法。

使用零售數據的方法是查看隨著這些位置的交通變化生成的信號。當一個信號產生,它就預示著很可能會出現收入差或失誤。你可以用這些信號做很多事情,但本質上這就是你如何使用它。這並不一定會使你當前的模型更精確1%。大多數情況下,這是一個獨立的信息流。這就像研究的馬賽克。它是一個輸入,用來與你所看到的一切進行比較。

這是給任何想要使用這種另類數據的人一條建議,把它看作是一個單獨的流,注入到你的整體研究中。這並不一定會使你現有的數字更准確,但它會使你的整個過程風險更小,並給你更多的想法。

隨著進入壁壘的降低,RS Metrics 如何在市場上保持競爭力?

沒有哪個行業是安全的,不受競爭、進化或任何進步的影響。你必須繼續前進。但是對我們來說,我們已經有了領先的優勢。這已經夠難的了,因為要每天監控全球成千上萬的地點。如果這家店搬到街對面,或者這家店關門了,或者這家冶煉廠開張了,或者這家公司買下了這個倉庫。所有這一切都很難在日常生活中跟上前進的步伐。試圖對我們的產品進行逆向工程,回到過去,找出世界上發生了什麼(為了提供基線,您必須這樣做),這幾乎是不可能的。

任何從今天開始的人,都要經過多年的努力才能接近我們正在做的事情。

最重要的是,我們為客戶提供全方位的地理空間分析,從提取和管理圖像、計數和測量數據,到生成Alpha的模型和預測。我們甚至不僅開發研究產品,還開發ETF等金融產品。通過我們的零售業與金屬相關數據,我們已經開始與指數提供商合作。我們希望為追蹤實體零售或金屬及其它衍生品的ETF提供「內部英特爾」(Intel Inside)指數。

因此,在未來,我們將進一步擴大價值鏈,為我們的客戶提供更多的價值。從競爭的角度來看,可供選擇的數據和衛星圖像一般都有很多機會。這裡有零售、農業、能源和大宗商品,我相信,要想讓它變得太有競爭力、太商品化,還需要很長一段時間。