卫星大数据应用成下一个风口,另类数据如何切入主流市场

在本篇文章中,我们采访了RS Metrics公司的创始人兼CEO Tom Diamond,讨论了目前的热门话题——卫星图像数据应用的崛起以及地理分析的前景,并研究了其商业价值以及投资价值。

Tom Diamond, RS Metrics公司创始人兼CEO2019-04-04

RS Metrics这家公司是如何创立的?

在2010年创建RS Metrics之前,我在一家名为Stax Inc.的管理咨询公司工作,曾与Prudential,H&R Block以及American Express等公司合作,主要工作是对客户或商家进行定量调查和分析(曾经的客户包括从达美航空、百思买到便利店到加油站等),以支持企业战略和增长。我还与私募股权公司和对冲基金合作,对他们感兴趣或已投资的市场或公司进行尽职调查。

这一切都始于一家寻求投资的私募股权公司,希望获得投资标的海外业务的数据,但却无法对过去几年中该地点的运营情况进行尽职调查。我的兄弟Alex当时正在与一家卫星公司Digital Globe合作,他能够获得该工厂的一些图像,证明它已按照应有的方式运行。当客户看到图像的时间序列,并看到卡车和员工车辆情况时,他立即从地板上拉了20个人。每个人都头晕目眩,大笑着鼓掌,因为他们可以毫无疑问地看到离岸地点发生的事情。正是在那一刻,所以我在那一刻意识到那里有一些东西。

如今,RS Metrics是一家面向企业和投资者提供卫星图像数据和地理空间分析公司。利用先进的计算机视觉和机器学习,我们从各种基于位置的资源中提取富有洞察力的即用型数据,为金融服务,房地产,零售,工业,金属,政府和学术研究决策提供预测分析,信号,警报和最终用户应用程序。

在刚成立公司的时候,卫星图像研究是怎样的?

刚开始的时候,所有的东西几乎都是100%人工制作的。早在2010年,大规模使用卫星图像进行地理空间分析还处于早期阶段,这意味着我们必须与卫星公司一起研究如何向我们交付批量订单。空中客车(Airbus)和数字地球(DigitalGlobe)都从未这样做过。谷歌Earth和RS Metrics是数字地球(DigitalGlobe)最大的卫星图像消费者。不像今天,企业可以直接去DigitalGlobe,注册他们的GBDX平台,然后开始提取成批的图像。在当时,我们必须自己建造它。

当我在Stax工作的时候,我已经和H&R Block这样的大型零售商合作过了。所以我对零售很在行,我知道对冲基金对零售业很感兴趣,而且零售业方面有足够的卫星图像。所以我们决定从零售开始,涵盖并测试了沃尔玛,家得宝,劳氏和麦当劳等公司。我们提取了上千张商店的图片,我们使用非常老式的计数方法来测量来进行我们最初的测试。我们看到的是它们之间存在关联,即停车场的汽车数量确实与整个连锁店的收入有关。

当时卫星运行的数量较少,所以大型零售连锁店的样本规模相对较小,但仍足以进行定量分析。现在有更多的卫星在运行,这使得样本量更大,结果更细粒度和更准确。

在你的创业过程中,什么时候最具挑战性,迫使你重新思考业务?

在2015-16年卫星发射数量没有实现的时候,我们面临了业务上的转变。虽然我们有大型量化公司和像Lowe 's、Target、Kroger这样的大客户,但当手机和GPS数据开始出现,从卫星数据中吸引注意力时,我们面临了激烈的竞争。当然,现在有更多的卫星和更多的数据可以用来测量零售交通趋势,隐私法正在限制从手机/GPS获取个人数据,所以事情变得更加现实,卫星数据再次成为零售业的焦点。但那时候,人们才开始意识到手机数据的颗粒度有多大。尽管它只捕获了一个地点的一小部分客户,但它每分钟都在收集信息。而我们的数据只在每个地点每隔几天收集一次。

所以我们真的需要更多的卫星图像来增加样本大小,使零售产品更强大。理想情况下,我们需要每天测量每家商店。但为了生存, 我们不得不增加其他不需要这种数字频率的产品。

所以我们决定把更多的精力放在大宗商品上。具体来说,MetalSignals是一个全球范围的户外金属储存调查,调查对象包括金属冶炼厂、熔毁精矿的地方,以及港口和码头等储存和运输贱金属、钢铁、煤炭和铁矿石的地方,当然还有矿山本身。

我们仍在做零售业数据。但我们将在今年年底以其他方式重新推出它。随着更多卫星的可用,我们现在能够以客户需要CRE的频率和准确性,提供全球范围内的零售和商业地产类数据。

MetalSignal是一款什么样的产品?

MetalSignals是一个平台、一款应用也是一个数据流,可以提供以卫星影像为基础的数据、趋势以及根据每天、每周和每月度增长金属精矿和成品储存提供全球铝、铜、锌、钢产量的分析。这些精矿通常都是在几百个人冶炼厂和储存的,这些设施主要国家包块中国、智利、俄罗斯、美国、澳大利亚等等。

MetalSignals不仅预测金属本身的期货价格和库存,而且对100多种股票、货币和利率的价格也具有很强的预测能力。例如,铜通常被称为“金属之王”。众所周知与经济关系密切。因此,我们的铜信号——在全球冶炼厂和仓库测量铜的数据——预测了欧元、英镑、澳元和日元的价格,5年期和10年期美国国债的利率以及诸如嘉能可(Glencore)、美国铝业(Alcoa)、COPX等数百种股票和指数的表现。

许多MetalSignals客户是对冲基金和宏观/外汇公司,以及金属行业的的交易商。但也有一些公司,你甚至不会想到它们会与金属行业有关,如一些消费品公司正在与我们合作,为他们的铝罐和其他产品包装进行了铝金属的对冲。这样做是因为他们可以观察到世界上有多少铝在生产,并预测价格,找出它们的去向。在RS Metrics,虽然我们仍然为许多金融机构提供服务,但我们也拥有广泛的企业客户。我们还与彭博企业数据(Bloomberg Enterprise Data)、CME数据胺(CME Datamine)和Quandl/纳斯达克(Quandl/Nasdaq)建立了良好的分销合作关系,为全球用户提供访问我们产品的渠道。

获得的金属信号有多准确?

我们覆盖了全球约500个地点,并且范围还在不断扩大。我们测量了这些地点的金属成品、精矿和车辆的数量……比如阿布扎比的Al Taweelah冶炼厂或智利的Escondida。为了确保99%的准确率,我们会有人工控制工作流保证质量,他们可以纠正人工智能/机器学习中的错误。我们对预先测量的图像进行检查和纠正,然后为系统提供训练和反馈。

我们从图像中提取的数据聚合成一个指数,对伦敦金属交易所(LME)、芝加哥商品交易所(CME)和上海期货交易所(SHFE)等交易所的库存和期货价格具有高度预测性。大约70%到80%的定向准确预测价格和一个月,两个月和三个月内的库存变化。

这就有点像冰山。冰山的顶部露出水面,你能看到的只是冰山一角,这就是目前LME、CME、以及上海交易所等交易所的情况。这些都是有担保的合同,但是水下的一切都没有人知道。我们可以观察到从来没有人报道过的俄罗斯一家冶炼厂的铝,并且在上市前三个月观察到在中国铜冶炼厂和存储设施。尽管这让人震惊,但是我们数据的效果就是如此之好

人工智能是如何赋能这项业务?会存在哪些局限?


人工智能/机器学习的功能强大,但仍不成熟,对我们来说,它确实是一种达到目的的手段。它确实帮助我们完成了大部分工作,但它仍然需要人类的互动才能达到99%的准确率。

多年来,RS Metrics将计算机视觉和机器学习与严格的采样技术相结合,来训练底层的机器学习模型,这些模型为MetalSignal提供动力,并大规模生成高质量的数据。该平台是我们独有的,并拥有相关专利,其中包括一个缩放的QC工作流程,以产生高质量、有预测的和并且可供消费的信息。

“如果有人告诉你,他们可以用人工智能100%精确地获取卫星图像,他们就会给你看一张有关沃尔玛(Walmart)的照片,照片上每辆汽车都闪耀着光芒。”

但在大多数情况下,特别是冶炼厂,雾很大,地上有树、水坑和雪。当我们看到中国,一些城市有雾霾,冶炼厂一开始就很脏,你真的必须让人参与到工作流程中来。

随着更多的卫星图像数据可用,它将像消防水管一样喷向我们,我们需要电脑来帮助规模化处理,同时它必须是准确的。

所以这对整个行业的每个人来说都是一个挑战。你不会听到很多人谈论它,因为几乎每个人,就像我说的,在这个空间里都来自像素世界,他们的整个声誉都建立于此。但事实上还有很长的路要走。但未来是非常光明的。

你所接触的金融机构,它们是否能迅速接受这种形式的另类数据?

一张图片所能传达的信息胜过千言万语,这是千真万确的。地理空间分析是基于事实的,人们喜欢它。它把风险和“意见”带出了情境。在很多情况下,仅仅看图片就能回答某些问题,但在大多数情况下,所有客户需要做的就是看数据和从图片中发出的信号。图片简洁、易于理解和使用。我们并不是仅仅说“这是原始数据。接下来祝你好运!”这些数据可以通过易于使用的终端用户应用程序、警报、信号和工具获得,也可以作为客户的日常数据提要,为客户提供定量关注和功能。

以MetalSignal为例。客户需要进行运行演示预测模型的所有内容都在一个压缩文件中。我们提供白皮书,也提供了完整的代码;我们从市场和卫星图像中获取信息,然后运行一个KNN,这是一个最近邻的算法或预测模型,输出所有金属类型提前一个月到三个月的方向预测。RS指标通过结合人工智能和人类监督的最佳功能,目前达到70-90%的准确率。即使在今天,我们也是唯一一家能够大规模生产这种数据的公司。

我们已经走了这么远,因为即使是拥有数据科学家的公司,他们也没有太多的时间和资源来测试和解释数据。这就是为什么我们不只是制作数据,而是将赢利点和洞察力直接送到他们眼前。

RS指标一直由那些出身商界和投资界的人来管理。在这个空间里,任何你和别人谈论卫星图像或地理空间数据的人,几乎所有的人,他们的专业领域都是关于图像处理的,都是关于像素的。例如,如何使用人工智能检测飞机。根据我们的经验,这可能是问题的10%。没有人能用这些信息做任何事。你需要把它放在具体环境中,或者一个可以与自身进行比较的指数中,这个指数可以产生洞察力或预测信号。

这就是人们在行业中使用它的方式。必须有一个基准线,并能够根据基准线做出反应。因此,从卫星图像中生成原始数据,使其准确,然后将其应用于被证明可以生成赢利点的模型之间,有很多步骤。

对于希望采用这些另类数据的企业,您有什么建议吗?

我推荐阅读Geoffrey A. Moore 《跨越鸿沟》(Crossing the gap)一书,该书阐述了新技术的早期采用者(空想家)和早期大多数人(实用主义者)之间的差距,并提出了成功跨越“鸿沟”的方法。

根据我的观察,美国最大的投资者和公司,它们应用这种另类数据的速度仍然很慢。但最近,随着彭博(Bloomberg)、芝加哥商业交易所(CME)、纳斯达克(NASDAQ)、Quandl、Factset和IHS等公司纷纷大举进军,所有这些公司都在建设另类数据中心。随着卫星图像的进步或总体技术的进步,随着行业进入壁垒的降低,技术采用的必然性越来越高。所以当我们和大机构谈论我们所做的事情时,每个人都明白这就是未来。它会来的,如果他们不使用它,其他人会。

十年来,我与这些世界上最聪明的人开展合作,我明白了一个事情,那就是如果要使用或测试这些另类数据,无论是卫星图像或信用卡数据或销售点数据,又或是舆情数据,你必须离开现有的局面。

我想举一个零售数据的例子。有时有人会打电话给我们说,“我有一个模型,它试图预测50家零售连锁店的确切收入数字,精确到一美元。我能用你的数据使我的模型更精确吗?”答案是否定的。也许有办法,但我们还没试过,因为这不是使用它的方法。

使用零售数据的方法是查看随着这些位置的交通变化生成的信号。当一个信号产生,它就预示着很可能会出现收入差或失误。你可以用这些信号做很多事情,但本质上这就是你如何使用它。这并不一定会使你当前的模型更精确1%。大多数情况下,这是一个独立的信息流。这就像研究的马赛克。它是一个输入,用来与你所看到的一切进行比较。

这是给任何想要使用这种另类数据的人一条建议,把它看作是一个单独的流,注入到你的整体研究中。这并不一定会使你现有的数字更准确,但它会使你的整个过程风险更小,并给你更多的想法。

随着进入壁垒的降低,RS Metrics 如何在市场上保持竞争力?

没有哪个行业是安全的,不受竞争、进化或任何进步的影响。你必须继续前进。但是对我们来说,我们已经有了领先的优势。这已经够难的了,因为要每天监控全球成千上万的地点。如果这家店搬到街对面,或者这家店关门了,或者这家冶炼厂开张了,或者这家公司买下了这个仓库。所有这一切都很难在日常生活中跟上前进的步伐。试图对我们的产品进行逆向工程,回到过去,找出世界上发生了什么(为了提供基线,您必须这样做),这几乎是不可能的。

任何从今天开始的人,都要经过多年的努力才能接近我们正在做的事情。

最重要的是,我们为客户提供全方位的地理空间分析,从提取和管理图像、计数和测量数据,到生成Alpha的模型和预测。我们甚至不仅开发研究产品,还开发ETF等金融产品。通过我们的零售业与金属相关数据,我们已经开始与指数提供商合作。我们希望为追踪实体零售或金属及其它衍生品的ETF提供“内部英特尔”(Intel Inside)指数。

因此,在未来,我们将进一步扩大价值链,为我们的客户提供更多的价值。从竞争的角度来看,可供选择的数据和卫星图像一般都有很多机会。这里有零售、农业、能源和大宗商品,我相信,要想让它变得太有竞争力、太商品化,还需要很长一段时间。