MioTalk x Seth Huang: AI 颠覆投资行业的五大方式

在这篇采访中,妙盈科技与香港科技大学金融学副教授 Seth Huang共同探讨了目前人工智能领域中的不同学习模型,它们的优势、缺陷等,并对颠覆投资行业的前瞻技术进行了预测。

Seth Huang, 香港科技大学金融学副教授 2018-10-30
AI人工智能科技

Seth Huang教授不仅是AI领域的研究者,同时也是一位计算金融应用领域的投资人。在金融建模领域中,黄教授开发的机器学习算法应用以及模式认证已有多年的成功经验,并致力于投资量化交易基金以及研究人才领域。

以下内容仅代表采访者本人观点

增强数据分析性能

人工智能并不是一把万能钥匙,人工智能是一座“军械库”。目前,人工智能科学家已经使用了一系列的深度学习模型,涵盖了十大子领域,例如自然语言处理、视觉识别、机器自我学习以及各种技术的组合。总体来说,人工智能以数据驱动、以内容驱动、以人才驱动。

"人工智能并不是一把万能钥匙,人工智能是一座“军械库”。"

对于计算机视觉领域来说,物体检测系统、面部识别系统是基础,在此基础上使用先进的视觉识别神经网络,如残差网络技术进行进一步的识别设计。该项技术可以应用于监测交通事故、油罐车、停车场车辆计数等领域。

先进的视觉识别神经网络系统可以监控建筑工地不同的车辆进出情况

先进的视觉识别神经网络系统可以监控建筑工地不同的车辆进出情况

两方面让这种先进的技术更为强大。首先,深度神经网络所包含的信息量是传统模型的10倍甚至1000倍。多元回归法或多因子投资策略通常会应用10个或至多100个因子。而在深度学习,构建一个市场模型可应用约10000个因子,将上市公司数据、多语言、新闻以及照片等多类型数据相结合,在不同的序列中包含多种数据类型,并在单个神经网络模型涵盖所有数据类型。 AI可以处理的数据量大大超过了传统投资模式,从而可以进行更好的评估。

像素越高,照片越清晰。投资模型相似,数据集越大,评估结果越好。

像素越高,照片越清晰。投资模型相似,数据集越大,评估结果越好。

其次,深度学习的“抽象层次”要高得多。在金融数据分析领域,信息可能即时反映在价格上,也可能是嘈杂的无用数据。在这种情况下,高抽象级别就更为重要。在我的研究中,最先进的一种方法是将知识图谱与新闻舆情相结合。人们可以研究相互关联的各类主体,并将大量的信息扩展到金融模型中。

强化学习也是近期热门应用领域。深度强化学习也是AlphaGo的核心。所谓强化学习,指的是机器进行自我学习,并通过各种行为来优化特定的任务,达到如降低成本、提高网站粘度等特定目标。Google将此项技术应用于管理服务器的用电量,并实现了超过30%的成本削减。不过,该模型的稳定程度相当低,应用时需特别小心,但通过“集成网络”的技术可以解决这一问题。最后,深度强化学习与LSTM技术相结合可以优化交易执行,这比价格预测要简单的多。

降低投资组合风险

通过预测”半平稳过程”(Semi-stationary process),人工智能可以获得更高的夏普比率。在金融中,我们通常要考量收益、风险以及全球关联性。收益通常是不稳定的,这意味着过去的模型包含了多种嘈杂数据,并不能很好的预测未来。波动与关联性相对更容易预测,而当你可以控制风险,就可以运用杠杆来管理收益率。

"通过预测”半平稳过程”(Semi-stationary process),人工智能可以获得更高的夏普比率。"

降低投资组合风险的方法有多种,但对金融产品风险与关联性进行更好的预估以及对冲是两种相对更好的方法。这很大程度上取决于投资理论及再平衡时机。我已在该领域申请了专利。由于计算成本过高,很难准确预估相关性。第二种方法是使用购买对冲产品来抵消风险,如卖出看涨期权、买入看跌期权或做空股指期货等。但期权通常十分昂贵,在市场波动时则更贵。而更好的办法是,要么使用更具创意的产品,如购买信用违约掉期,要么购买固定收益产品来以抵消对冲费用。

降低运营成本

90%的人工智能应用使用在降低运营成本方面。这听起来不那么”性感“,但却是人工智能被广泛采用的真正原因。

对传统交易来说,卖方交易大厅在不久的将来就会消失。交易的执行和传统的交易-客户关系将首先会被人工智能驱动的交易系统取代。Steve Cohen和都铎投资都在开发可以代替交易员的算法。这将削减每年数千万美元的成本。降低10%的成本通常意味着可以提高30%的利润率。实际上,在深度学习领域,诸如深度强化学习方法就可以优化交易的执行,这将最大程度降低客户的交易成本。

对于投行来说,设立股票研究部门是一项庞大但却必要的成本支出,它是传统意义上关键客户服务的重要组成部分。我个人比较守旧,确实相信基本面研究的价值所在,诸如管理层访问以及现场尽职调查等。

但在目前,研究部门要覆盖更广泛的领域,这意味分析师需要研究的公司数量更多,甚至要进行跨行业研究,因此他们无法深入研究公司,也就无法使用公开指标、盈利预测、管理层公告等信息。这就是为什么过去15-20年间羊群效应更显著——大多数分析师给出的评级、价格区间都非常相似。当人们使用相同的模型分析相似的数据,他们就会得出相似的结论。

公开数据引发分析师的从众心理

公开数据引发分析师的从众心理。

腾讯自2018年年初以来的表现就是一个很好的例子。虽然腾讯的股价在此期间下跌超过40%,但80%-90%分析师对腾讯的评级仍为买入/强烈买入。对于“中国限制新的手机游戏许可证发放”这一新的主题,人工智能仍旧很难理解并建立相应模型。同时,卖方股票研究领域仍存在系统性激励挑战,这也限制了分析师正确评估公司业绩。但我相信,人工智能可以与经验丰富的分析师合作,改进这些问题。

新闻舆情分析

成功的人工智能背后必然会有优秀的人类创造者的支持,因为人工智能的核心终究反映的是人类的创造力。所谓”奇点“,则是我们创造了一台比人类聪明的机器,机器在没有人类干扰的情况下变得更聪明,但目前我们并不能实现。因此,我们不禁要问,对于新闻舆情分析系统,建立它的目的是什么?我们可以如何使用它?

"成功的人工智能背后必然会有优秀的人类创造者的支持,因为人工智能的核心终究反映的是人类的创造力。"

建立人工智能系统就像打造一辆F1赛车。法拉利跑的比人类快,但是它并不是自己领悟这两技能的。这说明,人工智能驱动下的舆情分析系统仍旧依赖人类本身,它依赖于人的经验,也依赖于人们犯的错误。错误反而更有价值,因为目前,人工智能的进步完全依赖于创造新的工具来修复过去模型训练中犯下的错误与问题。

舆情分析领域中,最新技术趋势是关系映射,我认为妙盈科技正是这方面的专家。在机器学习中,它被称为”知识图谱“。这类似于创造行业的家族图谱。为对象与实体创建联系,这也是近几年最大的技术进步之一。

你可以在同一篇新闻中提取实体,如“苹果”与“iPhone”,并识别它们之间的关系。但在目前,最好的知识图谱仍是由人类自己创造的。

接下来我们要问,我们应该如何使用它?我认为,追踪相关实体的全球舆情是非常实用的工具。追踪所有的太阳能电池公司,当正面/负面舆情出现时,你就能看到不同公司的受影响程度。也许,有些延迟性的影响(比如美国晚上6点的新闻并没有对亚洲早上9点的市场产生影响)就创造了新的投资机会。

知识图谱可以更好的解释市场、公司、金融工具以及个人之间的关联性

知识图谱可以更好的解释市场、公司、金融工具以及个人之间的关联性

除了知识图谱外,我认为对大多数金融机构或是资产管理公司来说,人工智能的真正价值在于其实际应用价值,以及能否复制并自动化这些最佳交易员的决策。

一位专业交易员的经验十分有价值,他的经验可能来自收益曲线、波动面、市场波动以及来自彭博终端机获取的信息。真正成功的交易员需要花费多年的时间学习其中的知识及其中的逻辑。由于金融产品的本质是对群体行为的研究,因此了解交易员的想法,并量化其中的思考过程就尤为重要。反之则不然。

我认为,人工智能的真正价值在于充分的整合、专家的训练,以及最终的执行。初代AlphaGo由一位欧洲的围棋冠军训练。如今,人工智能的缺陷之一仅仅是单纯应用先进的技术以及大量的数据数据。而所有非线性建模技术都属于曲线拟合的范畴。曲线拟合是一种相关性检测,而不是因果检测。举一个最简单的例子,你在晚上6点看到一群走向地铁站的人,并不意味着他们之间存在关系并且要去同一个地方。将相关性等同于实际的统计关系,或者更糟的因果关系,是一个十分严重的错误。

"所有非线性建模技术都属于曲线拟合的范畴。"

传统经验告诉我们,数据的嘈杂度越高(例如金融行业会达到90-95%),就越要更多地考虑数据之间的逻辑和因果关系。数据嘈杂度越高,人类专业度体现越强。建模并不是为了检验关系,而是要了解如何剔除模型中不相关的关系。

最优投资组合的构建

金融业中,基于我对全球投资银行以及资产管理公司的了解,我认为人工智能驱动的风险溢价会上升。

"人工智能驱动的风险溢价会上升。"

Alpha收益持续走低、收费趋势接近于零,资产管理行业将经历一场重大整合。当一家公司管理着数十亿美元,不可避免的将会集中在风险溢价上。对于市场时机和主题的讨论有很多,但归根结底,我们想要知道的是能否在更低的风险或下行控制中获取更高的市场回报。

首先,舆情与回报可能存在时间差。一个完整的投资周期通常需要几个小时、几天甚至几个月。

其次,舆情分析系统的准确度在60%-65%之间,这对于对冲基金来说已经足够强大。但作为一款产品,35%-40%的错误率可能会招致恶意攻击,更不用说客户并不能正确的使用舆情分析。

第三方数据分析公司面临的一个难题是,它无法控制客户能否正确使用工具,或是该工具是否真正有所帮助。例如,绘制关系图、创建知识图谱并监控新闻相对简单,但是却无法准确了解信息是否已经反映在价格上。分析师并不能控制交易员如何使用这些信息,分析系统也并不了解它是否能获得收益。

利用人工智能创建投资组合已经有了一些最佳实践成果。我仍旧相信,由人类领导的数据科学团队和一个交易团队合作模式是最佳的。投资组合构建的过程中他们必须不断沟通,人工智能团队必须深入参与其中,以确保人工智能算法的真正价值得以实现。

以上内容仅代表采访者本人观点