MioTalk x Seth Huang: AI 顛覆投資行業的五大方式

在這篇采訪中,妙盈科技與香港科技大學金融學副教授 Seth Huang共同探討了目前人工智能領域中的不同學習模型,它們的優勢、缺陷等,並對顛覆投資行業的前瞻技術進行了預測。

Seth Huang, 香港科技大學金融學副教授 2018-10-30

Seth Huang教授不僅是AI領域的研究者,同時也是一位計算金融應用領域的投資人。在金融建模領域中,黃教授開發的機器學習算法應用以及模式認證已有多年的成功經驗,並致力於投資量化交易基金以及研究人才領域。

以下內容僅代表采訪者本人觀點

增強數據分析性能

人工智能並不是一把萬能鑰匙,人工智能是一座「軍械庫」。目前,人工智能科學家已經使用了一系列的深度學習模型,涵蓋了十大子領域,例如自然語言處理、視覺識別、機器自我學習以及各種技術的組合。總體來說,人工智能以數據驅動、以內容驅動、以人才驅動。

"人工智能並不是一把萬能鑰匙,人工智能是一座「軍械庫」。"

對於計算機視覺領域來說,物體檢測系統、面部識別系統是基礎,在此基礎上使用先進的視覺識別神經網絡,如殘差網絡技術進行進一步的識別設計。該項技術可以應用於監測交通事故、油罐車、停車場車輛計數等領域。

先進的視覺識別神經網絡系統可以監控建築工地不同的車輛進出情況

先進的視覺識別神經網絡系統可以監控建築工地不同的車輛進出情況。

兩方面讓這種先進的技術更為強大。首先,深度神經網絡所包含的信息量是傳統模型的10倍甚至1000倍。多元回歸法或多因子投資策略通常會應用10個或至多100個因子。而在深度學習,構建一個市場模型可應用約10000個因子,將上市公司數據、多語言、新聞以及照片等多類型數據相結合,在不同的序列中包含多種數據類型,並在單個神經網絡模型涵蓋所有數據類型。 AI可以處理的數據量大大超過了傳統投資模式,從而可以進行更好的評估。

像素越高,照片越清晰。投資模型相似,數據集越大,評估結果越好

像素越高,照片越清晰。投資模型相似,數據集越大,評估結果越好。

其次,深度學習的「抽象層次」要高得多。在金融數據分析領域,信息可能即時反映在價格上,也可能是嘈雜的無用數據。在這種情況下,高抽象級別就更為重要。在我的研究中,最先進的一種方法是將知識圖譜與新聞輿情相結合。人們可以研究相互關聯的各類主體,並將大量的信息擴展到金融模型中。

強化學習也是近期熱門應用領域。深度強化學習也是AlphaGo的核心。所謂強化學習,指的是機器進行自我學習,並通過各種行為來優化特定的任務,達到如降低成本、提高網站粘度等特定目標。Google將此項技術應用於管理服務器的用電量,並實現了超過30%的成本削減。不過,該模型的穩定程度相當低,應用時需特別小心,但通過「集成網絡」的技術可以解決這一問題。最後,深度強化學習與LSTM技術相結合可以優化交易執行,這比價格預測要簡單的多。

降低投資組合風險

通過預測」半平穩過程」(Semi-stationary process),人工智能可以獲得更高的夏普比率。在金融中,我們通常要考量收益、風險以及全球關聯性。收益通常是不穩定的,這意味著過去的模型包含了多種嘈雜數據,並不能很好的預測未來。波動與關聯性相對更容易預測,而當你可以控制風險,就可以運用槓桿來管理收益率。

"通過預測」半平穩過程」(Semi-stationary process),人工智能可以獲得更高的夏普比率。"

降低投資組合風險的方法有多種,但對金融產品風險與關聯性進行更好的預估以及對沖是兩種相對更好的方法。這很大程度上取決於投資理論及再平衡時機。我已在該領域申請了專利。由於計算成本過高,很難准確預估相關性。第二種方法是使用購買對沖產品來抵消風險,如賣出看漲期權、買入看跌期權或做空股指期貨等。但期權通常十分昂貴,在市場波動時則更貴。而更好的辦法是,要麼使用更具創意的產品,如購買信用違約掉期,要麼購買固定收益產品來以抵消對沖費用。

降低運營成本

90%的人工智能應用使用在降低運營成本方面。這聽起來不那麼」性感「,但卻是人工智能被廣泛采用的真正原因。

對傳統交易來說,賣方交易大廳在不久的將來就會消失。交易的執行和傳統的交易-客戶關系將首先會被人工智能驅動的交易系統取代。Steve Cohen和都鐸投資都在開發可以代替交易員的算法。這將削減每年數千萬美元的成本。降低10%的成本通常意味著可以提高30%的利潤率。實際上,在深度學習領域,諸如深度強化學習方法就可以優化交易的執行,這將最大程度降低客戶的交易成本。

對於投行來說,設立股票研究部門是一項龐大但卻必要的成本支出,它是傳統意義上關鍵客戶服務的重要組成部分。我個人比較守舊,確實相信基本面研究的價值所在,諸如管理層訪問以及現場盡職調查等。

但在目前,研究部門要覆蓋更廣泛的領域,這意味分析師需要研究的公司數量更多,甚至要進行跨行業研究,因此他們無法深入研究公司,也就無法使用公開指標、盈利預測、管理層公告等信息。這就是為什麼過去15-20年間羊群效應更顯著——大多數分析師給出的評級、價格區間都非常相似。當人們使用相同的模型分析相似的數據,他們就會得出相似的結論。

公開數據引發分析師的從眾心理

公開數據引發分析師的從眾心理。

騰訊自2018年年初以來的表現就是一個很好的例子。雖然騰訊的股價在此期間下跌超過40%,但80%-90%分析師對騰訊的評級仍為買入/強烈買入。對於「中國限制新的手機游戲許可證發放」這一新的主題,人工智能仍舊很難理解並建立相應模型。同時,賣方股票研究領域仍存在系統性激勵挑戰,這也限制了分析師正確評估公司業績。但我相信,人工智能可以與經驗豐富的分析師合作,改進這些問題。

新聞輿情分析

成功的人工智能背後必然會有優秀的人類創造者的支持,因為人工智能的核心終究反映的是人類的創造力。所謂」奇點「,則是我們創造了一台比人類聰明的機器,機器在沒有人類干擾的情況下變得更聰明,但目前我們並不能實現。因此,我們不禁要問,對於新聞輿情分析系統,建立它的目的是什麼?我們可以如何使用它?

"成功的人工智能背後必然會有優秀的人類創造者的支持,因為人工智能的核心終究反映的是人類的創造力。"

建立人工智能系統就像打造一輛F1賽車。法拉利跑的比人類快,但是它並不是自己領悟這兩技能的。這說明,人工智能驅動下的輿情分析系統仍舊依賴人類本身,它依賴於人的經驗,也依賴於人們犯的錯誤。錯誤反而更有價值,因為目前,人工智能的進步完全依賴於創造新的工具來修復過去模型訓練中犯下的錯誤與問題。

輿情分析領域中,最新技術趨勢是關系映射,我認為妙盈科技正是這方面的專家。在機器學習中,它被稱為」知識圖譜「。這類似於創造行業的家族圖譜。為對象與實體創建聯系,這也是近幾年最大的技術進步之一。

你可以在同一篇新聞中提取實體,如「蘋果」與「iPhone」,並識別它們之間的關系。但在目前,最好的知識圖譜仍是由人類自己創造的。

接下來我們要問,我們應該如何使用它?我認為,追蹤相關實體的全球輿情是非常實用的工具。追蹤所有的太陽能電池公司,當正面/負面輿情出現時,你就能看到不同公司的受影響程度。也許,有些延遲性的影響(比如美國晚上6點的新聞並沒有對亞洲早上9點的市場產生影響)就創造了新的投資機會。

知識圖譜可以更好的解釋市場、公司、金融工具以及個人之間的關聯性

知識圖譜可以更好的解釋市場、公司、金融工具以及個人之間的關聯性

除了知識圖譜外,我認為對大多數金融機構或是資產管理公司來說,人工智能的真正價值在於其實際應用價值,以及能否復制並自動化這些最佳交易員的決策。

一位專業交易員的經驗十分有價值,他的經驗可能來自收益曲線、波動面、市場波動以及來自彭博終端機獲取的信息。真正成功的交易員需要花費多年的時間學習其中的知識及其中的邏輯。由於金融產品的本質是對群體行為的研究,因此了解交易員的想法,並量化其中的思考過程就尤為重要。反之則不然。

我認為,人工智能的真正價值在於充分的整合、專家的訓練,以及最終的執行。初代AlphaGo由一位歐洲的圍棋冠軍訓練。如今,人工智能的缺陷之一僅僅是單純應用先進的技術以及大量的數據數據。而所有非線性建模技術都屬於曲線擬合的范疇。曲線擬合是一種相關性檢測,而不是因果檢測。舉一個最簡單的例子,你在晚上6點看到一群走向地鐵站的人,並不意味著他們之間存在關系並且要去同一個地方。將相關性等同於實際的統計關系,或者更糟的因果關系,是一個十分嚴重的錯誤。

"所有非線性建模技術都屬於曲線擬合的范疇。"

傳統經驗告訴我們,數據的嘈雜度越高(例如金融行業會達到90-95%),就越要更多地考慮數據之間的邏輯和因果關系。數據嘈雜度越高,人類專業度體現越強。建模並不是為了檢驗關系,而是要了解如何剔除模型中不相關的關系。

最優投資組合的構建

金融業中,基於我對全球投資銀行以及資產管理公司的了解,我認為人工智能驅動的風險溢價會上升。

"人工智能驅動的風險溢價會上升。"

Alpha收益持續走低、收費趨勢接近於零,資產管理行業將經歷一場重大整合。當一家公司管理著數十億美元,不可避免的將會集中在風險溢價上。對於市場時機和主題的討論有很多,但歸根結底,我們想要知道的是能否在更低的風險或下行控制中獲取更高的市場回報。

首先,輿情與回報可能存在時間差。一個完整的投資周期通常需要幾個小時、幾天甚至幾個月。

其次,輿情分析系統的准確度在60%-65%之間,這對於對沖基金來說已經足夠強大。但作為一款產品,35%-40%的錯誤率可能會招致惡意攻擊,更不用說客戶並不能正確的使用輿情分析。

第三方數據分析公司面臨的一個難題是,它無法控制客戶能否正確使用工具,或是該工具是否真正有所幫助。例如,繪制關系圖、創建知識圖譜並監控新聞相對簡單,但是卻無法准確了解信息是否已經反映在價格上。分析師並不能控制交易員如何使用這些信息,分析系統也並不了解它是否能獲得收益。

利用人工智能創建投資組合已經有了一些最佳實踐成果。我仍舊相信,由人類領導的數據科學團隊和一個交易團隊合作模式是最佳的。投資組合構建的過程中他們必須不斷溝通,人工智能團隊必須深入參與其中,以確保人工智能算法的真正價值得以實現。

以上內容僅代表采訪者本人觀點