技術的力量:如何利用機器學習預測企業並購重組

在本篇訪談中,妙盈科技邀請到了香港大學工商管理學士(國際商業及全球管理方向)課程主管Matthias Buehlmaier博士,就能否利用機器學習預測企業並購展開了討論。

Matthias Buehlmaier博士, 香港大學工商管理學士課程主管2018-12-19

在《金融媒體、價格發現與並購套利》這篇論文中,您主要想討論什麼問題?

並購(M&A)在企業融資領域扮演著重要角色,並被認為是一種有效的增長戰略。2017年,全球並購市場表現強勁,對外公布的交易額達到3.7萬億美元。並購活動對股東財富、公司價值和股票回報有重大影響。雖然大多數條款是在宣布之前就協商好的,但對外公布並不能保證最終收購成功。由於無法獲得股東、監管機構批准或缺乏充足資金等原因,收購都可能會失敗。金融媒體可以傳遞這些信息,但並購失敗的另一個原因可能是交易本身在媒體上的傳播。由於在並購公告之後會有大量文章發表,因此我們可以在媒體上找到蛛絲馬跡來預測最終交易是否能夠完成。

我的論文希望驗證一個理論,即解釋媒體是如何預測收購公告後的最終結果。由於前瞻性偏見,該項研究沒有包含並購公告之前的新聞內容。此外,從金融角度來看,信息是不可交易的。最終研究表明,對於收購者的正面報道預示著最終交易的成功。

 

為什麼決定進行這項研究?其重要性體現在哪?

長期以來,我對媒體在金融領域所扮演的角色很感興趣。這對我來說很重要,金融行業數據豐富。你可以用CRSP查股票價格,用Compustat查會計相關數據。關於交易、持倉、證券稅種等方面的報告非常豐富。如今,湯森路透(Thomson Reuters)、標普(S&P)等第三方市場數據來源正變得越來越重要。這些數據都十分有價值,會對業績產生重要的影響。

當我著手這篇論文的時候,幾乎沒有人關注並購的文本分析。目前,很少有人會認為將金融媒體視為收購成功的潛在因素。我意識到,如果關注的是別人沒注意到的東西,那麼這很可能正是市場效率低下的原因。這就是為什麼我選擇研究金融媒體對並購交易結果的影響,以及它如何使並購市場更加有效。

 

具體研究步驟如何?

有一種說法形象地描述了研究過程——當你建造一艘船時,第一艘船是為你的敵人建造的,第二艘船是給你朋友的,第三艘船才是為自己建造的。特別是在2011年,當時的程序並不像今天這樣復雜,構建模型需要多次迭代和大量的試錯。

研究的第一步,主要是涉及到時間以及人力成本,即獲取並進行數據清理,使數據能夠適用於我們的分析。

第二步是從可以處理數據集的軟件庫中選擇數據包。而在當時選擇是有限的,我們最初在R語言中使用的數據包已經有效率低下的跡象,因為我們的樣本多大13萬篇新聞文章,而每一個新的數據集意味著必須再次復制整個文本語料庫。

第三步是管理必要的計算能力。我必須從我自己的本地計算機切換到一個計算機集群,幾個計算機連接在一起,以獲得最佳的電源。在此期間,Hadoop剛剛上線,我相信我是最早將Hadoop專門用於金融的人之一。因此,我為一個分布式計算環境手工重寫了3次代碼。

與此同時,Hadoop MapReduce現在已經是老古董,人們正在使用Spark。而R語言和Python是兩種完全不同的東西。有人說R語言是統計學家寫的,而Python是計算機科學家寫的。這兩種方法在數據科學中有很多重疊之處,使用哪一種通常只是個人喜好的問題。R和Python都可以做大數據、機器學習和統計,但是在我看來Python更側重於機器學習和大數據,而R有更多的傳統統計背景。我相信精通R和Python對於文本分析是有幫助的。

 

在分析了13萬篇新聞之後,有哪些發現?

論文希望回答兩個問題,首先媒體在交易完成的過程中扮演的角色,以及即使股東們完全意識到媒體可以被收購方的內部人士操控,理性的他們仍舊關注新聞。在我們分析的超過13萬篇文章中,包含了大約1200次收購交易,我們發現有關收購者的正面新聞預示著收購成功。反之亦然,消極的新聞往往預示著失敗。這說明股東確實會關注新聞,他們獲得的信息會影響他們是否會最終實現這筆交易。

此外,在另一項研究中,我們發現媒體只在分離均衡中發揮作用,因為這是唯一一種對目標股東有益的媒體信號。你可能會問,如果有撒謊、操縱或編造新聞的可能,我們還應該關注他們嗎?答案是肯定的。你可以從理論和經驗兩方面來看待這個問題。從理論上講,公司出於自身利益會分享正面新聞,負面新聞一開始就不會被分享,公司並沒有撒謊的動機。偽造收購公告不僅成本高昂,而且在法律上也存在風險。

從經驗上來說,即使人們會撒謊,從數據中學到一些東西也是十分重要的。我們不能只考慮報告的正面或負面,僅僅是數據也可以揭示有關收購者的信息。為了說明這一點,我們假設美聯儲一直在宣布不會加息。但一個月後,他們卻加息了。這本身就是一個你可以從數據中得到的信號。如果有一個模式,它可能是真實的,或者以一種可預測的方式撒謊,你可以在機器學習中學習到這一點。而就本項研究來說,它可以在一定程度上預測並購結果,並告知並購方的行為模式。

 

如今有了更復雜的人工智能解決方案,會對投資前景產生哪些影響?

與我剛開始進行此項研究相比,文本分析如今已經被廣泛使用。沒有人會質疑,也不需要證明為什麼要進行關於並購文本分析的研究。但我認為這會導致激烈的競爭。與以往類似,隨著更大的數據集、更先進的技術被廣泛使用,市場可能會變得更有效率。但如果所有人都在根據數據投資股票,那就相當於這項技術並不存在,也會將變得越來越難賺到錢。

 

您今年開設了世界上第一門關於金融和金融科技中的文本分析和NLP的課程,為什麼您覺得這很重要?

金融專業的畢業生面臨著競爭相當激烈的就業市場。最好的方法就是讓自己與眾不同。雖然不是每個人都必須會寫代碼,但是對它有一些了解是總是很好的。

如果你看看這些年來交易大廳的變化,你就會意識到,由於自動化進程加快,處理和監控交易所需的人力更少了。而花了這麼久才明白這個道理是個奇跡。在自動化的幫助下,交易領域降低了交易成本,提高了流動性。除此之外,還有定量投資和機器學習等新技術,可以幫助交易員和投資組合經理做出更好的投資決策。

如果我們一點都不了解代碼,我們將完全無法判斷和理解這些機器學習技術。有些領域可能受影響較小,但如果從事的是金融領域的量化工作,而沒有基本的編程知識,那就很難提升自己的職業生涯。因此,我很高興向香港大學的同學介紹這門新課程。這門課程反映了機器學習和人工智能在金融領域日益增長的重要性。

 

點擊這裡,閱讀完整版論文。