專訪有光科技:如何在金融領域實現多語言ASR和NLP

在本文中,我們采訪到了有光科技首席科學家及CTO與Albert Lam,就有光科技如何應用多語言語音識別和NLP於金融領域進行了探討。

Albert Lam 2019-07-12

請簡單介紹一下有光科技

有光科技(Fano Labs)是香港大學的衍生科技公司。由香港大學電氣與電子工程(EEE)博士研究生Miles Wen博士和香港大學信息工程系講座教授Victor Li On Kwok教授創立,我們專注於自動語音識別(ASR),自然語言處理(NLP)以及大數據技術,幫助企業的客戶服務,合規服務以及其他業務線。有光科技在首席科學家Albert Lam博士和香港大學EEE兼職助理教授領導的內部研究團隊帶領下,致力於研究最前沿的語音和NLP技術,並將知識轉化為產品和行業解決方案。

在公司成立初期,我們很幸運得到許多組織和導師的支持。公司總部位於香港科技園內,並得到了香港大學和香港政府的資助,我們專注於核心技術和產品的研發。 2017年11月,有光科技完成了Pre-A輪融資,成為維港投資第一家投資的香港高科技創業公司。維港投資是世界上一些最具創新力的公司和顛覆性技術的領先投資者,投資的公司包括Facebook,DeepMind, Skype和Siri在內。

2018年,我們在成都、深圳和廣州設立了分支機構。我們的人工智能客戶服務系統榮獲了2018年香港ICT大獎金獎,以及2018年亞太ICT聯盟APICTA獎項。此外,我們的解決方案得到了市場的廣泛認可,並得到了已經廣泛用於電信、金融、政府和其他私營和公共部門。

據統計到2021年,NLP市場價值將會達到160.7億美元,您如何解釋這種爆炸性增長?

多年來,智慧城市,智能商務和智能未來一直以來是人們關注的技術主題。人工智能,特別是在語音識別和NLP方面,在其中發揮著不可避免的作用。例如,我們會在手機中使用個人助理來發送消息,播放音樂,甚至發布在線購物訂單。這背後,理解語音命令或查詢,軟件需要將語音輸入轉錄為文本,然後使用NLP技術理解文本。虛擬銀行,物聯網和呼叫中心等應用程序也需要同樣的技術,這就解釋了為什麼NLP市場在未來被認為是非常巨大的。

有光科技專注於方言的語音識別和NLP技術,專注於企業呼叫中心應用。在中國,有200萬名代理商在呼叫中心工作,每年的運營成本超過100億美元。作為全球最大的市場和人工智能技術發展的領導者之一,中國必將成為市場的重要參與者,並將在未來幾年取得顯著增長。

有光科技為何專注於進行中文和中文方言的研究?


作為一家在香港成立並在香港發展的創業公司,我們發現香港的許多公司都面臨著世界其他地區也會遇到的客戶服務難點。他們希望通過使用AI助手使他們的客戶服務變得更加智能。他們正面臨著呼叫中心人員流動率高,勞動力成本高的挑戰,其中一些人因為代理商不能很好地理解他們的需求,正在失去客戶。然而,目前市場上驕傲沒有為廣東話開發的合適解決方案。有些人嘗試內地或美國的特定供應商提供的解決方案,但事實證明這種解決方案不適合港式粵語。所以,我們想嘗試用我們的AI技術來解決這個問題。從那時起,我們便開始研究和開發我們自己的AI客戶服務系統。

從開發粵語ASR和NLP技術開始,我們還構建了處理各種語言的引擎,包括英語,普通話,四川語和其他方言。世界上有將近1億人會說廣東話,說其他方言的人數量更大。我們相信,在這些市場中采用人工智能技術,使他們的業務和生活變得更加智能是非常重要和有價值的。

中文中,普通話和其他方言的NLP分類有什麼區別?

最大的區別來自數據。您可能知道,數據在人工智能的開發中非常重要,尤其是機器學習技術。中國互聯網上有大量的語音和文本數據生成,傳輸和存檔,可以作為培訓自動語音識別(ASR)和NLP引擎的無窮無盡的燃料。然而對於一些方言來說,這卻是完全不同的。

由於我們可以獲得的模型培訓數據資源非常有限,我們通過優化算法,努力使系統性能最大化。此外,為了獲得更好的NLP結果,我們不斷收集特定領域和本地語言數據集,以使我們的模型能夠理解特定的知識,這使我們的解決方案能夠用於許多不同的行業和應用程序。


有光科技的技術獨特性體現在哪裡?

與我們通常在智能手機上使用的ASR引擎不同,智能手機只能理解與標准語言的日常對話,在大多數情況下,我們的引擎專為需要考慮許多因素的企業呼叫中心而設計,包括重音,域名知識,噪音,設備等。以銀行呼叫中心的ASR引擎為例,我們可以期望它理解一些特定領域的詞,例如「未來價格」或「定期存款」,這些詞在使用通用ASR模型時可能會被誤解。此外,引擎應該能夠處理通過電話系統傳輸的語音信號,以避免識別准確性差,因為其采樣率遠低於智能手機。

我們擁有一支由著名大學教授和博士組成的內部研究團隊,能夠為客戶建立定制的語音識別模型,滿足他們的獨特需求。此外,與市場上僅提供基於雲的解決方案的大多數供應商不同,我們能夠為客戶部署內部語音識別模型,以確保所有數據的安全性和受到良好保護。


作為一家香港公司,有光科技如何與內地公司競爭?

有光科技的獨特之處在於我們擁有強大的研發團隊,對當地市場有著深刻的理解。我們擁有方言和小語種專業,能夠為香港和內地的客戶提供量身定制的解決方案。大多數大公司專注於大市場,但通常忽視少數人的重要性。我們通過中國四川的呼叫中心發現的一個有趣的事實是,超過70%的呼叫者說四川語,這是中國西南地區常用的方言,超過3億人使用。

說實話,像我們一樣規模的初創公司與內地和美國的大公司競爭並不容易。但是,我們認為市場上仍有很多機會,因為NLP是一項新興技術,而且行業的爆發尚未到來。除了競爭,我們更歡迎合作。憑借對技術和目標市場的不同關注,有光科技還可以與其他ASR和NLP公司合作,為客戶提供全面的解決方案。

隨著中國引入新的數據保護法規,有光科技將如何應對這一規定?

數據安全始終是我們客戶及其客戶最關注的問題之一,尤其是在金融行業。 有光科技的使命是確保客戶數據和用戶信息的安全。我們的系統是在強大而安全的架構下構建的,可以防止來自外部的威脅和攻擊。將系統部署在私有雲上,系統處理的所有數據都傳輸並存儲在安全的網絡環境中。通過采用軟件,硬件和管理程序中的多種方法,我們設法確保數據處理符合客戶和當地政府的規定。

您詳細介紹一下ASR和NLP解決方案的具體應用案例?

我們在香港實施的第一個項目為是CLP構建AI客戶服務系統,我們部署了支持語音的聊天機器人,以回答客戶提出的常見問題。聊天機器人能夠識別和理解粵語的語音查詢,甚至是粵語和英語的混合語言,這種語言使用方法在香港很常見。使用NLP技術,聊天機器人可以理解不同表達背後的真實含義,並為用戶提供適當的響應。

我們的語音分析系統通過識別和分析他們的通話記錄並向經理提供業務見解,幫助銀行和保險公司進行客戶服務質量保證和合規性檢查。有光科技已成功為各行各業的客戶提供人工智能解決方案,包括政府部門,電信服務提供商和金融機構,幫助他們顯著降低人工成本,提高客戶服務質量。

創業過程中最具挑戰性的時刻是什麼?

最大的挑戰之一來自人力資源。在香港聘請語音識別和NLP專家並不容易。雖然在一些本地大學有一些博士畢業生的語音識別和NLP培訓,但他們中的許多人更喜歡在海外工作或在內地工作,可能是因為香港的整個工作並不夠具備競爭力。但是隨著更多政府政策的公布,情況正好轉好,但我們仍有很長的路要走。我們希望大學和地方機構的各種人工智能技術有更好的研究氛圍,從而幫助香港建立更好的研究生態系統。

您認為您的技術如何應用於金融行業並從中受益?

我們已經金融行業中擁有了很多應用。基於文本的聊天機器人或語音機器人可以了解客戶的查詢,並通過文本,語音或您想要的任何其他方式與他們進行通信。 Speech Analytics系統可以准確地檢測銷售電話中的不合規行為,優化KYC和AML的流程,從而減少合規性問題導致的罰款或訴訟,提高客戶服務質量。 我們的語音生物識別技術可以通過語音驗證縮短冗長的身份驗證過程,並提供更好的用戶體驗。

您預計未來,尤其是在中國,NLP會發生什麼變化?有光科技的未來計劃是什麼?

近年來,NLP技術在中國和海外迅速發展。 這些技術廣泛應用於客戶服務、智能家居、智能手機助手等。隨著技術的發展,這些技術在未來肯定會越來越受歡迎。 作為世界上最復雜的語言之一,中國NLP研究是一個具有挑戰性且前景廣闊的課題。 隨著業務的發展,我們將遇到各種不同行業和不同語言的應用案例。 然而,憑借我們的研究能力,並且在該領域不斷積累的經驗,有光科技已經為未來的變化和挑戰做好了充分准備。