1950年,艾倫圖靈提出著名的“圖靈測試”,給出判定機器是否具有“智能”的試驗方法。2022年,Open AI推出ChatGPT,它具有接近人類流暢而自然的多輪對話能力。
在這72年間,第一支由計算機創(chuàng)作的弦樂四重奏《依利亞克組曲》(Illiac Suite)完成,世界上第一部完全由人工智能創(chuàng)作的小說《在路上》(I The Road)問世,人工智能生成的畫作在佳士得拍賣行以43.25萬美元成交,成為世界上首個出售的人工智能藝術品......
生成式人工智能(AIGC)早已成為長驅直入人類生活的“強大之物”。于2022 年末發(fā)布的ChatGPT更是在全球引發(fā)轟動效應,日前推出的多模態(tài) GPT-4 顯示出更強大的邏輯和推理能力。
(資料圖片僅供參考)
“新版的ChatGPT(GPT-3.5)與GPT-4能力非常強大,遠強于以往的任何一般大語言模型(LLM)。”香港大學經管學院深圳金融科技研究所所長羅曄介紹稱,GPT-4 的智商大約相當于人類智商測試的 110,而普通人平均為 100。
某國內投資人告訴南方財經全媒體記者,其機構在持續(xù)關注AIGC的投資機會,其已投資的部分人工智能公司也在布局AIGC技術,“AIGC的產業(yè)上游是數據服務產業(yè),中游是算法模型產業(yè),下游是應用拓展產業(yè),我們認為大部分投資機會在于下游,最看好AIGC在金融行業(yè)的商業(yè)應用。”
金融行業(yè)作為數據密集型行業(yè),是傳統(tǒng)AI技術最早落地的商業(yè)場景之一。隨著AIGC的快速發(fā)展,諸多金融場景和應用也在廣泛試水和布局,如彭博社推出的Bloomberg GPT、GPT+Wolfram Alpha插件、上海人工智能研究院 DB-1項目等。
無疑,AIGC為金融行業(yè)帶來了更多想象空間。
金融場景下的ChatGPT
美東時間3月30日,彭博社發(fā)布了專門為金融領域打造的大型語言模型(LLM)——BloombergGPT。據彭博介紹,該模型將幫助彭博改進現有的金融NLP任務,如市場情緒分析、命名實體識別、新聞分類和問題回答等。
Bloomberg GPT是一個涉及500億參數的語言模型,其訓練主要是使用大規(guī)模的財務數據。羅曄介紹稱,BloombergGPT通過大量金融數據對類 GPT 模型進行微調,在金融領域內一定任務上表現好于基本的 ChatGPT。
ChatGPT自推出后,因在數學計算上的誤差常被戲稱為“文科生”,而GPT+Wolfram Alpha插件的出現讓其數學能力有望突破。 “Wolfram Alpha 是全球領先的數學知識網站和求解器公司,與 GPT 結合之后,兩者在數學上的能力有望突破。”羅曄稱。
其他研究成果還在不斷涌現。上海數字大腦研究院 DB-1項目通過結合大語言模型與 TravellingSalesman(旅行家問題)求解器,對復雜的規(guī)劃問題實現自然語言求解;AutoGPT由 GPT-4 驅動,可以通過把任務提交給它,自主生成計劃,并且執(zhí)行該計劃。AutoGPT 通過反復調用 GPT-4 和 ChatGPT 來實現規(guī)劃和執(zhí)行。
此外,在下游應用端,AIGC技術主要聚焦于智慧客服和智慧顧問服務方面,已逐漸取代金融業(yè)大量客戶人員和客戶經理。例如在2017年4月,富國銀行就開始試點一款基于Facebook Messenger平臺的智慧客服項目,可以通過與用戶交流,為客戶提供賬戶信息,幫助客戶重置密碼等服務。美國銀行很快也推出了類似的智能助手Erica。
而在國內,眾多金融機構將AIGC的相關技術應用在客戶服務和投顧咨詢上。如早在2016年2月,中國工商銀行便推出智能客服“工小智”,是面向客戶提供業(yè)務咨詢、信息查詢、業(yè)務辦理、優(yōu)惠分享等服務的機器人。據其2022年半年報顯示,“工小智”智能服務入口拓展至106個,智能呼入呼出業(yè)務量3.1億次。
上述AIGC技術的快速發(fā)展及行業(yè)應用實例都可見其應用在金融行業(yè)的潛力和機遇。但羅曄認為,“GPT最大的優(yōu)勢是在于通用性,它是一個廣泛的人工智能,可以覆蓋很多不同場景,很多不同業(yè)務。但在解決一個深度的行業(yè)問題時,它的能力還是欠缺的?!?/p>
ChatGPT解不開雞兔同籠數學題?
“很多人調侃說,ChatGPT可能是個‘文科生’,我也有同感。我感覺目前ChatGPT的數學水平大概相當于一個初中生,”羅曄說道。
為測試ChatGPT的能力邊界,他不斷給ChatGPT拋出“金融計算題”。首先用“雞兔同籠”的數學題測試ChatGPT的計算能力,但將雞和兔子改成了長頸鹿和鴨子,ChatGPT給出了錯誤答案。
除雞兔同籠問題外,羅曄還在ChatGPT中提問“請問000001.SZ是什么?”,但ChatGPT 給出了錯誤答案,認為其代表“上證指數”。在對其回復進行糾正和引導后,ChatGPT才給出了正確答案,即“它代表的是平安銀行股份有限公司在中國深圳證券交易所的股票代碼?!?/p>
此外,羅曄還讓ChatGPT分析“過去十年春節(jié)過后A股的平均走勢如何,并用表格展示”,ChatGPT準確寫出了代碼來分析歷年數據,并列出了清晰的表格,但最后算錯了平均數。
通過不斷測試,羅曄總結ChatGPT在金融領域內的能力:一般性問答能力較強,有一定代碼能力。但可靠性尚且有一定問題,且尚無法解決金融領域的深度問題。
ChatGPT的能力邊界取決于其技術特點。ChatGPT屬于廣度人工智能,在解決特定問題上能力欠缺。GPT與控制論主導的AlphaGo一類強化學習技術(深度人工智能)可以形成互補。
“隨著ChatGPT的技術改進,加上不斷學習,回答的正確率有所提升。但是可以看出,GPT在特定問題上的能力是欠缺的。”他強調。
長驅直入的“強大之物”
古希臘劇作家索福克勒斯曾鄭重提醒人類,“進入凡人生活的一切強大之物,無不具有弊端。”目前,以chatGPT為代表的生成式AI技術(AIGC)正是長驅直入人類生活的“強大之物”。
“未來可能阻止整個技術路線商業(yè)化最大的隱患是其可靠性(reliability)?!監(jiān)penAl首席科學家 lya Sutskever在近期采訪中說道。
羅曄認為ChatGPT商業(yè)化最大的問題在于它不是完全可靠的,“它有時候會錯得很離譜,但你不仔細看,也許看不出來?!睆纳鲜鰧hatGPT的數學能力測試中便可見一斑,而金融行業(yè)的業(yè)務特點要求數據質量好、維度全、場景多,數據的可靠性極其重要。
此外,安全性也是目前最大的隱患之一。人工智能無法獨立思考和判斷惡意的誘導行為,使用者會故意引導人工智能輸出違禁內容。
例如,學者杜雨和張孜銘在《AIGC智能創(chuàng)作時代》中提到,部分公司為獲得市場關注,故意在AI的訓練數據集中加入一些違禁內容,讓用戶“方便”地使用它來制作色情、暴力、虛假新聞等內容,從而增加自己在網絡上的曝光和宣傳。
因此,科學家們呼吁,必須防止生成式 AI 回答一些被禁止的問題,并且必須將安全性放到首位。必須對 GPT 可以問答的內容和可進行的操作進行限制,必須了解 GPT 本身的能力邊界并對其設置應用邊界。
目前,基于AIGC出現的諸多問題,各國也在加快制定相關法律法規(guī)對其監(jiān)管。據杜雨和張孜銘不完全統(tǒng)計,2022年,美國至少有17個州提出了AIGC相關的法案或決議,并在科羅拉多州、伊利諾伊州、佛蒙特州和華盛頓州頒布。
而在中國,2022年11月3日,國家互聯網信息辦公室、工業(yè)和信息化部、公安部聯合發(fā)布了《互聯網信息服務深度合成管理規(guī)定》,加強對深度合成技術的管理,確保其發(fā)展與安全,推進深度合成技術依法、合理、有效地被利用。
標簽:
熱門