2023 / 08
10
大咖說|大模型賽道“爭鳴”:場景、路徑和評估的多重挑戰

ChatGPT的爆火出圈,讓大模型走出專業領域,進入更普適的圈層,并引發更多人關注和思考這項技術究竟會如何影響人類社會。最終全社會形成共識:這是一項革命性技術,將充分釋放智能生產力,推動人類社會進入到一個全新AI時代。商業機遇來臨,誰能率先把握住風口,意味著誰將在下一輪市場競爭中取得優勢占位。今年以來,神州數碼也積極擁抱大模型帶來的全新變化,時刻關注技術發展動態,升級自有知識產權產品,加速布局人工智能算力等領域,切實抓住AIGC時代變革機遇,謀求全新發展。

在剛剛結束的2023數字生態大會上,神州數碼副總裁、CTO李剛受邀出席,與多位行業專家就大模型技術的深入應用以及模型評估等話題,進行了深入探討。本文就李剛討論內容進行整理編輯,希望能給火爆市場一些啟發和思考。

20221210003345.jpg

神州數碼副總裁、CTO 李剛

大模型發展需重視Native場景 避免路徑依賴

大模型與其他新技術出現以后,大家第一反應都是“+”,“大模型+”這個說法并不新鮮,因為之前有互聯網+,所以大家從這個角度直接切入是很自然的。

大模型是百年來顛覆性的技術范式轉變,我認為它真正的應用場景還沒有出現,“+”的場景不是最好的場景,以前互聯網爆發的時候,最后跑出來的都是互聯網Native的應用,大模型真正的應用場景也應該是Native的場景。我們尋找Native場景,要避免路徑依賴,也就是要避免模仿以前的模式和路徑來探索大模型的應用場景。

目前大模型技術還沒有完全成熟,我們還看不到它未來的發展頂點在哪兒。我認為要關注一個非常大的、Native的場景是多模態,在企業里面,多模態幾乎是沒有人去想,那多模態會出現什么場景,這個是要關注的。神州數碼關注大模型的時候,首先成立了一個追蹤團隊,組織一幫人關注行業動態,看論文寫周報,如果論文內容可驗證就第一時間進行驗證。其次是做敏捷,模型要想在企業里面用,需要做出一套敏捷平臺,讓企業去試,同時把客戶Involve進來共創。我們現在已經簽了一些共創客戶,讓客戶使用敏捷平臺,在共創過程中去摸索最適合的場景。最后作為一個科技企業還是要第一性原理,兩頭跟住,一方面是研究的跟進,一方面是場景的跟進。

大模型評估專業又前沿 注重知識本身和涌現能力

大模型評估本身就是一個非常前沿的領域,雖然現在已經有一些評估方法和標準出現,但站在企業角度,這些方法和標準還不夠,所以模型評估本身就是一個研究方向。

目前行業里做模型評估主要圍繞兩點進行,針對外部模型進行評估,主要是通識能力評估,包括知識本身和涌現能力兩部分。在行業大模型方面,它的行業知識評估相對簡單,但行業涌現能力,是一個專業性很強的話題。舉個例子,我們在金融行業做了一個行業大模型,它的涌現能力是什么呢?通用大模型的涌現能力,比如我們給它一道奧數題,它能夠解出來,這就很厲害了。

行業大模型一般來說是通過通用大模型做全參,或者是做fine-tuning,做好了以后出來的這個大模型叫行業大模型。這個做好了以后,是不是說通用能力加行業知識等于行業涌現能力?這是個問題。我們講風控,如果不是風控應用,而是行業大模型直接提供風控能力,這就是一個非常大的涌現出來的能力。它不是說只是看到了這些東西,他會直接對業務做一個風控評價,那這個就很難。

傳統來說,都是用傳統的機器學習做成的小模型來做,能不能泛化到大模型里面去做?這個是涌現出來的嗎?這就非常難。所以現在是一個選擇和共創的問題,選擇愿意在大模型里面跟我們一起做研究的,大家一起探索、共創。

推薦閱讀
在線咨詢
在線咨詢
發 送
請留下您的具體需求
我們將盡快與您聯系
*您的姓名
*您的手機號
您的郵箱
您的公司名稱
您的具體需求
提 交
欧美成人刺激A片,十八禁黄无遮挡禁漫画网站,污到下面一直滴水的句子医生,老司机午夜永久免费影院