·由于過分注重尺度定律,人力、算力等大量資源資源投入到尺度定律,導(dǎo)致基層研究人員沒有足夠多的計(jì)算資源研究新的模型路線,擠壓創(chuàng)新空間。

青年科學(xué)家共同探討大模型技術(shù)架構(gòu)的未來(lái)可能性。
人工智能大模型技術(shù)架構(gòu)是否已經(jīng)收斂?未來(lái)是否有新的技術(shù)可能性?大模型與具身智能如何結(jié)合?7月4日,2024世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議在上海開幕。在大會(huì)科學(xué)前沿全體會(huì)議上,青年科學(xué)家們探討下一代人工智能架構(gòu)的革新與挑戰(zhàn)。
從ChatGPT到GPT-4,一系列生成式大模型的涌現(xiàn),似乎昭示著人類正在走向通往通用人工智能的道路上。但上海人工智能實(shí)驗(yàn)室領(lǐng)軍科學(xué)家、教授林達(dá)華表示,也有研究者發(fā)現(xiàn),盡管現(xiàn)在的模型能力強(qiáng)大,但也出現(xiàn)了一些問題,其中幻覺和泛化是模型落地繞不開的話題。模型的幻覺帶來(lái)錯(cuò)誤回答,使得人們?cè)谝恍╆P(guān)鍵的認(rèn)知上產(chǎn)生疑慮,一定程度上會(huì)阻礙大模型落地,另一方面即便是最強(qiáng)大的大模型在真實(shí)應(yīng)用場(chǎng)景中還存在很多局限。
基于當(dāng)前所探討的大模型發(fā)展技術(shù)道路,如依靠尺度定律(Scaling Law)形成越來(lái)越強(qiáng)的智能體的模式,最終能否解決大模型面臨的問題?是否還存在能夠走得更遠(yuǎn)的新路徑?
滑鐵盧大學(xué)計(jì)算機(jī)學(xué)院助理教授張弘揚(yáng)表示,從短期來(lái)看,尺度定律出現(xiàn)后,大模型能力出現(xiàn)了新變化。尺度定律由數(shù)據(jù)和算力兩駕馬車?yán)瓌?dòng),算力、模型的參數(shù)量和數(shù)據(jù)量成一個(gè)比例,模型才會(huì)有質(zhì)的提升。“現(xiàn)在最大的一個(gè)問題就是數(shù)據(jù)荒,GPT-4基本上已經(jīng)把市面上能夠吸收的大部分?jǐn)?shù)據(jù)都使用了,我們面臨數(shù)據(jù)和算力上的瓶頸。”
張弘揚(yáng)表示,從長(zhǎng)期來(lái)看,尺度定律存在問題,“人類早上吃一個(gè)雞蛋就可以有很多能量做很多事。我們一生中讀不了多少本書,但我們卻有著比大模型優(yōu)秀得多的能力,比如大模型高考會(huì)不及格,但我們卻能考到高分。這是一個(gè)開放的問題,現(xiàn)在我也沒有一個(gè)具體的答案,但我們應(yīng)該嘗試交叉學(xué)科,比如研究清楚人類是怎樣學(xué)習(xí)、進(jìn)化、做任務(wù),這也會(huì)啟發(fā)大模型。”
上海人工智能實(shí)驗(yàn)室青年科學(xué)家陸超超團(tuán)隊(duì)正在研究如何提高大模型的因果推理能力。因果推理能力有助于大模型落地,“一旦一個(gè)多模態(tài)大模型具有了因果推理能力,它可以作為一個(gè)世界模型使用,也可以作為一個(gè)具身智能體使用,甚至因?yàn)橛辛艘蚬评砟芰Γ途哂辛朔此寄芰Γ梢宰鳛橐粋€(gè)具有自我意識(shí)的智能體。”
陸超超舉例,人坐在椅子上,如何確保機(jī)器人不會(huì)沖過去踢倒椅子?“首先要確定人和椅子之間的因果關(guān)系。我們?cè)谶@上面做了一些工作,如何定義人和人之間、人和物體之間,甚至物體和物體之間的因果關(guān)系,多模態(tài)大模型只有理解這些因果關(guān)系,才能做出決策,不會(huì)傷害人。”其次要賦予AI反思的能力,每次作出決策前,大模型要能反思做出決策后會(huì)產(chǎn)生的后果,只有這樣才能做出正確決策,這種反思能力完全可以在因果框架中定義。但陸超超表示,尺度定律并沒有顯著提高模型的因果推理能力。
谷歌DeepMind研究科學(xué)家張晗表示,由于現(xiàn)在過分注重尺度定律,人力、算力等大量資源資源投入到尺度定律,導(dǎo)致基層研究人員沒有足夠多的計(jì)算資源研究新的模型路線,擠壓創(chuàng)新空間,這是一個(gè)損失。
針對(duì)具身智能與大模型的結(jié)合,加州大學(xué)洛杉磯分校計(jì)算機(jī)系助理教授周博磊表示,可利用大模型為具身智能生成訓(xùn)練場(chǎng)景,提升具身智能的能力。清華大學(xué)交叉信息研究院助理教授許華哲表示,從模型訓(xùn)練來(lái)看,這取決于能否訓(xùn)練具身大模型來(lái)做決策,與世界交互。
“我們最近做了一些小的科學(xué)實(shí)驗(yàn),我在地上畫一個(gè)長(zhǎng)條的格子,讓機(jī)器人沿著格子往前走,每一個(gè)格子里要么有一元錢,要么沒有錢,機(jī)器人走在格子里就會(huì)把錢吸進(jìn)來(lái),走到格子末尾時(shí),我問它收到的錢是奇數(shù)還是偶數(shù)。GPT等主流大模型以Transformer為基礎(chǔ),我們發(fā)現(xiàn)Transformer需要非常多的數(shù)據(jù)才能回答這個(gè)問題,而RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))就很容易得到奇偶性。”許華哲表示,團(tuán)隊(duì)在做這一實(shí)驗(yàn)時(shí)就在考慮,用于機(jī)器人的模型是否需要新的架構(gòu),“也許并不是新的架構(gòu),而是新舊架構(gòu)的結(jié)合。”
從模型應(yīng)用來(lái)看,許華哲團(tuán)隊(duì)也利用大模型生成環(huán)境訓(xùn)練機(jī)器人。“我們直接讓大模型輸出人手的軌跡,在軌跡之上再疊加強(qiáng)化學(xué)習(xí),做更精細(xì)的操作等,機(jī)器人和大模型的這些結(jié)合還蠻好的,但這主要是靠大模型目前的能力,未來(lái)能否更直接輸出到底層的動(dòng)作層上,是我們想看到的。”