OpenAI的AGI之路,總裁Greg Brockman在最新的訪談中說(shuō)清楚了——
【資料圖】
技術(shù)層面,從文本生成轉(zhuǎn)向強(qiáng)化學(xué)習(xí)的推理范式,在現(xiàn)實(shí)世界中試錯(cuò)并獲取反饋;
資源策略上,持續(xù)投入大規(guī)模計(jì)算資源;
落地環(huán)節(jié),把模型封裝成Agent,將模型能力打包成為可審計(jì)的服務(wù)進(jìn)程。
這場(chǎng)訪談?dòng)葾I播客Latent Space主持,與Brockman探討了OpenAI的AGI的整體技術(shù)路線與資源策略。
與此同時(shí),OpenAI的落地布局,以及Brockman對(duì)未來(lái)的思考,也都隨著訪談的進(jìn)行浮出水面。
總結(jié)下來(lái),Brockman表達(dá)了這些核心觀點(diǎn):
模型正在不斷增強(qiáng)現(xiàn)實(shí)交互能力,這也是下一代AGI的關(guān)鍵組成部分;
AGI的主要瓶頸在于計(jì)算,計(jì)算量的多少直接決定了AI研究和發(fā)展的速度與深度;
AGI真正的目標(biāo)是讓大模型在企業(yè)和個(gè)人的工作流里長(zhǎng)駐,手段就是Agent;
把模型接進(jìn)現(xiàn)實(shí)世界的應(yīng)用領(lǐng)域極 具價(jià)值,各個(gè)領(lǐng)域還有大量尚未采摘的果實(shí)。
模型推理范式的轉(zhuǎn)變
談及OpenAI剛剛發(fā)布的GPT-5,Brockman認(rèn)為這是AI領(lǐng)域的一場(chǎng)重大范式轉(zhuǎn)變,作為OpenAI第 一個(gè)混合模型,旨在彌補(bǔ)GPT系列與AGI的距離。
在訓(xùn)練GPT-4之后,OpenAI給自己提出了一個(gè)問(wèn)題:
為什么它不是AGI?
GPT-4雖然可以進(jìn)行連貫的上下文對(duì)話,但可靠性欠佳,會(huì)犯錯(cuò)甚至脫離軌道。
因此他們意識(shí)到需要在現(xiàn)實(shí)世界中測(cè)試想法,并通過(guò)強(qiáng)化學(xué)習(xí)獲取反饋,從而提高可靠性。
這一點(diǎn)在OpenAI早期的Dota項(xiàng)目中就有所實(shí)現(xiàn),當(dāng)時(shí)使用了純強(qiáng)化學(xué)習(xí),可以從隨機(jī)初始化狀態(tài)中學(xué)習(xí)復(fù)雜行為。
△OpenAI的Dota訓(xùn)練架構(gòu)
所以從GPT-4完成的那一刻起,OpenAI開(kāi)始嘗試轉(zhuǎn)向新的推理范式,即先讓模型通過(guò)監(jiān)督數(shù)據(jù)學(xué)會(huì)對(duì)話,再借助強(qiáng)化學(xué)習(xí)反復(fù)在環(huán)境中試錯(cuò)。
傳統(tǒng)的模型訓(xùn)練是一次性訓(xùn)練,然后進(jìn)行大量推理,而GPT-5則借助強(qiáng)化學(xué)習(xí),讓模型在推理過(guò)程不斷生成數(shù)據(jù),然后基于這些數(shù)據(jù)重復(fù)訓(xùn)練,將模型與現(xiàn)實(shí)世界的觀測(cè)結(jié)果反饋到模型中。
這種新范式改變了所需數(shù)據(jù)的規(guī)模,原先預(yù)訓(xùn)練可能需要數(shù)十萬(wàn)個(gè)示例,但強(qiáng)化學(xué)習(xí)只需要從10到100個(gè)任務(wù)中學(xué)習(xí)復(fù)雜行為。
同時(shí)也說(shuō)明模型正在不斷增強(qiáng)現(xiàn)實(shí)交互能力,這也是下一代AGI的關(guān)鍵組成部分。
計(jì)算能力決定AGI開(kāi)發(fā)上限
當(dāng)被問(wèn)及當(dāng)前AGI開(kāi)發(fā)中的主要瓶頸時(shí),Brockman明確表示:計(jì)算。
他認(rèn)為,只要擁有更多的計(jì)算能力,OpenAI就總能找到迭代和提高模型性能的方法,計(jì)算量的多少直接決定了AI研究和發(fā)展的速度與深度。
例如同樣是在Dota項(xiàng)目中,當(dāng)時(shí)普遍認(rèn)為PPO (近端策略優(yōu)化)算法無(wú)法實(shí)現(xiàn)擴(kuò)展,但他們通過(guò)將內(nèi)核數(shù)量翻倍,實(shí)現(xiàn)了性能的持續(xù)提升,所以其實(shí)所謂的算法壁壘在擴(kuò)大計(jì)算資源后就能得以解決。
而當(dāng)前GPT-5的強(qiáng)化學(xué)習(xí)范式雖然帶來(lái)了更高的樣本效率,但仍然需要模型進(jìn)行數(shù)萬(wàn)次嘗試才能重復(fù)學(xué)會(huì)一項(xiàng)任務(wù),這需要巨大的計(jì)算量支撐。
更進(jìn)一步,圖靈曾為AGI提出的“超臨界學(xué)習(xí)”概念,認(rèn)為機(jī)器不僅要學(xué)習(xí)被即時(shí)教授的內(nèi)容,還要深入思考其二階、三階甚至四階效應(yīng),并更新整個(gè)知識(shí)體系。
這種更深層次學(xué)習(xí)過(guò)程則同樣需要投入更多的計(jì)算資源,OpenAI當(dāng)前的目標(biāo)就是探索如何以更具創(chuàng)造性的方式消耗計(jì)算,以實(shí)現(xiàn)這種高級(jí)學(xué)習(xí)能力。
Brockman將計(jì)算描述為一種基本燃料,可以將能量轉(zhuǎn)化為存儲(chǔ)在模型權(quán)重中的勢(shì)能,推動(dòng)模型執(zhí)行有效操作。
一旦模型通過(guò)大量計(jì)算訓(xùn)練完成,就可以被反復(fù)利用,在多任務(wù)中分?jǐn)偩薮蟮挠?jì)算成本。
另外,他也預(yù)測(cè)最終的AGI將會(huì)是一個(gè)模型管理器,將小型的本地模型與大型云推理器結(jié)合,以實(shí)現(xiàn)自適應(yīng)計(jì)算。
GPT-5的多模型混合和路由機(jī)制就是這種方式的一個(gè)初步嘗試,將推理模型和非推理模型結(jié)合,并通過(guò)條件語(yǔ)句選擇合適的模型。
推理模型更適用于深度智能但有充足思考時(shí)間的場(chǎng)景,非推理模型則用于快速輸出回合。
這種復(fù)合式的模型充分利用了計(jì)算的靈活性,能夠根據(jù)任務(wù)需求組合不同能力和成本的模型,也是AGI最可能呈現(xiàn)的面貌。
因此在AI驅(qū)動(dòng)的未來(lái)經(jīng)濟(jì)中,計(jì)算將成為需求極高的資源,擁有更多計(jì)算資源的研究人員可以產(chǎn)出更優(yōu)質(zhì)的成果,如何獲取計(jì)算資源及計(jì)算的分配方式將成為一個(gè)非常重要的問(wèn)題。
讓大模型進(jìn)入生產(chǎn)
Brockman反復(fù)強(qiáng)調(diào),模型不再是科研樣品,而是要成為現(xiàn)實(shí)生產(chǎn)線的一環(huán)。
他指出,AGI真正的目標(biāo)是讓大模型在企業(yè)和個(gè)人的工作流里長(zhǎng)駐,而不是停留在論文與演示當(dāng)中。
具體的落地路徑就是把模型封裝成Agent,將模型能力打包成為可審計(jì)的服務(wù)進(jìn)程。
Brockman認(rèn)為,這種交互像與資深同事協(xié)作,一個(gè)關(guān)鍵要素在于可控性——可以“隨時(shí)停下讓你檢查”,而且任何一步都能回滾。
為了保證高權(quán)限Agent可控,OpenAI設(shè)計(jì)了雙層結(jié)構(gòu)的“縱深防御”:
模型內(nèi)部,把system、developer、user三種指令排出可信度順序,使“忽略此前所有指令”這類注入在第 一關(guān)就被丟棄;
模型外部,把每個(gè)潛在高危操作拆成最小粒度,通過(guò)多級(jí)沙箱逐一確認(rèn)。
對(duì)于這種模式,Brockman用數(shù)據(jù)庫(kù)安全進(jìn)行了類比:
就像防SQL注入,必須先在最 低層把洞堵死,再往上疊加護(hù)欄,系統(tǒng)自然穩(wěn)固。
安全護(hù)欄之外,與人類之間的價(jià)值對(duì)齊也是一項(xiàng)重要工程。
工程團(tuán)隊(duì)先通過(guò)后訓(xùn)練從海量潛在“人格”中去除普遍不受歡迎的類型。
隨后,剩余的“人格”被放入公開(kāi)競(jìng)技場(chǎng)接受實(shí)時(shí)評(píng)分,評(píng)價(jià)高的策略在下一輪被放大,評(píng)價(jià)低的被削弱,從而形成模型與社會(huì)偏好的協(xié)同進(jìn)化。
這一流程將保證模型能力升級(jí)時(shí)不脫離人類共識(shí),也為未來(lái)引入在線學(xué)習(xí)打下數(shù)據(jù)基礎(chǔ)。
另外,為了增強(qiáng)生態(tài)黏性,OpenAI還把輕量級(jí)開(kāi)源列為第二驅(qū)動(dòng)力。
Brockman的判斷是,當(dāng)開(kāi)發(fā)者在這些模型上沉淀工具鏈,實(shí)際上就默認(rèn)采納了OpenAI的技術(shù)棧。
“各個(gè)領(lǐng)域還有大量尚未采摘的果實(shí)”
放眼未來(lái),Brockman認(rèn)為真正值得投入的機(jī)會(huì)不在于再造一個(gè)更炫的“模型包裝器”,而是把現(xiàn)有智能深植于具體行業(yè)的真實(shí)流程之中。
對(duì)很多人來(lái)說(shuō),似乎好點(diǎn)子都被做完了,但他提醒,每一條行業(yè)鏈都大得驚人。
把模型接進(jìn)現(xiàn)實(shí)世界的應(yīng)用領(lǐng)域極 具價(jià)值,各個(gè)領(lǐng)域還有大量尚未采摘的果實(shí)。
因此,他建議那些“覺(jué)得起步太晚”的開(kāi)發(fā)者與創(chuàng)業(yè)者,先沉到行業(yè)一線,理解利益相關(guān)者、法規(guī)和現(xiàn)有系統(tǒng)的細(xì)節(jié),再用AI去填補(bǔ)真正的缺口,而不是只做一次性的接口封裝。
當(dāng)被問(wèn)到如果要給2045年的自己留一張便簽會(huì)寫什么時(shí),他的愿景是“多星際生活”與“真正的豐裕社會(huì)”。
在他看來(lái),以當(dāng)前技術(shù)加速度推演,二十年后幾乎所有科幻情節(jié)都難以否定其可行性,唯 一的硬約束只剩下物質(zhì)搬運(yùn)本身的物理極限。
與此同時(shí),他也提醒,計(jì)算資源會(huì)成為稀缺資產(chǎn);即便物質(zhì)需求被自動(dòng)化滿足,人們?nèi)詴?huì)為了更高分辨率、更長(zhǎng)思考時(shí)間或更復(fù)雜的個(gè)性化體驗(yàn)而渴求更多算力。
如果能穿越回18歲,他想告訴年輕的自己,值得攻克的問(wèn)題只會(huì)越來(lái)越多,而不會(huì)減少。
我曾以為自己錯(cuò)過(guò)了硅谷的黃金年代,但事實(shí)完全相反——現(xiàn)在正是技術(shù)發(fā)展的最 好時(shí)機(jī)。
在AI將滲透一切行業(yè)的背景下,機(jī)遇不僅未被耗盡,反而隨技術(shù)曲線的陡升而倍增.
真正的挑戰(zhàn)是保持好奇心,敢于投入新的領(lǐng)域。
凡注有"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"或電頭為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的稿件,均為環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來(lái)源為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶",并保留"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的電頭。
- OpenAI總裁透露GPT-5改了推理范式,AGI實(shí)現(xiàn)2025-08-18
- 新三板創(chuàng)新層公司鼎隆智裝登龍虎榜:當(dāng)日價(jià)2025-08-18
- 男籃非洲杯 | 尼日利亞、科特迪瓦晉級(jí)八2025-08-18
- 英超|焦點(diǎn)戰(zhàn)阿森納角球戰(zhàn)術(shù)智取曼聯(lián)|今日2025-08-18
- 男籃非洲杯 | 尼日利亞、科特迪瓦晉級(jí)八強(qiáng)2025-08-18
- 英超|焦點(diǎn)戰(zhàn)阿森納角球戰(zhàn)術(shù)智取曼聯(lián)2025-08-18
- 英超 | 一球憾負(fù)阿森納 曼聯(lián)將帥心有不甘2025-08-18
- 西甲:馬競(jìng)首戰(zhàn)遭逆轉(zhuǎn)不敵西班牙人2025-08-18
- 今頭條!國(guó)家數(shù)據(jù)局:今年將推出數(shù)據(jù)產(chǎn)權(quán)等2025-08-18
- 國(guó)家數(shù)據(jù)局:今年將推出數(shù)據(jù)產(chǎn)權(quán)等10余項(xiàng)制2025-08-18
- 新華社權(quán)威速覽·非凡“十四五”|“數(shù)字中2025-08-18
- 新華社權(quán)威速覽·非凡“十四五”|“數(shù)字中2025-08-18
- 新華社權(quán)威速覽·非凡“十四五”|“數(shù)字中2025-08-18
- 參賽之前先去打個(gè)卡 機(jī)器人“愛(ài)寶”探店北2025-08-18
- 新華社權(quán)威速覽·非凡“十四五”| “數(shù)字2025-08-18
- 生意社:8月18日天津地區(qū)金屬硅553價(jià)格行情2025-08-18
- 世界最大直徑水下盾構(gòu)隧道貫通2025-08-18
- 瑞銀:料聯(lián)想集團(tuán)(00992)次財(cái)季收入按季增2025-08-18
- 速訊:人形機(jī)器人:從“跑起來(lái)”到“用得上2025-08-18
- 安碩信息擬定增募不超6億 實(shí)控人方2季度套2025-08-18
- 博力威實(shí)控人方擬減持 2021年上市募6.5億2025-08-18
- 每日消息!滬深兩市全天成交2.76萬(wàn)億元 創(chuàng)2025-08-18
- 焦點(diǎn)熱門:古井無(wú)波可以形容眼睛嗎?古井無(wú)2025-08-18
- 前沿賽道競(jìng)相破土 未來(lái)產(chǎn)業(yè)拔節(jié)生長(zhǎng) 最新2025-08-18
- 百雀羚醫(yī)美亮劍西普會(huì),開(kāi)啟健康產(chǎn)業(yè)新征程2025-08-18
- 快資訊丨繽紛是形容什么的?五彩繽紛的意思2025-08-18
- 清涼需求撬動(dòng)空調(diào)產(chǎn)品“熱消費(fèi)”2025-08-18
- 秀我中國(guó)|機(jī)器人自由搏擊決賽“拳拳到鐵”2025-08-18
- 我國(guó)成功發(fā)射試驗(yàn)二十八號(hào)B星02星 今日熱議2025-08-18
- 能拆會(huì)跳!安徽自研機(jī)器人斬獲金銀獎(jiǎng)牌_今2025-08-18
- 男籃非洲杯 | 尼日利亞、科特迪瓦晉級(jí)八強(qiáng)-最資訊
- 簡(jiǎn)訊:安徽雙墩遺址揭秘7300年前先民“日記本”
- 今年7月河北省進(jìn)出口同比增長(zhǎng)10.1%_今亮點(diǎn)
- 焦點(diǎn)速遞!美團(tuán)青山計(jì)劃發(fā)布八周年報(bào)告 推動(dòng)24城回收塑料餐盒超3.7萬(wàn)噸
- 熱門:前7月云南對(duì)湄公河五國(guó)進(jìn)出口值超659億元
- 天津?yàn)I海新區(qū):“十四五”關(guān)鍵指標(biāo)躍升 改革開(kāi)放創(chuàng)新特質(zhì)凸顯
- 暑假安全提示,師生家長(zhǎng)一起看 焦點(diǎn)
- 9月起北京中小學(xué)將開(kāi)展人工智能通識(shí)教育 快訊
- 多舉措整治市場(chǎng)亂象 遏制未成年醫(yī)美歪風(fēng)
- 凈利持續(xù)下滑,中國(guó)利郎轉(zhuǎn)型還要多久|每日信息
資訊
- 熱資訊!湛江金融監(jiān)管分局核準(zhǔn)都偉豐雷州惠民村鎮(zhèn)銀行副行長(zhǎng)
- 2025年8月總票房破40億元
- 新消息丨近千人??诠矐c熊貓兄弟12周歲生日
- “絲路主播”電商實(shí)訓(xùn)營(yíng)在固原市涇源縣開(kāi)營(yíng)
- 兩市融資余額增加75.91億元
- 醫(yī)藥制造上市龍頭企業(yè)有哪些?(2025/8/15)-微速訊
- 二大光伏組串式逆變器龍頭,名單收好?。?025/8/15) 觀焦點(diǎn)
- 沙漠里也能養(yǎng)海鮮、種水稻?看新疆如何“點(diǎn)沙成金”|當(dāng)前熱訊
- OpenAI龍頭公司有哪幾家?(2025/8/15)_每日消息
- 廈門物流通道海鐵聯(lián)運(yùn)與中歐班列共促發(fā)展
焦點(diǎn)
- CCC認(rèn)證規(guī)則升級(jí),充電寶“持證上崗”再添“安全鎖”
- 快資訊:三大股指齊創(chuàng)多年新高 全市場(chǎng)近4500股上漲
- 【焦點(diǎn)熱聞】追光丨世運(yùn)會(huì)啦啦操賽場(chǎng),中國(guó)隊(duì)男生撐起“半邊天”!
- 2025航空產(chǎn)業(yè)鏈(2025/8/15)-焦點(diǎn)滾動(dòng)
- 投資者如何利用基金應(yīng)對(duì)通貨膨脹?|新消息
- 東吳證券給予科達(dá)利買入評(píng)級(jí),2025半年報(bào)點(diǎn)評(píng):主業(yè)收入持續(xù)提升,機(jī)器人穩(wěn)步推進(jìn) 今日熱聞
- 【快播報(bào)】2025世界人形機(jī)器人運(yùn)動(dòng)會(huì)的“隱形守護(hù)” :5G-A助力機(jī)器人賽出水平
- 廣州可統(tǒng)建材有限公司成立 注冊(cè)資本10萬(wàn)人民幣
- 每日速遞:開(kāi)館兩年仍用“樣片”遭質(zhì)疑,赤峰博物院等各方回應(yīng):不存在“拖欠尾款”
- 每日精選:至7月底廣東新能源累計(jì)并網(wǎng)容量破8000萬(wàn)千瓦