一级黄网站_波多野结衣片子_欧美性极品_熟女高潮一区二区三区_亚洲最大成人在线_xxx在线播放

目錄

紅杉資本 訪談 OpenAI 團(tuán)隊(duì):首次披露ChatGPT Agent研發(fā)內(nèi)幕

人工智能AI2025-07-23
紅杉資本日前舉辦了一場對(duì)話會(huì),與OpenAI ChatGPT Agent團(tuán)隊(duì)成員深入探討其技術(shù)創(chuàng)新與未來潛力。對(duì)話由紅杉資本兩位合伙人索尼婭·黃(Sonya Huang)和勞倫·里德(Lauren Reeder)共同主持,參與ChatGPT Agent發(fā)布活動(dòng)的OpenAI團(tuán)隊(duì)成員伊薩?富爾福德(Isa Fulford)、凱西·楚(Casey Chu)和孫之...

紅杉資本 訪談 OpenAI 團(tuán)隊(duì):首次披露ChatGPT Agent研發(fā)內(nèi)幕 -1.jpg

紅杉資本日前舉辦了一場對(duì)話會(huì),與OpenAI ChatGPT Agent團(tuán)隊(duì)成員深入探討其技術(shù)創(chuàng)新與未來潛力。對(duì)話由紅杉資本兩位合伙人索尼婭·黃(Sonya Huang)和勞倫·里德(Lauren Reeder)共同主持,參與ChatGPT Agent發(fā)布活動(dòng)的OpenAI團(tuán)隊(duì)成員伊薩?富爾福德(Isa Fulford)、凱西·楚(Casey Chu)和孫之清(Edward Sun)參加。

在這場對(duì)話中,他們分享了ChatGPT Agent的開發(fā)歷程,探討了ChatGPT Agent如何結(jié)合Deep Research和Operator的優(yōu)勢,實(shí)現(xiàn)跨領(lǐng)域任務(wù)的高效執(zhí)行。他們還討論了ChatGPT Agent的安全保障措施以及廣泛的應(yīng)用場景。

按照OpenAI的設(shè)想,ChatGPT Agent將具備更強(qiáng)的獨(dú)立判斷能力,能夠根據(jù)每個(gè)用戶的習(xí)慣和需求提供定制化服務(wù),并支持語音、文字、圖像等多種交流方式。未來,OpenAI將打造通用超級(jí)智能體,能夠處理人類在計(jì)算機(jī)上的近乎所有任務(wù)。

紅杉資本 訪談 OpenAI 團(tuán)隊(duì):首次披露ChatGPT Agent研發(fā)內(nèi)幕 -2.jpg

以下為對(duì)話內(nèi)容精簡版:

主持人:今天,我們將與OpenAI團(tuán)隊(duì)的富爾福德、凱西·楚和孫之清共同探討AI Agent的演進(jìn)歷程。你們開發(fā)了全新的ChatGPT Agent,請(qǐng)介紹一下它的核心功能和重大突破。

富爾福德:感謝邀請(qǐng)我們參加節(jié)目。ChatGPT Agent是Deep Research和Operator團(tuán)隊(duì)協(xié)作開發(fā)的成果。這款A(yù)I Agent能夠執(zhí)行復(fù)雜且耗時(shí)長達(dá)一小時(shí)的多步驟任務(wù)。我們?yōu)樗鋫淞艘粋€(gè)虛擬計(jì)算機(jī)環(huán)境,集成了文本瀏覽、視覺瀏覽、終端訪問和API集成等功能,所有這些工具共享狀態(tài),類似于人類使用計(jì)算機(jī)時(shí)多個(gè)應(yīng)用程序共享文件系統(tǒng)。

這種設(shè)計(jì)讓ChatGPT Agent能夠靈活處理各種復(fù)雜任務(wù),顯著提升效率和能力。我們對(duì)這款模型在多輪對(duì)話中的表現(xiàn)尤為滿意,它能持續(xù)處理任務(wù)并不斷改進(jìn)。未來,我們希望進(jìn)一步增強(qiáng)個(gè)性化和記憶功能,使ChatGPT Agent能夠在無需用戶主動(dòng)發(fā)起的情況下執(zhí)行任務(wù)。

01 誕生與演進(jìn)

主持人:能否分享一下這個(gè)項(xiàng)目的起源故事?它是如何開始的?

凱西·楚:這個(gè)項(xiàng)目源于Deep Research和Operator兩個(gè)產(chǎn)品的結(jié)合。2025年1月,我們發(fā)布了Operator,它能夠執(zhí)行在線購物等互聯(lián)網(wǎng)任務(wù)。

兩周后,我們推出了Deep Research,專注于瀏覽和綜合網(wǎng)絡(luò)信息,生成帶有引文的詳細(xì)研究報(bào)告。在制定未來發(fā)展路線時(shí),我們意識(shí)到這兩個(gè)產(chǎn)品可以互補(bǔ)。

Operator擅長處理視覺交互,例如點(diǎn)擊網(wǎng)頁元素,而Deep Research更擅長處理文本信息,例如閱讀長篇文章。用戶反饋顯示,他們希望Deep Research能訪問付費(fèi)內(nèi)容,而Operator已具備這種能力。因此,將兩者結(jié)合是一個(gè)自然而然的選擇。

孫之清:我們的團(tuán)隊(duì)通過統(tǒng)一Deep Research和Operator的架構(gòu),實(shí)現(xiàn)了能力的巨大飛躍。所有工具共享狀態(tài),用戶可以在文本分析、視覺瀏覽和代碼執(zhí)行之間流暢切換。我們沒有預(yù)先編程工具的使用模式,而是通過強(qiáng)化學(xué)習(xí),在數(shù)千個(gè)虛擬機(jī)上讓模型自行發(fā)現(xiàn)最佳策略。

這種方法使ChatGPT Agent能夠與用戶協(xié)作數(shù)小時(shí),提出澄清問題并接受任務(wù)中的更正,極大地?cái)U(kuò)展了與AI智能體的交互方式。我們還面臨安全性和任務(wù)復(fù)雜性等挑戰(zhàn),例如日期選擇對(duì)AI仍是一個(gè)難題。小型團(tuán)隊(duì)通過精心的數(shù)據(jù)篩選實(shí)現(xiàn)了突破,表明AI發(fā)展進(jìn)入了一個(gè)新階段,產(chǎn)品洞察與計(jì)算能力同樣重要。

富爾福德:ChatGPT Agent能夠執(zhí)行需要人類耗費(fèi)大量時(shí)間的復(fù)雜任務(wù)。我們?yōu)樗峁┝艘粋€(gè)虛擬計(jì)算機(jī)環(huán)境,包含多種工具:文本瀏覽器(類似于Deep Research工具),用于高效獲取在線信息;視覺瀏覽器(類似于Operator工具),能夠與圖形用戶界面交互,支持點(diǎn)擊、輸入表單、滾動(dòng)和拖動(dòng)等操作;以及終端工具,用于運(yùn)行代碼、分析文件、生成電子表格或幻燈片等成果物。

此外,通過API集成,ChatGPT Agent可以訪問GitHub、Google Drive、SharePoint等服務(wù),所有工具共享狀態(tài),類似于人類計(jì)算機(jī)上的應(yīng)用程序共享文件系統(tǒng)。這種設(shè)計(jì)使ChatGPT Agent能夠靈活應(yīng)對(duì)復(fù)雜任務(wù),為用戶提供強(qiáng)大支持。

主持人:能否詳細(xì)談?wù)勥@個(gè)結(jié)合的過程?如何實(shí)現(xiàn)“1+1大于2”的效果?

凱西·楚:我們的團(tuán)隊(duì)分別開發(fā)了Operator和Deep Research。Operator擅長處理視覺交互,例如在網(wǎng)頁上點(diǎn)擊或填寫表單,但不擅長閱讀長篇文章;Deep Research則擅長高效瀏覽和綜合文本信息,但難以處理交互性強(qiáng)的視覺元素。我們注意到用戶在Operator上嘗試Deep Research類型的任務(wù),例如“研究旅行然后預(yù)訂”。

因此,將兩者結(jié)合是自然的選擇。我們不僅融合了這兩個(gè)工具,還加入了終端工具、圖像生成工具和API調(diào)用功能,使ChatGPT Agent能夠執(zhí)行更廣泛的任務(wù)。例如,終端工具可以運(yùn)行命令進(jìn)行計(jì)算,圖像生成工具可以為幻燈片添加視覺元素,API調(diào)用可以生成PowerPoint演示文稿。

孫之清:這種結(jié)合顯著增強(qiáng)了ChatGPT Agent的能力。例如,它可以用文本瀏覽器高效搜索信息,然后切換到視覺瀏覽器查看圖片或交互元素,甚至在終端中運(yùn)行代碼生成成果物。所有工具共享狀態(tài),使ChatGPT Agent能夠像人類一樣無縫操作不同應(yīng)用程序。

我們的團(tuán)隊(duì)成員埃里克(Eric)分析了用戶在Operator上的提示,發(fā)現(xiàn)許多任務(wù)涉及Deep Research類型的需求,例如“研究旅行然后預(yù)訂”,這進(jìn)一步驗(yàn)證了結(jié)合的必要性。

02 多場景任務(wù)能力 

主持人:ChatGPT Agent的具體應(yīng)用場景有哪些?用戶如何使用它?

富爾福德:我們有意設(shè)計(jì)了一個(gè)開放式的智能體,命名為“ChatGPT Agent”,鼓勵(lì)用戶探索其潛力。我們訓(xùn)練它處理Deep Research任務(wù),例如生成詳細(xì)報(bào)告;訓(xùn)練它完成Operator任務(wù),例如預(yù)訂航班或在線購物;以及數(shù)據(jù)分析任務(wù),例如創(chuàng)建電子表格或幻燈片。其靈活性讓我們期待用戶會(huì)發(fā)現(xiàn)更多未曾預(yù)料的用途。

例如,Deep Research用戶意外發(fā)現(xiàn)了代碼搜索功能。我們希望ChatGPT Agent在消費(fèi)者和企業(yè)場景中都能發(fā)揮作用,例如幫助專業(yè)用戶生成詳細(xì)報(bào)告,或?yàn)閭€(gè)人用戶規(guī)劃活動(dòng)。無論是消費(fèi)者等待30分鐘獲取詳細(xì)報(bào)告,還是企業(yè)用戶在工作中使用,它都能勝任。

凱西·楚:我個(gè)人用它處理Google Docs中的數(shù)據(jù),生成展示數(shù)據(jù)的幻燈片。另一個(gè)有趣的案例是,我用它研究古DNA領(lǐng)域的新進(jìn)展。由于該領(lǐng)域信息分散且缺乏綜合參考資料,ChatGPT Agent能夠從網(wǎng)絡(luò)上收集信息,綜合成報(bào)告或幻燈片,極大地簡化了我的工作。

孫之清:我用它進(jìn)行在線購物,尤其是需要視覺瀏覽的場景,例如通過搜索過濾器查看商品圖片或選擇款式。它在規(guī)劃活動(dòng)方面也非常有用,例如安排行程或活動(dòng)。我最喜歡的購物任務(wù)是購買衣服,因?yàn)樵S多網(wǎng)站需要視覺瀏覽器來處理搜索過濾器或查看商品外觀。

主持人:你們之前還展示了一個(gè)很酷的案例,能否分享一下?

富爾福德:當(dāng)然!我們的同事讓ChatGPT Agent基于網(wǎng)絡(luò)信息估算OpenAI的估值,生成財(cái)務(wù)模型,包括電子表格、總結(jié)分析和展示結(jié)果的幻燈片。這個(gè)任務(wù)耗時(shí)28分鐘,展示出它處理長時(shí)間任務(wù)的能力。ChatGPT Agent的預(yù)測相當(dāng)大膽,而且幻燈片的質(zhì)量令人印象深刻!

凱西·楚:這個(gè)案例開啟了一種新范式:用戶提出任務(wù)后可以離開,ChatGPT Agent在一段時(shí)間后返回詳細(xì)報(bào)告。隨著ChatGPT Agent變得更具自主性,任務(wù)時(shí)間可能更長,這是一個(gè)很好的例證。

主持人:28分鐘已經(jīng)很長了!你們有更長時(shí)間的任務(wù)嗎?如何確保ChatGPT Agent長時(shí)間運(yùn)行不偏離軌道?

孫之清:我最近運(yùn)行了一個(gè)長達(dá)一小時(shí)的任務(wù),可能是我們見過的最長時(shí)間任務(wù)。為了確保穩(wěn)定性,我們開發(fā)了工具擴(kuò)展ChatGPT Agent的上下文長度,使其記錄任務(wù)進(jìn)展,逐步完成復(fù)雜任務(wù)。

此外,我們?cè)O(shè)計(jì)了靈活的人機(jī)交互機(jī)制,用戶可以隨時(shí)糾正ChatGPT Agent、提供額外指令或要求狀態(tài)更新。例如,用戶可以要求它總結(jié)當(dāng)前進(jìn)展,或補(bǔ)充指令,例如“我只想要藍(lán)色運(yùn)動(dòng)鞋”。

富爾福德:這種協(xié)作模式模仿了人們通過Slack溝通的方式。ChatGPT Agent會(huì)在需要時(shí)詢問權(quán)限或澄清問題,例如在執(zhí)行破壞性操作或需要登錄時(shí)征求用戶同意。

我們的界面還允許用戶實(shí)時(shí)監(jiān)控ChatGPT Agent的操作,甚至在任務(wù)完成后接管虛擬計(jì)算機(jī)環(huán)境,例如登錄賬戶或輸入信用卡信息。這種“觀察同事操作并隨時(shí)接手”的體驗(yàn)非常直觀,增強(qiáng)了用戶對(duì)ChatGPT Agent的控制感。

03 訓(xùn)練與突破

主持人:從技術(shù)角度看,ChatGPT Agent是如何訓(xùn)練的?

凱西·楚:我們采用了強(qiáng)化學(xué)習(xí)(RL)技術(shù),在虛擬機(jī)環(huán)境中為它提供文本瀏覽器、GUI瀏覽器、終端和圖像生成工具等。

我們?cè)O(shè)計(jì)了復(fù)雜任務(wù),讓ChatGPT Agent通過試驗(yàn)發(fā)現(xiàn)最佳工具使用策略,并根據(jù)任務(wù)完成的質(zhì)量和效率給予獎(jiǎng)勵(lì)。例如,ChatGPT Agent可能先用文本瀏覽器搜索餐廳信息,再用GUI瀏覽器查看菜品圖片和預(yù)訂可用性,或從網(wǎng)站下載數(shù)據(jù)后在終端中處理。這種共享狀態(tài)的工具設(shè)計(jì)使ChatGPT Agent能夠無縫切換工具,完成多樣化任務(wù)。

富爾福德:與以往的工具使用不同,所有工具共享狀態(tài),類似于人類在計(jì)算機(jī)上使用多個(gè)應(yīng)用程序。這種設(shè)計(jì)使ChatGPT Agent能高效處理互聯(lián)網(wǎng)、文件系統(tǒng)和代碼等交互任務(wù)。我們沒有預(yù)先指定工具使用規(guī)則,而是讓模型通過強(qiáng)化學(xué)習(xí)自行發(fā)現(xiàn)最佳策略,效果近乎神奇。強(qiáng)化學(xué)習(xí)的數(shù)據(jù)需求遠(yuǎn)小于預(yù)訓(xùn)練,我們通過精心篩選的高質(zhì)量數(shù)據(jù)集教授模型新技能。

孫之清:強(qiáng)化學(xué)習(xí)非常數(shù)據(jù)高效,我們只需少量高質(zhì)量數(shù)據(jù)集就能教授新技能。例如,我們創(chuàng)建了多樣化的任務(wù)集,包括查找小眾信息、撰寫長篇報(bào)告等。只要能評(píng)估輸出質(zhì)量,強(qiáng)化學(xué)習(xí)就能有效提升性能。為了讓Operator功能表現(xiàn)良好,我們?cè)谶^去兩三年里投入大量時(shí)間,使模型能夠理解視覺元素和頁面交互,為當(dāng)前的ChatGPT Agent奠定了基礎(chǔ)。

主持人:這種強(qiáng)化學(xué)習(xí)方法是OpenAI訓(xùn)練AI智能體的標(biāo)準(zhǔn)方法嗎?

富爾福德:我們認(rèn)為這種方法潛力巨大。這次發(fā)布是我們團(tuán)隊(duì)合作后的最簡可行產(chǎn)品(Minimum Viable Product,MVP),但已展現(xiàn)強(qiáng)大能力。例如,幻燈片生成功能已非常出色,感謝眾多團(tuán)隊(duì)成員的努力。我們相信通過同樣的技術(shù)可以進(jìn)一步提升,但可能還需引入其他技術(shù)。

凱西·楚:這種方法非常神奇,同樣的強(qiáng)化學(xué)習(xí)算法適用于Deep Research、Operator以及現(xiàn)在的計(jì)算機(jī)使用ChatGPT Agent。我們?cè)诙虝r(shí)間內(nèi)取得了這些成果,未來還有很大提升空間。

主持人:強(qiáng)化學(xué)習(xí)在交互性方面有什么特別的訓(xùn)練方法嗎?

孫之清:我們主要關(guān)注端到端性能,從用戶提示到任務(wù)完成。ChatGPT Agent在與用戶交互方面表現(xiàn)良好,部分原因是我們?cè)谟?xùn)練中納入了多樣化的任務(wù)軌跡。用戶可隨時(shí)干預(yù),提供澄清或更正,它也能根據(jù)反饋調(diào)整行為。

主持人:早期的World of Bits項(xiàng)目(OpenAI開發(fā)的通用AI訓(xùn)練平臺(tái))嘗試用強(qiáng)化學(xué)習(xí)控制鼠標(biāo)路徑,但問題過于復(fù)雜。現(xiàn)在有什么變化使這個(gè)問題變得可解?

孫之清:ChatGPT Agent的開發(fā)可追溯到2017年的World of Bits項(xiàng)目,我們戲稱其為“World of Bits 2”。最大的變化是訓(xùn)練規(guī)模的提升,無論是預(yù)訓(xùn)練還是強(qiáng)化學(xué)習(xí),計(jì)算量可能增加了數(shù)十萬倍。數(shù)據(jù)規(guī)模和計(jì)算能力的提升使我們的目標(biāo)得以實(shí)現(xiàn)。

04 如何防止“失控”   

主持人:ChatGPT Agent在執(zhí)行外部操作時(shí),如何確保安全性和可靠性?

富爾福德:由于ChatGPT Agent能夠與外部世界交互,例如訪問網(wǎng)站或調(diào)用API,安全是核心關(guān)注點(diǎn)。

相比Deep Research的只讀模式,ChatGPT Agent可能引發(fā)更大風(fēng)險(xiǎn),例如在完成任務(wù)時(shí)執(zhí)行意外的破壞性操作,如購買100個(gè)不同選項(xiàng)以確保用戶滿意。為此,我們實(shí)施了多層次安全措施,包括內(nèi)部和外部紅隊(duì)測試、實(shí)時(shí)監(jiān)控系統(tǒng)(類似于防病毒軟件)以及快速響應(yīng)新威脅的協(xié)議。我們特別關(guān)注生物風(fēng)險(xiǎn)等嚴(yán)重問題,例如防止ChatGPT Agent被用于創(chuàng)建生物武器。

凱西·楚:互聯(lián)網(wǎng)充滿風(fēng)險(xiǎn),存在釣魚攻擊、欺詐等威脅。我們的模型經(jīng)過安全訓(xùn)練,能識(shí)別部分風(fēng)險(xiǎn),但有時(shí)可能過于急于完成任務(wù)而被欺騙。我們開發(fā)了一個(gè)實(shí)時(shí)監(jiān)控系統(tǒng),檢查ChatGPT Agent的行為,若發(fā)現(xiàn)可疑操作(如訪問異常網(wǎng)站),會(huì)立即暫停任務(wù)。

此外,我們有協(xié)議快速響應(yīng)新威脅,類似于更新防病毒軟件。感謝公司生物風(fēng)險(xiǎn)團(tuán)隊(duì)的緩解工作,我們進(jìn)行了數(shù)周的紅隊(duì)測試,確保模型不會(huì)被用于有害用途。

富爾福德:安全訓(xùn)練是一個(gè)跨團(tuán)隊(duì)努力,涉及安全、治理、法律、研究和工程團(tuán)隊(duì)。我們?cè)诿總€(gè)層面實(shí)施了防護(hù)措施,并將繼續(xù)迭代以應(yīng)對(duì)新威脅。例如,我們確保ChatGPT Agent在執(zhí)行敏感操作(如登錄銀行賬戶)前會(huì)征求用戶許可。

05 背后的團(tuán)隊(duì)協(xié)作

主持人:開發(fā)團(tuán)隊(duì)是如何協(xié)作的?規(guī)模如何?

富爾福德:我們的團(tuán)隊(duì)由Deep Research和Operator的研究與應(yīng)用團(tuán)隊(duì)合并而成,總?cè)藬?shù)并不多。Deep Research團(tuán)隊(duì)最初只有3-4人,Operator團(tuán)隊(duì)約6-8人,加上由亞什?庫馬爾(Yash kumar)領(lǐng)導(dǎo)的優(yōu)秀工程和產(chǎn)品設(shè)計(jì)團(tuán)隊(duì)。研究與應(yīng)用團(tuán)隊(duì)緊密合作,從定義產(chǎn)品功能到模型訓(xùn)練均以用戶場景為導(dǎo)向。這種小團(tuán)隊(duì)協(xié)作使我們?cè)诙虝r(shí)間內(nèi)取得了顯著成果。

凱西·楚:研究與應(yīng)用團(tuán)隊(duì)的界限并不嚴(yán)格。應(yīng)用工程師參與模型訓(xùn)練,研究人員也參與模型部署。這種跨職能合作使項(xiàng)目充滿活力,團(tuán)隊(duì)氛圍非常好。富爾福德和我是老朋友,這種默契也促進(jìn)了團(tuán)隊(duì)合作。

孫之清:小團(tuán)隊(duì)能成就大事。我們?cè)趲讉€(gè)月內(nèi)完成了這個(gè)項(xiàng)目,研究與應(yīng)用團(tuán)隊(duì)從一開始就共同定義產(chǎn)品功能,確保以用戶需求為導(dǎo)向。雖然ChatGPT Agent尚未完全實(shí)現(xiàn)所有目標(biāo),但這種框架使我們能夠快速迭代。

主持人:訓(xùn)練過程中最大的挑戰(zhàn)是什么?

孫之清:訓(xùn)練的穩(wěn)定性是一個(gè)巨大挑戰(zhàn)。Deep Research只涉及文本瀏覽和Python,而ChatGPT Agent需同時(shí)處理多種新工具,如GUI瀏覽器、終端、圖像生成工具和API調(diào)用,所有這些都在同一虛擬機(jī)環(huán)境中運(yùn)行。我們需要同時(shí)運(yùn)行成千上萬的虛擬機(jī)訪問網(wǎng)絡(luò),經(jīng)常遇到網(wǎng)站宕機(jī)、API限制或網(wǎng)絡(luò)容量不足等問題。

例如,某些網(wǎng)站可能因流量過載而暫時(shí)不可用,或者API調(diào)用因速率限制而失敗,這要求我們?cè)谟?xùn)練中加入魯棒性機(jī)制,確保ChatGPT Agent能處理這些異常情況。盡管面臨這些挑戰(zhàn),我們通過優(yōu)化虛擬機(jī)環(huán)境和改進(jìn)訓(xùn)練算法,最終成功訓(xùn)練了模型,使其在多樣化任務(wù)中表現(xiàn)出色。

富爾福德:未來,我們希望進(jìn)一步提升ChatGPT Agent的多輪對(duì)話能力、個(gè)性化和記憶功能。目前,所有任務(wù)都由用戶發(fā)起,但我們?cè)O(shè)想ChatGPT Agent未來能夠自主識(shí)別用戶需求并主動(dòng)執(zhí)行任務(wù)。例如,它可能根據(jù)用戶歷史行為預(yù)測需求,自動(dòng)生成報(bào)告或規(guī)劃活動(dòng)。

我們也在探索新的用戶界面和交互模式,例如更直觀的非聊天式交互方式、語音指令或圖形化界面等,以提升用戶體驗(yàn)。此外,我們計(jì)劃優(yōu)化ChatGPT Agent的上下文管理,使其在長時(shí)間任務(wù)中更好地保持任務(wù)連貫性,同時(shí)減少對(duì)計(jì)算資源的依賴。

凱西·楚:從編碼角度看,我發(fā)現(xiàn)ChatGPT Agent在代碼搜索和小型代碼編輯方面表現(xiàn)優(yōu)異,因?yàn)樗軠?zhǔn)確讀取文檔并減少幻覺。例如,它可以通過API訪問GitHub,搜索特定代碼庫并提取相關(guān)代碼片段。我用它處理類似o3的交互式編碼任務(wù),而Codex更適合解決明確定義的問題。用戶會(huì)發(fā)現(xiàn)更多新用例,如Deep Research用戶發(fā)現(xiàn)的代碼搜索功能。

未來,我們希望ChatGPT Agent在編程任務(wù)中進(jìn)一步提升,比如支持更復(fù)雜的代碼調(diào)試或自動(dòng)化生成完整應(yīng)用程序。此外,我們正在研究如何讓ChatGPT Agent更好地理解用戶意圖,例如在代碼編輯中自動(dòng)推斷用戶想要的功能,而無需詳細(xì)指令。

06 打造通用超級(jí)智能體

主持人:你們會(huì)開發(fā)專門的子智能體,例如財(cái)務(wù)分析智能體或活動(dòng)策劃智能體,還是堅(jiān)持單一超級(jí)智能體的愿景?

富爾福德: 我們傾向于打造一個(gè)通用的超級(jí)智能體。如果一個(gè)智能體能根據(jù)需求靈活調(diào)用所有工具,就像一位全能的首席幕僚,這將是簡單高效的解決方案。

我們的訓(xùn)練數(shù)據(jù)顯示,不同任務(wù)之間存在正向遷移,例如在購物任務(wù)中學(xué)習(xí)到的視覺交互技能可應(yīng)用于研究任務(wù)中的網(wǎng)頁導(dǎo)航。因此,單一智能體模型在擴(kuò)展性和通用性上更具潛力。我們希望通過持續(xù)優(yōu)化,讓ChatGPT Agent能夠無縫處理從簡單查詢到復(fù)雜工作流的各種任務(wù),減少用戶對(duì)多個(gè)專用模型的依賴。

凱西·楚:雖然在產(chǎn)品發(fā)布時(shí),定制化模型可能有市場價(jià)值,但從訓(xùn)練角度看,通用智能體能更好地利用技能的可遷移特性。例如,ChatGPT Agent在購物任務(wù)中可能使用終端進(jìn)行預(yù)算計(jì)算,無需專門的財(cái)務(wù)分析工具。我們也在探索如何通過強(qiáng)化學(xué)習(xí)進(jìn)一步提高它的泛化能力,例如讓它在遇到全新任務(wù)時(shí)快速適應(yīng),而無需大量額外訓(xùn)練數(shù)據(jù)。未來,ChatGPT Agent可能通過學(xué)習(xí)用戶反饋,動(dòng)態(tài)調(diào)整其行為模式,進(jìn)一步提升任務(wù)完成的精準(zhǔn)度。

孫之清:我們的目標(biāo)是讓ChatGPT Agent處理人類在計(jì)算機(jī)上執(zhí)行的幾乎所有任務(wù)。用戶甚至可以要求它‘嘗試在網(wǎng)上賺錢’,盡管目前執(zhí)行尚不完美。我們將通過迭代部署提高任務(wù)完成的質(zhì)量和準(zhǔn)確性。例如,我們計(jì)劃優(yōu)化ChatGPT Agent在復(fù)雜任務(wù)中的決策過程,減少錯(cuò)誤操作的可能性,同時(shí)提高其在動(dòng)態(tài)環(huán)境中的適應(yīng)能力。此外,我們希望通過用戶反饋和實(shí)際使用數(shù)據(jù),持續(xù)改進(jìn)ChatGPT Agent的性能,使其在處理跨領(lǐng)域任務(wù)時(shí)更加智能和高效。

主持人:展望未來,你們對(duì)ChatGPT Agent的愿景是什么?

富爾福德:我們?yōu)镃hatGPT Agent提供了涵蓋人類在計(jì)算機(jī)上所能完成大部分任務(wù)的工具集。我們將致力于提升模型在多樣化任務(wù)上的表現(xiàn),優(yōu)化用戶交互體驗(yàn),探索新的交互模式,例如更個(gè)性化的記憶功能或自主任務(wù)發(fā)起。

我們希望ChatGPT Agent未來能夠自主感知并響應(yīng)用戶需求。例如,ChatGPT Agent可能根據(jù)用戶日程自動(dòng)規(guī)劃會(huì)議,或根據(jù)歷史偏好推薦個(gè)性化解決方案。

凱西·楚:我們對(duì)改進(jìn)用戶界面和體驗(yàn)感到興奮。當(dāng)前基于聊天的交互僅是起點(diǎn),未來可能有更多創(chuàng)新交互方式,例如基于手勢或多模態(tài)輸入的界面。

我們希望用戶發(fā)現(xiàn)ChatGPT Agent的新能力,如Deep Research用戶發(fā)現(xiàn)的代碼搜索功能。例如,ChatGPT Agent在數(shù)據(jù)科學(xué)任務(wù)中已超越人類基準(zhǔn),感謝同事約翰·布萊克曼(John Blackman)在電子表格和數(shù)據(jù)分析方面的努力。未來,我們計(jì)劃讓ChatGPT Agent在數(shù)據(jù)處理和可視化方面進(jìn)一步提升,例如自動(dòng)生成交互式儀表板。

孫之清:自1月發(fā)布Operator以來,我們顯著提高了點(diǎn)擊和表單填寫的準(zhǔn)確性,盡管日期選擇等任務(wù)仍有改進(jìn)空間。我們?yōu)镃hatGPT Agent提供了通用工具集,涵蓋人類在計(jì)算機(jī)上的大部分任務(wù)。未來的挑戰(zhàn)是確保模型在所有任務(wù)上表現(xiàn)出色,并開發(fā)新的交互范式,例如更自然的語音交互或?qū)崟r(shí)協(xié)作工具。我們期待用戶與ChatGPT Agent形成更自然的協(xié)作關(guān)系,開啟AI智能體的新時(shí)代。


標(biāo)簽OpenAIChatGPT

掃描二維碼手機(jī)訪問

文章目錄
主站蜘蛛池模板: 欧美激情免费视频 | 九九热在线免费观看 | 色多多网站| 91成年视频 | 国产九九热 | 日本wwww色 | 成人免费视频一区二区 | 亚洲精品成人 | 97av在线视频 | 日本伊人网 | 神马影院久久 | 成人羞羞国产免费图片 | 成人在线免费网站 | 欧美黄色激情视频 | 91精品婷婷国产综合久久蝌蚪 | 激情六月婷婷 | 中文字幕亚洲精品 | 欧美日皮视频 | 日韩欧美91| 精品毛片在线观看 | 国产99精品 | 成人激情综合 | 亚洲国产高清在线 | 精久久久久久久 | 亚洲毛片一区 | 国产日韩在线观看视频 | 欧美又大粗又爽又黄大片视频 | 婷婷视频网 | 黄色a级大片 | 黄色在线免费观看 | 亚洲免费高清 | 国产精品zjzjzj在线观看 | 亚洲在线视频免费观看 | 亚洲一区二区三区免费 | 亚洲天天影视 | 欧美 日韩 中文字幕 | av在线播放网| 久久久97| 一个色在线视频 | 91免费高清视频 | 国产成人精品亚洲线观看 |