一级黄网站_波多野结衣片子_欧美性极品_熟女高潮一区二区三区_亚洲最大成人在线_xxx在线播放

<del id="ke92w"></del>

<address id="ke92w"></address>

<pre id="ke92w"></pre>

首頁人工智能AI 正文

目錄

紅杉資本訪談 OpenAI 團(tuán)隊(duì)：首次披露ChatGPT Agent研發(fā)內(nèi)幕

人工智能AI2025-07-23

紅杉資本日前舉辦了一場對(duì)話會(huì)，與OpenAI ChatGPT Agent團(tuán)隊(duì)成員深入探討其技術(shù)創(chuàng)新與未來潛力。對(duì)話由紅杉資本兩位合伙人索尼婭·黃（Sonya Huang）和勞倫·里德（Lauren Reeder）共同主持，參與ChatGPT Agent發(fā)布活動(dòng)的OpenAI團(tuán)隊(duì)成員伊薩?富爾福德（Isa Fulford）、凱西·楚（Casey Chu）和孫之...

紅杉資本訪談 OpenAI 團(tuán)隊(duì)：首次披露ChatGPT Agent研發(fā)內(nèi)幕 -1.jpg

紅杉資本日前舉辦了一場對(duì)話會(huì)，與OpenAI ChatGPT Agent團(tuán)隊(duì)成員深入探討其技術(shù)創(chuàng)新與未來潛力。對(duì)話由紅杉資本兩位合伙人索尼婭·黃（Sonya Huang）和勞倫·里德（Lauren Reeder）共同主持，參與ChatGPT Agent發(fā)布活動(dòng)的OpenAI團(tuán)隊(duì)成員伊薩?富爾福德（Isa Fulford）、凱西·楚（Casey Chu）和孫之清（Edward Sun）參加。

在這場對(duì)話中，他們分享了ChatGPT Agent的開發(fā)歷程，探討了ChatGPT Agent如何結(jié)合Deep Research和Operator的優(yōu)勢，實(shí)現(xiàn)跨領(lǐng)域任務(wù)的高效執(zhí)行。他們還討論了ChatGPT Agent的安全保障措施以及廣泛的應(yīng)用場景。

按照OpenAI的設(shè)想，ChatGPT Agent將具備更強(qiáng)的獨(dú)立判斷能力，能夠根據(jù)每個(gè)用戶的習(xí)慣和需求提供定制化服務(wù)，并支持語音、文字、圖像等多種交流方式。未來，OpenAI將打造通用超級(jí)智能體，能夠處理人類在計(jì)算機(jī)上的近乎所有任務(wù)。

紅杉資本訪談 OpenAI 團(tuán)隊(duì)：首次披露ChatGPT Agent研發(fā)內(nèi)幕 -2.jpg

以下為對(duì)話內(nèi)容精簡版：

主持人：今天，我們將與OpenAI團(tuán)隊(duì)的富爾福德、凱西·楚和孫之清共同探討AI Agent的演進(jìn)歷程。你們開發(fā)了全新的ChatGPT Agent，請(qǐng)介紹一下它的核心功能和重大突破。

富爾福德：感謝邀請(qǐng)我們參加節(jié)目。ChatGPT Agent是Deep Research和Operator團(tuán)隊(duì)協(xié)作開發(fā)的成果。這款A(yù)I Agent能夠執(zhí)行復(fù)雜且耗時(shí)長達(dá)一小時(shí)的多步驟任務(wù)。我們?yōu)樗鋫淞艘粋€(gè)虛擬計(jì)算機(jī)環(huán)境，集成了文本瀏覽、視覺瀏覽、終端訪問和API集成等功能，所有這些工具共享狀態(tài)，類似于人類使用計(jì)算機(jī)時(shí)多個(gè)應(yīng)用程序共享文件系統(tǒng)。

這種設(shè)計(jì)讓ChatGPT Agent能夠靈活處理各種復(fù)雜任務(wù)，顯著提升效率和能力。我們對(duì)這款模型在多輪對(duì)話中的表現(xiàn)尤為滿意，它能持續(xù)處理任務(wù)并不斷改進(jìn)。未來，我們希望進(jìn)一步增強(qiáng)個(gè)性化和記憶功能，使ChatGPT Agent能夠在無需用戶主動(dòng)發(fā)起的情況下執(zhí)行任務(wù)。

01 誕生與演進(jìn)

主持人：能否分享一下這個(gè)項(xiàng)目的起源故事？它是如何開始的？

凱西·楚：這個(gè)項(xiàng)目源于Deep Research和Operator兩個(gè)產(chǎn)品的結(jié)合。2025年1月，我們發(fā)布了Operator，它能夠執(zhí)行在線購物等互聯(lián)網(wǎng)任務(wù)。

兩周后，我們推出了Deep Research，專注于瀏覽和綜合網(wǎng)絡(luò)信息，生成帶有引文的詳細(xì)研究報(bào)告。在制定未來發(fā)展路線時(shí)，我們意識(shí)到這兩個(gè)產(chǎn)品可以互補(bǔ)。

Operator擅長處理視覺交互，例如點(diǎn)擊網(wǎng)頁元素，而Deep Research更擅長處理文本信息，例如閱讀長篇文章。用戶反饋顯示，他們希望Deep Research能訪問付費(fèi)內(nèi)容，而Operator已具備這種能力。因此，將兩者結(jié)合是一個(gè)自然而然的選擇。

孫之清：我們的團(tuán)隊(duì)通過統(tǒng)一Deep Research和Operator的架構(gòu)，實(shí)現(xiàn)了能力的巨大飛躍。所有工具共享狀態(tài)，用戶可以在文本分析、視覺瀏覽和代碼執(zhí)行之間流暢切換。我們沒有預(yù)先編程工具的使用模式，而是通過強(qiáng)化學(xué)習(xí)，在數(shù)千個(gè)虛擬機(jī)上讓模型自行發(fā)現(xiàn)最佳策略。

這種方法使ChatGPT Agent能夠與用戶協(xié)作數(shù)小時(shí)，提出澄清問題并接受任務(wù)中的更正，極大地?cái)U(kuò)展了與AI智能體的交互方式。我們還面臨安全性和任務(wù)復(fù)雜性等挑戰(zhàn)，例如日期選擇對(duì)AI仍是一個(gè)難題。小型團(tuán)隊(duì)通過精心的數(shù)據(jù)篩選實(shí)現(xiàn)了突破，表明AI發(fā)展進(jìn)入了一個(gè)新階段，產(chǎn)品洞察與計(jì)算能力同樣重要。

富爾福德：ChatGPT Agent能夠執(zhí)行需要人類耗費(fèi)大量時(shí)間的復(fù)雜任務(wù)。我們?yōu)樗峁┝艘粋€(gè)虛擬計(jì)算機(jī)環(huán)境，包含多種工具：文本瀏覽器（類似于Deep Research工具），用于高效獲取在線信息；視覺瀏覽器（類似于Operator工具），能夠與圖形用戶界面交互，支持點(diǎn)擊、輸入表單、滾動(dòng)和拖動(dòng)等操作；以及終端工具，用于運(yùn)行代碼、分析文件、生成電子表格或幻燈片等成果物。

此外，通過API集成，ChatGPT Agent可以訪問GitHub、Google Drive、SharePoint等服務(wù)，所有工具共享狀態(tài)，類似于人類計(jì)算機(jī)上的應(yīng)用程序共享文件系統(tǒng)。這種設(shè)計(jì)使ChatGPT Agent能夠靈活應(yīng)對(duì)復(fù)雜任務(wù)，為用戶提供強(qiáng)大支持。

主持人：能否詳細(xì)談?wù)勥@個(gè)結(jié)合的過程？如何實(shí)現(xiàn)“1+1大于2”的效果？

凱西·楚：我們的團(tuán)隊(duì)分別開發(fā)了Operator和Deep Research。Operator擅長處理視覺交互，例如在網(wǎng)頁上點(diǎn)擊或填寫表單，但不擅長閱讀長篇文章；Deep Research則擅長高效瀏覽和綜合文本信息，但難以處理交互性強(qiáng)的視覺元素。我們注意到用戶在Operator上嘗試Deep Research類型的任務(wù)，例如“研究旅行然后預(yù)訂”。

因此，將兩者結(jié)合是自然的選擇。我們不僅融合了這兩個(gè)工具，還加入了終端工具、圖像生成工具和API調(diào)用功能，使ChatGPT Agent能夠執(zhí)行更廣泛的任務(wù)。例如，終端工具可以運(yùn)行命令進(jìn)行計(jì)算，圖像生成工具可以為幻燈片添加視覺元素，API調(diào)用可以生成PowerPoint演示文稿。

孫之清：這種結(jié)合顯著增強(qiáng)了ChatGPT Agent的能力。例如，它可以用文本瀏覽器高效搜索信息，然后切換到視覺瀏覽器查看圖片或交互元素，甚至在終端中運(yùn)行代碼生成成果物。所有工具共享狀態(tài)，使ChatGPT Agent能夠像人類一樣無縫操作不同應(yīng)用程序。

我們的團(tuán)隊(duì)成員埃里克（Eric）分析了用戶在Operator上的提示，發(fā)現(xiàn)許多任務(wù)涉及Deep Research類型的需求，例如“研究旅行然后預(yù)訂”，這進(jìn)一步驗(yàn)證了結(jié)合的必要性。

02 多場景任務(wù)能力

主持人：ChatGPT Agent的具體應(yīng)用場景有哪些？用戶如何使用它？

富爾福德：我們有意設(shè)計(jì)了一個(gè)開放式的智能體，命名為“ChatGPT Agent”，鼓勵(lì)用戶探索其潛力。我們訓(xùn)練它處理Deep Research任務(wù)，例如生成詳細(xì)報(bào)告；訓(xùn)練它完成Operator任務(wù)，例如預(yù)訂航班或在線購物；以及數(shù)據(jù)分析任務(wù)，例如創(chuàng)建電子表格或幻燈片。其靈活性讓我們期待用戶會(huì)發(fā)現(xiàn)更多未曾預(yù)料的用途。

例如，Deep Research用戶意外發(fā)現(xiàn)了代碼搜索功能。我們希望ChatGPT Agent在消費(fèi)者和企業(yè)場景中都能發(fā)揮作用，例如幫助專業(yè)用戶生成詳細(xì)報(bào)告，或?yàn)閭€(gè)人用戶規(guī)劃活動(dòng)。無論是消費(fèi)者等待30分鐘獲取詳細(xì)報(bào)告，還是企業(yè)用戶在工作中使用，它都能勝任。

凱西·楚：我個(gè)人用它處理Google Docs中的數(shù)據(jù)，生成展示數(shù)據(jù)的幻燈片。另一個(gè)有趣的案例是，我用它研究古DNA領(lǐng)域的新進(jìn)展。由于該領(lǐng)域信息分散且缺乏綜合參考資料，ChatGPT Agent能夠從網(wǎng)絡(luò)上收集信息，綜合成報(bào)告或幻燈片，極大地簡化了我的工作。

孫之清：我用它進(jìn)行在線購物，尤其是需要視覺瀏覽的場景，例如通過搜索過濾器查看商品圖片或選擇款式。它在規(guī)劃活動(dòng)方面也非常有用，例如安排行程或活動(dòng)。我最喜歡的購物任務(wù)是購買衣服，因?yàn)樵S多網(wǎng)站需要視覺瀏覽器來處理搜索過濾器或查看商品外觀。

主持人：你們之前還展示了一個(gè)很酷的案例，能否分享一下？

富爾福德：當(dāng)然！我們的同事讓ChatGPT Agent基于網(wǎng)絡(luò)信息估算OpenAI的估值，生成財(cái)務(wù)模型，包括電子表格、總結(jié)分析和展示結(jié)果的幻燈片。這個(gè)任務(wù)耗時(shí)28分鐘，展示出它處理長時(shí)間任務(wù)的能力。ChatGPT Agent的預(yù)測相當(dāng)大膽，而且幻燈片的質(zhì)量令人印象深刻！

凱西·楚：這個(gè)案例開啟了一種新范式：用戶提出任務(wù)后可以離開，ChatGPT Agent在一段時(shí)間后返回詳細(xì)報(bào)告。隨著ChatGPT Agent變得更具自主性，任務(wù)時(shí)間可能更長，這是一個(gè)很好的例證。

主持人：28分鐘已經(jīng)很長了！你們有更長時(shí)間的任務(wù)嗎？如何確保ChatGPT Agent長時(shí)間運(yùn)行不偏離軌道？

孫之清：我最近運(yùn)行了一個(gè)長達(dá)一小時(shí)的任務(wù)，可能是我們見過的最長時(shí)間任務(wù)。為了確保穩(wěn)定性，我們開發(fā)了工具擴(kuò)展ChatGPT Agent的上下文長度，使其記錄任務(wù)進(jìn)展，逐步完成復(fù)雜任務(wù)。

此外，我們?cè)O(shè)計(jì)了靈活的人機(jī)交互機(jī)制，用戶可以隨時(shí)糾正ChatGPT Agent、提供額外指令或要求狀態(tài)更新。例如，用戶可以要求它總結(jié)當(dāng)前進(jìn)展，或補(bǔ)充指令，例如“我只想要藍(lán)色運(yùn)動(dòng)鞋”。

富爾福德：這種協(xié)作模式模仿了人們通過Slack溝通的方式。ChatGPT Agent會(huì)在需要時(shí)詢問權(quán)限或澄清問題，例如在執(zhí)行破壞性操作或需要登錄時(shí)征求用戶同意。

我們的界面還允許用戶實(shí)時(shí)監(jiān)控ChatGPT Agent的操作，甚至在任務(wù)完成后接管虛擬計(jì)算機(jī)環(huán)境，例如登錄賬戶或輸入信用卡信息。這種“觀察同事操作并隨時(shí)接手”的體驗(yàn)非常直觀，增強(qiáng)了用戶對(duì)ChatGPT Agent的控制感。

03 訓(xùn)練與突破

主持人：從技術(shù)角度看，ChatGPT Agent是如何訓(xùn)練的？

凱西·楚：我們采用了強(qiáng)化學(xué)習(xí)（RL）技術(shù)，在虛擬機(jī)環(huán)境中為它提供文本瀏覽器、GUI瀏覽器、終端和圖像生成工具等。

我們?cè)O(shè)計(jì)了復(fù)雜任務(wù)，讓ChatGPT Agent通過試驗(yàn)發(fā)現(xiàn)最佳工具使用策略，并根據(jù)任務(wù)完成的質(zhì)量和效率給予獎(jiǎng)勵(lì)。例如，ChatGPT Agent可能先用文本瀏覽器搜索餐廳信息，再用GUI瀏覽器查看菜品圖片和預(yù)訂可用性，或從網(wǎng)站下載數(shù)據(jù)后在終端中處理。這種共享狀態(tài)的工具設(shè)計(jì)使ChatGPT Agent能夠無縫切換工具，完成多樣化任務(wù)。

富爾福德：與以往的工具使用不同，所有工具共享狀態(tài)，類似于人類在計(jì)算機(jī)上使用多個(gè)應(yīng)用程序。這種設(shè)計(jì)使ChatGPT Agent能高效處理互聯(lián)網(wǎng)、文件系統(tǒng)和代碼等交互任務(wù)。我們沒有預(yù)先指定工具使用規(guī)則，而是讓模型通過強(qiáng)化學(xué)習(xí)自行發(fā)現(xiàn)最佳策略，效果近乎神奇。強(qiáng)化學(xué)習(xí)的數(shù)據(jù)需求遠(yuǎn)小于預(yù)訓(xùn)練，我們通過精心篩選的高質(zhì)量數(shù)據(jù)集教授模型新技能。

孫之清：強(qiáng)化學(xué)習(xí)非常數(shù)據(jù)高效，我們只需少量高質(zhì)量數(shù)據(jù)集就能教授新技能。例如，我們創(chuàng)建了多樣化的任務(wù)集，包括查找小眾信息、撰寫長篇報(bào)告等。只要能評(píng)估輸出質(zhì)量，強(qiáng)化學(xué)習(xí)就能有效提升性能。為了讓Operator功能表現(xiàn)良好，我們?cè)谶^去兩三年里投入大量時(shí)間，使模型能夠理解視覺元素和頁面交互，為當(dāng)前的ChatGPT Agent奠定了基礎(chǔ)。

主持人：這種強(qiáng)化學(xué)習(xí)方法是OpenAI訓(xùn)練AI智能體的標(biāo)準(zhǔn)方法嗎？

富爾福德：我們認(rèn)為這種方法潛力巨大。這次發(fā)布是我們團(tuán)隊(duì)合作后的最簡可行產(chǎn)品（Minimum Viable Product，MVP），但已展現(xiàn)強(qiáng)大能力。例如，幻燈片生成功能已非常出色，感謝眾多團(tuán)隊(duì)成員的努力。我們相信通過同樣的技術(shù)可以進(jìn)一步提升，但可能還需引入其他技術(shù)。

凱西·楚：這種方法非常神奇，同樣的強(qiáng)化學(xué)習(xí)算法適用于Deep Research、Operator以及現(xiàn)在的計(jì)算機(jī)使用ChatGPT Agent。我們?cè)诙虝r(shí)間內(nèi)取得了這些成果，未來還有很大提升空間。

主持人：強(qiáng)化學(xué)習(xí)在交互性方面有什么特別的訓(xùn)練方法嗎？

孫之清：我們主要關(guān)注端到端性能，從用戶提示到任務(wù)完成。ChatGPT Agent在與用戶交互方面表現(xiàn)良好，部分原因是我們?cè)谟?xùn)練中納入了多樣化的任務(wù)軌跡。用戶可隨時(shí)干預(yù)，提供澄清或更正，它也能根據(jù)反饋調(diào)整行為。

主持人：早期的World of Bits項(xiàng)目（OpenAI開發(fā)的通用AI訓(xùn)練平臺(tái)）嘗試用強(qiáng)化學(xué)習(xí)控制鼠標(biāo)路徑，但問題過于復(fù)雜。現(xiàn)在有什么變化使這個(gè)問題變得可解？

孫之清：ChatGPT Agent的開發(fā)可追溯到2017年的World of Bits項(xiàng)目，我們戲稱其為“World of Bits 2”。最大的變化是訓(xùn)練規(guī)模的提升，無論是預(yù)訓(xùn)練還是強(qiáng)化學(xué)習(xí)，計(jì)算量可能增加了數(shù)十萬倍。數(shù)據(jù)規(guī)模和計(jì)算能力的提升使我們的目標(biāo)得以實(shí)現(xiàn)。

04 如何防止“失控”

主持人：ChatGPT Agent在執(zhí)行外部操作時(shí)，如何確保安全性和可靠性？

富爾福德：由于ChatGPT Agent能夠與外部世界交互，例如訪問網(wǎng)站或調(diào)用API，安全是核心關(guān)注點(diǎn)。

相比Deep Research的只讀模式，ChatGPT Agent可能引發(fā)更大風(fēng)險(xiǎn)，例如在完成任務(wù)時(shí)執(zhí)行意外的破壞性操作，如購買100個(gè)不同選項(xiàng)以確保用戶滿意。為此，我們實(shí)施了多層次安全措施，包括內(nèi)部和外部紅隊(duì)測試、實(shí)時(shí)監(jiān)控系統(tǒng)（類似于防病毒軟件）以及快速響應(yīng)新威脅的協(xié)議。我們特別關(guān)注生物風(fēng)險(xiǎn)等嚴(yán)重問題，例如防止ChatGPT Agent被用于創(chuàng)建生物武器。

凱西·楚：互聯(lián)網(wǎng)充滿風(fēng)險(xiǎn)，存在釣魚攻擊、欺詐等威脅。我們的模型經(jīng)過安全訓(xùn)練，能識(shí)別部分風(fēng)險(xiǎn)，但有時(shí)可能過于急于完成任務(wù)而被欺騙。我們開發(fā)了一個(gè)實(shí)時(shí)監(jiān)控系統(tǒng)，檢查ChatGPT Agent的行為，若發(fā)現(xiàn)可疑操作（如訪問異常網(wǎng)站），會(huì)立即暫停任務(wù)。

此外，我們有協(xié)議快速響應(yīng)新威脅，類似于更新防病毒軟件。感謝公司生物風(fēng)險(xiǎn)團(tuán)隊(duì)的緩解工作，我們進(jìn)行了數(shù)周的紅隊(duì)測試，確保模型不會(huì)被用于有害用途。

富爾福德：安全訓(xùn)練是一個(gè)跨團(tuán)隊(duì)努力，涉及安全、治理、法律、研究和工程團(tuán)隊(duì)。我們?cè)诿總€(gè)層面實(shí)施了防護(hù)措施，并將繼續(xù)迭代以應(yīng)對(duì)新威脅。例如，我們確保ChatGPT Agent在執(zhí)行敏感操作（如登錄銀行賬戶）前會(huì)征求用戶許可。

05 背后的團(tuán)隊(duì)協(xié)作

主持人：開發(fā)團(tuán)隊(duì)是如何協(xié)作的？規(guī)模如何？

富爾福德：我們的團(tuán)隊(duì)由Deep Research和Operator的研究與應(yīng)用團(tuán)隊(duì)合并而成，總?cè)藬?shù)并不多。Deep Research團(tuán)隊(duì)最初只有3-4人，Operator團(tuán)隊(duì)約6-8人，加上由亞什?庫馬爾（Yash kumar）領(lǐng)導(dǎo)的優(yōu)秀工程和產(chǎn)品設(shè)計(jì)團(tuán)隊(duì)。研究與應(yīng)用團(tuán)隊(duì)緊密合作，從定義產(chǎn)品功能到模型訓(xùn)練均以用戶場景為導(dǎo)向。這種小團(tuán)隊(duì)協(xié)作使我們?cè)诙虝r(shí)間內(nèi)取得了顯著成果。

凱西·楚：研究與應(yīng)用團(tuán)隊(duì)的界限并不嚴(yán)格。應(yīng)用工程師參與模型訓(xùn)練，研究人員也參與模型部署。這種跨職能合作使項(xiàng)目充滿活力，團(tuán)隊(duì)氛圍非常好。富爾福德和我是老朋友，這種默契也促進(jìn)了團(tuán)隊(duì)合作。

孫之清：小團(tuán)隊(duì)能成就大事。我們?cè)趲讉€(gè)月內(nèi)完成了這個(gè)項(xiàng)目，研究與應(yīng)用團(tuán)隊(duì)從一開始就共同定義產(chǎn)品功能，確保以用戶需求為導(dǎo)向。雖然ChatGPT Agent尚未完全實(shí)現(xiàn)所有目標(biāo)，但這種框架使我們能夠快速迭代。

主持人：訓(xùn)練過程中最大的挑戰(zhàn)是什么？

孫之清：訓(xùn)練的穩(wěn)定性是一個(gè)巨大挑戰(zhàn)。Deep Research只涉及文本瀏覽和Python，而ChatGPT Agent需同時(shí)處理多種新工具，如GUI瀏覽器、終端、圖像生成工具和API調(diào)用，所有這些都在同一虛擬機(jī)環(huán)境中運(yùn)行。我們需要同時(shí)運(yùn)行成千上萬的虛擬機(jī)訪問網(wǎng)絡(luò)，經(jīng)常遇到網(wǎng)站宕機(jī)、API限制或網(wǎng)絡(luò)容量不足等問題。

例如，某些網(wǎng)站可能因流量過載而暫時(shí)不可用，或者API調(diào)用因速率限制而失敗，這要求我們?cè)谟?xùn)練中加入魯棒性機(jī)制，確保ChatGPT Agent能處理這些異常情況。盡管面臨這些挑戰(zhàn)，我們通過優(yōu)化虛擬機(jī)環(huán)境和改進(jìn)訓(xùn)練算法，最終成功訓(xùn)練了模型，使其在多樣化任務(wù)中表現(xiàn)出色。

富爾福德：未來，我們希望進(jìn)一步提升ChatGPT Agent的多輪對(duì)話能力、個(gè)性化和記憶功能。目前，所有任務(wù)都由用戶發(fā)起，但我們?cè)O(shè)想ChatGPT Agent未來能夠自主識(shí)別用戶需求并主動(dòng)執(zhí)行任務(wù)。例如，它可能根據(jù)用戶歷史行為預(yù)測需求，自動(dòng)生成報(bào)告或規(guī)劃活動(dòng)。

我們也在探索新的用戶界面和交互模式，例如更直觀的非聊天式交互方式、語音指令或圖形化界面等，以提升用戶體驗(yàn)。此外，我們計(jì)劃優(yōu)化ChatGPT Agent的上下文管理，使其在長時(shí)間任務(wù)中更好地保持任務(wù)連貫性，同時(shí)減少對(duì)計(jì)算資源的依賴。

凱西·楚：從編碼角度看，我發(fā)現(xiàn)ChatGPT Agent在代碼搜索和小型代碼編輯方面表現(xiàn)優(yōu)異，因?yàn)樗軠?zhǔn)確讀取文檔并減少幻覺。例如，它可以通過API訪問GitHub，搜索特定代碼庫并提取相關(guān)代碼片段。我用它處理類似o3的交互式編碼任務(wù)，而Codex更適合解決明確定義的問題。用戶會(huì)發(fā)現(xiàn)更多新用例，如Deep Research用戶發(fā)現(xiàn)的代碼搜索功能。

未來，我們希望ChatGPT Agent在編程任務(wù)中進(jìn)一步提升，比如支持更復(fù)雜的代碼調(diào)試或自動(dòng)化生成完整應(yīng)用程序。此外，我們正在研究如何讓ChatGPT Agent更好地理解用戶意圖，例如在代碼編輯中自動(dòng)推斷用戶想要的功能，而無需詳細(xì)指令。

06 打造通用超級(jí)智能體

主持人：你們會(huì)開發(fā)專門的子智能體，例如財(cái)務(wù)分析智能體或活動(dòng)策劃智能體，還是堅(jiān)持單一超級(jí)智能體的愿景？

富爾福德：我們傾向于打造一個(gè)通用的超級(jí)智能體。如果一個(gè)智能體能根據(jù)需求靈活調(diào)用所有工具，就像一位全能的首席幕僚，這將是簡單高效的解決方案。

我們的訓(xùn)練數(shù)據(jù)顯示，不同任務(wù)之間存在正向遷移，例如在購物任務(wù)中學(xué)習(xí)到的視覺交互技能可應(yīng)用于研究任務(wù)中的網(wǎng)頁導(dǎo)航。因此，單一智能體模型在擴(kuò)展性和通用性上更具潛力。我們希望通過持續(xù)優(yōu)化，讓ChatGPT Agent能夠無縫處理從簡單查詢到復(fù)雜工作流的各種任務(wù)，減少用戶對(duì)多個(gè)專用模型的依賴。

凱西·楚：雖然在產(chǎn)品發(fā)布時(shí)，定制化模型可能有市場價(jià)值，但從訓(xùn)練角度看，通用智能體能更好地利用技能的可遷移特性。例如，ChatGPT Agent在購物任務(wù)中可能使用終端進(jìn)行預(yù)算計(jì)算，無需專門的財(cái)務(wù)分析工具。我們也在探索如何通過強(qiáng)化學(xué)習(xí)進(jìn)一步提高它的泛化能力，例如讓它在遇到全新任務(wù)時(shí)快速適應(yīng)，而無需大量額外訓(xùn)練數(shù)據(jù)。未來，ChatGPT Agent可能通過學(xué)習(xí)用戶反饋，動(dòng)態(tài)調(diào)整其行為模式，進(jìn)一步提升任務(wù)完成的精準(zhǔn)度。

孫之清：我們的目標(biāo)是讓ChatGPT Agent處理人類在計(jì)算機(jī)上執(zhí)行的幾乎所有任務(wù)。用戶甚至可以要求它‘嘗試在網(wǎng)上賺錢’，盡管目前執(zhí)行尚不完美。我們將通過迭代部署提高任務(wù)完成的質(zhì)量和準(zhǔn)確性。例如，我們計(jì)劃優(yōu)化ChatGPT Agent在復(fù)雜任務(wù)中的決策過程，減少錯(cuò)誤操作的可能性，同時(shí)提高其在動(dòng)態(tài)環(huán)境中的適應(yīng)能力。此外，我們希望通過用戶反饋和實(shí)際使用數(shù)據(jù)，持續(xù)改進(jìn)ChatGPT Agent的性能，使其在處理跨領(lǐng)域任務(wù)時(shí)更加智能和高效。

主持人：展望未來，你們對(duì)ChatGPT Agent的愿景是什么？

富爾福德：我們?yōu)镃hatGPT Agent提供了涵蓋人類在計(jì)算機(jī)上所能完成大部分任務(wù)的工具集。我們將致力于提升模型在多樣化任務(wù)上的表現(xiàn)，優(yōu)化用戶交互體驗(yàn)，探索新的交互模式，例如更個(gè)性化的記憶功能或自主任務(wù)發(fā)起。

我們希望ChatGPT Agent未來能夠自主感知并響應(yīng)用戶需求。例如，ChatGPT Agent可能根據(jù)用戶日程自動(dòng)規(guī)劃會(huì)議，或根據(jù)歷史偏好推薦個(gè)性化解決方案。

凱西·楚：我們對(duì)改進(jìn)用戶界面和體驗(yàn)感到興奮。當(dāng)前基于聊天的交互僅是起點(diǎn)，未來可能有更多創(chuàng)新交互方式，例如基于手勢或多模態(tài)輸入的界面。

我們希望用戶發(fā)現(xiàn)ChatGPT Agent的新能力，如Deep Research用戶發(fā)現(xiàn)的代碼搜索功能。例如，ChatGPT Agent在數(shù)據(jù)科學(xué)任務(wù)中已超越人類基準(zhǔn)，感謝同事約翰·布萊克曼（John Blackman）在電子表格和數(shù)據(jù)分析方面的努力。未來，我們計(jì)劃讓ChatGPT Agent在數(shù)據(jù)處理和可視化方面進(jìn)一步提升，例如自動(dòng)生成交互式儀表板。

孫之清：自1月發(fā)布Operator以來，我們顯著提高了點(diǎn)擊和表單填寫的準(zhǔn)確性，盡管日期選擇等任務(wù)仍有改進(jìn)空間。我們?yōu)镃hatGPT Agent提供了通用工具集，涵蓋人類在計(jì)算機(jī)上的大部分任務(wù)。未來的挑戰(zhàn)是確保模型在所有任務(wù)上表現(xiàn)出色，并開發(fā)新的交互范式，例如更自然的語音交互或?qū)崟r(shí)協(xié)作工具。我們期待用戶與ChatGPT Agent形成更自然的協(xié)作關(guān)系，開啟AI智能體的新時(shí)代。

標(biāo)簽OpenAI ChatGPT

上一篇：谷歌 Gemini 高級(jí)版獲IMO 2025官方認(rèn)證金牌

下一篇：美國半導(dǎo)體關(guān)稅新政何時(shí)落地？

相關(guān)文章

OpenAI 推桌面版 CodeX，多智能體并行，硬剛 Claude Code！

OpenAI 推桌面版 CodeX，多智能體并行，硬剛 Claude Code！

全球首條機(jī)器人關(guān)節(jié)自動(dòng)化產(chǎn)線啟動(dòng)

全球首條機(jī)器人關(guān)節(jié)自動(dòng)化產(chǎn)線啟動(dòng)

一文讀懂谷歌最強(qiáng)大模型 Gemini 3：下半年最大驚喜，谷歌王者回歸

一文讀懂谷歌最強(qiáng)大模型 Gemini 3：下半年最大驚喜，谷歌王者回歸

第一批人形機(jī)器人，已經(jīng)開始倒閉了？

第一批人形機(jī)器人，已經(jīng)開始倒閉了？

Meta“宮斗”大戲驚天駭浪！90后上位，AI教父楊立昆負(fù)“氣”出走！

Meta“宮斗”大戲驚天駭浪！90后上位，AI教父楊立昆負(fù)“氣”出走！

馬斯克預(yù)測：未來傳統(tǒng)手機(jī) 與 App 將消失

馬斯克預(yù)測：未來傳統(tǒng)手機(jī) 與 App 將消失

掃描二維碼手機(jī)訪問

文章目錄

主站蜘蛛池模板：欧美激情免费视频 | 九九热在线免费观看 | 色多多网站| 91成年视频 | 国产九九热 | 日本wwww色 | 成人免费视频一区二区 | 亚洲精品成人 | 97av在线视频 | 日本伊人网 | 神马影院久久 | 成人羞羞国产免费图片 | 成人在线免费网站 | 欧美黄色激情视频 | 91精品婷婷国产综合久久蝌蚪 | 激情六月婷婷 | 中文字幕亚洲精品 | 欧美日皮视频 | 日韩欧美91| 精品毛片在线观看 | 国产99精品 | 成人激情综合 | 亚洲国产高清在线 | 精久久久久久久 | 亚洲毛片一区 | 国产日韩在线观看视频 | 欧美又大粗又爽又黄大片视频 | 婷婷视频网 | 黄色a级大片 | 黄色在线免费观看 | 亚洲免费高清 | 国产精品zjzjzj在线观看 | 亚洲在线视频免费观看 | 亚洲一区二区三区免费 | 亚洲天天影视 | 欧美日韩中文字幕 | av在线播放网| 久久久97| 一个色在线视频 | 91免费高清视频 | 国产成人精品亚洲线观看 |

<menuitem id="87lgr"></menuitem>

<td id="87lgr"></td>

<menuitem id="87lgr"></menuitem>

<object id="87lgr"></object>

<address id="87lgr"></address>