美股
基金
外匯、加密貨幣
滬、深港通
港股
 
納斯達克
 
恆生指數
 
道瓊斯
 
標準普爾
 
 
新聞分享
如欲分享新聞,請填寫收件人及閣下之電郵,再按「送出」。*必需填寫
收件者電郵*
請用分號「;」分隔不同電郵地址,例子:a@a.com;b@b.com
閣下之電郵*
分享內容
OpenAI拋震撼彈!GPT-5.4上線 AI首度能像人一樣操作電腦
OpenAI 推出全新旗艦基礎模型 GPT-5.4,並同步於 ChatGPT、API 及開發工具 Codex 上線。在 GPT-5.3 Instant 問世僅一天後,GPT-5.4 的登場代表著 Op...
重設
送出
視窗將於5秒內關閉
OpenAI拋震撼彈!GPT-5.4上線 AI首度能像人一樣操作電腦
鉅亨網新聞
推薦
0
利好
0
利淡
2
 
 

OpenAI 推出全新旗艦基礎模型 GPT-5.4,並同步於 ChatGPT、API 及開發工具 Codex 上線。在 GPT-5.3 Instant 問世僅一天後,GPT-5.4 的登場代表著 OpenAI 對專業工作場景與 AI 智能體(Agent)能力的全面強化。

OpenAI 執行長表示,GPT-5.4 是迄今為止能力最強、最高效的專業工作領先模型。該模型不僅具備卓越的文字與程式碼產生能力,更首次將「原生電腦操控」功能導入通用模型,使 AI 能夠跨軟體執行複雜工作流程。

業界普遍認為,這象徵著 AI 正從單純的「對話工具」轉型為能夠自動執行任務的「數位代理系統」。

技術里程碑:原生電腦操控功能

GPT-5.4 最具突破性的變革在於其內建的原生電腦操控能力。透過 API 與 Codex,該模型能像人類一樣直接操控電腦軟體、瀏覽網頁、並控制滑鼠與鍵盤完成任務。

1. 基準測試表現超越人類

在衡量桌面導航能力的 OSWorld-Verified 基準測試中,GPT-5.4 以 75.0% 的成功率超越了人類平均水準(72.4%),較前代 GPT-5.2 的 47.3% 實現了質的飛躍。此外,在瀏覽器操控測試 WebArena-Verified 中,成功率達到 67.3%;而在 Online-Mind2Web 測試中,僅憑截圖操作即達到 92.8% 的驚人準確率。

2. 實踐與效率提升

地產科技公司 Mainstay 的測試顯示,GPT-5.4 在處理約 3 萬個房產稅門戶網站任務時,首次嘗試成功率達 95%,且完成速度較以往模型快 3 倍,Token 消耗量則減少了約 30%。這證明了原生操控能力認在降低企業營運成本與提升效率方面的巨大潛力。

企業生產力核心:金融服務套件與 Excel 深度整合

針對專業知識工作,OpenAI 同步推出了「OpenAI 金融服務」套件,核心產品包括 ChatGPT for Excel 及 Google Sheets(測試版)。

無縫嵌入電子表格: AI 將直接嵌入單元格,協助用戶建立、分析與更新複雜的財務模型。

數據與專業技能: 整合了 FactSet、MSCI、Moody's 等頂級數據合作夥伴,並提供「獲利預覽」、「DCF 估值分析」及「投資備忘錄撰寫」等高頻工作技能(Skills)。

投行任務能力翻倍: 在內部投行基準測試中,GPT-5.4 Thinking 的得分從 GPT-5 的 43.7% 躍升至 88.0%;在模擬初級分析師的建模任務中,得分亦高達 87.3%。

法律 AI 平台 Harvey 表示,GPT-5.4 在複雜交易分析與長篇合約準確性方面表現卓越,其細節處理能力已優於市場上其他模型。

重構工具搜尋機制:效率與成本的最佳化

隨著 AI 代理系統中工具數量的增加,管理成本成為一大挑戰。GPT-5.4 引入了全新的 「工具搜尋」(Tool Search) 機制。

以往模型需在每次請求中預載所有工具定義,導致高額的 Token 消耗與延遲。在 GPT-5.4 模式下,模型僅接收輕量化清單,僅在需要時才按需檢索完整定義。

根據 Scale 的 MCP Atlas 基準測試,在啟用 36 個伺服器的情況下,新機制在保持準確率的前提下,成功減少了 47% 的總 Token 用量。Zapier 執行長指出,這使得 GPT-5.4 成為目前最具持續性且最可靠的模型。

抑制幻覺與專業產出:追求「零錯誤」目標

OpenAI 致力於解決 AI 模型的幻覺問題。GPT-5.4 被譽為「迄今最具事實準確性的模型」:

  • 錯誤率降低: 單項陳述錯誤率較 GPT-5.2 降低 33%,完整回應中出現任意錯誤的機率降低 18%。
  • 專業表現: 在 GDPval(涵蓋 44 個職業任務)測試中,GPT-5.4 在 83.0% 的案例中達到或超越行業專業人士水平。
  • 視覺與程式設計: 簡報生成品質獲得人類評審高度認可,視覺美感與影像生成應用更具多樣性。同時,Codex 的 /fast 模式可提供 1.5 倍的生成速度提升,特別適合多步驟工具依賴的自動化流程。
版本分層與定價策略

GPT-5.4 同時推出兩個版本,以滿足不同層級的用戶需求,並提供高達 100 萬 Token 的上下文窗口(Context Window),適合長鏈路任務的規劃與驗證。

GPT-5.4 Thinking 專為深度推理設計,適用於 Plus(20 美元 / 月)、Team 及 Pro 用戶;GPT-5.4 Pro 針對最複雜任務的極限表現,僅限 Pro(200 美元 / 月)及企業版用戶。原有的 GPT-5.2 Thinking 將於 2026 年 6 月 5 日正式退役。

API 價格方面,由於技術突破與能力的提升,價格較前代略有上調,但 OpenAI 表示透過更高效的推理機制,用戶在相同任務上的總 Token 消耗將會減少。

具體而言,GPT-5.4 的定價為輸入每百萬 Token 2.50 美元、輸出每百萬 Token 15.00 美元;高效能的 GPT-5.4 Pro 則為輸入每百萬 Token 30.00 美元、輸出每百萬 Token 180.00 美元。

此外,Batch 與 Flex 模式可享有標準價格的半價優惠,但若單次輸入超過 27.2 萬 Token,超出部分將以兩倍標準費率計費。

AI 代理系統的轉型

GPT-5.4 的發布代表著人工智慧進入了一個新階段。它不再僅僅是一個「你問我答」的聊天機器人,而是一個能與電腦系統深度結合、主動執行金融分析、操控應用程式並協助專業決策的數位代理。對於企業用戶而言,這將是提升數位化生產力的核心基礎。

GitHub 首席產品長強調:「GPT-5.4 是企業第一天就應該採用的模型。」隨著其原生操控能力的普及,未來的工作流程將面臨深刻的變革。

新聞來源 (不包括新聞圖片): 鉅亨網
公佈日期
指標
暫時沒有相關新聞。
 
美股網站地圖
支援電郵: support@aastocks.com
阿斯達克網絡信息有限公司 (AASTOCKS.COM LIMITED) 版權所有,不得轉載
免責聲明
閣下明確同意使用本網站/應用程式的風險是由閣下個人承擔。

AASTOCKS.com Ltd、香港交易所資訊服務有限公司、中國投資信息有限公司、深圳證券信息有限公司、Nasdaq, Inc.、其控股公司及/或該等控股公司的任何附屬公司、或其資訊來源及/或其他第三方數據供應商均竭力確保所提供資訊的準確和可靠度,但不能保證其絕對準確和可靠,且亦不會承擔因任何不準確或遺漏而引起的任何損失或損害的責任(不管是否侵權法下的責任或合約責任又或其他責任)。

AASTOCKS.com Ltd、香港交易所資訊服務有限公司、中國投資信息有限公司、深圳證券信息有限公司、Nasdaq, Inc.、其控股公司及/或該等控股公司的任何附屬公司、或其資訊來源及/或其他第三方數據供應商均對資訊不作任何明示或隱含的要約、陳述或保證 (包括但不限於可銷售性及特殊用途合適性的資訊保證) 。

AASTOCKS.com Ltd、香港交易所資訊服務有限公司、中國投資信息有限公司、深圳證券信息有限公司、Nasdaq, Inc.、或其控股公司及/或該等控股公司的任何附屬公司、或其資訊來源及/或其他第三方數據供應商不會就任何原因導致的中斷、不準確、錯誤或遺漏或因此而造成的任何損害賠償(不論直接或間接、相應而生、懲罰性或懲戒性)對任何人承擔責任。

AASTOCKS.com Ltd不負責,亦不承擔任何由於不可抗力的事故或在AASTOCKS.com Ltd不可合理控制的情況下導致的損失或損害,如颱風、暴雨、其他自然災難、政府或有關機構的限制、騷動、戰爭、病毒爆發,網絡故障或電信故障,引致AASTOCKS.com Ltd不能履行協議內的責任或提供服務。

Morningstar 免責聲明:版權所有©2020 Morningstar,Inc。保留所有權利此處包含的資料,數據,分析和意見(“信息”):(1)包含Morningstar及其內容提供者的專營資料; (2)除特別授權外,不得複製或轉載; (3) 不構成投資建議; (4)僅供參考,(5)並未為所載資料的完整性、準確性及時間性作出保證。Morningstar對於閣下使用任何相關資料而作出的任何有關交易決定、傷害及其它損失均不承擔任何責任。 請在使用所有資料前作出核實,並且在諮詢專業投資顧問意見前勿作任何投資決定。 過往業績並不代表將來表現,任何投資項目的價值及所得收入皆可升可跌。

本網站/應用程式包含的內容和信息乃根據公開資料分析和演釋,該公開資料,乃從相信屬可靠之來源搜集,這些分析和信息並未經獨立核實和AASTOCKS.com Limited並不保證他們的準確性、完整性、實時性或者正確性。

在本網站/應用程式的資料、金融市場數據、報價、圖表、統計數據、匯率、新聞、研究、分析、購買或者出售評分、財金教學及其他資訊僅作參考使用,在根據資訊執行證券或任何交易前,應諮詢獨立專業意見,以核實定價資料或獲取更詳細的市場信息。AASTOCKS.com Limited不應被視為游說任何訂戶或訪客執行任何交易,閣下須為所有跟隨在本網站/應用程式的資料、評論和購買或出售評分執行的交易負責。

為了方便使用者,阿斯達克網絡信息有限公司增加了由 Azure OpenAI開發的翻譯功能,以幫助使用者理解阿斯達克網絡信息有限公司平台上的資訊中文以外的語言。 翻譯後的文字可能會失去一些原本的意義。資訊的某些項目(包括包含文字的圖像、帶字幕的影片、PDF 文件或地圖)可能無法翻譯,某些功能可能無法在翻譯版本中使用。

阿斯達克網絡信息有限公司不保證翻譯的準確性及完整性,並且翻譯後的文本不應被認為是準確的及完整的。 對於因使用翻譯功能而造成的任何形式的損害或損失,阿斯達克網絡信息有限公司不承擔任何責任。

AASTOCKS.com Limited之信息服務基於「現況」及「現有」的基礎提供,網站/應用程式的信息和內容如有更改恕不另行通知。AASTOCKS.com Limited有權但無此義務,改善或更正在本網站/應用程式的任何部分之錯誤或疏漏。

用戶在沒有AASTOCKS.com Limited明確的書面同意情況下,不得以任何方式複製、傳播、出售、出版、廣播、公佈、傳遞資訊內容或者利用在本網站/應用程式的信息和內容作商業用途。

投資涉及風險。 閣下可自行决定利用本網站的財金教學作學術參考用途,但 AASTOCKS.com Limited不能並不會保證任何在本網站/應用程式現在或未來的購買或出售評論和訊息會否帶來贏利。過往之表現不一定反映未來之表現,AASTOCKS.com Limited不可能作出該保證及用戶不應該作出該假設。

AASTOCKS.com Limited也許連結訂戶或訪客至其有興趣的網站,但AASTOCKS.com Limited只提供此服務給訂戶或訪客並不為此安排負責。

AASTOCKS.com Limited對於任何包含於、經由、連結、下載或從任何與本網站/應用程式有關服務所獲得之資訊、內容或廣告,不聲明或保證其內容之正確性或可靠性。 對於閣下透過本網站/應用程式上之廣告、資訊或要約而展示、購買或取得之任何產品、資訊資料,本公司亦不負品質保證之責任。

AATV是AASTOCKS.com Limited旗下的視頻網站平台。

閣下確認:(i) AATV只為提供資訊,並不為了任何交易目的;(ii) AATV節目內容以及其提供的資料並不構成任何AASTOCKS為售賣任何證券作出招攬、提出要約、意見或推薦,或對任何證劵或投資的收益或是否合適提供法律、稅務、會計、或投資意見或服務;及(iii)AATV並非為任何人士或法律實體在其他司法管轄區或國家使用,而在當地可能因該使用或分發而違反當地法律或法規。

AATV中節目內容中的個人意見和觀點僅供參考及討論,亦並不代表AASTOCKS.com Limited的立場。投資者必須按其本身投資目標及財務狀況自行作出投資決定。AASTOCKS.com Limited不對以下任何情況對閣下或任何人直接或間接負責:(i)AATV的不准確性,錯誤或遺漏,包括但不限於報價和財務數據; (ii)AATV中節目傳輸的延遲,錯誤或中斷; (iii)閣下由AATV中節目內容招致任何損失。

我們保留權利不時更改本免責聲明並於本網站/應用程式刊登更新版本。閣下必須定期查閱於本網站/應用程式刊登的資訊,以確保您即時知悉任何有關的改動。 如閣下於本免責聲明更新後仍繼續使用本網站/應用程式,即代表閣下同意接受更改後的本免責聲明的約束。

本免責聲明應受中華人民共和國香港特別行政區(「香港」)法律管限。閣下同意接受香港法院的專屬司法管轄權管轄。

本免責聲明的中英原文如有任何岐異,一切以英文原文為準。

更新日期為: 2026年2月9日