GPT-4o

gpt-4o

GPT-4o 是 OpenAI GPT-4o 一代的多模态旗舰模型,支援文字和圖像輸入,并具备较强的通用智能。官方文件将它描述为適合广泛语言与視覺任務的高智能通用模型。在更看重多模态理解和自然交互,而不是最新推理栈的場景中,它仍然有价值。

最大上下文

128KToken

最大輸出

16.4KToken

發布日期

2024年5月13日

模態

GPT-4o 價格

輸入價格輸出價格快取讀取
$2.5/M$10/M$1.25/M

GPT-4o API

POST /v1beta/models/{model}:generateContent

GPT-4o 基準測試

9.6

/100

Artificial Analysis 綜合能力指數

Artificial Analysis 綜合能力評分

指數分數

16.6

/100

Artificial Analysis 程式碼能力指數

Artificial Analysis 軟體任務評分

指數分數

知識與推理

GPQA

高階科學問題求解

52.1%

HLE

廣泛專家級考試集合

2.9%

程式碼與工程

LiveCodeBench

近期程式題評測

31.7%

SciCode

科學計算程式碼挑戰

33.1%

Terminal-Bench Hard

高難度終端任務執行

8.3%

數學能力

MATH-500

高難度數學解題

79.5%

AIME

數學競賽題

11.7%

指令遵循與 Agent 任務

IFBench

指令約束遵循

36.0%

AA-LCR

長上下文推理

35%

τ²-Bench

Agent 工作流程任務

28.9%

指標來源 Artificial Analysis

媒體與討論

精選與此模型相關的公開影片和貼文。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

GPT-4o 常見問題

了解 GPT-4o 的定位、適合的使用情境、主要優勢、使用限制,以及在 TokenHub 中串接時要注意的事項。

GPT-4o 屬於哪一類模型?+

GPT-4o 是 OpenAI 較早一代的 Omni 模型,可處理一般文字與視覺理解,目前屬於較舊的 API 選項。它已從 ChatGPT 下架,但 API 仍可能可用;請以 TokenHub 目前頁面為準。

團隊可以用 GPT-4o 做什麼?+

它適合文字與影像輸入分析、回應迅速的互動式助理以及一般內容生成。正式上線前應使用具代表性的輸入測試,並訂定可衡量的驗收標準。

GPT-4o 在哪些技術面向較有優勢?+

它最實用的優勢包括整合文字與影像的理解能力、廣泛的通用能力以及回應流暢的對話表現。這些特點對回應迅速的互動式助理尤其有價值。

什麼情況下應選擇其他模型,而不是 GPT-4o?+

如果新專案應採用供應商目前建議的新一代模型、工作需要專用推理模型,或重要決策流程無法安排人工覆核,可以考慮其他模型。涉及事實、法律、財務、醫療或營運的重要結果,應由具備相關資格的人員覆核。

透過 TokenHub 串接 GPT-4o 前需要檢查什麼?+

在 TokenHub 中,請選擇頁面顯示的 GPT-4o 精確模型識別碼,使用帳戶文件中指定的介面,並以 TokenHub 憑證完成驗證。請查看 TokenHub 目前文件中的文字與影像輸入支援情況,因為平台開放能力可能不同於供應商的完整功能。