GPT-4.1

gpt-4.1

GPT-4.1 是 OpenAI 強調程式碼、指令遵循和長上下文能力提升的一代模型。官方發布信息将它描述为在许多编程和指令密集型任務上强于 GPT-4o 的開發者模型。它的描述应突出程式碼可靠性和長上下文理解。

最大上下文

1MToken

最大輸出

32.8KToken

發布日期

2025年4月14日

模態

GPT-4.1 價格

輸入價格輸出價格快取讀取
$2/M$8/M$0.5/M

GPT-4.1 API

POST /v1/chat/completions

GPT-4.1 基準測試

GPT-4.1

19.4

/100

Artificial Analysis 綜合能力指數

Artificial Analysis 綜合能力評分

指數分數

21.8

/100

Artificial Analysis 程式碼能力指數

Artificial Analysis 軟體任務評分

指數分數

34.7

/100

Artificial Analysis 數學能力指數

Artificial Analysis 數學推理評分

指數分數

知識與推理

MMLU-Pro

高難度多任務知識評測

80.6%

GPQA

高階科學問題求解

66.6%

HLE

廣泛專家級考試集合

4.6%

程式碼與工程

LiveCodeBench

近期程式題評測

45.7%

SciCode

科學計算程式碼挑戰

38.1%

Terminal-Bench Hard

高難度終端任務執行

13.6%

數學能力

MATH-500

高難度數學解題

91.3%

AIME

數學競賽題

43.7%

AIME 2025

數學競賽題

34.7%

指令遵循與 Agent 任務

IFBench

指令約束遵循

43.0%

AA-LCR

長上下文推理

61%

τ²-Bench

Agent 工作流程任務

47.1%

指標來源 Artificial Analysis

媒體與討論

精選與此模型相關的公開影片和貼文。

X (Twitter)

View post on X
View post on X
View post on X

Reddit

YouTube

Watch on YouTube
Watch on YouTube
Watch on YouTube

GPT-4.1 常見問題

了解 GPT-4.1 的定位、適合的使用情境、主要優勢、使用限制,以及在 TokenHub 中串接時要注意的事項。

GPT-4.1 是什麼?在 OpenAI 的模型產品線中如何定位?+

GPT-4.1 是 一款著重指令遵循、工具呼叫與長上下文工作的高能力非推理 GPT 模型。它已從 ChatGPT 下架,但 API 仍可能可用;請以 TokenHub 目前頁面為準。

GPT-4.1 最適合哪些工作?+

它適合處理大型程式碼庫、嚴格遵循指示以及具工具呼叫的應用流程。正式上線前應使用具代表性的輸入測試,並訂定可衡量的驗收標準。

團隊為什麼會選擇 GPT-4.1,而不是更小或較舊的模型?+

它最實用的優勢包括出色的長上下文處理、可靠遵循詳細指示以及有效使用工具與函式呼叫。這些特點對嚴格遵循指示尤其有價值。

在依賴 GPT-4.1 前應先驗證什麼?+

如果工作需要更深入、審慎的推理、極低延遲是首要需求,或重要決策流程無法安排人工覆核,可以考慮其他模型。產生的程式碼在合併或部署前應通過測試、安全檢查與人工審查。

GPT-4.1 在 TokenHub 中有哪些實用串接建議?+

在 TokenHub 中,請選擇頁面顯示的 GPT-4.1 精確模型識別碼,使用帳戶文件中指定的介面,並以 TokenHub 憑證完成驗證。並確認 TokenHub 頁面是否提供應用所需的輸入類型、工具行為與輸出控制。