DeepSeek 發布 V3.2 系列模型推理能力直逼 GPT-5 X

02/12/2025 08:00

<匯港通訊> DeepSeek 宣布同時推出兩個正式版人工智能模型,包括 DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。V3.2 在工具呼叫能力上達到目前開源模型最高水平,大幅縮小開源模型與閉源模型的差距。

在推理能力方面,V3.2 在數學基準(AIME 2025)測試中達到93.1%的通過率,接近 GPT-5 的94.6%和 Gemini-3.0-Pro 的95%。而 Gemini-3.0-Pro 在2025年國際數學奧林匹克競賽(IMO 2025)等四項國際頂級競賽中斬獲金牌。

V3.2 的目標是平衡推理能力與輸出長度,適合日常使用,例如問答場景和通用 Agent 任務場景。V3.2-Speciale 的目標是將開源模型的推理能力推向極致,探索模型能力的邊界。(BC)

#DeepSeek

本文所提供的任何資料只供參考之用。本網站概不對這些資料的準確性、完整性、合時性或對基於這些資料而作出的任何決定負責。而其他網站的轉載或翻譯,並不代表本網站推介或認可該等其他網站。本網站不對該等其他網站的內容負責,亦未核實有關內容。