阿里巴巴(09988)通義千問發布並開源 Qwen3 X

29/04/2025 08:14

<匯港通訊> 阿里巴巴(09988)通義千問周二凌晨發布新版 Qwen3 系列人工智能(AI)模型,公司聲稱,新版模型可以匹敵 Google(谷歌)和 OpenAI 提供的最佳模型,在某些情況下甚至優於競爭對手。

新版 Qwen3 包括2個 MoE 模型和6個 Dense 模型,參數量從6億個到2350億個。與 DeepSeek-R1、OpenAI o1 及 o3-mini、馬斯克的 Grok 3 和 Google Gemini 2.5 Pro 等其他頂級模型比較,旗艦模型 Qwen3-235B-A22B 在編碼、數學、通用能力等基準評估中,取得具競爭力的結果。

小型 MoE 模型 Qwen3-30B-A3B 的活化參數量是 QwQ-32B 的10%,表現更勝一籌,甚至像 Qwen3-4B 這樣的小模型,也能匹敵 Qwen2.5-72B-Instruct 的表現。

六個 Dense 模型也已開源,包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和 Qwen3-0.6B,均在 Apache 2.0 許可下開源。

Qwen3 模式支持兩種思考模式,其一為思考模式,在這種模式下,模型會逐步推理,經過深思熟慮後給予最終答案。這種方法非常適合需要深入思考的複雜問題。其二是非思考模式,能提供快速、近乎即時的反應,適用於對速度要求高於深度的簡單問題。

通義千問並表示,Qwen3 模型推理能力大幅提升,在數學、程式碼和邏輯推理等評測中,達到同規模業界 SOTA 水準。 (BC)

#阿里巴巴 #通義千問 #Qwen3

本文所提供的任何資料只供參考之用。本網站概不對這些資料的準確性、完整性、合時性或對基於這些資料而作出的任何決定負責。而其他網站的轉載或翻譯,並不代表本網站推介或認可該等其他網站。本網站不對該等其他網站的內容負責,亦未核實有關內容。