智譜(02513)正式發布並開源GLM-OCR 性能接近Gemini 3 Pro X
03/02/2026 10:28
<匯港通訊>       智譜(02513)正式發布並開源GLM-OCR。

智譜表示,該模型僅0.9B參數規模,支持vLLM、SGLang和Ollama部署。在文本、公式、表格識別及訊息抽取四大細分領域的表現優於多款OCR專項模型,性能接近谷歌(Google)旗艦大模型Gemini 3 Pro。在實際應用中,GLM-OCR能夠精準解析掃描件、PDF、表格及票據,有效解決手寫、印章、豎排及多語言混排難題。

該公司稱,未來將持續迭代GLM-OCR,推出更多尺寸版本,並將能力延伸至更多語言和視頻OCR,全面拓寬視覺智能的應用邊界。

#智譜 (CW)



本文所提供的任何資料只供參考之用。本網站概不對這些資料的準確性、完整性 、合時性或對基於這些資料而作出的任何決定負責。 而其他網站的轉載或翻譯,並不代表本網站推介或認可該等其他網站。 本網站不對該等其他網站的內容負責,亦未核實有關內容。