界面新聞記者 | 伍洋宇

界面新聞編輯 | 文姝琪

7月11日晚,月之暗面突然發布重要更新,正式推出Kimi K2模型并同步開源。

K2采用MoE架構,總參數達到1T,激活參數為32B。相較過去的基座模型,K2更強調代碼能力和通用Agent任務能力。

在SWE Bench Verified、Tau2、AceBench等基準性能測試中,K2達到開源模型SOTA表現。

其中,K2在SWE-bench Verified和SWE-bench Multilingual兩項自主編程能力的測試上,成績僅次于Claude 4 Opus和Claude 4 Sonnet,優于DeepSeek-V3-0324、Qwen3-235B-A22B以及OpenAI GPT-4.1。?

在兩項工具調用能力測試中,K2分別逼近位居第一的OpenAI和Anthropic。?

圖片來源:Kimi

為展現其代碼能力提升,Kimi在演示中通過一段“創建3D HTML山脈場景”的提示詞,生成了山川峽谷的3D景觀,包含懸崖、河流和晝夜光照變化等元素,支持粒子系統、可視化和3D場景等表現形式。?

Agent能力方面,月之暗面表示Kimi K2現已可穩定拆解復雜指令,尤其展示了在長上下文能力(13萬行原始數據)支撐下,對冗雜內容的準確分析能力。?

月之暗面強調,K2將作為通用Agent能力的基礎,未來計劃加入更高級的思考和視覺理解能力。

目前,月之暗面已在官網和Kimi App中上線K2模型。它也展現出更多的開放性,在上線API服務的同時(支持最長128K上下文),提供兼容OpenAI和Anthropic的Chat API接口,表示前兩者的用戶可以在Coding和Agent功能上體驗K2的能力。

定價方面,K2每百萬輸入tokens/4 元;每百萬輸出tokens/16 元。

就行業影響力而言,Kimi K2可能是DeepSeek年初在全球狂掃一波關注度之后,月之暗面最重要的一次發布。彼時面對DeepSeek的異軍突起,有AI行業從業人士對界面新聞記者表示,Kimi如若想要再度回到舞臺中央,需要貢獻出有同等量級的技術創新表現。?

Kimi內部或許也是對K2如此定位的。一名與Kimi方面有合作的知情人士告訴界面新聞記者,過去一段時間,Kimi工作人員多次表示近期會有“大動作”。在Kimi K2發布的當晚,其聯合創始人張宇韜在朋友圈轉發文章時直言,“Make Kimi Great Again”。

相比起2024年在行業風生水起的Kimi,它在今年上半年的確一改風格,變得出奇的低調。至于它是否真的做到了“悄悄驚艷所有人”,行業中暫且說法不一。?

從目前已經流出的評測來看,K2在Agent任務規劃上還是有不夠好用的地方,但在產品和模型層面,Kimi要奮起直追的姿態非常鮮明。事實上,在K2之前,Kimi還發布了自己的Deep Research功能,比肩OpenAI和谷歌Gemini的同類產品,并且在馬斯克的xAI Grok 4發布會上被提及。?

一名AI大模型投資人給出了更客觀的評價,他對界面新聞記者表示,Kimi K2是完成度很不錯的產品,但驚艷程度的確不及DeepSeek。

在用戶層面,Kimi K2要將自己的體驗升級之處向C端(用戶)市場傳達到位并不容易,因為普通用戶大多難以直觀感知基座模型的Agentic能力。這意味著它的影響力量級有限。

至于資本層面,這名投資人表示,下半年市場還將迎來幾款重要的國產模型,投資人其實普遍已經更有耐心。