,,

界面新聞記者 | 伍洋宇
界面新聞編輯 | 文姝琪

7月11日晚，月之暗面突然發布重要更新，正式推出Kimi K2模型并同步開源。

K2采用MoE架構，總參數達到1T，激活參數為32B。相較過去的基座模型，K2更強調代碼能力和通用Agent任務能力。

在SWE Bench Verified、Tau2、AceBench等基準性能測試中，K2達到開源模型SOTA表現。

其中，K2在SWE-bench Verified和SWE-bench Multilingual兩項自主編程能力的測試上，成績僅次于Claude 4 Opus和Claude 4 Sonnet，優于DeepSeek-V3-0324、Qwen3-235B-A22B以及OpenAI GPT-4.1。?

在兩項工具調用能力測試中，K2分別逼近位居第一的OpenAI和Anthropic。?

為展現其代碼能力提升，Kimi在演示中通過一段“創建3D HTML山脈場景”的提示詞，生成了山川峽谷的3D景觀，包含懸崖、河流和晝夜光照變化等元素，支持粒子系統、可視化和3D場景等表現形式。?

Agent能力方面，月之暗面表示Kimi K2現已可穩定拆解復雜指令，尤其展示了在長上下文能力（13萬行原始數據）支撐下，對冗雜內容的準確分析能力。?

月之暗面強調，K2將作為通用Agent能力的基礎，未來計劃加入更高級的思考和視覺理解能力。

目前，月之暗面已在官網和Kimi App中上線K2模型。它也展現出更多的開放性，在上線API服務的同時（支持最長128K上下文），提供兼容OpenAI和Anthropic的Chat API接口，表示前兩者的用戶可以在Coding和Agent功能上體驗K2的能力。

定價方面，K2每百萬輸入tokens/4 元；每百萬輸出tokens/16 元。

就行業影響力而言，Kimi K2可能是DeepSeek年初在全球狂掃一波關注度之后，月之暗面最重要的一次發布。彼時面對DeepSeek的異軍突起，有AI行業從業人士對界面新聞記者表示，Kimi如若想要再度回到舞臺中央，需要貢獻出有同等量級的技術創新表現。?

Kimi內部或許也是對K2如此定位的。一名與Kimi方面有合作的知情人士告訴界面新聞記者，過去一段時間，Kimi工作人員多次表示近期會有“大動作”。在Kimi K2發布的當晚，其聯合創始人張宇韜在朋友圈轉發文章時直言，“Make Kimi Great Again”。

相比起2024年在行業風生水起的Kimi，它在今年上半年的確一改風格，變得出奇的低調。至于它是否真的做到了“悄悄驚艷所有人”，行業中暫且說法不一。?

從目前已經流出的評測來看，K2在Agent任務規劃上還是有不夠好用的地方，但在產品和模型層面，Kimi要奮起直追的姿態非常鮮明。事實上，在K2之前，Kimi還發布了自己的Deep Research功能，比肩OpenAI和谷歌Gemini的同類產品，并且在馬斯克的xAI Grok 4發布會上被提及。?

一名AI大模型投資人給出了更客觀的評價，他對界面新聞記者表示，Kimi K2是完成度很不錯的產品，但驚艷程度的確不及DeepSeek。

在用戶層面，Kimi K2要將自己的體驗升級之處向C端（用戶）市場傳達到位并不容易，因為普通用戶大多難以直觀感知基座模型的Agentic能力。這意味著它的影響力量級有限。

至于資本層面，這名投資人表示，下半年市場還將迎來幾款重要的國產模型，投資人其實普遍已經更有耐心。