購物時不再用搜索而是問AI,已經成為大模型給日常生活帶來的趨勢之一。一組數據顯示,在和消費有關的AI互動中,有60%的提問和消費場景有關,即該“買什么”的決策咨詢,而非“哪里買更便宜”。
這似乎釋放了一個信號:在消費領域做AI產品大有可為。而深耕消費內容領域的值得買科技,通過構建獨特的AI能力矩陣并走向開放,成為這一變革的重要參與者。
2024年,值得買科技全面實施AI戰略,累計投入研發費用1.82億元,較2023年增長10.52%。其核心成果是形成了“一組大模型,兩個數據庫,三個引擎和四類應用”的AI生態矩陣。其中,“一組大模型”采用分層模型架構,結合負責復雜理解推理的大模型與處理高頻結構化任務的小模型,以解決單一模型的能力邊界與成本問題。 而構建在“實時性”和“事實性”數據壁壘之上的“兩個數據庫”,則被視作與模型同等重要的AI能力基石,為消費決策提供權威“百科全書”。
作為戰略落地的關鍵一步,值得買科技近期正式發布并升級了其消費AI基礎設施平臺——“海納”MCP Server。該平臺基于標準化的MCP協議框架,向大模型廠商、智能硬件等生態伙伴開放其積累的10億級商品鏈接和120億級消費內容等核心能力,提供更高效、精準的消費決策支持。發布僅一個月,“海納”已吸引20多家伙伴合作,6月內容與商品輸出量超800萬,環比增長近80%。
正如值得買科技CTO王云峰在接受界面新聞采訪時所說,開放是AI生態發展的必經之路。他認為,AI技術正處于重塑自身生態的階段,包括值得買在內的不同領域公司投身其中,才能讓AI的生態能力更加豐富,擁有更大市場。
構建消費AI能力的基石與路徑
值得買科技對AI的感知和應用起步很早,2017年就已利用機器生產消費內容。ChatGPT的出現,讓這家以內容起家的公司更深刻地意識到一場巨大的技術浪潮已然來臨。
在“什么值得買”這一平臺上,由用戶真實測評與專業編輯精選共同構建的高質量內容生態,是公司長期以來的“護城河”,歷史上,值得買科技始終以UGC為主、編輯精選為輔的模式沉淀優質內容。AIGC的發展速度促使值得買科技思考AI對于內容行業的顛覆性影響。王云峰告訴界面新聞,盡管目前值得買科技的AI產品和技術已經不只局限于內容生產,但這是公司探索AI的最初動力。
實際上,值得買科技對AI的探索起步很早,而大模型帶來的深刻變革促使公司加速布局并制定全面AI戰略。2024年5月,值得買科技發布全面AI戰略成為其AI進程中的首個里程碑事件:該戰略在持續推進AIGC研發、應用的基礎上,實現AI對公司業務的重構,并推動核心產品“什么值得買”升級至第二代,即“什么值得買”GEN2。
然而,戰略落地并非一蹴而就,在技術實踐過程中,團隊發現并非所有場景都適合依賴通用大模型,特別是在高頻調用、功能相對單一的任務中,直接用大模型不一定比小模型效果好;而在需要深度理解用戶意圖等場景下,大模型則展現出相對更顯著的優勢。基于此,值得買科技便從最初聚焦消費領域大模型的構想,演進為構建“一組大模型”的技術路線。
所謂“一組大模型”,是一種分層模型架構,它并非依賴單一通用大模型,而是根據不同任務需求組合使用多種模型,包括參數規模大、擅長復雜理解和推理任務的核心大模型;以及針對高頻、特定、結構化任務進行優化的小型專用模型,以解決單一模型的能力邊界問題。
采用這種架構主要基于三點考量,首先,大模型并非萬能,例如商品屬性提取等結構化任務需依賴專項小模型;其次,高頻場景下大模型推理成本過高,輕量化模型更符合商業可持續性;以及,實際業務作為由意圖理解、特征提取、實時比價等多能力協同的復雜系統,必須通過模型組實現全鏈路覆蓋。
除了模型架構選擇,在消費領域構建強大的AI能力,另一核心壁壘在于數據維度,該領域有其特殊性。王云峰告訴界面新聞,在過去一年的實踐中,他們發現消費領域的數據存在兩個特點:實時性和事實性。實時性指的是價格每天都在變,每天有新的內容產生;事實性則是指數據本身必須具有權威性和正確性,正是這兩大特性構筑了公司的數據護城河。去年2月,什么值得買發布AI購物助手 “小值”,用戶的反饋也印證了消費領域數據處理的挑戰性,例如,當詢問“iPad Pro 2024的芯片是什么芯片?”時,最初的模型可能給出“M4芯片”或“M2芯片”的不同答案,這既源于大模型本身固有的概率輸出特性,也突顯了確保海量、快速變化的消費數據在事實層面絕對準確的難度。
這也解釋了眾多合作伙伴與值得買科技深度合作的原因。王云峰表示,大模型廠商有很強的技術實力,但在實際應用中,它仍需要一個能提供“標準答案”的權威消費領域百科全書,不同的垂直領域,需要不同的百科全書和標準答案。而值得買在消費領域構建的結構化、實時更新的高質量數據能力,恰恰能完美滿足這一關鍵需求。
由此,值得買將消費內容庫、商品數據庫這兩個數據庫視作構建AI能力的根基,優先級和大模型并列。“所以我們會把這兩個數據庫當成構建AI能力不可或缺的基石,在我們心目中,它就是個權威的、實時更新的百科全書,與大模型技術模塊同等重要。”王云峰解釋稱。
經過一整年的探索,值得買目前形成了一組大模型、兩個數據庫、三個引擎和四類應用的AI矩陣生態。今年,“海納”MCP Server的發布,成為值得買科技AI發展進程中的又一個里程碑。
開放核心能力,打造消費AI“基礎設施”
今年5月底,值得買科技發布海納MCP Server,正式開放其消費領域基礎設施能力。這在行業內引發了不小的關注。
MCP全稱為“Model Context Protocol”(模型上下文協議),基于這一協議,大模型能夠快速接入各種外部能力。具體到“海納”MCP Server上,該平臺是值得買科技基于MCP構建的標準化消費數據服務能力平臺,基于大量用戶數據積累,該平臺以AI理解內容為核心,通過MCP協議為大模型廠商、智能硬件等提供消費決策服務。在這一模式中,值得買不僅提供消費信息,也能打通整個消費鏈路,甚至提供云設備服務。
在王云峰看來,“海納”MCP Server的發布有更深層次的意義:這標志著值得買科技從原來單個合作伙伴的狀態,進入到了將產品融入整個AI生態,進行標準化產品探索的階段。以此為起點,公司也邁出了全新的步伐。
在前不久的6月分享會上,王云峰對外透露,短短一個月以來,“海納”已經吸引了20多家行業伙伴的合作邀請。除阿里云百煉平臺外,“海納”MCP Server近期還入駐了火山方舟平臺,為更廣泛的AI應用提供消費信息服務。官方數據顯示,“海納”MCP Server已經開放給了更多大模型、智能終端、智能體應用平臺等合作伙伴,并為各類應用進行了大量的適配工作,通過綜合的評判為AI應用提供信息輸出,6月整體內容和商品輸出量已超800萬,環比5月增長近80%。
事實上,“海納”MCP Server之所以能夠吸引如此多的注意力,恰恰是因為值得買科技多年以來積累的數據優勢。
王云峰總結稱,在消費領域做AI產品,行業普遍面臨一些痛點,包括消費數據的收集和數據的實時性問題。“從這個角度而言,值得買本身其實有一些天然的優勢。我們作為第三方平臺,擁有相對完整、及時且真實的信息。”
在踩了一年的“坑”之后,值得買決定把這樣的能力開放出去。王云峰認為,正因為“海納”MCP Server整合了值得買科技在消費領域內沉淀的數據和內容優勢,并且具備豐富性、實時性、中立性等獨特價值,眾多AI產品才會選擇與其合作,增強消費領域的服務能力。
一個有意思的事實是,值得買科技正是在這種開放生態的過程中發現了一些“隱藏”的機會。王云峰發現,不僅是通用型AI產品,任何一個垂類產品,最終大概率也會落到消費層面。此前,一家金融公司曾經找到值得買,稱公司希望做一個Agent,接入“海納”,目的就是為金融產品的代理們提供禮物選擇的AI服務。
官方數據披露,值得買科技已擁有10億級商品鏈接和120億級消費內容存儲,每日實現1000萬至2000萬條數據的新增和更新。?
走向開放:AI的必經之路
如果要用一個詞來總結值得買截至目前的AI探索歷程,“開放”必然是其中一個關鍵詞。
在商業模式上,值得買科技選擇免費開放接口,通過電商平臺分傭獲取收益,并計劃分傭給上游合作伙伴。通過這種方式,值得買希望讓更多流量接入MCP,同時吸引更多品牌商家入駐平臺提供交易能力。
做出這樣的選擇,最原始的動力來自于值得買科技對當下AI技術發展階段的判斷。王云峰長期扎根于技術領域,在他看來,任何一個新技術應用都存在“二八原則”——當一項新技術真正發揮作用時,80%的工作是這項技術之外的周邊工作,只有20%是純粹的新技術本身,但是這20%常常是點睛之筆,讓原來不可能的事情變得可能。放到AI領域來看,如果AI本身以后要更好地服務人們的生活,除了模型本身需要精進之外,周邊的基礎設施也非常重要。王云峰認為,AI技術正處于重塑自身生態的階段,包括值得買在內的不同領域公司投身其中,才能讓AI的生態能力更加豐富,擁有更大市場。
“我們認為,所有的公司都應該擁抱這個生態,大家都應該推動它前進。”王云峰認為。
未來,“海納”MCP Server還有三個目標:第一是信息供給,包括商品鏈接和消費內容,第二個目標是希望通過“海納”真正完成交易,讓它成為水電煤這樣的基礎設施。第三,值得買科技還希望構建一個聯盟,讓上游獲取自己的收入模式,下游能夠從中找到新的銷售渠道。通過這樣的開放聯盟,公司期待行業共同構建起一個健康的生態。
發表評論