醫(yī)療健康信息技術(shù)裝備制造汽車(chē)及零部件文體教育現(xiàn)代服務(wù)業(yè)金融保險(xiǎn)旅游酒店綠色環(huán)保能源電力化工新材料房地產(chǎn)建筑建材交通運(yùn)輸社消零售輕工業(yè)家電數(shù)碼產(chǎn)品現(xiàn)代農(nóng)業(yè)投資環(huán)境
產(chǎn)業(yè)新聞產(chǎn)業(yè)資訊產(chǎn)業(yè)投資產(chǎn)業(yè)數(shù)據(jù)產(chǎn)業(yè)科技產(chǎn)業(yè)政策
AI大模型市場(chǎng)表現(xiàn)與競(jìng)爭(zhēng)格局發(fā)生變化,Kimi成為國(guó)產(chǎn)大模型曙光。市場(chǎng)上的大模型層出不窮,以Kimi為代表的產(chǎn)品憑借其在長(zhǎng)文本處理領(lǐng)域的卓越能力,迅速成為用戶訪問(wèn)量最高的產(chǎn)品,打破了現(xiàn)有競(jìng)爭(zhēng)格局。Kimi在中文領(lǐng)域?qū)PT-4、Claude等國(guó)際大模型展現(xiàn)出明顯優(yōu)勢(shì),并通過(guò)不斷的技術(shù)迭代和用戶體驗(yàn)優(yōu)化,實(shí)現(xiàn)了用戶流量的激增和市場(chǎng)的快速擴(kuò)張。公司認(rèn)為,Kimi的AI-Native產(chǎn)品核心價(jià)值在于提供個(gè)性化交互,其長(zhǎng)文本上下文處理能力(LongContext)能大幅減少模型定制成本,解決90%的模型定制問(wèn)題。
2024年3月下旬,Kimi進(jìn)一步將上下文處理能力提升至200萬(wàn)漢字,隨著用戶流量的激增,服務(wù)連續(xù)進(jìn)行了5次擴(kuò)容。公司在C端致力于將Kimi打造成超級(jí)應(yīng)用,成為AI原生交互的入口;在B端,通過(guò)Moonshot AI開(kāi)放平臺(tái)提供與OpenAI兼容的API,內(nèi)測(cè)期間已有法律、游戲閱讀等領(lǐng)域應(yīng)用進(jìn)行測(cè)試,反饋良好。隨著Kimi應(yīng)用訪問(wèn)量的持續(xù)增長(zhǎng),預(yù)計(jì)將再次拉動(dòng)算力需求的快速增長(zhǎng),推動(dòng)AI行業(yè)的算力基礎(chǔ)設(shè)施發(fā)展。
隨著AI大模型技術(shù)的發(fā)展和應(yīng)用場(chǎng)景的拓展,全球算力需求正面臨重估。Meta等科技巨頭對(duì)AI算力的需求超出預(yù)期,預(yù)計(jì)到2024年底將擁有接近60萬(wàn)顆H100GPU的等效算力。Sora模型的發(fā)布標(biāo)志著AI視頻生成領(lǐng)域的新突破,進(jìn)一步推動(dòng)了多模態(tài)大模型的發(fā)展,預(yù)示著未來(lái)對(duì)算力需求的大幅提升。
同時(shí),美國(guó)政府的限制措施可能促使中國(guó)等國(guó)家的企業(yè)自行購(gòu)買(mǎi)算力卡或租賃國(guó)產(chǎn)AI算力,推動(dòng)國(guó)產(chǎn)AI產(chǎn)業(yè)鏈的革新和發(fā)展。在此背景下,Kimi等國(guó)產(chǎn)大模型的成功,不僅帶動(dòng)了產(chǎn)業(yè)鏈的革新,還為內(nèi)容創(chuàng)作、游戲互動(dòng)、AI陪伴等領(lǐng)域帶來(lái)了新的應(yīng)用場(chǎng)景和創(chuàng)新機(jī)遇。此外,Step系列通用大模型的發(fā)布和Pixverse在AI視頻生成領(lǐng)域的領(lǐng)先地位,進(jìn)一步展示了國(guó)產(chǎn)AI技術(shù)的競(jìng)爭(zhēng)力和市場(chǎng)潛力。
月之暗面發(fā)布Kimi,長(zhǎng)文本成為破局關(guān)鍵
月之暗面成為國(guó)產(chǎn)大模型新星。2023 年10 月,清華大學(xué)楊植麟及其AI 團(tuán)隊(duì)“月之暗面”發(fā)布了Kimi,擁有優(yōu)秀的長(zhǎng)文本處理能力,可處理20萬(wàn)漢字輸入。同時(shí),利用Long Context 可以大幅減少 fine-tune 的成本,實(shí)現(xiàn)模型應(yīng)用的“多、快、好、省”。例如可以先用5萬(wàn)字定制一個(gè)模型的能力,剩余還有大量文字窗口,也足夠日常交互使用。而fine-tune需要構(gòu)造數(shù)據(jù)并訓(xùn)練,時(shí)間較長(zhǎng)且需要較高的復(fù)雜度,單位token的成本也更高。公司選擇用Long Context方式來(lái)解決 90%的問(wèn)題,更好向前向后兼容,也成為公司最高優(yōu)先級(jí)的技術(shù)突破方向。
“大海撈針”測(cè)試驗(yàn)證了 Kimi 長(zhǎng)文本能力。長(zhǎng)文本能力是實(shí)現(xiàn)人類(lèi)與AI之間無(wú)損理解的基礎(chǔ),它使 AI 可以更準(zhǔn)確地理解人類(lèi)的復(fù)雜、感性思維,從而在多種應(yīng)用場(chǎng)景中更有效地服務(wù)于人類(lèi)。根據(jù)近一年全球各個(gè)大模型迭代方向,上下文窗口的“長(zhǎng)文本”再持續(xù)升級(jí)。
其中,在文本持續(xù)變長(zhǎng)過(guò)程中,大型是否會(huì)忽略掉部分細(xì)節(jié)內(nèi)容的問(wèn)題一直是“長(zhǎng)文本”能力的關(guān)鍵。因此有開(kāi)發(fā)者進(jìn)行了一項(xiàng)名為“大海撈針”的大模型長(zhǎng)文本性能測(cè)試,即在文本中加入一句與該文本內(nèi)容不相關(guān)的句子,測(cè)試大模型是否能通過(guò)Prompt把這句話準(zhǔn)確提取出來(lái)。月之暗面的工程師在2023年12月也進(jìn)行了測(cè)試,選取模型為Kimi chat(支持20萬(wàn)漢字輸入),GPT-4 Turbo(支持128K上下文窗口),Claude 2.1(支持200K上下文窗口)。根據(jù)測(cè)試結(jié)果,Kimi chat在“大海撈針”中的表現(xiàn)明顯好于GPT-4Turbo和Claude 2.1。
更多行業(yè)研究分析請(qǐng)參考思瀚產(chǎn)業(yè)研究院《2023-2028年中國(guó)大模型行業(yè)市場(chǎng)現(xiàn)狀與投資前景預(yù)測(cè)規(guī)劃報(bào)告》,同時(shí)思瀚產(chǎn)業(yè)研究院亦提供行研報(bào)告、可研報(bào)告、產(chǎn)業(yè)規(guī)劃、園區(qū)規(guī)劃、商業(yè)計(jì)劃、專項(xiàng)調(diào)研、建筑設(shè)計(jì)、境外投資報(bào)告等相關(guān)咨詢服務(wù)方案。