醫(yī)療健康信息技術(shù)裝備制造汽車及零部件文體教育現(xiàn)代服務(wù)業(yè)金融保險(xiǎn)旅游酒店綠色環(huán)保能源電力化工新材料房地產(chǎn)建筑建材交通運(yùn)輸社消零售輕工業(yè)家電數(shù)碼產(chǎn)品現(xiàn)代農(nóng)業(yè)投資環(huán)境
產(chǎn)業(yè)新聞產(chǎn)業(yè)資訊產(chǎn)業(yè)投資產(chǎn)業(yè)數(shù)據(jù)產(chǎn)業(yè)科技產(chǎn)業(yè)政策
1、行業(yè)發(fā)展概況
(1)在全球數(shù)字經(jīng)濟(jì)發(fā)展以及以 ChatGPT 為代表的大模型的驅(qū)動(dòng)下,全球人工智能產(chǎn)業(yè)即將進(jìn)入新一輪加速發(fā)展期
當(dāng)前,新一輪科技革命和產(chǎn)業(yè)變革深入發(fā)展,數(shù)字化轉(zhuǎn)型成為大勢(shì)所趨,世界主要國家均高度重視發(fā)展數(shù)字經(jīng)濟(jì),紛紛出臺(tái)戰(zhàn)略規(guī)劃,重塑數(shù)字時(shí)代的國際競爭新格局。
人工智能作為數(shù)字經(jīng)濟(jì)發(fā)展的底層核心技術(shù)之一,正在發(fā)揮更加重要的作用。例如,隨著數(shù)字經(jīng)濟(jì)發(fā)展的不斷深入,數(shù)據(jù)體量以及復(fù)雜度均不斷提升,為更好解決產(chǎn)業(yè)數(shù)字化中數(shù)據(jù)提取、處理、分析等工作,將會(huì)產(chǎn)生更多樣化的人工智能需求,人工智能支出也將成為支持企業(yè)數(shù)字化轉(zhuǎn)型支出的主力之一。
根據(jù) IDC 報(bào)告,全球范圍內(nèi),企業(yè)在人工智能市場的投資增速將顯著高于數(shù)字化轉(zhuǎn)型支出(DX)和 GDP 增速。
此外,以 ChatGPT 為代表的大模型在近期的現(xiàn)象級(jí)智能化表現(xiàn)引發(fā)行業(yè)強(qiáng)烈關(guān)注。作為全新的人工智能聊天機(jī)器人,推出僅僅兩個(gè)多月,ChatGPT 全球用戶已突破 1 億,人工智能通過極具顛覆性的能力再次走入大眾視野,并獲得了產(chǎn)業(yè)界的廣泛關(guān)注??梢灶A(yù)見,人工智能行業(yè)將在以 ChatGPT 為代表的大模型技術(shù)的推動(dòng)下進(jìn)入新一輪產(chǎn)業(yè)高速發(fā)展期。
未來,受益于數(shù)字經(jīng)濟(jì)政策和大模型技術(shù)的雙重驅(qū)動(dòng),人工智能將具備更強(qiáng)的產(chǎn)業(yè)融合能力,并將深刻影響千行百業(yè)的運(yùn)行規(guī)則,以及人們的生活方式,人工智能產(chǎn)業(yè)的發(fā)展將隨之進(jìn)入快車道。
根據(jù)國際數(shù)據(jù)公司(IDC)的數(shù)據(jù),2021 年,全球人工智能市場規(guī)模為 885.7億美元,預(yù)計(jì) 2025 年將達(dá)到 2,218.7 億美元,年復(fù)合增長率達(dá)到 26.2%。
在市場需求拉動(dòng)和國家政策的支持引導(dǎo)下,當(dāng)前我國人工智能產(chǎn)業(yè)加速發(fā)展,已形成基礎(chǔ)底層設(shè)施、中層技術(shù)以及上層應(yīng)用的完備的產(chǎn)業(yè)鏈生態(tài),一批創(chuàng)新活躍、特色鮮明的創(chuàng)新企業(yè)不斷涌現(xiàn),并聯(lián)合推動(dòng)中國人工智能產(chǎn)業(yè)實(shí)現(xiàn)規(guī)模增長。根據(jù)艾瑞咨詢的數(shù)據(jù)顯示,2022 年中國人工智能產(chǎn)業(yè)規(guī)模達(dá) 1,948 億元,
預(yù)計(jì) 2027 年市場規(guī)模將達(dá)到 6,122 億元,年復(fù)合增長率為 25.6%,主要與智算中心建設(shè)以及大模型訓(xùn)練等需求拉動(dòng)的 AI 芯片市場、無接觸服務(wù)需求拉動(dòng)的智能機(jī)器人及對(duì)話式 AI 市場等快速增長相關(guān),并有望在下游制造、交通、金融醫(yī)療等多領(lǐng)域不斷滲透,實(shí)現(xiàn)大規(guī)模落地應(yīng)用。
(2)訓(xùn)練數(shù)據(jù)作為 AI 算法發(fā)展和演進(jìn)“燃料”的作用更加凸顯
在 AI 產(chǎn)業(yè)鏈中,算法、算力和數(shù)據(jù)共同構(gòu)成技術(shù)發(fā)展的三大核心要素。算法模型從技術(shù)理論到應(yīng)用實(shí)踐的落地過程依賴于大量的訓(xùn)練數(shù)據(jù)。訓(xùn)練數(shù)據(jù)越多、越完整、質(zhì)量越高,模型推斷的結(jié)論越可靠。過去十年人工智能產(chǎn)業(yè)是以算法為核心,通過深度學(xué)習(xí)算法的不斷創(chuàng)新,推動(dòng)人工智能產(chǎn)業(yè)的快速發(fā)展。但未來,隨著算法發(fā)展趨于開源、算力能力大幅提升、及人工智能模型從技術(shù)理論應(yīng)用到更多的垂直場景,想要更快更好提升人工智能能力,數(shù)據(jù)將發(fā)揮更重要的作用。
根據(jù) Cognilytica 數(shù)據(jù)統(tǒng)計(jì)顯示,2021 年全球 AI 訓(xùn)練數(shù)據(jù)市場需求約為 42億美元,并預(yù)計(jì)到 2027 年這一需求將增長到 220 億美元,2021-2027 年復(fù)合增長率達(dá) 32%。
中國作為全球人工智能產(chǎn)業(yè)增速最快的國家之一,相關(guān)數(shù)據(jù)需求也在快速增長。根據(jù)德勤數(shù)據(jù),2022 年中國人工智能基礎(chǔ)數(shù)據(jù)服務(wù)市場規(guī)模為 45 億元,2027年規(guī)模將達(dá)到 130-160 億元,年復(fù)合增長率為 23.6%-28.9%。
(3)數(shù)據(jù)要素市場蓬勃發(fā)展,數(shù)據(jù)行業(yè)迎來更為廣闊的發(fā)展機(jī)遇
近年來,我國數(shù)字經(jīng)濟(jì)蓬勃發(fā)展,數(shù)據(jù)要素因具有基礎(chǔ)性戰(zhàn)略資源和關(guān)鍵性生產(chǎn)要素的雙重屬性,相關(guān)市場規(guī)模持續(xù)增長。
尤其在《中共中央、國務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》出臺(tái)后,我國系統(tǒng)性布局了數(shù)據(jù)基礎(chǔ)制度體系的“四梁八柱”,加速了數(shù)據(jù)流通交易和數(shù)據(jù)要素市場發(fā)展,進(jìn)一步推動(dòng)了公共數(shù)據(jù)、企業(yè)數(shù)據(jù)、個(gè)人數(shù)據(jù)合規(guī)高效流通使用。為更好響應(yīng)中央號(hào)召,北京、上海、廣州、深圳、杭州等地?cái)?shù)據(jù)政策陸續(xù)出臺(tái),逐步構(gòu)建了多層次、多元化數(shù)據(jù)要素市場生態(tài)體系。
以北京為例,《關(guān)于更好發(fā)揮數(shù)據(jù)要素作用進(jìn)一步加快發(fā)展數(shù)字經(jīng)濟(jì)的實(shí)施意見》、《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》和《關(guān)于推進(jìn)北京市數(shù)據(jù)專區(qū)建設(shè)的指導(dǎo)意見》指出,北京市要加快建設(shè)“數(shù)據(jù)基礎(chǔ)制度先行先試示范區(qū)”(以下簡稱“先行先試示范區(qū)”),“支持北京經(jīng)濟(jì)技術(shù)開發(fā)區(qū)等開展數(shù)據(jù)基礎(chǔ)制度先行先試,打造政策高地、可信空間和數(shù)據(jù)工場”,探索打造數(shù)據(jù)訓(xùn)練基地,歸集高質(zhì)量基礎(chǔ)訓(xùn)練數(shù)據(jù)集,推動(dòng)數(shù)據(jù)要素高水平開放,提升本市人工智能數(shù)據(jù)標(biāo)注庫規(guī)模和質(zhì)量,并建設(shè)針對(duì)重大領(lǐng)域、重點(diǎn)區(qū)域或特定場景建設(shè)專題數(shù)據(jù)區(qū)域,吸納市場主體和數(shù)據(jù)、技術(shù)、資本等多元要素參與。
北京市陸續(xù)出臺(tái)的多項(xiàng)文件旨在打破數(shù)據(jù)壁壘,推動(dòng)數(shù)據(jù)融合利用,加快推動(dòng)公共數(shù)據(jù)開放,促進(jìn)數(shù)據(jù)要素流通,激發(fā)數(shù)字市場創(chuàng)新活力,釋放和發(fā)展數(shù)字化生產(chǎn)力,打造多層級(jí)數(shù)據(jù)要素市場,成為具有競爭力和影響力的數(shù)字產(chǎn)業(yè)集群。按照“政府引導(dǎo)、市場運(yùn)作、創(chuàng)新引領(lǐng)、安全可控”的原則,“先行先試示范區(qū)”有望成為國際領(lǐng)先的數(shù)據(jù)要素高效流通核心樞紐。
數(shù)據(jù)要素市場受政策推動(dòng),進(jìn)入高速發(fā)展期,未來圍繞數(shù)據(jù)的價(jià)值利用以及流通交易,將產(chǎn)生大量新增數(shù)據(jù)需求,為數(shù)據(jù)行業(yè)開拓了新的增長空間,提供了新的業(yè)務(wù)拓展機(jī)遇。未來,數(shù)據(jù)要素也將成為數(shù)據(jù)行業(yè)增長的重要推動(dòng)力量。
2、行業(yè)發(fā)展趨勢(shì)
(1)大模型技術(shù)的突破和躍升,將驅(qū)動(dòng)新型數(shù)據(jù)需求持續(xù)增長
隨著 ChatGPT 成為全球范圍內(nèi)的現(xiàn)象級(jí)應(yīng)用,人工智能迎來了新的發(fā)展機(jī)遇,其背后的大模型技術(shù)也將進(jìn)一步引導(dǎo)人工智能產(chǎn)業(yè)變革并帶來相關(guān)數(shù)據(jù)需求的變化和增長。
首先,數(shù)據(jù)的質(zhì)量以及數(shù)據(jù)清洗的工程化能力會(huì)顯著拉開大模型預(yù)訓(xùn)練階段的效果差距;同時(shí),更多模型或?qū)⒉捎妙悘?qiáng)化學(xué)習(xí)模式來進(jìn)行特定領(lǐng)域或特定方向上的優(yōu)化迭代,以使得機(jī)器能夠以更加接近于人類期望的方式提供答案輸出。
對(duì)于大模型訓(xùn)練而言,不僅需要持續(xù)獲取大規(guī)模、高質(zhì)量、多模態(tài)、多場景、多垂向的數(shù)據(jù),更須具備持續(xù)迭代的高質(zhì)量數(shù)據(jù)清洗和標(biāo)注策略,以不斷提升包括預(yù)訓(xùn)練(Pre-training)、模型微調(diào)(Fine-tune)及獎(jiǎng)勵(lì)模型(Reward Model)等過程中所需數(shù)據(jù)(例如提示(Prompt)類數(shù)據(jù))的質(zhì)量,確保語言類和常識(shí)性知識(shí)之外的其他垂直領(lǐng)域的應(yīng)用場景的能力提升,為大模型精確性、通用性及泛化能力的實(shí)現(xiàn)奠定堅(jiān)實(shí)基礎(chǔ)。
在以上背景下,一方面,大規(guī)模、高質(zhì)量數(shù)據(jù)集重要性凸顯,成為模型訓(xùn)練效果的核心支撐之一。另一方面,AI 發(fā)展所面對(duì)的數(shù)據(jù)前沿性及工程化技術(shù)的挑戰(zhàn)也較為顯著。長期看,只有 AI 數(shù)據(jù)處理技術(shù)的不斷拓新與發(fā)展,才能及時(shí)適應(yīng)甚至超前引領(lǐng)大模型技術(shù)和應(yīng)用的發(fā)展。
(2)多模態(tài)數(shù)據(jù)受 AIGC 發(fā)展驅(qū)動(dòng),將呈現(xiàn)快速增長趨勢(shì)
隨著 AIGC 技術(shù)發(fā)展,AI 可在更多維度、更多場景輔助人類進(jìn)行內(nèi)容生產(chǎn)以及創(chuàng)作。例如,通過大模型等 AIGC 技術(shù),人類僅需輸入一段簡單的文字指令,AI 即可按照人類描述生成一幅畫、一段語音或一段視頻,以此幫助人類完成內(nèi)容創(chuàng)作。想要實(shí)現(xiàn)上述功能,AI 除了要具備理解人類文字指令的能力,還需要通過對(duì)齊兩種獨(dú)立模態(tài)關(guān)鍵特征的方式,建立文字與圖、語音、視頻等一一映射關(guān)系,這背后將依賴大量的多模態(tài)數(shù)據(jù),AI 需要對(duì)多模態(tài)數(shù)據(jù)進(jìn)行學(xué)習(xí),以實(shí)現(xiàn)跨模態(tài)的創(chuàng)作能力。
此外,隨著 AI 虛擬主播、虛擬學(xué)生、虛擬員工輪番上崗,數(shù)字人這個(gè)新興概念逐漸走入大眾視野,成為人工智能領(lǐng)域的熱門技術(shù)賽道。想要讓虛擬數(shù)字人實(shí)現(xiàn)與人類的自然交互,不僅需要發(fā)音標(biāo)準(zhǔn)自然、身體動(dòng)作流暢,其表情、口型與聲音也要實(shí)現(xiàn)細(xì)節(jié)的精準(zhǔn)匹配,而多模態(tài)技術(shù)就是打破傳統(tǒng)人工智能單一感官局限、讓各類 AI 能力協(xié)同使用的重要技術(shù)。通過對(duì)高質(zhì)量多模態(tài)訓(xùn)練數(shù)據(jù)集的持續(xù)學(xué)習(xí),AI 可實(shí)現(xiàn)圖像、視頻、音頻、語義文本等多維度能力的融合,使得虛擬人在行為上更接近人類。
未來,隨著以 AIGC、虛擬人為代表的 AI 技術(shù)以及應(yīng)用的不斷發(fā)展,多模態(tài)數(shù)據(jù)需求將呈現(xiàn)加速增長趨勢(shì)。
(3)人工智能企業(yè)全球化布局加速,多語種能力成為企業(yè)業(yè)務(wù)拓展核心支撐
2013 年,共建“一帶一路”的倡議正式面世,十年來,隨著國家“一帶一路”戰(zhàn)略的深入推進(jìn),國內(nèi)一批具有較強(qiáng)創(chuàng)新能力和過硬技術(shù)實(shí)力的企業(yè),紛紛踏出國門,積極拓展海外市場,通過不斷擴(kuò)大企業(yè)出海戰(zhàn)略版圖,獲得高速發(fā)展機(jī)會(huì)。另一方面,境外頭部企業(yè)也繼續(xù)踐行“全球化”戰(zhàn)略,搭乘全球出海的快車。
隨著境內(nèi)、外企業(yè)的全球化擴(kuò)張成為確定性趨勢(shì),多語種能力作為支撐企業(yè)順利出海的核心要素之一,重要意義更加凸顯。未來,多語種訓(xùn)練數(shù)據(jù)將對(duì)客戶側(cè)在語音助手、智能汽車、智能家居、智能客服、機(jī)器人、多語種 OCR 等各領(lǐng)域產(chǎn)品/應(yīng)用的全球化推廣起到積極作用。因此,隨著各類客戶群體擴(kuò)張步伐加速,多語種需求也將快速增長,具有強(qiáng)大語言研究能力的數(shù)據(jù)服務(wù)企業(yè)將獲得更多商業(yè)機(jī)會(huì)。
(4)人工智能技術(shù)加速向產(chǎn)業(yè)滲透融合,催生更多垂向領(lǐng)域數(shù)據(jù)需求
隨著深度學(xué)習(xí)技術(shù)的不斷突破,人工智能發(fā)展已經(jīng)進(jìn)入 2.0 時(shí)代,相關(guān)訓(xùn)練需求正逐漸從通用基礎(chǔ)能力建設(shè),向更為專業(yè)的垂向場景/行業(yè)拓展。一方面,以大模型為代表的 AI 基礎(chǔ)技術(shù)不斷取得重大突破,AI 模擬人類認(rèn)知的能力飛速提升,因此從技術(shù)能力維度看,AI 已具備與垂直產(chǎn)業(yè)融合并規(guī)?;瘧?yīng)用的前提條件;另一方面,受國家數(shù)字經(jīng)濟(jì)發(fā)展戰(zhàn)略推動(dòng),產(chǎn)業(yè)數(shù)字化和智能化將進(jìn)一步席卷各行各業(yè),智能化技術(shù)與傳統(tǒng)產(chǎn)業(yè)的融合將成為數(shù)字經(jīng)濟(jì)時(shí)代的新發(fā)展趨勢(shì),并創(chuàng)造出巨大的藍(lán)海空間。
當(dāng)前 AI 技術(shù)正在加速與各類產(chǎn)業(yè)融合,在汽車、金融、醫(yī)療、工業(yè)等傳統(tǒng)行業(yè)的滲透率和應(yīng)用場景不斷提升,展現(xiàn)出可觀的商業(yè)價(jià)值和巨大的發(fā)展?jié)摿?,而?shù)據(jù)作為打通算法技術(shù)與行業(yè)需求的核心橋梁,作用更加凸顯,可以說數(shù)據(jù)能力一定程度上決定了算法模型在對(duì)應(yīng)產(chǎn)業(yè)的適用性以及實(shí)用性,成為加速 AI 產(chǎn)業(yè)化落地的關(guān)鍵要素。