醫(yī)療健康信息技術(shù)裝備制造汽車及零部件文體教育現(xiàn)代服務(wù)業(yè)金融保險旅游酒店綠色環(huán)保能源電力化工新材料房地產(chǎn)建筑建材交通運(yùn)輸社消零售輕工業(yè)家電數(shù)碼產(chǎn)品現(xiàn)代農(nóng)業(yè)投資環(huán)境
產(chǎn)業(yè)新聞產(chǎn)業(yè)資訊產(chǎn)業(yè)投資產(chǎn)業(yè)數(shù)據(jù)產(chǎn)業(yè)科技產(chǎn)業(yè)政策
基礎(chǔ)的生成算法模型是驅(qū)動AI的關(guān)鍵
2014年,伊恩·古德費(fèi)洛(lan Goodfellow)提出的生成對抗網(wǎng)絡(luò)(Generative Adversarial Network, GAN)成為早期最為著名的生成模型。GAN使用合作的零和博弈框架來學(xué)習(xí),被廣泛用于生成圖像、視頻、語音和三維物體模型。隨后,Transformer、基于流的生成模型(Flow-based models)、擴(kuò)散模型(Diffusion Model)等深度學(xué)習(xí)的生成算法相繼涌現(xiàn)。
Transformer模型是一種采用自注意力機(jī)制的深度學(xué)習(xí)模型,這一機(jī)制可按輸入數(shù)據(jù)各部分的重要性分配權(quán)重,可用于自然語言處理(NLP)、計算機(jī)視覺(CV)領(lǐng)域應(yīng)用,后來出現(xiàn)的BERT、GPT-3、laMDA等預(yù)訓(xùn)練模型都是基于Transformer模型建立的。
基礎(chǔ)的生成算法模型是驅(qū)動AI的關(guān)鍵
通過梳理全球主流大語言模型(LLM)的發(fā)展脈絡(luò),2018年以來的GPT系列、LLaMA系列、BERT系列、Claude系列等多款大模型均發(fā)源 于 Transformer 架構(gòu)。
預(yù)訓(xùn)練模型引發(fā)了AI技術(shù)能力的質(zhì)變
預(yù)訓(xùn)練模型是為了完成特定任務(wù)基于大型數(shù)據(jù)集訓(xùn)練的深度學(xué)習(xí)模型,讓AI模型的開發(fā)從手工作坊走向工廠模式,加速AI技術(shù)落地。2017年,Google顛覆性地提出了基于自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)——Transformer架構(gòu),奠定了大模型預(yù)訓(xùn)練算法架構(gòu)的基礎(chǔ)。2018年,OpenAI和Google分別發(fā)布了GPT-1與BERT大模型,意味著預(yù)訓(xùn)練大模型成為自然語言處理領(lǐng)域的主流。
預(yù)訓(xùn)練數(shù)據(jù)直接影響AI大模型性能
預(yù)訓(xùn)練數(shù)據(jù)從數(shù)據(jù)來源多樣性、數(shù)據(jù)規(guī)模、數(shù)據(jù)質(zhì)量三方面影響模型性能。以GPT模型為例,其架構(gòu)從第1代到第4代均較為相似,而用來訓(xùn)練數(shù)據(jù)的數(shù)據(jù)規(guī)模和質(zhì)量卻有很大的提升,進(jìn)而引發(fā)模型性能的飛躍。以吳恩達(dá)(Andrew Ng)為代表的學(xué)者觀點(diǎn)認(rèn)為,人工智能是以數(shù)據(jù)為中心的,而不是以模型為中心。“有標(biāo)注的高質(zhì)量數(shù)據(jù)才能釋放人工智能的價值,如果業(yè)界將更多精力放在數(shù)據(jù)質(zhì)量上,人工智能的發(fā)展會更快”。
為了追求更好的模型性能,模型參數(shù)規(guī)模也與訓(xùn)練數(shù)據(jù)量同步快速增長,模型參數(shù)量大約每18個月時間就會增長40倍。例如2016年最好的大模型ResNet-50參數(shù)量約為2000萬,2020年的GPT-3模型參數(shù)量達(dá)1750億,2023年的GPT-4參數(shù)規(guī)模則更加龐大。
市場規(guī)模
隨著人工智能技術(shù)的不斷發(fā)展,其應(yīng)用場景日益豐富,各行各業(yè)所匯聚的龐大數(shù)據(jù)資源為技術(shù)的實(shí)際應(yīng)用和持續(xù)完善提供了堅實(shí)基礎(chǔ)。根據(jù)第三方咨詢機(jī)構(gòu)格物致勝的統(tǒng)計數(shù)據(jù),2022年中國人工智能市場規(guī)模達(dá)到2058億元,預(yù)計2023-2027年市場規(guī)模將保持28.2%的復(fù)合增長率,2027年中國人工智能市場規(guī)模將達(dá)到7119億元。根據(jù)statista的統(tǒng)計數(shù)據(jù),2023年全球人工智能市場規(guī)模達(dá)2079億美元,預(yù)計2030年將增至18475億美元。
更多行業(yè)研究分析請參考思瀚產(chǎn)業(yè)研究院官網(wǎng),同時思瀚產(chǎn)業(yè)研究院亦提供行研報告、可研報告(立項審批備案、銀行貸款、投資決策、集團(tuán)上會)、產(chǎn)業(yè)規(guī)劃、園區(qū)規(guī)劃、商業(yè)計劃書(股權(quán)融資、招商合資、內(nèi)部決策)、專項調(diào)研、建筑設(shè)計、境外投資報告等相關(guān)咨詢服務(wù)方案。