醫(yī)療健康信息技術(shù)裝備制造汽車及零部件文體教育現(xiàn)代服務(wù)業(yè)金融保險(xiǎn)旅游酒店綠色環(huán)保能源電力化工新材料房地產(chǎn)建筑建材交通運(yùn)輸社消零售輕工業(yè)家電數(shù)碼產(chǎn)品現(xiàn)代農(nóng)業(yè)投資環(huán)境
產(chǎn)業(yè)新聞產(chǎn)業(yè)資訊產(chǎn)業(yè)投資產(chǎn)業(yè)數(shù)據(jù)產(chǎn)業(yè)科技產(chǎn)業(yè)政策
字節(jié)跳動正式進(jìn)軍 AI 視頻生成領(lǐng)域,其數(shù)據(jù)、技術(shù)和人才等儲備深厚。2024 年 9 月 24 日,2024 火山引擎 AI創(chuàng)新巡展在深圳舉辦,發(fā)布了兩款豆包視頻生成大模型——PixelDance 和 Seaweed,開啟了邀測階段。9 月 25日,視頻大模型賦能的字節(jié) C 端產(chǎn)品——即夢正式開啟內(nèi)測邀請。
1)PixelDance V1.4 是基于 DiT 結(jié)構(gòu)的視頻生成大模型,同時(shí)支持文生視頻和圖生視頻,能夠一次性生成長達(dá)10 秒的精彩視頻片段。模型可完成時(shí)序性多拍動作,支持多主體復(fù)雜交互,還擁有豐富的運(yùn)鏡效果,多風(fēng)格多比例兼容性強(qiáng),能快速生成優(yōu)質(zhì)的視頻片段,賦能影視創(chuàng)作,廣告?zhèn)髅?,短視頻,直播,電商等多個(gè)場景。
2)Seaweed 視頻生成大模型基于 Transformer 架構(gòu),支持文生視頻和圖生視頻。利用時(shí)空壓縮的潛空間進(jìn)行訓(xùn)練,模型原生支持多分辨率生成,適配橫屏、豎屏,并能夠根據(jù)用戶輸入的高清圖像分辨率進(jìn)行適配和保真。默認(rèn)輸出為 720p 分辨率、24fps、時(shí)長 5 秒,并可動態(tài)延長至 20-30 秒。
更多行業(yè)研究分析請參考思瀚產(chǎn)業(yè)研究院官網(wǎng),同時(shí)思瀚產(chǎn)業(yè)研究院亦提供行研報(bào)告、可研報(bào)告(立項(xiàng)審批備案、銀行貸款、投資決策、集團(tuán)上會)、產(chǎn)業(yè)規(guī)劃、園區(qū)規(guī)劃、商業(yè)計(jì)劃書(股權(quán)融資、招商合資、內(nèi)部決策)、專項(xiàng)調(diào)研、建筑設(shè)計(jì)、境外投資報(bào)告等相關(guān)咨詢服務(wù)方案。