91手机看片国产永久免费,亚洲中文字幕无码亚洲成a人片

當(dāng)前位置：思瀚首頁(yè) >> 行業(yè)新聞 >> 產(chǎn)業(yè)科技

Google技術(shù)積累深厚，模型發(fā)布節(jié)奏加速
思瀚產(chǎn)業(yè)研究院 2024-11-11

多模態(tài)模型：最新發(fā)布Gemini 1.5，支持超長(zhǎng)上下文窗口

2024年2月，谷歌發(fā)布最新一代MoE多模態(tài)模型Gemini 1.5。MoE (Mixture of Experts)是一種混合模型，由多個(gè)子模型（即專家）組成，核心思想是使用一個(gè)門控網(wǎng)絡(luò)來(lái)決定每個(gè)數(shù)據(jù)應(yīng)該被哪個(gè)模型訓(xùn)練，從而減輕不同類型樣本之間的干擾。

支持超長(zhǎng)的上下文窗口，信息處理能力進(jìn)一步增強(qiáng)。谷歌增加了Gemini 1.5 Pro的上下文窗口容量，并實(shí)現(xiàn)在生產(chǎn)中運(yùn)行高達(dá)100萬(wàn)個(gè)Token，遠(yuǎn)超32k的Gemini 1.0、128k的GPT-4 Turbo、200k的Claude 2.1，這意味著Gemini 1.5 Pro可以一次性處理大量信息——包括1小時(shí)的視頻、11小時(shí)的音頻、超過(guò)30000行代碼的代碼庫(kù)或超過(guò)700000個(gè)單詞。

圖像生成模型：Imagen 2可生成高質(zhì)量、更逼真的輸出

2023年12月，Google發(fā)布最新的圖像模型Imagen 2，在數(shù)據(jù)集和模型方面改善了文本到圖像工具經(jīng)常遇到的許多問題，包括渲染逼真的手和人臉，以及保持圖像沒有干擾視覺的偽影。

Imagen 2基于擴(kuò)散技術(shù)提供了高度的靈活性，使控制和調(diào)整圖像風(fēng)格變得更加容易。通過(guò)提供參考風(fēng)格的圖像并結(jié)合文字提示，使用者可以調(diào)節(jié)Imagen 2生成相同風(fēng)格的新圖像；此外，還支持修補(bǔ)(inpainting)和擴(kuò)圖(outpainting)等圖像編輯功能。

視頻生成模型：Genie可通過(guò)單張圖像生成交互式環(huán)境

2024年2月26日，谷歌發(fā)布Genie(Generative Interactive Environments)，它是一個(gè)110億參數(shù)的基礎(chǔ)世界模型，可通過(guò)單張圖像提示生成可玩的交互式環(huán)境。谷歌認(rèn)為Genie是實(shí)現(xiàn)通用智能體的基石之作，未來(lái)的AI智能體可以在新生成世界的無(wú)休止的curriculum中接受訓(xùn)練，從Genie學(xué)到的潛在動(dòng)作可以轉(zhuǎn)移到真實(shí)的人類設(shè)計(jì)的環(huán)境中。

Genie包含三個(gè)關(guān)鍵組件：1) 潛在動(dòng)作模型(Latent Action Model, LAM)，用于推理每對(duì)幀之間的潛在動(dòng)作

免責(zé)聲明：
1.本站部分文章為轉(zhuǎn)載，其目的在于傳播更多信息，我們不對(duì)其準(zhǔn)確性、完整性、及時(shí)性、有效性和適用性等任何的陳述和保證。本文僅代表作者本人觀點(diǎn)，并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
2.思瀚研究院一貫高度重視知識(shí)產(chǎn)權(quán)保護(hù)并遵守中國(guó)各項(xiàng)知識(shí)產(chǎn)權(quán)法律。如涉及文章內(nèi)容、版權(quán)等問題，我們將及時(shí)溝通與處理。