醫(yī)療健康信息技術(shù)裝備制造汽車及零部件文體教育現(xiàn)代服務(wù)業(yè)金融保險(xiǎn)旅游酒店綠色環(huán)保能源電力化工新材料房地產(chǎn)建筑建材交通運(yùn)輸社消零售輕工業(yè)家電數(shù)碼產(chǎn)品現(xiàn)代農(nóng)業(yè)投資環(huán)境
產(chǎn)業(yè)新聞產(chǎn)業(yè)資訊產(chǎn)業(yè)投資產(chǎn)業(yè)數(shù)據(jù)產(chǎn)業(yè)科技產(chǎn)業(yè)政策
2024 年 10 月 1 日,OpenAI 開發(fā)者大會上,公司公布了幾大創(chuàng)新:實(shí)時(shí) API、提示詞緩存、模型蒸餾、視覺微調(diào)。
1)Realtime API:讓開發(fā)者可以構(gòu)建近乎實(shí)時(shí)的“語音轉(zhuǎn)語音”的體驗(yàn),并可以選擇使用 OpenAI 提供的六種聲音。
2)提示詞緩存:類似于 Anthropic 幾個(gè)月前推出的緩存功能,允許開發(fā)人員在 API 調(diào)用之間緩存常用上下文,從而降低成本并改善延遲。
3)模型蒸餾:讓開發(fā)人員可以使用較大的 AI 模型(例如 o1-preview 和 GPT-4o)來微調(diào)較小的模型(例如GPT-4o mini)。
4)視覺微調(diào):使開發(fā)人員能夠使用「圖像」結(jié)合「文本」,來微調(diào)他們的 GPT-4o 應(yīng)用程序,“看”的能力被極大強(qiáng)化。
5)新廣場玩法:提示詞新的框架、用法等,以及結(jié)構(gòu)化輸出新的突破,這些讓開發(fā)變得前所未有容易。
OpenAI推出了 Realtime API 的公開測試版,讓所有付費(fèi)開發(fā)者都能在其應(yīng)用中打造低延遲、多模式體驗(yàn)。與ChatGPT 的高級語音模式類似,Realtime API 支持使用六種預(yù)設(shè)聲音進(jìn)行自然的語音對語音對話。OpenAI 還在 Chat Completions API 中引入了音頻輸入和輸出(在新窗口中打開)以支持不需要 Realtime API 的低延遲優(yōu)勢的用例。通過此更新,開發(fā)人員可以將任何文本或音頻輸入傳遞到 GPT-4o,并讓模型以他們選擇的文本、音頻或兩者做出響應(yīng)。
比如:1)Healthify 是一款營養(yǎng)和健身指導(dǎo)應(yīng)用程序,它使用實(shí)時(shí) API 實(shí)現(xiàn)與其 AI 教練 Ria 的自然對話,同時(shí)在需要個(gè)性化支持時(shí)讓人類營養(yǎng)師參與進(jìn)來。2)Speak 是一款語言學(xué)習(xí)應(yīng)用程序,它使用 Realtime API來支持其角色扮演功能,鼓勵用戶用新語言練習(xí)對話。
Realtime API 收費(fèi)模式和價(jià)格:文本輸入令牌的價(jià)格為 5 美元/1M tokens,輸出令牌的價(jià)格為 20 美元/1Mtokens。音頻輸入的價(jià)格為 100 美元/1M tokens,輸出的價(jià)格為 200 美元/1M tokens。這相當(dāng)于每分鐘音頻輸入約 0.06 美元,每分鐘音頻輸出約 0.24 美元。
海外 AI+音頻代表性應(yīng)用公司及應(yīng)用場景:Duolingo(語言及其他課程學(xué)習(xí))
2024 年 9 月 24 日,全球領(lǐng)先的移動學(xué)習(xí)平臺 Duolingo 在其年度會議 Duocon 2024 上宣布了重大產(chǎn)品創(chuàng)新,主要包括:獨(dú)特虛擬 IP 視頻通話、虛擬世界探險(xiǎn)學(xué)玩、擴(kuò)展音樂、數(shù)學(xué)課程等更新。
1)Video Call With Lily 口語對練:這一功能已上線 iOS 端的英語、西班牙語及法語課程,供海外部分市場的Duolingo Max 會員使用。允許 Duolingo Max 訂閱者與 Duolingo 最受歡迎的角色之一 Lily 進(jìn)行自發(fā)、真實(shí)的對話;
2)Adventures:一種創(chuàng)新的探索游戲式體驗(yàn),用戶首次可以探索動態(tài)設(shè)置和故事情節(jié),通過結(jié)合上下文來與拽姐、奧斯卡等高人氣角色對話,完成任務(wù)。
3)Music:Duolingo 宣布與領(lǐng)先的便攜式樂器制造商 Loog 合作,打造專為 Duolingo Music 課程設(shè)計(jì)的緊湊型便攜式數(shù)碼鋼琴,課程售價(jià)為 249 美元;
4)數(shù)學(xué)課程:多鄰國新增四款益智游戲,模擬更加生活化的教學(xué)場景,滿足不同群體的學(xué)習(xí)需求。
目前 Duolingo 股價(jià)歷史新高,受益于生成式 AI,公司產(chǎn)品的用戶付費(fèi)率逐漸提升,公司財(cái)務(wù)和經(jīng)營數(shù)據(jù)均表現(xiàn)較為亮眼。24Q2 公司實(shí)現(xiàn)營收 1.78 億美元,比去年同期增長 41%;調(diào)整后的 EBITDA 為 4810 萬美元,去年同期為 2090 萬美元,24Q2 和 23Q2 調(diào)整后的 EBITDA 利潤率分別為 27.0%和 16.5%;用戶情況:24Q2Duolingo 月活超過 1 億,季度末付費(fèi)用戶總數(shù)達(dá)到 800 萬,比去年同期增長 52%,即目前 Max 產(chǎn)品付費(fèi)率超過 8%,本次產(chǎn)品更新有望進(jìn)一步加速 Max 產(chǎn)品付費(fèi)滲透率。
更多行業(yè)研究分析請參考思瀚產(chǎn)業(yè)研究院官網(wǎng),同時(shí)思瀚產(chǎn)業(yè)研究院亦提供行研報(bào)告、可研報(bào)告(立項(xiàng)審批備案、銀行貸款、投資決策、集團(tuán)上會)、產(chǎn)業(yè)規(guī)劃、園區(qū)規(guī)劃、商業(yè)計(jì)劃書(股權(quán)融資、招商合資、內(nèi)部決策)、專項(xiàng)調(diào)研、建筑設(shè)計(jì)、境外投資報(bào)告等相關(guān)咨詢服務(wù)方案。