醫(yī)療健康信息技術裝備制造汽車及零部件文體教育現(xiàn)代服務業(yè)金融保險旅游酒店綠色環(huán)保能源電力化工新材料房地產(chǎn)建筑建材交通運輸社消零售輕工業(yè)家電數(shù)碼產(chǎn)品現(xiàn)代農(nóng)業(yè)投資環(huán)境
產(chǎn)業(yè)新聞產(chǎn)業(yè)資訊產(chǎn)業(yè)投資產(chǎn)業(yè)數(shù)據(jù)產(chǎn)業(yè)科技產(chǎn)業(yè)政策
近年來,視覺人工智能的多數(shù)研究都集中在深度學習、檢測和分類面部/手部/姿勢、3D 傳感技術等方面。隨著識別準確度的提升空間趨小,研究重心將逐漸轉(zhuǎn)向技術協(xié)同、融合與應用。
在視覺人工智能領域內(nèi),將終端設備演進為小型數(shù)據(jù)中心集群,并與云端高效協(xié)同將成為研究重點之一。終端設備的鋪設和數(shù)據(jù)量的增長將使面向云端的傳輸壓力倍增,這要求端側(cè)完成部分云側(cè)的圖像處理功能。而在終端逐漸提高的算力要求,例如更加準確的實時識別,也需要端云架構的協(xié)同整合。
在識別技術趨于成熟的今天,端云的深度結合與協(xié)同將成為識別技術的重要依托,如何將兩側(cè)的架構進行不斷耦合優(yōu)化也將不會局限于計算機視覺技術,而成為人工智能技術層共同探索的方向。
目前,業(yè)內(nèi)的部分研究也在突破對識別準確度的單一聚焦,轉(zhuǎn)向更加綜合的計算機視覺問題,如圖像描述、事件推理、場景理解等。未來,視覺人工智能將與其他的智能技術協(xié)同融合,評判因素也將由準確性延伸至識別的靈活性、推測的合理性。例如,融合自然語言處理技術來完成圖像描述,將圖片翻譯為一段文字。
而事件推理則是通過識別復雜視頻中的因果關系,并基于因果關系給出合理推測。未來,安防領域可運用這項技術,建立端到端的時間推理系統(tǒng),從而幫助提升案件偵查效率,改善治安管理效果。
場景理解則通過由自身傳感器收集的環(huán)境感知數(shù)據(jù),獲得周邊場景的幾何/拓撲結構、構成要素與時空變化,并進行語義推理甚至決策出未來時間內(nèi)的運動走向。該項技術有廣大的潛在市場亟待滲透,未來隨著數(shù)據(jù)集的不斷拓展和自監(jiān)督學習,視覺人工智能的交互性和通用性將大大增強,為各種行業(yè)所用。
技術的協(xié)同和融合將進一步積累針對多樣化場景的解決方案,而更加廣泛、密集的應用又將推動技術的不斷迭代。海量數(shù)據(jù)、多種技術的交互作用有利于最終構成完整的技術賦能平臺,持續(xù)的整合和創(chuàng)新將不斷擴展視覺人工智能的技術邊界,轉(zhuǎn)化為下一階段的產(chǎn)業(yè)化能力和平臺化能力。