亚洲国产午夜真人一级片中文字幕精品黄,精品久久久噜噜噜久久久,国产区综合精品国产www,www.国产精品.com,国产美女的第一次好痛在线看,最新国产乱人伦偷精品免费网站,日本欧美一区二区三区不卡视频,精品久久久无码人妻字幂,国产午夜精品理论片,国产午夜精品久久久久免费视

首 頁
研究報告

醫(yī)療健康信息技術(shù)裝備制造汽車及零部件文體教育現(xiàn)代服務(wù)業(yè)金融保險旅游酒店綠色環(huán)保能源電力化工新材料房地產(chǎn)建筑建材交通運輸社消零售輕工業(yè)家電數(shù)碼產(chǎn)品現(xiàn)代農(nóng)業(yè)投資環(huán)境

產(chǎn)業(yè)規(guī)劃

產(chǎn)業(yè)規(guī)劃專題產(chǎn)業(yè)規(guī)劃案例

可研報告

可研報告專題可研報告案例

商業(yè)計劃書

商業(yè)計劃書專題商業(yè)計劃書案例

園區(qū)規(guī)劃

園區(qū)規(guī)劃專題園區(qū)規(guī)劃案例

大健康

大健康專題大健康案例

行業(yè)新聞

產(chǎn)業(yè)新聞產(chǎn)業(yè)資訊產(chǎn)業(yè)投資產(chǎn)業(yè)數(shù)據(jù)產(chǎn)業(yè)科技產(chǎn)業(yè)政策

關(guān)于我們

公司簡介發(fā)展歷程品質(zhì)保證公司新聞

當(dāng)前位置:思瀚首頁 >> 可研報告 >>  可研報告案例 >>  通訊網(wǎng)絡(luò)

人工智能核心技術(shù)研發(fā)升級項目可行性研究報告
思瀚產(chǎn)業(yè)研究院 合合信息    2023-09-12

1、項目概況

圍繞著公司技術(shù)架構(gòu)體系,該項目通過繼續(xù)對前沿 AI 技術(shù)進行研發(fā),進一步升級目前的 AI 平臺和 AI 核心技術(shù),深化智能文字識別技術(shù)在公司 C 端和 B 端業(yè)務(wù)的場景應(yīng)用,提升公司核心技術(shù)競爭力。

本項目分 AI 智能文檔識別與分析技術(shù)項目、AI 自然語言處理平臺項目、AI 底層技術(shù)平臺研發(fā)項目三個方向展開。

本項目是對公司目前的智能文字識別核心技術(shù)的進一步深化、升級和整合,通過更加模型化、平臺化的技術(shù)開發(fā),支撐公司智能文字識別 C 端產(chǎn)品和 B 端服務(wù)等業(yè)務(wù)發(fā)展。

2、項目具體內(nèi)容

(1)AI 智能文檔識別與分析技術(shù)項目

本項目主要擴展智能文字識別技術(shù)的應(yīng)用場景,提升技術(shù)的應(yīng)用性能,包括多語言場景、多文字方向場景、多樣化字體和版面場景,加強對圖表識別理解、掃描文檔圖像分析還原及掃描增強等智能文字識別技術(shù)研發(fā),提升文本圖像質(zhì)量、識別準(zhǔn)確率,進一步優(yōu)化用戶體驗。

1)多語言多方向的 STR(Scene Text Recognition)技術(shù)研發(fā)

支持對拍攝或者掃描后的文本圖像中的多語言和多方向文字進行識別,提取文字和版式。該項目旨在通過研發(fā)相應(yīng)的多方向文字檢測技術(shù),多語言文字識別技術(shù),特別是中文和英語混合的圖像文本識別技術(shù)進行優(yōu)化。

2)復(fù)雜場景下的 STR(Scene Text Recognition)技術(shù)研發(fā)

支持對拍攝或者掃描后的文本圖像中,存在的曲形文字、圓形文字、手寫文字、公式、下劃線文字、藝術(shù)體文字、復(fù)雜版面中的文字等各種復(fù)雜場景下的文字進行識別。該項目旨在通過對文字檢測和識別技術(shù)進行升級,使得其能夠適應(yīng)更通用更復(fù)雜多樣的場景下的文字檢測與識別,比如可以更好地對試卷、雜志、手寫文稿中的文字進行識別。

3)文檔中圖表的檢測、識別和理解技術(shù)研發(fā)

圖表在商業(yè)文檔具有非常重要的作用和意義,該技術(shù)主要是為了研發(fā)和升級表格檢測識別和理解技術(shù)算法,以支持對拍攝或者掃描后的商業(yè)文檔數(shù)據(jù)中的圖表進行檢測、識別和理解。該項目旨在通過研發(fā)文檔圖像中的圖表的檢測識別和理解算法,并與文字識別和理解相結(jié)合,更好的對文檔圖像進行識別和理解。

4)基于數(shù)據(jù)驅(qū)動的版面分析與還原技術(shù)研發(fā)

支持對拍攝或者掃描后的商業(yè)文本圖像數(shù)據(jù)進行版面分析,對識別后的文字按照語義進行組織,并還原成對應(yīng)的 word、excel、pdf 等各種格式的文件。該項目旨在通過研發(fā)基于圖像檢測和分割的文檔版面分析算法、基于智能文字識別結(jié)果的文檔版面分析算法,以及這兩種算法的融合和集成,實現(xiàn)商業(yè)文檔的版面分析與還原。

5)智能文檔掃描增強技術(shù)研發(fā)

本項目旨在利用基于深度學(xué)習(xí)的曲面文本圖像校正技術(shù)、文本圖像切邊技術(shù)、去陰影技術(shù)、去手指技術(shù)、多圖拼接技術(shù)等對各種業(yè)務(wù)場景中的拍照和掃描文檔圖像進行智能掃面增強處理,提升文本圖像的質(zhì)量和用戶體驗。大幅度降低后續(xù)的文檔圖像分析與處理的難度。例如在拍書的場景中,由于書籍彎曲,使得拍攝的書籍圖像頁面是彎曲的,通過曲面文檔校正技術(shù),可以將曲面校正成平面,提升整個圖像的質(zhì)量。

6)基于 AI 技術(shù)的文檔圖像檢測與定位技術(shù)研發(fā)

在實際應(yīng)用場景中,用戶拍攝的圖像中,除了用戶關(guān)心的文本圖像外,還包含很多干擾性背景。在有些場景中,用戶對多個文本圖像感興趣,而不希望拍攝多次。因此,本項目旨在利用基于深度學(xué)習(xí)的物體檢測技術(shù)對任意場景下的文檔進行定位檢測??梢宰詣佣ㄎ粰z測出每一個文本圖像的位置。為后續(xù)的切邊校正、增強、分類、識別提供一個干凈的文本圖像,降低后續(xù)文本圖像處理的難度,大幅提升用戶體驗。

(2)AI 自然語言處理平臺項目

本項目將重點建設(shè)超大規(guī)模自然語言模型訓(xùn)練平臺,以此為技術(shù)支撐,開發(fā)拓?fù)浜驼Z義信息融合及基于遷移學(xué)習(xí)的文字理解技術(shù),在理解的基礎(chǔ)上,進一步實現(xiàn)自然語言的生成。并在與智能文字識別技術(shù)結(jié)合后,使機器能對全新的、任意商業(yè)文檔實現(xiàn)關(guān)鍵信息提取。

1)超大規(guī)模的自然語言模型訓(xùn)練平臺

為了建設(shè)超大規(guī)模語料的存儲清洗提煉挖掘平臺,針對超大規(guī)模語料提供分布式計算功能,可實時流式處理文本語料,同時應(yīng)用多種算法清洗語料,為語料提供分布式高可用存儲支持。本項目旨在研發(fā)超大規(guī)模的自然語言預(yù)訓(xùn)練模型,并構(gòu)建并行訓(xùn)練系統(tǒng),加速大規(guī)模語言模型的訓(xùn)練,采用 Bert、XLNet、ERNIE 等深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的相關(guān)模型,對后續(xù)的各種 NLP 技術(shù)提供底層技術(shù)支撐。

2)融合拓?fù)湫畔⒑驼Z義信息的文字理解技術(shù)

針對拍攝的或者掃描的文本圖像,通過智能文字識別技術(shù)合合可以獲取到文本圖像中每個字符的文本內(nèi)容和位置信息。該項目主要是同時利用文字的語義和拓?fù)湫畔亩酶珳?zhǔn)地對文字進行理解。該項目旨在研發(fā)文字語義特征提取,拓?fù)湮恢锰卣魈崛?、多特征融合語義理解技術(shù),實現(xiàn)對證照、票據(jù)、簡歷、合同等各種類型的文檔進行理解。

3)基于遷移學(xué)習(xí)的文字理解技術(shù)

通過融合拓?fù)湫畔⒑驼Z義信息的語義理解技術(shù),公司可以針對有充分標(biāo)注數(shù)據(jù)的各種類型的文本圖像訓(xùn)練一個通用的語義理解模型。但在遇到特定類型的新文本圖像時,起步階段標(biāo)注樣本較少,導(dǎo)致語義理解技術(shù)無法使用。本項目旨在將遷移學(xué)習(xí)技術(shù)與融合拓?fù)湫畔⒑驼Z義信息的文字理解技術(shù)相結(jié)合,通過將已經(jīng)訓(xùn)練好的文字理解模型中學(xué)習(xí)到的知識遷移到新遇到的文本圖像數(shù)據(jù)中,從而實現(xiàn)對少量標(biāo)注的新的文本圖像的語義理解。

4)自然語言生成技術(shù)研發(fā)

本項目主要為了讓機器在理解文字內(nèi)容的同時,能夠自主生成人類能夠閱讀的自然語言,可以和人類進行語言上的溝通交流,使機器不僅能夠幫助處理海量的文檔信息內(nèi)容,理解文字信息背后的含義,同時能夠?qū)⑵涮釤挼暮诵膬?nèi)容信息通過語言文字表達出來,讓人更高效地處理文字信息內(nèi)容。

5)基于 AI 技術(shù)的智能文檔關(guān)鍵信息提取技術(shù)研發(fā)

目前文檔關(guān)鍵信息提取的技術(shù)主要針對特定的文檔類型,比如合同關(guān)鍵信息提取、票據(jù)關(guān)鍵信息提取等。通過運用 AI 技術(shù),可以實現(xiàn)在面對全新的文檔類型時,準(zhǔn)確地將其中的關(guān)鍵信息提取出來。因此本項目主要是將公司的智能文字識別與 NLP 技術(shù)進行集成并進行創(chuàng)新研發(fā),實現(xiàn)對任意商業(yè)文檔實現(xiàn)關(guān)鍵信息提取,從而更大的擴展 NLP技術(shù)的應(yīng)用場景和范圍。

(3)AI 底層技術(shù)平臺研發(fā)項目

本項目重點開發(fā) AI 底層技術(shù),包括針對數(shù)據(jù)的自動生成技術(shù)、針對圖像的分層技術(shù),并進一步開發(fā)更加通用的自學(xué)習(xí)平臺,使公司的 AI 模型在實際業(yè)務(wù)場景中的性能不斷提升。對 AI 算法在實際運行中出現(xiàn)的高延遲、能量消耗與模型存儲量過大的問題,開發(fā)深度學(xué)習(xí)模型壓縮和加速技術(shù),大幅度提升 AI 技術(shù)在移動端和邊緣計算設(shè)備中的落地的廣度和深度。

1)深度學(xué)習(xí)模型壓縮和加速技術(shù)研發(fā)

深度學(xué)習(xí)技術(shù)在很多領(lǐng)域內(nèi)取得了非常優(yōu)異性能的同時,也受限于其高延遲、能量消耗與模型存儲量過大的問題。特別是在移動端和邊緣計算設(shè)備中,深度學(xué)習(xí)技術(shù)很難落地應(yīng)用。因此,該技術(shù)主要是通過對模型的結(jié)構(gòu)進行優(yōu)化設(shè)計,并對模型的參數(shù)進行壓縮,在基本不影響性能的情況下,大幅度降低深度學(xué)習(xí)模型的存儲量并提升運行速度。該項目主要是通過對深度學(xué)習(xí)模型壓縮和加速技術(shù)進行研發(fā),使公司的核心 AI 算法能夠在模型精度,運算速度和模型大小三個指標(biāo)上有更好的平衡,從而大幅度提升 AI 技術(shù)在移動端和邊緣計算設(shè)備中的落地的廣度和深度。

2)基于深度學(xué)習(xí)的數(shù)據(jù)自動生成技術(shù)研發(fā)

該項目旨在通過基于深度學(xué)習(xí)的 GAN 技術(shù)、遷移學(xué)習(xí)、圖像處理、版面分析技術(shù)、NLP 技術(shù)等技術(shù)進行集成和融合,自動生成出符合真實場景的各種類型的數(shù)據(jù),包括但不限于多語言文本行數(shù)據(jù)、文檔圖像數(shù)據(jù)、自然語言數(shù)據(jù)等。海量的標(biāo)注數(shù)據(jù)在 AI項目中占據(jù)舉足輕重的地位,真實場景下,大量的標(biāo)注數(shù)據(jù)面臨著數(shù)據(jù)獲取困難、標(biāo)注成本高的問題。本項目通過數(shù)據(jù)生成技術(shù)自動的生成海量標(biāo)注樣本,從而提升公司核心AI 技術(shù)的整體性能和應(yīng)用場景。

3)通用的 AI 自學(xué)習(xí)平臺技術(shù)研發(fā)

該項目主要是通過研發(fā) AI 自學(xué)習(xí)平臺技術(shù),構(gòu)建公司的 AI 自學(xué)習(xí)平臺?;谠撟詫W(xué)習(xí)平臺,可以將公司智能文字識別、自然語言處理、數(shù)據(jù)生成等 AI 技術(shù)的開發(fā)在一個平臺上迭代升級,更高效地服務(wù)于實際業(yè)務(wù)。通過不斷的增加實際業(yè)務(wù)場景的數(shù)據(jù)和深度學(xué)習(xí)技術(shù),反哺 AI 自學(xué)習(xí)平臺,使得公司的 AI 模型在實際業(yè)務(wù)場景中的性能不斷提升。

4)基于 AI 技術(shù)的圖像分層技術(shù)研發(fā)

在實際業(yè)務(wù)場景中,圖像中往往存在多種要素疊加在一起的情況。例如印章會疊加在文字上面,水印會疊加在文字下面,有些文字也會疊加在圖像上等等。疊加的要素會干擾對某一特定要素的處理。因此本項目旨在通過研發(fā)基于 AI 技術(shù)的圖像分層技術(shù),將圖像中的疊加要素進行分離,從而使得后續(xù)針對特定要素的處理更加方便有效。

3、項目必要性及可行性分析

(1)項目的實施有利于公司響應(yīng)用戶需求,進一步提高在多語言、多場景、多版式的文檔識別與分析的準(zhǔn)確率

隨著公司的產(chǎn)品應(yīng)用市場越來越廣闊,個人和企業(yè)用戶積累數(shù)量的快速增長,用戶需求和市場特征也在快速變化,用戶的使用需求更加多樣化。公司業(yè)務(wù)擴張的全球化,使得公司產(chǎn)品需要適應(yīng)種類更加多樣的語言。在真實場景中,可能遇到多文字方向、曲形文字、圓形文字、手寫文字、公式、下劃線文字、藝術(shù)體文字、復(fù)雜版面等復(fù)雜情況。用戶對圖表、票據(jù)、合同、報表、購物小票、手寫文稿等場景下的文本圖像質(zhì)量要求越來越高。

基于此,本項目主要擴展智能文檔識別與分析技術(shù)的應(yīng)用場景,提升技術(shù)的應(yīng)用性能,包括多語言場景、多文字方向場景、多樣化字體和版面場景,強化智能文字識別技術(shù)研發(fā),提升文本圖像質(zhì)量、識別準(zhǔn)確率,進一步優(yōu)化用戶體驗。將加強對復(fù)雜場景文檔關(guān)鍵信息提取、掃描拍攝文件格式轉(zhuǎn)換等技術(shù)的研發(fā),緊跟用戶需求和市場趨勢變化,實現(xiàn)更廣泛的產(chǎn)品應(yīng)用場景的覆蓋。

(2)項目的實施有助于提升產(chǎn)品性能,提高研發(fā)效率,實現(xiàn)新產(chǎn)品、服務(wù)的快速開發(fā)

文字識別技術(shù)水平的進一步提升高度依賴于自然語言處理技術(shù)的水平,在此基礎(chǔ)上提供更為智能的商務(wù)智能分析與服務(wù)。在用戶實際使用產(chǎn)品的過程中,智能文字識別技術(shù)可以獲取到文本圖像中每個字符的文本內(nèi)容和位置信息,但對于證照、票據(jù)、簡歷、合同等各種類型的文檔,需要同時利用文字的語義和拓?fù)湫畔?,才能更好、更精?zhǔn)地對文字進行理解。

在產(chǎn)品開發(fā)過程中,研發(fā)人員一般針對有充分標(biāo)注數(shù)據(jù)的各種類型的文本圖像訓(xùn)練一個通用的語義理解模型,但在很多場景中,文本圖像的類型會逐步增多,尤其在開發(fā)初期,特定類型的新文本圖像的標(biāo)注樣本較少,產(chǎn)生語義理解技術(shù)無法使用的問題。

本項目將重點建設(shè)超大規(guī)模自然語言模型訓(xùn)練平臺,以此為技術(shù)支撐,開發(fā)拓?fù)浜驼Z義信息融合及基于遷移學(xué)習(xí)的文字理解技術(shù),在理解的基礎(chǔ)上,進一步實現(xiàn)自然語言的生成。并在與智能文字識別技術(shù)結(jié)合后,使機器能對全新的、任意商業(yè)文檔實現(xiàn)關(guān)鍵信息提取,提升用戶體驗,并減少開發(fā)過程中的樣本數(shù)據(jù)規(guī)模量、減少標(biāo)注量,提升模型性能及運行速度,降低新模型的構(gòu)建周期,提高技術(shù)研發(fā)和產(chǎn)品開發(fā)的效率。

(3)項目的實施助力企業(yè)提升技術(shù)壁壘,引領(lǐng)技術(shù)變革步伐

軟件產(chǎn)品迭代和技術(shù)更新發(fā)展速度非常快,尤其是面向全球的基于人工智能的技術(shù)和產(chǎn)品更是呈現(xiàn)日新月異的發(fā)展態(tài)勢。

本項目重點開發(fā) AI 底層技術(shù),包括基于 AI 技術(shù)的針對數(shù)據(jù)的自動生成技術(shù)、針對圖像的分層技術(shù),并進一步開發(fā)更加通用的自學(xué)習(xí)平臺,使公司的 AI 模型在實際業(yè)務(wù)場景中的性能不斷提升。對 AI 算法在實際運行中出現(xiàn)的高延遲、能量消耗與模型存儲量過大的問題,開發(fā)深度學(xué)習(xí)模型壓縮和加速技術(shù),大幅提升 AI 技術(shù)在移動端和邊緣計算設(shè)備中的落地的廣度和深度。

通過對 AI 前沿算法進行研發(fā),可以進一步加深和擴展公司的 AI 核心算法技術(shù),并和通用文檔的機器識別理解場景深度結(jié)合,進一步提升公司在智能文檔識別與分析領(lǐng)域的技術(shù)壁壘。

4、項目建設(shè)進度及投資

項目建設(shè)周期為三年、項目投資21,032萬元。

免責(zé)聲明:
1.本站部分文章為轉(zhuǎn)載,其目的在于傳播更多信息,我們不對其準(zhǔn)確性、完整性、及時性、有效性和適用性等任何的陳述和保證。本文僅代表作者本人觀點,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。
2.思瀚研究院一貫高度重視知識產(chǎn)權(quán)保護并遵守中國各項知識產(chǎn)權(quán)法律。如涉及文章內(nèi)容、版權(quán)等問題,我們將及時溝通與處理。

人妻少妇精品视频二区| 久久精品国产福利一区二区| 亚洲成aAv人片不卡无码| 欧美国产亚洲日韩一区二区三区| 精品国产一区二区三区不卡免费| 亚洲一区爱区精品无码| 热RE99久久6国产精品免费| 免费观看的AV毛片的网站| 国产偷窥熟女精品视频大全| 午夜成人理论无码电影在线播放| 久久精品国产亚洲AV麻豆长发| 久久夜色精品国产网站| 99精品电影一区二区免费看| 欧美狂野精品视频在线观看| 欧美爆乳大码在线观看| 网友分享AV无码高潮AV心得| 国产精品V欧美精品∨日韩| 婷婷色婷婷开心五月四房播播| 欧美性爱国产一区二区三区| 免费看的黄色视频一本无码| 久久久久亚洲Av专区首页| 三级a午夜电影在线观看| 久久综合伊人99麻豆| 国产日韩精品欧美一区喷水| 久久亚洲国产精品成人AV秋霞| 人妻体体内射精一区二区| 2021精品无码福利在线| 国产猛男猛女超爽免费视频| 99久久99视频只有精品| 久久婷婷五月综合色奶水99啪| 国模吧-亚洲AV午夜精品一区二区三区| 四虎国产精品无码免费看| 国产精品久久久久久久小说| 重口SM一区二区三区视频| 国产区视频在线观看日韩午夜三级| 亚洲鲁丝片AV无码多人 | 91精品国产综合久久久久久| 欧美老熟妇又粗又大| a级片在线秋霞影音先锋一区二区| 无码久久综合久中文字幕| 中文字幕无码免费久久|