醫(yī)療健康信息技術(shù)裝備制造汽車及零部件文體教育現(xiàn)代服務(wù)業(yè)金融保險(xiǎn)旅游酒店綠色環(huán)保能源電力化工新材料房地產(chǎn)建筑建材交通運(yùn)輸社消零售輕工業(yè)家電數(shù)碼產(chǎn)品現(xiàn)代農(nóng)業(yè)投資環(huán)境
產(chǎn)業(yè)新聞產(chǎn)業(yè)資訊產(chǎn)業(yè)投資產(chǎn)業(yè)數(shù)據(jù)產(chǎn)業(yè)科技產(chǎn)業(yè)政策
1、項(xiàng)目概況
本項(xiàng)目將圍繞公司商業(yè)大數(shù)據(jù)解決方案的主營(yíng)業(yè)務(wù)展開,一方面結(jié)合核心技術(shù)提高數(shù)據(jù)提取、挖掘能力,提高知識(shí)圖譜的建立與計(jì)算能力,同時(shí)提高數(shù)據(jù)獲取與清洗環(huán)節(jié)的自動(dòng)化水平,從而促進(jìn)公司技術(shù)壁壘的構(gòu)建,并為大數(shù)據(jù)解決方案業(yè)務(wù)的運(yùn)營(yíng)帶來降本增效的效果。
另一方面加強(qiáng)公司數(shù)據(jù)中臺(tái)建設(shè),從基礎(chǔ)數(shù)據(jù)、知識(shí)數(shù)據(jù)、智能數(shù)據(jù)維度豐富公司底層數(shù)據(jù)種類與容量,并加強(qiáng)數(shù)據(jù)智能化應(yīng)用模塊研發(fā),提供智能化的信用、商機(jī)、風(fēng)險(xiǎn)描述與評(píng)價(jià),在為客戶提供更加豐富數(shù)據(jù)與功能的同時(shí)提高對(duì)數(shù)據(jù)利用的智能化水平,達(dá)到增強(qiáng)數(shù)據(jù)使用時(shí)效性、降低公司數(shù)據(jù)處理成本,以此作為公司長(zhǎng)期發(fā)展的有力保障。
2、項(xiàng)目具體內(nèi)容
本項(xiàng)目具體研發(fā)內(nèi)容及目標(biāo)如下:
(1)商業(yè)大數(shù)據(jù)核心技術(shù)研發(fā)項(xiàng)目
商業(yè)大數(shù)據(jù)核心技術(shù)研發(fā)子項(xiàng)目以公司人工智能、大數(shù)據(jù)等技術(shù)為基礎(chǔ),通過對(duì)知識(shí)圖譜、自然語言處理、數(shù)據(jù)獲取、數(shù)據(jù)清洗、中間件等技術(shù)進(jìn)行進(jìn)一步研發(fā)以為公司商業(yè)大數(shù)據(jù)業(yè)務(wù)提供更好的底層支持。在知識(shí)圖譜技術(shù)領(lǐng)域,本項(xiàng)目將提高知識(shí)圖譜建立的智能化水平,并加強(qiáng)分布式圖數(shù)據(jù)庫(kù)、關(guān)系計(jì)算研發(fā)投入,提高計(jì)算性能與關(guān)系挖掘能力;
在自然語言處理技術(shù)領(lǐng)域,本項(xiàng)目集中于新聞、公告等復(fù)雜文本情況下的關(guān)系識(shí)別、提取、內(nèi)容去重及情感分析的研發(fā),提升商業(yè)大數(shù)據(jù)服務(wù)在復(fù)雜文本場(chǎng)景下的信息提取、分析能力;
在數(shù)據(jù)獲取領(lǐng)域,本項(xiàng)目將探索公開數(shù)據(jù)源自動(dòng)發(fā)現(xiàn)能力,對(duì)網(wǎng)頁(yè)的結(jié)構(gòu)進(jìn)行優(yōu)化,提高數(shù)據(jù)獲取效率,并實(shí)現(xiàn)對(duì)數(shù)據(jù)的自動(dòng)更新,降低公司數(shù)據(jù)獲取成本、提高數(shù)據(jù)內(nèi)容的時(shí)效性;在數(shù)據(jù)清洗領(lǐng)域,本項(xiàng)目基于人工智能與弱監(jiān)督學(xué)習(xí)研發(fā)半自動(dòng)化的數(shù)據(jù)清洗技術(shù),降低數(shù)據(jù)標(biāo)注、數(shù)據(jù)清洗成本;在中間件領(lǐng)域本項(xiàng)目將在訪問便捷度、訪問效率、數(shù)據(jù)安全性領(lǐng)域進(jìn)行研發(fā),提高訪問體驗(yàn)與底層數(shù)據(jù)的安全性。
(2)數(shù)據(jù)中臺(tái)建設(shè)項(xiàng)目
數(shù)據(jù)資源是公司商業(yè)大數(shù)據(jù)服務(wù)的核心,數(shù)據(jù)中臺(tái)建設(shè)子項(xiàng)目基于提高底層數(shù)據(jù)完整性、提升數(shù)據(jù)中臺(tái)智能化水平進(jìn)行三個(gè)模塊的建設(shè):基礎(chǔ)數(shù)據(jù)模塊、知識(shí)數(shù)據(jù)模塊、智能數(shù)據(jù)模塊。具體為:
1)基礎(chǔ)數(shù)據(jù)模塊包括國(guó)內(nèi)外企業(yè)數(shù)據(jù)、產(chǎn)品產(chǎn)業(yè)數(shù)據(jù)、宏觀數(shù)據(jù),以及商業(yè)、行為、檢測(cè)等另類數(shù)據(jù)。基礎(chǔ)數(shù)據(jù)模塊的完善能夠提高公司數(shù)據(jù)的完整性,為下游客戶決策的制定提供更加豐富的維度,并幫助商業(yè)大數(shù)據(jù)業(yè)務(wù)探索更多的服務(wù)模式。
2)知識(shí)數(shù)據(jù)模塊主要為企業(yè)、產(chǎn)品、產(chǎn)業(yè)鏈、事件等知識(shí)圖譜系統(tǒng)的建設(shè),建立起企業(yè)、產(chǎn)品、產(chǎn)業(yè)鏈、事件之間的節(jié)點(diǎn)與關(guān)系,豐富結(jié)構(gòu)化標(biāo)簽與非結(jié)構(gòu)化描述,并對(duì)節(jié)點(diǎn)、關(guān)系進(jìn)行高效的可視化描述,能夠加強(qiáng)公司底層知識(shí)圖譜能力。
3)智能數(shù)據(jù)模塊包括信用模型、傳導(dǎo)模型、風(fēng)險(xiǎn)模型、機(jī)會(huì)模型,以及智庫(kù)產(chǎn)品,通過自動(dòng)化模型的研發(fā)能夠?qū)崿F(xiàn)對(duì)企業(yè)信用、關(guān)系傳導(dǎo)、企業(yè)風(fēng)險(xiǎn)、商機(jī)的自動(dòng)分析與評(píng)價(jià),能夠提高公司數(shù)據(jù)分析的智能化水平,并為用戶提供便于使用的智庫(kù)類產(chǎn)品。
3、項(xiàng)目必要性及可行性分析
(1)提升數(shù)據(jù)完整性、準(zhǔn)確性、實(shí)時(shí)性,滿足下游客戶場(chǎng)景化應(yīng)用需求
隨著大數(shù)據(jù)解決方案行業(yè)的發(fā)展,行業(yè)經(jīng)營(yíng)模式相對(duì)穩(wěn)定,產(chǎn)品與服務(wù)的競(jìng)爭(zhēng)逐漸激烈,各平臺(tái)紛紛推動(dòng)差異化戰(zhàn)略以構(gòu)建競(jìng)爭(zhēng)優(yōu)勢(shì)。對(duì)于數(shù)據(jù)資產(chǎn)而言,數(shù)據(jù)的完整性、準(zhǔn)確性、實(shí)時(shí)性是實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)價(jià)值并且最大化發(fā)揮其效能的關(guān)鍵。
一方面,平臺(tái)需要提高數(shù)據(jù)覆蓋廣度,為用戶使用數(shù)據(jù)提供多維度參考,另一方面則在于大數(shù)據(jù)平臺(tái)應(yīng)該為用戶提供準(zhǔn)確的數(shù)據(jù)并及時(shí)、高效地處理與更新信息,把握數(shù)據(jù)價(jià)值。首先,數(shù)據(jù)覆蓋廣度決定利用效率,更豐富的數(shù)據(jù)能夠?yàn)榭蛻籼峁└嗟膮⒖季S度,幫助客戶在更多場(chǎng)景做出決策。
其次,商業(yè)大數(shù)據(jù)質(zhì)量參差不齊且實(shí)時(shí)發(fā)生變化,客戶依賴公司提供的大數(shù)據(jù)解決方案進(jìn)行風(fēng)險(xiǎn)管理、智能營(yíng)銷、市場(chǎng)分析等活動(dòng),錯(cuò)誤或過時(shí)的數(shù)據(jù)具有引發(fā)錯(cuò)誤決策的風(fēng)險(xiǎn),數(shù)據(jù)完整性能夠保障企業(yè)所取得數(shù)據(jù)信息緊跟市場(chǎng)變化,從而提高決策的可靠性。
本項(xiàng)目中,公司在提高數(shù)據(jù)挖掘、計(jì)算等核心能力的同時(shí),還將針對(duì)數(shù)據(jù)完整性進(jìn)行建設(shè),完善基礎(chǔ)數(shù)據(jù)、知識(shí)數(shù)據(jù)模塊內(nèi)容,為用戶提供更加豐富的數(shù)據(jù)內(nèi)容,并針對(duì)數(shù)據(jù)清洗、數(shù)據(jù)實(shí)時(shí)提取技術(shù)進(jìn)行研發(fā),提高數(shù)據(jù)質(zhì)量與對(duì)數(shù)據(jù)的實(shí)時(shí)抓取、更新能力,從而滿足下游客戶越來越豐富的應(yīng)用場(chǎng)景需求。
(2)加強(qiáng)知識(shí)圖譜、大數(shù)據(jù)挖掘方面的技術(shù)壁壘,招募相關(guān)技術(shù)人才
技術(shù)是公司提供各種商業(yè)大數(shù)據(jù)服務(wù)的基礎(chǔ)支撐,也是公司核心競(jìng)爭(zhēng)力的體現(xiàn)。隨著大數(shù)據(jù)、NLP、深度學(xué)習(xí)、知識(shí)圖譜等新興技術(shù)在行業(yè)內(nèi)的加速滲透,行業(yè)技術(shù)水平不斷提高,由于這些技術(shù)具有高投入的特性,需要進(jìn)行長(zhǎng)時(shí)間研發(fā),因此各企業(yè)紛紛加強(qiáng)優(yōu)勢(shì)技術(shù)研發(fā),構(gòu)建技術(shù)護(hù)城河。
為了保持公司產(chǎn)品服務(wù)的技術(shù)領(lǐng)先性,公司需要對(duì)現(xiàn)有技術(shù)迭代升級(jí),建立企業(yè)知識(shí)圖譜技術(shù)系統(tǒng)、自然語言處理技術(shù)系統(tǒng),研究基于人工智能弱監(jiān)督學(xué)習(xí)的半自動(dòng)大數(shù)據(jù)清洗技術(shù)、分布式數(shù)據(jù)中間件等先進(jìn)技術(shù)。技術(shù)的創(chuàng)新在幫助公司構(gòu)建技術(shù)壁壘的同時(shí)可進(jìn)一步提高產(chǎn)品與服務(wù)水平,為客戶帶來更便捷的使用體驗(yàn),進(jìn)而促進(jìn)業(yè)務(wù)的增長(zhǎng)。
同時(shí),NLP、大數(shù)據(jù)等技術(shù)升級(jí)難度較大,對(duì)人員需求較高,不僅需要公司具有較大規(guī)模的技術(shù)團(tuán)隊(duì),同時(shí)對(duì)其技術(shù)水平與研發(fā)經(jīng)驗(yàn)也有一定的要求,但公司的人員規(guī)模無法滿技術(shù)升級(jí)的迫切需求。公司計(jì)劃招募更多高水平研發(fā)人才,幫助公司開展人工智能、大數(shù)據(jù)、知識(shí)圖譜等技術(shù)的研發(fā),以進(jìn)一步加強(qiáng)技術(shù)壁壘,有利于公司的長(zhǎng)期可持續(xù)發(fā)展。
(3)升級(jí)大數(shù)據(jù)解決方案業(yè)務(wù)的自動(dòng)化與智能化能力,實(shí)現(xiàn)降本增效
公司大數(shù)據(jù)解決方案業(yè)務(wù)以大數(shù)據(jù)技術(shù)為框架,以數(shù)據(jù)為支撐,良好的數(shù)據(jù)質(zhì)量是公司業(yè)務(wù)開展與的必要前提。由于公司數(shù)據(jù)源多樣,所獲取的數(shù)據(jù)在格式、質(zhì)量等方面均存在較大差異,需要在挖掘前對(duì)數(shù)據(jù)進(jìn)行清洗留下高質(zhì)量的數(shù)據(jù),存在一定的清洗成本。此外,公司 NLP、知識(shí)圖譜等技術(shù)模型算法的進(jìn)步需要大量標(biāo)注后的數(shù)據(jù)加以訓(xùn)練,成本較高。
通過本項(xiàng)目的實(shí)施,公司將研究基于人工智能弱監(jiān)督學(xué)習(xí)的半自動(dòng)大數(shù)據(jù)清洗技術(shù),通過建立智能數(shù)據(jù)清洗模型,避免大量樣本標(biāo)注,而是基于原始數(shù)據(jù)即可完成訓(xùn)練,從而降低樣本標(biāo)注成本。公司還將開發(fā)可自動(dòng)生成數(shù)據(jù)清洗規(guī)則的模型,通過配合人工干預(yù)和人工預(yù)設(shè)規(guī)則,對(duì)海量數(shù)據(jù)進(jìn)行有效的異常數(shù)據(jù)發(fā)現(xiàn)與修復(fù),實(shí)現(xiàn)降低數(shù)據(jù)清洗成本的效果。因此,本項(xiàng)目建設(shè)能夠降低公司數(shù)據(jù)標(biāo)注與清洗成本,提高公司盈利能力。
此外,公司還將針對(duì)知識(shí)圖譜系統(tǒng)進(jìn)行智能化模型研發(fā)與計(jì)算性能優(yōu)化,通過自動(dòng)化的關(guān)系建立模型提高知識(shí)圖譜建設(shè)效率,并通過加快計(jì)算速度、加大關(guān)系計(jì)算深度為客戶提供更加優(yōu)秀的服務(wù)。作為公司商業(yè)大數(shù)據(jù)業(yè)務(wù)的基礎(chǔ),數(shù)據(jù)技術(shù)平臺(tái)的升級(jí)能夠?yàn)楣緲I(yè)務(wù)保持長(zhǎng)期競(jìng)爭(zhēng)力與可持續(xù)增長(zhǎng)提供推動(dòng)力,是公司戰(zhàn)略發(fā)展的必要建設(shè)。
4、項(xiàng)目建設(shè)進(jìn)度安排
項(xiàng)目建設(shè)周期為三年,投資16,306.01萬元。