醫(yī)療健康信息技術(shù)裝備制造汽車及零部件文體教育現(xiàn)代服務(wù)業(yè)金融保險(xiǎn)旅游酒店綠色環(huán)保能源電力化工新材料房地產(chǎn)建筑建材交通運(yùn)輸社消零售輕工業(yè)家電數(shù)碼產(chǎn)品現(xiàn)代農(nóng)業(yè)投資環(huán)境
產(chǎn)業(yè)新聞產(chǎn)業(yè)資訊產(chǎn)業(yè)投資產(chǎn)業(yè)數(shù)據(jù)產(chǎn)業(yè)科技產(chǎn)業(yè)政策
近年來隨著互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、5G 、Ai等信息通信技術(shù)及產(chǎn)業(yè)的不斷發(fā)展,全球數(shù)據(jù)量呈爆發(fā)式增長(zhǎng)態(tài)勢(shì)。
數(shù)據(jù)作為和土地、資本、勞動(dòng)力、技術(shù)一樣的生產(chǎn)要素,在數(shù)字經(jīng)濟(jì)不斷深入發(fā)展的過程中,地位愈發(fā)凸顯。我國(guó)是數(shù)據(jù)資源大國(guó),IDC 研究報(bào)告指出,到 2020 年,中國(guó)數(shù)據(jù)量約 12.6ZB,較 2015 年增長(zhǎng) 7 倍,年復(fù)合增長(zhǎng)率為 124%。2025 年中國(guó)的數(shù)據(jù)量預(yù)計(jì)達(dá)到 48.6ZB,約占全球數(shù)據(jù)總量的 30%。
數(shù)據(jù)資源總體呈現(xiàn)出“4V”的特點(diǎn),即海量的數(shù)據(jù)規(guī)模(Volume)、多樣的數(shù)據(jù)類型(Variety)、價(jià)值密度低(Value)、快速的數(shù)據(jù)流轉(zhuǎn)(Velocity)。海量的數(shù)據(jù)規(guī)模指數(shù)據(jù)量大,包括采集、存儲(chǔ)和計(jì)算過程中所涉及數(shù)據(jù)量都非常大。大數(shù)據(jù)的起始計(jì)量單位通常是 PB(約 1,000TB)、EB(約 100 萬 TB)或 ZB(約 10億 TB)。
多樣的數(shù)據(jù)類型指數(shù)據(jù)種類和來源多樣化,包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),具體表現(xiàn)為關(guān)系型數(shù)據(jù)、日志、音頻、視頻、文本、圖片、地理位置信息等類型數(shù)據(jù),多類型的數(shù)據(jù)對(duì)數(shù)據(jù)的處理能力提出了更高的要求。
價(jià)值密度低指有價(jià)值數(shù)據(jù)所占比例低。隨著互聯(lián)網(wǎng)以及物聯(lián)網(wǎng)的廣泛應(yīng)用,信息感知無處不在,信息海量,但價(jià)值密度較低,通過結(jié)合業(yè)務(wù)邏輯并通過強(qiáng)大的機(jī)器算法來挖掘數(shù)據(jù)價(jià)值,是大數(shù)據(jù)時(shí)代需要解決的重要問題之一??焖俚臄?shù)據(jù)流轉(zhuǎn)指數(shù)據(jù)增長(zhǎng)速度快,處理速度要求快,時(shí)效性要求高。
例如實(shí)時(shí)監(jiān)測(cè)場(chǎng)景中,企業(yè)需要對(duì)物聯(lián)網(wǎng)設(shè)備數(shù)據(jù)進(jìn)行實(shí)時(shí)處理并做出反應(yīng);零售電子商務(wù)應(yīng)用類軟件將消費(fèi)者所持的移動(dòng)設(shè)備的地理位置信息和其個(gè)人偏好相結(jié)合,推送有針對(duì)性的促銷信息。
這是大數(shù)據(jù)區(qū)別于傳統(tǒng)數(shù)據(jù)使用的顯著特征。隨著信息技術(shù)以及實(shí)際業(yè)務(wù)需求的快速發(fā)展,傳統(tǒng)數(shù)據(jù)管理軟件在處理大數(shù)據(jù)場(chǎng)景時(shí)不能很好適應(yīng)數(shù)據(jù)的“4V”特性,面臨較多技術(shù)挑戰(zhàn)。因此,傳統(tǒng)數(shù)據(jù)管理軟件迫切需要技術(shù)革新。