醫(yī)療健康信息技術(shù)裝備制造汽車及零部件文體教育現(xiàn)代服務(wù)業(yè)金融保險(xiǎn)旅游酒店綠色環(huán)保能源電力化工新材料房地產(chǎn)建筑建材交通運(yùn)輸社消零售輕工業(yè)家電數(shù)碼產(chǎn)品現(xiàn)代農(nóng)業(yè)投資環(huán)境
產(chǎn)業(yè)新聞產(chǎn)業(yè)資訊產(chǎn)業(yè)投資產(chǎn)業(yè)數(shù)據(jù)產(chǎn)業(yè)科技產(chǎn)業(yè)政策
傳統(tǒng)數(shù)據(jù)庫(kù)以集中式架構(gòu)為主,集中式架構(gòu)由一臺(tái)或多臺(tái)主計(jì)算機(jī)組成中心節(jié)點(diǎn),數(shù)據(jù)存儲(chǔ)以及整個(gè)系統(tǒng)的業(yè)務(wù)單元都集中部署于該中心節(jié)點(diǎn)中,系統(tǒng)所有的功能均由中心節(jié)點(diǎn)集中處理。
每個(gè)終端或客戶端僅僅負(fù)責(zé)數(shù)據(jù)的錄入和輸出,而數(shù)據(jù)的存儲(chǔ)與控制處理完全交由主機(jī)完成。分布式架構(gòu)下,軟件組件分布在不同主機(jī)上,主機(jī)之間通過網(wǎng)絡(luò)連接進(jìn)行通信和協(xié)調(diào)。
隨著海量及異構(gòu)數(shù)據(jù)的數(shù)據(jù)分析需求增長(zhǎng),需要的計(jì)算、存儲(chǔ)和 IO 等資源也在極速增加。集中式架構(gòu)通過改善硬件配置來提升存儲(chǔ)和處理能力,但單臺(tái)主機(jī)可配置的資源存在上限,因此傳統(tǒng)的集中式架構(gòu)軟件難以滿足海量及異構(gòu)數(shù)據(jù)的數(shù)據(jù)集的處理和分析需求。
而為了處理 TB 以及 PB 級(jí)別以上的數(shù)據(jù)規(guī)模,分布式的架構(gòu)將數(shù)據(jù)分散在網(wǎng)絡(luò)上多個(gè)通過高速網(wǎng)絡(luò)互聯(lián)的節(jié)點(diǎn)上聯(lián)合計(jì)算。因?yàn)閿?shù)據(jù)分布在不同節(jié)點(diǎn),在進(jìn)行計(jì)算任務(wù)時(shí),任務(wù)也會(huì)被切分成多個(gè)子任務(wù),分發(fā)到多個(gè)節(jié)點(diǎn)上同時(shí)進(jìn)行計(jì)算,能充分利用整個(gè)集群各個(gè)節(jié)點(diǎn)的計(jì)算資源、存儲(chǔ)資源和 IO 資源,可線性提升集群的存儲(chǔ)和處理能力。因此,分布式架構(gòu)能較好的處理該類問題,這也是分布式架構(gòu)相對(duì)于傳統(tǒng)單機(jī)架構(gòu)的核心優(yōu)勢(shì)。
在大數(shù)據(jù)場(chǎng)景下,分布式系統(tǒng)在擴(kuò)展性、容錯(cuò)性、經(jīng)濟(jì)性、靈活性、可用性和可維護(hù)性方面具有明顯優(yōu)勢(shì),能夠較好的滿足大數(shù)據(jù)分析的需求。此外,近年來,分布式技術(shù)不斷發(fā)展,在提供高彈性、支持高并發(fā)的同時(shí),支持關(guān)系型數(shù)據(jù)庫(kù)中強(qiáng)事務(wù)性的特性,成為大數(shù)據(jù)技術(shù)的重要發(fā)展方向。