醫(yī)療健康信息技術(shù)裝備制造汽車及零部件文體教育現(xiàn)代服務(wù)業(yè)金融保險旅游酒店綠色環(huán)保能源電力化工新材料房地產(chǎn)建筑建材交通運(yùn)輸社消零售輕工業(yè)家電數(shù)碼產(chǎn)品現(xiàn)代農(nóng)業(yè)投資環(huán)境
產(chǎn)業(yè)新聞產(chǎn)業(yè)資訊產(chǎn)業(yè)投資產(chǎn)業(yè)數(shù)據(jù)產(chǎn)業(yè)科技產(chǎn)業(yè)政策
隨著信息技術(shù)的發(fā)展,數(shù)據(jù)處理需求的變化推動了數(shù)據(jù)管理軟件技術(shù)的變革,從技術(shù)發(fā)展方向來看,數(shù)據(jù)管理軟件技術(shù)發(fā)展歷程包括以下三個階段:
圖 :數(shù)據(jù)管理軟件主要技術(shù)演變及代表性公司
1970-2000 年,數(shù)據(jù)管理軟件主要為集中式架構(gòu)的關(guān)系型數(shù)據(jù)庫,其軟件產(chǎn)品具備 不可分割性(atomicity)、一致性(consistency)、隔離性(isolation,又稱獨(dú)立性)、 持久性(durability)即“ACID”功能特性,占據(jù)了數(shù)據(jù)管理軟件的主導(dǎo)地位。
關(guān)系型數(shù)據(jù)庫技術(shù)出現(xiàn)在 20 世紀(jì) 70 年代,經(jīng)過二十余年的發(fā)展,到90 年代已經(jīng)成熟。市場上具有代表性的集中式架構(gòu)關(guān)系型數(shù)據(jù)庫產(chǎn)品包括 Oracle、IBM DB2 以及微軟 SQL Server 等。
2000年以來,隨著互聯(lián)網(wǎng)和計算機(jī)技術(shù)的快速發(fā)展,需要處理的數(shù)據(jù)量更大、類 型更豐富、速度要求更快,傳統(tǒng)集中式計算架構(gòu)已無法適應(yīng)數(shù)據(jù)海量、異構(gòu)、多源等特點(diǎn),在部署的擴(kuò)展性、容錯性、經(jīng)濟(jì)性、靈活性等方面有一定局限性。
谷歌于 2003 年 -2006 年間的三篇論文奠定了分布式存儲和計算的基礎(chǔ),而后行業(yè)從業(yè)者基于以上理論 建立了 Hadoop、Spark 等大數(shù)據(jù)分布式系統(tǒng)框架,并交由 Apache 軟件基金會托管;2009 年,在 Johan Oskarsson 開源分布式數(shù)據(jù)庫的討論中,來自 Rackspace 的 Eric Evans 重提 NoSQL 概念,用以指代非關(guān)系型的分布式數(shù)據(jù)存儲系統(tǒng)。針對于不同的場景,分別產(chǎn)生了圖數(shù)據(jù)庫、搜索引擎、文檔數(shù)據(jù)庫、鍵值數(shù)據(jù)庫等 NoSQL 數(shù)據(jù)庫,代表性 NoSQL 數(shù)據(jù)庫提供商包括 MongoDB、Elastic 等。
2010 年以來,隨著數(shù)字化轉(zhuǎn)型的逐步深化,快速變化的業(yè)務(wù)場景呈現(xiàn)了復(fù)雜化、 多樣化的態(tài)勢。復(fù)雜的業(yè)務(wù)場景往往需要使用多種數(shù)據(jù)模型,以及數(shù)據(jù)模型間的融合。 這個時期的,行業(yè)內(nèi)大部分?jǐn)?shù)據(jù)庫都是面向單一數(shù)據(jù)模型而設(shè)計的,用以解決特定業(yè)務(wù) 場景的特定問題。例如,使用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫解決結(jié)構(gòu)化數(shù)據(jù)的存儲和處理問題、 使用圖數(shù)據(jù)庫解決圖相關(guān)的存儲和處理問題、使用文檔數(shù)據(jù)庫解決文本相關(guān)的存儲和處理問題。由于結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)通常以不同的格式和模式存儲,單模型數(shù)據(jù)庫 雖然優(yōu)化了數(shù)據(jù)存儲和處理,卻難以滿足日趨增長的、多樣的業(yè)務(wù)場景需求。
當(dāng)同一業(yè)務(wù)需要用到不同類型數(shù)據(jù)的時候,受限于單模型數(shù)據(jù)庫的處理能力,客戶往往需要部署 多個相互獨(dú)立的單模型數(shù)據(jù)庫,在對不同模型數(shù)據(jù)進(jìn)行聯(lián)合處理的時候,需要對數(shù)據(jù)進(jìn) 行搬遷或融合,導(dǎo)致架構(gòu)復(fù)雜度高、開發(fā)成本高、運(yùn)維成本高以及數(shù)據(jù)處理效率低。
由此,催生了從單一數(shù)據(jù)管理系統(tǒng)到融合型、多模型數(shù)據(jù)管理系統(tǒng)的技術(shù)需求。 此外,隨著云計算技術(shù)的大規(guī)模應(yīng)用,傳統(tǒng)各類軟件產(chǎn)品都開始由獨(dú)立部署模式向 云服務(wù)模式轉(zhuǎn)變。其中數(shù)據(jù)庫作為信息系統(tǒng)核心軟件,逐漸附加云化能力形成云原生數(shù) 據(jù)庫,以服務(wù)的形式對外提供技術(shù)支撐。云原生數(shù)據(jù)庫按照部署方式可以分為公有云部 署和私有云部署。
其中,私有云部署模式由企業(yè)提供云數(shù)據(jù)庫依賴的底層物理資源,數(shù) 據(jù)庫服務(wù)商負(fù)責(zé)部署云原生數(shù)據(jù)庫軟件,后期企業(yè)和數(shù)據(jù)庫服務(wù)商約定運(yùn)維維護(hù)工作的 具體職責(zé)分工等,特點(diǎn)是“自有資源池化”,“數(shù)據(jù)不外流”等。相比公有云部署下的 云數(shù)據(jù)庫,私有云模式更加關(guān)注信息安全,能夠?qū)崿F(xiàn)對數(shù)據(jù)安全性和服務(wù)質(zhì)量最有效控 制,僅限于企業(yè)員工和取得授權(quán)的合作伙伴使用。
多模型、數(shù)據(jù)庫云原生相關(guān)技術(shù)已經(jīng)成為信息產(chǎn)業(yè)的未來發(fā)展方向,促使大數(shù)據(jù)軟 件進(jìn)一步革新,規(guī)模呈現(xiàn)快速增長趨勢,代表性企業(yè)如 Snowflake、AWS 等。相較于國 內(nèi)外的現(xiàn)狀,私有云在面向國計民生的相關(guān)行業(yè)更受客戶歡迎,面向私有云模式的云原 生數(shù)據(jù)庫預(yù)計在未來將獲得快速增長。
隨著技術(shù)不斷成熟,分布式架構(gòu)將逐漸成為主流。自底向上,傳統(tǒng)的集中式資源管理調(diào)度逐漸向基于云原生技術(shù)的分布式統(tǒng)一資源管理平臺發(fā)展;數(shù)據(jù)管理軟件技術(shù)架構(gòu) 也會因?yàn)橛嬎隳J降霓D(zhuǎn)變發(fā)生重大變革,傳統(tǒng)的集中式數(shù)據(jù)庫逐漸向分布式、多模型數(shù) 據(jù)庫發(fā)展;傳統(tǒng)數(shù)據(jù)分析軟件逐漸向新型的分布式數(shù)據(jù)開發(fā)和智能分析軟件發(fā)展。