醫(yī)療健康信息技術(shù)裝備制造汽車及零部件文體教育現(xiàn)代服務(wù)業(yè)金融保險旅游酒店綠色環(huán)保能源電力化工新材料房地產(chǎn)建筑建材交通運輸社消零售輕工業(yè)家電數(shù)碼產(chǎn)品現(xiàn)代農(nóng)業(yè)投資環(huán)境
產(chǎn)業(yè)新聞產(chǎn)業(yè)資訊產(chǎn)業(yè)投資產(chǎn)業(yè)數(shù)據(jù)產(chǎn)業(yè)科技產(chǎn)業(yè)政策
(1)數(shù)據(jù)復(fù)制技術(shù)發(fā)展現(xiàn)狀
數(shù)據(jù)復(fù)制技術(shù)主要包含了數(shù)據(jù)抓取、數(shù)據(jù)傳輸和數(shù)據(jù)復(fù)原三個環(huán)節(jié)。數(shù)據(jù)抓取環(huán)節(jié)主要指對生產(chǎn)端的變化數(shù)據(jù)進行識別和提取,要求識別顆粒度細且對生產(chǎn)系統(tǒng)影響??;數(shù)據(jù)傳輸環(huán)節(jié)主要指對數(shù)據(jù)進行分段拆分組合、加密、壓縮等,實現(xiàn)準(zhǔn)確、高效、安全的數(shù)據(jù)傳輸;數(shù)據(jù)復(fù)原主要指目標(biāo)端的數(shù)據(jù)接收和數(shù)據(jù)寫入,其核心在于快速寫入的同時,保證數(shù)據(jù)的一致性。
根據(jù)獲取數(shù)據(jù)的層級不同,數(shù)據(jù)復(fù)制軟件可分為存儲硬件層復(fù)制、操作系統(tǒng)層復(fù)制和數(shù)據(jù)庫層復(fù)制,不同層級的數(shù)據(jù)復(fù)制技術(shù)在功能、性能上存在一定的差異,各有特點,適用不同的應(yīng)用場景,具體情況如下:
①存儲硬件層復(fù)制技術(shù)
存儲硬件層復(fù)制主要指基于存儲磁盤陣列之間的直接鏡像,是通過存儲系統(tǒng)內(nèi)建的固件或操作系統(tǒng),利用 IP 網(wǎng)絡(luò)或光纖等傳輸介質(zhì)連結(jié),將數(shù)據(jù)以同步或異步的方式復(fù)制到目標(biāo)端。
存儲硬件層復(fù)制的優(yōu)勢在于復(fù)制工作僅在存儲硬件層面進行,與操作系統(tǒng)層無關(guān),因此可以避免服務(wù)器的性能開銷過大的問題,適用于關(guān)鍵任務(wù)和高端交易應(yīng)用,也是目前最廣泛用于容災(zāi)場景的數(shù)據(jù)復(fù)制技術(shù)之一。存儲硬件層復(fù)制的劣勢在于主要適用于同品牌且同型號的同構(gòu)存儲系統(tǒng),并需配備低延遲和大帶寬的物理鏈路,成本較高,給異地復(fù)制帶來極大困難。
存儲硬件層的復(fù)制技術(shù)通常依賴于特定存儲硬件,因此使用該技術(shù)的主要是存儲硬件廠商,代表產(chǎn)品為 DELL EMC 的 SRDF 軟件、IBM 的 PPRC 軟件等。
②操作系統(tǒng)層復(fù)制技術(shù)
根據(jù)數(shù)據(jù)捕獲環(huán)節(jié)的不同,操作系統(tǒng)層復(fù)制可以分為字節(jié)級復(fù)制和塊級復(fù)制。
字節(jié)級復(fù)制技術(shù)是指對生產(chǎn)服務(wù)器文件系統(tǒng)的 I/O 操作信息進行實時捕獲,生成序列化 I/O 操作日志并發(fā)送至目標(biāo)服務(wù)器,操作日志包括 I/O 操作發(fā)生的時間、發(fā)起的進程、操作具體針對的文件、文件具體操作的位置以及操作的內(nèi)容。目標(biāo)服務(wù)器收到 I/O 操作日志后進行數(shù)據(jù)的寫入,完成數(shù)據(jù)復(fù)制。該技術(shù)具有對計算機資源占用小、復(fù)制顆粒度細等優(yōu)勢,能夠?qū)崿F(xiàn)高實時性的數(shù)據(jù)復(fù)制,在容災(zāi)以及持續(xù)數(shù)據(jù)保護領(lǐng)域有較強的優(yōu)勢。
塊級復(fù)制技術(shù)是指在生產(chǎn)服務(wù)器的文件系統(tǒng)之下和磁盤驅(qū)動之上的卷層設(shè)置驅(qū)動模塊,實現(xiàn)磁盤數(shù)據(jù)變化的捕捉。通過對生產(chǎn)服務(wù)器磁盤空間進行劃分,構(gòu)建磁盤位圖,將發(fā)生數(shù)據(jù)變化的位圖信息發(fā)送至目標(biāo)服務(wù)器并與前次位圖信息進行整合,實現(xiàn)數(shù)據(jù)的復(fù)制。和字節(jié)級復(fù)制相比,塊級復(fù)制顆粒度較粗,單次傳輸數(shù)據(jù)量較大,適用于具有海量文件的文件系統(tǒng)或者非標(biāo)準(zhǔn)化文件系統(tǒng)的場景,在定時備份領(lǐng)域具有較強的優(yōu)勢。
操作系統(tǒng)層復(fù)制技術(shù)由于不受底層存儲型號的限制,可以實現(xiàn)跨物理、虛擬、云等復(fù)雜環(huán)境,是第三方數(shù)據(jù)復(fù)制軟件企業(yè)主要使用的技術(shù)。部分存儲硬件企業(yè)在發(fā)展過程中,通過不斷收購第三方數(shù)據(jù)復(fù)制軟件企業(yè),也擁有了較成熟的操作系統(tǒng)層復(fù)制技術(shù)。
③數(shù)據(jù)庫層復(fù)制技術(shù)
數(shù)據(jù)庫層復(fù)制通常采用邏輯復(fù)制的方式,將源數(shù)據(jù)庫中的重做日志和歸檔日志解析出 SQL 語句后,發(fā)送至目標(biāo)數(shù)據(jù)庫,在目標(biāo)數(shù)據(jù)庫上重做 SQL 語句實現(xiàn)數(shù)據(jù)復(fù)制。邏輯復(fù)制的優(yōu)點在于可以實現(xiàn)不同品牌數(shù)據(jù)庫之間的數(shù)據(jù)復(fù)制,且能實現(xiàn)數(shù)據(jù)庫讀寫分離、多活,適用于各種數(shù)據(jù)庫數(shù)據(jù)容災(zāi)、高可用、讀寫分離等場景。
數(shù)據(jù)庫層復(fù)制技術(shù)的參與者主要包括數(shù)據(jù)庫復(fù)制企業(yè)和第三方數(shù)據(jù)復(fù)制軟件企業(yè)。
④數(shù)據(jù)復(fù)制技術(shù)對比
(2)數(shù)據(jù)復(fù)制技術(shù)發(fā)展趨勢
①軟硬件解耦的數(shù)據(jù)復(fù)制技術(shù)
數(shù)據(jù)復(fù)制技術(shù)最早是由存儲硬件及數(shù)據(jù)庫廠商開發(fā),作為其存儲硬件或數(shù)據(jù)庫軟件的輔助工具,通常與存儲硬件或數(shù)據(jù)庫綁定,只能用于本公司的存儲硬件或數(shù)據(jù)庫之間的數(shù)據(jù)復(fù)制。其優(yōu)點在于對本公司的存儲或數(shù)據(jù)庫產(chǎn)品的兼容良好、穩(wěn)定性高、數(shù)據(jù)復(fù)制速度快,但在靈活性和可擴展性上有所欠缺。
隨著信息技術(shù)的發(fā)展,各行業(yè)信息系統(tǒng)不斷升級和迭代,存儲及數(shù)據(jù)庫類型多樣化,數(shù)據(jù)量的提升也帶來了分級存儲、分級備份的需求,與硬件或數(shù)據(jù)庫綁定的復(fù)制技術(shù)功能單一、缺乏靈活性等缺點逐漸顯現(xiàn)。軟硬件解耦的數(shù)據(jù)復(fù)制技術(shù)可以實現(xiàn)不同存儲硬件、不同數(shù)據(jù)庫之間的數(shù)據(jù)復(fù)制,在信息系統(tǒng)升級、數(shù)據(jù)分級存儲等場景下具有較強的優(yōu)勢,有望成為未來數(shù)據(jù)復(fù)制行業(yè)的重要發(fā)展方向。
同時,在國內(nèi)信息系統(tǒng)軟硬件安全可信的趨勢下,國產(chǎn)存儲設(shè)備和數(shù)據(jù)庫紛紛涌現(xiàn),軟硬件解耦的數(shù)據(jù)復(fù)制技術(shù)也將在信息系統(tǒng)國產(chǎn)化進程中發(fā)揮重要作用,加速國產(chǎn)化進程。
②云端數(shù)據(jù)復(fù)制技術(shù)
云計算相較于傳統(tǒng) IT 架構(gòu),具有資源配置效率高、運維難度低等優(yōu)勢。隨著云計算技術(shù)和基礎(chǔ)設(shè)施的逐步成熟,越來越多的企業(yè)開始遷移上云。數(shù)據(jù)復(fù)制技術(shù)也從本地數(shù)據(jù)復(fù)制向云端數(shù)據(jù)復(fù)制發(fā)展。
和本地 IT 架構(gòu)不同的是,云計算架構(gòu)將底層硬件設(shè)備虛擬化后形成統(tǒng)一的計算資源、存儲資源和網(wǎng)絡(luò)資源,企業(yè)在云端的業(yè)務(wù)系統(tǒng)均統(tǒng)一部署在數(shù)據(jù)中心的虛擬平臺上,因此云端復(fù)制和本地復(fù)制相比,傳輸環(huán)境存在較大的差異,云端復(fù)制的傳輸具有帶寬窄、傳輸不穩(wěn)定等特點,對復(fù)制技術(shù)的壓縮能力、斷點續(xù)傳能力提出了更高的要求。
同時,云端復(fù)制還需兼顧數(shù)據(jù)隱私問題,特別是在公有云的場景下,云供應(yīng)商有較大的權(quán)限,可以對數(shù)據(jù)進行管理,因此在云端復(fù)制場景下,數(shù)據(jù)的脫敏、加密也是云端復(fù)制技術(shù)需要考慮的重要問題。
③大數(shù)據(jù)平臺實時復(fù)制技術(shù)
大數(shù)據(jù)平臺是為了滿足大數(shù)據(jù)的存儲、運算、分析、展現(xiàn)的軟件平臺,主要功能包括數(shù)據(jù)接入、數(shù)據(jù)處理、數(shù)據(jù)存儲、查詢檢索、分析挖掘、數(shù)據(jù)集成等。
大數(shù)據(jù)平臺擁有特殊的文件系統(tǒng)、數(shù)據(jù)庫及數(shù)據(jù)處理模塊,以適配大數(shù)據(jù)的查詢、存儲和計算。以 Hadoop 為例,Hadoop 平臺采用 HDFS 分布式文件系統(tǒng)和 HBase 分布式數(shù)據(jù)庫,通過 Hive 數(shù)據(jù)倉庫進行數(shù)據(jù)的存儲、查詢和分析,與傳統(tǒng)的數(shù)據(jù)庫結(jié)構(gòu)存在較大的差別,因此傳統(tǒng)的數(shù)據(jù)庫數(shù)據(jù)復(fù)制技術(shù)無法實現(xiàn)大數(shù)據(jù)平臺間的數(shù)據(jù)實時復(fù)制,亦無法實現(xiàn)由傳統(tǒng)數(shù)據(jù)庫向大數(shù)據(jù)平臺的數(shù)據(jù)實時復(fù)制。
隨著大數(shù)據(jù)技術(shù)不斷演進和應(yīng)用持續(xù)深化,以數(shù)據(jù)為核心的大數(shù)據(jù)產(chǎn)業(yè)生態(tài)正在加速構(gòu)建。大數(shù)據(jù)平臺作為基礎(chǔ)工具,將隨著大數(shù)據(jù)行業(yè)應(yīng)用的不斷深化,得到越來越廣泛的應(yīng)用。同時,傳統(tǒng)數(shù)據(jù)庫中的數(shù)據(jù)也將越來越多地匯聚至大數(shù)據(jù)平臺,進行數(shù)據(jù)分析挖掘等,以發(fā)揮更大地數(shù)據(jù)價值。因此,大數(shù)據(jù)平臺實時復(fù)制技術(shù)是未來數(shù)據(jù)復(fù)制行業(yè)的重要發(fā)展方向之一。
編輯:如皋
責(zé)任編輯:趙佗
來源:英方軟件 思瀚產(chǎn)業(yè)研究院