作者:Zhao Hai
2007年起先后在IBM、惠普等公司從事軟件開發(fā)、系統(tǒng)運維及優(yōu)化、客戶案例解決及方案咨詢、云計算項目建設(shè)及部署等工作。2014年加入某城商銀行系統(tǒng)規(guī)劃設(shè)計中心,任系統(tǒng)架構(gòu)師,專注于銀行數(shù)據(jù)中心解決方案規(guī)劃及設(shè)計。
隨著全球IT產(chǎn)業(yè)的飛速發(fā)展,金融行業(yè)的IT建設(shè)逐步成為主導(dǎo)金融企業(yè)業(yè)務(wù)發(fā)展的核心驅(qū)動力,基于金融行業(yè)IT系統(tǒng)容災(zāi)建設(shè)的各種行業(yè)標(biāo)準(zhǔn)以及監(jiān)管標(biāo)準(zhǔn)也相應(yīng)提高。而決定容災(zāi)架構(gòu)健壯與否的關(guān)鍵因素就是數(shù)據(jù)復(fù)制技術(shù),它是實現(xiàn)高標(biāo)準(zhǔn)RTO和RPO的前提條件。本文基于業(yè)界主流數(shù)據(jù)復(fù)制技術(shù)的原理、復(fù)雜度、關(guān)鍵因素以及復(fù)制效果等多個維度進(jìn)行分析及論述,旨在為同業(yè)在此類項目規(guī)劃和建設(shè)過程中提供一些啟示和幫助。
1.背景及綜述
在金融行業(yè)內(nèi),眾所周知其對業(yè)務(wù)連續(xù)性的要求以及對各種IT風(fēng)險的應(yīng)對能力的要求都是非常高,尤其是對容災(zāi)能力的要求,這是由它的業(yè)務(wù)特殊性以及集中式架構(gòu)所決定的。
在金融企業(yè)容災(zāi)架構(gòu)中,所謂的數(shù)據(jù)復(fù)制技術(shù)主要是指能夠?qū)⒔Y(jié)構(gòu)化數(shù)據(jù)進(jìn)行復(fù)制,從而保證數(shù)據(jù)具備雙副本或者多副本的技術(shù)。
目前業(yè)界發(fā)展來看,可以實現(xiàn)數(shù)據(jù)復(fù)制的技術(shù)多種多樣,有基于數(shù)據(jù)庫層面的數(shù)據(jù)復(fù)制技術(shù),例如Oracle公司的Active Data Gurad、IBM公司的 db2 HADR等;有基于系統(tǒng)層面的數(shù)據(jù)復(fù)制技術(shù),例如賽門鐵克的vxvm、傳統(tǒng)的邏輯卷管理(LVM)、Oracle公司的自動存儲管理(ASM)冗余技術(shù)、IBM公司的GPFS等;有基于存儲虛擬化實現(xiàn)的數(shù)據(jù)復(fù)制技術(shù),例如EMC公司Vplex Stretch Cluster、IBM公司SVC Split Cluster、NetAPP公司Metro Cluster等; 也有基于存儲底層實現(xiàn)的數(shù)據(jù)復(fù)制技術(shù),例如IBM公司的DS8000 PPRC技術(shù)、EMC公司的SRDF技術(shù)、HP公司的CA技術(shù)等等。
每一種技術(shù)都有其實現(xiàn)的前提條件,也有各自的技術(shù)特點和實現(xiàn)的不同效果。本文將從復(fù)制技術(shù)的原理、特點、復(fù)雜程度以及復(fù)制效果等多方面展開分析及論述,并從多個維度進(jìn)行對比分析,將業(yè)界主流數(shù)據(jù)復(fù)制技術(shù)的發(fā)展現(xiàn)狀以及技術(shù)優(yōu)劣給予一個清晰的展示,并就數(shù)據(jù)復(fù)制技術(shù)發(fā)展的未來以及趨勢予以展望。
2.數(shù)據(jù)復(fù)制技術(shù)價值分析
2.1 數(shù)據(jù)復(fù)制在容災(zāi)中的必要性
一、RPO保障
如果沒有數(shù)據(jù)復(fù)制技術(shù),那么容災(zāi)也就無從談起。當(dāng)面臨站點及故障時,由于沒有數(shù)據(jù)復(fù)制技術(shù)的支撐,我們的數(shù)據(jù)無法在其他站點再現(xiàn),這將意味著RPO將無法保障。對于一個金融企業(yè)來講,就是要客戶的數(shù)據(jù),它是企業(yè)的生命。從這個意義上來講,金融企業(yè)不能沒有容災(zāi)體系,容災(zāi)體系的前提條件是能夠?qū)崿F(xiàn)數(shù)據(jù)復(fù)制。那么數(shù)據(jù)復(fù)制的效率如何,復(fù)制的效果如何,復(fù)制技術(shù)的先進(jìn)與否也就決定了金融企業(yè)生命線的穩(wěn)固與否。
二、RTO保障
所謂RTO就是在容災(zāi)系統(tǒng)在面臨站點級故障時,多長時間能夠恢復(fù)業(yè)務(wù)。假設(shè)站點故障恢復(fù)的時間不可容忍或者根本沒有可能,那么業(yè)務(wù)必須能夠切到另外一個數(shù)據(jù)中心,從數(shù)據(jù)、應(yīng)用以及網(wǎng)絡(luò)層都需要具備這個切換能力。但是的目的就是要保障業(yè)務(wù)能正常恢復(fù),而業(yè)務(wù)恢復(fù)的前提條件就是數(shù)據(jù),沒有數(shù)據(jù)的應(yīng)用切換和網(wǎng)絡(luò)切換沒有任何意義。也就是說數(shù)據(jù)恢復(fù)是應(yīng)用切換以及網(wǎng)絡(luò)切換的前提條件,從這個意義上講,數(shù)據(jù)復(fù)制效率和效果直接決定了一些列切換,也就是它使得RTO成為可能。
2.2 評價數(shù)據(jù)復(fù)制技術(shù)的維度分析
對于數(shù)據(jù)復(fù)制來講,我們可以從多個層面、多種技術(shù)去實現(xiàn)。各有各的特點,那么究竟哪一種數(shù)據(jù)復(fù)制技術(shù)更適合我們?活著說哪一種復(fù)制技術(shù)更科學(xué)合理?這需要一系列從不同緯度進(jìn)行的科學(xué)評估。本文認(rèn)為應(yīng)該從以下幾個方面來展開分析,并結(jié)合我們自己的需求來選擇合理的數(shù)據(jù)復(fù)制方案。
一、投資成本分析
建設(shè)任何一個項目,投資成本的分析都是必不可少的分析維度。對數(shù)據(jù)復(fù)制技術(shù)的投資成本分析來講,我們需要從它的首次建設(shè)成本、持續(xù)維護(hù)成本以及容災(zāi)管理成本等多方面去考慮。
二、技術(shù)成熟度及健壯性分析
對于數(shù)據(jù)復(fù)制技術(shù)的成熟度和健壯性分析來講,一方面我們要從技術(shù)本身的原理上來分析,另外我們還需要從技術(shù)的發(fā)展以及應(yīng)用范圍以及應(yīng)用的持久穩(wěn)定性等方面來考慮。
三、風(fēng)險評估分析
數(shù)據(jù)復(fù)制技術(shù)本身來講是要幫助我們解決站點級故障帶給我們的IT風(fēng)險,但是對于技術(shù)應(yīng)用本身來講,它也會存在一些技術(shù)風(fēng)險。比如說特殊場合下的一些技術(shù)風(fēng)險、容災(zāi)管理過程中的一些風(fēng)險、極端場合下的一些技術(shù)風(fēng)險等等。
四、功能拓展性分析
對于數(shù)據(jù)復(fù)制技術(shù)本身來講,其主要功能就是完成數(shù)據(jù)的復(fù)制。但是在完成數(shù)據(jù)復(fù)制的同時,由于其架構(gòu)的特點以及技術(shù)特點等因素有可能對于我們的應(yīng)用產(chǎn)生積極的拓展性作用,也有可能限制了我們的應(yīng)用架構(gòu)模式,還有可能對我們的基礎(chǔ)架構(gòu)擴(kuò)展性以及靈活性造成一定的限制。
3.數(shù)據(jù)復(fù)制技術(shù)原理分析
3.1 基于應(yīng)用事務(wù)日志回放技術(shù)
圖3.1是Oracle數(shù)據(jù)庫層面的數(shù)據(jù)復(fù)制技術(shù)(ADG)的架構(gòu)原理圖。
對于該架構(gòu)原理圖,本文從其實現(xiàn)的基本條件、數(shù)據(jù)復(fù)制原理、數(shù)據(jù)復(fù)制的模式以及數(shù)據(jù)復(fù)制的關(guān)鍵因素等幾個方面來進(jìn)行深度剖析。
圖3.1-1 Oracle Active Data Guard
·············
信息來源:AIX專家俱樂部
原文點擊: 金融行業(yè)數(shù)據(jù)容災(zāi)架構(gòu)中的數(shù)據(jù)復(fù)制技術(shù)