基于網格的數據傳輸與復制技術研究論文

時間：2021-04-16 18:34:39 論文我要投稿

基于網格的數據傳輸與復制技術研究論文

　　所謂數據復制，就是將數據庫中的數據資源復制到一個或多個不同的物理站點上。數據復制技術可以有效地保證目標數據庫與源數據庫的中數據的一致性。目前，很多領域都會用到數據通信復制技術，如分布對象系統、移動計算和分布式數據庫系統等。

基于網格的數據傳輸與復制技術研究論文

　　1 數據復制的概念

　　所謂數據復制，就是將數據庫中的數據資源復制到一個或多個不同的物理站點上。數據復制技術可以有效地保證目標數據庫與源數據庫的中數據的一致性。

　　1.1 訪問地有效性

　　我們在進行數據處理里，有時候受到網絡的限制無法使用廣域網WAN，為了可以繼續訪問本地數據，我們可以采用數據復制技術。在復制時，用戶可以直接在本地訊問數據，非常方便，而不用通過數據庫之間的網絡連接來獲取用戶需要的數據資源。

　　1.2 縮短響應時間

　　數據復制可以縮短數據請求的響應時間，其原因如下：

　　1)由于數據復制的請求是在本地服務器上進行的，不需要訪問網絡，所以檢索速度更快。

　　2)在本地服務器上處理數據減輕了中心數據庫服務器的負擔，同時也緩解了對處理器時間的爭用。

　　1.3 事務的完整性

　　確保每個數據庫始終保持事務完整性是任何復制系統都面臨的挑戰。Replication Server 和 SQL Remote 按以下方式復制事務日志的各個部分，因此在復制期間可保持事務的完整性。

　　MobiLink合并多個已提交的事務中所做的更改。這些更改以單個事務的方式應用到另一數據庫中。

　　1.4 數據的準確性

　　我們在數據復制時，要使整個系統中的數據保持一致，提高數據的準確性。復制系統在整個體系中將工作時所做的改變以準確無誤的方式復制到其他站點上，但是不同的站點在同一時間擁有不同的數據副本。

　　2 數據復制的分類

　　在數據復制技術中，復制配置和復制類型是兩個重要方面，是區別不同復制技術的主要指標。配置，指的是有多少個源服務器被復制到多少個目標服務器，包括一對一復制、一對多復制、多對一復制、多對多復制。復制類型，指的是程序如何在兩個系統之間進行數據同步，一個復制解決方案可能根據計劃好的時間間隔來使數據保持同步，也可以用同步復制或異步復制的方式連續進行數據復制。數據復制類型主要有以下幾種：

　　1)同步復制

　　在一個同步復制環境中，為了確保目標系統上最高程度的數據整體性，數據必須在主系統完成寫入之前被寫入到目標系統中。一方面，同步復制使得無論何時，目標系統上的數據都與源系統數據完全相同;另一方面，同步復制也可能導致源系統的性能延遲，尤其是在兩個系統間的網絡連接速度比較慢的情況下，延遲問題更為嚴重。

　　2)異步復制

　　在異步復制時，復制軟件會對數據進行排隊，然后在網絡可用期間在系統之間批處理地傳遞改變的數據，源系統在執行前不會等候目標系統的確認。為了保持數據的完整性，有些解決方案將同步和異步復制操作組合在一起：當發生通訊問題時，同步復制會轉為異步復制;當通訊問題解決后，又會轉回同步方式。

　　3)計劃復制

　　對有些用途而言，連續的復制不是理想的方案，采用計劃復制更為適宜。在這種復制方式中，變化的數據將按預先設定的時間間隔被同步復制。

　　數據復制技術的應用范圍非常廣，不同的范圍內，復制的目標數據、數據復制粒度及重要技術都有很大差別。如分布數據庫、分布對象和移動計算等，這些應用領域和分布式儲存關系非常密切。分布數據庫系統的關鍵技術是非常有效的數據復制技術，它可以幫助我們有效地提高數據庫系統的性能，如增強系統容錯能力、改善數據訪問性能和實現數據系統的負載平衡等。

　　由于移動環境下網絡帶寬低、速度慢。如果采用數據復制技術，可以根據當前用戶的訪問需求和分布情況，進行動態數據復制。這樣做的好處是：可以使移動用戶就近訪問并復制所需的數據，大大提高訪問的性能。

　　3 數據網格中的數據復制技術

　　為了改善數據網格系統性能，我們在網絡系統中大范圍地使用了數據復制技術。與傳統分布式系統應用領域中的復制相比，數據網格中的復制技術在復制目標、復制粒度、復制關鍵技術等方面表現出獨特性質。數據網格系統中，采用數據復制技術的目的是為了節省網絡帶寬、減少系統的訪問時間等。在使用數據復制技術時通過數據在網格中的流動，實現數據網格系統的性能優化，也就是根據用戶的訪問需求和數據網格系統的數據特征自動將數據流復制到不同的網格節點或服務器上。

　　3.1 在網格中數據復制的特點

　　數據復制技術可以多個服務器上建立數據備份，如果我們在操作過程中發現某個服務器中的數據出錯，就可以使用其他服務器進行操作，這樣可以提高數據的準確性和數據的可用性。數據復制技術為了提高使用效率，降低傳輸負載，一般都會將遠程服務器中的數據復制到本地服務器，讓用戶就近訪問并復制所需的數據，大大提高訪問的性能。但是，網格中的數據復制技術與分布對象等、分布數據庫中的復制技術相比，還有一些問題要注意改進。

　　1)在數據系統中，用戶可以把數據存儲為一般文件、XML文件及各類數據庫文件等;

　　2)而在數據網格系統中，需要充分考慮網絡開銷，這和數據庫、分布對象系統選擇副本時是不同的，只在減少網絡開銷，才能提高使用數據的速度;

　　3)在數據網格系統中，由于網格環境是呈動態性的，而且數據副本的數量可達幾百甚至更多，存在巨大的數據量，為了對副本進行有效管理;我們必須采用合理的動態副本創建策略才能滿足要求;

　　4)一方面，數據網格系統中的數據量巨大，且操作頻率很高，整個文件的內容會被一個操作改寫。這和傳統的數據庫中副本同步時幾個小事務的操作有著很大的不同;而另一方面，數據網格中的數據廣泛分布和復制在WAN上，更加靈活，一般的保持副本一致性算法并不適用于此。

　　3.2 在數據網格中對復制系統的相關需求

　　根據網絡系統特點和對數據復制技術的分析，我們在使用數據網格下的數據復制系統需要注意以下幾點需求：

　　1)動態性：在創建副本時，復制系統可以按需動態創建副本和刪除副本;

　　2)適應性：復制系統需要考慮各種網絡問題，如本地網速、用戶網速以及訪問失敗等多種情況;

　　3)安全性：在創建副本時，應保證用戶數據訪問的安全，不讓有圖謀的他人進入;

　　4)有效性：復制系統創建副本時必須考慮資源和時間的開銷，用自己能利用的資源設計出最佳方案;

　　5)靈活性：復制系統能夠根據操作需要，靈活創建、刪除和管理副本。

　　3.3 數據網格復制

　　Globus中數據管理的另一個基本服務是復制(replica management)，Globus中數據的復制管理主要是針對遠程的大型數據庫文件進行訪問。replica的原意是指復制品，即在文件復制時要與其本身保持一致性。為了滿足這個要求，在復制管理體系結構中，必須要有一個支持WAN的分布式數據庫。這樣就可以在對文件復制時進行修改。同時，在原子操作時對文件進行加密。

　　在Globus項目中沒有采用復雜的`分布數據庫。Globus中的復制管理服務實際上沒有按照“replica”的一般語義進行實現，而是對“replica”語義放寬了限制，對于文件的多個復制操作，Globus的復制服務不會主動執行任何操作來檢查確保文件的一致性。而當用戶在復制一個注冊的邏輯集合文件時，則需要由操作來保持數據文件之間的一致性。

　　在分布式計算的環境中，有時會遇到計算失敗，或網絡問題，這就給我們的復制管理服務提出了更高的要求，可以快速從錯誤中回復，并保持數據的一致性。在Globus的復制管理服務功能中只能夠保證注冊文件的一致性，但不能保證存儲在復制管理服務中信息的一致性。

　　Globus復制目錄服務可以使科學應用程序快速地進行數據訪問，它是Globus復制管理的核。其工作原理是智能地把部分相關數據放置在離科學應用程序最近的位置。復制管理服務的功能主要包括：注冊新的拷貝到復制目錄中以、創建全部或部分文件集合的新拷貝、允許用戶查詢復制目錄來找到部分或全部文件集合的拷貝。

　　4 基于網格環境中的數據復制具體實現

　　在網格環境中，我們在數據復制前要對具體問題進行具體分析，做好規劃與設計。這就需要我們在設計時必須確定出需要復制的數據對象、數據庫站點及類型、沖突解決方案、同步方式等內容。從而設計出一套詳實并能滿足實際業務需求的合理方案。在進行詳細的規劃與設計后，我們就可以按計劃實現數據復制，具體操作如下：

　　1)創建數據復制站點;

　　2)創建組對象;

　　3)配置合理、詳實的解決沖突方案。

　　下面，我們舉例說明相關操作。我們會設置主控站點和共享數據表各兩個，采用多主控站點復制方式。

　　主控站點分別為處理站點(handle.world)和解釋站點(explain.world);數據表分別為測區(region)和測線(line)。

　　1)用系統身份進行登錄并訪問主站點數據庫。

　　2)為每個復制站點創建新用戶，并為其授權復制管理員身份，其主要任務是負責創建并管理復制的站點，其代碼如下圖所示：

　　3)指定本站點的propagator，其主要職責是將本地的最新數據傳播到其他站點上，完成任務。

　　4)指定本站點的receiver，其主要職責是接收其他站點上的propagator傳輸過來的數據，其代碼如下圖所示：

　　5)為了提高運行速度，我們需要定時清除已經加載的事務，在本例中設定每小時清除一次。這樣做的目的是避免事務隊列過長。

　　6)調度數據庫鏈接

　　我們用同樣的方法法創建處理站點(handle.world)和解釋站點(explain.world)。創建的過程如下：首先，需要先在各個主控站點之間建立數據庫鏈接，我們需要先建立一個公用的數據庫鏈接，讓它為其他私有數據庫鏈接提供服務。同時，我們需要在解釋站點(explain.world)上建立與處理站點(handle.world)的數據庫鏈接。其次，我們要為每個數據庫鏈接定義系統調度的時間。

　　5 解決數據復制中的沖突問題

　　在進行數據庫系統和應用程序設計過程中，設計者會考慮到沖突的問題，在設計時進行優化操作，但是站點之間的沖突問題并不能完全避免。一旦發生沖突，就需要采用沖突解決機制來處理，從而保證各站點數據的一致性。我們可以通過以下幾種方法來解決上述問題：

　　5.1 查看出錯命令的具體內容

　　當出現復制沖突問題時，我們要及時了解哪些數據容易出現沖突。在系統中，靜態數據很少出現沖突，發生沖突的主要是一些變化較大的動態數據。了解這一情況之后，我們要根據情況來解決沖突問題。其方法有如下幾種，方法1：建立各站點間的優先次序，在數據不一致時，系統以基準站點上的數據為準;方法2：當數據不一致時，系統以某個站點上最新更新的修改為準。

　　雖然數據庫中提供了很多解決方案來避免沖突，如針對更新沖突、刪除沖突、唯一性沖突等多種沖突的解決方案。這些方案都有相應的適用范圍，用戶可以根據具體的業務情況來選擇合適的方案來解決沖突問題。除了這些系統中的方案以外，我們還可以通過自定義方案的方法來處理沖突問題。

　　5.2 比較數據之間的差異

　　如果遇到一些查詢復制出錯的語句，使用人工處理同步失敗時相對容易。但是當復制錯誤的命令很多時，就會比較麻煩，使用以上方法難以處理。這種情況下，我們一般會選擇忽略失敗的復制命令，然后通過比較訂閱表的數據之間的差異來解決問題。

　　在具體的數據復制應用中，還有許多復雜的問題亟需解決，這些問題需要我們在實際應用中繼續研究，深入探索。

【基于網格的數據傳輸與復制技術研究論文】相關文章：

數字電視數據傳輸技術研究論文10-25

基于知識網格的分布式數據挖掘論文04-25

基于移動Agent系統的安全技術研究論文11-06

基于Android平臺軟件開發技術研究論文11-07

基于遺傳算法的車牌定位技術研究論文11-06

基于非連續頻譜的短波傳輸技術研究論文11-06

基于有源吸聲單元的聲隱身技術研究論文11-06

基于GIS的海量氣象數據預處理技術研究論文11-06

基于數據挖掘的數字圖書館檢索技術研究論文11-06

亚洲综合专区|和领导一起三p娇妻|伊人久久大香线蕉aⅴ色|欧美视频网站|亚洲一区综合图区精品

基于網格的數據傳輸與復制技術研究論文