探析網絡存儲技術研究論文
0引言
云計算浪潮席卷全球,推動著社會信息基礎設施的重大變革。以虛擬化為代表的新技術已經成為數據中心的基本組織方式,商業產品如VMware和開源產品如KVM、Xen已得到普及使用。統計數據顯示,至2012年底已有超過一半的x86服務器使用了虛擬化,至2014年這一比例將擴大到700%。
雖然虛擬化技術獲得快速發展,但在面向云計算數據中心的存儲系統設計仍然而臨諸多挑戰和困惑。人們目前對虛擬機環境下的文件系統I/O特征還缺乏深入認識和理解,在虛擬機環境下存儲技術路線的選擇方而缺乏理論與實驗數據支撐的有效指導。在云計算數據中心中,一類重要的存儲需求是為每個虛擬機提供一個虛擬磁盤映像。該應用需要存儲系統具有良好的可擴展性,支持為任意數量的虛擬機提供磁盤映像,并支持高性能訪問;可以支持磁盤映像的快照與克隆、遷移、動態擴展等高級特性。
NAS和SAN是目前數據中心所使用的主要存儲設備形式,NAS存儲可以支持數據共享,具有更好的可擴展性、可管理性和可用性;SAN在大多數傳統應用場景中具有更好的性能,但配置和管理較為復雜。在功能上,NAS和SAN都可以作為虛擬機的磁盤映像存儲設備,虛擬磁盤映像既可以對應到SAN設備的一個邏輯卷,也可以映射到NAS的一個或多個文件。
本文將簡要分析NAS和SAN的工作原理,探討虛擬化環境下的存儲系統架構和I/O訪問路徑,然后模擬數據中心的虛擬化環境對NAS和SAN的性能進行測試,對測試的結果進行分析探討,在此基礎上提出而向數據中心的存儲方案實施建議。
1網絡存儲系統的類型
NAS和SAN是目前云計算數據中心所使用的兩類主要存儲設備,本節簡要分析其工作原理并比較其差異。
1.1 NAS
NAS(Network Attachment Storage)存儲系統上運行有文件系統,對外部提供文件和目錄、元數據的數據視圖。其中目錄和文件的內容稱為文件系統的數據,而把用于描述和實現文件系統所用到的數據稱為元數據(Metadata),如文件大小、修改日期、以及訪問控制等。目前使用比較廣泛的NAS訪問協議有NFSv3, NFSv4和CIFS。其中UNIX/Linux環境使用NFS協議,而windows系統使用CIFS協議。
NAS可以支持多個程序對文件的`共享和并發訪問,并采取較為嚴格的一致性語義。如NFSv3規定對元數據的訪問使用同步操作;客戶端在打開文件時根據文件的最后修改時間對已緩沖文件數據的有效性進行檢查;對寫入的文件數據的緩存也有時間限制。
1.2 SAN
SAN (Storage Area Network)提供的數據視圖和磁盤完全相同。根據通信網絡的不同,SAN分為光纖通道( FC-SAN)和基于TCP/IP網絡的IP-SAN(通信協議為iSCSI)。總體來看,FC-SAN性能表現更加穩定,但iSCSI具有顯著性價比優勢,iSCSI在應用普及程度方而已經遠遠超過FC-SAN;隨著萬兆以太網的普及,有理由相信iSCSI將會在性能方而追趕上FC-SAN。
需要指出的是,在功能上SAN設備只提供了最基本的塊存儲功能,只能被動的接受讀寫命令;由于SAN設備上無文件系統,因此,不具有存儲空間和數據管理能力;其配置和管理也更加復雜。
2虛擬機環境下的存儲架構
虛擬機上運行有文件系統,當應用程序訪問文件時,文件系統將其轉換為對磁盤設備的請求,這些請求以模擬磁盤方式或準虛擬化方式發送到虛擬機監視器(Hypervisor)。虛擬機監視器判斷后端存儲設備的類型,如果為NAS,則將對磁盤的請求轉換為文件操作,發送請求給NAS服務器;如果后端存儲設備為SAN,則將磁盤塊訪問請求發送給SAN設備。
如果后端存儲設備為NAS, VM所訪問的虛擬磁盤實際為NAS存儲系統中的文件。這種模式下Hypervisor訪問存儲設備的I/O模式與傳統應用自接訪問NAS設備有很大不同。在傳統應用中,元數據操作高達I/O操作總數的70%,而在虛擬化環境下,所有元數據操作都轉換為對文件數據的操作,因此,元數據操作數量將顯著減少,與此同時,文件數據訪問呈現出更多的隨機訪問特征。
3虛擬機環境下NAS與SAN的性能測試
本節將測試虛擬機環境下NAS和SAN的性能。使用一個計算機作為存儲服務器,其CPU為Pentium(R) Dual-CoreE5300 2.60GHz,配置有8GB內存和2塊2TB SATA硬盤,配置有1塊千兆以太網卡,操作系統為CentOS6.4;在其上運行有NFS服務器和ISCSI軟件,可同時作為NAS和SAN存儲設備;另有一臺計算機作為虛擬機服務器,CPU為Pentium(R) Dual-Core E5300 2.60GHz,內存為8GB ,配置有1個千兆以太網卡,操作系統均為Ubuntu 12.04;創建2個虛擬機,每個虛擬機內存大小限制為2GB,虛擬機磁盤大小為30GB 。
測試文件設定為4GB,為虛擬機內存大小的2倍,以盡量消除虛擬機內存cache對讀寫性能的影響。
從測試結果可以看出,NAS的read. reread性能稍高于SAN,其原因在于NAS端的文件系統執行了預讀策略;而在random-read測試中,NAS的性能要低于SAN,則是由于在隨機讀情況下,NAS的預讀策略失效;在虛擬機環境下NAS和SAN的write . rewrite性能基本持平,而在randrom-write測試中,NAS的性能要稍高于SAN,這是由于NAS端的文件系統具有緩沖功能,可以將隨機寫入的數據進行緩沖,并在此基礎上進行I/O的優化。
虛擬機數量對測試性能有顯著影響。虛擬機數量增加時,性能有明顯下降。這是由于當只有一個虛擬機訪問存儲設備時,讀寫操作均為順序訪問;而當多個虛擬機并發訪問存儲系統時,不同虛擬機的請求交替到達,總體上在存儲設備端表現為隨機訪問,造成額外的磁頭移動,從而導致性能下降。
上述測試顯示了與傳統非虛擬化環境完全不同的結果。在傳統非虛擬化環境中,SAN的性能要顯著高于NAS,尤其在元數據密集型操作中SAN的性能高達NAS的3倍,究其原因,在于SAN的客戶端可以采取有效的緩沖策略,減少與存儲設備端的交互;而NAS由于數據一致性的要求客戶端需要及時將新的數據提交到存儲服務器,從而導致大量通信開銷。在虛擬機應用環境中,虛擬機上運行有文件系統,可以對數據采取有效的緩存策略,有效減少了和后端存儲設備的通信開銷;與此同時,所有在虛擬機上的文件系統中產生的元數據操作,都被轉換為針對NAS存儲系統中文件數據的操作,因此可以采用異步方式寫入NAS存儲設備,也進一步有效減少了通信開銷。
4總結
現代云計算數據中心需要為虛擬機提供可擴展、易于管理、支持快照和克隆等高級特性、并具有高性能的虛擬機映像存儲方案。本文的研究結果揭示出,雖然在傳統應用場景中SAN和NAS的性能有顯著差異,但這一性能差異已在虛擬機應用環境中得以消除。由于NAS存儲具有更好的可擴展性和易管理性,我們有理由相信NAS存儲是數據中心虛擬機映象存儲的更好選擇。
【探析網絡存儲技術研究論文】相關文章:
網絡存儲技術論文03-29
網絡存儲技術比較研究論文11-07
云計算環境下的分布存儲技術研究論文11-06
網絡安全技術研究論文03-29
網絡層的安全技術研究的論文11-07
網絡技術的發展與安全探析論文05-24
網絡信息理入侵檢測技術研究論文11-07
關于語言模因與網絡語言的探析論文04-24
網絡可靠性優化設計探析論文11-15