在IT行業(yè),“虛擬化”這一概念最早可追溯到上世紀60年代,迄今為止,虛擬化技術已經走過了半個多世紀;2006年亞馬遜推出了“Elastic Compute Cloud(彈性計算云)”服務,“云計算”這一概念進入了人們的視野,并且迅速發(fā)展,短短數年,就從虛無縹緲的概念轉化成了實際的應用,2012年,中國的云計算市場就已達到474.48億元。根據IDC的預測,2014年云計算市場將會呈爆發(fā)式增長。對云計算而言虛擬化是其所有要素中最基本,也是最為核心的組成部分。服務器虛擬化是發(fā)展歷史最長的虛擬化技術,可以幫助企業(yè)和機構提高設備利用率,系統(tǒng)可靠性,同時可以解決計算單元管理等方面的問題,給企業(yè)帶來了很大的成本、安全性和管理簡易性等方面的收益。有相關調查研究顯示,在2009年世界范圍內部署的虛擬機數量就已超過物理服務器的部署數量;雖然越來越多的企業(yè)將虛擬化的部署作為IT戰(zhàn)略的重要步驟,但是隨著IT架構虛擬化程度的不斷提高,越來越多的用戶發(fā)現,服務器虛擬化給企業(yè)帶來了負擔,性能下降、安全等問題讓不少用戶對虛擬化技術產生了懷疑,阻礙了虛擬化技術的進一步普及和發(fā)展。這里我們要討論的就是虛擬化和云計算方案中日益凸顯的與存儲相關的挑戰(zhàn)。
部署虛擬化方案需要考慮存儲問題
服務器虛擬化背后的一個驅動因素就是需要提高服務器資源未使用部分的性能輸出,提高資源利用率。從實踐中我們可以看到,服務器虛擬化可以更高效和更有效的使用服務器的處理能力,但是虛擬化技術給其它物理資源所帶來的額外壓力卻經常被忽視。在服務器整合過程結束后,存儲系統(tǒng)可能會成為系統(tǒng)一個更大的瓶頸問題。現在日益凸顯的性能方面的問題也證明了這一點。
挑戰(zhàn)一:日益集中的數據資源,極大的增加了管理復雜度
服務器虛擬化實現了對計算機的虛擬化,從而在一臺物理的計算機上同時運行多臺虛擬計算機成為可能。相對于傳統(tǒng)的存儲而言,云計算和大數據背景下的存儲一般與上層的應用系統(tǒng)結合的更加緊密。過去,存儲往往是專門為特定的應用設計和開發(fā)的,不同應用場景往往有對應的存儲系統(tǒng)。在服務器虛擬化技術不斷發(fā)展的情況下,越來越多的應用以虛機的形式被集中到了一個小的平臺上,但是存儲卻還停留在以硬件為中心的框架下,這就給存儲管理員帶來了極大的麻煩。企業(yè)通常有很多不同的工作負載存儲在存儲系統(tǒng)中,對于管理員而言,存儲卷、每卷支持的工作負載、對每卷的要求以及什么占用容量之間并不存在明確的關聯(lián)性,導致存儲負載占比不同和總體占用率低等問題,如下圖。
而且,從本質上講,虛擬基礎設施在存儲基礎設施上創(chuàng)造了另一個抽象層,因此并沒有真正擺脫物理層的復雜性,他們需要管理大量針對不同的應用的存儲而購買的異構的存儲資源,這就大大增加的管理的復雜度和管理成本,也帶來了潛在的系統(tǒng)安全性的風險。
挑戰(zhàn)二:急劇增長的隨機負載,帶來I/O瓶頸和性能下降問題
隨著虛擬化程度的加深和虛擬機密度的增加,用戶最先感受到的就是系統(tǒng)性能的下降,這也是服務器虛擬化出現挑戰(zhàn)的最直觀的感受之一。現在,有一個讓管理員非常郁悶的問題就是,存儲性能增長速度相比于計算能力的增長,明顯要慢得多。對于虛擬化而言,I/O瓶頸和緩慢的存儲性能已經成為了公認的頭號難題。服務器虛擬化情況下,不同的應用集中到同一個平臺上,可以實現在單個物理磁盤上進行頻繁的操作,但這會產生大量的隨機I/O流,造成大量的磁盤負載,導致性能下降。在系統(tǒng)沒有足夠緩存來處理大量的數據的情況下,還可能會導致緩存故障,減慢系統(tǒng)的速度。
根據摩爾定律,計算機的計算性能大約每18個月就會增長一倍,現在的發(fā)展速度還有加快的趨勢,而從統(tǒng)計數據來看,存儲的性能增長速度要遠遠慢于計算性能的增長。根據傳統(tǒng)存儲模式提供的方案,要滿足虛擬機密度不斷增加帶來的大量隨機IO,那么就必須要購買更多的存儲資源。
根據Gartner的預測當前模式下,服務器虛擬化將讓你的存儲采購量提升600%。也就是說,你必需要購買你目前已經部署的6倍,并且這將發(fā)生在之后的三年內,而原因只是為了適應你所要步入的美好的全新的虛擬化模式。對于大多數企業(yè)和機構而言,這樣的成本是無法承受的。這也就意味著傳統(tǒng)的存儲模式下,存儲會成為制約企業(yè)實施虛擬化和云計算戰(zhàn)略的一個極大的瓶頸。
企業(yè)部署虛擬化方案,主要的目的就是集中資源,提高資源利用率,簡化應用的管理和降低成本,從而獲取更大的收益。從客戶的角度來看,管理和性能是跟客戶最為緊密相連也是客戶感受最為直觀的兩點。首先,服務器資源,數據資源的集中必須要伴隨著存儲資源的整合,否則異構的存儲資源會消耗大量的管理資源,帶來不小的管理成本和風險,同時還是會存在存儲資源利用率的問題。其次,在存儲虛擬化環(huán)境下,一定要考慮到數據資源的集中帶來的隨機負載增加的問題,急劇增加的隨機負載對存儲性能帶來了極大的挑戰(zhàn)。綜上所述,在當前的虛擬化和云計算的背景下,部署虛擬化必須要先考慮存儲。