對服務器產(chǎn)業(yè)而言,2010年是很有紀念意義的一年。在產(chǎn)品上,我們迎來了包括英特爾至強 7500、IBM POWER7 在內(nèi)的十多款重量級芯片及一系列服務器新產(chǎn)品的大發(fā)布;在應用上,從虛擬化到云計算,從 Web2.0的大規(guī)模分布式處理到超算中心里的高性能異構(gòu)并行計算,我們看到了許多新的變化。那么,具體到x86服務器來說,這一年又給我們帶來了哪些啟示呢?特別是對于企業(yè)里的 CIO 和 IT 經(jīng)理們,有哪些技術(shù)變化和應用特點需要關(guān)注呢?對此,筆者整理出了以下九點,供大家參考。
1、重新審視 x86服務器的作用
傳統(tǒng)上,x86服務器被定位于中低端服務器,因為在向上擴展(Scale-up)、性能和 RAS 可靠性等方面明顯要比 RISC 小型機矮上一截。不過進入 2010年以來,這種定位發(fā)生了一些變化,特別是上半年推出的英特爾至強7500處理器,通過 QPI 直連架構(gòu)、8核16線程設計、22條 RAS、最大32路 SMP 擴展等特性,將 x86平臺推向了一個新的高度,并引發(fā)了服務器廠商的積極跟進,如富士通在推八路 PRIMEQUEST 1800E 時甚至打出“x86架構(gòu)小型機”的概念,浪潮與華為等國產(chǎn)廠商在開發(fā)基于這一平臺的高端容錯計算機,IBM 則依托其新一代企業(yè)級eX5架構(gòu)在內(nèi)存擴展、I/O 虛擬化等方面的五大創(chuàng)新技術(shù)重新定義了 x86服務器的工業(yè)標準。
這些技術(shù)進步使得今天的 x86服務器在性能、可靠性、可擴展性、可管理性等方面大幅提升,進而可以承擔更多、更關(guān)鍵的業(yè)務負載,如服務器整合、虛擬化、大規(guī)模數(shù)據(jù)處理等,甚至吸引一部分傳統(tǒng)小型機用戶的應用遷移。因此,對于用戶而言,特別是在那些大規(guī)模整合或核心關(guān)鍵應用的場合,需要重新審視和考慮x86服務器的用途,進行相應的測試和部署。
2、重視 I/O 瓶頸
盡管應用負載會存在計算密集型、內(nèi)存密集型和 I/O 密集型等差異,但對于 CPU 芯片和通用服務器系統(tǒng)來說,這些應用需求都需要照顧到。值得注意的是,在不同時期,隨著應用需求的變化,要考慮的側(cè)重點會有所不同。
對 x86服務器來說,今天 CPU 的發(fā)展速度遠遠超過了內(nèi)存、磁盤、網(wǎng)絡等 I/O 系統(tǒng),使得 I/O 瓶頸在實際應用中越來越突出,特別是對于虛擬化、大規(guī)模數(shù)據(jù)庫等內(nèi)存密集型應用而言,更是如此。我們知道,在一個向上擴展的多核系統(tǒng)中,數(shù)據(jù)存取的層次是 CPU、緩存、內(nèi)存、硬盤,越往外層,I/O 越慢,因此,隨著 CPU 的核心數(shù)量越多,CPU 喂不飽的現(xiàn)象會更加嚴重,I/O 因此成為多核計算之路上最重要的因素。
這一點也得到了從芯片廠商到服務器廠商的一致認同,如英特爾最新的至強 7500處理器通過引入 QPI 直連架構(gòu)、集成內(nèi)存控制器和大容量緩存,跟上一代產(chǎn)品相比,內(nèi)存帶寬提高了 9倍;甚至還發(fā)布了至強 6500這樣一款處理器來滿足那些需要“雙路服務器計算性能+四路服務器內(nèi)存容量”的用戶,比如一些內(nèi)存密集型的高性能計算應用。在服務器廠商層面,IBM 在其新一代 eX5系統(tǒng)設計架構(gòu)中更是著重考慮 I/O 問題,如 MAX5 內(nèi)存擴展技術(shù)可以提高 2倍內(nèi)存容量,eXFlash 固態(tài)存儲子系統(tǒng)大幅提高磁盤 I/O,同時將網(wǎng)絡 I/O 虛擬化技術(shù)引入 x86系統(tǒng)。比如,IBM System x3690 X5就是一款采用eX5架構(gòu)設計的雙路機架服務器,支持英特爾至強 6500系列(Nehalem-EX)處理器。一臺 x3690 X5機箱里可以支持32個內(nèi)存 DIMM,如果再配上 MAX5 內(nèi)存擴展單元(上有 32個內(nèi)存 DIMM),即可以擴展到 64個 DIMM; 而如果通過 QPI 線纜將兩臺 x3690 X5 連在一起,形成四路系統(tǒng),總共內(nèi)存 DIMM 數(shù)就可以達到 128條!可見,IBM 的 eX5已經(jīng)巔覆了劃分雙路、四路系統(tǒng)的傳統(tǒng)標準。
3、根據(jù)工作負載智能化調(diào)節(jié)資源
由于用戶需求千差萬別,理想的情況是讓服務器變得更加“智能化”,即可以根據(jù)負載的變化實現(xiàn)自動調(diào)節(jié)資源。近兩年來,這種智能特性已經(jīng)開始呈現(xiàn)。比如,英特爾在其最新的處理器中增加了睿頻加速 (Turboost)和超線程技術(shù),可以通過感知工作負載的變化來打開或關(guān)閉核心,進而提高主頻或增加并行線程,以滿足不同需求。
除了性能,功耗也可以動態(tài)控制。比如 IBM 在服務器中使用了“海拔高度計”,通過測量服務器所在地的海拔高度來判斷空氣的密度,進而調(diào)整風扇的轉(zhuǎn)速和送風量;另一家服務器廠商惠普公司則使用了“海洋式傳感器”,通過機箱里多達32個溫度傳感器來實時地對系統(tǒng)進行細致的環(huán)境監(jiān)測,防止過度散熱和調(diào)整風扇轉(zhuǎn)速以避免浪費電力。另外,服務器廠商也開始優(yōu)化各自的功耗管理軟件,如 IBM Director Active Energy Manager,以實現(xiàn)功耗封頂、監(jiān)控調(diào)節(jié)等更多高級功能。
當然,虛擬化和云計算本質(zhì)上就是為了實現(xiàn)靈活 IT 部署和服務而存在的。因此,今天在選購服務器時,你不僅僅要看性能、價格、可用性等方面,還應該把“智能”這一因素也考慮進去,以更好的應對“IT 系統(tǒng)僵化”、“功耗高漲”、“管理人手不足”等諸多困擾。特別是當你作為一個數(shù)據(jù)中心管理員,面對數(shù)以百計、甚至數(shù)以千計的服務器需要管理時,相信對系統(tǒng)智能特性的渴求會更加突出。
4、用系統(tǒng)的觀點考慮節(jié)能問題
IT 經(jīng)理對于服務器能耗的關(guān)注程度越來越高,特別是對于中大型數(shù)據(jù)中心來說,節(jié)能不僅意味著一種社會責任,也會實實在在地影響到成本支出。不過,對于用戶來說,考慮節(jié)能問題既要有系統(tǒng)的觀點,也要抓住重點,對癥下藥。因為從芯片、組件、整機、管理軟件到空調(diào)制冷系統(tǒng)、供電系統(tǒng)乃至數(shù)據(jù)中心建設,很多個環(huán)節(jié)都需要消耗能源。
就 x86服務器而言,在選型時一方面可以用 SpecPower 等指標來比較不同系統(tǒng)的性能功耗比,同時也要注意比較不同廠商的節(jié)能技術(shù)和功能,如機箱內(nèi)的散熱系統(tǒng)設計是否科學合理?電源轉(zhuǎn)換效率能否達到 90%以上的級別?能耗控制與管理軟件有什么樣的功能?能否根據(jù)負載自動調(diào)節(jié) CPU 主頻和風扇轉(zhuǎn)速?能否通過光通路診斷顯示屏便捷地對主要部件進行監(jiān)控?等等。
5、向管理要效率
“向管理要效率”,并非一句空言。隨著業(yè)務應用的發(fā)展變化,企業(yè)后臺的 IT 系統(tǒng)和數(shù)據(jù)中心日益復雜,管理支出也在不斷攀升。有統(tǒng)計表明,企業(yè) IT 部門把 70%的預算用在了 IT 運維管理方面,而只有 30%的資源可以用來支持業(yè)務創(chuàng)新。因此,向管理要效率,不僅必要,而且也大有可為。
在考察 x86服務器的可管理性和可維護性時,關(guān)鍵要看廠商能否提供齊全的管理模塊和功能,包括安裝配置、遠程管理、光通路診斷、組件熱插拔、高級管理軟件等。同時也要注意廠商是否支持最新的管理技術(shù),如統(tǒng)一可擴展固件接口(UEFI)?因為最新的 BIOS 不僅方便配置和部署,而且比上一代 BIOS 提供了更多的管理功能。當然,對于不同的用戶來說,碰到的“痛點”是不一樣的,需要的管理功能也不同,如有的注重功耗管理,有的注重虛擬化管理,有的關(guān)心管理的便捷性。
6、給刀片潑點冷水
憑借高密度、高可管理性、高度整合等優(yōu)勢特性,刀片服務器一度被認為是機架產(chǎn)品的替代品,甚至有廠商喊出了“Blade Everything”的口號。但刀片真的能適應所有環(huán)境,并完全取代機架嗎?答案顯然是否定的,因為沒有一種架構(gòu)完美到可以適用所有的場合,什么時候用刀片,關(guān)鍵還得具體情況具體分析。
由于刀片機箱在很小的空間里把服務器、存儲、網(wǎng)絡、供電、散熱、管理等模塊集成在一起,使得其單位空間的能耗大大提升,一般功率都在 2000-5000W 之間,遠遠高于同等空間大小的機架服務器。而且,實際上并不是所有的客戶和機房都能支持這種高密度的設備,由于供電能力有限,數(shù)據(jù)中心里往往出現(xiàn)一個42U機柜里只能放置 1-2臺刀片機箱的情況,寶貴的機柜空間反而被大大浪費。此外,機架服務器由于有足夠的散熱空間,可靠性也比刀片服務器更高,并且機箱里也有足夠的空間去支持更高的 I/O 擴展能力。而這些因素對于關(guān)鍵業(yè)務應用而言都是不可忽視的。因此,用戶在選型時應該根據(jù)應用特點來決定,特別是對于 I/O 吞吐比較大的應用,如數(shù)據(jù)庫、大規(guī)模網(wǎng)絡輸入輸出等,機架式產(chǎn)品反而更有優(yōu)勢。
7、標準化與定制化
由于應用負載多種多樣,一般會存在計算密集型、內(nèi)存密集型、I/O 密集型等差異,而且對于某些用戶,特別是大規(guī)模 Web2.0企業(yè)、超級計算中心、云計算數(shù)據(jù)中心等,還有著更多的特殊需求,因此,我們看到服務器定制化在 2010年得到了長足的發(fā)展。
這種定制化體現(xiàn)在兩個方面。第一種是工業(yè)標準服務器的“定制化模塊”,如 IBM 在其最新的 eX5 架構(gòu)中,引入了 FlexNode 節(jié)點互聯(lián)技術(shù)和 MAX5 內(nèi)存擴展技模塊,可以把 HX5、x3690 X5、x3850 X5等三款產(chǎn)品擴展成覆蓋“普通應用、內(nèi)存饑渴型、計算密集型和復雜大型應用”在內(nèi)的 12種不同優(yōu)化配置。第二種是專門針對某類應用進行優(yōu)化的功能型服務器,如面向高性能計算的 CPU+GPU 混合架構(gòu)服務器集群,針對高密度互聯(lián)網(wǎng)數(shù)據(jù)中心的“雙胞胎”或“四胞胎”高密度服務器(即一臺服務器里裝有多塊主板),針對云環(huán)境部署的軟硬件集成化機柜式系統(tǒng)等等。
可見,前一種仍然是標準化服務器,只是通過技術(shù)創(chuàng)新實現(xiàn)了更好的擴展性,因此適用面更廣,而后一種定制化服務器往往適用面比較窄,一般適合的都是“服務器大戶”。當然,對具體用戶來說,在選型時仍然是要首先分析自己的工作負載,然后衡量投入產(chǎn)出比。
8、從虛擬化到私有云
進入 2010年以來,虛擬化技術(shù)應用的廣度和程度不斷加深。一方面是虛擬化的范疇更廣,不再只局限于服務器,很多用戶開始考慮存儲虛擬化和 I/O 虛擬化;另一方面是虛擬化與行業(yè)應用結(jié)合得會更加緊密,而不只是針對基礎架構(gòu)的虛擬化。如果我們把私有云建設當成一個過程來看,隨著用戶應用愈加深入,對虛擬化技術(shù)的要求也會越來越高,考慮的問題也會增多,比如虛擬化的效率、更高級功能、安全性、擴展性以及對虛擬化數(shù)據(jù)中心的管理等。
因此,為虛擬化應用選擇 x86服務器時,我們需要有一種動態(tài)發(fā)展的觀點,即你所選擇的平臺能否靈活按需擴展。如 CPU 和內(nèi)存等資源是否方便擴展,比如 IBM eX5 架構(gòu)中的 MAX5 內(nèi)存擴展單元?是否支持 I/O 虛擬化功能?服務器廠商在云計算方面是否有相對應的升級產(chǎn)品或方案服務,如 IBM 的 CloudBurst 等等。對于某些用戶來說,還要考慮 x86服務器與小型機甚至是大型機在虛擬化環(huán)境下的資源統(tǒng)一管理問題。
9、關(guān)注架構(gòu)融合與統(tǒng)一管理
俗話說,“分久必合,合久必分!盜T 領(lǐng)域也是如此。大型機時代以集中為主,互聯(lián)網(wǎng)時代強調(diào)分布式應用,而到了今天的虛擬化與云計算時代,又出現(xiàn)了融合的趨勢,這一方面是得益于技術(shù)的進步,另一方面也是應用發(fā)展的需要。
具體到服務器領(lǐng)域來看,這種融合至少體現(xiàn)在了兩個方面。一是計算、存儲、網(wǎng)絡資源的整合,如刀片服務器、模塊化數(shù)據(jù)中心等,甚至開始把各種系統(tǒng)軟件和中間件也集成在一起,以實現(xiàn)“Cloud in a Box”,如 IBM 的 Cloudburst 和 Oracle 的 Exalogic Elastic Cloud。另一種是不同體系架構(gòu)之間的融合,如 CPU 與 GPU 的協(xié)同并行計算,又比如 IBM 最新一代的 zEnterprise 開始把大型主機與基于 POWER 和 x86 架構(gòu)的刀片服務器資源整合在一起,并實現(xiàn)統(tǒng)一管理,以適應更多新興的工作負載需求。
其實,從長遠來看,在虛擬化和云計算環(huán)境下,軟硬件架構(gòu)和產(chǎn)品本身之間的差異性會變得不象以前那么明確和重要,而用戶自身的業(yè)務創(chuàng)新和工作負載要求會變得越來越關(guān)鍵。
總之,從整個產(chǎn)業(yè)的角度來看,2010年是 x86服務器具有“轉(zhuǎn)折意義”的一年,不僅性能上了一個大臺階,而且應用領(lǐng)域也在不斷拓展。比如,以前你可能沒想到把 x86服務器做成小型機?沒想到 x86可以與 GPU 協(xié)同計算?沒想到把 x86與大型機整合在一起?沒想到把標準的 x86服務器做得跟“變形金剛”一樣可以靈活配置?沒想到 x86服務器芯片也能“超頻”?……2010年,這些或得到進一步增強,或成為新的現(xiàn)實!所以,作為用戶,你也需要用發(fā)展的眼光來重新審視 x86技術(shù)以及你的工作負載:沒有不可能,只有想不到!