綠兔部屋 提供每日焦點訊息

首頁 > 3C / 內容

2U 4節點Xeon SP伺服器(上):PowerEdge C6420更受重視

2017-07-20 3C 968人瀏覽

本文內容非商業用途可無需授權轉載,請務必註明作者、微博ID:唐僧_huangliang,以便更好地與讀者互動。

接前文:《Dell PowerEdge R940解析:四路頂配伺服器維護平民化》

《Dell PowerEdge R740xd解析:伺服器只看參數那就錯了》

《Xeon SP伺服器的M.2 SSD RAID:揭秘PowerEdge 14G BOSS》

《Dell PowerEdge R640:NVMe直連、NDC網卡、PERC10一覽》

儘管以前Dell等OEM大廠也提供2U 4節點伺服器機型,但該領域受關注更多的似乎是SuperMicro、廣達這樣的ODM廠商。

在網際網路公司這一輪興起之前,計算密度高的2U 4節點最初用於HPC應用多一些,該部分市場有些不溫不火——增長更多在於GPU/協處理器。如今策略變化的原因是什麼呢?不知您的答案是否和我一樣——超融合

最近寫的新一代Xeon Scalable伺服器主要是圍繞Dell的機型,有讀者朋友給我留言,能否分析下不同廠商的產品?

一旦涉及到橫向對比,我都會比較謹慎。首先要對各家的產品有一定的了解,更重要的是客觀中立,如果做不到則不如不寫。既然這麼說,我也做好準備談一些Dell伺服器設計上的限制,並嘗試分析其背後的原因。

大功率電源模塊:110V電壓下輸出下降一半?

2U 4節點的PowerEdge C6420,是本次Dell 14G伺服器發布型號當中,我要寫的最後一款。上面這台24盤位樣機一共安裝了8個SSD,每節點連接2個。

Intel OEM給Dell的SATA接口SSD DC S3610 800GB

C6420的後視圖。我們看到1+1冗餘電源的位置現在位於中間,上一代的PowerEdge C6320電源模塊在機箱最左邊。

抽出其中一個節點,除了固化的管理網口、USB 3.0和DP顯示輸出等之外,右上方安裝了一塊PCIe網卡。除此之外還能擴展幾個PCIe設備呢?請大家往後面看。

之前介紹另外幾款Dell 14G伺服器時沒太注意電源部分。這款2000W 80plus Platinum(白金)電源模塊的轉換效率可達94%。需要注意的是,其最大交流輸入電流為11.5A,也就是說只有在200-240V輸入時才能達到最大2000W的輸出功率,而在100-120V輸入時只能達到1000W輸出。

我們知道,Xeon SP的最高功耗可達205W,一個節點光是2顆CPU就有可能達到400W。所以PowerEdge C6420支持的電源模塊有1600W、2000W和2400W三種。根據我的理解,在110V供電時也可以將負載分攤到2個模塊上,支撐總體功率的同時犧牲一部分冗餘能力。至於最佳實踐,請以官方說明為準。

同時我也核對了C6420的另外兩種電源模塊規格,100-120V交流輸入下,1600W電源的輸出為800W,2400W的輸出為1400W。我想其他伺服器廠商應該也會有類似的情況,這一點對於國內用戶基本沒啥影響。

我又翻閱了上周拍的照片,R940用的1100W電源在100-120V交流輸入下可輸出1050W,而R640使用的750W輸出功率則不受輸入電壓影響,供參考。

上圖是C6400機箱內部的線纜連接示意,其中MB 1-4對應的是4個節點的主板,Linking Board負責連接驅動器,而Midplane、CM和PIB板則是用於供電轉接、機箱管理(風扇控制)等。

Xeon 61xxF、81xxF的Omni-Path 100Gb/s互連

這張照片就是其中一個節點,光線不夠好請大家諒解:)除了位於下風方向的CPU散熱器尺寸較大之外,左下方節點尾部可以看到有PCIe轉接板的托架。

為什麼兩顆一樣的CPU配不同散熱器呢?我想不少朋友都知道,右邊處理器更靠近系統風扇,散熱氣流會先經過它,帶走熱量並升溫後再經過左邊的CPU。或者說位於風道後面的CPU進風溫度更高,而風壓則較小一些,所以散熱壓力相對較大,就要靠散熱器補回來。

LGA-3647這一代CPU的Socket成本看來較高,而易用性也相當到位。首先CPU不用鎖扣而直接靠散熱器壓在插座上,其次有防呆設計不用擔心散熱器方向裝反。

在介紹PowerEdge R940的文章中我曾提到拆散熱器時CPU會被被矽脂粘下來,下面有一張分離操作的示意圖。

大家可能也看到了,該示意圖中用的CPU有點特別,也就是本次推出的Xeon Scalable家族中帶有「F」結尾的型號。

上圖截自《Intel Xeon Processor ScalableFamily - Specfication Update》,當在PowerEdge C6420中配置這些CPU時,就多出了100Gb/s的Omni-Path Fabric(也稱為OPA)互連接口,目前主要用於HPC高性能計算,與InfiniBandEDR競爭。

關於OPA網絡,我在一年前的《Xeon Phi x200要自我互連,CPU靠邊站》中就介紹過。當時趕上Intel發布了代號為KnightsLanding的Xeon Phi Processor 7200,不依賴傳統x86 CPU就可以獨立工作,其中就有集成Omni-Path Fabric互連的版本(上圖右邊)。

與此同時,Dell還推出了一款專門支持Xeon Phi 7200的2U 4節點伺服器PowedEdge C6320p,和上圖中的節點長得比較像。有了這個專門針對HPC的機型,可以說在LGA-3647和OPA方面提前積累了一些經驗吧。

在上周7月12日的發布會現場,Intel EPSD展台上擺出了這樣一塊OPA接口子卡,相當於是2個100Gb/s的QSFP28接口物理層。

目前Xeon 61xxF、81xxF的用途明顯還是高性能計算,對於C6420以外的PowerEdge 14G機型,可以通過獨立的OPA PCIe擴展卡來獲得類似功能。據了解100Gb/s Omni-Path卡的價格可能比56Gb/sIB還要便宜,另外交換機埠數上還有優勢。雖說Mellanox的IB王國短時間內不會動搖,但他們或許需要更重視乙太網市場了,比如未來空間巨大的25GbE。

從Dell的網卡支持列表來看,雖說技術上可以通過40G晶片降速到25GbE,但Intel新一代25G網卡的動作還是慢了點。為什麼這樣說呢?因為RDMA的重要性,未來大致是兩種標準的PK——RoCE和iWARP,後者主要靠Chelsio和Intel,而當前使用Intel XL710晶片的25GbE網卡XXV710還不支持iWARP。

最後再來看一下C6420的PCIe擴展。這個插槽的作用大家可以猜一下,會不會轉接支持M.2 SSD呢?

這張照片里下方的黑色插槽在樣機上用於轉接網卡,而上方的黑色插槽和一對白色連接器又是怎麼使用的呢?此外PowerEdge C6420最多支持多少個NVMe SSD...

在明天的下篇里我再給大家介紹吧,另外我還想深入討論下2U 4節點伺服器結構設計的兩個分支方向,敬請繼續關注!

註:本文只代表作者個人觀點,與任何組織機構無關,如有錯誤和不足之處歡迎在留言中批評指正。進一步交流技術,可以加我的QQ/微信:490834312。如果您想在這個公眾號上分享自己的技術乾貨,也歡迎聯繫我:)

尊重知識,轉載時請保留全文。感謝您的閱讀和支持!《企業存儲技術》微信公眾號:huangliang_storage

原文連結:https://mp.weixin.qq.com/s?__biz=MzAwODExNjI3NA==&mid=2649776389&idx=1&sn=83c83f904824f411a8324548f9d60383&chksm=83770058b400894e71b4af8cdc2f353ca266209cd57963b47fa8c70b9c2470c71ce8917256fb#rd

工商服務
友情連結
分類選單