協同計算加速架構

創新性引入GPU計算單元,突破了傳統單一的計算單元,采用Intel最新Nehalem/Westmere處理器核心與NVIDIA Tesla加速計算技術的協同,讓CPU和GPU各司其職,CPU主要承擔更加擅長的邏輯選擇、判斷跳轉和IO通信方面的職責,而GPU則專職計算密集型、高度并行的計算工作,使得計算資源合理的分配,計算力被充分釋放,計算性能達到從幾倍到幾百倍的增長。特別強調的是,協同計算加速架構不是對傳統技術路線的否定,而是一種補充和輔助,更加淋漓盡致地發揮GPU的優勢,最終幫助用戶在某些特定應用領域中大大縮短解決問題的時間或提高解決問題規模。

大規模并行計算處理核心
相比較于僅能有很少線程同時工作的多核CPU而言,GPU的特性是可以同時執行數千個線程,這將令我們的系統能處理更多的信息流。例如在游戲、動漫渲染中,由于GPU的計算是一種特殊的計算任務,即所計算的每一個像素之間不需要(或者用方法使它不需要)考慮先后順序,那么如果有了上百萬個線程,就可以讓所有的像素同時渲染,這樣所有的像素就可以在一個像素的時間內計算完成。目前Tesla處理單元支持448個處理器核,峰值處理速度達每秒1萬億次浮點運算,通過協同可擴展架構,根據用戶的需求可以增加GPU的數量,通常應用加速比都在1個到2個量級。

協調處理單元間高速IO交換技術
為了更好的發揮CPU和GPU的協同效應,九重天S8000桌面超級計算機采用了Intel 公司的QPI(Quick Path Interconnect)技術,可以實現高達6.4GT/s的傳輸速率,使通信更加迅捷。QPI總線實現了多核處理器內部的直接互聯,在多處理器作業下,每顆處理器可以互相傳送資料,并不需要經過芯片組,從而大幅提升整體系統性能。隨著Nehalem架構的處理器集成內存控制器、PCI-E 2.0圖形接口乃至圖形核心的出現,QPI架構的優勢將進一步發揮出來。

優秀的編程環境
CUDA(Compute Unified Device Architecture)通用并行計算架構使GPU能夠解決復雜的計算問題。 它包含了CUDA指令集架構(ISA)以及GPU內部的并行計算引擎??⑷嗽畢衷誑梢允褂肅語言來為CUDA™架構編寫程序,C語言是應用最廣泛的一種高級編程語言。所編寫出的程序于是就可以在支持CUDA™的處理器上以超高性能運行。并且支持其它語言,包括FORTRAN以及C++。

  用于GPU并行應用開發的標準C語言
  快速傅里葉轉換(FFT)以及基本線性代數子程序(BLAS)的標準數字庫
  專用CUDA驅動器,用于GPU和CPU之間快速數據傳輸計算
  CUDA驅動程序與OpenGL和DirectX圖形驅動程序可以實現互操作
  支持Linux 32/64位,Windows XP 32/64位以及Mac 操作系統
  目前數以千計的軟件開發人員正在使用免費的CUDA軟件開發工具來解決各種專業以及家用應用程序中的問題。這些應用程序從視頻與音頻處理和物理效果模擬到石油天然氣勘探、產品設計、醫學成像以及科學研究,涵蓋了各個領域

操作系統

Windows,linux全系列

CPU處理器類型

- 支持雙路 Intel® Xeon® E5-2600 系列, Socket R LGA2011 , 4/6/8 核心、15MB/20MB 緩存,最大功耗: 150W

芯片組

英特爾® C602

電源要求

2400W2+1)冗余 100-240V全球電壓自適應,主動式功率因數校正

內存類型

DDR3 1333 MHz ECC Unbuffered or Registered DIMMs

內存

- 24 DDR3 DIMM slots ,高達 192GB
- 8
通道 DDR3/DDR3L 、 800/1066/1333/1600 MT/s
-
支持 RDIMM/UDIMM ECC/LR-DIMM/LV-DIMM

內置驅動器

23.5 英寸 SATA 6GB 硬盤或 4 2.5 英寸 SATA 硬盤,支持固態SSD(電子)硬盤

硬盤驅動器速度

7200 15000 rpm

存儲控制器

- 2 AHCI (ODD)SATA 6G 端口, 包括 RAID 0/1
- 4
SCU0 (HSBP)SATA 6G 端口
-
可選 2x 4 端口 mini-SAS ,支持高達 6Gb/s SAS/SATA with both LSI & RSTe RAID 0/1/10/5 通過 Intel RAID C600 升級 Key

GPU處理器類型

- 高達8Nvidia Tesla M2090 GPU卡(每卡支持448顆計算核心、共計4,096顆核心)
-
單個機箱內,提供5.32 Teraflops 雙精度浮點和10.65 Teraflops單精度浮點性能
- IEEE 754
/雙精度浮點
-
高達48GB專用DDR5內存(每個GPU支持6.0GB

擴展槽

- 8x PCIe Gen3 x16 slot, FL, DW
- 3x PCIe Gen3 x8 slot, FL
- 1x PCIe Gen2 x4 electrical (in x8 slot), HL
*
支持高達8x16 雙槽位卡

外置 I/O 端口

正面: 2 USB 2.0 端口; 背面: 2 USB 2.0 端口、2 PS/2 接口、2 個用于集成千兆局域網的 RJ-45 接口; 內置: 2 USB 2.0 端口

顯卡

- 整合服務器引擎 PILIT 3 PILOT3 IBMC. Matrox G200
1
個內置 VGA

GPU計算處理單元

可同時支持8個具有448個內核的NVIDIA Tesla M2090系列 GPU計算卡

多操作系統虛擬化技術

可選Parallels WS VirtualizationExtreme

網絡接口

- 集成雙路千兆端口,通過 Intel® I350 千兆以太網控制器 w/ Intel 虛擬化技術
-1
Intel 內置 I/O ??椴宀?,支持大量網絡接口的新增外置端口 ( SFP+ 10GbE ,雙 10GBAST-T, ,單 Infiniband FDR Quad GbE 端口 )

產品尺寸

17.6 x 71.0 x 48.3 厘米(寬 x x 高)

產品重量

最小配置: 20 千克; 最大配置:30 千克

管理IPMI

- 整合服務器引擎PILOT 3 IBMC、支持IPMI 2.0
-
可選RMM4 Lite先進管理器或RMM4 w/ 遠程KVM 升級 key + dedicated NIC 端口

工作噪音

< 60 dBA(分貝);依照ISO 9296 宣布的工業標準 [ISO 9296的全稱是《聲學計算機和辦公設備噪聲發射的申報值》]

保修

3年保修:3年現場、下一工作日零件或人工保修服務

 

{ganrao}