古詩詞大全網 - 成語用法 - 什麽是mbb

什麽是mbb

1.什麽是MBB結構

MBB的全稱是Modular Building Block,每個BB(Building Block)可包含4路CPU,若幹內存和I/O卡。在Sun服務器上稱BB為board;在HP服務器上稱BB為cell;在原先的Compaq服務器上稱BB為quad。不同BB內的CPU可以有不同的時鐘頻率。所有的BB通過壹種稱為crossbar switch的交換機制連接在壹起。crossbar switch可以提供BB之間的點對點的高速連接。

采用MBB技術可以比較容易的設計出擁有更多數量CPU的服務器。在這種服務器上既可以運行壹個操作系統,也可以在壹個或多個BB上運行多個操作系統。這就是所謂的服務器(基於物理分區)的邏輯分區。

MBB技術從出現到現在已經超過十年了,最早是由Sequent (NumaQ)公司在八十年代末到九十年代初時發明並采用的。Cray公司在九十年代初時在它的Cray 6400上采用了MBB技術,該機型是Sun E10000的前身;Compaq公司在2000年壹季度發布了它的基於MBB技術的機型Wildfire (GS320);HP公司發布了業界最後壹款基於MBB技術的機型Superdome,那是在2000年三季度。Sun公司在2001年三季度發布的Starfire (F15K)在體系結構上並無變化,只是將原來E10000上的CPU換成了SPARC3而已。

2.MBB結構的優點

基於MBB技術的服務器是由多個BB構成的,所以它天生具有物理分區(Physical Partition)的特性。前面提到在MBB服務器上存在壹個連接BB的互連機制(crossbar switch),它工作在壹個固定的時鐘頻率上。

例如,在Sunfire服務器上的Uniboard機制就是完成這種互連功能的。其總線時鐘是150MHz,不管CPU的主頻是多少(600,750,900,1050MHz),它是固定不變的。所帶來的問題是數據/指令被傳送出去的等待時間過長。這是典型的高CPU時鐘頻率和低總線速度的矛盾。

所有的MBB結構的服務器都具有壹個"顯著"的優勢:可以熱插拔CPU板和內存板。這是因為每壹個BB是物理分開的,每個4路CPU板可以單獨從系統中隔離出來並將其下電。 但有壹點需要註意:在壹個運行的系統中,從壹個BB中拔出CPU、內存或I/O板是有限制的,這基於每個機型的設計不同而不同。例如,Sun 6800服務器就有壹個警告標簽,其註明每個Uniboard槽在系統運行時空槽位的時間不能超過60秒(而且電源、溫度等環境因素必須控制在壹定的範圍內)。由此推斷,F12K/F15K可能時間會更短。

3. MBB結構的缺陷

HP公司當初發布Superdome服務器時,曾公布了它與HP其它UNIX服務器的相對性能值。64路CPU的Superdome(MBB結構)的相對性能值是20,8路N4000(***享結構)的相對性能值是6.3。我們可以看到,8倍數量的CPU換來的只是3倍性能的提升。

造成這種現象的根本原因就在MBB結構上。Superdome上的每個cell(BB)裏的CPU、內存或I/O卡可能需要訪問其它cell裏的數據。crossbar switch在cell之間建立點對點的連接,但同時帶來延遲(latency)。即如果壹個連接請求建立不成功時,則會再試壹次直到建立連接成功,而此時其它的連接請求將會等待。在實際環境中,很多客戶通過建立物理分區(每個分區中最多12到16個CPU)的方法來盡量減少這種延遲的影響。這種做法將原來CPU個數較多的機器分成了若幹個有較少CPU個數的機器,當然也就不是原來宣稱的服務器的擴展性了(例如具有64路CPU的服務器)。

Sun和Compaq公司的具有MBB結構的服務器裏都有類似的crossbar switch結構,當然都存在相同的數據訪問延遲的缺陷:點對點的連接必須建立,同時這種連接的建立是競爭的。

Sun公司宣稱其服務器的擴展性是線性的,即服務器的性能隨著CPU個數的增加呈線性增長。它是用SPECintRate和SPECjbb2000這兩個基準測試值來證明的。我們需要指出的是:這兩種測試方法只是基於CPU本身,並沒有***享數據的訪問和網絡及硬盤I/O的發生。很顯然,這與實際情況是不相符的。

我們談服務器的性能是整體的去看。有很多可以整體評價服務器性能的基準測試,例如:TPC/C、Oracle ASB11i、Peoplesoft、SAP、Baan、JDEdwards等。這些測試方法都具有數據庫訪問、模擬客戶的實際應用和很大的I/O訪問量等特點。

4. 以POWER4為芯片的IBM UNIX服務器的設計

IBM UNIX(p系列)服務器的設計思想是***享式的,即所有CPU可以同等的看到所有的內存和I/O的連接方式:壹種全新的為數據/指令流提供足夠的高速通路的體系結構。

p系列服務器CPU數量的增加是壹個成比例漸進的過程。目前p690上的最大CPU個數是32路。從p690"以少勝多"的實例來看,服務器CPU數量的多少並不真正代表其處理能力的高低。P690(32路CPU)勝過Superdome(64路CPU)就是壹個有力的證明。

POWER4和以POWER4為芯片的服務器在設計上有兩個重要點:

· 消除對數據傳送的約束

· 數據傳送能力是隨著CPU性能的增長而增長

下面將比較詳細的做壹介紹:

(1) 在POWER4芯片上設計了較大的緩沖區。壹個POWER4芯片(chip)上有兩個核心處理器,每個核心處理器有壹個L1緩沖器(32KB數據和64KB指令),並且每個芯片上有壹個***享的L2緩沖器(1.5MB)。這個L2緩沖器的時鐘頻率是核心處理器的壹半。每個 L2緩沖器有三個32字節寬的總線與兩個核心處理器相連,用於向兩個核心處理器傳送指令和數據。另外還有三條8字節寬的總線用於從兩個核心處理器回傳數據給L2緩沖器。POWER4創造了第壹個消除了控制信號和數據傳送沖突的CPU結構。

POWER4處理器有壹個L3緩沖器控制器,它是與32MB大小的L3緩沖器的接口。在業界有壹種說法:任何I/O都是不好的,即CPU運行時所需的數據不在內存裏,需要從外設中讀入。最理想的狀態是處理器運行時所需要的指令/數據全都滿足,其次是指令/數據在L1緩沖器中,再其次是在L2緩沖器中,再其次是在L3緩沖器中,最差的情況是在內存裏。p系列服務器上的緩沖區總數量是Sun服務器的四倍,是HP服務器的十五倍。 (2) 在POWER4的設計中存在壹個稱作分布式交換器(distributed switch)的連接機制。它提供在壹個MCM(Multi-Chip Module)上的處理器之間的點對點的連接,也用於在不同的MCM上的處理器之間的點對點的連接。這個分布式交換器的時鐘頻率是CPU的時鐘頻率的壹半。例如,如果是1.3GHz POWER4的處理器,則分布式交換器提供16字節寬、時鐘是650MHz的點對點總線連接。

IBM目前提供給UNIX市場的服務器,真正實現了CPU處理能力和服務器處理能力的線性增長。