藍色基因

藍色基因

IBM産超級計算機
藍色基因,超級計算機名。國際商業機器公司(IBM)緻力于尖端超級計算的一個項目。在計算機體系結構中,在必須編程和控制整體并行系統的軟件中和我們在重要生物學的高級計算如蛋白質折疊中應用。2003年,藍色基因的原型機經過三年研發問世,當年11月登上超級計算機“TOP500”第73名。
  • 中文名:藍色基因
  • 外文名:Blue Gene/L
  • 所屬品牌:
  • 産品類型:
  • 項目來源:IBM
  • 主要用途:生物學高級計算等

基本簡介

2003年,藍色基因的原型機經過三年研發問世,當年11月登上超級計算機“TOP500”第73名。日本NEC公司的“地球模拟機”(Earth Simulator)在三年前曾是世界最快超級計算機,其計算能力達35.867萬億次浮點運算速度,2004年11月被70萬億次浮點運算速度的藍色基因超過。

IBM藍色基因超級計算系統曾經是全球速度最快的超級計算機,代表系統是藍色基因/L(Blue Gene/L)。在全球最著名的超級計算權威機構TOP500榜單上,他的峰值運算速度達到360Teraflops(Linpark基準運算)。IBM的藍色基因/L憑借空前的可持續計算性能,以每秒鐘280.6萬億次浮點運算速度奪得冠軍位置。

架構設計

藍色基因系統是由大量運算節點組成,每個節點的時鐘頻率相對來說都不很快,以節省電力和降低成本。

藍色基因采用IBM PowerPC嵌入式處理器、嵌入式DRAM和系統芯片技術,并整合所有系統功能,其中包括計算處理器、通訊處理器、三層高速緩存,在單一ASIC上有着複雜路徑的多重高速互聯網絡。

因為處理器時鐘周期相比之下速度較為緩慢,因此就時鐘周期而言,内存近似于處理器。這對減少耗電量來說是一項優點,還能将1024個計算節點(内含2顆PowerPC嵌入式處理器)放在單一機架内進行密集封裝。藍色基因可以擴充到65536個計算節點(共計131072顆處理器),其峰值速度可達到367萬億次浮點運算速度,除了成本效益,還有低耗電、冷卻效果好及節省占地面積等特色。

藍色基因是由下列組件構成:每計算節點2個處理器,每計算卡上有2個計算節點、每節點闆上有16張計算卡、每機架有32個節點闆、機架由上下兩部分組成,中間有2個中間平面。

每個處理器在每個周期中可以執行4次浮點運算。依照在藍色基因上所執行應用程序性質的不同,程序設計人員可以選擇在單一運算節點上同時采用兩個處理器進行運算,或是以一個處理器專門處理通信。除了這些運算節點外,藍色基因系統還提供了可彈性決定使用數量的雙處理器I/O(輸入/輸出)節點,這些節點可以處理運算節點和其它系統間的通訊。

藍色基因的計算節點是通過5種網絡來互相連接,這5種網絡分别是:1個3D圓環面網絡,用在計算節點間以點對點的方式傳輸信息;1個總體集合網絡,用于整個應用中的總體運行;1個總體障礙和中斷網絡;1個千兆以太網,用來控制機器;還有另1個千兆以太網,用來連接到其它系統。3D圓環面網絡讓每個節點都能和最近的6個相鄰節點以低延遲時間、高帶寬互連,3D圓環面網絡還支持一般的點對點通訊。圓環面網絡在使用區域通訊的應用程序上特别有效。

總體集合網絡對提高平常使用的MPI總體通訊架構的速度相當有用。而總體障礙網絡能夠迅速地同步化系統内所有處理器的狀态。

藍色基因還需要一個服務節點,在這個節點上系統管理員可以管理儲存資料用的文件服務器。藍色基因還能管理複雜的前端節點,在這些前端節點上終端用戶可以編譯資料并發出工作指令。藍色基因包含了多種設計創新,可以擴展到之前無法到達的性能水平,而且還能将客戶系統的耗電量、散熱量和可用的占用空間限制在合理範圍内。

軟件環境

在軟件環境方面,藍色基因也有特别設計,強調遵守下列三項基本原則:簡單化、高效和廣泛性。在軟件設計時以簡單化的原則進行開發,且能夠利用硬件功能的優勢,既保證高效又兼顧穩定和安全性。而依據熟悉且被廣泛使用的程序語言、資料庫、工作管理工具和并行文件系統所建立的編程和管理環境,客戶将能夠從藍色基因的創新設計要素中獲益,而不用面對陡峭的學習曲線。

藍色基因的前端節點是程序設計人員存取系統運算核心的入口。前端節點執行标準的SUSE SLES9版本Linux,能提供使用者熟悉的操作平台,讓使用者可以在該操作平台上編輯程序、進行程序糾錯等。支持藍色基因系統的語言為用在Power PC上标準的IBM XL Fortran、C和C++編輯器,這些還增加了一個能利用雙浮點運算單元優勢的末端,而這個雙浮點運算單元是藍色基因所獨有的。

程序設計人員可以運用廣受歡迎的IBM工程及科學子程序資料庫(Engineering and Scientific Subroutine Library,ESSL),這是一套最先進的資料庫,收集了超過400個數學子程序,能給Fortran、C或C++等語言所寫成的浮點工程和科學應用程序提供最佳性能。這些程序中有許多都已經調整成适用于藍色基因架構。

為了支持并行編寫程序,藍色基因還一并提供了一套MPI解決方案,這套解決方案可以利用美國Argonne國家實驗室的MPICH2數據庫,可生成一個利用運算節點通訊技術的執行方案。

在工作任務及平衡工作量方面,IBM LoadLeveler對藍色基因也提供支持。LoadLeveler已經過許多大規模集群客戶的考驗,能提供建立、提出和處理工作的設備,其設計是以可用資源來搭配應用程序處理過程中的需求。

藍色基因中還包括了IBM General Parallel File System(一般并行文件系統,GPFS),可以進一步強化藍色基因的軟件環境。GPFS是一個高性能的磁盤共享文件系統,它能從藍色基因的所有節點中提供快速數據存取功能。應用程序可以立即存取使用标準文件系統界面的共享文件,使用者将因此能從數個節點中存取同樣的文件。

藍色基因系統還包括一個讓系統管理員可以管理該系統的服務節點。管理員可使用的重要功能有系統設定、初始化、監督功能和運行。這些功能都已經整合到IBM Cluster Systems Management産品中,以提供額外的管理功能和在單一控制點上,在CSM支持的運行平台間進行管理。能在服務節點上執行的還有一個和DB2相關的數據庫,這個數據庫是靜态和動态狀态的信息儲存點。

總之,藍色基因系統軟件集合了諸多為用戶考慮的因素,這些因素都為了達到高性能和高可靠性而加以調整,并符合許多現有集群客戶所熟悉的特性。在這種情況下,客戶将能夠快速讓藍色基因發揮強大計算能力,還能從藍色基因的結構功能中獲益。

性能

2005年11月,IBM正式向業界宣布,安裝在美國勞倫斯·利弗摩爾國家實驗室的藍色基因/L超級計算機創造了每秒鐘280.6萬億次運算的性能紀錄,峰值速度甚至達到367萬億次。在同月發布的世界超級計算機500強排行榜(TOP500)上,這台機器名列第一名,速度約是第二名的另一台藍色基因的三倍。所以被稱為上世界最快的計算機,IBM藍色基因當之無愧。2005年12月1日,IBM藍色基因的樣機來到中國。

業務

藍色基因計劃在2000年第一次獲得授權時,其目标就是發展能應用于生物分子現象(例如蛋白質折疊)研究的大型并行計算機。這些努力的成果将能通過大量的模拟,對蛋白質折疊的機制有更進一步的了解,此外還能探索在大型并行計算機架構和軟件方面的創新想法。藍色基因所能提供的性能等級能夠大幅度提高模拟的規模,并遠遠超越其它超級計算機。在此規模上,成功的蛋白質折疊模拟研究可望在生物分子仿真的技術、模型和算法上能有更進一步的發展。

諸多不同應用層面的實踐經驗顯示,藍色基因架構适用于各學科間相互關聯的作業。IBM與許多機構正共同努力,擴展藍色基因架構上高性能計算應用的名單,這些應用包括了生命科學、金融模型、流體力學、量子化學、分子動力學、天文學和宇宙研究、材料科學和氣候模型。

應用實踐

1.藍色基因能幫助美國國家大氣研究中心的研究人員建立大氣模型,并且能确保該中心在業内處于領先地位。使用藍色基因系統等超級計算機,美國國家大氣研究中心将能更快地建立模型和分析資料,還能估算引起大氣變化的天然因素和人類活動正如何影響氣候。

2.荷蘭ASTRON是領先的天文學組織。這個組織使用藍色基因作為新型射電望遠鏡的中央處理引擎。這款新型的射電望遠鏡叫做LOFAR,它能夠研究宇宙形成後,最早期的恒星和銀河在萌芽階段的狀況。

3.波士頓大學打算利用藍色基因來設立處理艱深科學問題的主機,這些科學問題包括核物理學、基因學、細胞生物學到宇宙氣候和海洋系統的模型建立。例如,波士頓大學的研究人員打算利用藍色基因來預測太陽表面上的活動(例如太陽耀斑)是如何影響地球的輻射帶、地球的上層大氣層和電離層。當許多科學家和研究人員将大規模集群運算應用到不同的問題組,并在類似計劃發展中建立共同的專業知識時,藍色基因的相關性就變得更加清楚。

模拟貓腦

據PhysOrg網站報道,IBM的研究人員通過一個稱為“藍色項目”的新計算程序繪制了人類大腦内部大腦皮層和皮層下組織節點的系統連接圖。然後這個研究團隊建立了貓的大腦皮層模拟機構,其中包括10億腦細胞和10兆認知神經元突觸,信息的傳遞和連接就在這些神經元中間進行。貓腦數字模型的運行速度相當于真貓大腦實際運行速度的1/100。

2007年06月,根據科技新聞社區Slashdot援引IBM工程師Eric Van Hensbergen的消息,Plan 9操作系統成功運行于IBM的藍色基因(Blue Gene)超級計算機。

模拟人腦

據TED(網易公開課)報道,藍色基因也在模拟人腦。

應用範圍

來自美國消息,就在幾天以前IBM公司的BlueGene/L超級計算機創下了每秒鐘70萬億次的世界記錄,周一IBM公司制造商用藍色BlueGene(藍色基因)超級計算機系統,面向商業和科研用戶

IBM旗下eServer部門的副總裁ColinParris表示,該系統的推出使得IBM商用計算機系統的性能跨上了一個台階。在過去幾年,IBM一直和其合作夥伴緻力于BlueGene計算系統适合處理不同的科研計算任務,涉及的領域包括生命科學、金融建模、流體力學、量子化學、天文學、氣象建模以及分子動力學。

此外,IBM還緻力于将Blue Gene計算系統應用于更廣泛的商業應用包括網格計算、商業智能、制造流程等等。

IBM耗費了5年的時間以及1億美元的成本才開發出了Blue Gene超級計算機系統。

相關詞條

相關搜索

其它詞條