Суперкомп'ютер Blue Gene/P i бiологiя.
Blue Gene/P
26 червня 2007 IBM представила Blue Gene/P, друге покоління суперкомп'ютерів Blue Gene. Розроблений для роботи з піковою продуктивністю в 1 петафлопс. Blue Gene/P може бути налаштований для досягнення пікової продуктивності більш, ніж 3 петафлопса. Крім того, він у сім разів більш енергетично ефективний ніж будь-які інші суперкомп'ютери. Blue Gene/P виконаний з використанням великої кількості невеликих, малопотужних чипів, що зв'язуються через п'ять спеціалізованих мереж.
Архітектура
Кожен чип Blue Gene/P складається з чотирьох процесорних ядер PowerPC 450 з тактовою частотою 850 МГц. Чип, 2 або 4 ГБ оперативної пам'яті і мережеві інтерфейси утворюють обчислювальний вузол суперкомп'ютера. 32 обчислювальних вузла об'єднуються в карту (Compute Node card), до якої можна під'єднати від 0 до 2 вузлів вводу-виводу. Системна стійка вміщує в себе 32 таких карти.
Конфігурація Blue Gene/P з піковою продуктивністю 1 петафлопс являє собою 72 системні стійки, містять 294,912 процесорних ядер, об'єднаних в високошвидкісну оптичну мережу. Конфігурація Blue Gene/P може бути розширена до 216 стійок із загальним числом процесорних ядер 884,736, щоб досягти пікову продуктивність в 3 петафлопса. У стандартній конфігурації системна стійка Blue Gene/P містить 4,096 процесорних ядер.
Опис обчислювального комплексу
- 1024 чотириядерних обчислювальних вузла в кожній з стійок - 16 вузлів вводу-виводу в стійці (у поточній конфігурації активні 8, тобто одна I/O-карта на 128 обчислювальних вузлів) - виділені комунікаційні мережі для міжпроцесорних обмінів та глобальних операцій - програмування з використанням MPI, OpenMP / pthreads, POSIX I/O - висока енергоефективність: ~ 372 MFlops / W (див. список Green500) - система повітряного охолодження
Стійка (rack, cabinet) складається з двох midplane'ів. У midplane входить 16 node-карт (compute node card), на кожній з яких встановлено 32 обчислювальних вузла (compute card). Midplane, 8 x 8 x 8 = 512 обчислювальних вузлів, — мінімальний розділ, на якому стає доступна топологія тривимірного тора; для розділів менших розмірів використовується топологія тривимірної решітки. Node-карта може містити до двох вузлів вводу-виводу (I/O card). Обчислювальний вузол включає в себе чотирьохядерний процесор, 2 ГБ спільної пам'яті і мережеві інтерфейси.
Мікропроцесорне ядро
- модель: PowerPC 450 - робоча частота: 850 MHz - адресація: 32-бітна - кеш інструкцій 1-го рівня (L1 instruction): 32 KB - кеш даних 1-го рівня (L1 data): 32 KB - кеш 2-го рівня (L2): 14 потоків попередньої вибірки (stream prefetching): 14 x 256 байтів - два блоки 64-бітної арифметики з плаваючою точкою (Floating Point Unit, FPU), кожен з яких може видавати за один такт результат суміщеної операції множення-складання (Fused Multiply-Add, FMA) - пікова продуктивність: 2 FPU x 2 FMA x 850 MHz = 3,4 GFlop / sec per core