Відмінності між версіями «Blue Gene/L»

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук
Рядок 6: Рядок 6:
 
==Основні характеристики==
 
==Основні характеристики==
  
'''Суперкомп'ютер Blue Gene/L''' був унікальним у наступних аспектах:
+
  '''Суперкомп'ютер Blue Gene/L''' був унікальним у наступних аспектах:
  
 
•Заміна швидкості процесорів для зниження енергоспоживання. Blue Gene/L використовує низькочастотні та малопотужні вбудовані ядра PowerPC з прискореним обчисленням операцій з плаваючою комою. Хоча продуктивність кожного чипа відносно низька, система досягає більш високої продуктивності з меншим енергоспоживанням, просто використовуючи більше число вузлів.  
 
•Заміна швидкості процесорів для зниження енергоспоживання. Blue Gene/L використовує низькочастотні та малопотужні вбудовані ядра PowerPC з прискореним обчисленням операцій з плаваючою комою. Хоча продуктивність кожного чипа відносно низька, система досягає більш високої продуктивності з меншим енергоспоживанням, просто використовуючи більше число вузлів.  

Версія за 17:22, 23 травня 2024

Короткі відомості

 Blue Gene/L — це перший комп’ютер серії IBM Blue Gene, розроблений спільно з Ліверморською національною лабораторією. Його теоретична пікова продуктивність становить 360 терафлопс, а реальна продуктивність, отримана під час тесту Linpack, близько 280 терафлопс. Після оновлення в 2007 році реальна продуктивність збільшилася до 478 терафлопс при піковій продуктивності в 596 терафлопс. Blue Gene/C є підмножиною для архітектури Cyclops64.

У листопаді 2006 року 27 комп’ютерів зі списку TOP500 мали архітектуру Blue Gene/L.

Основні характеристики

  Суперкомп'ютер Blue Gene/L був унікальним у наступних аспектах:

•Заміна швидкості процесорів для зниження енергоспоживання. Blue Gene/L використовує низькочастотні та малопотужні вбудовані ядра PowerPC з прискореним обчисленням операцій з плаваючою комою. Хоча продуктивність кожного чипа відносно низька, система досягає більш високої продуктивності з меншим енергоспоживанням, просто використовуючи більше число вузлів.

•Два процесори на вузол з двома режимами роботи:

•Режим співпроцесора, в якому один процесор обробляє обчислення, а інший обробляє повідомлення;

•Режим віртуальних вузлів, в якому обидва процесори доступні для запуску користувацького коду, але вони або спільно обчислюють, або обробляють повідомлення.

•Архітектура system-on-a-chip. Усі вузли-компоненти системи вбудовані в один чип, за винятком 512 Мб зовнішньої DRAM.

•Велика кількість вузлів (масштабована з кроком 1024 до, щонайменше, 65 536).

•Зв'язок компонентів у вигляді тривимірного тора з допоміжною мережею для глобальних комунікацій (трансляцій та скорочень), вводу/виводу та управління.

•Полегшена ОС на вузол для мінімальних накладних витрат системи (системні шуми).

Архітектура

 Blue Gene/L архітектура — це еволюція QCDSP- і QCDOC-архітектур. Кожен вузол Blue Gene/L, обчислювальний чи вводу/виводу, складається з однієї ASIC (інтегральна схема спеціального призначення) та DRAM пам'яті. ASIC оснащена двома 700 МГц процесорами PowerPC 440 з двоканальними FPU (математичними співпроцесорами) подвійної точності, кэш-пам'яттю, контролером DRAM і логікою для підтримки кількох комунікаційних підсистем. Теоретична пікова продуктивність кожного вузла — 5,6 Гфлопс.

На обчислювальній карті розміщуються два вузли, на платі — 16 карт плюс до 2 вузлів вводу/виводу. Одна стійка вміщує до 32 плат. Вузли споживають близько 17 Вт (включаючи DRAM), що дозволяє розмістити до 1024 обчислювальних вузлів у стандартній 19-дюймовій стійці з електроживленням і повітряним охолодженням. Це забезпечує високу ефективність за флопс на ват, квадратний метр і вартість. Система може ізолювати несправні компоненти для продовження роботи.

Кожен вузол Blue Gene/L підключений до трьох мереж зв'язку:

 1.3D-тороїдальна мережа P2P між обчислювальними вузлами,
 2.Загальна мережа для колективних операцій (трансакцій та редукцій),
 3.Глобальна мережа переривань для швидкої синхронізації.

Вузли вводу/виводу з ОС Linux забезпечують зв'язок з хранилищем і зовнішніми вузлами через Ethernet. Вони також обробляють файлові операції обчислювальних вузлів. Окремі Ethernet мережі забезпечують доступ до будь-якого вузла для конфігурації, завантаження та діагностики.

Для одночасного запуску кількох програм система ділиться на електронно-ізольовані розділи вузлів. Кількість вузлів у розділі повинна бути кратною степені 2, як мінімум 32 вузли. Програма завантажується і запускається на всіх вузлах розділу, після завершення вузли звільняються для наступних програм.