Відмінності між версіями «Суперкомп'ютер Blue Gene/P i бiологiя.»

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук
(Створена сторінка: == '''Blue Gene/P''' == 26 червня 2007 IBM представила Blue Gene/P, друге покоління суперкомп'ютерів Blue Gene. Р...)
 
Рядок 4: Рядок 4:
 
== '''Архітектура''' ==
 
== '''Архітектура''' ==
 
Кожен чип Blue Gene/P складається з чотирьох процесорних ядер PowerPC 450 з тактовою частотою 850 МГц. Чип, 2 або 4 ГБ оперативної пам'яті і мережеві інтерфейси утворюють обчислювальний вузол суперкомп'ютера. 32 обчислювальних вузла об'єднуються в карту (Compute Node card), до якої можна під'єднати від 0 до 2 вузлів вводу-виводу. Системна стійка вміщує в себе 32 таких карти.
 
Кожен чип Blue Gene/P складається з чотирьох процесорних ядер PowerPC 450 з тактовою частотою 850 МГц. Чип, 2 або 4 ГБ оперативної пам'яті і мережеві інтерфейси утворюють обчислювальний вузол суперкомп'ютера. 32 обчислювальних вузла об'єднуються в карту (Compute Node card), до якої можна під'єднати від 0 до 2 вузлів вводу-виводу. Системна стійка вміщує в себе 32 таких карти.
 
 
Конфігурація Blue Gene/P з піковою продуктивністю 1 петафлопс являє собою 72 системні стійки, містять 294,912 процесорних ядер, об'єднаних в високошвидкісну оптичну мережу. Конфігурація Blue Gene/P може бути розширена до 216 стійок із загальним числом процесорних ядер 884,736, щоб досягти пікову продуктивність в 3 петафлопса. У стандартній конфігурації системна стійка Blue Gene/P містить 4,096 процесорних ядер.  
 
Конфігурація Blue Gene/P з піковою продуктивністю 1 петафлопс являє собою 72 системні стійки, містять 294,912 процесорних ядер, об'єднаних в високошвидкісну оптичну мережу. Конфігурація Blue Gene/P може бути розширена до 216 стійок із загальним числом процесорних ядер 884,736, щоб досягти пікову продуктивність в 3 петафлопса. У стандартній конфігурації системна стійка Blue Gene/P містить 4,096 процесорних ядер.  
  
 
== '''Опис обчислювального комплексу''' ==
 
== '''Опис обчислювального комплексу''' ==
  - 1024 чотириядерних обчислювальних вузла в кожній з стійок
+
  - 1024 чотириядерних обчислювальних вузла в кожній з стійок
  - 16 вузлів вводу-виводу в стійці (у поточній конфігурації активні 8, тобто одна I/O-карта на 128 обчислювальних вузлів)
+
  - 16 вузлів вводу-виводу в стійці (у поточній конфігурації активні 8, тобто одна I/O-карта на 128 обчислювальних вузлів)
  - виділені комунікаційні мережі для міжпроцесорних обмінів та глобальних операцій
+
  - виділені комунікаційні мережі для міжпроцесорних обмінів та глобальних операцій
  - програмування з використанням MPI, OpenMP / pthreads, POSIX I/O
+
  - програмування з використанням MPI, OpenMP / pthreads, POSIX I/O
  - висока енергоефективність: ~ 372 MFlops / W (див. список Green500)
+
  - висока енергоефективність: ~ 372 MFlops / W (див. список Green500)
  - система повітряного охолодження
+
  - система повітряного охолодження
 
Стійка (rack, cabinet) складається з двох midplane'ів. У midplane входить 16 node-карт (compute node card), на кожній з яких встановлено 32 обчислювальних вузла (compute card). Midplane, 8 x 8 x 8 = 512 обчислювальних вузлів, — мінімальний розділ, на якому стає доступна топологія тривимірного тора; для розділів менших розмірів використовується топологія тривимірної решітки. Node-карта може містити до двох вузлів вводу-виводу (I/O card). Обчислювальний вузол включає в себе чотирьохядерний процесор, 2 ГБ спільної пам'яті і мережеві інтерфейси.
 
Стійка (rack, cabinet) складається з двох midplane'ів. У midplane входить 16 node-карт (compute node card), на кожній з яких встановлено 32 обчислювальних вузла (compute card). Midplane, 8 x 8 x 8 = 512 обчислювальних вузлів, — мінімальний розділ, на якому стає доступна топологія тривимірного тора; для розділів менших розмірів використовується топологія тривимірної решітки. Node-карта може містити до двох вузлів вводу-виводу (I/O card). Обчислювальний вузол включає в себе чотирьохядерний процесор, 2 ГБ спільної пам'яті і мережеві інтерфейси.
 
  
 
==== '''''Мікропроцесорне ядро''''' ====
 
==== '''''Мікропроцесорне ядро''''' ====
  - модель: PowerPC 450
+
  - модель: PowerPC 450
  - робоча частота: 850 MHz
+
  - робоча частота: 850 MHz
  - адресація: 32-бітна
+
  - адресація: 32-бітна
  - кеш інструкцій 1-го рівня (L1 instruction): 32 KB
+
  - кеш інструкцій 1-го рівня (L1 instruction): 32 KB
  - кеш даних 1-го рівня (L1 data): 32 KB
+
  - кеш даних 1-го рівня (L1 data): 32 KB
  - кеш 2-го рівня (L2): 14 потоків попередньої вибірки (stream prefetching): 14 x 256 байтів
+
  - кеш 2-го рівня (L2): 14 потоків попередньої вибірки (stream prefetching): 14 x 256 байтів
  - два блоки 64-бітної арифметики з плаваючою точкою (Floating Point Unit, FPU), кожен з яких може видавати за один такт результат суміщеної операції     
+
  - два блоки 64-бітної арифметики з плаваючою точкою (Floating Point Unit, FPU), кожен з яких може видавати за один такт результат суміщеної операції     
    множення-складання (Fused Multiply-Add, FMA)
+
    множення-складання (Fused Multiply-Add, FMA)
  - пікова продуктивність: 2 FPU x 2 FMA x 850 MHz = 3,4 GFlop / sec per core
+
  - пікова продуктивність: 2 FPU x 2 FMA x 850 MHz = 3,4 GFlop / sec per core
 +
 
 +
==== '''''Обчислювальні вузли''''' ====
 +
Обчислювальні вузли та I/O-карти в апаратній сенсі невиразні і є взаємозамінними, різниця між ними полягає лише в способі їх використання. У них немає локальної файлової системи, тому всі операції введення-виведення перенаправляються зовнішніх пристроїв.
 +
 +
==== '''''Обчислювальні вузол''''' ====
 +
  - чотири мікропроцесорних ядра PowerPC 450 (4-way SMP)
 +
  - пікова продуктивність: 4 cores x 3,4 GFlop / sec per core = 13,6 GFlop / sec
 +
  - пропускна здатність пам'яті: 13,6 GB / sec
 +
  - 2 ГБ загальної пам'яті
 +
  - 2 x 4 МБ кеш-пам'яті третього рівня (L3)
 +
  - легковаге ядро (compute node kernel, CNK), що являє собою Linux-подібну операційну систему, що підтримує значне підмножина Linux-сумісних системних       
 +
    викликів
 +
  - асинхронні операції міжпроцесорних обмінів (виконуються паралельно з обчисленнями)
 +
  - операції введення-виведення перенаправляються I/O-картками через мережу колективних операцій
 +
 
 +
== '''Моделювання мозку''' ==
 +
У 2009 році спільне підприємство по IBM і Стенфордського університету змоделювали кору головного мозку кішки за допомогою суперкомп'ютера Blue Gene / IP. Вони змоделювали 1% від функціонування людського мозку в тому ж році. Повний рендеринг і моделювання роботи людського мозку, буде показано за допомогою суперкомп'ютера. Для чого моделювати мозок? Щоб зрозуміти, як працює ця частина тіла, як передаються повідомлення, як зберігаються спогади і т.д. Психологи зможуть зрозуміти, чому виникають деякі психічні стани, і яка частина мозку на це впливає. Мозок людини є найбільш широко використовуваної частиною тіла, але про нього дуже мало що відомо, і подолання цього розриву, є одним з ключових робіт суперкомп'ютерів.

Версія за 21:44, 27 грудня 2018

Blue Gene/P

26 червня 2007 IBM представила Blue Gene/P, друге покоління суперкомп'ютерів Blue Gene. Розроблений для роботи з піковою продуктивністю в 1 петафлопс. Blue Gene/P може бути налаштований для досягнення пікової продуктивності більш, ніж 3 петафлопса. Крім того, він у сім разів більш енергетично ефективний ніж будь-які інші суперкомп'ютери. Blue Gene/P виконаний з використанням великої кількості невеликих, малопотужних чипів, що зв'язуються через п'ять спеціалізованих мереж.

Архітектура

Кожен чип Blue Gene/P складається з чотирьох процесорних ядер PowerPC 450 з тактовою частотою 850 МГц. Чип, 2 або 4 ГБ оперативної пам'яті і мережеві інтерфейси утворюють обчислювальний вузол суперкомп'ютера. 32 обчислювальних вузла об'єднуються в карту (Compute Node card), до якої можна під'єднати від 0 до 2 вузлів вводу-виводу. Системна стійка вміщує в себе 32 таких карти. Конфігурація Blue Gene/P з піковою продуктивністю 1 петафлопс являє собою 72 системні стійки, містять 294,912 процесорних ядер, об'єднаних в високошвидкісну оптичну мережу. Конфігурація Blue Gene/P може бути розширена до 216 стійок із загальним числом процесорних ядер 884,736, щоб досягти пікову продуктивність в 3 петафлопса. У стандартній конфігурації системна стійка Blue Gene/P містить 4,096 процесорних ядер.

Опис обчислювального комплексу

 - 1024 чотириядерних обчислювальних вузла в кожній з стійок
 - 16 вузлів вводу-виводу в стійці (у поточній конфігурації активні 8, тобто одна I/O-карта на 128 обчислювальних вузлів)
 - виділені комунікаційні мережі для міжпроцесорних обмінів та глобальних операцій
 - програмування з використанням MPI, OpenMP / pthreads, POSIX I/O
 - висока енергоефективність: ~ 372 MFlops / W (див. список Green500)
 - система повітряного охолодження

Стійка (rack, cabinet) складається з двох midplane'ів. У midplane входить 16 node-карт (compute node card), на кожній з яких встановлено 32 обчислювальних вузла (compute card). Midplane, 8 x 8 x 8 = 512 обчислювальних вузлів, — мінімальний розділ, на якому стає доступна топологія тривимірного тора; для розділів менших розмірів використовується топологія тривимірної решітки. Node-карта може містити до двох вузлів вводу-виводу (I/O card). Обчислювальний вузол включає в себе чотирьохядерний процесор, 2 ГБ спільної пам'яті і мережеві інтерфейси.

Мікропроцесорне ядро

 - модель: PowerPC 450
 - робоча частота: 850 MHz
 - адресація: 32-бітна
 - кеш інструкцій 1-го рівня (L1 instruction): 32 KB
 - кеш даних 1-го рівня (L1 data): 32 KB
 - кеш 2-го рівня (L2): 14 потоків попередньої вибірки (stream prefetching): 14 x 256 байтів
 - два блоки 64-бітної арифметики з плаваючою точкою (Floating Point Unit, FPU), кожен з яких може видавати за один такт результат суміщеної операції     
   множення-складання (Fused Multiply-Add, FMA)
 - пікова продуктивність: 2 FPU x 2 FMA x 850 MHz = 3,4 GFlop / sec per core

Обчислювальні вузли

Обчислювальні вузли та I/O-карти в апаратній сенсі невиразні і є взаємозамінними, різниця між ними полягає лише в способі їх використання. У них немає локальної файлової системи, тому всі операції введення-виведення перенаправляються зовнішніх пристроїв.

Обчислювальні вузол

 - чотири мікропроцесорних ядра PowerPC 450 (4-way SMP)
 - пікова продуктивність: 4 cores x 3,4 GFlop / sec per core = 13,6 GFlop / sec
 - пропускна здатність пам'яті: 13,6 GB / sec
 - 2 ГБ загальної пам'яті
 - 2 x 4 МБ кеш-пам'яті третього рівня (L3)
 - легковаге ядро (compute node kernel, CNK), що являє собою Linux-подібну операційну систему, що підтримує значне підмножина Linux-сумісних системних         
   викликів
 - асинхронні операції міжпроцесорних обмінів (виконуються паралельно з обчисленнями)
 - операції введення-виведення перенаправляються I/O-картками через мережу колективних операцій

Моделювання мозку

У 2009 році спільне підприємство по IBM і Стенфордського університету змоделювали кору головного мозку кішки за допомогою суперкомп'ютера Blue Gene / IP. Вони змоделювали 1% від функціонування людського мозку в тому ж році. Повний рендеринг і моделювання роботи людського мозку, буде показано за допомогою суперкомп'ютера. Для чого моделювати мозок? Щоб зрозуміти, як працює ця частина тіла, як передаються повідомлення, як зберігаються спогади і т.д. Психологи зможуть зрозуміти, чому виникають деякі психічні стани, і яка частина мозку на це впливає. Мозок людини є найбільш широко використовуваної частиною тіла, але про нього дуже мало що відомо, і подолання цього розриву, є одним з ключових робіт суперкомп'ютерів.