Selene

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук
Selene logo.png

Selene - NVIDIA DGX A100, AMD EPYC 7742 64C 2.25GHZ, NVIDIA A100, MELLANOX HDR INFINIBAND.

Суперкомп’ютер, розроблений компанією Nvidia, здатний досягати 63 460 петафлопсів, займаючи п’яте місце серед найшвидших суперкомп’ютерів у світі, коли він входив до списку. Selene базується на системі Nvidia DGX, що складається з процесорів AMD, графічних процесорів Nvidia A100 і мережі Mellanox HDDR. Selene базується на Nvidia DGX Superpod, високопродуктивному готовому суперкомп’ютерному рішенні, наданому Nvidia з використанням обладнання DGX. DGX Superpod — це тісно інтегрована система, яка поєднує високопродуктивні обчислювальні вузли DGX із швидким сховищем даних і високою пропускною здатністю мережі. Він має на меті забезпечити готове рішення для високих попитів на навантаження машинного навчання. Selene була створена за три місяці, і вона є найшвидшою промисловою системою в США, а також другою за енергоефективністю суперкомп’ютерною системою в історії.

Характеристики

Selene types.jpeg
Назва Selene
Дата початку розробки 2018-ий рік
Дата запуску 2020-ий рік
Виробник Nvidia, Mellanox, AMD
Країна USA
Архітектура 555 520 ядер, AMD EPYC 7742 64C 2.25GHz
Потужність 2 646 kW
Обчислювальна потужність 63.46 PFlop/s, 79.22 PFlop/s (теоретично максимальна)
Операційна система Ubuntu 20.04.1 LTS

Архітектура

Selene, що використовує 1080 процесорів AMD Epyc і 4320 графічних процесорів A100, використовується для навчання BERT, процесора природної мови, менш ніж за 16 секунд, що зазвичай займає в більшості невеликих систем близько 20 хвилин. IEEE Spectrum повідомила, що станом на грудень 2021 року серед усіх комерційно доступних суперкомп’ютерних систем Selene перевершила всі результати тесту MLPerf, який є тестом, розробленим консорціумом розробників штучного інтелекту з академічних кіл, дослідницьких лабораторій і промисловості з метою неупередженого оцінити ефективність навчання та висновків для апаратного забезпечення, програмного забезпечення та послуг, які використовуються для ШІ(Штучного Інтелекту).

Призначення

Selene arch.png

Вирішення проблеми великомасштабної багатовузлової інфраструктури штучного інтелекту NVIDIA DGX SuperPOD розроблено для забезпечення неперевершеного рівня багатосистемного навчання. Традиційні великі обчислювальні кластери обмежені складністю масштабування зв’язків між GPU, оскільки конфігурації стають більшими, а обчислення розпаралелюються на все більшій кількості вузлів. Це призводить до зниження продуктивності. DGX SuperPOD вирішує цю проблему масштабування, оптимізуючи кожен компонент у системі відповідно до унікальних вимог багатовузлової інфраструктури ШІ. Використовуючи цю архітектуру, NVIDIA створила один із найшвидших і найбільш енергоефективних суперкомп’ютерів у світі Selene, який постійно займає перше місце в списках TOP500 і Green500 і встановлює численні рекорди MLPerf.

Повний життєвий цикл досвіду за підтримки NVIDIA Підприємствам потрібен не лише архітектурний дизайн, а швидший шлях до того, щоб зробити прискорену обчислювальну інфраструктуру корисною для свого бізнесу. Їм потрібен готовий, швидкий і оптимізований для ІТ-середовища досвід впровадження, щоб спеціалісти з обробки даних могли працювати з першого дня та продовжувати вдосконалюватися з часом. Завдяки NVIDIA DGX SuperPOD підприємства отримують переваги від повного життєвого циклу професійних послуг, які охоплюють усе: від встановлення до керування інфраструктурою, масштабування робочих навантажень і спрощеного штучного інтелекту. І згідно з обіцянками DGX SuperPOD, він постійно покращується. Інженери NVIDIA постійно впроваджують інновації та оновлюють програмне забезпечення, на якому працює DGX SuperPOD, тому кожна система працює швидше, ніж у день її введення в експлуатацію.

Цікаві факти

  • За ~3.33 хвилини надає персоналізовані результати в орієнтованих на користувачів службах, таких як соціальні мережі або веб-сайти електронної комерції, завдяки розумінню взаємодії між користувачами та елементами послуг, як-от продукти чи оголошення
  • Обробка природної мови за менш ніж 1 хвилину: Розуміє текст, використовуючи зв’язок між різними словами в блоці тексту. Дозволяє відповідати на запитання, перефразувати речення та багато інших випадків використання, пов’язаних із мовою
  • Повторюючий переклад за 0.71 хвилину: Перекладає текст з однієї мови на іншу за допомогою рекурентної нейронної мережі.
  • Класифікація зображення за 0.76 хвилин: Надає вхідному зображенню мітку з фіксованого набору категорій, тобто застосовується до завдань комп'ютерного зору, таких як автономні транспортні засоби.

Джерела