WikiDer > Nvidia DGX
Nvidia DGX это линия Nvidia произведены серверы и рабочие станции, специализирующиеся на использовании ГПГПУ ускоряться глубокое обучение Приложения.
DGX-1
Количество серверов DGX-1 8 GPU на основе Паскаль или Вольта дочерние карты[1] с HBM 2 память, связанная NVLink ячеистая сеть.[2]
Линия продуктов призвана ликвидировать разрыв между графическими процессорами и Ускорители ИИ в том, что устройство имеет особые функции, предназначенные для рабочих нагрузок глубокого обучения.[3] Первоначальный DGX-1 на базе Pascal имел 170 терафлопс из половинная точность обработка[4] в то время как обновление на основе Volta увеличило это до 960 терафлопс.[5]
DGX-2
Преемником Nvidia DGX-1 является Nvidia DGX-2, который использует 16 карт 32 ГБ V100 (второго поколения) в одном устройстве. Это увеличивает производительность до 2 Петафлопс с 512 ГБ общей памяти для решения более серьезных проблем и использует NVSwitch для ускорения внутренней связи.
Кроме того, существует версия DGX-2 с более высокой производительностью, DGX-2H, с заметной разницей, заключающейся в замене Dual Intel Xeon Platinum 8168 @ 2,7 ГГц на Dual Intel Xeon Platinum 8174 @ 3,1 ГГц.[6]
DGX A100
14 мая 2020 года было объявлено и выпущено 3-е поколение серверов DGX, включая 8 Амперна базе ускорителей А100.[7] Также включено 15 ТБ PCIe поколение 4 NVMe место хранения,[8] два 64-ядерных AMD Рим 7742 процессора, 1 ТБ оперативной памяти и Mellanox-питание межблочного соединения HDR InfiniBand. Начальная цена на DGX A100 составляла 199 000 долларов.[7]
Ускорители
Сравнение ускорителей, используемых в DGX:[7]
Ускоритель |
---|
A100 |
V100 |
P100 |
Архитектура | Ядра CUDA FP32 | Boost Clock | Часы памяти | Ширина шины памяти | Пропускная способность памяти | VRAM | Одинарная точность | Двойная точность | INT8 Тензор | FP16 Тензор | FP32 Тензор | Соединить | GPU | Размер кристалла графического процессора | Количество транзисторов | TDP | Производственный процесс |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Ампер | 6912 | ~ 1410 МГц | 2,4 Гбит / с HBM2 | 5120 бит | 1,6 ТБ / сек | 40 ГБ | 19,5 терафлопс | 9.7 терафлопс | 624 терафлопс | 312 терафлопс | 156 терафлопс | 600 ГБ / сек | A100 | 826 мм2 | 54,2B | 400 Вт | TSMC 7N |
Вольта | 5120 | 1530 МГц | 1,75 Гбит / с HBM2 | 4096 бит | 900 ГБ / сек | 16 ГБ / 32 ГБ | 15.7 терафлопс | 7,8 терафлопс | Нет данных | 125 терафлопс | Нет данных | 300 ГБ / сек | GV100 | 815 мм2 | 21,1B | 300 Вт / 350 Вт | TSMC 12 нм FFN |
Паскаль | 3584 | 1480 МГц | 1,4 Гбит / с HBM2 | 4096 бит | 720 ГБ / сек | 16 ГБ | 10.6 терафлопс | 5.3 TFLOP | Нет данных | Нет данных | Нет данных | 160 ГБ / сек | GP100 | 610 мм2 | 15.3B | 300 Вт | TSMC 16 нм FinFET |
Смотрите также
Рекомендации
- ^ "nvidia dgx-1" (PDF).
- ^ "внутри паскаль".
Гибридная кубическая сетчатая архитектура с восемью графическими процессорами и NVLink
- ^ "суперкомпьютер глубокого обучения".
- ^ «Система глубокого обучения DGX-1» (PDF).
NVIDIA DGX-1 обеспечивает в 75 раз более быстрое обучение ... Примечание: тест Caffe с AlexNet, обучение 1,28 млн изображений с 90 эпохами
- ^ «Сервер DGX». Сервер DGX. Nvidia. Получено 7 сентября 2017.
- ^ https://docs.nvidia.com/dgx/pdf/dgx2-user-guide.pdf
- ^ а б c Райан Смит (14 мая 2020 г.). «NVIDIA Ampere Unleashed: NVIDIA анонсирует новую архитектуру графического процессора, графический процессор A100 и ускоритель». AnandTech.
- ^ Том Уоррен; Джеймс Винсент (14 мая 2020 г.). «Первый графический процессор Ampere от Nvidia предназначен для центров обработки данных и искусственного интеллекта, а не для вашего ПК». Грань.
Эта статья о вычислительной технике заглушка. Вы можете помочь Википедии расширяя это. |