NVIDIA Tesla P100

Ускоритель Tesla P100, основанный на новой архитектуре NVIDIA Pascal с пятью передовыми технологиями, обеспечивает несравненную производительность и экономичность для самых ресурсоемких приложений.

Пять архитектурных прорывов

TeslaP100 обеспечивает беспрецедентную производительность, масштабируемость и эффективность программирования благодаря использованию пяти прогрессивных технологий:

  • Архитектура NVIDIAPascal для экспоненциального роста производительности TeslaP100 на базе архитектуры Pascal повышает скорость обучений нейронных сетей в 12 раз по сравнению с решениями на базе архитектуры прошлого поколения NVIDIAMaxwell™.

  • NVIDIA NVLink для максимальной масштабируемости приложений NVIDIA NVLink , высокоскоростной интерфейс для связи между несколькими графическими процессорами, распределяет нагрузку между GPU, увеличивая пропускную способность в 5 раз по сравнению с лучшими на сегодня решениями в данном классе.1NVLink позволяет связать до восьми GPUTeslaP100, максимально повышая производительность в узле. IBM уже внедрила NVLink в свои процессоры POWER8 для высокоскоростной коммуникации между CPU и GPU.

  • 16нм FinFET для высокой энергоэффективности – Обладая 15.3 млрд. транзисторов, построенных на базе 16нм процесса FinFET, графический процессор Pascal является крупнейшим в мире FinFET чипом.2 Он создан, чтобы обеспечить высочайшую производительность и энергоэффективность для нагрузок с практически неограниченными вычислительными требованиями.

  • CoWoS с HBM2 для больших нагрузок – архитектура Pascal объединяет процессор и данные в одном пакете, чтобы максимально повысить эффективность вычислений. Инновационный подход к строению памяти, Chip-on-Wafer-on-Substrate (CoWoS) с HBM2, повышает пропускную способность памяти в 3 раза, до 720ГБ/с, по сравнению с архитектурой Maxwell.

  • Новые алгоритмы искусственного интеллекта для пиковой производительности – новые инструкции половинной точности обеспечивают пиковую производительность свыше 21 терафлопса в задачах глубокого обучения.

Графический ускоритель TeslaP100 поднимает на новый уровень производительность в ряде приложений высокопроизводительных вычислений и глубокого обучения, включая приложение молекулярной динамики AMBER, которое работает быстрее на 1-ом серверном узле с графическими процессорами TeslaP100, чем на 48 двухсокетных серверных узлах. Для обучения популярной глубокой нейронной сети AlexNet потребуется 250 двухсокетных серверных узлов, чтобы достичь производительности восьми GPUTeslaP100.

TeslaP100 - первый ускоритель со скоростью вычислений двойной и одинарной точности в 5 и 10 терафлопс соответственно – это огромный шаг вперед в скорости обработки данных и ускорении открытий в широком спектре областей.

 

NVIDIA DGX-1

Система глубокого обучения NVIDIADGX-1 построена на базе графических процессоров NVIDIATesla® P100, основанных на архитектуре NVIDIAPascal™. Это законченное, полностью готовое к использованию решение, которое обеспечивает скорость обработки, сравнимую с 250 серверами на базе CPU.

Среди других передовых технологий, которые обеспечивают максимальную производительность и простоту использования NVIDIADGX-1, - высокоскоростной интерфейс NVIDIA NVLink для максимальной масштабируемости приложений;16нм процесс производства FinFET для высокой энергоэффективности; технология Chip-on-Wafer-on-Substrate с HBM2 для работы с большими объемами данных; а также новые инструкции половинной точности, которые обеспечивают более 21 терафлопса пиковой производительности в задачах глубокого обучения.

Система NVIDIADGX-1 включает полный набор программ, оптимизированных для глубокого обучения, который позволяет ученым и исследователям в области данных легко и быстро обучать глубокие нейронные сети.

В набор ПО DGX-1 входит NVIDIA Deep Learning GPU Training System (DIGITS™), полноценная интерактивная система для создания глубоких нейронных сетей (DNN), а также GPU-ускоряемая библиотека примитивов для создания DNN - NVIDIA CUDA® Deep Neural Network (cuDNN) версии 5.

Помимо этого, система включает оптимизированные версии нескольких широко используемых фреймворков глубокого обучения— Caffe, Theano и Torch. DGX-1 дополнительно предоставляет доступ к облачным инструментам управления, обновлениям ПО и банку приложений-контейнеров.