NVIDIA DGX Cloud нацелена на генеративный ИИ
Содержание
Суперкомпьютер NVIDIA в облаке предоставляет полноценную платформу для разработки ИИ
NVIDIA DGX Cloud — это ИИ-суперкомпьютер в облаке, разработанный для корпоративных пользователей с высокими требованиями и глубокими карманами. Это предложение включает в себя полный пакет программного и аппаратного обеспечения для крупномасштабной разработки ИИ, доступный через веб-браузер.
DGX Cloud предоставляет предприятиям возможность обучать современные рабочие нагрузки ИИ, такие как генеративный ИИ и большие языковые модели, говорит Чарли Бойл, вице-президент NVIDIA по платформам DGX. Он объединяет набор инструментов для разработчика ИИ, программное обеспечение для рабочего процесса, высокопроизводительную инфраструктуру, прямой доступ к экспертам по ИИ от NVIDIA и круглосуточную поддержку.
Влияние генеративного ИИ на рынок
Появление генеративного ИИ вызвало быстрый рост спроса на продукты и услуги на основе ИИ. В результате компании стремятся приобрести необходимые навыки и инфраструктуру для использования ИИ в процессах разработки продуктов и бизнес-операциях. С помощью DGX Cloud предприятия могут получить почти мгновенный доступ к суперкомпьютерной среде полного стека ИИ, не беспокоясь о совместимости программного обеспечения, оптимизации, пространстве в дата-центре, электроэнергии, охлаждении или о необходимых знаниях для установки и обслуживания кластера суперкомпьютеров, говорит Бойл. "Это позволяет им сосредоточиться на инновациях, а не на инфраструктуре, и начать работу за дни вместо месяцев."
Множественные компоненты
DGX Cloud включает в себя множество интегрированных компонентов. Пользователи получают доступ к DGX Cloud из веб-браузера с использованием программного обеспечения NVIDIA Base Command Platform. "Это центральный узел DGX Cloud, где несколько пользователей управляют своими полными рабочими процессами разработки ИИ", говорит Бойл. "Это устраняет сложность совместного использования ресурсов для крупномасштабного обучения ИИ, используя несколько экземпляров, известных как «многонодовое обучение», которое часто трудно достичь, с легким в использовании графическим интерфейсом и интегрированными инструментами мониторинга и отчетности."
DGX Cloud также включает NVIDIA AI Enterprise, программный слой платформы NVIDIA AI, который включает более 100 предварительно обученных моделей, оптимизированных фреймворков и ускоренных библиотек программного обеспечения для науки о данных. Эти дополнения дают разработчикам дополнительный старт в их проектах ИИ, отмечает Бойл.
Организации арендуют несколько экземпляров DGX Cloud и, взамен, получают постоянный доступ в течение периода аренды, говорит Бойл. Экземпляры автоматически появляются в программном обеспечении Base Command Platform, позволяя пользователям отправлять и выполнять задания.
Каждый экземпляр включает восемь GPU NVIDIA H100 или A100 80GB Tensor Core, всего 640GB памяти GPU на узел. Бойл говорит, что высокопроизводительная сеть с низкой задержкой, построенная на сетевых продуктах NVIDIA, гарантирует масштабирование рабочих нагрузок на кластеры взаимосвязанных систем, позволяя нескольким экземплярам удовлетворять требования производительности продвинутого обучения ИИ. Высокопроизводительное хранилище также интегрировано в DGX Cloud.
С финансовой точки зрения, DGX Cloud предоставляет несколько значительных преимуществ и выгод. Подход устраняет необходимость для клиентов инвестировать и управлять своей собственной дорогостоящей аппаратной инфраструктурой. "Это переводится в экономию средств, увеличение гибкости и масштабируемости в их работе с ИИ и глубоким обучением", объясняет Билая.
DGX Cloud интегрируется с популярными ИИ-фреймворками и инструментами, упрощая рабочий процесс разработки. Он также приоритизирует безопасность и конфиденциальность данных, обеспечивая возможность работы с чувствительными данными и моделями. "В целом, DGX Cloud усиливает возможности своих пользователей, предоставляя высокопроизводительную, гибкую и удобную облачную платформу, адаптированную под их потребности в ИИ и глубоком обучении", говорит Билая.
Обслуживание потребности, но не дешево
Бойл говорит, что, предоставляя специализированные экземпляры суперкомпьютеров ИИ, DGX Cloud удовлетворяет критическую потребность, позволяя предприятиям быстро и недорого запускать услуги. NVIDIA сотрудничает с ведущими облачными провайдерами, включая Oracle Cloud Infrastructure, Microsoft Azure и Google Cloud, чтобы разместить инфраструктуру DGX Cloud.
Экземпляры DGX Cloud начинаются с $36 999 за экземпляр в месяц, без дополнительных платежей за программное обеспечение ИИ или передачу данных. Итак, это $444 000 в год за один экземпляр, и это повторяющаяся стоимость.
Когда пользователь начинает задачу, такую как обучение модели ИИ, его работа обрабатывается на доступных системах DGX в облаке. Эти системы оснащены высокопроизводительными GPU от NVIDIA, специально оптимизированными для рабочих нагрузок глубокого обучения. Данные пользователя и модели безопасно передаются на системы DGX, где происходит вычисление.
DGX Cloud поддерживает основные платформы и инструменты ИИ, обеспечивая совместимость с предпочитаемыми пользователями библиотеками и API. Это позволяет пользователям без швов разрабатывать и развертывать свои модели ИИ в облаке.
Начало работы
Бойл говорит, что клиенты и их команды могут быстро разобраться. NVIDIA предлагает восемь взаимосвязанных GPU на каждый экземпляр и обеспечивает доступ в любом регионе, где размещен DGX Cloud. Сетевая ткань службы основана на собственной технологии NVIDIA, которая, по утверждению Бойла, обеспечивает высокопропускную, низкозадержечную связь, оптимизированную для многонодового обучения. Он также указывает на простой пользовательский интерфейс, который позволяет пользователям запускать многонодовые задания по обучению.
Многоклаудовый подход позволяет избежать необходимости заключать соглашение с каким-либо одним облачным провайдером, говорит Бойл. "Платформа DGX Cloud Base Command обеспечивает вид из одного окна для управления гибридным облаком через облачные и локальные ресурсы."
Другие соображения и оговорки
DGX Cloud не является единственным игроком, предлагающим такой тип услуги. К основным конкурентам относятся Google Cloud AI Platform, Amazon AWS Deep Learning AMIs, Microsoft Azure Machine Learning и IBM Watson Studio. "Эти платформы предоставляют аналогичные возможности, такие как масштабируемые вычислительные ресурсы, интеграция с популярными фреймворками ИИ и поддержка рабочих процессов глубокого обучения", говорит Билая.
Стоимость развертывания и использования DGX Cloud варьируется в зависимости от таких факторов, как тарифный план, распределение ресурсов и продолжительность использования. NVIDIA предлагает различные модели ценообразования и планы, адаптированные к конкретным потребностям пользователей.
Принятие облачного решения делает пользователей зависимыми от инфраструктуры и поддержки поставщика услуг. Сбои и технические проблемы на стороне поставщика могут повлиять на доступность и производительность платформы, что потенциально может затронуть выполнение и сроки проекта.
Более того, особенно для организаций с строгими требованиями к конфиденциальности данных или соответствию стандартам, использование облачной платформы может вызвать опасения по поводу безопасности данных и конфиденциальности. "Хотя NVIDIA DGX Cloud применяет меры безопасности, важно, чтобы пользователи оценили протоколы безопасности платформы и убедились, что они соответствуют их конкретным требованиям по соблюдению стандартов".
Источник: networkworld.com