您的购物车目前是空的!
NVIDIA DGX Spark 产品规格书
NVIDIA DGX Spark
个人级 AI 计算机,专为构建和运行 AI 而设计。
桌面 AI 计算需求
随着生成式 AI 模型的规模和复杂性不断增长,在本地系统上进行开发变得愈发困难。
在本地进行大型模型的原型设计、调优和推理需要庞大的内存和显著的计算性能。
随着企业、软件公司、政府机构、初创企业和研究人员不断扩充 AI 团队,对 AI 计算资源的需求持续增加。
2000 亿参数模型,可放在桌上
NVIDIA DGX™ Spark 属于一种全新的计算机类别,从底层架构开始即为构建和运行 AI 而设计。
由 NVIDIA GB10 Grace Blackwell 超级芯片提供动力,基于 NVIDIA Grace Blackwell 架构,
DGX Spark 可提供高达 1 petaFLOP(千万亿次浮点运算) 的 AI 性能,用于支持大型 AI 工作负载。
配备 128 GB 统一系统内存,开发者可以在本地进行高达 2000 亿参数 的模型实验、微调或推理。
此外,通过 NVIDIA ConnectX™ 网络,可将两台 DGX Spark 超级计算机互联,
以支持高达 4050 亿参数 的模型推理。
为了让开发者拥有熟悉的体验,DGX Spark 的软件架构与 NVIDIA 工业级 AI 工厂一致,
预装 NVIDIA DGX OS (基于 Ubuntu Linux),并配备最新的 NVIDIA AI 软件栈,
提供 NVIDIA NIM™ 与 NVIDIA Blueprints 的开发者访问权限。
开发者可使用 PyTorch、Jupyter、Ollama 等常见工具直接进行原型设计、微调与推理,
并能轻松将项目迁移到数据中心或云端。
DGX Spark 在紧凑体积中提供了惊人的性能和能力,
让开发者、研究人员、数据科学家与学生能在桌面上继续推动生成式 AI 的边界。
基于 NVIDIA Grace Blackwell
DGX Spark 的核心是 NVIDIA GB10 Grace Blackwell 超级芯片,
基于专为桌面形态优化的 Grace Blackwell 架构。
GB10 集成了一颗强大的 NVIDIA Blackwell GPU,配备第五代 Tensor Core 和 FP4 精度支持,
可提供最高 1 petaFLOP 的 AI 算力。
此外,GB10 还包含高性能的 20 核 Arm Grace CPU,用于加速数据预处理与调度,
显著提升模型调优与推理效率。
GB10 超级芯片采用 NVIDIA NVLink™-C2C 互连,实现 CPU+GPU 一致内存模型,
带宽为 PCIe Gen 5 的 5 倍。
主要特性
- 基于 NVIDIA GB10 Grace Blackwell 超级芯片
- 搭载 NVIDIA Blackwell GPU,第五代 Tensor Core 技术
- 集成 NVIDIA Grace CPU,20 核 Arm 高性能架构
- 使用 FP4 精度时 AI 性能高达 1 petaFLOP
- 128 GB 一致统一系统内存
- 支持高达 2000 亿参数的 AI 模型
- 通过 NVIDIA ConnectX™ 网络连接两台设备,可支持 4050 亿参数模型
- 内置 4 TB NVMe 存储
- 紧凑的桌面机身设计
处理超大参数 AI 模型
DGX Spark 拥有 128 GB 统一系统内存并支持 FP4 数据格式,
可支持高达 2000 亿参数 AI 模型,
使开发者能在桌面上完成模型原型、调优与推理。
借助内置的 NVIDIA ConnectX 网络技术,
两台 DGX Spark 系统可协作运行更大型的模型,例如 Llama 3.1 405B。
本地开发,随处部署
软件与架构分层
层级 | 内容 |
---|---|
硬件层 | NVIDIA Grace Blackwell 架构 |
系统软件 | DGX OS (基于 Ubuntu) |
开发与框架 | CUDA、CUDA-X、RTX 工具包与库 |
AI 服务与工具 | NIM AI Blueprints、AI Workbench |
深度学习框架 | PyTorch、TensorFlow、MATLAB 等 |
平台与生态 | Riva、Holoscan、Metropolis、Isaac 等 |
容器环境 | 预装 Docker 及 NVIDIA 容器工具包 |
此软件堆栈让组织与开发者拥有强大的经济型实验平台,
可在桌面上构建与测试模型,从而释放集群环境中更适合训练与部署的计算资源。
基于 NVIDIA AI 平台的统一软件架构,
DGX Spark 用户可以轻松将项目从桌面迁移至 DGX Cloud 或任意加速云/数据中心基础设施,
快速实现模型原型设计、微调与迭代。
技术规格 (初步参数,可能变动)
项目 | 规格 |
---|---|
架构 | NVIDIA Grace Blackwell |
GPU | NVIDIA Blackwell 架构 |
CPU | 20 核 Arm (10× Cortex-X925 + 10× Cortex-A725) |
CUDA 核心 | Blackwell 代 |
Tensor 核心 | 第 5 代 |
RT 核心 | 第 4 代 |
Tensor 性能 | 1 PFLOP(FP4 稀疏模式理论值) |
系统内存 | 128 GB LPDDR5x,一致统一内存 |
内存接口 | 256 bit |
内存带宽 | 高达 273 GB/s |
存储 | 4 TB NVMe M.2 自加密存储 |
USB 接口 | 4 × USB Type-C |
以太网 | 1 × RJ-45 10 GbE |
网卡 | ConnectX-7 @ 200 Gbps |
Wi-Fi | Wi-Fi 7 |
蓝牙 | BT 5.4 (含 LE) |
音频输出 | HDMI 多声道输出 |
功耗 | 240 W |
视频输出 | 1 × HDMI 2.1a |
视频编解码 | NVENC × 1 | NVDEC × 1 |
操作系统 | NVIDIA DGX™ OS |
尺寸 | 150 mm (L) × 150 mm (W) × 50.5 mm (H) |
重量 | 1.2 kg |