性能基准 Performance Benchmarks
实测数据,拒绝虚标。深超智算在标准 AI 负载环境下,针对主流大模型训练与推理任务进行了严苛的性能压测,旨在为您提供最真实的算力预期。
训练吞吐量 (TFLOPS)
SCZS Galactic (H100 x16)
98.2 TFLOPS
Industry Standard Node
62.4 TFLOPS
测试负载: Llama-3 70B FP8 Pre-training
推理时延 (TTFT)
SCZS Quantum (vLLM Opt)
12ms
General Cloud Instance
45ms
测试负载: DeepSeek-V2 Inference (Triton)
能效比 (Perf/Watt)
SCZS Immersion Liquid
1.42 x
Standard Air Cooling
0.88 x
测试负载: 7x24h Full Load Stability Test
旗舰机型综合性能对比
| 测试维度 | S1 (Quantum) | S2 (Nebula) | S4 (Galactic) |
|---|---|---|---|
| FP8 Tensor 峰值算力 | 3.2 PFLOPS | 6.4 PFLOPS | 12.8 PFLOPS |
| 单卡 HBM 带宽 | 3.35 TB/s | 3.35 TB/s | 3.35 TB/s |
| 集群通信延迟 (NVLink) | Low | Ultra-Low | Zero-Loss |
| Llama-3 70B 推理速度 | 120 tokens/s | 280 tokens/s | 540 tokens/s |
需要针对您的特定模型进行性能预测吗?
申请性能实测报告