從 Live Data Streaming 看華為與 NVIDIA
August 10, 2025•368 words
從 Live Data Streaming 看華為與 NVIDIA
AI 晶片架構的分歧:誰才是真正為未來設計的 AI 平台?
AI 晶片的競爭往往聚焦於算力指標,如 TFLOPs、TOPS 或製程技術。然而,在大模型普及的 2025 年,Live Data Streaming(即時資料串流)正重新定義 AI 平台的價值。來自中國的華為昇騰 910B與美國的NVIDIA H100在理論性能上旗鼓相當,但其架構設計哲學在應對動態資料流時展現顯著差異。本文將深入分析兩者在即時資料處理中的表現,並探討誰更能適應未來的 AI 應用需求。
離線算力對決:昇騰與 NVIDIA 的性能基準
根據華為官方資料,昇騰 910B 支援最高 320 TFLOPs(BF16) 和 640 TOPS(INT8),採用 7nm 製程,單晶片算力接近 NVIDIA A100(312 TFLOPs,BF16)。然而,MLPerf 基準測試(2024 年最新報告)顯示,昇騰 910B 在 ResNet-50 訓練任務中,吞吐量約為 A100 的 85%,主要受限於 MindSpore 框架的優化程度 [1]。
...
Read post