NVIDIA Turing GPU 與 NVIDIA Xavier 在 MLPerf 數據中心與邊緣 AI 推理性能基準測試中取得最快成績

 

加利福尼亞州圣克拉拉市 —— 2019 年 11 月 6 日  ——  NVIDIA 于今日公布,其在最新測定數據中心與邊緣 AI 推理工作負載性能的基準測試中取得最快成績。NVIDIA 在前不久的 AI 訓練基準測試中也展現出同樣強大的實力,為此次獲勝奠定了基礎。

 

MLPerf Inference 0.5 是業內首個獨立 AI 推理基測套件,其測試結果證明了 NVIDIA Turing™數據中心 GPU 以及 NVIDIA Xavier™ 邊緣計算芯片系統的性能。

 

MLPerf 的五項推理基準適用于一系列形式因素和四種推理場景,涵蓋了圖像分類、目標檢測和翻譯等已有的 AI 應用。

 

憑借 Turing GPU 所提供的目前市面上單處理器最高的性能,NVIDIA 在全部五項針對于兩種數據中心關注的場景(服務器和離線)的基準測試中均排在首位 1。Xavier 則是市面上針對兩種邊緣場景(單流和多流)性能最高的邊緣和移動芯片系統 2。

 

NVIDIA 副總裁兼加速計算總經理 Ian Buck 表示:“AI 正處于從研究階段迅速轉向大規模實際應用部署的臨界點。AI 推理是一項巨大的計算挑戰。NVIDIA 將業內最先進的可編程加速器 CUDA-X AI 算法套件與我們在 AI 計算領域的深厚知識相結合,能夠幫助數據中心部署龐大且正在不斷增長的復雜 AI 模型。”

 

由于重視其計算平臺在各種 AI 工作負載中的可編程性與性能,因此 NVIDIA 是唯一一家提交了全部五項 MLPerf 基準測試結果的 AI 計算平臺公司。此前七月,NVIDIA 就曾在多項 MLPerf 0.6 AI 訓練基準測試結果中勝出,在訓練性能方面創造了八項紀錄。

 

NVIDIA GPU 在全球最大的云基礎設施中為大型推理工作負載提供加速,這些云基礎設施包括阿里云、AWS、谷歌云平臺、微軟 Azure 和騰訊等。目前,AI 正在朝操作和數據生成點的邊緣移動。沃爾瑪、寶潔等全球首屈一指的企業和機構正使用 NVIDIA EGX 邊緣計算平臺與 AI 推理能力在邊緣運行復雜的 AI 工作負載。

 

NVIDIA 的所有 MLPerf 測試結果均采用 NVIDIA TensorRT™ 6 高性能深度學習推理軟件獲得。該軟件能夠在生產中輕松優化和部署數據中心、邊緣等位置的 AI 應用。此外,GitHub 庫還以開源形式提供新的 TensorRT 優化。

 

全新 Jetson Xavier NX

為了擴展其推理平臺,NVIDIA 于今日宣布推出了 Jetson Xavier NX。Jetson Xavier NX 是全球體積最小、性能最強大的適用于邊緣機器人和嵌入式計算設備的 AI 超級計算機,它是圍繞 MLPerf Inference 0.5 基準測試中所使用的 Xavier 芯片系統所打造的低功耗版本。