巨炮快评篇一百：卓越生产力工具！NVIDIA RTX A

来源：生产力研究 【在线投稿】栏目：综合新闻时间：2021-03-20

【前言】

NVIDIA在1999年8月发布首款真正意义上的可编程GPU——GeForce 256，从此奠定了显卡在PC中的重要地位。同年11月再度推出基于GeForce 256核心、定位生产力工具的Quadro产品线，以90%以上的市场占有率霸占该领域至今。通过强劲的性能以及完善的生态环境，推动设计和视觉化产业的快速发展。

NVIDIA新一代Ampere架构的横空出世再一次将GPU性能推向了新的高度，其中面向专业领域有3款——NVIDIA?A40、A100与RTX A6000，前者针对高性能计算、后者主攻图形渲染。本人有幸拿到了RTX A6000，今天就为大家分析它究竟有什么特点。

【RTX A6000硬件特性】

Ampere架构全新的SM多单元流处理器，单精度浮点 (FP32) 运算处理速度提升1倍，优化的性能功耗比，显著提高图形和模拟工作流程的性能，例如复杂的3D计算机辅助设计 (CAD) 和计算机辅助工程 (CAE)。

第2代RT Core的吞吐量是上代的2倍，并能同时运行光线追踪和着色或降噪功能，大幅加快工作负载的运行速度，例如电影内容的逼真渲染、建筑设计评估和产品设计的虚拟原型创建。这项技术还可加速渲染具有光线追踪效果的动态模糊画面，更快获得视觉准确性更高的结果。

第2代Tensor Core提供的人工智能训练吞吐量达到上代5倍，而且无需更改代码即可加速AI和数据科学模型的训练。从硬件上支持结构稀疏度使推理吞吐量提升一倍。Tensor Core 还通过DLSS、AI降噪等功能将AI引入到图形处理中，并增强了特定应用程序的编辑功能。

第4代PCI-E总线，相比PCI-E 3.0带宽增加1倍，能够更快地执行AI和数据科学等数据密集型任务。第3代NVIDIA NVLink，高达112GB/s的GPU互联带宽提供一体式可扩展显存，可加速图形和计算工作负载，并能处理更大的数据集。

RTX A6000采用完整GA102核心，内含个CUDA单元，配备48GB 384bit GDDR6 ECC显存，带宽768GB/s（GDDR6X没有如此的存储密度，发热量和功耗略高），可通过NVLink扩展到高达96GB。输出接口是4个DisplayPort 1.4a，连接多台8K显示设备，实现大型洞穴式自动虚拟环境 (CAVE)、视频墙等应用场景。

【外观赏析】