生产力研究
    主页 > 综合新闻 >

巨炮快评 篇一百:卓越生产力工具!NVIDIA RTX A

【前言】

NVIDIA在1999年8月发布首款真正意义上的可编程GPU——GeForce 256,从此奠定了显卡在PC中的重要地位。同年11月再度推出基于GeForce 256核心、定位生产力工具的Quadro产品线,以90%以上的市场占有率霸占该领域至今。通过强劲的性能以及完善的生态环境,推动设计和视觉化产业的快速发展。

NVIDIA新一代Ampere架构的横空出世再一次将GPU性能推向了新的高度,其中面向专业领域有3款——NVIDIA?A40、A100与RTX A6000,前者针对高性能计算、后者主攻图形渲染。本人有幸拿到了RTX A6000,今天就为大家分析它究竟有什么特点。

【RTX A6000硬件特性】

Ampere架构全新的SM多单元流处理器,单精度浮点 (FP32) 运算处理速度提升1倍,优化的性能功耗比,显著提高图形和模拟工作流程的性能,例如复杂的3D计算机辅助设计 (CAD) 和计算机辅助工程 (CAE)。

第2代RT Core的吞吐量是上代的2倍,并能同时运行光线追踪和着色或降噪功能,大幅加快工作负载的运行速度,例如电影内容的逼真渲染、建筑设计评估和产品设计的虚拟原型创建。这项技术还可加速渲染具有光线追踪效果的动态模糊画面,更快获得视觉准确性更高的结果。

第2代Tensor Core提供的人工智能训练吞吐量达到上代5倍,而且无需更改代码即可加速AI和数据科学模型的训练。从硬件上支持结构稀疏度使推理吞吐量提升一倍。Tensor Core 还通过DLSS、AI降噪等功能将AI引入到图形处理中,并增强了特定应用程序的编辑功能。

第4代PCI-E总线,相比PCI-E 3.0带宽增加1倍,能够更快地执行AI和数据科学等数据密集型任务。第3代NVIDIA NVLink,高达112GB/s的GPU互联带宽提供一体式可扩展显存,可加速图形和计算工作负载,并能处理更大的数据集。

RTX A6000采用完整GA102核心,内含个CUDA单元,配备48GB 384bit GDDR6 ECC显存,带宽768GB/s(GDDR6X没有如此的存储密度,发热量和功耗略高),可通过NVLink扩展到高达96GB。输出接口是4个DisplayPort 1.4a,连接多台8K显示设备,实现大型洞穴式自动虚拟环境 (CAVE)、视频墙等应用场景。

【外观赏析】

NVIDIA RTX A6000定位生产力工具,采用简约实用的方正造型,正面为镜面黑色面板,侧面通过金色的锯齿形进行装饰。传统公版涡轮式散热有利于组建多卡的高性能计算平台。

涡轮风扇的风道有能增加风压的收腰设计,显著提高整卡运行起来的散热效率并降低风扇高速旋转时产生的风噪。产品型号雕刻在显卡靠近IO挡板的前部,并使用金漆上色,彰显高端。

双路NVLINK接口搭配桥接器连接另一块RTX A6000扩展显存和性能,实现高达112GB/s带宽和96GB的共享GDDR6显存,满足最大视觉计算工作负载的需求。

SYNC接口用于连接Quadro Sync同步卡,轻松部署和管理多个显示设备,最多同步32个4K显示设备,确保显示设备的输出帧保持一致,不产生任何图像伪影。

RTX A6000背面加入全尺寸铝合金背板,保护PCB元器件、增加强度的同时,涡轮风扇也可以通过背部来进风,避免多卡运行时风道过于密集的问题。

输出接口方面,RTX A6000共使用4个DisplayPort 1.4a接口,单卡即可连接4屏8K 60fps同步输出,打造炫目的超高分辨率画面,来满足各行各业的可视化和展示需求。

RTX A6000标称功耗高达300W,但仅有1个8?PIN供电接口,为了兼容更多的电源,附赠1条双8 Pin电源转接线。

【内部拆解】

由于RTX A6000搭配48GB超大容量GDDR6显存,PCB两面共有24颗显存颗粒,对显存散热提出更高要求,所以铝合金材质背板上贴了大量显存导热贴。