迈入DirectX10时代,ATi统一超标量着色架构架构详解
即便ATi在R580中引入了1:3的黄金渲染架构,但传统的渲染架构还是存在弊端的,在目前许多新的大型3D游戏中,许多独立渲染的场景由大量多边形组成,对GPU的Vertex Shader(顶点着色器)要求很大,而这时相对来说,并不需要太多的像素渲染操作,这样便会出现像素渲染单元被闲置,而顶点着色引擎却处于不堪重荷的状态,为了解决这一问题,ATi开发除了统一超标量着色架构(Unified Superscalar Shader Architecture)的R600系列。
得益于80nm核心工艺制程的帮助,Radeon HD 2900XT显卡终于摆脱传统“管线”概念的束缚,采用更为高效的统一超标量着色架构(Unified Superscalar Shader Architecture),内置了高达320个流处理器单元(64*5),全面支持Microsoft DirectX 10.0和Shader Model 4.0,能同时兼容DirectX 10和DirectX 9 与OpenGL等引擎开发的3D游戏。下面是有关Radeon HD 2900XT显卡的核心架构体系图。
Radeon HD 2900XT 核心架构图示
DirectX 10最大的革新就是统一渲染架构(Unified Shader Architecture)。目前的GPU架构还是沿用的分离式渲染架构,此前NVIDIA的G71和ATI的R580都是采用这样的架构,顶点渲染和像素渲染各自独立进行,而且一旦当架构确定下来,顶点和像素shader单元的比例就会固定下来。不过分离式渲染架构设计更为简便而且经验丰富,例如NVIDIA的NV40发成到后来的G70/G71,又或者是R420到R580,性能都得到显而易见的提升。
微软认为这种分离渲染架构不够灵活,不同的GPU,其像素渲染单元和顶点渲染单元的比例不一样,大大限制了开发人员自由发挥的空间。不同的应用程序和游戏对像素渲染和顶点渲染的需求不一样,导致GPU的运算资源得不到充分利用。微软在DirectX 10中提出了统一渲染架构,在通用和独立的shader单元中可以执行不同的shader程序,包括vertex、pixel和在DirectX 10中首次提出的geomery shader。而且随着这些通用独立的shader单元功能的不断完善,日后有望执行更多的shader程序,例如物理效果。
虽然ATi的R600和nVIDIA的G80同样是支持DirectX 10的显卡,但它们之间是有着本质的不同的,nVIDIA在其统一渲染架构中,通过Shader/核心频率异步的方式,使其Shader单元以高于核心频率两倍以上的速度运行,从而获得了更高的渲染效率。ATi在其统一超标量着色架构中,宣称R600拥有320个流处理单元,但准确来说,Radeon HD 2900XT是拥有64个流处理器,而每一个流处理器都配于5个1D逻辑计算器,因而ATi便宣称Radeon HD 2900XT拥有320个流处理器,这点做法和当初RV580有点类似,通过1:3的渲染管线和渲染单元的比例,大幅度的增加了显卡的渲染单元。
Radeon HD 2900XT 核心架构图示
本贴来自中关村在线产品论坛:<a href='http://group.zol.com.cn/'>http://group.zol.com.cn/</a>,本帖地址:<a href='http://group.zol.com.cn/9/6_85544.html' target='_blank'>http://group.zol.com.cn/9/6_85544.html</a>
上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] 下一页