毫无意外,G84和G86的核心架构完全源于G80,采用了Direct X10的统一shader架构。传统的GPU因为采用了分离式的架构,所以经常会出现数据分配问题,极大的影响了实际游戏运行中的渲染效率。而DirectX 10中最大的改进便是引入了统一渲染架构(unified shader),所谓统一渲染架构,最容易的理解方式就是Vertex Shader(VS)与Pixel Shader(PS)处理单元不再分离。

『将shader单元的架构统一,能达成资源分配的最佳化』
因为传统的显卡处理流程是严格按照顶点单元、坐标变换、像素处理、ROP输出等等流程进行,所以一旦游戏画面的渲染内容不同造成的PS、VS单元负载不同,就会造成资源的大量浪费。而新的架构抛弃了传统的Vexter与Pixel Shader独立设计,通过一个统一执行单元(流处理器)运算游戏画面的所有Shader数据(包括Vexter与Pixel数据),这样无论几何图形(VS单元负责处理)过于复杂、或者像素渲染(PS单元负责处理)过于复杂,GPU都能有效的合理分配处理单元,有效的分配硬件资源。
与G80相比,G84和G86核心通过精简处理单元的数量达到成本缩减的目的。在技术规格方面,最为关键的shader单元,即流处理器,G84缩减到了两组32个,G86缩减到了1组16个,与G80的8组(96至128个)相比有着巨大的减幅,当然3D性能也会有大幅下降。下面是G84与G86在规格规格设计上,与自己的前一代产品的详细对比表。
规格对比表|Specs contrast table list |
|
GeForce 7300GT |
GeForce 7600GT |
GeForce 8500GT |
GeForce 8600GT |
GeForce 8600GTS |
GeForce 8800GTS |
GPU 工艺制程 |
晶体管数量 |
1.77亿 |
1.77亿 |
2.1亿左右 |
3亿左右 |
3亿左右 |
6.81亿 |
核心工艺 |
90nm/80nm |
90nm/80nm |
80nm |
80nm |
80nm |
80nm |
GPU 3D渲染架构 |
连接界面/Socket |
PCI-E |
PCI-E |
PCI-E |
PCI-E |
PCI-E |
PCI-E |
DirectX 版本 |
DX9 |
DX9 |
DX10 |
DX10 |
DX10 |
DX10 |
核心代号 |
G73 |
G73 |
G86 |
G84 |
G84 |
G80 |
核心工艺 |
90nm/80nm |
90nm/80nm |
80nm |
80nm |
80nm |
90nm |
核心频率 |
400MHz |
560MHz |
450MHz |
540MHz |
675MHz |
550MHz |
PS单元数量 |
8 |
12 |
统一架构 16个流处理器 |
统一架构 32个流处理器 |
统一架构 32个流处理器 |
统一架构 96个流处理器 |
VS单元数量 |
4 |
5 |
HDR支持度 |
支持 |
支持 |
支持 |
支持 |
支持 |
支持 |
显存类型 |
DDR2 |
DDR3 |
DDR2 |
DDR3 |
DDR3 |
DDR3 |
显存频率 |
800MHz |
1400MHz |
800MHz |
1400MHz |
2000MHz |
1600MHz |
显存容量 |
128MB |
256MB |
256MB |
256MB |
256MB |
320/640MB |
显存位宽 |
128bit |
128bit |
128bit |
128bit |
128bit |
320bit |
显存带宽 |
12.8GB/s |
22.4GB/s |
12.8GB/s |
22.4GB/s |
32GB/s |
64GB/s |
GPU 2D视频架构 |
技术名称 |
Purevideo HD |
Purevideo HD |
Purevideo HD增强 |
Purevideo HD增强 |
Purevideo HD增强 |
Purevideo HD |
技术特点 |
H.264辅助解码 |
H.264辅助解码 |
H.264硬件全解码 |
H.264硬件全解码 |
H.264硬件全解码 |
H.264辅助解码 |

『这是G80的核心架构图,G84/G86与之类似,只是运算单元大幅减少』
上面是G80的核心架构图,它最多集成了8组流处理单元,总共包含128个流处理器(GeForce 8800GTX),可以作为G84/G86架构的参考。G84/G86同样可以做到象G80一样灵活的调配Shader单元,进行不同的数据类型运算,达成资源的合理利用,有效的提高GPU的运算效率。

『G8x核心中每组流处理单元包含16个流处理器』
其实统一渲染架构并不是简单的将PS单元和VS单元整合在一起,而是将GPU的角色由单纯为游戏渲染提升至游戏处理中心的理念,统一架构引擎设计更适合异类运算工作,比如物理运算等等,让显卡的应用范畴大幅提升。

『统一架构数据处理流程图』
上面这个架构图更为清楚一些,可以说,G84仅仅集成了2组流处理单元,总共包含32个流处理器(数字6部分),而G80集成了8组这样的流处理单元。传统架构的“顶点单元为先”的设计已经被取代,我们可以看到,最早的处理部分是顶点设置(数字1部分)、像素数据流设置(数字2部分)、几何单元数据流设置(数字3部分)。随后,便进入一个整体的设置和分配单元,在这里,数据被合理的分配到流处理单元中。
在此之前(数字5部分),G8x的一项新技术起到了作用,那就是Early Z,它是Z缓存技术的加强,通常Z缓存会在Rop单元进行处理,但是这样像素仍然经过了整个流水线处理,消耗了有效的资源。而Early Z会在像素进入流水线之前判断这个像素的价值,如果判断为无用像素,就直接省去了进入流水线的过程,从而节省了相应的渲染单元,提高渲染效率。
G8x架构的统一渲染架构采用完全的标量化设计,在每组流处理单元中包含16个FP32精度的流处理器,每个流处理器都是单周期一个操作,因此G84具有的两组流处理单元就是32个流处理器。另外在流处理单元中,还包括了L1一级缓存和像素地址设定单元。
而更廉价一些的G86只有16个流处理器,即只保留了1组流处理单元。
上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] ... 下一页 >>