光栅单元数量 (光栅单元和光追单元的换算比率)
在上上次的发布会中,Nvidia正式发布了基于GP100核心的Tesla P100,那么这款计算卡能不能用于游戏呢?显然是不可能的。姑且不算Tesla P100没有视频输出接口,我们知道完整的GP100核心拥有5760个CUDA,其中3840个用于FP32也就是单精度的运算,另外的1920个是FP64双精度核心。虽然这这样2:1的单双精度的配置对于科学计算来说十分地有用,但是双精度性能对于游戏玩家来说毫无用处,玩家们只关心单精度浮点性能。另外更为重要的是GP100并没有所谓的ROP光栅单元,这对于一款游戏卡来说是致命的。
我们来看看Tesla P100的单精度性能,大约为10.6TFlops,而目前的旗舰显卡GTX 1080为9TFlops,光看这个数据,Tesla P100仅仅比GTX 1080高出17%的性能,你觉得对于一款旗舰显卡来说提升这点性能合理吗?除了这个以外,P100所使用的显存为HBM2显存,众所周知这种显存生产十分地复杂,目前也就海力士和三星能够制造,预计量产时间需要等到今年底了,那么老黄应该怎么办呢?
于是机智的Nvidia想出了一个办法,那就是在GP100和GP104之间再一次开辟出全新的GP102核心。这一次Pascal架构所使用的流处理器很奇怪,FP32单元和FP64单元几乎一样,也就是说通过某些手段可以将FP64处理单元转变为FP32处理单元。
由于阉割了大部分毫无用处的FP64也就是双精度处理单元(从Tesla GP100的1/3变成GP104的1/32),让新Titan和GTX 1080 Ti的性能和效率大幅度地提升,预计全新的Titan将会完整地保留3840个单精度核心(Tesla P100为3584个CUDA),与之相比较的是GTX 1080拥有2560个CUDA,光从浮点上来看比GP104多出了1/3,这样子也和目前的GM204与GM200之间的对比相吻合,GM204拥有2048个CUDA,而GM200则是3072个。
不过除了完整版的泰坦外,略微低端的GTX 1080 Ti应该还会屏蔽掉部分处理器,以保持和新Titan的性能差距,毕竟新Titan不出意外都将是公版,而GTX 1080 Ti以非公版为主。预计GP102核心将会是目前GP104核心的150%-180%的性能,如果说1080应对4K游戏还是有点困难的话,那么新Titan就基本上毫无压力了。
除了屏蔽大部分FP64计算单元以外,外媒猜测就是把HBM2显存变成目前的GDDR5X显存,当然我是不这么认为,毕竟作为GP100旗舰显卡,没有点新东西显得难以服众。况且AMD的Vega显卡将会使用最新的HBM/2显存,Nvidia如果不用怎么也说不过去吧。
外媒兄弟还预测了GP102核心的大小,据称拥有108亿个晶体管,核心面积位于GP100和GP104(314平方毫米-610平方毫米)之间,大约在于462-478平方毫米。而TDP为250W,与目前的旗舰显卡GTX Titan X相类似。
当然不确定GP100究竟是否是Pascal的完整版,如果今后Nvidia利用置换大法将部分FP64单元变成FP32单元也是有可能的,只是目前可以确定的一点就是,GP102不会便宜的,至少比5399元要高出不少价钱,想要购买的玩家还是早点准备好你的钱包吧。