科技年轮 您所在的位置:网站首页 amd所有型号 科技年轮

科技年轮

2023-11-18 13:33| 来源: 网络整理| 查看: 265

上周五我们聊到了AMD是如何痛定思痛,大刀阔斧地改掉了沿用已久的VLIW架构,倾力研发出了“浪子回头金不换”的GCN架构(戳我传送),不过由于篇幅所限,只给大家分析了GCN1.0的架构以及相应的显卡。那么这周五,就让我们继续聊聊GCN接下来的三代吧~

还是老规矩,在梳理GCN历代架构之前,先放汇总表:(感谢微信昵称为emmmmmmm的粉丝补充的RX540)

本表包含了HD7970以来的所有AMD GCN架构显卡,截至Polaris架构RX系列。由于VEGA织女星架构至今只有VEGA64/56流出,本表将暂时不涉及,待VEGA系列全面铺货后再行更新。

▲注:图片较大,大家可以保存后查看。

P.S:上一期GCN架构史发出来后,有粉丝补充RX540也是张马甲卡,于是小天哥就去搜索了一番……结果就是AMD放着好好的Polaris12核心不动刀,非得把7年前的Cape Verde PRO再拿出来炒一次冷饭……于是就出现了RX550与RX540完全同规格(512SP 128bit)但是架构却整整差了7年(14nm VS 28nm)的这一幕;当然Cape Verde PRO也终于将Pitcairn XT斩于马下,“荣归”AMD称号。

- 3 -GCN2.0:悄然发布,初见颓势

▌“我们中出了一个叛徒!”

时间回到2012上半年,HD7970横空出世,带着GCN的辉煌一起走进了广大玩家的视野。与此同时,HD7870/7850、HD7770/7750也纷纷登场,在不到半年的时间内就一鼓作气从高端到低端迅速完成了市场布局。但是问题依然存在:HD7950的1792SP与HD7870的1280SP之间有较大的性能差距,这种差距同时也存在于HD7850的1024SP也与HD7770的640SP之间。半年过去了,2012下半年,GTX650Ti的发布像一把利刃,扼住HD7770的喉咙的同时,也让HD7850惶惶不可终日。终于,经历了一年沉寂的AMD在2013年初搬出了HD7790,弥补了性能空档,来应对GTX650Ti的攻击。

但是紧接着,大家发现HD7790并不像之前的HD7890(HD7870XT)一样,直接将高一等级的核心阉割一刀;而是一个全新的核心:Bonaire XT。

从图片上来看,好像HD7790跟GCN1.0核心的HD7970核心没什么不同,仅仅是阉割了显存控制器以及几组GCN单元而已——其实不然。HD7790毕竟是一个低端核心,要比也应该跟HD7770比较:

从上两图的红框中可以看出——原本应作为低端显卡的HD7790,却像HD7970一样配备了双发射的架构!仅仅这一点小小的改变,便注定了它与GCN1.0的不同,同时也预示着GCN2.0的完全体——R9 290X的恐怖:

▌千呼万唤始出来,可惜是个大火炉

没错,R9 290X果然延续了架构方面的准则,两倍于R7 260X(HD7790),采用了四发射的架构。与此同时,引入许多新的功能性改变:例如全新的无桥交火引擎,使得从GCN2.0开始,交火不再受CFX金手指的约束;引入TrueAudio DSP单元,进一步深化了广大玩家心中“A卡音质好”的印象。

特别注意到的是,在尝到支持指令乱序执行的ACE单元带来的甜头后,AMD在GCN2.0中直接将ACE单元暴增至8个,每个单元可执行8个计算队列;而上代的HD7970是2个ACE单元,每个单元可执行2个计算队列。因此Hawaii每周期可执行的指令数目暴增至Tahiti的16倍之多。

可惜由于采用了512bit的显存位宽,公版散热器并不能压制其所带来的巨大发热,因此市场上不仅各种非公版三风扇大行其道,甚至众多玩家拿到R9 290X的第一件事情便是上水冷改造。而半年后推出的R9 295X2也“不负众望”地采用了公版水冷散热的方案……这种巧合,真不知是该喜还是该忧啊。

▌“然后呢?”

2013年底,玩家们兴冲冲的等到了R9 200的时代,却失望的发现除了Hawaii核心的R9 290 / 290X,剩下的所有型号均是马甲!R9 265 / 270(X)换了个核心名称,本质还是GCN1.0;R9 280 / 280X更是连核心名称都不换,直接披挂上阵;就算是GCN2.0的R7 260X,也仅仅是相对于HD7790加入了无桥交火等新功能而已。玩家们不禁在问:然后呢?

时间到了2014年初。旗舰级别的R9 290X,性能也仅介于GTX Titan与GTX780Ti之间。而NVIDIA却发布了一个新的显卡:采用GM107核心的GTX750(Ti)。大家意外的发现,NVIDIA新的Maxwell核心居然有着如此优秀的能耗比!大家不禁开始期待Maxwell的完全体。反观AMD这边呢?流处理器越来越多,注定要吃更多的显存位宽;而512bit的位宽却已经是板载显存的极限,更快的下一代GDDR6又遥遥无期。在GCN主旋律不变的基础上,如何才能进一步“堆料”,重新拿回单芯性能王座呢?

- 4 -GCN3.0:时运不济,命途多舛

▌出师不利——完整版Tonga胎死腹中

时间来到了2014下半年。距离R9 200系列全面补完已经过了小半年时间,沉寂已久的AMD感受到了来自即将发布的GTX980的压力,抢先发布了R9 285显卡,想抢占一波甜点级显卡的市场。1792个流处理器,256bit的位宽,像极了当年的HD7950——没错,基于新一代GCN3.0的Tonga核心,就这样来到了我们的面前。

可是从核心图上,我们却明显看到了一些端倪:这完全不是完整版的Tonga嘛!而且下方的显存控制器也告诉我们,它的完整版是一张384bit的显卡,2048SP,3或6GB显存——也就是HD7970最正统的后代!于是,广大玩家抱着期待的心情,等着完整版Tonga加持的R9 285X——因为R9 285的出现,让玩家们看到了GCN架构的潜力:经过优化后的架构不仅单位SP性能提升,功耗也降到了单卡190W,只需双6pin即可满足。

可就在大家幻想R9 285X的时候,GTX980 / 970横空出世,强大的性能直接让本想对位GTX970的R9 285,一夜之间放低了身段去打GTX960,还将将打了个平手。于是,完整版的Tonga XT(R9 285X)直接被AMD摁死在了工厂里——更多的显存控制器虽然带来了更高的带宽,但也带来更高的成本;相比较出一张打不过GTX970,成本却和其相差不大的显卡,还不如直接放弃。作为GCN3.0架构首次出师征战的两员大将之一,就这样折戟沉沙了。

▌番外:流产两年!AMD R9 285X神奇复活

但是!就在大家已经淡忘这张显卡的2016年底,AMD都已经进入北极星RX时代时,国外的网友曝光了一张R9 285X——2048SP、384bit、3G的规格与当年的HD7970一模一样!PCB编号也是AMD从未使用过的C765,足以证明这是神奇复活的R9 285X!可惜AMD已经没有将其重新发布的意义,这张卡也仅仅是从工厂中流出,PCB、散热等也均是公版方案。

但幸运的是!小天哥在万能的某鱼收到了一块,上面的GPUZ图就是小天哥手里这张R9 285X的图。等VEGA32/28铺货以后,小天哥将为大家带来GCN1.0(HD7970 / R9 280X)+ 两种GCN3.0(R9 285X / 380X)+ GCN4.0(RX470 / 570)+ GCN5.0(VEGA32)四代架构、五张显卡之间的同SP(2048个)、同频率对比,来遍历GCN走过的五代,为大家献上一场GCN架构的纵向评测盛宴!

▌显存界的金坷垃——HBM

让我们回到主题,将时间再度拉回2015上半年。等不到GDDR6的AMD,将目标转向了下一代显存技术——HBM显存。相比GDDR显存,HBM将直接集成于片上,大幅减少由于PCB走线所导致的延迟;相对应的也带来了及其可观的显存位宽。农企就像拿到了梦寐以求的金坷垃一样,“GCN掺了HBM,流处理器随便堆!”“GCN用了HBM,一片显存能顶八片用!”

但是,新技术的尝试总要付出代价。HBM显存的难产,直接导致了AMD旗舰级显卡的跳票。然而GTX900系列的铺货,却又让AMD感受到了巨大的压力。于是R9 300系列在2015年中,被AMD以全系马甲的身份搬上了历史舞台,在本文开头的表格里可谓一清二楚。唯一称得上“新卡”的R9 380X,也只是套用了Tonga完整版的2048个流处理器,显存控制器依然被阉割成了256bit。

终于,一个月后,AMD的新旗舰R9 Fury系列登场。得益于HBM显存的超高带宽,AMD干脆一鼓作气将Fiji核心堆上了4096SP的超强规格。同时也得益于使用了HBM显存,节省了GDDR显存的布线,R9 Fury系列的PCB完全可以做到17cm的ITX规格。因此R9 Fury Nano横空出世,一时间风光无两,被冠以“小钢炮之王”的称号;顶级的Fury X干脆也直接上水冷,只将次旗舰R9 Fury开放给了各大AIB厂商做非公版。GCN3.0终于迎来了最强、也是最后的三员大将。

2015年就在Fiji的光环中落下了帷幕。最强ITX小钢炮也有了,4096SP的巨无霸也有了,HBM的存在也让AMD不再担心显存位宽带来的瓶颈……一切都好似顺风顺水的发展着。然而,AMD的架构师却依然坐立难安:4096SP的规格已经是GCN架构的极限,HBM显存也足够喂饱这颗性能怪兽,在核心和显存都已经得到了完全的性能发挥后,将来的路该怎么走?

- 5 -GCN4.0:14nm加持,涅槃重生

▌比你小,还比你强!

2016年注定是不平凡的一年。年初,AMD的女朋友Global Foundry的14nm制程就宣布流片成功,这让AMD看到了未来的希望:从28nm升级到14nm,这简直可以说是质的飞跃!既然架构上已经遇到了瓶颈,那我们就用制程来凑!

终于在半年后,我们看到了RX480,也是首张14nm的显卡。在GCN3.0的基础上小改了一波GCN单元的结构,再加以一些Liquid VR、HDR技术、原生DX12支持等新特性,就这样与大家见面了。

从图中我们可以看到,精简后的显存控制器由每路控制64bit精简为32bit,这样保持8路显存控制器不变的同时,可将总位宽降至256bit,大大减少了布线难度。GCN单元的结构也由R9 390X的4+4+3=11CU精简为3+3+3=9CU,同时精简了一半的ROP单元。但最重要的不是架构上的缝缝补补,而是在应用了14nm的工艺后,AMD将GCN4.0架构的核心频率直接由历代GCN的1050MHz左右拉升至1250MHz附近!这直接带来了同SP下将近20%左右的性能提升,就算是ROPs以及SP单元相对R9 390X做出了精简,RX480总体依然与R9 390X相平甚至略优。

AMD也深知无力对抗NVIDIA的顶级产品Titan系列,因此直接用田忌赛马的策略对阵NVIDIA的GTX970、GTX1060。虽然发布后遭遇了从主板偷电、散热不佳等一系列问题,但依然没有阻碍RX480成为一张玩家心目中值得购买的显卡。

▌没有新卡怎么办,超超频率又一年

后面的事情大家应该就比较熟悉了……AMD全力研发GCN5.0的VEGA系列,RX500系列就又搬出了全系RX400的马甲作为新卡上市了。不过由于14nm制程的成熟,漏电率相比初期更低,因此RX580相比RX480频率再高100MHz,来到了1350MHz附近。加之高频率显存的加持,带来的相比RX480的提升也算是够看。加之2017年适逢迪兰恒进成立18周年,迪兰就出了这么一款全白的RX580 8G,也算是满足了一众颜值控的玩家们~

虽然GCN4.0不算是一个多么“崭新”的架构,但至少是AMD从GCN1.0以来,第一次升级了制程来到了14nm;也是第一次从中高端到低端完全布局,避免了GCN2.0、GCN3.0时代“一块新卡,全系马甲”的这种尴尬局面。虽然Fiji核心R9 Fury系列的继承者被织女星VEGA钦定,但是那毕竟是有钱人的玩具,GCN4.0能让我们广大的平民玩家享受到不错的性能,就足够了。大家说呢?

- 6 -GCN5.0:总结与展望

GCN这个架构,从2011年研发到2012年发布,直到今年2018年都仍在历史舞台上坚守。可是,伴随着VEGA64(GCN5.0)的发布,4096SP的巨无霸核心、超高带宽的HBM2显存、14nm的新制程这三张救命牌已然被AMD打完,剩下的GCN架构该何去何从?难道要堆5120个流处理器?寄希望于HBM3显存?抑或是使用7nm制程?殊不知,这些都是治标不治本的举措——GCN架构,实在是太老了。就像当年的VLIW架构在X1900时代站上历史舞台,却在HD6000时代遭遇了折戟沉沙一样,这期间是2006年到2012年的6年时间。GCN架构已经撑了7年,它也老了,也需要新一代的接班人来接过它的火炬,将AMD再度推上新的巅峰。

虽然纵向对比GCN的历代架构,不管用何种方式,性能总还在稳步地提升着;但是横向比较隔壁的NVIDIA,Pascal、Volta的出现却直接让显卡性能坐火箭一般上天。而由于AMD这边的缝缝补补,老黄的手术刀又开始耍的肆无忌惮。我们太需要一个可以抗衡NVIDIA高端产品的存在了,一个不仅仅是堆料、超频,而是真真正正涅槃重生的GPU架构。

我们理解,作为一个在Intel和NVIDIA夹缝中生存的农企,无法做到同时兼顾GPU与CPU部门。GCN架构横空出世的那年,FX系列处理器的多模块设计遭遇了前所未有的滑铁卢,高端市场尽失;而AMD对ZEN处理器的全身心投入,为我们带来了一颗极其优秀的产品的同时,也让GCN架构经历了缝缝补补三年又三年的窘境。如今市值120亿美元的AMD已不再是2015年市值连15亿美元都不到的公司,17年4季度非固定资产营收的扭亏为盈也让我们看到AMD正在崛起。

GCN架构已然到了耄耋之年,我们也衷心希望AMD能看到其中的不足,努力研发新的GPU架构,对人工智能等并行计算领域提供更好的支持,争取早日与NVIDIA抗衡。

最后,祝AMD翻身成功!AMD,Yes!



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有