AMD人工智能芯片供应紧张状况分析:对未来市场的影响及预测

  • 时间:
  • 浏览:0

在当今这个日新月异的时代,两位华人,正在颠覆科技巨头英特尔也在不断发展变化。今天,我将和大家探讨关于两位华人,正在颠覆科技巨头英特尔的今日更新,以期为大家带来新的启示。

文章目录列表:

两位华人,正在颠覆科技巨头英特尔

锐公司(ID:shangjiezz)报道

作者/ 郑 栾

“当我还是IBM的一名年轻工程师时,有人建议我,应该奔着问题去。要做,就要做最重要的事。我一直都记得。”

这句话出自苏姿丰之口,她是一位华人女性,也是AMD公司总裁兼CEO。

苏姿丰于2014年起担任AMD公司的CEO,在她的任期内,AMD的股价从2美元左右涨至如今的90美元,5年之间涨幅高达4500%。

她的确解决了AMD当时面临的大量问题。如今,AMD已经将个 脑的CPU市场完全颠覆,制程和性能都反超了英特尔,并且在数据中心(即曾经的服务器)处理器等市场向英特尔大举进攻。2019年,苏姿丰成为史上 位登上美联社年度CEO薪酬榜单的女性。

令英特尔头疼的另一家公司,是它曾经的忠实小弟英伟达。

英伟达刚刚以400亿美元的价格,从软银手中收购了英国新品设计公司ARM,这是芯片史上规模最大的一笔收购。这笔收购一旦完成,意味着英伟达可以在CPU市场和英特尔直接竞争,同时威胁英特尔重要的利润来源——数据中心市场。

英伟达的创始人黄仁勋同样是华人。在电脑硬件发烧友的圈子中,他和苏姿丰被称为“老黄”和“苏妈”。

而英特尔的近况并不顺利,研发进展不顺导致自己很难跟上祖师爷提出的“摩尔定律”,股价也不再坚挺。

这两位华人,会成为 科技 巨头英特尔的掘墓人吗?

01

硅谷最年轻的亿万富翁

1965年,英特尔未来的创始人之一,当时36岁的戈登·摩尔在准备一份报告时发现了一个惊人的规律: 每过18-24个月,集成电路芯片上的电路数目都会翻倍增长。这种现象不仅存在于储存器芯片,也同时在微处理器上出现。

如果这一定律长期生效,就意味着,每过2年,计算机的储存容量和计算能力都会翻倍增长。

这就是 的摩尔定律,它准确地预测了未来50多年里计算机性能的发展,成为计算机产业中的 定律。

那一年,2岁的黄仁勋还和家人住在台北,英特尔还没有诞生,距离苏姿丰出生还有4年。

这是一段相爱相杀的 历史 。

1968年,戈登·摩尔和罗伯特·诺伊斯、安迪·格鲁夫离开仙童半导体,创办英特尔。有媒体评价:英特尔是这个星球上最成功、最具竞争力的公司之一,它就像一台精密的机器一样,从来没有出过差错。

英特尔几乎 地遵循了摩尔定律预言的发展轨迹,像一艘航母一样劈波斩浪。而AMD则扮演了一个屡败屡战的挑战者角色。

几十年间,时而靠英特尔授权,时而靠山寨,AMD始终在芯片业界扮演着“第二供应商”的角色。直到20世纪8、90年代,英特尔取消了对AMD的技术授权,AMD走上了自主研发的道路,并且熬死了所有竞争对手,成为英特尔在CPU市场 的敌人。

20世纪的后半叶,半导体产业的飞速发展成为了美国经济最重要的引擎。黄仁勋和苏姿丰也随着家人,从中国台湾来到了大洋彼岸的美国。

黄仁勋在俄勒冈州立大学取得了电机工程学位,后来在斯坦福大学获得了硕士学位,毕业后还曾经短暂地供职于AMD。

1985年,黄仁勋加入LSI Logic,8年的时间里,他从普通员工做到了董事,先后负责技术、销售等多个部门,成为一位复合型人才。

1993年,在自己30岁生日之前,黄仁勋联合创办了英伟达,主要业务是显示芯片。 在英伟达的推动下,显示芯片从可有可无的产品蹿升为计算机的两大核心处理器。

这一年,苏姿丰还没有从麻省理工大学毕业。在这所美国名校里,苏姿丰学习了8年,获得了电机工程的学士、硕士和博士学位。

苏姿丰先后在德仪、IBM研发部门、Freescale Semiconductor工作,外界给她的评价是: 善于谈判、领导力强、人际关系丰富,并且多才多艺。

在1995年之前,显示芯片主要用于 游戏 机,因为当时的个 脑几乎不具备 游戏 功能。而当微软发布Windows95后,计算机的图形化时代到来,显卡开始站上芯片产业的“C位”。

黄仁勋敏锐的嗅觉让他做出了决断:全面支持微软的D3D API。同时,他还提出了和摩尔定律并称的显卡芯片领域“黄氏定律”,即显卡芯片每6个月性能提升一倍。

显卡曾经只是一个负责信号输出的部件,但随着计算机性能的发展,显卡芯片的重要性不断提高。

1999年,英伟达提出GPU(图形处理器)概念,并发布了一款全新架构的产品GeForce256。这款芯片被认为是 上 款消费者级别的 3D 图形 GPU。

黄仁勋的一系列决策让英伟达在显卡市场脱颖而出,他本人也成为硅谷 历史 上最年轻的亿万富翁。

2006年,当AMD已经可以在CPU市场和英特尔正面掰手腕时,这家公司却做出了一个惊人的决策——花费54亿美元的巨额资金收购显卡双雄之一,英伟达的最大竞争对手ATI,这也让AMD成为全球 一家有能力研发生产CPU和显卡的厂商。

02

AMD的救世主

从长远来看,AMD的这次收购影响深远,且具有长期价值。今天的AMD仍然是全 一家可以同时研发CPU和独立显卡的企业,在CPU性能发展日趋缓慢的时刻,显卡的运算能力仍有很大的想象空间,并且在浮点运算和人工智能领域有 的优势。

但在收购之时,AMD是CPU市场的第二,ATI则是显卡市场的第二。这笔收购的完成意味着AMD需要进行双线作战。老二收购老二,直接和两个老大竞争,这是非常危险的一次商业操作。

资金链的紧张直接影响了AMD的研发能力,在CPU市场上,AMD的性能逐渐落后于英特尔。2008年,为了保证公司的经营,AMD被迫卖掉了自己的晶圆厂,让AMD从此再也没有了晶圆生产能力,成为了一个单纯的芯片设计公司。

而在显卡市场,AMD也在和英伟达的竞争中落于下风。因为提供不了有足够竞争力的产品,AMD一度成为了“性价比”的代名词。

2014年,AMD已经风雨飘摇,市值由最高时的750亿美元跌到不足30亿美元,连续更换了4任CEO都没有挽回颓势。

雷军曾经说过,没有一家手机品牌能在销售额下跌后成功逆转,除了小米。这种大趋势放在整个 科技 领域亦然,几乎所有人都认为,AMD将会在苟延残喘几年后,消失在 历史 舞台上。

幸运的是,AMD找到了那个救世主。

2012年,AMD从飞思卡尔重金挖来苏姿丰,苏姿丰在AMD先后担任首席运营官、高级副总裁兼全球业务总经理等职务,并在2014年6月的改组中成为AMD 历史 上 女性CEO。

尽管外界认为AMD四面楚歌,但苏姿丰却有不同的看法: 虽然AMD经营状况不佳,却拥有高性能计算技术与核心知识产权,拥有定义下一代CPU和GPU的筹码。 这正是工程师出身的苏姿丰梦寐以求的大舞台。

为了扭转亏损,AMD开始为索尼和微软提供 游戏 主机的半定制芯片,这项业务利润率很低,属于英特尔和英伟达看不上的业务。AMD同时拥有CPU和独立显卡业务,很适合这样的本定制芯片,这项举措很快为AMD提供了稳定的现金流。

同时,苏姿丰着眼于解决AMD最致命的问题,因为她深知“问题就是机会所在”。苏姿丰为AMD提出了三大战略: 打造伟大的产品,加深与客户、合作伙伴的关系以及简化运营。

苏姿丰希望AMD将资源投入那些规模大而且重要的市场,这其中包括数据中心、个 脑、 游戏 等,整体市场规模预计可以高达750亿美元。

抢夺这些重要市场的举措有两个,按时推出新产品和专注于开发高性能芯片。AMD开始执行全新的产品周期,每年推出一代新的GPU,每一年半推出一代新的CPU。

苏姿丰召回了AMD的两位功勋元老,曾经参与并领导CPU架构设计的Jim Keller,以及在AMD任职12年,长期领导显卡芯片设计的华人王启尚,由他们负责AMD新一代CPU和显卡架构的研发。

AMD还成立了专门的业务发展委员会和工程设计领导团队,定期审视AMD的路线图,确保所有的投入均在正确的方向上,在正确合适的时间点向客户提供最适合的产品。

2017年2月21日,在旧金山举行的AMD Ryzen Tech Day大会上,苏姿丰微笑着发布了全新架构的Ryzen(锐龙)处理器。新架构让AMD的产品重新具备了竞争力,且性价比高于英特尔的产品。

半年后,AMD发布的财报显示,公司逐渐摆脱亏损,重新实现盈利。

03

英特尔四面楚歌

苏姿丰的步伐没有停止。

在发布全新的个 脑CPU后,AMD将新架构和新技术辐射到了其他市场,包括苏姿丰提到过的数据中心,以及商用电脑、笔记本电脑等市场。

在走上正确轨道后,AMD爆发出惊人的潜力。他们选择和台积电合作,押注7纳米制程,迅速完成了对英特尔的超越。

2019年,这是AMD的50周年生日,也是苏姿丰的50周岁生日。AMD在这一年扬眉吐气,发布了 上首块7纳米台式处理器,显卡也迈入了7纳米制程。更让AMD引以为豪的是,自己的技术整合涵盖了笔记本电脑、台式机电脑、云计算、高性能计算(HPC)和下一代 游戏 机。这成为AMD利润和股价大涨的原因。

在AMD出色表现的衬托下,英特尔疲态尽显。 因为研发不顺,英特尔在14纳米这一制程上停滞了整整5年,直到今年才推出10纳米产品,但表现依然不佳。

今年7月,英伟达的市值达到2500亿美元超越英特尔,此后一路上涨至3200多亿美元。不久前英特尔发布的第三季度财报更是给投资者 破 了一大盆冷水: 营收同比下降4.5%,环比下降7.1%;毛利率同比下降5.7%;净利润同比下降28.6%。

截至12月29日,英特尔的市值一度跌破2000亿美元大关,在对冲基金的救场下才勉强涨回。

尽管现金流充足,但英特尔似乎已经到了悬崖边。 在处理器制造领域,英特尔已经跟不上台积电和三星的节奏,个 脑和数据中心CPU则被AMD持续抢夺份额。

更糟糕的是,英特尔的传统客户,如苹果、微软和亚马逊等公司已经在开发自己的内部芯片解决方案,并交由台积电和三星代工制造。

11月末,苹果基于ARM架构推出了M1芯片,这款处理器在很多场景下的性能已经超过了16 寸 MacBook Pro 所搭载 i9-9980HK,同时功耗表现要好于英特尔的处理器。未来,苹果会不会把Macbook的全线产品换上自己的处理器?

目前为止,对英特尔威胁最大的还是AMD和英伟达。 在苏姿丰的领导下,AMD重回数据中心处理器市场,并且将它的战略地位提升到前所未有的高度,称自己的新产品为“ 最强x86处理器” “现代数据中心的新标准”。

而这一市场是英特尔的现金奶牛和增长引擎,占到了英特尔第二季度收入的52%。AMD基于7纳米制程推出的产品,性能明显 于英特尔。

黄仁勋领导的英伟达在市值超越英特尔后,仍在快速增长,目前已经超过了3200亿美元,把英特尔远远甩在身后。主要原因在前景广阔的人工智能应用中,英伟达占得了先机,英特尔则迟迟未能进入这些场景。

十年前,英伟达的首席科学家戴维·柯克说服黄仁勋做出了一系列在当时看来风险 的疯狂决策。首先是让一块只能渲染图形的独立显卡,变成一个通用计算图形处理器(GPGPU);另一方面则强烈要求英伟达现有与即将推出的所有GPU都必须支持CUDA程序。

CUDA是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。它让GPU不再单独存在于个人用户的显卡中,仅为自己的“一亩三分地”工作;而是让GPU通用化,把“个人计算机”变成可以并行运算的“超级计算机”。

现在,英伟达已经在CUDA基础上开发和积累了针对不同领域的大量算法与软件,人工智能领域主流的深度学习框架基本都是基于CUDA进行GPU并行加速。

如今,英伟达收购ARM,一方面有机会进军英特尔和AMD重点争夺的数据中心处理器市场;另一方面,ARM是全球最大的芯片IP供应商,全球超过90%的手机和平板电脑处理器都采用Arm架构,如果这笔交易最终完成,英伟达将成为横跨服务器、PC、消费电子和智能手机等多个重要领域的 科技 公司。

不希望看到这笔交易完成的,恐怕不止英特尔,还有苹果、三星、高通等ARM的大客户。

对英特尔来说,它面临着成立52年以来的又一个重大危机。英特尔不是没有遇到过生死存亡的时刻,70年代末,以储存器为主业的英特尔果断砍掉储存器业务,进军处理器市场,与微软的合作打破了IBM对个 脑的垄断,成为 科技 巨头。

如今的英特尔,再次来到了命运转折的十字路口,但当年的传奇CEO安迪·格鲁夫已经远离英特尔20年。

这一次,谁能带领英特尔触底反弹?

如果说英伟达的Grace CPU超级芯片的架构是CPU+GPU是巧合,那么英特尔和AMD推出的Falcon Shores XPU芯片、Instinct MI300芯片同样是CPU+GPU结构时,CPU+GPU一体的架构就很难称之为巧合了。

更为“碰巧”的是,以上三种芯片其都是用于数据中心的场景,这就意味着在未来两年内,AMD、英伟达和英特尔都将拥有混合CPU+GPU芯片进入数据中心市场。

可以说CPU+GPU的形式已经成为未来芯片设计的趋势。

英特尔推出XPU

英特尔宣布了一款特殊的融合型处理器“Falcon Shores”,官方称之为XPU。其核心是一个新的处理器架构,将英特尔的x86 CPU和Xe GPU硬件置入同一颗Xeon芯片中。

Falcon Shores芯片基于区块(Tile)设计,具备非常高的伸缩性、灵活性,可以更好地满足HPC、AI应用需求。

按照英特尔给出的数字,对比当今水平,Falcon Shores的能耗比提升超过5倍,x86计算密度提升超过5倍,内存容量与密度提升超过5倍。

Falcon Shores芯片将在2024年推出。

AMD推出APU

在数据中心领域,AMD同样展示其野心。

APU是AMD传统上用于集成显卡的客户端CPU的“加速处理单元”命名法。自2006年Opteron CPU的鼎盛时期以来,AMD一直梦想着使用APU,并于2010年开始推出 款用于PC的APU。随后在索尼Play Station4和5以及微软Xbox XS中推出了定制APU系列 游戏 机,也推出了一些Opteron APU——2013年的X2100和2017年的X3000。

最近,AMD公布的路线图中显示,其将在2023年推出Instinct MI300芯片,这是AMD推出的 款百亿亿次APU,AMD将其称为“ 上 个数据中心APU”。

而这个APU是一种将CPU和GPU内核组合到一个封装中的芯片,仔细来说是将基于Zen4的Epyc CPU与使用其全新CDNA3架构的GPU相结合。

AMD表示Instinct MI300预计将比其Instinct MI250X提供超过8倍的AI训练性能提升,与支持Instinct MI200系列的CDNA2 GPU架构相比,用于Instinct MI300的CDNA3架构将为AI工作负载提供超过5倍的性能功耗比提升。

Instinct MI300将于2023年问世。

英伟达Grace超级芯片

一直专注于GPU设计的英伟达,在去年宣布进军基于Arm架构的CPU时引发了一阵轰动。在今年3月,英伟达推出解决HPC和大规模人工智能应用程序的Grace Hopper超级芯片。这款芯片将NVIDIA Hopper GPU与Grace CPU通过NVLink-C2C结合在一个集成模块中。

CPU+GPU的Grace Hopper核心数减半,LPDDR5X内存也只有512GB,但多了显卡的80GBHBM3内存,总带宽可达3.5TB/s,代价是功耗1000W,每个机架容纳42个节点。

英伟达同样承诺在2023年上半年推出其超级芯片。

从推出的时间节点来看,英特尔Falcon Shores芯片、AMD Instinct MI300、英伟达Grace Hopper超级芯片分别在2024年、2023年、2023年上半年推出。

CPU+GPU的形式,为什么引起了三大巨头的兴趣,纷纷将其布局于数据中心?

首先,在数字经济时代,算力正在成为一种新的生产力,广泛融合到 社会 生产生活的各个方面。数据中心是算力的物理承载,是数字化发展的关键基础设施。全球数据中心新增稳定,2021年全球数据中戏市场规模超过679亿美元,较2020年增长9.8%。因此,具有巨大市场的数据中心早已被 科技 巨头紧盯。

其次,数据中心会收集大量的数据,因此需要搭建于数据中心的芯片具有极大算力,将CPU与GPU组合可以提高算力。英特尔高级副总裁兼加速计算系统和图形(AXG)集团总经理Raja Koduri的演讲中提及,如果想要成功获得HPC市场,就需要芯片能够处理海量的数据集。尽管,GPU具有强大的计算能力,能够同时并行工作数百个的内核,但如今独立的GPU仍然有一大缺陷,就是大的数据集无法轻松放入独立GPU内存里,需要耗费时间等待显存数据缓慢刷新。

特别是内存问题,将CPU与GPU放入同一架构,能够消除冗余内存副本来改善问题,处理器不再需要将数据复制到自己的专用内存池来访问/更改该数据。 内存池还意味着不需要第二个内存芯片池,即连接到CPU的DRAM。例如,Instinct MI300将把CDNA3 GPU小芯片和Zen4 CPU小芯片组合到一个处理器封装中,这两个处理器池将共享封装HBM内存。

英伟达官方表示,使用NVLink-C2C互连,Grace CPU将数据传输到Hopper GPU的速度比传统CPU快15倍;但对于数据集规模超大的场景来说,即使有像NVLink和AMD的Infinity Fabric这样的高速接口,由于HPC级处理器操作数据的速度非常快,在CPU和GPU之间交换数据的延迟和带宽代价仍然相当高昂。因此如果能尽可能缩短这一链路的物理距离,就可以节约很多能源并提升性能。

AMD表示,与使用分立CPU和GPU的实现相比,该架构的设计将允许APU使用更低的功耗;英特尔同样表示,其Falcon Shores芯片将显着提高带宽、每瓦性能、计算密度和内存容量。

整合多个独立组件往往会带来很多长期收益,但并不只是将CPU与GPU简单整合到一颗芯片中。英特尔、英伟达及AMD的GPU+CPU均是选择了Chiplet方式。

传统上,为了开发复杂的 IC 产品,供应商设计了一种将所有功能集成在同一芯片上的芯片。在随后的每一代中,每个芯片的功能数量都急剧增加。在最新的 7nm 和 5nm 节点上,成本和复杂性飙升。

而使用Chiplet设计,将具有不同功能和工艺节点的模块化芯片或小芯片封装在同一芯片,芯片客户可以选择这些小芯片中的任何一个,并将它们组装在一个先进的封装中,从而产生一种新的、复杂的芯片设计,作为片上系统 (SoC) 的替代品。

正是由于小芯片的特性,三家巨头在自己发展多芯片互连的同时,还展开了定制服务。

英特尔在发布Falcon Shores时介绍,其架构将使用Chiplet方法,采用不同制造工艺制造的多个芯片和不同的处理器模块可以紧密地塞在一个芯片封装中。这使得英特尔可以在其可以放入其芯片的CPU、GPU、I/O、内存类型、电源管理和其他电路类型上进行更高级别的定制。

最特别的是,Falcon Shores可以按需配置不同区块模块,尤其是x86CPU核心、XeGPU核心,数量和比例都非常灵活,就看做什么用了。

目前,英特尔已开放其 x86 架构进行许可,并制定了Chiplet策略,允许客户将 Arm 和 RISC-V 内核放在一个封装中。

最近,AMD同样打开了定制的大门。AMD首席技术官Mark Papermaster在分析师日会议上表示:“我们专注于让芯片更容易且更灵活实现。”

AMD允许客户在紧凑的芯片封装中实现多个芯粒(也称为chiplet或compute tiles )。AMD已经在使用tiles,但现在AMD允许第三方制造加速器或其他芯片,以将其与x86 CPU和GPU一起包含在其2D或3D封装中。

AMD的定制芯片战略将围绕新的Infinity Architecture 4.0展开,它是芯片封装中芯粒的互连。专有的Infinity结构将与CXL 2.0互连兼容。

Infinity互连还将支持UCIe(Universal Chiplet Interconnect Express)以连接封装中的chiplet。UCIe已经得到英特尔、AMD、Arm、谷歌、Meta等公司的支持。

总体而言,AMD的服务器GPU轨迹与英特尔、英伟达非常相似。这三家公司都在向CPU+GPU组合产品方向发展,英伟达的GraceHopper(Grace+H100)、英特尔的Falcon Shores XPU(混合和匹配CPU+GPU),现在MI300在单个封装上同时使用CPU和GPU小芯片。在所有这三种情况下,这些技术旨在将最好的CPU和最好的GPU结合起来,用于不完全受两者约束的工作负载。

市场研究公司Counterpoint Research的研究分析师Akshara Bassi表示:“随着芯片面积变得越来越大以及晶圆成品率问题越来越重要,多芯片模块封装设计能够实现比单芯片设计更佳的功耗和性能表现。”

Chiplet将继续存在,但就目前而言,该领域是一个孤岛。AMD、苹果、英特尔和英伟达正在将自研的互连设计方案应用于特定的封装技术中。

2018 年,英特尔将 EMIB(嵌入式多硅片)技术升级为逻辑晶圆 3D 堆叠技术。2019 年,英特尔推出 Co-EMIB 技术,能够将两个或多个 Foveros 芯片互连。

AMD率先提出Chiplet模式,在2019年全面采用小芯片技术获得了技术优势。Lisa Su 在演讲时表达了未来的规划,“我们与台积电就他们的 3D 结构密切合作,将小芯片封装与芯片堆叠相结合,为未来的高性能计算产品创建 3D 小芯片架构。”

今年 3 月 2 日,英特尔、AMD、Arm、高通、台积电、三星、日月光、谷歌云、Meta、微软等十大巨头宣布成立 Chiplet 标准联盟,推出了通用小芯片互连标准 (UCIe),希望将行业聚合起来。

迄今为止,只有少数芯片巨头开发和制造了基于Chiplet的设计。由于先进节点开发芯片的成本不断上升,业界比以往任何时候都更需要Chiplet。在多芯片潮流下,下一代顶级芯片必然也将是多芯片设计。

好了,今天关于“两位华人,正在颠覆科技巨头英特尔”的话题就讲到这里了。希望大家能够通过我的介绍对“两位华人,正在颠覆科技巨头英特尔”有更全面、深入的认识,并且能够在今后的实践中更好地运用所学知识。