好爱生活

​下注NPU、发布跑一万参数大模型的服务器,高通、AMD芯片大厂都在“争”什

点击: 来源:好爱生活
摘要:下注NPU、发布跑一万参数大模型的服务器,高通、AMD芯片大厂都在“争”什 么? 作者丨邱晓芬 编辑丨苏建勋 为期三天的 2024 年台北电脑展(Computex 2024),昨日已落下帷幕。在这一次

下注NPU、发布跑一万参数大模型的服务器,高通、AMD芯片大厂都在“争”什么?

作者丨邱晓芬

编辑丨苏建勋

为期三天的 2024 年台北电脑展(Computex 2024),昨日已落下帷幕。在这一次的展会上,AI 成为贯穿一切的主题。英伟达、AMD、英特尔、高通等芯片大厂的话事人们纷纷做了主题演讲,也让这次展会的参与人数比上一届暴涨了 80%。

除了用主题演讲表明对于未来 AI 的立场之外,各大芯片大厂或秀出了自己的新产品,或公布了未来的产品路线图。而这些公司在展会上的一举一动,也刺激着他们的股价表现。

在台北电脑展举办之前,芯片大厂们的股价已经有了不同程度的提振;而在为期三天的展会期间,AMD、英伟达的股价双双增长了 4% 左右,高通的股价也有 3% 的提升,Arm 更是有 10% 的股价提升。

在 Computex 2024 上,各大芯片大厂在 " 斗 " 什么?背后又蕴藏着各家什么思考?这又将如何影响未来的行业走势?

Computex 2024

AMD:迎战英伟达,CPU+NPU+GPU 多面下注

相比于英特尔在 GPU 产品线上的 " 保守 ",AMD 这次在 Computex 上显得相当激进,策略是在 CPU、NPU、GPU 方面同时下注。

比如,在 AI 服务器芯片领域,此次 AMD 发布了重磅的 Instinct MI325X,并且计划在 2024 年四季度上市。AMD 还直接把英伟达不久前发布的 H200 拉出来对标,在最关键的性能、内存、带宽等参数上全面发起进攻。

根据介绍,相比英伟达 H200,AMDInstinct MI325X 的计算性能是其 1.3 倍、内存容量是其 2 倍、带宽是其 1.3 倍。

能够跑多大的模型,也是当下这些先进 GPU 面临市场考核时的一大考核标准。据 AMD 方面介绍, 一台搭载着 AMDInstinct MI325X 的八卡服务器,最多可以跑一万参数的大模型,是同等条件下英伟达 H200 服务器的双倍。

在此次展会上,AMD 创始人苏姿丰也首次罕见明确了未来 AMD 在 GPU 上的产品节奏——每年都会迭代一款新的产品,2024 年年底是 AMDInstinct MI325X,2025 年将发布 Instinct MI350X 系列。

而值得注意的是,在不久前英伟达的财报会议上、以及此次的展会上,英伟达黄仁勋也都恰好也提及了,在 Blackwell 芯片之后,英伟达也将保持一年一迭代的产品节奏。双方火药味颇浓。

lisa su 发布 Instinct MI325X

这也不难理解,AMD MI 系列的芯片未来是支撑起他们营收的一大关键点。根据 AMD 方面此前乐观预计,在 2024 年年底,数据中心 GPU 将给 AMD 带来高达 20 亿美元的收入。苏姿丰此前也暗示,这颗芯片得到了行业的广泛关注和好评。

在此次 Computex 上,AMD 除了抓住数据中心的机会,另一手还抓住了 AI PC 在端侧的机遇,发布了两款王炸产品。

此次,他们发布了AMD Zen 5 架构的锐龙 9000 系列桌面处理器,这颗处理器被 AMD 方面自封为 " 地表最强消费级 CPU"。

由于基础架构的升级,这颗处理器的性能有了大幅度提升。AMD 官方专门把英特尔的酷睿 i9-14900K 拉出来做了对比。AMD 的这颗芯片在游戏场景中的速度快了 4%-23%,测试速度快了 7%-56%。

这次,AMD 还秀了他们的朋友圈,惠普、微软、联想等 PC 厂商都即将推出搭载这颗芯片的笔记本产品。

去年以来,为了加强 AI PC 在端侧的计算能力,AMD 还尝试开辟出独立的 NPU 产品,集成到他们的 CPU 上——早在去年,AMD 发布了首颗集成了 NPU 的 X86 处理器(锐龙 7040 系列)。

但在此次展会上,AMD 的 NPU 的计算能力有了超强升级。据 AMD 方面介绍,AMD 锐龙 AI 300 系列上搭载的 NPU,可以提供超过 50TOPS 的 AI 算力——纸面上是上一代产品的 5 倍。

一边迎战英伟达,一边掣肘英特尔,是 AMD 如今的双线策略。

英伟达:画了饼,但股价炸了

这次 Computex 上,英伟达不像英特尔、AMD 一般发布新产品,黄仁勋的演讲基本是重新介绍了他们不久前在 GTC 上的产品和服务细节(包括 NIM 微服务、AI 工厂等等)。

" 炒冷饭 " 之余,黄仁勋也透露出了更重要的信息点,公布了他们产品未来的规划——

据他介绍,英伟达将在 2025 年推出 Blackwell 芯片的迭代版本,Blackwell Ultra AI 芯片,并在 2026 年更新下一代全新架构 Rubin,在 2027 年推出基于这一全新架构的升级版 Rubin Ultra。

黄仁勋还稍微透露了全新架构 Rubin 的结构:全新的 GPU、新的基于 Arm 架构的 CPU、配备 NVLink 6、融合 InfiniBand 或以太网交换机的先进网络。

这也意味着,英伟达将会继续在高算力这一条路上蒙眼狂奔。而股价也给予了相应的反馈。在展会期间,英伟达的股价冲上了三万亿美元的大关,超越了苹果,仅次于微软。而英伟达股价飙升也堪称火箭速度,值得注意的是,在一年前,英伟达的股价还没有超过 1 万亿美元。

英特尔:巩固数据中心市场,开发存量

在过去,随着 AI 大模型的普及千行百业,数据中心的一大趋势是出现多元化算力,GPU 逐渐称为 AI 服务器的一项关键部件——一般情况下,一个 AI 服务器的芯片配置一般是 1-2 个 CPU,再搭配 8 块的 GPU。

与此同时,AI 服务器在数据中心的依旧保持高增长态势,IDC 此前数据显示,2023 年中国加速服务器市场中,GPU 服务器占据了九成市场。这一市场趋势之下,GPU 的增长势头远远盖过了 CPU。

英特尔虽然也在布局 GPU 的产品,但主力还是放在巩固他们在 CPU 的传统优势,开发服务器的存量市场。

这其实也不难理解,一位行业人士告诉《智能涌现》,由于 GPU 服务器的价格太高,目前对于一些数据量不大的模型,行业中也在尝试用表现更好的 CPU 来覆盖一部分 AI 计算任务。

此次,英特尔发布了他们的新一代数据中心芯片「至强 6」。

英特尔至强 6

「至强 6」分为两个版本:性能核(E 核)和能效核(P 核),分别侧重高性能和低能耗,让用户根据实际使用诉求取用。这颗芯片是基于英特尔的 Intel 3 制程工艺生产而成。

有 " 电老虎 " 之称的数据中心,能耗一直是行业在持续攻坚的难题,这正是此次「至强 6」的一大卖点。据英特尔方面介绍,和上一代产品第五代至强处理器相比,「至强 6」的功效能耗比大大提升——最高可以节省 280w 功耗,四年的时间,能够减排二氧化碳 34kmt。

为了开发存量市场,这次「至强 6」也能带来更强大的服务器机架整合能力,帮助老客户进行老服务器产品的升级。比如,此前使用英特尔第二代至强可扩展芯片需要 200 个机架,但「至强 6」只需要 66 个,机架整合率 3:1。

这意味着,数据中心可以节省更多空间的同时,还能进一步获得更高的算力。据英特尔方面介绍,相比于此前的服务器芯片,「至强 6」最多有 4.2 倍的性能提升。

在 GPU 产品上,不久前英特尔已经发布了 Gaudi3,但在此次 Computex 上,英特尔虽然没有公布太多产品进展,但英特尔 CEO 基辛格还是在演讲中暗搓搓提示——他们的 Gaudi3,未来会比竞争对手更便宜。

英特尔 CEO 基辛格

高通和微软:"Copilot+PC" 从概念走向现实

不久前,微软在开发者大会上提出了 AI PC 的新概念 "Copilot+PC"。而在此次 Computex 上,这也成为了行业一大关注热点。

值得注意的是,引领移动生态的芯片大厂高通,这次也不愿意放过 AI PC 的机遇,和微软有了合作绑定,Copilot+PC 全面搭载了高通的 NPU ——骁龙 X 系列平台。

所谓的 "Copilot+PC,微软是在电脑系统内置了 40 多个 AI 小模型,让笔记本也能够支持多元的 AI 能力。

比如,AI PC 可以根据邮件等信息,对你的行程安排提出建议;或者 AI 也可以为你提供主动服务,比如根据摄像头识别到你的状态,帮你提供对应的建议,或者是帮你和网站的客服沟通等等。

而为了满足 AI 端侧计算的需求,微软还和高通对 Copilot+PC 下了定义,起草了具体的参数标准——比如,电脑的 NPU 需具备 40TOPS 以上的算力、配备至少 16GB 的内存、和 256GB 的 SSD。此外,电脑还要有更长的的电池续航时间。

在 AI PC 上,算力上的一项趋势是,AI 负载有逐渐从 CPU、GPU,下放到 NPU 上。根据高通方面介绍,高通的 NPU 特点正是兼顾了低功耗和高性能——骁龙 XElite NPU 的每瓦特性能,是苹果 M3 芯片的 2.6 倍,是英特尔酷睿 Ultra7 处理器的 5.4 倍。

高通这颗 NPU 在 AI PC 上的落地速度也很快。在 Computex 上,华硕、宏碁、戴尔、联想、惠普等厂商都官宣了和高通的合作,微软的 "Copilot+PC" 概念正走向现实,快速复制到多个厂商上,而高通也顺势扩充自己在 PC 行业的地位。

Arm:披露 AI 进展,但还是很审慎

一直以来,Arm 在 AI 上的布局可谓相当谨慎,或者可以说是有些缓慢。在这次 Computex 上,Arm 终于有所行动。此次,Arm 推出基于人工智能优化的 Arm 终端计算子系统  ( CSS )  、以及相对应的 Arm Kleidi 软件系统。

Arm 终端事业部产品管理副总裁 James McNiven

Arm 终端计算子系统  ( CSS )  包括这些成分:Arm 最新的 Armv9 CPU、Arm Immortalis GPU、以及最新的 CoreLink 系统互连、系统内存管理单元  ( SMMU ) 。这些都将基于 3 纳米工艺生产,这也是迄今速度最快的 Arm 计算平台。

看起来有点复杂,可以这么理解 Arm 这次的产品思路——过去 Arm 是芯片厂商的上游,提供的是芯片 IP,但在 AI 时代下,下游的终端厂商希望能够更快推出产品,产业链需要更加集成化,而 Arm 也顺应了这一速求。Arm 终端计算子系统  ( CSS )  的推出,意味着 Arm 往前走了一步,提供了更加集成的 IP 方案,缩短下游产品的上市进程。

不过,Arm 对于人工智能的态度依旧审慎。尽管目前市面上几乎所有的手机芯片都是基于 Arm 架构打造,但端侧 AI 算力都是用各家自己的 NPU 来应对。

在一次公开采访中,Arm 终端事业部产品管理副总裁 James McNiven 回复《智能涌现》在内的媒体称,不会专门做一个 Arm 的 NPU 产品线,支持手机厂商们的自由选择空间。

end

相关文章

    ​一觉醒来,欧洲大变

    ​一觉醒来,欧洲大变

    ​东北985,跑出一支IPO天团

    ​东北985,跑出一支IPO天团

    ​雅诗兰黛,胆子也太大了

    ​雅诗兰黛,胆子也太大了

    ​掌管200亿基金的美的太子,在娱乐圈失手了

    ​掌管200亿基金的美的太子,在娱乐圈失手了

    ​胡塞武装“击中”中国外贸人的七寸

    ​胡塞武装“击中”中国外贸人的七寸

    ​人工智能时代,问题的多与少?

    ​人工智能时代,问题的多与少?

    ​抖音快手战火烧到AI

    ​抖音快手战火烧到AI

    ​我国多地发布高温预警信号 局地可达40℃以上

    ​苏丹恩图曼市遭炮击,已致约40人死亡

    ​苏丹恩图曼市遭炮击,已致约40人死亡

    ​淘宝直播全托管,能否复制“罗永浩”?

    ​淘宝直播全托管,能否复制“罗永浩”?

    ​马斯克,成了

    ​走向精品化,大厂游戏疯狂卷“质量”

    ​走向精品化,大厂游戏疯狂卷“质量”

    ​金价猛涨,吓得周大福搬厂又裁员

    ​金价猛涨,吓得周大福搬厂又裁员