盛源制造有限公司

国产一区二区三区导航 AMD再下重注 苏姿丰在Agent时代再出狠招
盛源制造有限公司
你的位置:盛源制造有限公司 > 产品中心 > 国产一区二区三区导航 AMD再下重注 苏姿丰在Agent时代再出狠招
国产一区二区三区导航 AMD再下重注 苏姿丰在Agent时代再出狠招
发布日期:2026-05-20 10:34    点击次数:147

国产一区二区三区导航 AMD再下重注 苏姿丰在Agent时代再出狠招

5月19日国产一区二区三区导航,AMD在上海举办AI开发者日(AI DevDay 2026),这是该活动首次在北美以外举办,现场超过2000名开发者到场。AMD董事会主席及CEO苏姿丰、高级副总裁Jack Huynh先后发表主旨演讲,零一万物CEO李开复、阶跃星辰CTO朱亦博、清华大学教授汪玉登台分享。大会以\"开放-构建-创新-连接\"为主题,但真正值得关注的,是AMD在这场会上系统性地阐述了一条与NVIDIA方向不同的算力路线。

CPU:GPU从1:4到1:1,推理正在重写算力配比

苏姿丰在演讲中提到一个数据:传统数据中心里CPU与GPU的比例是1:4,到2026年这个比例将变成1:1。

在训练阶段,GPU承担几乎全部重负载,CPU负责调度和数据搬运,1:4的配比合情合理;但推理阶段的计算结构完全不同。一个智能体要完成一次任务,涉及目标解析、工具调用、多步骤决策、状态管理、数据流转——这些都需要CPU完成逻辑编排。GPU负责大模型推理和并行计算,CPU负责协调调度和逻辑控制,两者对等。

苏姿丰在现场展示了这个逻辑链:从\"大模型为中心\"到\"智能体编排\",Agent的运行依赖推理、工具调用、数据处理、目标管理,每一步都重度依赖CPU。GPU依然做它擅长的事,但CPU的工作量在推理场景下大幅增加,角色从辅助变为对等。

这个判断对产业的影响是具体的:服务器采购逻辑会变,CPU的调度能力成为新的权重因子,芯片公司需要重新平衡CPU和GPU的产品资源。目前行业资源高度集中在训练侧,推理侧的算力需求增速还没有充分反映到基础设施投资中。AMD在CPU领域有EPYC产品线,在GPU领域有Instinct系列,1:1的配比判断如果成立,AMD是少数两家都能提供且有动力推动这个趋势的厂商。

200B模型本地跑近100 tokens/s Token成本趋近于零

AMD在这次大会上提出了\"智能体主机\"这个品类概念国产一区二区三区导航,硬件定义很明确:96GB GPU专属显存、128GB统一内存、200B参数模型本地运行、7×24小时持续工作、断网可用。

已经有35款基于Ryzen AI Max+系列处理器的系统设计落地,来自惠普、华硕、联想、宏碁及多家本土品牌,涵盖笔记本、一体机和Mini AI工作站。

AMD高级副总裁Jack Huynh给出了一条AI部署路径:开发阶段用Ryzen AI Max本地跑200B模型;规模测试阶段用Radeon AI Pro R9700配合Threadripper Pro 9000工作站(128条PCIe 5.0通道,支持多GPU协同);部署阶段上MI350系列数据中心GPU。同一套ROCm软件栈,从笔记本到数据中心,代码一次编写全路径运行。

这条路径能不能成立,取决于本地推理的性能和经济性。阶跃星辰CTO朱亦博在现场给了一组数据:Step 3.5约1960亿参数,4位量化后在AI Max 395上解码速度接近100 tokens/s,比很多云端模型API还快。阶跃星辰即将发布的新模型也将继续在AMD平台上流畅运行。

这个性能数据背后是一道经济账:智能体运行的特点是持续调用、高频推理,按云API的Token计费模式,企业长期成本会非常高;本地部署把Token成本压到趋近于零,只消耗电费。Nick Ni在技术分享中提到,中国头部开发者一年在API调用上的花费达到数百万元。当200B参数的模型可以在本地以近100 tokens/s的速度运行时,很多AI应用的商业模式才能算得过账。

零一万物和AMD联合推出了Cube01企业智能体一体机,基于AI Max+ 395,可在本地同时运行数百个Agent。李开复在与苏姿丰的对谈中提了一个概念——DRI(Direct Responsible Individual,直接责任人),他的判断是,智能体时代开发者的角色会从写代码转向编排智能体并对结果负责。他还直言企业CEO应该主导AI转型:IT部门天然倾向于安全部署而非业务重构,很多企业的AI应用停留在会议纪要、内部搜索这类低价值场景,没有触及真正影响损益表的业务流程。

李开复对2024到2026年AI行业核心问题的演变有一个梳理:2024年是\"AI能不能完成一项任务\",2025年是\"AI能不能完成一条完整工作流\",2026年是\"AI能不能运营一个企业职能部门\"。顺着这个逻辑,智能体主机要承载的是持续运行、自主决策、对业务结果负责的AI系统,好男人在线观看而不仅仅是跑模型的终端设备。

300万模型Day 0适配 ROCm在拆CUDA的墙国产一区二区三区导航

ROCm是AMD在软件层面与NVIDIA竞争的核心工具。

这次大会披露了ROCm的最新进展:新增支持锐龙AI 400系列处理器,组件可在ComfyUI中直接下载;从ROCm 7.2版本开始同时支持Windows和Linux;通过Hugging Face和魔搭社区覆盖超过300万个模型;DeepSeek、通义千问、MiniMax、Kimi、阶跃星辰、小米MiMo等国内主流开源模型实现Day 0适配。

AMD还推出了面向中国AI开发者的免费公共开发者云,底层搭载Radeon GPU;与魔搭和阿里云的合作使得AMD GPU可以直接在魔搭创空间中使用,开发者无需自备硬件。

Nick Ni分享了一个值得注意的实践:AMD内部有数千个Agent持续监控开源社区,自动识别AMD支持中的缺口,生成完整的Pull Request并完成自动测试,工程师的产出从每周提交几个PR提升到每天提交几个。AMD还在用Agent辅助做GPU内核的性能优化——每个模型的推理负载有不同的内核特征,Agent能自动生成内核排列组合,做性能分析和迭代,速度远超人工。

开源对AMD来说是唯一可行的竞争策略。CUDA的壁垒在于开发者生态的惯性:代码已经在NVIDIA上跑通了,迁移到另一个平台需要时间和试错成本。AMD要打破这个惯性,必须把迁移成本压到最低。ROCm的思路是做抽象层:开发者不需要关心底层GPU型号,写一次代码可以在从笔记本到数据中心的任何AMD硬件上运行。支持OpenAI Triton、Gluon、TileLang等工具,让GPU编程的门槛进一步降低。

李开复在对谈中对开源有一个判断:硅谷闭源模型公司的模式类似于iOS,高利润、封闭控制;全球开源社区的模式类似于Android,覆盖面广、开放协作。他提到中国AI企业由于算力资源有限,无法像美国巨头那样暴力堆算力,工程效率和开源协作是被迫进化出来的能力。他把中国AI生态比作一个去中心化的学习小组——企业在商业上竞争,在开源层面共享成果。AMD在中国市场集中投入开源生态,对应的是这个市场结构:这里有全球最活跃的开源社区和最愿意尝试新硬件的开发者群体。

数据不上云、延迟不等人 中国市场验证端侧推理

AMD AI开发者日此前只在旧金山举办过,上海是北美之外唯一一站,现场参会者超过2000人。苏姿丰在演讲中多次强调中国市场的重要性:AMD在华30多年,大中华区主要研发中心拥有超过4000名工程师,四地设有AI卓越中心;上海研发中心今年是成立二十周年。

AMD在中国讲的内容有明确的指向性:端侧推理、开放生态、本地部署。这三个方向在中国市场有具体的现实约束做支撑。

在现场,AMD演示了一个医疗场景:基于Ryzen AI Max的问诊系统,包含病例采集、知识图谱、患者简报三个Agent,所有数据在本地处理,演示过程中切断了WiFi。Jack Huynh提到,中国的医疗法规要求患者数据不能上云,本地推理在这个场景下是合规前提。

朱亦博也提到了类似判断:本地AI无需持续联网,响应更快,且不向云端发送数据。他相信未来会是端云协同的模式——本地模型处理高频、低延迟、隐私敏感的任务,复杂任务再调用云端大模型,Token成本可以大幅降低。

清华大学电子工程系教授、无问芯穹发起人汪玉提出了物理AI的方向:机器人、无人机的感知-决策-控制延迟要求在毫秒级,算力必须在设备本地。无问芯穹与AMD合作开发了物理AI推理框架RLinf,四个月内在GitHub获得超过3300个Star,被超过20家公司采用。汪玉提出了一个公式:AI生产力 = 智能规模 × Token生产效率 × Token价值转化。其中Token生产效率——每秒生成的Token数——直接与硬件和软件的协同优化相关,这也是AMD芯片在无问芯穹平台上被重点优化的方向。

苏姿丰预测:到2030年全球将有50亿人每日使用AI。Jack Huynh补充了一个对比:PC普及花了45年,互联网花了27年,智能手机花了15年,AI的普及速度远超此前任何技术。推理Token需求在2026年上半年比2025年同期增长了20倍,推理成本正在从技术问题变成战略资源问题。

AMD在上海这场会上释放的信号可以归结为:AI产业的下一个增长点在推理侧和端侧,算力会从集中的训练集群散落到每一台设备、每一个工厂、每一个机器人里。在这个阶段,GPU堆量不再是唯一答案,CPU的调度能力、软件栈的开放性、端侧部署的经济性,都成为同等重要的竞争维度。AMD的路线选择——端侧推理、开放生态、本地部署——每一项都指向NVIDIA当前布局的薄弱环节。两条路线都有各自的市场空间,但推理侧和端侧的增长速度,将决定这条相反路线能走多远。