国产一区二区三区导航 AMD再下重注苏姿丰在Agent时代再出狠招

盛源制造有限公司

盛源制造有限公司: 关于我们; 产品中心; 行业资讯; 联系我们

热点资讯

《色诱女教师》在线观看小鹏GX首台Robotaxi量产车下

替代者之迷情画皮免费归元S平台首款车型魏牌V9X上市 3

啊好涨好痛轻点全新一代问界M9将于5月27日上市

你的位置：盛源制造有限公司 > 产品中心 > 国产一区二区三区导航 AMD再下重注苏姿丰在Agent时代再出狠招

国产一区二区三区导航 AMD再下重注苏姿丰在Agent时代再出狠招

发布日期：2026-05-20 10:34 点击次数：147

国产一区二区三区导航 AMD再下重注苏姿丰在Agent时代再出狠招

5月19日国产一区二区三区导航，AMD在上海举办AI开发者日（AI DevDay 2026），这是该活动首次在北美以外举办，现场超过2000名开发者到场。AMD董事会主席及CEO苏姿丰、高级副总裁Jack Huynh先后发表主旨演讲，零一万物CEO李开复、阶跃星辰CTO朱亦博、清华大学教授汪玉登台分享。大会以\"开放-构建-创新-连接\"为主题，但真正值得关注的，是AMD在这场会上系统性地阐述了一条与NVIDIA方向不同的算力路线。

CPU:GPU从1:4到1:1，推理正在重写算力配比

苏姿丰在演讲中提到一个数据：传统数据中心里CPU与GPU的比例是1:4，到2026年这个比例将变成1:1。

在训练阶段，GPU承担几乎全部重负载，CPU负责调度和数据搬运，1:4的配比合情合理；但推理阶段的计算结构完全不同。一个智能体要完成一次任务，涉及目标解析、工具调用、多步骤决策、状态管理、数据流转——这些都需要CPU完成逻辑编排。GPU负责大模型推理和并行计算，CPU负责协调调度和逻辑控制，两者对等。

苏姿丰在现场展示了这个逻辑链：从\"大模型为中心\"到\"智能体编排\"，Agent的运行依赖推理、工具调用、数据处理、目标管理，每一步都重度依赖CPU。GPU依然做它擅长的事，但CPU的工作量在推理场景下大幅增加，角色从辅助变为对等。

这个判断对产业的影响是具体的：服务器采购逻辑会变，CPU的调度能力成为新的权重因子，芯片公司需要重新平衡CPU和GPU的产品资源。目前行业资源高度集中在训练侧，推理侧的算力需求增速还没有充分反映到基础设施投资中。AMD在CPU领域有EPYC产品线，在GPU领域有Instinct系列，1:1的配比判断如果成立，AMD是少数两家都能提供且有动力推动这个趋势的厂商。

200B模型本地跑近100 tokens/s Token成本趋近于零

AMD在这次大会上提出了\"智能体主机\"这个品类概念国产一区二区三区导航，硬件定义很明确：96GB GPU专属显存、128GB统一内存、200B参数模型本地运行、7×24小时持续工作、断网可用。

已经有35款基于Ryzen AI Max+系列处理器的系统设计落地，来自惠普、华硕、联想、宏碁及多家本土品牌，涵盖笔记本、一体机和Mini AI工作站。

AMD高级副总裁Jack Huynh给出了一条AI部署路径：开发阶段用Ryzen AI Max本地跑200B模型；规模测试阶段用Radeon AI Pro R9700配合Threadripper Pro 9000工作站（128条PCIe 5.0通道，支持多GPU协同）；部署阶段上MI350系列数据中心GPU。同一套ROCm软件栈，从笔记本到数据中心，代码一次编写全路径运行。

这条路径能不能成立，取决于本地推理的性能和经济性。阶跃星辰CTO朱亦博在现场给了一组数据：Step 3.5约1960亿参数，4位量化后在AI Max 395上解码速度接近100 tokens/s，比很多云端模型API还快。阶跃星辰即将发布的新模型也将继续在AMD平台上流畅运行。

这个性能数据背后是一道经济账：智能体运行的特点是持续调用、高频推理，按云API的Token计费模式，企业长期成本会非常高；本地部署把Token成本压到趋近于零，只消耗电费。Nick Ni在技术分享中提到，中国头部开发者一年在API调用上的花费达到数百万元。当200B参数的模型可以在本地以近100 tokens/s的速度运行时，很多AI应用的商业模式才能算得过账。

零一万物和AMD联合推出了Cube01企业智能体一体机，基于AI Max+ 395，可在本地同时运行数百个Agent。李开复在与苏姿丰的对谈中提了一个概念——DRI（Direct Responsible Individual，直接责任人），他的判断是，智能体时代开发者的角色会从写代码转向编排智能体并对结果负责。他还直言企业CEO应该主导AI转型：IT部门天然倾向于安全部署而非业务重构，很多企业的AI应用停留在会议纪要、内部搜索这类低价值场景，没有触及真正影响损益表的业务流程。

李开复对2024到2026年AI行业核心问题的演变有一个梳理：2024年是\"AI能不能完成一项任务\"，2025年是\"AI能不能完成一条完整工作流\"，2026年是\"AI能不能运营一个企业职能部门\"。顺着这个逻辑，智能体主机要承载的是持续运行、自主决策、对业务结果负责的AI系统，好男人在线观看而不仅仅是跑模型的终端设备。

300万模型Day 0适配 ROCm在拆CUDA的墙国产一区二区三区导航

ROCm是AMD在软件层面与NVIDIA竞争的核心工具。

这次大会披露了ROCm的最新进展：新增支持锐龙AI 400系列处理器，组件可在ComfyUI中直接下载；从ROCm 7.2版本开始同时支持Windows和Linux；通过Hugging Face和魔搭社区覆盖超过300万个模型；DeepSeek、通义千问、MiniMax、Kimi、阶跃星辰、小米MiMo等国内主流开源模型实现Day 0适配。

AMD还推出了面向中国AI开发者的免费公共开发者云，底层搭载Radeon GPU；与魔搭和阿里云的合作使得AMD GPU可以直接在魔搭创空间中使用，开发者无需自备硬件。

Nick Ni分享了一个值得注意的实践：AMD内部有数千个Agent持续监控开源社区，自动识别AMD支持中的缺口，生成完整的Pull Request并完成自动测试，工程师的产出从每周提交几个PR提升到每天提交几个。AMD还在用Agent辅助做GPU内核的性能优化——每个模型的推理负载有不同的内核特征，Agent能自动生成内核排列组合，做性能分析和迭代，速度远超人工。

开源对AMD来说是唯一可行的竞争策略。CUDA的壁垒在于开发者生态的惯性：代码已经在NVIDIA上跑通了，迁移到另一个平台需要时间和试错成本。AMD要打破这个惯性，必须把迁移成本压到最低。ROCm的思路是做抽象层：开发者不需要关心底层GPU型号，写一次代码可以在从笔记本到数据中心的任何AMD硬件上运行。支持OpenAI Triton、Gluon、TileLang等工具，让GPU编程的门槛进一步降低。

李开复在对谈中对开源有一个判断：硅谷闭源模型公司的模式类似于iOS，高利润、封闭控制；全球开源社区的模式类似于Android，覆盖面广、开放协作。他提到中国AI企业由于算力资源有限，无法像美国巨头那样暴力堆算力，工程效率和开源协作是被迫进化出来的能力。他把中国AI生态比作一个去中心化的学习小组——企业在商业上竞争，在开源层面共享成果。AMD在中国市场集中投入开源生态，对应的是这个市场结构：这里有全球最活跃的开源社区和最愿意尝试新硬件的开发者群体。

数据不上云、延迟不等人中国市场验证端侧推理

AMD AI开发者日此前只在旧金山举办过，上海是北美之外唯一一站，现场参会者超过2000人。苏姿丰在演讲中多次强调中国市场的重要性：AMD在华30多年，大中华区主要研发中心拥有超过4000名工程师，四地设有AI卓越中心；上海研发中心今年是成立二十周年。

AMD在中国讲的内容有明确的指向性：端侧推理、开放生态、本地部署。这三个方向在中国市场有具体的现实约束做支撑。

在现场，AMD演示了一个医疗场景：基于Ryzen AI Max的问诊系统，包含病例采集、知识图谱、患者简报三个Agent，所有数据在本地处理，演示过程中切断了WiFi。Jack Huynh提到，中国的医疗法规要求患者数据不能上云，本地推理在这个场景下是合规前提。

朱亦博也提到了类似判断：本地AI无需持续联网，响应更快，且不向云端发送数据。他相信未来会是端云协同的模式——本地模型处理高频、低延迟、隐私敏感的任务，复杂任务再调用云端大模型，Token成本可以大幅降低。

清华大学电子工程系教授、无问芯穹发起人汪玉提出了物理AI的方向：机器人、无人机的感知-决策-控制延迟要求在毫秒级，算力必须在设备本地。无问芯穹与AMD合作开发了物理AI推理框架RLinf，四个月内在GitHub获得超过3300个Star，被超过20家公司采用。汪玉提出了一个公式：AI生产力 = 智能规模 × Token生产效率 × Token价值转化。其中Token生产效率——每秒生成的Token数——直接与硬件和软件的协同优化相关，这也是AMD芯片在无问芯穹平台上被重点优化的方向。

苏姿丰预测：到2030年全球将有50亿人每日使用AI。Jack Huynh补充了一个对比：PC普及花了45年，互联网花了27年，智能手机花了15年，AI的普及速度远超此前任何技术。推理Token需求在2026年上半年比2025年同期增长了20倍，推理成本正在从技术问题变成战略资源问题。

AMD在上海这场会上释放的信号可以归结为：AI产业的下一个增长点在推理侧和端侧，算力会从集中的训练集群散落到每一台设备、每一个工厂、每一个机器人里。在这个阶段，GPU堆量不再是唯一答案，CPU的调度能力、软件栈的开放性、端侧部署的经济性，都成为同等重要的竞争维度。AMD的路线选择——端侧推理、开放生态、本地部署——每一项都指向NVIDIA当前布局的薄弱环节。两条路线都有各自的市场空间，但推理侧和端侧的增长速度，将决定这条相反路线能走多远。

上一篇：替代者之迷情画皮免费归元S平台首款车型魏牌V9X上市 34.98万元起

下一篇：被体育老师C了一节课作文美股芯片股已严重超买！美银警告：历史7次类似信号后平均暴跌44%