您的位置: 首页> 知识 > 正文

国君海外科技:AMD MI 300表现亮眼,但暂时难以撼动英伟达的市场统治格局_环球简讯

2023-06-16 09:24:18 来源:搜狐数码

报告导读


(资料图)

AMD系列新品重磅来袭,MI 300X表现亮眼,成为AI算力增量市场的有效补充,但暂未撼动英伟达在GPU市场的统治地位。

摘要

投资建议:AMD MI300系列为AI算力市场贡献增量,芯片市场“赢家通吃”英伟达仍占AI芯片主导地位,推荐标的英伟达(NVDA.O)。

以MI 300X为代表的AMD系列新品重磅发布,整体表现亮眼。AMD举行“AMD数据中心与人工智能技术首映会”,发布了一系列新产品。其中,MI 300X针对大语言模型进行优化,产品性能大幅突破。MI 300X与MI 300A类似,由多个chiplets组成,在chiplets间内存和网络链接可实现共享。但MI300X移除了MI300A 上原有的CPU chiplets,成为了纯GPU产品。从参数上看,MI300X基于CDNA 3,拥有192GB的HBM3 DRAM内存,5.2TB/s的内存带宽,Infinity Fabric带宽896GB/s和1530亿个晶体管,采用5nm和6nm的制程并含13个chiplets。

AMD的MI 300系列产品作为全球AI算力的新供给,是AI算力增量市场有效补充,但暂时难以撼动英伟达在AI芯片市场的统治格局。第一,在硬件端,英伟达具备系统性集成竞争优势。GH200集合了Grace Hopper架构,并应用第四代Tensor Core提升计算性能、进行模型优化,以及NVLink实现高速传输,这些系统性的优化并不仅是MI 300X部分硬件参数的提升所能比拟的,而这超异构创新正形成了英伟达在硬件端的竞争壁垒,实现了芯片和系统耦合。

第二,软件端CUDA打造高兼容性的GPU通用平台,形成的壁垒短期内ROCm无法打破。CUDA具备ROCm难以企及的开发人员数量,目前CUDA 拥有超过400万开发人员,历史上CUDA总下载量达到4000万,整体而言,在发布时间、硬件支持、操作系统和开发者数量等维度上CUDA均具备优势,展现出更加繁荣的生态。

此外,量产时间、合作伙伴网络和研发人员等因素均成为了英伟达的竞争优势的有力加持。MI300 X目前仍未送样,距离实现量产也还有较长时间,仍需经过产业实践;而英伟达H100已在去年9月实现量产,GH200目前也已投入量产,上市时间指日可待;英伟达已形成了多元而庞大的客户群和完备的合作伙伴网络,整体积淀暂时优于AMD;随着英伟达研发人员数量和研发投入的高增,我们看好后续英伟达产品的迭代速度。

风险提示:AI应用发展不及预期;产品出货时间不及预期;地缘政治冲突。

目录

报告正文

1

AI算力新供给,AMD MI300新品重磅发布

在2023年6月13日AMD举行的“AMD数据中心与人工智能技术首映会”中,AMD发布了一系列新产品,包括第四代AMD EPYC(霄龙)产品组合、EPYC“Bergamo”CPU、EPYC “Genoa” CPU 、EPYC “Genoa-X” CPU、P4 DPU等。其中最受人关注的莫属AMD AI Platforms中的硬件端MI300A、MI300X和Instinct Platform的发布。

1.1.MI300A专为AI和HPC打造

MI300A成为全球首个为AI和HPC打造的APU加速卡。公司CEO苏姿丰率先公布了MI300A,称这是全球首个为AI和HPC(高性能计算)打造的APU加速卡。MI300A总共包含1460亿个晶体管,含13个chiplets,24个Zen 4 CPU核心,1个CDNA 3GPU和128GB HBM3内存,采用5nm和6nm的制程,CPU和GPU共用统一内存。与MI 250相比,MI 300A提供了8倍的性能和5倍的效率。目前,MI300A已经送样。

1.2MI300X针对LLM进行优化,性能高于MI 300A

MI 300X表现亮眼,内存带宽大幅突破。MI300X与MI 300A类似,也是由多个chiplets组成的芯片,在chiplets间内存和网络链接可实现共享。但与MI 300A不同的是,MI 300X移除了 MI300A 上原有的CPU chiplets,成为了纯GPU产品。MI300X同样基于CDNA 3,拥有192GB的HBM3 DRAM内存,5.2TB/s的内存带宽,Infinity Fabric带宽896GB/s和1530亿个晶体管,同样采用5nm和6nm的制程并含13个chiplets。MI300X计划于23Q3送样、23Q4出货。

MI300X性能显著高于MI300A。对比MI 300X 和MI 300A,MI300A是由3个Zen4 CPU chiplets和多个GPU chiplets组成的,但在MI300X中,CPU被换成了2个额外的CDNA 3 chiplets,MI300X的晶体管数量也从1460亿增加到了1530亿。为满足大语言模型对内存的需求, MI 300X的DRAM内存从MI300A的128GB增加到了192GB,内存带宽从800GB/s增加到了5.2TB/s。

MI300X是针对大语言模型进行了优化的版本。MI 300X能够在内存中处理高达800亿参数的大型语言模型的芯片,苏姿丰将其称为“生成式AI加速器”,并表示其包含的CDNA 3 GPU chiplets是专门为AI和HPC工作负载而设计。此外,她在发布会中展示了MI300X如何使用Falcon-40B大型语言模型在内存中运行一个40亿参数的神经网络,而不需要将数据在外部内存中来回移动。

MI300X部分性能可对标英伟达H100GPU。苏姿丰表示,MI300X将提供英伟达H100 Hopper GPU2.4倍的内存密度和1.6倍的内存带宽。我们认为,AMD MI300X在内存密度和内存带宽等参数上已优于英伟达可比产品,MI 300X将一定程度影响AI加速卡市场份额。

1.3 AMD Instinct Platform实现现有基础架构的直接使用

Instinct Platform实现在现有的基础架构中直接使用MI300X的AI计算能力和内存。苏姿丰在发布会中同时发布了AMD Instinct Platform,Instinct Platform将结合8个MI300X和1.5TB的HMB3内存,并采用工业级标准化设计。通过利用行业标准的OCP基础架构,Instinct Platform可直接使用MI300X的AI计算能力和内存,在降低了客户总体开发成本的基础上也加速了客户的上市时间,实现了轻松部署的效能。

2

英伟达在GPU市场统治地位短期不会改变

英伟达持续加大研发投入,注重创新能力培育。据FourWeekMBA统计,截至2023年1月,英伟达全球员工总数共26196人,其中研发人员19532人,研发人员占比约75%,四年间英伟达研发人员数量近乎翻倍。其中很多员工来自英特尔和AMD,由于英伟达在GPU市场的龙头地位,其对于芯片开发者而言具备较高的吸引力,头部效应吸引大量高端人才注入,因此维护了自己的研发能力优势。

英伟达以超异构创新构建面向大规模AI计算的超级计算机。我们认为,英伟达的核心竞争优势在于,构建了AI时代面向大规模并行计算而设的全栈异构的数据中心。英伟达NVLink性能快速迭代,同时NVSwitch可连接多个NVLink,在单节点内和节点间实现以NVLink能够达到的最高速度进行多对多GPU通信,满足了在每个GPU之间、GPU和CPU间实现无缝高速通信的需求,同时基于DOCA加速数据中心工作负载的潜力,实现DPU的效能提升,GPU +Bluefield DPU+Grace CPU的结合开创性地实现了芯片间的高速互联。同时CUDA充当通用平台,引入英伟达软件服务和全生态系统。我们认为,芯片和系统耦合的实现使得英伟达真正实现了超异构创新。

英伟达自研Grace Hopper超级芯片,为AI数据中心而生。Grace Hopper是适用于大规模AI和HPC应用的突破性加速CPU。通过NVLink-C2C 技术将Grace和Hopper架构相结合,为加速AI和HPC应用提供 CPU+GPU 相结合的一致内存模型。它采用新型900 GB/s一致性接口,比PCIe 5.0快7倍,并可运行所有的英伟达软件栈和平台,包括 NVIDIA HPC SDK、NVIDIA AI和NVIDIA Omniverse。

英伟达CUDA构筑软件业务底层框架基石,打造高兼容性的GPU通用平台。借助英伟达 CUDA 工具包,开发者可以在GPU加速的嵌入式系统、桌面工作站、企业数据中心、基于云的平台和HPC超级计算机上开发、优化和部署应用程序。CUDA最初用于辅助GeForce提升游戏开发效率,但随着CUDA的高兼容性优势彰显,英伟达将GPU的应用领域拓展至计算科学和深度学习领域。CUDA可以充当英伟达各GPU系列的通用平台,因此开发者可以跨GPU配置部署并扩展应用。目前,通过 CUDA 开发的数千个应用目前已部署到嵌入式系统、工作站、数据中心和云中的GPU。

CUDA形成的壁垒短期内ROCm无法打破,成为英伟达与AMD市场份额差距的重要影响因素。在COMPUTEX 2023中,英伟达表示,目前CUDA 拥有超过400万开发人员,历史上CUDA 的总下载量也达到惊人的4000万。而ROCm作为AMD为对标英伟达而打造的开放式软件平台,2016年4月首次发布,相比2007年发布的CUDA目前使用的人数依旧较少。ROCm操作系统直至2023年4月才支持Windows,改变了仅支持Linux的尴尬局面,同时长期仅支持Radeon Pro系列GPU,近期才开始陆续拓展。此外,ROCm缺少类似于CUDA的社区支持和成熟的生态体系。我们认为,目前CUDA已形成极高的准入壁垒,也成为了英伟达持续扩展人工智能领域市场的品牌影响力来源,带动了英伟达GPU的高市场份额,短期内ROCm的软件支持难以匹敌CUDA。

MI 300较英伟达GH 200部分硬件参数差距有望对标,但整体仍存在一定差距。GH200超级芯片是英伟达系统性竞争优势的集大成者,将72核的Grace CPU、H100 GPU、96GB的HBM3和512 GB的LPDDR5X 集成在同一个封装中,它集合了最先进的Grace Hopper架构,并应用第四代Tensor Core提升计算性能、进行模型优化,NVLink实现了高速的传输,这都将进一步形成英伟达的竞争壁垒。通过将英伟达GH 200和MI 300进行对比,我们认为,MI 300还有许多参数有待后续公布,但从算力、内存等指标上有望和英伟达实现对标,但在架构、制程和晶体管数量上仍与英伟达GH 200存在一定差距。

芯片市场具有一定的“赢家通吃”性。1)以全球x86 CPU服务器处理器市场为例,据Mercury Research,英特尔占超80%的市场份额;2)以独立显卡市场为例,据JPR测算,英伟达长期占全球独立显卡的市场份额近80%;3)以基带芯片市场为例,据TechInsights,高通在2022年以61%的收入份额领先基带芯片市场。而目前,英伟达就基于其繁荣的生态,构筑了AMD暂时难以逾越的生态壁垒。

综上所述,我们认为英伟达短期内仍占AI芯片主导地位,主要基于如下原因:

1)英伟达具备系统性集成竞争优势,GH200集合了Grace Hopper架构,并应用第四代Tensor Core提升计算性能、进行模型优化,以及NVLink实现高速传输,这些系统性的优化并不仅是部分硬件参数的提升所能比拟的,而这超异构创新正是英伟达在硬件端的竞争壁垒,实现了芯片和系统耦合;

2)CUDA具备ROCm难以企及的开发人员数量,而英伟达基于CUDA而形成的软件生态的繁荣程度高于AMD的ROCm;

3)MI300 X目前仍未送样,距离实现量产可能也还有较长时间,仍需经过产业实践;而英伟达H100已在去年9月实现量产,GH200目前也已投入量产,上市时间指日可待;

4)英伟达已形成了多元而庞大的客户群和完备的合作伙伴网络,在其合作伙伴网络列表中,截止2023年6月14日,共公示了976家公司,英伟达的客户群和合作伙伴积淀暂时优于AMD;

5)研发人员的数量反映了公司长期的研发能力,随着英伟达研发人员数量和研发投入的高增,我们看好后续英伟达产品的迭代速度。

整体而言,AMD的MI 300系列产品作为全球AI算力的新供给,是AI算力增量市场有效补充,但暂时难以撼动英伟达的市场统治格局,推荐标的英伟达(NVDA.O)。

3

风险提示

AI应用发展不及预期;产品出货时间不及预期;地缘政治冲突。

来源:券商研报精选

责任编辑:

关键词:

资讯
业界
企业
骑闻
产品
唐山曹妃甸推动京津冀协同发展 产业协同转移全面提速
春暖渤海湾,书写新画卷。位于唐山曹妃甸的金隅天坛(唐山)木业科技有限公司的生产车间内一片繁忙景象——铺装、压机、翻板等工作正紧张有序
2022-03-19
石家庄海关共签发RCEP原产地证书864份 货值3.9亿元
自今年1月1日RCEP(《区域全面经济伙伴关系协定》)正式实施以来,截至3月14日,石家庄海关共签发RCEP原产地证书864份,货值3 9亿元。据介绍
2022-03-19
蚌埠海关累计签发RCEP原产地证书35份 涉及金额2583.09万元
在蚌埠海关报关大厅原产地证办理窗口,海关关员仔细核对着递交过来的材料。十分钟后,一份RCEP原产地证书打印盖章后交到了企业业务员手中。
2022-03-19
昆明西山区:“双招双引”推动人才链和产业链融合发展
为激励党员干部在营商环境建设中担当作为,昆明市西山区深入实施人才强区战略和人才领跑工程,建立健全招商引资和招才引资并轨新模式,以产
2022-03-19
绥化望奎以工业化思维为引领 推动肉类加工制造产业腾飞
望奎县以工业化思维为引领,推动全县以生猪为主的肉类加工制造产业一年全面开局、三年基本成势、五年产业腾飞,聚焦五化做强做优肉类加工制
2022-03-19
1-2月安徽省限上餐饮收入实现69.9亿元 同比增长17.4%
安徽省统计局近日发布信息,今年1-2月,全省限额以上消费品零售额1030 4亿元,同比增长10 4%,比2021年两年平均增速高0 9个百分点,比全国
2022-03-19
  中新网海口1月23日电(符宇群)海南省第六届人民代表大会第五次会议23日在海口举行第二次全体会议。海南省人民检察院检察长张毅在作报告
2022-01-24
  中新网太原1月23日电 (高雨晴 冉涌 张鹏宇)记者23日从国网山西省电力公司获悉,该公司冬奥保电应急发电队伍已到达河北张家口赛区,
2022-01-24
  中新网西宁1月23日电 (记者 李江宁)据青海省地震局23日消息,中国地震台网正式测定,北京时间2022年1月23日10时21分,在青海海西州德
2022-01-24
  中新网贵阳1月23日电 (周燕玲)对外开放,是内陆开放型经济试验区贵州正在召开的两会热点词汇,如何拓展海内外“朋友圈”助力贵州经济
2022-01-24
温馨生活好young 厦门推广文旅产品火爆全网
  中新网厦门1月23日电 (记者 杨伏山)“冬日暖阳厦门好young”福建省内宣传推广线下活动22日精彩收官。主办方称,本次活动火爆全网及福
2022-01-24
宁夏非遗传承人:刻刀里的守正创新更有“年味”
  (新春见闻)宁夏非遗传承人:刻刀里的守正创新更有“年味”  中新网银川1月23日电 题:宁夏非遗传承人:刻刀里的守正创新更有“年味
2022-01-24
沧州:8个重大科技专项项目确定 引领经济社会高质量发展
为充分发挥科技在经济社会高质量发展中的引领和支撑作用,沧州市确定8个项目为2021年全市重大科技专项项目。这8个重大科技专项项目分别为:
2022-03-19
  中新网海口1月23日电(王子谦 符宇群)海南省高级人民法院院长陈凤超23日说,2021年海南法院为自贸港建设提供坚强司法保障,全年有效管
2022-01-24
  新华社武汉1月23日电(记者王贤)随着春节假期临近,从广州、深圳等地返回湖北的旅客较多。为此,23日,武汉站、汉口站、襄阳东站、十堰
2022-01-24
  1月22日0—24时,广东省新增本土确诊病例3例和本土无症状感染者1例,均为珠海报告。23日,珠海市疫情防控新闻发布会上,珠海市政府副秘
2022-01-24
青海海西州德令哈市发生3.7级地震
  据中国地震台网正式测定,1月23日11时58分在青海海西州德令哈市发生3 7级地震,震源深度9千米,震中位于北纬38 40度,东经97 35度。
2022-01-24
  北京2022年冬奥会和冬残奥会颁奖花束已于近期完成交付。与传统的鲜切花不同,这些花束全部采用上海市非物质文化遗产“海派绒线编结技艺
2022-01-24
  中新网宿迁1月23日电 (刘林 张华东)核酸检测是当下及时发现潜在感染者、阻断疫情传播的有效方法。23日,记者从宿迁市宿豫区警方获悉
2022-01-24
  记者从天津市人社局获悉,从明天(24日)起,天津2022年度第一期积分落户申报工作正式开始,这是新修订的《天津市居住证管理办法》《天津
2022-01-24
  中新社北京1月23日电 (记者 刘亮)记者23日从中国海关总署获悉,2021年,中国海关组织开展“国门绿盾”专项行动,在寄递、旅客携带物
2022-01-24
  记者从天津市疫情防控指挥部获悉,天津疫情第341—360例阳性感染者基本信息公布。  目前,这20例阳性感染者已转运至市定点医院做进一
2022-01-24
“最美基层民警”武文斌:案子破了最管用
  中新网吕梁1月23日电 题:“最美基层民警”武文斌:案子破了最管用  作者 高瑞峰  同事称他为“拼命三郎”。从警14年,武文斌破
2022-01-24
  据“西安发布”消息,截至2022年1月23日,雁塔区长延堡街道近14天内无新增本地病例和聚集性疫情。根据国务院联防联控机制关于分区分级
2022-01-24
  中新网西宁1月23日电 (记者 孙睿)据青海省地震台网测定,2022年1月23日10点21分(北京时间)在青海省海西州德令哈市(北纬38 44度,东经
2022-01-24
江西南昌:市民赏年画迎新年 书法家挥毫送春联
  (新春见闻)江西南昌:市民赏年画迎新年 书法家挥毫送春联  1月23日,“赏年画过大年”新年画作品联展江西南昌站活动在江西省文化馆
2022-01-24
  中新网成都1月23日电 (祝欢)成都市第十七届人民代表大会第六次会议23日在成都举行,成都市中级人民法院院长郭彦与成都市人民检察院检
2022-01-24
列车临时停车3分钟救旅客
  (新春见闻)列车临时停车3分钟救旅客  中新网广州1月23日电 (郭军 黄伟伟)“车长,车长,4号车厢有位旅客腹涨难忍,身体不舒服”…
2022-01-24
女子背负命案潜逃24年 因涉疫人员核查落网
  中新网湖州1月23日电(施紫楠 徐盛煜 赵学良)1998年7月,犯罪嫌疑人杜某因家庭琐事,用菜刀将自己的弟媳砍伤致死。案发后,她从老家河
2022-01-24
广东“00后”雄狮少年锤炼功夫迎新春
  (新春见闻)广东“00后”雄狮少年锤炼功夫迎新春  中新社广州1月23日电 题:广东“00后”雄狮少年锤炼功夫迎新春  作者 孙秋霞 
2022-01-24
03-19 2022岳阳国际旅游节开幕 特色农产品展销等系列活动目不暇接
2022岳阳国际旅游节开幕 特色农产品展销等系列活动目不暇接
今天,天下洞庭岳阳市君山区第九届良心堡油菜花节暨2022岳阳国际旅游节开幕,菊红、粉红、水红、桃红、紫色、白色等七色组成的4万亩花海在 [详细]
03-19 2022年郴州计划重点推进文旅项目101个 总投资354亿元
2022年郴州计划重点推进文旅项目101个 总投资354亿元
3月16日,我市举行全市文旅项目和城市大提质大融城项目集中开工仪式,市委书记吴巨培宣布项目开工。郴州嘉合欢乐世界、仙福路工地清风徐来 [详细]
03-19 宿州泗县深入推进文旅融合发展 擦亮城市品牌
宿州泗县深入推进文旅融合发展 擦亮城市品牌
近年来,泗县以争创安徽省文化旅游名县为目标,深入推进文旅融合发展,努力擦亮水韵泗州 运河名城城市品牌,全县文化旅游业实现高质量发展 [详细]
03-19 淡季不忘引流 京郊民宿市场有望迎来回暖
淡季不忘引流 京郊民宿市场有望迎来回暖
旅游淡季中的京郊民宿有望成为市场中最先复苏的板块。3月17日,北京商报记者调查发现,虽然正值旅游淡季,且受疫情变化的影响,不过各家民 [详细]
01-24 西安浐灞回应“社区领导怒怼咨询群众”:涉事社区主任已停职
西安浐灞回应“社区领导怒怼咨询群众”:涉事社区主任已停职
  西安浐灞回应“一社区领导在市民咨询离市政策时发生争执”事件 涉事社区主任已停职  西部网讯(记者 刘望)日前,网络上流传一条视频 [详细]
01-24 陕西:截至23日12时 西安56.5万大中专学生已离校返家
陕西:截至23日12时 西安56.5万大中专学生已离校返家
  1月23日,陕西省举行第45场疫情防控工作发布会,发布会上陕西省教育厅相关负责人通报,陕西全省疫情有效控制后,大中专学校能不能放假 [详细]
01-24 河北魏县发布北京一阳性人员在魏县的主要轨迹
河北魏县发布北京一阳性人员在魏县的主要轨迹
  魏县疾病预防控制中心关于紧急寻找丰台区新冠肺炎阳性检测者同时间同空间人员的公告  2022年01月22日,接到邯郸市疾控中心转北京市疾 [详细]