GPU服务器:全球市值最大的半导体公司

服务器是AI核心基础设施。根据IDC数据,2020年中国AI基础设施市场规模为39.3亿美元,同比增长26.8%,并将在2024年达到78.0亿美元,其中2020年服务器市场规模占AI基础设施的87%以上,承担着最为重要的角色。

互联网行业是AI服务器最大采购行业。根据IDC数据,2020年上半年,互联网占整体加速计算服务器市场近60%的份额,同比增持超过100%;政府行业和服务业分别依次位居第二位和第三位。

GPU服务器是AI加速方案首选。IDC预计2021年中国GPU服务器占比91.9%左右的市场份额,是数据中心AI加速方案首选。根据IDC数据,2019年中国GPU服务器市场规模达到20亿美元,预计2024年将达到64亿美元。

GPU服务器:全球市值最大的半导体公司_第1张图片

GPU服务器

GPU加速服务器能够提供优秀的浮点计算能力,从容应对高实时、高并发的海量计算场景,例如深度学习、科学计算、3D动画渲染、CAE等应用场景。

2019年平均每台服务器配置8.02个GPU。一台GPU服务器通常搭载多个GPU加速芯片,根据IDC数据,2019年中国AI服务器出货量为79318台,同比增长46.7%,每个服务器配置1-20个GPU,加权计算平均每台服务器配置8.02个GPU加速卡。

GPU服务器:全球市值最大的半导体公司_第2张图片

全球GPU巨头

Nvidia成立于1993年,1999年上市,市值近10年增长超过83倍,近6年增长超过49倍。截至2021年11月5日,Nvidia总市值7438亿美元,总市值美股排名第七,是目前全球市值最大的半导体公司。

进阶之路

技术革新、场景拓展、外延并购,Nvidia引领全球GPU发展。

➢ GPU架构:Nvidia坚持每2-3年推出一代新的GPU架构,持续保持技术领先,新的Ampere已经采用7nm工艺;

➢ 应用场景:从最初图形处理到通用计算,再到AI深度学习和自动驾驶,Nvidia不断推动GPU应用场景的突破;

➢ 外延并购:2000-2008年Nvidia密集收购额多家公司,涵盖显卡、图形处理、半导体等多个领域,2020年宣布计划收购ARM。

业务分类

Nvidia产品主要分为两大类:图形处理、计算&网络。下游市场包括游戏、专业可视化、数据中心、汽车四大类。

2020年Nvidia营收166.8亿美元(yoy+52.7%),净利润43.3亿美元(yoy+54.9%),其中图形处理业务营收98.3亿美元,计算&网络业务营收68.4亿美元。除去2019年游戏市场需求波动造成业绩下滑外,Nvidia近5年营收、利润均保持较快增长。

得益于基于Ampere架构新GPU产品带动游戏业务高增,以及数据中心对算力需求旺盛,2021上半年Nvidia营收、净利润快速增长。

下游分类与产品

Nvidia下游市场分为四类:游戏、专业可视化、数据中心、汽车,各市场重点产品如下:

➢ 游戏:GeForce RTX/GTX系列GPU(PCs)、GeForce NOW(云游戏)、SHIELD(游戏主机)

➢ 专业可视化:Quadro/RTX GPU(企业工作站)

➢ 数据中心:基于GPU的计算平台和系统,包括DGX(AI服务器)、HGX(超算)、EGX(边缘计算)、AGX(自动设备)

➢ 汽车:NVIDIA DRIVE计算平台,包括AGX Xavier(SoC芯片)、DRIVE AV(自动驾驶)、DRIVE IX(驾驶舱软件)、Constellation(仿真软件)计算业务

计算业务是Nvidia成长的主要驱动力:数据中心已成规模,智能汽车将进入收获期。

➢ 在数据中心市场,Nvidia拥有芯片、硬件、硬件的全栈布局。得益于全球AI应用场景的快速增加,对算力的需求飙升。是Nvidia成长最快的市场,2020年营收达到约66.96亿美元,近4年CAGR达到68.5%,远高于游戏市场的17.6%。2020年Nvidia数据中心市场营收占比已经超过40%,预计未来仍将继续提升。

➢ 在智能汽车市场, Nvidia形成了全栈式自动驾驶解决方案。AGX Xavier芯片于2018年开始出货,下一代自动驾驶芯片Orin计划用于2022年量产,算力将达到254TOPS,目前已经获得蔚来、理想、沃尔沃、奔驰等多个整车厂定点项目。我们认为2022年高阶自动驾驶汽车或将集中落地,Nvidia自动驾驶将进入收获期。中国大陆贡献

Nvidia中国大陆收入快速增长。2020年Nvidia来自中国大陆收入38.86亿美元,同比增长42.3%,近4年CAGR达到31.4%,同期Nvidia整体营收CAGR为24.6%。

Nvidia中国大陆收入占比呈上升趋势。2020年Nvidia中国大陆收入占比达到23.3%,相比于2016年的18.9%提升4.4pct,2021上半年Nvidia中国大陆收入占比25.6%,上升趋势明显。

我们预计中国大陆占比仍将提升。图显业务层面,人均收入提升将带动PC需求增加;计算业务层面,目前中国大陆在AI算法、应用层面具有领先优势,自动驾驶场景也将率先得到释放。

景嘉微:国产GPU 领军人物

景嘉微

景嘉微成立于2006年,公司主营业务分为图形显控、小型专用化雷达、GPU芯片三类。其中图显、雷达产品主要面向军用市场,GPU芯片产品包括JM5400、JM7200,其中JM5400主要应用于公司图显模块中,JM7200成功拓展了民用和信创市场。2021年9月,公司第三代GPU芯片JM9成功流片,目前正在进行性能测试。

GPU服务器:全球市值最大的半导体公司_第3张图片

景嘉微量产芯片

景嘉微已完成两个系列、三款GPU芯片量产应用。第一代GPU产品JM5400于2014年流片成功,主要支撑军用装备,已在国产军用飞机上实现了对ATI M9、M54、M72等芯片的替代;第二代产品JM7200于2018年8月流片成功,性能与 Nvidia的GT640显卡相近。在JM7200基础上,公司又推出能耗更低的JM7201,成功进入民用领域。

景嘉微:两个系列、三款GPU量产应用

景嘉微三款量产GPU芯片介绍

JM7200

目前JM7200已完成与国内主要的CPU和操作系统厂商的适配工作,与长城、联想、同方等十余家国内主要计算机整机厂商建立合作关系并进行产品测试,成功进入商用领域。JM7201是JM7200针对民用市场的升级,在保证性能基础上降低能耗。

GPU服务器:全球市值最大的半导体公司_第4张图片

2019年11月,景嘉微全资子公司长沙景美与湖南长城科技信息有限公司签署了《战略合作协议》,根据协议,2020年湖南长城拟采购10万套基于JM7200芯片的国产图形显卡;2020年3月,景嘉微全资子公司长沙景美与北京神州数码有限公司签署《采购合作框架协议》,神州数码以景嘉微“大陆地区经销商”名义代理公司GPU及显卡产品。中国长城是国内信创市场的核心整机厂商,神州数码是国内重要的IT分销商和信创参与方,合作是景嘉微GPU产品在民用信创大批量落地的体现。

2021年上半年景嘉微芯片营收2.14亿元,同比增长13.5倍,占总营收比例达到45.1%。

JM9系列芯片

预计JM9271系列芯片性能达到GTX1080水平,目标中高端市场。根据公司公告,JM9231和JM9271将采用业界主流的统一渲染架构,支持 OpenGL4.5接口,可以无缝兼容市面上主流的CPU、操作系统和应用程序。

GPU服务器:全球市值最大的半导体公司_第5张图片

➢ JM9231性能与国际同类公司2016年中低端产品性能相当,主要针对国产化办公电脑,便携式计算机、中低端的游戏机和高端嵌入式系统等消费电子领域。

➢ JM9271在JM9231基础上对科学计算能力进行大幅度提高和改进,可以达到国际同类公司2017年中高端产品的性能,主要针对人工智能、安防监控、语音识别、深度学习、云计算等对计算速度要求非常高的高端应用领域。

潜在风险

1、市场竞争加剧的风险

当前全球独立GPU市场由Nvidia和AMD垄断,景嘉微是国内唯一商用GPU公司,未来全球和国内GPU市场竞争或将加剧;

2、GPU市场发展不及预期

GPU应用正从图像显示向计算领域拓展,FPGA、ASIC芯片也应用于计算领域,未来或将挤占GPU在计算领域应用;

3、Nvidia产品迭代不及预期

Nvidia推动GPU向数据中心、汽车等新兴场景应用,若产品迭代不及预期,或将影响Nvidia市场地位和业绩表现;

4、景嘉微第三代芯片性能不及预期

目前景嘉微JM9系列芯片正在性能测试过程中,若性能不及预期,将影响景嘉微向民用领域拓展。

附:GPU重要参数解析

⚫ CUDA Core和Tensor Core:为GPU提供计算能力的硬件单元。CUDA core也叫Streaming Processor(SP),是单精度,组成SM的重要部分。Tensor Core已发展到第三代,Tensor Core大幅减少了深度学习需要的时间。Core的数量越多,并行运算的线程越大,计算的峰值越高。

⚫ 像素填充速率:指GPU一秒钟内能处理多少个像素,单位是GPixel/S(每秒十亿像素),或MPixel/S(每秒百万像素)。像素填充速率是较好衡量GPU图像显示功能的整体指标,说明了显卡能以多快的速度对图像进行光栅化处理。

⚫ 纹理填充率:指对多边形图像进行纹理贴图、实现3D效果的速度,和像素填充率类似,单位是GTexels/S或MTexels/S。游戏采用了多纹理贴图的方式,使画面具有更好的光影效果。

⚫ 显存容量:其主要功能就是暂时储存GPU要处理的数据和处理完毕的数据。显存容量大小决定了GPU能够加载的数据量大小,在深度学习、机器学习的训练场景,显存的大小决定了一次能够加载训练数据的量,在大规模训练时,显存会显得比较重要。

⚫ 显存位宽:显存在一个时钟周期内所能传送数据的位数,位数越大则瞬间所能传输的数据量越大,这是显存的重要参数之一。

⚫ 显存频率:一定程度上反应着该显存的速度,以MHz(兆赫兹)为单位,显存频率随着显存的类型、性能的不同而不同。显存频率和位宽决定显存带宽。

⚫ 显存带宽:指显示芯片与显存之间的数据传输速率,它以字节/秒为单位。显卡的显存是由一块块的显存芯片构成的,显存总位宽同样也是由显存颗粒的位宽组成,显存带宽=显存频率×显存位宽/8。

⚫ 制作工艺:制作工艺,指的是晶体管与晶体管之间的距离,单位是纳米。制作工艺越小说明集成度越高,功耗越小,性能越好。

⚫ 功率:集显依靠CPU的主板连接提供电源,但独显性能较强,需要单独接电源。

⚫ 总线接口:显示卡要插在主板上才能与主板互相交换数据,现在主流接口为PCLe(PCI-Express)。接口提供数据流量带宽,目前主流采用PCLe4.0版本,16个通道。

⚫ Directx支持:简称DX,是一种应用程序接口(API)。DX由微软编写,由很多的API组成,包括显示、声音、输入和网络。DirectX 11还支持高质量实时渲染和预渲染场景,目前DX已发展到Directx 12版本,提高了多线程效率,可以充分发挥多线程硬件的潜力。

你可能感兴趣的