(报告出品方/作者:申万宏源证券,洪依真,*忠煌,杨海燕)
1.立足高端处理器,CPU/DCU同步发展
海光信息主业是研发、设计和销售应用于服务器、工作站等计算、存储设备中的高端处理器。目前产品包括CPU/DCU,其中CPU系列兼容x86指令,广泛应用于电信、金融、互联网、教育、交通等行业;DCU以GPGPU架构为基础,兼容“类CUDA”环境。
采取“销售一代、验证一代、研发一代”研发策略。海光建立了完善的高端处理器的研发环境和流程,截至年3月,海光CPU系列产品海光一号、海光二号已经实现商业化应用,海光三号完成实验室验证,实现销售,海光四号处于研发阶段;海光DCU系列产品深算一号已经实现商业化应用,深算二号处于研发阶段。
公司年实现营业收入23.1亿元,收入高增,利润扭亏。随公司主要产品放量,年公司实现收入23亿元,净利润3.27亿元。收入主要来自应用于高端处理器的系列。年公司、、、系列分别占比65.01%、8.30%、16.34%、10.34%。其中系列对标Intel至强铂金(Platinum)、至强金(Gold),面向关键任务和数据中心关键应用,目前是驱动公司销售收入高增主要产品。同时年后系列DCU产品开始形成销售。
预计公司未来三年保持无实际控制人状态。上市发行前,公司主要股东中科曙光、成都国资分别持有公司32.10%、19.53%股份,上述两大股东持股比例较为接近,均在一段时期内持有公司30%以上股权。根据招股书,公司第一大股东变化并未对公司经营管理造成实质性影响,股东各方均无法对公司形成控制,且承诺在公司上市之日起36个月内不谋求获得或者参与争夺公司的控制权。
Fabless经营模式,专注于高端处理器的研发、设计和销售,通过向客户提供高端处理器产品获取业务收入。公司主要通过向客户提供高端处理器产品获取业务收入,并将晶圆制造、封装测试等其余环节交由晶圆制造企业、封装测试企业及其他加工厂商完成。海光信息与AMD合资成立海光微电子和海光集成,从事x86CPU的相关业务。其中,海光微电子:主要负责x86处理器核开发,处理器制造、封装及测试的外协工作;海光集成:主要负责处理器整体设计,及处理器产品的推广和应用。公司主营业务收入系向外部客户销售海光CPU产品形成;海光微电子定位为生产成本中心,产品只能销售给海光集成。海光微电子和海光集成间销售合资产品的定价方式是按照产品销售总价在公司间按一定的比例分割,海光微电子主营业务收入占海光集成主营业务收入的比重为30-40%。
目前已完成海光3号、海光4号两代产品独立迭代。年6月在公司被列入美国《出口管制条例》“实体清单”后,AMD不再提供相关技术服务,公司自行实现了后续产品和技术的迭代开发。海光一号和海光二号的成功量产,证明了公司已经完成了对AMD授权技术的消化、吸收;海光三号成功流片、海光四号完成了电路设计和性能模拟,证明了公司全面掌握了高端处理器设计技术,具备了产品迭代研发能力。公司本次公开发行不超过3亿股人民币普通股(A股),发行价格36元/股,募集资金亿元,投入新一代通用处理器研发等项目。
2.依托X86架构,在国产CPU三路径中地位领先
2.1.国产CPU的三条路线
当前,国产CPU公司走出三条不同的道路,核心区别在于选择何种架构以实现国产化需求:1)X86架构:兆芯、海光。X86指令集的发展受限于Intel、AMD。优点是技术门槛低、性能起点高、没有生态壁垒,缺点是自主创新的程度低,且购买授权的成本较高。以这条路线发展,不存在生态壁垒,在技术上通过不断迭代逐步缩小差距。海光是采用这种方式获得市场,但是这种购买授权的方式,没有从根本上解决自主创新的需求。
2)ARM架构:飞腾、鲲鹏。此种模式为指令集架构授权,自主化程度相对较高,ARM主要有三种授权等级:其中指令集层级授权等级最高,企业可以使用指令集进行CPU设计,从而加入ARM生态。此前海思、飞腾已经获得ARMV8永久授权,ARM此前确认ARMv9架构不受约束,华为海思依然可获授权。以这条路线发展,存在较高的技术门槛,尽管ARM架构目前发展迅速,但在桌面和服务器端的生态与X86仍有差距。指令集架构的永久授权,一定程度上满足了自主创新的需求,依然存在未来更新版本被断供的风险。3)MIPS、LoongArch等自主架构:龙芯、申威。此种模式是自主研制的指令集,高度自主创新,但是技术门槛最高,生态构建极其困难。龙芯已经切换到纯自主的LoongArch;申威目前在专用高性能方面比较突出。
基于目前国产CPU替代市场的主要特征,我们认为,使用X86架构的产品,性能和生态显著较好,短期内可利用成本优势打开一部分企业市场,但长期看受外部影响较大,存在较大的不确定性;使用ARM架构的国产CPU,将在短期内受益于重点领域信创市场的快速增长;使用自主架构的国产CPU,生态建立需要一定的时间,中长期看,有望实现**及特殊领域的大面积甚至全面替代。
2.2.目前国产CPU芯片与Intel仍然存在差距
想要探讨国产CPU未来的走势,就必然要面对一个十分现实的问题:国产CPU到底弱在哪里?我们认为,国产CPU与全球领先水平的差距主要概括为:性能差距、生态差距。性能上,国产CPU,尤其PC芯片存在明显劣势。
具体到CPU产品来看,国产CPU与全球领先水平有哪些方面差距?我们认为主要包括:1、单核性能不行还是核数不够多?目前国产CPU的关键问题还是在于单核的性能较弱。Intel还在做4核产品的时候,国内核高基计划就已经实现了8核产品的研制,但是整体性能完全劣后于Intel同期产品。2、工艺不行还是设计能力不行?目前国产CPU的主要差距在于设计能力上。从纵向发展历程来看,相同工艺条件下,设计能力提升带来的产品性能提升十分显著,在fabless模式下,设计能力的差距显得尤为重要。工艺水平对性能有较大影响,在相同设计水平上,能带来20%-30%的稳定提升,但是更为重要的设计水平,能给产品带来一倍以上的性能提升。
3、产品性能完全决定用户体验?产品性能是影响用户体验的重要因素,但是系统优化同样重要。例如,在年iPad就风靡全球,但当时的CPU性能只有Intel的1/2到1/3左右,但是用户体验和评价都很好,就是得益于苹果的系统优化。而国产CPU由于积累不够,即使在产品性能已经能满足某些重点领域信创的要求的情况下,用户体验依然比Intel差一些。
性能差距只是外在表现,我们认为造成这种差距的内因,主要有以下几点:1、微架构设计能力存在显著差距。所谓微架构,即在指令集架构体系之内的一种结构设计,是CPU内部晶体管的一种排列方式,属于指令集架构体系的框架之内,例如Intel的Icelacke、Broadwell。Intel和AMD不断更新微架构,实现性能的不断迭代提升,国产CPU的微架构在乱序执行、高速缓存、多核互联等技术上,由于起步较晚,都与先进水平有一定差距。
2、定制化水平差导致精细度不足。Intel针对特定领域和客户,会采用高度定制化的设计,例如人工设计版图、采用锁存器Latch替换触发器flipflop、全定制设计关键单元等方案。定制化的实现需要多年的技术积累和人力投入,目前国产CPU很难实现,基本还是采用传统的EDA工具生成版图和做版图优化的方式,精细度远低于定制化产品。
3、使用通用EDA(ElectronicDesignAutomation)工具缺乏协同。全球EDA软件市场中,美国产品份额超过95%,“三巨头”即Synopsys、Cadence、Mentor。Intel等欧美大厂许多都有自研的EDA工具或拓展,以及成熟的flow,设计过程中出现的问题可以与EDA部门直接协同解决,显著提升了设计效率和设计能力,不断拓展边界,而国产CPU厂商目前普遍采用的是外购的EDA工具,缺少与设计工具的协同,且国产EDA工具竞争力较弱,这一环节也难以实现自主创新。
4、与Foundry配合不够密切。在生产模式上,Intel是典型的IDM厂商,AMD虽然是Fabless厂商,但与之前分拆出去的GlobalFoundries保持密切联系,两者都能实现设计与制造环节的密切配合与协同。国产CPU由于起步晚、规模小以及国内芯片制造能力弱,都是Fabless模式,难以与Foundry实现密切配合,限制了产品技术发展的速度。
落后的软硬件生态系统是制约国产CPU发展的另一瓶颈。X86是目前桌面和服务器领域的绝对主流架构,所以选用X86架构的受影响最小,可以直接使用Windows系统及软件,ARM架构的生态在全球范围内逐渐完善,而使用自主架构的面临巨大挑战。
生态系统很重要的一点是能够吸引全球程序员共同参与的各类应用软件开发的盈利模式、知识产权分享机制等制度安排。CPU设计需要耗费大量时间和人力开发编译器,芯片流片成功后,还需要移植Linux内核、Android系统等,后期系统的软件也涵盖了驱动层、中间层到应用层,还需要不断针对这种架构进行迭代优化。前期即使大量投入,如果软件上适配和推广不足,销量受限,软件开发者便会激励不足,用户更少,引起恶性循环,商业模式便会出现问题。除了Wintel联盟的强大压力,我国集成电路、软件等产业整体实力弱是另一核心掣肘。以龙芯为例,目前围绕龙芯已有百余家国产软件企业共同构筑产业生态系统,但这些企业多数起步晚、规模不大、客户渠道单一,与国际领先水平可能存在差距,难以带来较大的市场竞争力。
2.3.云化时代,X86领先优势明显
服务器发展到云化阶段,对性能提出更高要求,主要的性能指标大致包括:1)单颗处理器核心数一般在8核~64核,20核以上居多;2)支持多路互连,两路、四路、八路等;3)可靠性、稳定性要求高,常年无故障运行;4)高端内存,支持ECC等可靠性要求;5)功耗比较高,一般W以上。根据服务器的性能指标,服务器端CPU技术特点大致包括:1)微结构复杂、先进,制造工艺先进,核心数多,单核及多核性能皆优异;2)指令集功能齐全;3)片上集成缓存容量大;4)内存通道数多;5)I/O带宽高;6)支持多处理器一致性互连;7)可靠性高,RAS功能丰富;8)TDP功耗较高。
由于X86处理器起步较早,生态环境较其他处理器具有明显优势,应用X86处理器的服务器销售额占全部服务器销售额的比例约为91%,销售量占比超过97%,处于显著领先的地位。根据IDC全球服务器跟踪报告,年全年,全球X86服务器市场销售额为.5亿美元,较年增长3.31%;全球X86服务器市场销售量为.2万台,较年增长1.82%。
服务器企业尝试将ARM架构使用于服务器端,重现ARM在移动终端中的成功,但收效甚微。基于X86对于服务器芯片的长期绝对垄断,以及ARM在移动端的突出表现,部分服务器企业开始尝试推出ARM的服务器,比较突出的包括18年亚马逊推出的CPUGraviton和华为19年基于鲲鹏的泰山服务器。未来服务器市场,依然会是X86绝对领先,ARM只能作为少量补充。必须明确,ARM在移动端成功的核心是低功耗,这不是服务器的第一