共封装光学(CPO)与光模块
共封装光学(Co-Packaged Optics,CPO)是一种将光学引擎与交换芯片或计算芯片通过先进封装技术集成在同一封装体内的互连架构。CPO的核心特征是将光引擎和ASIC共封装在同一基板上,使电互联链路从传统方案的15–30厘米急剧缩短至毫米级,从而显著降低功耗[^c1]。传统可插拔光模块在800G速率下每端口功耗约为14–16W,而CPO可将同速率端口功耗降至5.2–5.6W,降低幅度超过60%[^c3]。CPO引擎功耗在远期路线图中可低于2W,较可插拔模块实现15倍能效提升[^c19]。可插拔光模块消耗的功率占AI数据中心GPU总计算功率的约10%,在一个400,000 GPU工厂中相当于40兆瓦[^c22]。CPO通过消除数字信号处理器(DSP)和缩短电信号路径,为AI基础设施突破功耗瓶颈提供了根本性解决方案。
AI工作负载在GPU芯片上产生高度动态的热模式,热点可超过平均热流数倍并在毫秒级内移动[^c21],而CPO中温度敏感的硅光子器件(激光器和微环调制器)需要精确的热管理[^c20]。LPO(线性可插拔光学)作为保留可插拔形态的简化方案,被行业视为"没有包袱的CPO"[^c23],已在2025年启动部署,预计2026年出货数百万只[^c17]。
2026年6月成为CPO产业化进程的标志性节点。英伟达于6月2日宣布Spectrum-X以太网硅光CPO交换机全面量产,这是全球首款基于CPO技术的以太网交换机,实现能效提升5倍、AI系统运行时间提升5倍、部署效率提升1.3倍[^c2]。随后在GTC Taipei上,英伟达确认已开始向合作伙伴交付该交换机,采用台积电COUPE平台开发,吞吐量达400 Tbps[^c12]。云服务商Lambda实测了同代Quantum-X Photonics InfiniBand CPO交换机,在144端口×800G配置下将功耗从约7kW降至约3.95kW,一个128,000 GPU集群可消除约655,000个可插拔收发器[^c11]。AWS、微软和谷歌在2026年第一季度即开始了首批商用CPO交换机部署[^c18]。2026年被机构定义为CPO产业化元年[^c7],该技术从实验室验证正式迈入规模化商用的新阶段。
在生态建设方面,英伟达CEO黄仁勋在Computex 2026上提出"能用铜用铜,必须用光用光"的技术策略,并披露过去三个月向光子学领域累计投入至少65亿美元——分别向Lumentum和Coherent各投资20亿美元,向康宁投资5亿美元[^c10][^c5]。Ayar Labs和Lightmatter先后加入英伟达NVLink Fusion生态系统,将CPO引入机架级AI scale-up互连架构[^c6][^c14]。Lightmatter的Passage L20通用光学引擎计划于2027年第一季度上市,提供12.8 Tbps聚合带宽[^c28]。Wiwynn联合8家伙伴展示了从芯片到数据中心的全栈CPO方案[^c13]。Credo以7.5亿美元收购DustPhotonics实现全栈硅光子整合[^c15]。博通发布业界首款3nm 400G/通道光PAM-4 DSP Taurus BCM83640,为204.8T交换机奠定基础[^c26]。AuthenX在Computex 2026上展示了基于12英寸CMOS工艺的可拆卸2D FAU,解决了CPO封装瓶颈[^c27]。
在组件层面,鸿腾精密旗下华云光电发布了102.4T CPO ELSFP 2.0外置光源模块,单通道输出功率达26dBm,支持16路1.6T应用,功耗低于35W,计划2026年第二季度送样[^c33]。FS.com推出了采用3nm Broadcom DSP和硅光技术的1.6T OSFP DR8模块,功耗低于25W,并在NVIDIA Quantum-X800交换机上完成验证[^c34]。亚洲光学以纳米压印(NIL)技术生产超颖透镜(MetaLens),应用于CPO准直镜及棱镜一体化元件,规划2026年底送样[^c35]。
在标准化方面,OFC 2026期间三大光互连多源协议(MSA)同时发布[^c4]:OCI(Optical Compute Interconnect)由AMD、博通、Meta、微软、英伟达和OpenAI联合发起,定义基于NRZ调制的协议无关心态光互连物理层[^c9];XPO(Xtra Dense Pluggable Optics)由Arista主导,定义12.8 Tbps超高密度可插拔模块标准;Open CPX由Coherent、Marvell等厂商发起,为CPO光引擎建立标准化可插拔插槽接口。台积电于2026年上半年披露"COUPE on Substrate"方案预计下半年进入量产,将CPO从芯片级扩展至基板级集成[^c30]。
在挑战方面,高速率异构集成带来的良率问题仍是CPO大规模量产的严峻门槛。以16颗光引擎的CPO系统为例,每颗良率95%时系统级整合良率仅约44%[^c31]。在成本结构中,光子芯片仅占模组总成本的20–30%,而封装环节成本占比高达60–70%[^c32]。在供应链层面,CW激光器被识别为当前CPO产业链的最大瓶颈,扩产周期长达16–18个月[^c16]。ELS封装良率当前约60–70%,需提升至85–90%才具备经济性。摩根士丹利测算CPO对可插拔光模块需求的稀释仅为2026年3%、2027年11%。Cignal AI预计到2030年每年可部署超过3000万个CPO端口[^c29]。全球光收发器市场在2026年达到154.2亿美元,预计到2031年增至292.6亿美元(CAGR 13.67%)[^c24];广义光模块市场预计达237亿美元,其中800G模块85亿美元、1.6T模块21亿美元[^c25]。IDTechEx预测到2036年CPO市场规模将超过200亿美元,2026年至2036年CAGR为37%[^c8]。尽管面临良率、热管理和供应链等工程挑战,CPO已成为超大规模AI数据中心和高性能计算集群互连架构演进的核心方向。