CFCF2024 AI时代光互连:从网络架构变革到OIO以及硅光/EML/光铜连接的变革
7/03/2024,光纤在线讯,由光纤在线,产业研究中心C&C,江苏省通信学会、南京光通信与光电子技术学会共同举办,飞宇集团、苏州创新联合体、海拓仪器、海光芯创、是德科技、永鼎股份共同协办,OIF、宇特光电共同参与主题策划的“CFCF2024光连接大会”6月23-25日在苏州知音温德姆至尊酒店圆满举行。
在2024年6月24日举办的《AI时代的光互联论坛》,由光纤在线和OIF联合策划,由铭普光磁的副总经理陈聪博士主持,陈博士表示:在当今这个AI技术快速的提升的时代,AI已经成为各行各业关注的焦点,其影响力已经深入到我们的日常生活和工作中。今天早晨的三场主题论坛演讲为我们描绘了一个充满希望的未来图景。那么光通信产业的光互联,作为AI应用的受益者之一,带给行业技术革新和市场增长的双重利好,面对多种技术革新的选择和市场机遇,正是我们本次论坛深入探讨的核心议题。
AI时代的光互联论坛,共计15场精彩演讲,从CPO与OIO的应用开始,剖析当下热门的LPO/LRO、高速调制芯片、单波200G光电芯片、400G/800G光互联需求变化,以及配套的怎么来降低光模块功耗的工艺、设备等等,议题非常丰富。
来自中兴通讯CPO技术预研总工,资深架构工程师,汤宁峰先生,分享了时下及未来最具潜力的《CPO&OIO的应用和挑战》,汤总介绍到:2019年3月,微软和Facebook领导发起的Co-PackagedOpticsCollaboration,是从封装的角度定义未来的光模块;而于2015年由Ayarlabs发布第一款光学I/O通信的CPU芯片,则正式开启了从互连方式的角度定义的光模块的时代。两种方式均是为了逐步优化功耗、成本、延时等特性,应用场景却不完全一样,但作为片间互联,OIO比CPO的市场空间更大。展望未来的应用场景,102.4T交换将是CPO光互联的节点,但CPO面临的困境依然存在,包括生态链(供应商与客户)、高密度集成的技术和规模的测试等等,还待业界一起努力,但针对业界提到的可靠性问题,CPO交换机具备绝对的优势(CPO交换机的可靠性提升了35倍)。而OIO当前已经有更多的企业开始布局,包括Nvidia,Ayar,Broadcom,Microsoft,Intel,GF,TSMC等,但依然面临着PCIe光口、UCIe光口以及光源的标准制定,以及新兴技术,如空芯光纤、量子点光源等的进一步开发和成熟。
AOI的产品总监聂鹏则针对光模块热门的LPO和LRO做出细致的优劣分析和应用场景的机会。聂总表示:人工智能(AI)和机器学习(ML)快速推动了高速率光模块的需求,但随着速率的提升,降低功耗成为业界重要的研发方向,继LPO之后,LRO/TRO在降低功耗方面得到了业界的广泛关注,并在近期实现了良好的互操作性。从时延、成本、功耗的角度来看,LRO均处于折中的水平,DSP(100ns)>
LRO(50ns)>
LPO(1ns),无论哪种方案均有其优势适用于特定的应用场景,但最终选择哪种方案,还有待计算机显示终端的选择。
领先的IDM模式VCSEL芯片制造商,华芯半导体的研发副总尧舜重点介绍了IDM制造高可靠性全系列高速VCSEL芯片。尧总表示:AI的爆发推动了数通VCSEL芯片向更高速率快速迭代,而工艺和技术方案均有所变化,从25G、56G的InGaAs量子阱,到112GPAM4全新的外延设计和芯片工艺完成小孔径+寄生优化,在未来的224GPAM4则需要从芯片设计架构上进行革新。华芯半导体已经实现25G、56GPAM4VCSEL芯片的规模出货,而在批量高可靠方面,华芯半导体采用IDM纯自产的方式,拥有国际领先的VCSEL外延专用金属有机物化学气相沉积(MOCVD)设备、建有1条完整的材料外延、芯片流片制程生产线及可靠性、老化测试线GVCSEL芯片已经突破千万级的出货量在现网中工作。
上海微技术工业研究院,硅光总监汪巍演讲主题为《硅基光电异质集成技术》,他表示硅基光电子技术兼具微电子的高集成度、低成本和光电子的大带宽、低损耗的优势,成为解决信息传输、功耗、带宽等的重要瓶颈。硅基光电子技术已从通信的数据中心应用走向5G通信应用,并向非通信的光子计算/量子计算、生物、激光雷达、光纤陀螺等多场景发展。而面向更高的带宽,业界最为关注的激光器与硅光器件的结合工艺,包括倒装集成、异质键合、转移打印等多种工艺正逐步走向成熟。而在氮化硅集成工艺方面,主要解决Crack控制、应力控制和工艺温度的管理;硅基III-V与铌酸锂异质集成则重点解决键合技术和成套的异质集成工艺。上海工研院的硅光工艺平台以特色工艺为核心,面向生物传感应用的成套SiN波导工艺:可见光为主;面向光通信/数通应用的成套SiO2、SiON波导工艺;面向数通,传感应用的厚SiN波导工艺等,同时拥有8英寸硅基LNOI加工能力。
中国联通研究院胡雅坤分享《面向智算互联的400G和800G技术发展及应用探讨》时介绍说:2023年400G热度居高不下,2024年800G以及芯光纤的热度持续攀升。这一切都源于AI应用,而AI应用的背后则是智算中心的建设需求,那么智算时代需要怎样的光网络。一方面在于速率的提升是光通信产业永恒不变的发展路径;另一方面,到了400GC+L一体化成为新的挑战。因此催生了包括空芯光纤等新型技术和光纤的发展;而面向800G的需求,光网络建设初期可能重点需求在于城域网,但随着光器件演进,波特率提升,可能会出现更多的长距离的适用场景。
腾讯的网络架构师付思东分享主题为《数据中心硅光芯片技术》,他表示:AI网络接入层互联距离增加,最大距离拓展到200米,而在112Gbps速率下,VCSEL技术在标准的OM4光纤互联距离不足,因此采用单模引入了硅光技术填补互联的空白。小尺寸面积、低封装成本、兼容LPO应用是硅光芯片的追求目标,腾讯量体裁衣推出BR4标准平衡优化各项性能指标。面向未来,优化耦合损耗、更小尺寸、更低损耗、更丰富的集成功能,和更高的密度,则是硅光技术追求的演进方向。
苏州海光芯创光电科技股份有限公司,首席技术官孙旭的演讲主题为《AI时代硅光大规模互联机遇》,他表示:AI时代对高速光互联的需求激增,但交换芯片的带宽每年翻倍增长,能耗逐年递增,且供电限制导致互联距离拉远,硅光芯片技术在带宽、集成度、芯片成本、功耗等方面均具备优势,但封测产能成为其发展的关键瓶颈。同时,面向硅光产业规模化发展,孙总倡导业界共同建设标准化产业链生态,发挥硅光规模化优势。可从四个方向着手:首先是Standard(标准化)包括封测、可靠性认证等标准;其次是Simple(简单化)的设计,减少性能冗余,测试简化等;第三是Scalable(规模化),包括Wafer级封装规模化,无源耦合技术和全自动标准化封测线等规模化;最后是Share(多平台共享),共享半导体产业链,并与其他PIC技术共享封测平台,以扩展更多的应用。
三菱电机半导体事业部高频光器件全球市场团队负责人,马智昊分享了三菱电机在《高速高性能光芯片研究》,AI的驱动导致高速率高性能的光电芯片快速迭代,对于更高速率的1.6T,3.2T采用16通道难度较大,所以依然会考虑4通道或8通道,则需要200G、400G单波的需求。三菱专注于高速率的EML芯片供应,当前三菱的单波200GEML芯片已经在主流的计算机显示终端批量出货,在400GEML芯片的开发中,根据当前的测试,即使在传输500米以上,也能在155GbaudPAM6(400Gb/s)的情况下获得清晰的眼图,这一根据结果得出了每通道400Gb/s强度调制直接检测(IM-DD)操作的可能性。在接入网市场,从G-PON到10G-PON的演进花了大约10年的时间,而50G-PON市场预计将于2030年左右开始腾飞,因此对具有低成本和紧凑尺寸的TO-CAN封装的需求产生,三菱正在通过新设计的SOA集成实现高功率和良好波形的平衡。
百度网络系统部光网络架构师万昳的演讲主题为《AIGC驱动下的光电互联未来》,最新一代的智算集群网络架构HPN是为AI而生,因此整个网络架构需求与传统的DCN需求大有不同,光互联解决方案呈现差异化。包括Copper与光连接的比重也在发生明显的变化,但在机柜内的芯片互联,未来Copper也会拥有用武之地。针对硅光技术方案,112GSerdes硅光技术将会成为重点方案,因此在400G时代开始上量应用,并且期望在800G和1.6T的应用中带来收益,而除了功耗之外,业界需要仔细考虑的是硅光技术方案的稳定性、大规模供应能力。针对TRO/LPO的方案,基于400G慢慢的开始了技术评估,TRO可能会成为HPN的重要方案,但业界正在做评估、试点及应用;此外从长期演进来看3.2T及更高带宽,系统挑战更大,因此CPO技术可能会成为选择方向,但在技术条件可满足的情况下,可插拔仍为更优选。
SiFotonics的市场VP费涛先生,以《AI时代硅光芯片产业化应用部署》为题,发表了一场引人入胜的演讲。他满怀喜悦地指出,随着行业趋势和热点的演变,硅光技术正迎来AI时代的春天。市场咨询机构和行业领军企业的预测显示,未来硅光市场的规模有望实现高达十倍的增长。AI技术的发展催生了对高带宽的巨大需求,而硅光技术以其低功耗、高带宽、高集成度和并行传输的特性,完美契合了AI时代的需求。作为硅光芯片产业链的关键参与者,SiFotonics已经向业界提供了超过千万片的硅光芯片,并提供了从发射到接收的一站式解决方案,展现了其批量交付的强大能力。然而,硅光技术在发展过程中也面临挑战。首先是AI时代对产品迭代速度的更加高的要求,在大多数情况下要每两年甚至每年更新一代产品。其次是对产品质量的更高标准,特别是在低丢包率的严苛要求下。最后,技术的广泛应用也提出了更高的要求。在AI应用领域,SiFotonics特别注重发射端的技术创新,尤其在降低插入损耗方面做了深入的优化,以期提供更高效、更可靠的产品。如在100G/LanePAM4MZM调制器,能做到3dB的插损,降低对激光器功率的要求,以此来降低功耗。其次是带宽,SiFotonics基于成熟稳定的200G/laneMZM设计和工艺制造实现,在不同批次、不同工艺平台,都实现了稳定的带宽输出。在接收端方面,SiFotonics的100GGeSiPD芯片在2023年已经实现了百万端出货;在单波200GGeSiPD方面也已经实现了批量的交付,且支持正照GeSiPD的TSVFC结构兼容现有的200G/laneIII-V背照PD的所有TIA方案,且适用于所有已有正照封装的工艺平台。在OFC上,SiFotonics提代套片分别与Wistron交换机,Celestica交换机在400GDR4以及800GDR8LPO对传测试结果,得到了很好的TEDQ和误码指标。针对全球化布局,SiFotonics在国内拥有硅光芯片和组件封测产线年设立了越南硅光组件的生产线年底还推在越南、泰国建立硅光芯片生产测试线。
是德科技大中华区光通信测试技术负责人李凯,演讲主题是《AI时代单波200G光电互联测试挑战》,李总表示,算力的需求是呈10倍的增长,而业界正在努力通过计算或网络总线提升系统算力,包括基于以太网和IB的Scale-out,以及基于PCIe、NVLink、Serdes提升的Scale-up。高算力数据中心需要更高速、更低功耗和时延的连接技术。在更高速率的评估手段和指标,可以基于112Gbps的测试方法为未来200G/400G测试做参考,如基于112G的VSR电口采用VEC指标,XSR/MR/LR电口标准使用SNDR参数进行信号质量评估;LPO的电参数采用EECQ结合SNDR的方法;这些参数可以在224G标准中借鉴;单通道224Gbps的Serdes和光调制是下一代800G/1.6T互联关键技术,预计24年底进入小批量阶段;是德科技全面提供超过224Gbps的光/电信号产生和测试能力,并根据最新标准提供最及时的测量算法。
铋盛半导体的总经理石超鹏先生,以《MicroTEC在高速光模块和LiDar的应用》为主题,重点分享了MicroTEC当前的应用进展。TEC作为热管理的一种方式,是一种主动降温的部件,应用于光模块的TEC对于尺寸、间距的要求极为严苛,铋盛半导体已能做到业界最小的1mm*1mm,以及间距小至0.05mm的标准。对于TEC来说,长期可靠性是一个巨大的挑战,铋盛的TEC产品均经理HTS-125度的可靠性测试,ACR变化率
<2%。在光模块领域尤其是配合eml使用的box封装,tec作为结构支撑,同是又是复合的电路。在激光雷达领域,microtec可以精准控制vcsel的温度,稳定其波长,精准判断障碍物的距离。石总还从tec规格书上为业界解读如何选择相应的tec是否满足各种应用场景。石总坦言tec国产化是自2019年之后才真正开始,国产化之路还有很长的路要走,但聚沙成塔,集腋成裘,与业界同仁共勉。铋盛半导体当前的月产能可达200k~400k片,产品种类多达300+,同时加速交付周期,此外也是业界率先定制了自动化生产工艺,以提升生产效率和良品率。
锐捷网络研究院刘敬伟先生,分享了《AI光互连技术趋势》,AI场景下从单集群训练转向跨域多集群联合训练,DCN/DCI光网络结构面临革新,单个数据中心的供电/供地/供冷不足以满足需求,对于未来采用长距和相干光模块互连两个或多个异地智算中心的需求明确。通用以太短距光互连:在112G时代,LPO由于具有延时、成本和功耗优势,是当前的研究热点,一致性和相互连通特性要进一步验证;224G时代,LPO是否可行值得商榷,要进一步仿真验证,而LRO更具可行性,并且拥有非常良好的一致性和相互连通性能。随着速率的进一步演进,NPO/CPO是光模块的终极形态,要解决可靠性和产业链生态等问题。在相干下沉的背景下,未来可能在数据中心中跳过可插拔相干光模块,立即进入相干CPO系统形态。面向非以太网短距光互连:通用计算节点互连PCIe走光是确定性趋势,直驱架构是优选方案,预计PCIe7.0有望实现。随着电IO接口带宽的提升,OIO终将取代传统电接口,英伟达有望率先使用(因为NVLink的传输速率远高于PCIe)。而对于跨域光互连技术:由于单个数据中心规模受供电、供地、供冷的限制,跨域多集群联合训练成为必然趋势,相干将下沉至10~20km互连,由于AI互连的大带宽、高可靠、低延时的需求,IPoDWDM将成为AI时代的DCN领域的新机会。
海拓仪器的销售总监张传松,演讲主题为《AI时代下高速光模块环境测试的挑战》,从高速光通信环境测试、可靠性测试方向,向与会者深入探讨了AI时代对高速光通信环境测试和可靠性测试的新要求。他强调,在AI技术的推动下,环境测试正面临着前所未有的变革。张总监分享了海拓仪器在这一领域的创新实践,包括实现满足带交换机的三温测试,这不仅满足了客户对温度测试的特定需求,同时也对测试设备的能耗进行了深入的优化。他指出,如果测试设备能耗过高,将导致整体电力负载过大,因此在节能方面海拓仪器进行了多方面的技术革新。为了更好地支持客户提升产品的质量和交付效率,海拓仪器推出了一款集成了热流仪、误码仪、测试板等多种测试设备的三温性能检测系统。这一系统不仅仅可以支持400G、800G、1.6T等不同封装形式的高速光模块测试需求,而且展现了海拓仪器在高速光模块测试领域的专业能力和技术领先性。通过这一些创新解决方案,海拓仪器致力于帮助客户在AI时代中应对环境测试的挑战,实现产品的高效、可靠交付。
Abracon亚太区高级技术经理TracyLi的演讲主题为《AbraconClearClock-光应用的理想时钟解决方案》,为与会者分享了配合高速DSP数据运算和传输的创新时钟方案,差分输出晶振是Abracon针对高速数据传输和运算应用推出的超低抖动时钟产品,其超低抖动性能可满足新一代通信、云计算、存储和射频应用设计性能需求。该系列时钟抖动典型值可低至50fs,且功耗表现处于业界领头羊。此外,它的相位噪声性能还可满足FPGA和ASIC对56Gbps以上串行数据速率的要求。同时,面对快速变化的市场和设计需求,ClearClock产品系列可支持最小到2.5*2.0mm,,3.2*2.5mm,5.0*3.2mm和7.0*5.0mm4种尺寸,最高频率2.1GHz输出。展望未来,时钟晶振芯片还需要向更小尺寸、更宽温度、更低功耗、更高频和更低抖动等方向演进。
至此,AI时代的光互联论坛主题演讲环节结束,随后展开了AI时代对光通产业变化及AI时代光连接的圆桌讨论环节。有关其他论坛及圆桌讨论的报道,敬请关注光纤在线公众号后续的报道。
CFCF2024 平行论坛: AI带动并深度促进高密度光连接(07-03)
构建信息互联,源国科技参与400G/800G高速光模块相互连通测试(07-02)
CFCF2024 智算时代的光网络:从接入到城域,构建算力时代全光底座(07-01)