数字经济时代的今天,创新已经成为推动企业可持续发展的核心要素。面对生成式AI时代带来的算力、存储、网络、管理、能效等挑战,必须构建全球化的开放协作平台,全力优化人工智能基础设施,合力推动AI的发展。
2024年8月8日,主题为“开放协同:协作、智慧、创新”的2024开放计算中国峰会在北京举行。大会由开放计算社区OCP及开放标准组织OCTC(中国电子工业标准化技术协会开放计算标准工作委员会)联合主办,来自不同行业的专家围绕数据中心基础设施、人工智能创新、开放计算生态、绿色计算发展、开放系统&CXL等议题展开了精彩的探讨。OCP基金会新兴市场副总裁Steve Helvie在会后接受记者采访时表示,AI的快速增长对数据中心提出了更高的要求,OCP基金会通过开放计算项目聚集全球企业协同合作,加速推动数据中心各项技术创新,共同应对IT生态系统的新变化。
秉承开放理念,激发创新活力
人工智能、深度学习、大模型等技术的飞速发展,给企业创新发展带来了无限可能,同时也对数据中心提出了更高的要求。面对无处不在的挑战,只有开源开放,通过全球企业的协同合作,才能从根本上解决各种难题。随着AIGC时代的到来,算力需求爆发,多元算力成为趋势,AI芯片的多元化、通用服务器的多元化趋势明显,更加需要开源开放。
成立十多年来,OCP始终活跃在开放计算领域,并受到社区成员的高度赞赏。据Steve Helvie介绍,基金会以工作项目为主要运营模式,目前已经规划了12个顶层项目,并且在每个顶层项目之下还规划了很多的子项目和工作流。每一个项目,都由社区中的会员单位志愿牵头负责,并通过投票的方式确认立项。目前,社区项目覆盖了数据中心制冷、计算等行业热点。
Steve Helvie表示,OCP成立的一个重要主题就是要把超大规模用户的最佳实践尽可能地延展到通用行业,赋能所有行业构建更加智能的基础设施。因此,只有产业链中的每个厂商都能够因为开源开放而获益,并得到内生动力,才是开放社区创新和运营的基础,也是开放社区的长久繁荣的核心关键点。
OCTC秘书长陈海认为,开放的目的是为了拉动产业发展,促进技术的迭代。因此,没有产权才能让更多的上下游产业链参与进来,推动和加速数据中心各领域的技术创新与成果普惠,快速实现产业化,最终让更多的客户受益。
浪潮信息服务器产品线总经理赵帅同样表示,开放能促进技术的迭代,让用户真正参与进来,更快地看到新技术的发展。浪潮信息未来的领先战略就是要用开放去让更多的先进技术快速产业化落地,在这个过程当中,我们引领产业的发展,引领技术的创新。
重构数据中心基础设施,破解AI算力挑战
生成式AI对数据中心算力提出了更高的要求,同时对数据中心的散热和能耗也带来了更多的挑战。在Scaling law约束下,数据中心基础设施所面临的全方位创新,将越来越依赖于更加广泛的全球化开放协作,加速AI技术创新与应用,共同构建一个人机高度交互的智能世界。
谈到生成式AI对算力提出的更高要求,Steve Helvie表示,生成式人工智能的快速增长正在重构数据中心的生态系统,这就要求全球企业协同合作,通过技术创新来应对挑战。他表示,OCP已经建立了多个AI项目,并发布了一系列的技术规范和创新成果,以此来应对数据中心算力、散热、能耗等挑战,更有效地支持各行业对IT基础架构不断增长的需求。
作为算力产业的领导企业,OCP、ODCC、Open19、OCTC全球四大开放计算组织的核心成员,浪潮信息希望通过技术的创新迭代拉动上下游产业的发展。为此,浪潮信息研制了多款符合开放加速规范的AI服务器,并发布了开放加速规范AI服务器设计指南,为AI加速卡和系统设计提供参考,让中国的芯片初创企业知道如何实现工程化的应用,能够快速实现产业化和芯片的落地,大幅缩短AI加速卡与AI服务器的适配周期。
赵帅表示,随着AI算力的爆发,我们需要更大的Scale up(单系统性能提升),需要Scale out(集群规模扩展)超大规模的互联。他强调,算力迭代是Scale up与Scale out并存迭代、快速发展的过程。现阶段,开放加速模组和开放网络实现了算力的Scale,开放固件解决方案实现了管理的Scale,开放标准和开放生态实现了基础设施的Scale,未来要以开放创新加速算力系统全向scale,应对大模型Scaling Law。
作为OCP的白金会员,阿里云秉持开放合作的策略,积极参与推动产业发展和繁荣,目前已是UEC、UCIe、CXL、MLCommons等多个行业组织的董事会成员或TAC成员。
谈到大模型带来的各种挑战,阿里云基础设施服务器研发产业合作总监吴灵熙表示,阿里云不仅在软件上进行深入研发和持续地投入,打造了支持在一云多芯的底层云平台,实现了多种算力的组合和多种算力的集群服务,而且在服务器硬件架构层面上推出了磐久高密度GPU整机柜的解决方案。除此之外,阿里云还发布了ALS系统,在Scale up网络上提供了更具有扩展性的架构。。
此外,为了满足AI对于多元化算力的需求,本次大会上还正式立项了开放算力模组规范(OCM),首批成员包括中国电子技术标准化研究院、百度、浪潮信息、英特尔、AMD、小红书、联想、超聚变等,以CPU、内存为核心构建最小算力单元,兼容x86、ARM等多架构芯片的多代处理器,方便用户根据应用场景灵活、快速组合。OCM开放标准的制定,能够为用户提供更多通用性强、绿色高效、安全可靠的算力选择。
全球化协作创新,加速行业数智化转型
正是秉承着开放协作的理念,OCP在过去几年中取得了长足的发展,会员成员数量在不断增加。
据了解,在过去的三年中,OCP的成员数量从250多家增长至360多家,增幅接近50%,社区项目和子项目数量超过40个。与此同时,OCTC的成员数量也在一年内迅速翻倍,从40多家增长至近百家,快速构建起包含基础设施、测评与服务、运维管理等在内的标准框架,并将通用计算、柜计算、AI异构、液冷等列入标准化建设的重点内容。
在过去一年中,OCTC和OCP也在开展全球开放计算的交流合作,双方以“破壁”、“开放”的态度共同推动开放计算的广泛应用,构建全球化的开放协作平台,通过数据中心产品技术协同创新、知识产权成果共创共享、标准规范共建等,加速行业数智化、绿色高效发展。
正如赵帅在采访中所述,开放的力量是全球化的。我们要把国内外开放组织的思想碰撞,技术碰撞,业务碰撞结合起来,才会产生更大的价值。因此,我们要让中国企业的开放走向全球,让全球化的开放走入中国。