在数字经济的推动下,越来越多的企业开启了数字化转型之旅,数据中心行业发展良好,市场规模不断扩大。数据中心作为数字经济的主要载体和算力底座,2024年将继续保持增长态势。根据市场研究公司Dell'Oro Group的最新报告,全球数据中心资本支出预计将在2024年反弹至11%的增长率,因为部分超大规模云服务提供商将重返扩张周期,并且企业市场的支出冻结也将迎来缓和。
那么,2024年数据中心将会有哪些重点技术趋势?以下,是对2024年数据中心发展趋势和热点技术的展望。
生成式AI对数据中心算力提出更高要求
2024年,生成式AI仍旧是各大企业关注的热点,并将产生更多的生成式AI项目。随着生成式AI项目的不断落地,数据中心将面临更大的算力挑战。为此,数据中心将迎来重大变革。记者认为,在提升算力层面上,数据中心在2024年将会围绕以下热点进行重点突破。
1)异构计算
众所周知,生成式AI对数据中心算力提出了更高的要求,传统的以CPU为核心的计算方式显然已经无法满足人工智能对于算力的需求,CPU+GPU/FPGA/ASIC等异构式架构成为2024年以及未来数据中心的主要算力构成方式。
当然,在构建异构计算时,不仅仅要重点关注底层芯片,而且还要注意应用的开发方式,要软硬件并行,两条腿走路。同时,由于异构计算是将CPU、DSP、GPU、ASIC、FPGA等不同制程架构、不同指令集、不同功能的计算单元,组合起来形成一个混合的计算系统。在这一生态体系中,有着不同的厂商参与,彼此之间既是竞争关系,又是合作关系,只有通过多方的合作,才能不断优化算力架构,提高计算效率。
2)HBM高带宽内存
众所周知,生成式AI不但对CPU、GPU性能提出了更高的需求,也对存储性能的要求越来越高。传统的内存显然已经无法满足AI对于存储性能的要求,HBM(高带宽内存)成为2024年以及未来数据中心的技术趋势之一。
HBM通过利用3D芯片堆叠技术将多个DRAM芯片堆叠在一起,从而提供更大的存储容量。随着AI技术的发展,GPU的功能越来越强,需要更加快速地从内存中访问数据,以此来缩短应用处理的时间。特别是在生成式AI出现之后,大型语言模型 (LLM)需要重复访问数十亿甚至数万亿个参数,如此庞大且频繁的数据处理,往往需要数小时甚至数天的时间,这显然无法满足要求。于是,传输速度也成了HBM的核心参数。
目前,HBM大都采用了标准化设计:HBM 存储器堆栈通过微凸块连接到 HBM 堆栈中的硅通孔(TSV 或连接孔),并与放置在基础封装层上的中间件相连,中间件上还安装有处理器,提供 HBM 到处理器的连接。与此同时,HBM通过控制芯片对多个DRAM芯片进行控制,使它们能够同时读取或写入数据,从而提高了存储带宽和数据处理能力。
3)800G网络技术
网络性能是决定AI集群算力效率的核心要素。由于AI芯片对互联带宽的需要非常大,如H100互联达到了900GB(1B=8bps),加速了网络架构的变革,800G网络成为2024年数据中心的热点。
近年来,400G的快速部署表明业界能够快速提供最新的解决方案,并且随着服务提供商扩展和升级其数据中心,服务提供商已经准备好在2024年快速转向800G。为此,各大厂商也纷纷发布800G的网络产品和解决方案。
800G交换机端口、光模块和DAC的推出,为服务提供商提供了一个无需等待800GE标准即可升级网络性能的重要机会。IEEE 802.3df 800G和1.6T任务组的工作以及行业技术的发展将确保未来升级的稳健路线图。具有800G端口的25.6T交换机的推出为数据中心运营商利用网络创造了新的机会,能够显著提高性能,同时降低复杂性、成本和功耗。
节能环保推动液冷数据中心建设
数据中心的能耗问题一直备受关注,在“双碳”目标面前,如何降低数据中心能耗,也将成为数据中心运营者关注的重点。IDC指出,在国家“双碳战略”和东数西算的不断要求下,数据中心需要向绿色低碳迈进。与此同时,以人工智能、5G为代表技术热潮的兴起,也给数据中心带来资源使用和性能提升等挑战。
在政策的推动下,液冷数据中心将会是2024年以及未来很长一段时间内用户关注的重点技术。作为突破散热瓶颈,有效降低数据中心PUE关键技术,液冷技术在2023年进展迅速。众所周知,数据中心液冷散热主要有冷板式液冷和浸没式液冷两大技术。相比较浸没式液冷技术,冷板式液冷由于相对简单,因此更加容易部署。
当然,在液冷数据中心的建设上,目前仍旧存在很多问题,比较缺乏业界统一的标准、建设成本过高等。不过,随着技术的不断成熟,标准的不断完善,液冷数据中心将会越来越受用户青睐。
多云战略催生更多数据中心安全问题
数据中心的安全问题是一个老生常谈的话题。不过,随着2024年数据量的爆炸式增长,企业业务形态的变化,以及越来越多的企业部署多云战略,数据保护的难度正在不断加大,数据中心的安全问题将会越来越受重视。
面对各种网络攻击,数据中心运营者不但要建立健全数据中心的物理安全、网络安全等多道屏障,以更高规格的解决方案确保数据、业务安全。并且还要强化数据的备份保护,确保在受到攻击之后能够快速恢复数据,确保业务的正常运行。
与此同时,企业还要强化员工教育,防止人为错误导致的数据中心中断事故和攻击事件发生。
边缘计算推动小型数据中心建设
边缘计算的快速发展加速了边缘计算中心的建设步伐。据Gartner预测,到2025年将有75%的数据产生在数据中心和云之外并在边缘侧进行处理。据STL Partners的预测,到2030年,全球边缘计算潜在市场规模将增长到4450亿美元,10年复合增长率高达48%。
边缘计算市场成长空间广阔,边缘服务器市场潜力也不容小觑。目前,包括联想、戴尔、新华三等国内外服务器厂商,均开始全面布局边缘计算市场,并推出了面向边缘数据中心的不同产品和解决方案,以此来满足不同企业的需求。据Gartner预测,到2025年,全球服务器市场规模将达到1350亿美元,边缘计算设备市场将达到370亿美元。
随着技术的日益成熟,边缘业务应用将更加多样化,越来越多的服务器厂商将面向不同的行业和应用,推出更加多样化的产品,将进一步推动边缘数据中心的高速发展。
人工智能驱动数据中心迈入智能化
利用人工智能构建智能化数据中心,简化数据中心的运维与管理,将成为2024年以及未来数据中心的主流趋势。
未来的数据发展必将走向软件定义,随着数据中心呈现复杂化,人工处理的精力和能力都有限。如果通过人工智能利用其学习能力,对以往管理数据进行智能分析,不但能够实现数据中心的运营自动化、改进资源管理以及提高能源,还可以提供洞察,改善工作负载管理和容量规划等运营决策。
除此之外,人工智能技术还能够通过计算PUE值,根据PUE值反推哪些因素影响数据中心的能耗,再进行针对性地优化,就能够达到降低能耗的目的,提升数据中心运行效率。
可以说,随着在数据中心应用人工智能,能够实现更高效、更安全、更稳定的运营目标,降低人为干预的风险和成本,提高数据中心的整体效率。