英特尔至强处理器将达到200核!数据中心冷却技术:风冷OR液冷?

2023-04-20 11:47:41 来源:EETOP

4月12日,英特尔在北京召开主题为“可持续·共未来”的2023英特尔可持续发展高峰论坛。帕特·基辛格首次以英特尔公司首席执行官的身份来访中国,并在峰会上发表了“携手共创可持续的未来”的主题演讲。

image.png

基辛格在演讲中提到,我们正在步入被五大超级技术力量所定义的数字经济时代,即无所不在的计算、无所不在的连接、从云到边缘的基础设施、人工智能以及传感与感知助推数实融合。这些超级技术力量不仅单独来看非常强大,结合在一起更可以相互促进,驱动指数级增长。

芯片驱动万事万物的数字化,半导体是数字化的基石。基辛格巧妙地将英特尔的计算架构比作美猴王的金箍棒。就像美猴王可以使用金箍棒变大撑起天空,或变小成绣花针放到自己的耳朵里一样,英特尔的计算架构既可以打造出大型的超级计算机或者用于训练AI的计算设备,也能内置到诸如手环、便携设备乃至助听器一样非常小的计算设备里面。


基辛格非常坚定的说到:“我一直是一个彻底的技术乐观主义者,我相信科技具有其它行业无法比拟的力量,去推动进步和变革”。身处科技行业,我们不仅需要把握数字经济的机遇,也肩负助力数字经济可持续发展的责任。


█ 数字化变革中的数据中心


数字经济时代,数据中心已经成为支撑数字经济高速发展的底座,其规模在迎来高速增长的同时也面临着低碳化的迫切要求。以ChatGPT为代表的生成式AI爆火之后对算力提出了巨大需求。在新型的数据中心中如何采取更好、更低能耗的设计,以及如何降低后期的运维成本,从何有效提升算力带来的综合价值,这是迫在眉睫要解决的问题。与此同时,现有的存量数据中心,如何在新旧数据中心转化过程中,寻找到产业化和低成本之间的平衡点,从而更好的推动可持续发展,这些都是当前面临的重重挑战。


图片

英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立表示,未来对算力需求必然是一个持续增长的趋势。英特尔的路线图上,核数正在飞速增长,从现在第四代至强拥有的50个核、60个核,在一两年之后,将很快会增长到100个核、200个核。所以在同样一个数据中心的设计当中,它的高密度、核数,以及性能都是大幅度提升的。在算力如此集中的情况下,数据中心的设计势必要经历巨大的演进。


从新型数据中心的整体布局规划到推广新型的技术,包括高效制冷、余热应用、智能运维等。英特尔在这个领域,主要开展了三个部分的探索:处理器产品;服务器整体设计;软件与工具。其中,在处理器部分,陈葆立介绍,今年1月英特尔发布的第四代英特尔至强可扩展处理器,在深层环节已经使用了90%的可再生电力。除此之外,处理器本身的设计也在各个环节内置了多种提高能效的技术。另外,第四代英特尔至强可扩展处理器中内置了诸多加速器,这些内键的加速器能够大幅提升不同工作负载的能效,平均可以带来2.9倍的能效提升,且对于现在比较火热的AI则会带来高达14倍的能效提升。


那么从整个数据中心的产业层面来看,数据中心的PUE(Power Usage Effectiveness)是一个非常关键的技术指标。简单来说,PUE就是用于测量IDC能源效率的指标,是用IDC总能耗除以IT设备能耗得来。IDC总能耗包含IT设备能耗和制冷、配电等系统能耗,PUE数值越靠近1,则说明非IT设备的能耗越少,能效水平越高。


目前,数据中心中最常用的散热和制冷方式是风冷方式,即用空气作为媒介冷却需要冷却的物体。不过,随着算力的快速发展,CPU功耗的不断提高,以及节能降耗、“双碳”战略等宏观因素的迫切需求,许多应用场景在快速考量更新数据中心整体设计时,已经转向更节能、更先进的液冷数据中心的方式来解决能耗和平衡的问题。


图片

英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰介绍说:“传统风冷的数据中心的PUE能到1.4-1.5,但现在通过液冷可以做到近1.1,这对整个能耗的改善有很明显的作用。”液冷对基于新一代处理器的服务器来说肯定是一个发展方向。新一代服务器所搭载的处理器的核数越来越多,对功耗的需求越来越高,包括国家“东数西算”等工程项目对数据中心PUE的要求也非常高。


图片

新华三集团计算存储产品线副总裁刘宏程分享说:“从风冷技术转向液冷技术,这不仅是可以节能多少的问题,还包括在使用过程当中有可能出现巨大空间浪费的情况。因为传统数据中心无法容纳新的能耗过高的设备。比如GPU服务器会造成空间的占用,以及提高数据中心管理和运营费用。”对此,庄秉翰指出:“在今后的服务器发展中,液冷大概率会成为一个趋势。”


█ 液冷技术是否将是未来的主流冷却方式


液冷技术是指使用液体取代空气作为冷媒,与发热部件进行热交换,带走热量的技术。按照液体与发热器件的接触方式,液冷又可分为“间接接触型”和“直接接触型”两大类。直接接触又可分浸没式液冷和喷淋式液冷两种。英特尔主推的是间接接触型的冷板式液冷,和直接接触型的浸没式液冷。陈葆立非常形象说:“就比如今天天气很热,冷板等于铺了一个凉席,也就是在很热的CPU上铺了一层冷板,把热能通过这层冷板给传出去;而浸没式液冷是泡澡,把所有的部件泡在液体当中,让温度可以降低。”


其实,液冷技术并非一项新兴的技术。液冷技术是指使用液体取代空气作为冷媒,与发热部件进行热交换,带走热量的技术。该技术在上世纪80年代就崭露头角,90年代出现一些通信设备的液冷基站。随着21世纪初云计算时代的到来,数据中心需要更高功率、更大规模部署,液冷概念被正式提出,相关技术逐步成熟。


图片

宁畅总裁秦晓宁分享,以前液冷技术没有大批量使用,主要由于它对于客户是非必要的。液冷是一个很创新的技术,在高性能应用环节才可能被需要,但是当时的应用并不需要那么高功耗。但现在不一样了,CPU的功耗高达270W~300W,未来可能到350W,GPU甚至都已经达到400W~500W,加之现在很多数据中心、智算中心等大量都需要高算力,因此就需要应用液冷。此外,从宏观上来看,“双碳”战略、节能政策等已提上日程。整体来看,无论是宏观战略要求,还是实际业务的需求,都趋动我们必须要把液冷技术应用到日常的研发或客户应用的机房环境当中去。


那么,现在液冷技术的落地应用情况如何呢?据庄秉翰介绍,液冷技术首先被大量应用在互联网产业,比如阿里采用的是浸没式液冷方案,京东是基于冷板技术的方案。而对于运营商来说,因为它管理的数据中心数量也非常大,因此对冷板的采用比例也很高。除此之外,还有像金融行业也非常早期开始应用,他们从数年前就开始用液冷的POC,现在也到了采用阶段。庄秉翰总结说:“整体来看,国内几个服务器使用的头部行业,如互联网、运营商、金融行业等,目前对液冷都已经跳过了POC阶段,进入到了规模化采用的状态。”


那对于冷板和浸没两种不同方式,未来哪种技术将会成为主流?陈葆立回答说:“从英特尔的视角来看,由于客户需求不同,所以它们将会是同时存在的。另外,尽管现在液冷技术比较热门,但风冷也是存在的,而且整个业界大家都在每一个不同的环节做创新。比如像未来新的至强处理器可能会升级到拥有100个能效核,CPU电源功率可能还是300W或350W。所以理论上来看,它在风冷上也可以应用,而并非一定要用液冷。所以在不同服务器部件上,我们会做不同的创新。对客户而言,是在他的可支出的能力或是环境限制下拥有更多、更好的方案选择,更能适合他自己的部署。”


虽然液冷技术是未来的一大发展趋势,但当前它的产业化发展依然面临诸多问题。冷板技术,技术门槛比较成熟,但使用率却不高,主要原因是国内许多冷板设计缺乏一个规范的验证标准,使得每个厂家设计都有差异,这使系统设计成本、验证成本比较高,因此对于最终用户而言这个方案就比较贵。而浸没式液冷则是一项难度系数更高的技术,除了成本更高的制约因素之外,庄秉翰分享说,它其实对器件、和芯片本身也有一些可靠性的影响。为此,英特尔提出,为在浸没式液冷场景下使用第三代和第四代至强可扩展处理器的厂家,提供一年保修服务,这也是英特尔为了加速液冷技术在产业链应用所做的努力之一。


除此之外,面对液冷技术标准不统一,甚至快插的接口大小、尺寸都不一样,通用性不解决,严重影响产业化发展等问题,英特尔也作为倡导者,为搭建更好的生态而在做积极的贡献。据介绍,英特尔携手20余位生态伙伴经过过去半年的努力,共同编纂的冷板液冷团体标准已于今年3月15日正式发布。与此同时,英特尔还与生态伙伴一同通过简化设计与替代材料的选择等举措,推动成本优化措施,加速方案落地。在浸没式液冷方面,英特尔希望能在今年下半年把相关经验与设计规格通过白皮书分享给业界伙伴,加速浸没式液冷解决方案落地,普惠最终用户。


秦晓宁非常认可英特尔在标准化方面所做出的努力和贡献,她表示:“能耗问题的解决,需要在芯片层面、系统层面,甚至于整体机房的结构设计层面去综合考虑。英特尔牵头制定的这个标准在业界得到了广泛的认同,并且为客户带来了积极影响。冷板标准统一后,产量提升会带来成本的下降。其相关成本的降低,不仅限于单个元器件的采购成本上,还包括在动态使用过程当中环温的控制,包括散热、CPU能耗对整个功耗的影响等。整体而言,在持续使用的情况下,尤其是一个大型数据中心的使用过程当中,是能够实现可观的成本控制和节能降耗。


刘宏程分享,新华三和英特尔在数据中心设计方面的合作已超过14年。绿色节能不是一个部件、一个系统或者一个机柜的问题,而是一个系统性工程,需要从整个底层的部件,依照底层数据中心全方位地去做一些设计才有可能达到目标。刘宏程说:“当’用户需求激增→标准建立→规模效应显现→整体成本自然下降’的循环形成之后,就可以加速推动产业从存量的数据中心转向新型节能的数据中心。”


有效降低成本无疑是产业化发展的关键。而在成本之外,还有如安全、液体漏液等其他影响因素的考量。一个产业的发展并非是一朝一夕就能促成,还需要大规模的验证去证明应用的普适性。数字化就是提高效率的手段,提高效率就是可持续发展的一个关键。


█ 结束语


英特尔看来,中国是可持续发展领域的领导者。目前为止,中国算力的爆发式增长,正在连续性地考验国家能源战略。信通院去年发布的数据显示,在2021年底到2022年时,全国已有近520万个数据中心的基架进入部署,而且过去五年的年均复合增长率达到30%。同时另外一组数据也值得我们关注,全国数据中心的用电量已经达到了全国用电的2.6%,而且这个比例预估还会继续增长。


新基建中的5G网、电力网和交通网有效地打通了信息流、能源流以及人流物流,是促进中国经济高质量发展的大动脉。但随之而来的环境问题、气候问题也是当前面临的严峻挑战。如何可持续性发展是未来很长一段时间都绕不开的话题。


科技是实现绿色经济的唯一途径,对此,基辛格也表示,“中国生态伙伴们在可持续发展方面的积极目标让我们深受鼓舞,我们将继续利用自身技术和专长,支持中国数字经济发展和可持续发展目标,帮助打造可持续未来。”


  1. EETOP 官方微信

  2. 创芯大讲堂 在线教育

  3. 创芯老字号 半导体快讯

相关文章

全部评论

@2003-2024 EETOP