中国算力大会观察|大模型催生算力新需求,算力基建将迎新政策
21世纪经济报道记者 缴翼飞 实习生 黄婷婷 银川报道
(相关资料图)
“算力已成为数字经济时代的关键生产力,是全社会数字化、智能化转型的重要基石。未来要以智能化、绿色化、融合化为主攻方向,一体推进基础设施建设、产业基础创新和深度融合应用,做强做优做大算力产业。”工业和信息化部部长金壮龙在8月19日召开的2023中国算力大会上作出上述表态。
工信部数据显示,截至2023年6月底,全国在用数据中心机架总规模超过760万标准机架,算力总规模达到197EFLOPS,算力总规模近五年年均增速近30%,存力总规模超过1080EB。
工业和信息化部副部长张云明在会上透露,目前中国算力产业已初具规模,工业和信息化部将结合算力行业发展的最新情况,在广泛调研的基础上,加快出台推动算力基础设施高质量发展的政策举措,进一步加强顶层设计,为算力基础设施发展提供强有力的政策保障。
智能算力需求猛增
大模型的热潮也带动了上游智能算力需求的猛增。
中国信通院数据显示,中国算力规模特别是智能算力规模不断提升。截至2023年6月底,中国算力规模达到197EFLOPS,其中通用算力规模占比达74%,智能算力规模占比达25%,智能算力规模同比增加60%。
“去年10月份以来,大模型的发展对人工智能算力起到非常重要的推动作用。从目前来看,通用算力的规模还是主要的,但是算力结构会在未来几年发生根本性的变化,智能算力需求正呈现爆发性增长态势。”余晓晖说。
中国工程院院士、紫金山实验室主任刘韵洁在接受21世纪经济报道采访时也表示,近期大模型在全球范围内不断涌现,但我国的通用大模型已经落后于美国。其中一大主要原因就是数据,美国有全球数据资源方面的优势。中国的机会是行业大模型,因为与实体经济紧密相关,但前提是要把行业的大数据利用好、管理好、保护好。
秦淮数据集团CTO张炳华对此深有体会,张炳华表示,“目前国内的大模型有的是想要包罗万象的,所有数据都往里面训练,但有的可能只是需要做一个垂类模型,比如之前做过一个金融行业的大模型,可能只需要正常1/4的算力规模。”
“中国是全球算力规模第二大的国家,但这里面有些算力可能已经过时了。目前存在算力不足的情况,但应用方面的算力资源也还没有充分发挥出来,甚至还有富裕,大家不能一窝蜂的去做算力,要具体问题具体分析。”刘韵洁举例说,目前算力的利用率还不够高,而且很多还处于孤岛状态,一些数据需要通过货车、飞机等运输方式把硬盘运输过去进行超算。这或者是因为网络没有接进来,或者是价格上用户觉得不合理,这些都是需要解决的问题。
中国联通研究院院长李红五表示,目前中国联通正在构建以通用大模型为基础的集成模型组合,通过构建中国联通特色的多模态、高可信的优质数据集,并以此为基础积极研究布局通用大模型、行业大模型以及场景小模型的集成模型组合。
“东数西算”需要高效协同
“东数西算”是把东部的数据传输到西部进行计算和处理,业界把“东数西算”比作“南水北调”“西电东送”,正是因为其本质都是要发挥我国体制机制优势,优化资源配置,提升资源使用效率,下好全国“一盘棋”。
目前“东数西算”工程全面启动已经一年半,京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8个国家算力枢纽节点的建设方案均已进入深化实施阶段,并取得了相应进展。
这离不开网络基础设施的建设。工信部数据显示,截至2023年6月,全国光缆线路总长度达到6196万公里,比上年末净增238.1万公里。全国互联网宽带接入端口数量达11.1亿个,比上年末净增3457万个。5G网络建设稳步推进,移动电话基站总数达1129万个,5G基站总数达293.7万个,占移动基站总数的26%。
目前,贵州、内蒙古、甘肃、宁夏等核心省份算力发展潜力较大,但仍处在初步发展阶段,技术创新驱动不足、发展环境亟待优化、算力需求少等问题依然存在。
张炳华举例,当前适合转移到西部的数据一般是对时延要求不高的“冷数据”,如后台加工、离线分析、存储备份等数据,而像人工智能、视频会议等对网络时延要求较高的“热数据”,稍有延迟都会影响用户体验,目前更多还是要留在东部做计算分析。常用、需要复杂处理的“热数据”无法“西算”,能拿到西部的“冷数据”往往只是存在那里。而且成本依然是关键制约。虽然把数据中心建在西部,大约每年能节约大量电费成本,但建设“东数西算”数据网络的成本仍然不可忽视。
“算力网将面临两大技术挑战,一是通信连接(超低延迟、超宽带)挑战;二是算力调度挑战,目前云算力、智能算力、超算算力、混合算力的服务商入口、系统、计费等不同。”中国工程院院士高文认为,需要不断提高传送速度,建立直连超宽带光网络;建立云原生网络。
刘韵洁认为,“东数西算”需要一个新的技术解决方案,一个新型的网络来提供服务。确定性网络是“东数西算”的重要底座。可以提高“东数西算”的传输效率,也会大大地降低网络使用成本;算力网在“东数西算”可以提供非常好的普遍服务。
中国移动首席科学家、副总工程师王晓云表示,算力网络当前正处于一阶段“泛在协同”收官、二阶段“融合统一”开启的关键时期,需聚力重点突破,推动算力网络发展提速。
张云明表示,接下来将着力优化算力网络布局,形成全国枢纽、区域中心、本地边缘协同发展的梯次算力基础设施架构。着力优化算力供给结构,盘活全国算力资源,实现东中西部协调发展,提升算力综合供给能力。
仍需优化的算力能效考核
算力规模增长的同时,算力能耗总量也在快速攀升。
国际能源机构(IEA)的数据显示,2022 年全球数据中心用电量为2400~3400 亿千瓦时,约占全球最终电力需求的1%~1.3%。根据信通院统计,我国2022 年数据中心能耗总量1300 亿千瓦时,同比增长16%,预计到2030 年,能耗总量将达到约3800 亿千瓦时。
会上发布的《面向算力应用环节的计算绿色化白皮书》指出,截至2023 年6 月,我国累计建成196 家国家绿色数据中心,行业内先进绿色中心电能利用效率降至1.08 左右,达到世界领先水平。但伴随产业蓬勃发展,PUE 指标优化空间不断减少,局限性逐渐显现。
工业和信息化部党组成员、副部长张云明表示,绿色低碳是算力产业高质量发展的必然要求,要加强绿色低碳技术研发,加快推进数据中心节能改造,持续提升数据中心可再生能源利用水平,强化产业协同和区域协同,凝聚广泛共识、构筑良好生态,切实推动我国算力产业绿色低碳发展水平迈上新台阶。
蚂蚁集团副总裁、平台技术事业群总裁何征宇认为,算力行业的绿色化、数字化、绿色化协同发展势在必行。计算绿色化仍处于发展初期,需要政、产、学、研合作共同推动,从政策引导、标准体系、应用落地、生态合作等层面,进一步构建计算绿色化评价指标,形成可借鉴和规模化应用的参考指南。
“对于建立绿色意识的企业来说,其中一个挑战来自于如何评估绿色度,也就是建立对于有效算力进行衡量的指标。” 何征宇说。
目前,绿色计算相关行业组织及相关标准主要的关注点都在于数据中心及其相关设施能效,提出包括电能利用效率PUE、水资源利用效率WUE、碳利用效率CUE 等被行业普遍采用的指标。但对于算力应用环节的效率评估,行业尚缺乏通用指标。
余晓晖也表示,目前中国数据中心能效政策不断趋严,能效考核指标从以PUE为主逐步演变为PUE、CUE兼顾,未来有可能会纳入更多新的能效指标。同时,中国算力政策标准体系不断完善,国家部委、地方政府正在相继出台一系列政策,推动构建多层次算力基础设施体系。