计算机系存储实验室获得2025年ASPLOS/EuroSys大模型推理优化竞赛冠军

2025.04.08 15:59

2025年3月30日至4月3日,第30届面向编程语言和操作系统的体系结构支持国际会议(ACM International Conference on Architectural Support for Programming Languages and Operating Systems,ASPLOS)与第20届欧洲计算机系统会议(The European Conference on Computer Systems,EuroSys)在荷兰鹿特丹举办。由计算机系存储实验室博士生高世伟、范如文等组成的参赛团队,在ASPLOS/EuroSys 2025大模型推理优化竞赛中荣获冠军,指导教师为计算机系舒继武教授和陆游游副教授。

获奖证书

本次比赛吸引了来自康奈尔大学、纽约大学、威斯康星大学麦迪逊分校、阿卜杜拉国王科技大学、延世大学、北京大学、上海交通大学等世界知名高校的多支队伍参赛。比赛中,计算机系团队成员基于亚马逊AWS提供的NKI编程框架,进行了计算分块、指令归并、算子融合等设计优化,相比于亚马逊原生实现,将大模型推理性能提升至1.1倍,最终获得冠军。

计算机系存储实验室在存储领域长期深耕,持续开展创新研究,屡获国际学术奖项。近年来,实验室在机器学习系统存储方向上取得多项有影响力的研究成果,在本次ASPLOS/EuroSys会议中发表并宣讲了大模型KV Cache存算协作恢复HCache、大模型推理快速冷启动Medusa、SSD上推荐系统参数排布及检索方法MaxEmbed、高效经济的嵌入模型训练系统Frugal等多项研究工作。

ASPLOS和EuroSys会议由美国计算机学会(ACM)举办,主要研究内容涵盖计算机体系结构和计算机系统领域,历史均超过20年,被中国计算机学会(CCF)认定为A类国际学术会议,是衡量该领域研究水平的国际顶尖标杆。

关闭