| 2025年并行与分布式计算相关论文大盘点 |
| 1. 面向处理器微架构设计空间探索的加速方法综述 ( 王铎, 刘景磊, 严明玉, 滕亦涵, 韩登科, 叶笑春, 范东睿 ) |
| 2. 移动设备日志结构文件系统综述 ( 杨梨花, 董勇, 邬会军, 谭支鹏, 王芳, 卢凯 ) |
| 3. 面向分布式图计算的图划分技术综述 ( 尚俊霖, 张振宇, 屈稳稳, 王晓玲 ) |
| 4. 面向智算中心的细粒度流量控制技术综述 ( 许晶, 王展, 元国军, 马振龙, 杨帆, 孙凝晖 ) |
| 5. 大语言模型推理中的存储优化技术综述 ( 葛旭冉, 欧洋, 王博, 赵宇, 吴利舟, 王子聪, 陈志广, 肖侬 ) |
| 6. ScaleFS:面向大语言模型的高性能可扩展元数据设计 ( 尚碧筠, 韩银俊, 肖蓉, 陈正华, 屠要峰, 董振江 ) |
| 7. AdaptDNN:一个自适应可伸缩的大模型分布式训练系统 ( 刘国栋, 朱家祺, 高梓源, 包云岗, 王卅 ) |
| 8. 基于概率分布的无服务器计算弹性伸缩算法 ( 李威, 李光辉, 赵庆林, 代成龙, 陈思 ) |
| 9. 小规模非规则TRSM实现与优化 ( 郭容园, 贾海鹏, 张云泉, 韦存阳, 邓明森, 陈婧蕊, 周振亚 ) |
|
| 10. 面向天河超算的回旋动理学模拟代码异构开发及优化 ( 李青峰, 李跃岩, 栾钟治, 张文禄, 龚春叶, 郑刚, 康波, 孟祥飞 ) |
| 11. 一种带缓冲区的分布式流式图划分算法 ( 史惠康, 王泽胜, 胡克坤, 董刚, 赵有健 ) |
| 12. PetS: 针对参数高效Transformer模型的可扩展推理服务系统 ( 魏学超, 周哲, 徐盈辉, 张洁靖, 谢源, 孙广宇 ) |
| 13. SW-IntraCC:一种面向申威智能加速卡内部的集合通信机制 ( 赵玉龙, 顾燕卿, 田松涛, 吴春志, 汤凌韬, 张鲁飞, 秦晓军, 刘鑫, 陈左宁 ) |
| 14. 面向天河新一代超算系统的大规模精确对角化方法 ( 李彪, 刘杰, 王庆林 ) |
| 15. 大规模异构一致性融合计算系统的性能建模与优化 ( 李仁刚, 唐轶男, 郭振华, 王丽, 宗瓒, 杨广文 ) |
| 16. Resilio:一种大模型弹性训练容错系统 ( 李焱, 杨偲乐, 刘成春, 王林梅, 田瑶琳, 张信航, 朱昱, 李莼蒲, 孙磊, 颜深根, 肖利民, 张伟丰 ) |
| 17. 基于异构编程模型的共性算子移植与并行优化 ( 马兆佳, 邵恩, 狄战元, 马立贤 ) |
| 18. 一种异构系统下计算软件性能数据采集方法 ( 顾蓓蓓, 邱霁岩, 王宁, 陈健, 迟学斌 ) |
|
| 19. 面向GPU平台的通用Stencil自动调优框架 ( 孙庆骁, 杨海龙 ) |
| 20. 混洗SRAM:SRAM中的并行按位数据混洗 ( 张敦博, 曾灵灵, 王若曦, 王耀华, 沈立 ) |
| 21. 基三众核架构中基于同步哈密顿环的无死锁策略 ( 李春峰, Karim Soliman, 计卫星, 石峰 ) |
| 22. 基于可重构架构的数据中心异构加速软硬件系统级平台 ( 王彦伟, 李仁刚, 徐冉, 刘钧锴 ) |
| 23. Neptune:一种通用网络处理器微结构模拟和性能仿真框架 ( 林涵越, 吴婧雅, 卢文岩, 钟浪辉, 鄢贵海 ) |
| 24. 算网融合下的多层次计算资源系统 ( 徐家豪, 余辰, 李健, 金海 ) |
| 25. 一种可动态伸缩的移动端深度计算图算优化方法 ( 罗诗妍, 刘思聪, 郭斌, 方程, 王敏帆, 郭赛, 於志文 ) |
| 26. 映天湖:晶圆级通用异构多芯粒千万亿次计算机 ( 董文阔, 殷春锁, 张志锰, 王鹏超, 沙江, 王梦雅, 朱旻琦, 刘宏伟, 刘宇航, 郝沁汾 ) |
| 27. Pipe-RLHF: 计算模式感知的RLHF并行加速框架 ( 徐颖, 王梦迪, 程龙, 刘炼, 赵世新, 张磊, 王颖 ) |
|
| 28. 基于数据流架构的NTT蝶式计算加速 ( 石泓博, 范志华, 李文明, 张志远, 穆宇栋, 叶笑春, 安学军 ) |
| 29. BeeZip2: 高性能无损数据压缩领域专用加速器 ( 高睿昊, 史舜晨, 李雪琦, 谭光明 ) |
| 30. 一种可重构的单精度近似浮点乘法器设计 ( 李鹏程, 黄立波, 陈刚, 赖明澈, 邓林, 刘威, 杨乾明, 王永文 ) |
| 31. 基于缓存数据重用的稀疏矩阵向量乘序列优化 ( 徐传福, 邱昊中, 车永刚 ) |
| 32. SparseMode:用于高效SpMV向量化代码生成的稀疏编译框架 ( 王昊天, 丁岩, 何贤浩, 肖国庆, 阳王东 ) |
| 33. SW39000处理器上顺序任务流多从核辅助并行构图算法 ( 傅游, 贾淑慧, 陈莉, 花嵘, 杜云龙, 高希然 ) |
| 34. SIMD-to-RVV动态二进制翻译中的跨架构编程模型适配优化 ( 赖远明, 李亚龙, 胡瀚之, 谢梦瑶, 王喆, 武成岗 ) |
| 35. 边缘智能计算系统中加速推荐模型训练的样本调度机制 ( 李国鹏, 谈海生, 张弛, 倪宏秋, 王子龙, 章馨月, 徐洋, 田晗, 陈国良 ) |
| 36. 异构边缘环境下自适应分层联邦学习协同优化方法 ( 冯奕铭, 钱珍, 李光辉, 代成龙 ) |
| 摘自《计算机研究与发展》2025年刊登论文, 更多论文检索 请点击 |
|