| 2025年系统结构相关论文大盘点 |
| 1. 映天湖:晶圆级通用异构多芯粒千万亿次计算机 ( 董文阔, 殷春锁, 张志锰, 王鹏超, 沙江, 王梦雅, 朱旻琦, 刘宏伟, 刘宇航, 郝沁汾 ) |
| 2. Pipe-RLHF: 计算模式感知的RLHF并行加速框架 ( 徐颖, 王梦迪, 程龙, 刘炼, 赵世新, 张磊, 王颖 ) |
| 3. DAQ:基于分治策略的自适应Vision Transformer低位宽量化方法 ( 吕倩茹, 许金伟, 姜晶菲, 李东升 ) |
| 4. 基于数据流架构的NTT蝶式计算加速 ( 石泓博, 范志华, 李文明, 张志远, 穆宇栋, 叶笑春, 安学军 ) |
| 5. BeeZip2: 高性能无损数据压缩领域专用加速器 ( 高睿昊, 史舜晨, 李雪琦, 谭光明 ) |
| 6. 一种可重构的单精度近似浮点乘法器设计 ( 李鹏程, 黄立波, 陈刚, 赖明澈, 邓林, 刘威, 杨乾明, 王永文 ) |
| 7. 面向处理器微架构设计空间探索的加速方法综述 ( 王铎, 刘景磊, 严明玉, 滕亦涵, 韩登科, 叶笑春, 范东睿 ) |
| 8. 移动设备日志结构文件系统综述 ( 杨梨花, 董勇, 邬会军, 谭支鹏, 王芳, 卢凯 ) |
| 9. 混洗SRAM:SRAM中的并行按位数据混洗 ( 张敦博, 曾灵灵, 王若曦, 王耀华, 沈立 ) |
| 10. 基三众核架构中基于同步哈密顿环的无死锁策略 ( 李春峰, Karim Soliman, 计卫星, 石峰 ) |
|
| 11. 基于深度强化学习的连续微流控生物芯片控制逻辑布线 ( 蔡华洋, 黄兴, 刘耿耿 ) |
| 12. 基于可重构架构的数据中心异构加速软硬件系统级平台 ( 王彦伟, 李仁刚, 徐冉, 刘钧锴 ) |
| 13. 流路径驱动的微流控生物芯片任意角度布线算法 ( 潘友林, 郭帅, 黄兴, 刘耿耿 ) |
| 14. GroupUCP:按需动态调节的细粒度缓存划分策略 ( 张传奇, 王卅, 孙凝晖, 包云岗 ) |
| 15. 基于访存图案变形的CGRA存储划分优化 ( 潘德财, 牟迪, 尚家兴, 刘大江 ) |
| 16. Neptune:一种通用网络处理器微结构模拟和性能仿真框架 ( 林涵越, 吴婧雅, 卢文岩, 钟浪辉, 鄢贵海 ) |
| 17. FireLink:一种面向芯粒设计空间探索的评估框架 ( 李开, 曾坤, 荣培涛, 陈志强, 张甜, 王永文 ) |
| 18. 一种面向纠删码的存储库优化方法 ( 谢汶兵, 关睿雪, 张艺鸣, 李佳梅, 王俊 ) |
| 19. 面向LoongArch边界检查访存指令的GCC优化 ( 舒燕君, 郑翔宇, 徐成华, 黄沛, 王永琪, 周凡, 张展, 左德承 ) |
| 20. 基于细粒度状态标签的代码缓存优化方案 ( 牛根, 张福新 ) |
|
| 21. 一种基于带权有向图的印刷电路板群组布线算法 ( 邓新国, 张鑫泓, 陈家瑞, 刘清海, 陈传东 ) |
| 22. 面向昇腾处理器的高性能同步原语自动插入方法 ( 李帅江, 张馨元, 赵家程, 田行辉, 石曦予, 徐晓忻, 崔慧敏 ) |
| 23. 芯粒互联技术综述 ( 王浩, 王勇, 冯长磊, 盖伟新, 吴鹏, 钱江 ) |
| 24. 基于混合模式路由的脑启发片上网络架构 ( 王智超, 陈亮, 李千鹏, 陈奥新, 刘昕, 宋文娜 ) |
| 25. 基于多策略的总线拓扑感知全局布线算法 ( 刘耿耿, 黄隽芊, 朱予涵, 余延涛, 魏凌, 陈家瑞, 徐宁 ) |
| 26. SIMD-to-RVV动态二进制翻译中的跨架构编程模型适配优化 ( 赖远明, 李亚龙, 胡瀚之, 谢梦瑶, 王喆, 武成岗 ) |
| 27. 大语言模型推理中的存储优化技术综述 ( 葛旭冉, 欧洋, 王博, 赵宇, 吴利舟, 王子聪, 陈志广, 肖侬 ) |
| 28. ScaleFS:面向大语言模型的高性能可扩展元数据设计 ( 尚碧筠, 韩银俊, 肖蓉, 陈正华, 屠要峰, 董振江 ) |
| 29. 面向低磨损存内计算的多状态逻辑门综合 ( 赵安宁, 许诺, 刘康, 罗莉, 潘炳征, 薄子怡, 谭承浩 ) |
| 30. 面向SCSI子系统的用户空间存储架构设计 ( 郝栋栋, 高聪明, 舒继武 ) |
|
| 31. 基于背景-前景组成式建模的电路板异常检测 ( 傅冰飞, 陈同林, 许枫, 朱麟, 李斌, 薛向阳 ) |
| 32. 边缘智能计算系统中加速推荐模型训练的样本调度机制 ( 李国鹏, 谈海生, 张弛, 倪宏秋, 王子龙, 章馨月, 徐洋, 田晗, 陈国良 ) |
| 33. 异构边缘环境下自适应分层联邦学习协同优化方法 ( 冯奕铭, 钱珍, 李光辉, 代成龙 ) |
| 34. 面向分布式图计算的图划分技术综述 ( 尚俊霖, 张振宇, 屈稳稳, 王晓玲 ) |
| 35. 支持端边云多运行时协同应用的网程系统 ( 俞子舒, 王一帆, 曾琛, 张星洲, 彭晓晖, 徐志伟 ) |
| 36. AdaptDNN:一个自适应可伸缩的大模型分布式训练系统 ( 刘国栋, 朱家祺, 高梓源, 包云岗, 王卅 ) |
| 37. 基于概率分布的无服务器计算弹性伸缩算法 ( 李威, 李光辉, 赵庆林, 代成龙, 陈思 ) |
| 38. SW-IntraCC:一种面向申威智能加速卡内部的集合通信机制 ( 赵玉龙, 顾燕卿, 田松涛, 吴春志, 汤凌韬, 张鲁飞, 秦晓军, 刘鑫, 陈左宁 ) |
| 39. 大规模异构一致性融合计算系统的性能建模与优化 ( 李仁刚, 唐轶男, 郭振华, 王丽, 宗瓒, 杨广文 ) |
| 40. Resilio:一种大模型弹性训练容错系统 ( 李焱, 杨偲乐, 刘成春, 王林梅, 田瑶琳, 张信航, 朱昱, 李莼蒲, 孙磊, 颜深根, 肖利民, 张伟丰 ) |
| 摘自《计算机研究与发展》2025年刊登论文, 更多论文检索 请点击 |
|