RAD 团队 – 出版物
AMD 研发 (RAD) 团队高度重视在同行评审会议和期刊上发表的重大科研成果。
通过本页的链接可以查看 RAD 团队近几年来的很多出版物。
2024
- 基于 AI 的网络安全方法 – AI4Good 2024
- T3:通过透明跟踪和触发实现计算与集合的精细重叠 – ASPLOS 2024
- 将 FPGA 和 GPU 加速与 OpenMP 分布式计算相结合 – FPL 2024
- 面向 GPU 的回合制时空一致性技术 – HiPEAC 2024
- 用于处理 AI 工作负载的网络技术 – ISC 2024
- 大规模可持续计算 – MODSIM 2024
2023
- 频谱使用与占用监控:挑战和软件定义无线电解决方案 – IIIE WCNC 2023
- 通过智能并发 GEMM 执行提高 DNN 吞吐量 – arXiv 2023
- 小芯片创新的下一个时代 – DATE 2023
- 利用 MLIR 进行 AI 引擎设计 – FCCM 2023
- 利用 FPGA 加速的神经网络代理模型来减少节点间通信 – FIRE 2023
- 探索系统级芯片技术的未来格局 – IEEE SOCC 2023
- 两个 C 的故事:计算扩展对比通信扩展:未来硬件上的 Transformer – IISWC 2023
- SPARTA:利用空间加速技术实现高效且可扩展的水平扩散天气模板计算 – ICS 2023
- AMD Versal ACAP 自适应智能引擎及其编程模型介绍 – SC 2023
- 基于自适应计算的 AI 创新方法 – SPL 2023
2022
- BERT 揭秘:系统设计的启示 - IISWC 2022
- 异构系统中的细粒度一致性专业化案例 - TACO
- 具有多级单元的加密非易失性存储器的虚拟陪集编码技术 – HPCA 2022
- 数据对流:基于 GPU 的案例研究:3D DRAM 中的热感知数据布局 - SIGMETRICS 2022
- Cloak:容忍非易失性缓存读取延迟 – ICS 2022
- 基于 ML 的科学应用代理模型的不确定性量化方法 – NeurIPS 2022
- 缓存中的主动内存加密技术 – MICRO 2022
- Athena:一种用于减少片上分页表遍历延迟的预取架构 – PACT 2022
- 使用 FPGA 提高许可区块链的能效 – ICPADS 2022
2021
- 分析和利用 GPU 中解耦的 L1 缓存 - HPCA 2021
- 面向高吞吐量加速器的截止时间感知型分载 - HPCA 2021
- 了解当今的小芯片技术,以预测未来的集成机遇与限制 - DATE 2021
- 具有强排序功能的系统级芯片 - TACO
- 在 AMD EPYC(霄龙)和锐龙处理器系列中采用开创性的小芯片组件技术及设计 - ISCA 2021(行业专题)
- 量化服务器内存频率余量并利用其提升 HPC 系统性能 - ISCA 2021
- 同构与异构多处理器的互连建模 - Springer(书籍章节)
- 利用未充分利用的片上资源扩大 GPU 转换范围 - MICRO 2021
- DUB:利用片上网络的动态降频与旁路技术处理异构 GPU 工作负载 - NOCS 2021
- 定制计算的新时代(短篇论文)- VLSI Symposium 2021
- 通过模型感知的数据放置实现推荐模型的高效缓存利用 - MEMSYS 2021
- 具有多级单元的加密非易失性存储器的虚拟陪集编码技术 – HPCA 2022
- 利用神经网络减少偏微分方程数值解中的通信量 - NEURIPS 2021
- 利用物理信息正则化提升神经网络的外推能力 - NEURIPS 2021
2020
- Kite:通过精确的互连建模实现的异构中介层拓扑系列 – DAC 2020
- SeqPoint:识别基于序列的神经网络的代表性迭代模式 – ISPASS 2020
- 提高 x86 处理器中微操作缓存的利用率 – MICRO 2020
- Centaur:一种用于实现可靠、低磨损、高密度 3D NAND 存储的新型架构 - SIGMETRICS 2020
- 分析并利用 GPU 中共享的 L1 缓存 – PACT 2020
- PreFAM:了解预取在结构连接的内存架构中的影响 – MEMSYS 2020
- CFDNet:一种基于深度学习的流体模拟加速器 – ICS 2020
- 利用分块机会优化无标签缓存中的缓存间流量关联 – TCAD 2020
- 利用分块机会优化无标签缓存中的缓存间流量关联 – CASES 2020
- 工作组的独立进展 – ISCA 2020
- 基于机器学习的设计经验:NoC 案例研究 – HPCA 2020
- GPU 启动的 OpenSHMEM:面向 dGPU 的正确且高效的内核内网络 – PPoPP 2020
- Centaur:一种用于实现可靠、低磨损、高密度 3D NAND 存储的新型架构 - SIGMETRICS 2020
- DSM:对内容相同的 DRAM 行进行硬件辅助合并的案例 – SIGMETRICS 2020