跳转到内容
rd

归档

所有归档的文章。

2026 4
六月 3
  • 从 cmodel 说开来

    从 GPU cmodel 的性能优化出发,聊到 Vortex/POCL 桥接踩坑,再到可观测系统的搭建——围绕'怎么让软件模拟器更快、更好用、更可理解'展开的三个技术探索。

  • GPU 进阶实验 1 —— 最小 AI 软件栈

    在 QEMU 虚拟 GPU 上从零搭建类 CUDA 风格的最小 AI 软件栈,跑通 CNN 推理的完整过程记录。覆盖寄存器设计、指令模拟器优化、内核驱动、算子和运行时库。

  • QEMU 训练营 2026 专业阶段总结

    QEMU 训练营 2026 GPU 方向专业阶段实验总结。覆盖 SIMT 核指令模拟器设计、NEMU 风格宏系统、设备驱动对接,以及 debug 经验分享。

五月 1