所有包含此标签的文章 "CNN".
在 QEMU 虚拟 GPU 上从零搭建类 CUDA 风格的最小 AI 软件栈,跑通 CNN 推理的完整过程记录。覆盖寄存器设计、指令模拟器优化、内核驱动、算子和运行时库。