NPU资源谁也别想独占!AMD时间片机制逼退流氓应用:Intel早已动手

点点百科 百科资讯 1

4月29日消息,据报道,AMD正在为AMDXDNA加速器驱动程序准备一项名为“硬件调度器时间片”的新功能,专门用于防止单个应用独占锐龙 AI NPU的全部资源。

这项功能直指NPU多用户场景下的核心痛点:长时间运行的AI推理任务可能持续占用全部NPU资源,导致其余任务无法获得响应。

AMD的解法是利用NPU硬件调度器本身的能力,在每个并发上下文之间强制执行固定的时间分片。

默认时间片被设定为30毫秒,这是在响应速度与吞吐效率之间取的一个平衡值。

目前该功能的代码补丁已经在Linux内核邮件列表上进行审核,按时间线推算,有望在Linux v7.2版本周期内正式合入主线。

在防止NPU资源被单一应用独占这件事上,AMD并非唯一采取行动的厂商,率先行动的是Intel。

早在Linux 7.1版本,Intel就已经为IVPU加速器驱动程序引入了类似的资源限制机制,阻止非root用户的单个程序耗尽酷睿 Ultra NPU的全部上下文和门铃资源。

Intel的策略是直接划定硬上限:非root用户空间程序最多只能使用64个上下文和127个门铃,相当于总资源的一半。

AMD的策略是:不做固定配额,而是用时间片轮流调度,把调度权交给硬件本身。

两条路线殊途同归,目标完全一致:确保NPU这块AI加速硅在多用户、多任务环境下不会被某个“流氓级”工作负载独占。