每日推荐
早报
搜索
登录
舍弃CUDA编程!CMU等用几十行代码将LLM编译成巨型内核,推理延迟可降6.7倍
机器之心
2025-06-21 10:30
全新编译器 MPK 将 LLM 推理延迟推近硬件极限。
推荐阅读