「注意力实际上是对数的」?七年前的Transformer还有新发现,Karpathy点赞

机器之心 2025-03-23 12:01
于普通计算机而言,注意力的深度复杂度更像是 O (n log n)
推荐阅读