同一条去噪轨迹,四个面板各自上演自己的"问 Q 的方式"。自动循环播放。
试试:拖动任意面板里蓝色等高线的中心(Q 的峰)——所有梯度箭头实时重算。注意只有 BPTT 终点处的梯度、和 QGF 的梯度始终指向峰;OOD 的问号箭头不理你,BPTT 传回 a_t 的梯度则一直在抖。