2025 年 3 月 12 日,清华大学 NLP 实验室联手中南大学等提出 APB 序列并行推理框架,可解决长上下文远距离语义依赖问题,在 128K 文本上比 Flash Attention 快约 1
1 个月前
2月10日,清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目公布更新:一块24G显存的4090D,就可以在本地运行DeepSeek-R1、V3的671B“满血版”。
2 个月前
论坛上提出了AI治理框架、AI发展治理、AI安全治理和AI治理国际合作等议题。
9 个月前