GitHub 人工智能与机器学习 Native Sparse Attention高效稀疏注意力实现,硬件对齐降低Transformer长序列计算成本 Native Sparse Attention 旨在解决 Transformer...