冗余

共 2 篇文章

阿里团队发现大模型「合二为一」的黑魔法:仅舍弃1%参数,不需GPU和重新训练,性能依旧强劲

阿里巴巴研究发现: 大模型「合二为一」黑魔法!可达相同性能原标题:舍弃99%的参数,仍保持相同性能!阿里巴巴团队发现了大模型「合二为一」的黑魔法,无需GPU加速,无需重新训练关键词:模型、参数、性能、方法、冗余文章来源:夕小瑶科技说字数:6293字摘要:夕小瑶科技说原创作者 | 小戏、Python动...
阿里团队发现大模型「合二为一」的黑魔法:仅舍弃1%参数,不需GPU和重新训练,性能依旧强劲

降低视觉Transformer计算成本:时间冗余方法惊艳操作

阅读 AIGC 动态欢迎原标题:降低视觉Transformer计算成本:时间冗余策略让人大开眼界关键词:冗余、策略、研究人员、成本、时间文章来源:机器之心内容字数:7495字内容摘要:机器之心编译编辑:Panda W。Transformer 在带动语言领域革新之后,如今正逐步涉足视觉领域,但其高昂的...
降低视觉Transformer计算成本:时间冗余方法惊艳操作