英伟达官宣开源TensorRT-LLM，H100推理速度飙升至8倍，支持10+种模型

AIGC动态3年前发布 AI工具箱

英伟达官宣开源TensorRT-LLM，H100推理速度飙升至8倍，支持10+种模型的封面图

近日，英伟达宣布开源了一款名为TensorRT-LLM的软件，这一动态受到了广泛关注。据称，该软件能够显著提升H100上大型语言模型的推理性能，使模型总吞吐量提升了8倍。除了支持10多种模型外，TensorRT-LLM还引入了诸多优化功能，包括In-Flight批处理等。这一举措被认为将为用户提供更为高效的推理体验，并标志着“GPU贫民”或将告别困境。有关详细信息，可访问原文链接：H100推理飙升8倍！英伟达官宣开源TensorRT-LLM，支持10+模型。值得一提的是，本文摘自新智元，作者为桃子润，文章来源与作者微信号均可参见以上信息。

AIGC动态 # AIGC动态 # 性能 # 模型 # 语言

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关AI热点

OpenAI宣布推广GPT-4.5人工智能模型的新举措

OpenAI宣布推广GPT-4.5人工智能模型的新举措

AI实验室1年前

海斌访谈：DeepSeek如何重塑中国大模型产业生态

海斌访谈：DeepSeek如何重塑中国大模型产业生态

AI实验室1年前

AI助力！民警寻回70名失踪被拐儿童，含18名无童年照片者

AI助力！民警寻回70名失踪被拐儿童，含18名无童年照片者

AI之家1年前

AI与5G赋能大模型基础设施建设，构筑全面智能社会基石

AI与5G赋能大模型基础设施建设，构筑全面智能社会基石

AI实验室2年前

ChatGPT插件即将停止支持，奥特曼年终总结暗示明年有大动作…

ChatGPT插件即将停止支持，奥特曼年终总结暗示明年有大动作…

AI工具箱3年前

英伟达与AMD展开激烈竞争：GPU霸主地位谁能稳坐？

英伟达与AMD展开激烈竞争：GPU霸主地位谁能稳坐？

AI工具箱3年前

实现通用智能：机器如何从自然模态学习到世界模型？

实现通用智能：机器如何从自然模态学习到世界模型？

AI工具箱3年前

AI 时代：强劲至强！云服务如何保驾护航？

AI 时代：强劲至强！云服务如何保驾护航？

AI工具箱3年前

暂无评论

none

暂无评论...