离线

共 2 篇文章

上交大推理引擎：4090性能超越A100，生成速度仅比A100慢18%

文章内容主要介绍了上海交大团队推出的超强 CPU/GPU LLM 高速推理引擎 PowerInfer。该推理引擎在单个 NVIDIA RTX 4090 GPU 上运行时，平均 token 生成速率为13.20 tokens/s，峰值为29.08 tokens/s，只比顶级服务器 A100 GPU 低...

AI工具箱3年前

Airbnb 每日 24 亿次请求处理：揭秘 Riverbed 技术

这篇文章介绍了Airbnb开发的Riverbed数据框架，用于生成和管理分布式物化视图。Riverbed支持50多个涉及重度数据读取的应用场景，数据来自Airbnb的多个数据源，包括Apache Kafka和Apache Spark作为在线和离线处理工具。文章来源于AI前线，作者是Rafal Gan...

AI工具箱3年前

离线

上交大推理引擎：4090性能超越A100，生成速度仅比A100慢18%

Airbnb 每日 24 亿次请求处理：揭秘 Riverbed 技术

热门AI工具

CC Switch

热门AI应用