上交大推理引擎:4090性能超越A100,生成速度仅比A100慢18% 文章内容主要介绍了上海交大团队推出的超强 CPU/GPU LLM 高速推理引擎 PowerInfer。该推理引擎在单个 NVIDIA RTX 4090 GPU 上运行时,平均 token 生成速率为13.20 tokens/s,峰值为29.08 tokens/s,只比顶级服务器 A100 GPU 低... AI工具箱2年前
Airbnb 每日 24 亿次请求处理:揭秘 Riverbed 技术 这篇文章介绍了Airbnb开发的Riverbed数据框架,用于生成和管理分布式物化视图。Riverbed支持50多个涉及重度数据读取的应用场景,数据来自Airbnb的多个数据源,包括Apache Kafka和Apache Spark作为在线和离线处理工具。文章来源于AI前线,作者是Rafal Gan... AI工具箱3年前