速度

共 11 篇文章

2080 Ti跑70B大模型?上交大新框架让LLM推理速度提升11倍

阅读AIGC动态的最新内容 原文标题:2080 Ti就能跑70B大模型,上交大新框架让LLM推理增速11倍 关键词:神经元,模型,速度,局部性,路由 文章来源:量子位 字数:7617字 内容摘要: 上海交大IPADS实验室由量子位编辑投稿|公众号 QbitAI。原本需要一张售价16万元的80G A1...
2080 Ti跑70B大模型?上交大新框架让LLM推理速度提升11倍

OpenAI研究员回应:GPT-4.5解禁是网友幻觉?灰度测试引发热议

最新消息称,有关 GPT-4.5 提前曝光的传闻引发了网友们的热议。尽管 OpenAI 的研究人员甚至公司创始人 Altman 都予以否认,但这并未阻止网友们欢快地讨论。关于 GPT-4.5 究竟是否已经悄悄上线仍是一个谜。 最近,许多网友发现了一个让人震惊的现象。在询问 ChatGPT 在 API...
OpenAI研究员回应:GPT-4.5解禁是网友幻觉?灰度测试引发热议

特斯拉人形机器人Optimus二代,经过两年半的训练,正式上线

在机器之心的最新报道中,特斯拉推出了经过两年半练习的人形机器人Optimus二代。根据报道,Optimus Gen2相较上一代有了许多改进,包括由特斯拉设计的致动器和传感器、2-Dof的脖子提高了行走速度30%、重量减轻了10千克、脚力/扭矩感应铰接式脚趾、人体脚部几何形状等。此外,双手更加灵活,在...
特斯拉人形机器人Optimus二代,经过两年半的训练,正式上线

Transformer简化版发布,网友盛赞:年度论文

AIGC动态欢迎阅读 原标题:简化版Transformer问世,备受网友瞩目 关键词:研究者、速度、模型、深度、参数 文章来源:机器之心 内容字数:8398字 内容摘要:机器之心报道,编辑部对大型模型进行优化。Transformer 架构被认为是近期深度学习领域许多成功案例的核心。构建深度Trans...
Transformer简化版发布,网友盛赞:年度论文

iQOO 12系列:突破性能极致,绝无仅有的优雅

AIGC动态欢迎阅读原标题:iQOO 12 系列:电竞性能旗舰,从未如此优雅关键词:性能,系列,速度,赛道,影像文章来源:爱范儿内容字数:7364字内容摘要:赛道上的速度与日常舒适形成鲜明对比。性能赛车外表夸张,内饰却朴实轻量。舒适配置于竞速中显得多余。性能车辆适用于赛道,却不易在公路上驾驭。赛道只...
iQOO 12系列:突破性能极致,绝无仅有的优雅

ChatGPT全球宕机:昨日事件的警示

AIGC动态欢迎阅读近日,发生了一件让人震惊的事情,即昨日全球知名的ChatGPT系统发生了全面宕机的事件。这一事件不仅令许多人感到意外,也给我们带来了一些值得深思的警示。有人调侃道,昨日ChatGPT系统宕机导致全球生产力下降了50%,许多从事AI领域的人士也因此遭遇了一番挑战。据称,甚至有数以万...
ChatGPT全球宕机:昨日事件的警示

美国加强对出口至中国的人工智能芯片的管制

AIGC动态欢迎阅读 美国加强对向中国出口人工智能芯片的管制 据AI范儿报道,美国商务部最近宣布收紧对向中国出口人工智能芯片的管制措施。商务部长吉娜·雷蒙多表示,他们的目标是限制中国获得可能推动人工智能和高级计算机领域取得突破的先进半导体。她指出,这些芯片对中国的军事应用至关重要,引发了对美国在关键...
美国加强对出口至中国的人工智能芯片的管制

北大数院校友联合开源:单GPU微调大模型生成速度提升2倍,仅需数小时

本篇文章介绍了一项名为Medusa的研究成果,该研究成功提升了大型模型的推理速度,而无需额外训练新模型或优化计算硬件。值得一提的是,该研究由来自普林斯顿大学、UIUC、卡内基梅隆大学和康涅狄格大学的研究人员以及FlashAttention作者Tri Dao共同完成。该项技术已成功应用于伯克利的&qu...
北大数院校友联合开源:单GPU微调大模型生成速度提升2倍,仅需数小时

英伟达推出大模型加速包,Llama2推理速度翻倍

AIGC动态欢迎阅读 原标题:英伟达推出大模型加速包:"老黄"给H100“打鸡血”,Llama2推理速度翻倍 关键词:模型、公告、速度、批处理、量子 文章来源:量子位 内容字数:3838字 内容摘要:近期,英伟达宣布推出针对LLM推理的加速程序,将大模型的推理速度提升了一倍!这也许意味着不再需要等到...
英伟达推出大模型加速包,Llama2推理速度翻倍