模型

共 1477 篇文章

探寻语音 AI 之路:约翰霍普金斯大学 CLSP 群英谱

该文介绍了约翰霍普金斯大学CLSP(Center for Language and Speech Processing)团队在语音AI领域的探索和成就。文章提到了一群有志青年离开学校后,如何利用人工智能技术来改变世界的故事。其中,徐鹏作为其中一员,在接到一通意想不到的电话后,开启了他在CLSP的探索...
探寻语音 AI 之路:约翰霍普金斯大学 CLSP 群英谱

谷歌发布重磅更新 PaLI-3,小改动大作用!

AIGC动态欢迎阅读 原标题:谷歌发布全新模型 PaLI-3,实力不容小觑! 关键词:模型、编码器、图像、文本、任务 文章来源:夕小瑶科技说 字数:10887字 简介:智商掉了一地,ZenMoore视觉语言模型(VLM)的参数规模已经扩展到数百亿甚至数千亿,性能持续提升。尽管如此,小规模模型仍然非常...
谷歌发布重磅更新 PaLI-3,小改动大作用!

生成式人工智能的碳排放量相当于开车往返月球,怎么解决?

欢迎阅读AIGC动态这篇文章原题为:生成式 AI 碳排放是否堪比开车往返月球?如何解决这一问题关键词:模型、报告、人工智能、排放量、提示文章来源:AI前线字数:9891字内容摘要:作者Jesse McCrosky,译者明知山策划丁晓昀。生成式人工智能的发展正在改变我们的行业和社会。像ChatGPT和...
生成式人工智能的碳排放量相当于开车往返月球,怎么解决?

GPT-4主导的「谁是卧底」桌游!对话逼真,类人属性有待提升

本文介绍了一项有关GPT-4参与桌游「Spyfall」的研究。通过让GPT-3.5和GPT-4参与游戏测试其类人属性,一支韩国团队引发了对生成式AI研究的新思考。「Spyfall」是一个黑帮题材的桌游,玩家需要通过言语互动揭示「卧底」的身份,适合朋友聚会。该研究也探讨了AI在类人交流方面的发展空间。...
GPT-4主导的「谁是卧底」桌游!对话逼真,类人属性有待提升

Transformer八子融资额突破8.7亿美元,百度谷歌共同打造AI黄埔军校,「AI行业全景报告」揭示GenAI大爆发

本文介绍了由新智元报道的“人工智能全景报告”,该报告由Air Street Capital创始人Nathan Benaich等人制作,对过去一年AI行业的突破性技术和新发展进行了像素级回顾。这份160多页的报告涵盖了AI研究、行业、安全等领域。报告总结了百度、谷歌之类的公司在人工智能领域的进展以及T...
Transformer八子融资额突破8.7亿美元,百度谷歌共同打造AI黄埔军校,「AI行业全景报告」揭示GenAI大爆发

GPT-3.5和微调Llama 2开源模型比较分析:哪个更适合?

本文来源于机器之心的一篇文章,题为《选择GPT-3.5还是微调Llama 2等开源模型?综合比较后答案有了》,作者通过对GPT-3.5和Llama 2在不同任务上的微调进行比较,总结了在不同情况下选择GPT-3.5或Llama 2等模型的建议。文章试图通过实验验证手动微调模型是否能达到接近GPT-3...
GPT-3.5和微调Llama 2开源模型比较分析:哪个更适合?

谷歌与CMU合作研究:大语言模型击败扩散模型,视频图像生成双SOTA,北大校友担任一作

欢迎阅读AIGC动态 原标题:大型语言模型击败传统扩散模型!视频和图像生成双SOTA,最新研究由谷歌CMU团队完成,主要作者是北大校友。 关键词:模型、视觉、语言、分词、人工智能 文章来源:量子位 内容字数:2561字 内容摘要:最新来自凹非寺量子位发布的消息称,语言模型在视频和图像生成领域取得双重...
谷歌与CMU合作研究:大语言模型击败扩散模型,视频图像生成双SOTA,北大校友担任一作

香港中文大学研究团队发布全面的中文大语言模型评测

欢迎阅读AIGC动态 原文标题:全面的中文大语言模型评测来啦!香港中文大学研究团队发布 关键词:模型、中文、数据、语言、能力 文章来源:量子位 内容字数:6594字 摘要:2023年,全球大语言模型竞赛拉开帷幕。近期,工业界和研究机构推出了各种大语言模型,特别是中文大语言模型在过去半年间蓬勃发展。在...
香港中文大学研究团队发布全面的中文大语言模型评测

最新AI研究热点论文(10月9日-10月15日)

欢迎阅读AIGC动态 原文题目:最新人工智能热点论文(10/9-10/15) 关键词:语言,事实性,模型,规则,策略 文章来源:AI范儿 文章字数:5736字 内容摘要:AI范儿整理了最新人工智能论文(10/9-10/15)的要点:- 环形注意力- 通用模拟器- LLMs中事实性的概述- LLMs ...
最新AI研究热点论文(10月9日-10月15日)

AI行业热点:10月9日至10月15日

<img src=""> AI范儿资讯:重磅报道 本文标题: 本周人工智能热点(10月9日-10月15日) 主要关键词:解读、企业、人工智能、模型、融资 文章来源:AI范儿 字数:8553字 内容概要:根据AI范儿报道,OpenAI计划推出一项重大更新,旨在使其人工智...
AI行业热点:10月9日至10月15日

文心大模型4.0:推理成本增加十倍的可能性揭秘

AIGC动态欢迎阅读 原标题:推理成本增加10倍?对文心大模型4.0的一些猜想 关键词:模型, 知乎, 数据, 成本, 用户 文章来源:夕小瑶科技说 内容字数:4702字 内容摘要:夕小瑶科技说原创作者 | 卖萌酱大家好,我是卖萌酱。相信不少小伙伴这几天都听到了消息,在期待下周即将发布的文心大模型4...
文心大模型4.0:推理成本增加十倍的可能性揭秘

CTO遭大大震惊!GPT-4V自动驾驶五连测引关注,探讨前沿科技| 量子位 2023-10-15 14:39 北京报道

最近,图森中国的CTO王乃岩在知乎上发表了一篇关于GPT-4V在自动驾驶中的测试报告,引起了广泛关注。经过多次测试后,王CTO表示他们感到“大大震惊”。这标志着GPT-4V的到来给人工智能领域带来了新的可能性。尤其是在视觉相关功能方面,GPT4终于推出了新功能,引发了业内人士的探讨和关注。作者表示虽...
CTO遭大大震惊!GPT-4V自动驾驶五连测引关注,探讨前沿科技| 量子位 2023-10-15 14:39 北京报道

CTO曝光:GPT-4V自动驾驶五连测大揭秘

文章介绍了图森中国CTO王乃岩在知乎上发表的关于GPT-4V在自动驾驶中的初步探索,引起了广泛关注。经过多方测试后,王乃岩表示他们对GPT-4V的表现感到“大大震惊”。文章指出,GPT-4V的推出为人工智能领域带来了新的可能性,尤其在视觉相关功能方面有了重大突破。作者强调了GPT在图像感知方面的惊人...
CTO曝光:GPT-4V自动驾驶五连测大揭秘

优化基础LLM技术:Meta版ChatGPT为长上下文提供持续预训练

AIGC动态欢迎阅读 原标题:「Meta版ChatGPT」背后的技术:持续预训练改进基础LLM处理长上下文的能力 关键词:模型、上下文、长上、任务、下文 文章来源:机器之心 内容字数:10932字 内容摘要:机器之心报道编辑 Panda W 在处理长上下文方面指出,LLaMA 在一直力有不足,而通过...
优化基础LLM技术:Meta版ChatGPT为长上下文提供持续预训练

开源社区上季度值得尝试的模型项目有哪些?

本文介绍了过去一个季度开源社区推出的一些值得尝试的开源模型,涵盖了语言大模型和多模态项目等内容。具体包括LLaMA 2、Baichuan 2、ChatGLM2-6B、Qwen-14B、InternLM-20B、Tigerbot-13B、Xverse-13B等语言大模型,以及LlaVA1.5、Visu...
开源社区上季度值得尝试的模型项目有哪些?

字节跳动李航:语言大模型的观察和思考

欢迎阅读AIGC动态 原标题:字节跳动李航:对语言大模型的一些观察和思考 关键词:模型、语言、序列、字节跳动、心智 文章来源:机器之心 文章长度:17188字 内容概要:本文系机器之心专栏作者、字节跳动研究负责人李航就大规模语言模型(LLM)发表观点,主要包括以下几点:ChatGPT通过规模和模型方...
字节跳动李航:语言大模型的观察和思考

深度学习光芒四射:探寻 SGD 的重要性

<img src=""> 欢迎阅读AIGC动态 原文标题:SGD 的光芒:探索深度学习的意义 关键词:模型、解读、行为、可能性、特征 文章来源:大数据文摘 文章字数:6594字 文章摘要:本文由纽约大学(NYU)的博士后Naomi Saphra于7月份撰写,题为“Interpr...
深度学习光芒四射:探寻 SGD 的重要性

LangChain起步于一场程序员的自嗨,这就是它不好用的原因

感谢您阅读AIGC动态原标题:为何LangChain并不理想?根源在于它起源于一场程序员的自我陶醉关键词:模型、开发者、快手、字节跳动、中间层文章来源:Founder Park文本长度:12007字内容摘要:当蒂姆·库克站在苹果总部大楼外的草坪上,展示全新的iPhone 15 Pro系列时,居住在波...
LangChain起步于一场程序员的自嗨,这就是它不好用的原因

OpenAI依靠ChatGPT实现暴涨!年度收入较去年增长45倍

本文报道了OpenAI利用ChatGPT取得巨大成功的消息。据悉,OpenAI首席执行官Sam Altman透露公司年化标准收入已达到13亿美元,比去年增长了45倍。这家得到微软支持的初创公司自今年2月推出付费版ChatGPT以来,收入呈现出快速增长的态势。这则新闻显示了人工智能领域的巨大商机和潜力...
OpenAI依靠ChatGPT实现暴涨!年度收入较去年增长45倍

ICCV 2023 | 深度主动轮廓模型DeepAC实现实时六度物体跟踪

融合深度学习技术的物体跟踪新方法原标题:ICCV 2023 | 实现实时六度物体跟踪,深度主动轮廓模型DeepAC来了关键词:物体、方法、边界、模型、度文章来源:机器之心内容字数:11119字内容摘要:本文介绍了由国防科技大学刘煜教授团队和浙江大学-商汤联合实验室周晓巍教授团队共同撰写的论文《Dee...
ICCV 2023 | 深度主动轮廓模型DeepAC实现实时六度物体跟踪

UC伯克利提出LAMP框架:强化学习与视觉语言模型的语言奖励调节

《AIGC动态》欢迎阅读 本文原标题为:强化学习与视觉语言模型之间的交汇:UC伯克利提出语言奖励调控LAMP框架 关键词:任务、模型、作者、语言、提示 文章来源:大数据文摘 字数:8947字 内容概要:本文授权转载自将门创投作者seven_。在强化学习(RL)领域,一个关键的研究方向是如何巧妙设计模...
UC伯克利提出LAMP框架:强化学习与视觉语言模型的语言奖励调节

AI重新训练大模型:通过暂停token,AI学会三思而后行

最新文章来自量子位,标题为“用暂停token重新训练大模型,AI学会三思而后行”。该研究通过在训练大型模型时引入暂停token,实现了AI在任务执行前多考虑步骤从而提高准确率的能力。实验结果显示,在8项评测中,包括SQuAD和CommonSenseQA在内的相关任务表现都有所提升。研究者Jack H...
AI重新训练大模型:通过暂停token,AI学会三思而后行

基于Imagen打造的网友之DALL-E替代品:谷歌AI绘画搜索框开启新玩法

AIGC动态欢迎阅读原标题:谷歌推出AI绘画搜索框功能,轻松玩转图像生成关键词:图像、量子、助手、功能、模型文章来源:量子位内容字数:3392字内容摘要:近日,谷歌推出名为“DALL-E/Midjourney”的 AI 功能,为其搜索引擎带来了一项重要更新:用户只需在搜索框中输入提示词,即可开始进行...
基于Imagen打造的网友之DALL-E替代品:谷歌AI绘画搜索框开启新玩法

有必要在情绪识别中应用迁移学习吗?

<img src=""> 欢迎阅读AIGC动态 原文标题:使用LLM进行情绪识别是否必要? 关键词:模型、数据、任务、情感、话语 文章来源:大数据文摘 内容字数:9567字 摘要:情绪识别在各种对话场景中具有广泛的应用价值。例如,在社交媒体中,可以通过对评论进行情感分...
有必要在情绪识别中应用迁移学习吗?

OpenAI推出新功能,将开发成本降低至5%,吸引开发者并留住客户。

AIGC动态简报 原文标题:OpenAI计划推出新功能,将开发成本降至5%!吸引开发者并稳固客户关系 关键词:模型、美元、微软、成本、公司 文章来源:AI前线 字数统计:7515字 内容概要:本文撰写者为冬梅。据路透社报道,OpenAI计划推出新功能,降低开发成本至5%。该计划旨在吸引更多企业和开发...
OpenAI推出新功能,将开发成本降低至5%,吸引开发者并留住客户。

ChatGPT安全性受到微调攻击风险:普林斯顿、斯坦福研究发布LLM预警

本文介绍了微调语言模型(LLM)可能存在的安全风险,指出微调过程中使用良性数据和角色扮演等方式可能破坏模型的性能对齐。虽然预训练语言模型在某些情况下表现出色,但在实际应用中,通常需要对其进行微调以适应特定任务。然而,微调后的模型安全性、对齐性能是否受影响,以及在面向用户时可能产生的风险等问题尚需进一...
ChatGPT安全性受到微调攻击风险:普林斯顿、斯坦福研究发布LLM预警

将旧模型重编程到新任务:轻量级持续学习中的0.6%额外参数

这篇文章介绍了机器之心编辑部持续学习的主题,重点在于模仿人类在连续任务中持续积累知识的能力。其中提到,持续学习的主要挑战在于如何确保在学习新任务后仍保持对以前所学任务的表现,避免灾难性遗忘。相比之下,持续学习和多任务学习在方法上有所不同,多任务学习可以同时学习不同任务,而持续学习则是逐个学习任务。原...
将旧模型重编程到新任务:轻量级持续学习中的0.6%额外参数

2023 AI全景报告:AI将驾驭3A大作,OpenAI或面临调查?十大预测揭秘

本文介绍了最新一期《人工智能全景报告》的发布情况,该报告由业内领先的人工智能从业者撰写,已经成为了人工智能领域的风向标。报告总结了过去一年的发展并做出了未来发展的预测。文章来源于机器之心,作者为专业的人工智能媒体和产业服务平台。报告内容涉及到AI在3A大作中的运用,以及OpenAI可能面临的调查等内...
2023 AI全景报告:AI将驾驭3A大作,OpenAI或面临调查?十大预测揭秘

一家公司横扫业界领先的大模型

近日,机器之心报道了一则关于业界领先大模型的文章,其中提到即使是最先进的大模型,如GPT-4,仍存在一些局限性。例如,GPT-4的上下文窗口仅支持32k token,无法处理过长的文本;另外,对于涉及超过8位数字乘法的运算或涉及小数、分数等复杂计算,也存在挑战。文章指出,尽管这些大模型具有强大的能力...
一家公司横扫业界领先的大模型

14个提高Prompt质量的有效方法

<img src=""> AIGC动态欢迎阅读 本文原题为:《Effective Prompt: 编写高质量Prompt的14个有效方法》。关键词包括知乎、模型、任务、答案和问题。文章来源于夕小瑶科技说,字数为13133字。夕小瑶科技说分享了知乎用户@Maple小七、...
14个提高Prompt质量的有效方法

阿尔特曼透露:OpenAI年收入同比增长4500%,达到13亿美元

AIGC动态欢迎您的阅读原标题:同比增长4500%!阿尔特曼透露OpenAI年收入达13亿美元关键词:美元,收入,模型,微软,产业文章来源:AI导航字数统计:5787字内容摘要:随着OpenAI的崛起,谷歌DeepMind却陷入困境。据《The Information》报道,OpenAI的CEO 萨...
阿尔特曼透露:OpenAI年收入同比增长4500%,达到13亿美元

智源发布强大的开源中英双语LLM模型“全家桶”,超越Llama 2

AIGC动态欢迎阅读 本文介绍了智源研究院最新推出的Aquila2-34B大语言模型,这一340亿参数的新成员超越了Llama 2-70B,在22个评测基准中表现出色。被称为当前最强的开源中英双语大模型。此举进一步提升了大模型在各项业绩评估中的地位。智源研究院强调该模型不仅在大模型榜单上取得成功,还...
智源发布强大的开源中英双语LLM模型“全家桶”,超越Llama 2

腾讯推出混元大模型,在QQ浏览器中投入应用;DeepMind去年利润下降40%;OPPO新一代小布AI助手开始公测丨AIGC大事日报

AIGC新闻动态本文原标题为:腾讯成功将混元大模型应用于QQ浏览器;DeepMind去年利润下降40%;OPPO新款小布AI助手正在公测中丨AIGC大事日报关键词:模型,腾讯,人工智能,报道,功能文章来源:AI导航内容字数:12390字内容摘要:10月12日全球AIGC产业要闻包括:1、传OpenA...
腾讯推出混元大模型,在QQ浏览器中投入应用;DeepMind去年利润下降40%;OPPO新一代小布AI助手开始公测丨AIGC大事日报
1 22 23 24 25 26 37