腾讯混元发布图生视频模型,开放源代码并推出对口型和动作驱动等新玩法 腾讯发布了混元图生视频模型并对外开源,同时推出了多种新玩法,包括口型对齐和动作驱动功能,支持生成背景音效以及2K高质量视频。 基于图生视频技术,用户只需上传一张图片,并简要描述期望的动态效果及镜头调度,混元便能够根据要求将图片动起来,转化为5秒短视频,并自动添加背景音效。此外,用户若上传一张人物图片... AGI1年前
一张图片+一句动作指令,轻松制作3D视频,尽在Animate124 <img src=""> 欢迎阅读AIGC动态 本文原标题为:“只需一张图片、一句动作指令,Animate124轻松生成3D视频”关键词:模型、视频、华为、阶段、静态文章来源:机器之心文章字数:4853字 内容摘要: 《机器之心》专栏介绍了机器之心编辑部Aniamte... AI工具箱2年前
谷歌发布全新视频生成大型语言模型VideoPoet AI时代新动态 原标题:谷歌推出视频生成巨型语言模型VideoPoet关键词:视频、模型、文本、音频、图像文章来源:AI范儿字数:2042字 内容摘要: 请点击上方链接关注我们。谷歌推出了VideoPoet,这是一款生成式人工智能系统,能够通过文本等输入创建和编辑视频。与其他竞争模型不同,Video... AI工具箱2年前
库克揭秘:苹果Vision Pro三大秘密武器 AIGC动态欢迎阅读原标题:苹果Vision Pro即将上市,库克准备了三大秘密武器关键字:苹果,报告,视频,空间,用户文章来源:AI导航内容字数:11084字内容摘要:经过亲自测试,3D空间视频效果令人惊叹!能否冲击百万销量?时价3万元的预售已经启动,所有与苹果Vision Pro发布相关的信息都... AI工具箱2年前
谷歌发布新大语言模型:零样本生成10秒视频达SOTA,网友各路艺术从业者感压力↑↑↑ 最新动态: 近期,谷歌发布了一项引人关注的新技术:一种先进的大型语言模型,能够在零样本情况下生成高质量的10秒视频。这一成果迅速引起了业界的关注和讨论。网友们纷纷表示期待看到这一技术未来的应用,也给了其他相关公司一些压力。 文章概要: 据明敏在凹非寺量子位的报道,谷歌最新推出的大型语言模型Video... AI工具箱2年前
NeurIPS 2023|美图&国科大提出基于文生图模型的新视频编辑一致性方法 EI2 欢迎阅读AIGC动态原标题:NeurIPS 2023|有效提高视频编辑的一致性!美图&国科大联合提出基于文生图模型的新方法EI2关键词:时序, 模块, 模型, 语义, 视频文章来源:AI科技评论字数:5815字内容摘要:美图影像研究院(MT Lab)与中国科学院大学颠覆性地提出了基于文生图模... AI工具箱2年前
谷歌发布 AI 视频生成模型 VideoPoet,让 AI 也能做剪辑师的工作 AIGC动态欢迎阅读 原标题:谷歌发布视频生成模型 VideoPoet,AI 连剪辑师的工作也承包了 关键字:视频,模型,内容,任务,画面 文章来源:AI科技评论 内容字数:5176字 内容摘要: 谷歌发布了新的AI视频生成模型VideoPoet,实现了单个大模型完成多种视频生成任务。过去一年,生成... AI工具箱2年前
谷歌发布VideoPoet大模型,网友:视频生成无限可能 这篇文章来自机器之心报道,介绍了谷歌推出的视频生成大模型VideoPoet,受到了人们的关注。该模型被认为是一种性技术的零射视频生成工具,能够生成多样化且流畅的视频内容。文章中提到了一些人对于这款大模型的生成长度和性质表示了好奇和期待,有人呼吁谷歌尽快开源VideoPoet。随着生成式人工智能的发展... AI工具箱2年前
谷歌发布全新零样本视频生成模型,效果惊艳超越传统扩散模型? AIGC动态欢迎阅读原标题:谷歌重磅发布零样本视频生成模型!效果惊艳,赶超扩散模型?关键字:视频、模型、文本、图像、语言文章来源:夕小瑶科技说内容字数:1739字夕小瑶科技说原创作者:王二狗今日,谷歌AI发布了最新的视频生成模型VideoPoet。VideoPoet不采用常见的扩散模型架构,实质上是... AI工具箱2年前
LLM打破记录,超越Gen-2,创造谷歌10秒视频生成神话 最新的报道显示,谷歌推出了一款新的视频生成模型VideoPoet,引领全球视频生成技术发展。这款模型能够生成10秒超长且连贯的大动作视频,效果远超先前的Gen-2模型。与其他领先模型不同的是,VideoPoet无需特定数据即可生成视频,为业界带来了新的可能性。该模型的发布再次凸显了谷歌在人工智能领域... AI工具箱2年前
苹果 2024 年重要更新一览 本文介绍了苹果公司2024年的重要更新计划,其中包括新产品的发布和功能改进。明年将开启新纪元,Vision Pro眼镜等产品即将上市,各种产品线的规划也已经逐渐明朗。Vision Pro作为2024年的头号明星产品,在今年的WWDC大会上首次亮相,备受期待。据透露,苹果计划在2024年1月邀请数百名... AI工具箱2年前
万人参与试用:AI新应用让真人视频转变为动漫、像素风,流畅感受前所未有 <img src=""> AIGC动态欢迎阅读 原标题:万人试用AI新应用:真人视频转动漫、像素风,从未如此丝滑关键字:视频,风格,网友,动漫,效果文章来源:机器之心内容字数:3867字 内容摘要: 机器之心最新报道编辑:张倩、大盘鸡 视频领域的次元壁被成功突破。在人工智能的助... AI工具箱2年前
AI原生视频工具:让创作者的职业发展迎来巅峰! 欢迎阅读AIGC动态 原文标题:有一款AI原生视频“神器”,创作者的职业天花板即将被冲破? 关键词:视频,文案,素材,创作,技术 文章来源:AI导航 文章总字数:7950字 内容摘要: 实测发现一款一键AI生成视频工具,数字化人物与真人主播相媲美。 作者:三北 编辑:漠影 大型AI模型将如何改变内容... AI工具箱2年前
NeurIPS 2023|美图&国科大基于文生图模型提出新方法EI² 有效提升视频编辑一致性 本文介绍了美图影像研究院(MT Lab)与中国科学院大学合作提出的基于文生图模型的视频生成新方法EI²,旨在提高视频编辑过程中的语义和内容一致性。文章指出现有视频编辑过程中存在的不一致性问题,主要由引入的时序信息学习模块导致特征空间的协变量偏移,针对此问题设计了新的网络模块以生成高质量的编辑结果。该... AI工具箱2年前
HeyGen 宣布注销国内主体,并宣布与 560 万美元新一轮融资相关 AIGC动态欢迎阅读原标题:HeyGen正 注销国内主体,或与560万美元新一轮融资有关关键词:公告,字节跳动,科技,视频,红杉文章来源:AI科技评论内容字数:4162字内容摘要:HeyGen团队联合创始人徐卓(左)和梁望(右)出海AI主体是否始终需要进行去中国化?作者:王 悦编辑:陈彩娴据AI科技... AI工具箱2年前
AI视频生成:大型模型的新里程碑和未来展望 欢迎阅读AIGC动态 本文原标题:AI视频生成技术的突破与未来走向 关键词:视频, 字节跳动, 模型, 技术, 领域 文章来源:机器之心 字数:3306字 摘要:时至年末,2023年被誉为大模型元年,从文本大模型ChatGPT到图片生成模型Stable Diffusion和Midjourney,技术... AI工具箱2年前
阿里文生视频挑战Gen-2、Pika,1280×720高清画质流畅播放,3500万像素呈现文本与视频绝佳效果 AIGC动态欢迎阅读 近日,阿里巴巴的研究掀起了文生视频领域的新热潮。一项名为I2VGen-XL的文生视频模型展示了惊人的表现,能够以1280×720分辨率高质量、流畅地生成各类视频,包括艺术画作、人物肖像、动物、科幻图等。其中包含了一些示例文本:“一只小猫在花丛中,中国画。”、“一个黄色的机器人。... AI工具箱2年前
UC伯克利与DeepMind联合发布真实世界模拟器,挑战虚实边界|NeurlPS 2023 在NeurlPS 2023上,来自UC伯克利、谷歌DeepMind、MIT和阿尔伯塔大学的研究人员展示了真实世界模拟器,该模拟器能够帮助解决智能体无法适应真实物理世界的问题。这一展示开创了新的技术前景,有望推动人工智能在模拟现实体验方面迈出重要一步。研究人员的最新工作UniSim在会上受到了广泛关注... AI工具箱2年前
NeurIPS 2023|LightSim自动驾驶光照仿真平台新版本发布:真实、可控、可拓展 欢迎阅读AIGC动态 原标题:NeurIPS 2023|真实、可控、可拓展,自动驾驶光照仿真平台LightSim更新 关键词:场景、数据、物体、相机、视频 文章来源:机器之心 字数:5927字 内容摘要:最新报道显示,由Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究人员共同推出的全新自动驾... AI工具箱2年前
字节跳动宣布取消PICO 5发布!裁员千人曝光,秘密项目“天鹅”竞品为苹果Vision Pro 文章涉及字节跳动公司下属VR头显公司PICO取消PICO 5并进行裁员的消息。根据报道,PICO将放弃原有的PICO 5研发计划,转而研发代号为“天鹅”的高端MR头显,以与苹果Vision Pro竞争。报道还指出,PICO进行了大规模裁员,约有400余名员工被辞退,另有600余名员工调整至字节跳动中... AI工具箱2年前
特斯拉发布Optimus二代:速度提升30%,新增90度深蹲功能 <img src=""> 欢迎阅读AIGC动态 原标题:特斯拉Optimus二代发布!速度提升30%,还能做90度深蹲 关键词:动作,触觉,视频,瑜伽,能力 文章来源:大数据文摘 内容字数:1851字 摘要:本文授权转载自机器人大讲堂的作者李鑫。12月13日,Elon... AI工具箱2年前
Transformer技术助力扩散模型:AI视频生成质量达到照片级真实感 <img src=""> 欢迎阅读AIGC动态 原文标题:Transformer在扩散模型中的应用,AI生成视频达到照片级真实感 关键词:视频, 模型, 注意力, 图像, 报告 文章来源:机器之心 内容字数:9333字 内容摘要:机器之心报道编辑:Panda指出,将T... AI工具箱2年前
斯坦福李飞飞合作谷歌,AI文生视频大模型炸圈 欢迎阅读AIGC动态原标题:斯坦福大学李飞飞团队联合谷歌推出AI文生视频大模型关键词:视频, 字节跳动, 模型, 图像, 示例文章来源:AI导航字数:7188字内容摘要:AI文生视频工具的迅速崛起,视频生成模型的GPT时代即将到来。本文报道了斯坦福大学AI科学家李飞飞及其团队与谷歌合作,发布了名为W... AI工具箱2年前
Runway发布全新通用世界模型,视频AI技术迎来突破! AIGC最新消息 本文来源于新智元,公告指出Runway宣布开发通用世界模型,以解决AI视频领域的重大挑战。近期,Pika 1.0在AI视频领域取得巨大成功,与Runway相比成果远超预期。面对Pika的竞争,Runway选择抛出惊人的宣言,声称将不与其争锋,而是朝着更宏大的目标迈进。官方宣布推出通... AI工具箱2年前
阿里再次创新:一张人脸一句话就能玩《擦玻璃》,服装背景任意更换! 欢迎阅读AIGC动态原标题:阿里巧妙创新:一张人脸一句话就能跳《擦玻璃》,服装背景自由更换!关键词:视频,阿里,内容,舞蹈,文本文章来源:量子位内容字数:3098字内容摘要:金磊 发自 凹非寺量子位 | 公众号 QbitAI阿里再次带来了一项引人注目的“舞蹈创新”技术,这次只需一张脸部照片和一句话描... AI工具箱2年前
阿里Animate Anyone跳舞技术揭秘:作者带你探索背后的秘密 欢迎阅读AIGC动态 原标题:阿里Animate Anyone跳舞引发热议,作者解读背后技术 关键词:解读、技术、视频、人物、机器 文章来源:机器之心 字数统计:2052字 摘要:研究者从 GAN 等技术入手,逐渐深入探索图像动画化和姿态迁移,但生成图像或视频存在局部失真、细节模糊等问题,限制了应用... AI工具箱2年前
贾佳亚团队新研究:AI成为鉴片大师,星际穿越也能轻松看懂超长3小时视频 AIGC动态欢迎阅读 本文来源于量子位,介绍了贾佳亚团队最新研究成果:他们开发的多模态大模型LLaMA-VID可以处理超长视频,使得AI能够像专业影评人一样理解电影,比如《星际穿越》,并对电影中的细节进行准确回答。这项研究的背后原理简单却高效,将每一帧图像的表示压缩到仅有2个token。与其他同类模... AI工具箱2年前
谷歌承认Gemini视频是经过剪辑制作的,计划超越GPT-4引发疯狂议论 本文标题为《AIGC动态欢迎阅读》,内容摘要为谷歌承认Gemini视频剪辑并欲超越GPT-4,文章来源于夕小瑶科技。谷歌发布的Gemini模型在推出不久后引起轰动,但随后被揭露使用了不当手法,甚至承认视频是剪辑制作。Gemini在MMLU基准测试中表现超人,但其依赖的CoT@32方法引发了争议。想了... AI工具箱2年前
Pika 1.0首测:秒杀Gen-2!网友抢先体验电影级炸裂效果,背后技术细节首度揭秘 本文是来自新智元的报道,标题为《Pika 1.0首测秒杀Gen-2!网友抢先体验电影级炸裂效果,背后技术细节首公开》。Pika 1.0首次亮相,网友们有幸率先体验到了电影级的炫酷效果。该产品由斯坦福AI Lab博士创办的初创公司Pika推出,一经发布便引起极大反响。用户们在内测阶段已经对Pika 1... AI工具箱2年前
谷歌Gemini揭示复仇GPT-4的底牌,猛料再次曝光 AIGC动态欢迎阅读 原标题:谷歌Gemini再次揭示猛料,逐帧分析揭开GPT-4的底牌 关键词:报告,解读,工作人员,视频,提示 文章来源:AI导航 文章长度:13952字 文章摘要:谷歌Gemini并非宣传视频中所展示的那样强大,但与GPT-4的对决是否能够实现?作者|李水青编辑|云鹏最近的24... AI工具箱2年前
Gemini研究:原生多模态揭示文本在大型模型中的重要性 AIGC动态欢迎阅读 原标题:Gemini解读:原生多模态,反而证明了文本对于大型模型的重要性 关键词:报告,模型,解读,视频,能力 文章来源:Founder Park 内容字数:8965字 内容摘要:谷歌于12月6日发布了Gemini语言大型模型,并在Bard中推出了Gemini Pro版本。同时... AI工具箱2年前
谷歌Gemini视频造假曝光:多模态视频涉嫌剪辑配音,涉嫌「作弊」击败GPT-4? 本文报道了谷歌Gemini被曝视频造假的情况。原文指出,Gemini的多模态视频实际上是经过剪辑拼贴和配音制作的,并非实时感知。该视频在发布后受到了广泛关注,但随后遭受了质疑。文章列举了一些质疑声音,并提到了谷歌官方的回应说明视频确实存在后期制作。如果您想查看完整原文,请点击谷歌Gemini被曝视频... AI工具箱2年前
Pika 1.0试用效果口碑翻转,众人直呼「最佳视频生成器」 AIGC动态欢迎阅读 原标题:口碑翻转,Pika 1.0试用效果折服一大票人,直呼「最佳视频生成器」 关键词:用户,视频,创始人,大片,效果 来源:机器之心 字数:3101字 内容摘要:根据机器之心的报道编辑杜伟的观点,Pika 1.0的出现确实给Runway带来了强有力的竞争对手。上个月底,一个名... AI工具箱2年前
Gemini上线首日:用户褒贬不一,演示被质疑「造假」,谷歌受到质疑认可 本文摘自机器之心,介绍了Gemini在上线首日所遇到的争议。文章指出Gemini展示的多模态AI能力受到了褒贬不一的评价,其中一些Demo被指称为伪造。谷歌随后承认了这一情况。文章提到Gemini的视频在发布后引起了巨大关注,其中展示了多模态模型在识别和响应各种输入方面的能力。感兴趣的读者可以查看原... AI工具箱2年前
Gemini演示视频称谷歌被刷屏,实为伪造 <img src="" /> AI范儿动态欢迎您的阅读 原标题:揭露:谷歌Gemini演示视频实为伪造 核心词汇:视频、模型、提示、演示、手势 文章来源:AI范儿 文章字数:5288 字 内容摘要:请点击上方蓝字关注我们。根据TechCrunch的报道,Google的... AI工具箱2年前
后期强化!照片替换视频主角,动作再大也OK|Meta&新加坡国立大学 本文为转载自量子位的文章,介绍了一种名为“VideoSwap”的视频编辑模型,可以通过一张图片替换视频主角,效果十分流畅。该模型能够保持物体之间轨迹的一致性,即使替换前后的物体形状有较大差异也能实现完美替换。与谷歌早前发布的类似技术相比,这一技术的进步可见肉眼可见。文章提到该模型是如何实现这一功能的... AI工具箱2年前
Google发布最强大的新模型:GPT-4是否将被超越? 最新的 AIGC 动态如下: 随着 Google 推出了多模态 Gemini AI 模型,掀起了一场关于 GPT-4 是否会被反超的讨论。Gemini 能够处理文本、代码、音频、图像和视频等不同类型的信息,被视为 Google 在 AI 大模型领域的重要突破。然而,Google 之前推出的 Bard... AI工具箱2年前
香港大学教授徐东创立文生视频大型公司「徐图智能」 阅读AIGC动态的最新消息 原始标题:香港大学徐东教授成立文生视频大模型公司「徐图智能」 关键词:视频、模型、教授、领域、论文 信息来源:大数据文摘 内容字数:2301字 内容概要:大数据文摘获得授权,转载自AI科技评论作者:郭思编辑:陈彩娴。现在,大模型的创业经历已经进入了2.0阶段,除了之前如雨... AI工具箱2年前
字节新技术实现抖音跳舞“一张照片就能生成高质量视频”,连抖音创始人都亲自体验! 最新的技术进展让人们不得不感叹科技的无限可能。最近,字节跳动与新加坡国立大学合作推出了一项名为MagicAnimate的技术,令人瞩目。这项技术可以通过一张图片和一组动作生成出毫无瑕疵的视频,无需真人出镜,令人匪夷所思。 这一创新立即引起了科技界的广泛关注和热烈讨论,许多科技大佬和极客们纷纷亲身体验... AI工具箱2年前
徐东教授领衔,香港大学成立文生视频大模型公司「徐图智能」 近日,由AI科技评论报道,IEEE Fellow、香港大学教授徐东创立了一家名为"徐图智能"的人工智能公司,公司定位于基于视觉大模型技术,提供文生视频等服务。成立于今年6月的公司目前还处于注册状态。徐东教授自2001年和2005年分别在中国科学技术大学获得学士和博士学位,在香港大... AI工具箱2年前