
最新动态:
近期,谷歌发布了一项引人关注的新技术:一种先进的大型语言模型,能够在零样本情况下生成高质量的10秒视频。这一成果迅速引起了业界的关注和讨论。网友们纷纷表示期待看到这一技术未来的应用,也给了其他相关公司一些压力。
文章概要:
据明敏在凹非寺量子位的报道,谷歌最新推出的大型语言模型VideoPoet引发了业内热议。该模型不仅能够在零样本情况下达到当前领先水平,还能实现画面稳定、动作逼真、清晰度提升等显著效果。借助与Bard的合作,甚至能够轻松生成一分钟长的视频小片,完全无需人类干预。这一创新让网友们惊叹视频生成技术的飞速发展,许多人对其表现出浓厚兴趣。此外,有评论指出VideoPoet效果优异,也督促其他公司如Runway和Pika加快发展步伐。
VideoPoet的功能十分全面,涵盖了文本转视频、图像转视频、视频编辑、风格化处理、画面补充等多项任务。在文本转视频任务中,用户可以灵活调整输出视频的长度,并根据需求添加动作和风格元素。而在图像转视频任务中,使用者甚至可以让静态图片动起来,包括名画和照片等内容。此外,通过输入一些额外的文本信息,用户还可以调整视频的风格,模型将预测视频的光照和深度信息,呈现出更具创意和想象力的效果。
原文链接:谷歌发布新大语言模型:零样本生成10秒视频达SOTA!网友:压力给到Runway/Pika
作者联系方式
文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关AI热点
暂无评论...