谷歌发布新大语言模型：零样本生成10秒视频达SOTA，网友各路艺术从业者感压力↑↑↑

文章概要：

据明敏在凹非寺量子位的报道，谷歌最新推出的大型语言模型VideoPoet引发了业内热议。该模型不仅能够在零样本情况下达到当前领先水平，还能实现画面稳定、动作逼真、清晰度提升等显著效果。借助与Bard的合作，甚至能够轻松生成一分钟长的视频小片，完全无需人类干预。这一创新让网友们惊叹视频生成技术的飞速发展，许多人对其表现出浓厚兴趣。此外，有评论指出VideoPoet效果优异，也督促其他公司如Runway和Pika加快发展步伐。

VideoPoet的功能十分全面，涵盖了文本转视频、图像转视频、视频编辑、风格化处理、画面补充等多项任务。在文本转视频任务中，用户可以灵活调整输出视频的长度，并根据需求添加动作和风格元素。而在图像转视频任务中，使用者甚至可以让静态图片动起来，包括名画和照片等内容。此外，通过输入一些额外的文本信息，用户还可以调整视频的风格，模型将预测视频的光照和深度信息，呈现出更具创意和想象力的效果。

原文链接：谷歌发布新大语言模型：零样本生成10秒视频达SOTA！网友：压力给到Runway/Pika