Phenaki 是什么?
Phenaki 是 Google Research 的一个项目,其目标是从开放域的文本描述中合成逼真的视频。可以直接从文本中生成长达数分钟的视频。
通过Phenaki,您还可以从静止图像和提示生成视频。所提出的视频编码器-解码器在时空质量和每个视频的令牌数量方面优于文献中当前使用的所有每帧基线。
为了从文本生成视频标记,Phenaki使用以预先计算的文本标记为条件的双向掩码转换器。生成的视频令牌随后被去令牌化以创建实际视频。
Phenaki 是视频合成领域的一个突破,因为它可以处理开放域和时间变量提示,这与以前受数据可用性和计算成本限制的方法不同。Phenaki 还可以从静止图像和提示生成视频,例如放大猫的眼睛或让它打哈欠。Phenaki 有许多潜在的应用,例如娱乐、教育、讲故事和艺术。
Phenaki能做什么?
这段视频火爆外网,谷歌把AI视频造假搞得太真太简单了
Phenaki 优点:
它可以生成可变长度和质量的视频,最长可达两分钟
它可以处理开放域和时间变量提示,例如故事或描述
它利用大量的图像-文本对语料库和少量的视频-文本示例来泛化视频数据集之外
相关导航
Creatus.ai 是一个允许您使用人工智能从文本输入生成引人入胜的视频内容的平台。Creatus offers an AI-native workspace and autonomous team members for small-to-medium businesses to optimize resourcing costs and boost productivity. Our platform seamlessly integrates AI features and tools, providing custom-tailored solutions for enterprises. Experience the power of AI in everyday tools like Canva, Notion, Airtable, Zapier, and more. With Creatus, you get your own private Google that can work autonomously, generating videos, organizing tasks, and even creating a conversational avatar. Join us in the future of work with our digital co-workers.