Vlogger是一种适用于虚拟肖像的多模态Diffusion模型,利用MENTOR数据库进行演习,该数据库中包含超过 80 万名人物肖像,以及累计超过2200小时的影片。

谷歌推出AI模型Vlogger可根据图片和音频生成人物讲话视频_视频_措辞 智能写作

据称,Vlogger旨在支持与人类用户的自然对话,这个新工具可以用作演示、教诲、阐述等方面的办理方案。

这个新模型可以作为一个人工智能代理,人们可以和它交谈,同时也可以编辑***。

据理解,Vlogger紧张运用之一是编辑现有的***,例如,Vlogger可以改变主题的表情,或者调度嘴巴和眼睛的闭合状态,从而改变***的感情和信息通报。

Vlogger的另一个方面是***翻译,它采取特定措辞的现有***,并改变嘴唇和面部表情以适应新的音频。
用户可以修正现有的***以适应不同措辞的动态。
谷歌研究职员供应的一个例子是翻译成西班牙语的英文原版***。

通过Vlogger,谷歌的研究职员彷佛正在测试***中人工智能的边界,同时也重新定义了用户该当如何利用这些图像到***的做事。