AI见闻日报:见智实测“超级网红”Runway Gen2一键文生***比Midjourney更易用 | 见智研究_模子_达摩
1、谷歌大手笔投资的Runway正式发布Gen2,笔墨天生***成真,内附见智实测;
2、360智脑通过中国信通院可信AIGC大措辞模型功能评估,为海内首家;
3、阿里达摩院开源Video-LLaMA,帮大措辞模型加上“眼睛”、“耳朵”;
4、AI天生二维码—将快速运用于广告市场;
逐日AI
1、谷歌大手笔投资的Runway正式发布Gen2,笔墨天生***成真,内附见智实测
本日,真正的文本一键天生***涌现了。Stable Diffusion和《瞬息全宇宙》背后技能公司Runway,出品的text to video的AI***编辑工具Gen2,今日开放用户利用。Gen2,也在内测阶段就被网友夸奖“***界的Midjourney”。
见智本日利用runway的app版本做了一个猫的***;Prompt: A golden gradient cat is jumping in the grass,同时又给了一张小猫咪的图作为模板。
目前来看runway已经能够按照指令天生相应的***,但是风雅程度和对prompt的理解程度相对图片天生平台Midjourney还是明显要弱一些的。但是随着用户大规模的利用改进,相信Runway的Gen2很快可以风靡小***创作领域。
见智点评:随着多模态模型的发展,从笔墨-图片-***之间的相互天生将改变全体用户生态。对付家当界来说,只成为素材生产者还远远不足,能够将天生素材进一步便捷让用户天生终极形态运用将是AI运用发展更主要的一步。
2、360智脑通过中国信通院可信AIGC大措辞模型功能评估,为海内首家
360智脑的360GPT-S2-V8型号产品得到了中国信息通信研究院“可信AIGC大措辞模型根本能力”评估报告,报告显示必选项目评估内容均通过。据悉,360智脑是海内首个通过中国信通院该项威信评估的大模型产品。
见智点评:360智脑成为首家通过中国信通院威信认证,一方面解释了通用大模型的根本能力得到认可,主要的是数据集的安全性有了国家的背书,更有助于之后大范围的商用运用推广。同时关注来日诰日的360智脑发布会。
3、阿里达摩院开源Video-LLaMA,帮大措辞模型加上“眼睛”、“耳朵”
阿里达摩院的研究职员提出了 Video-LLaMA,一个具有综合视听能力大模型。Video-LLaMA 能够感知和理解***中的***和音频旗子暗记, 并能理解用户输入的指令,完成一系列基于音***的繁芜任务,例如音 / ***描述,写作,问答等。目前论文,代码,交互 demo 都已开放。其余,在 Video-LLaMA 的项目主页中,该研究团队还供应了中文版本的模型,让中文用户的体验更丝滑。
见智点评:阿里达摩院让Video-LLaMA开源,进一步推动海内多模态大模型的发展进程。视听综合大模型非常适用于办公、学习领域的运用。其余,Video-LLaMA大模型对付静态图像也有比较强的理解能力,能够完成图片描述和问答。
4、AI天生二维码—将快速运用于广告市场
摆脱单调的黑白,利用 ControlNet 的 AI 天生的二维码将更具特色和商业代价。
详细来看一个运用显示:识别二维码推举的是QRBTF -便是一款能够制作俊秀有趣二维码的免费开源在线工具;
见智点评:ControlNet是基于Stable_Diffusion进行AI天生的一种演习办法,它的特点是打算方法更高效,由于演习不须要在原始编码器上进行,以是更节省GPU内存,演习速率也更快。最值得关注的是,ControlNet这种有掌握的天生AI图像更能够得到我们想要的图片结果,同时操作办法大略能够在PC端运行。
从运用层面来看,我们看到这种创意形 AI 天生的二维码更能够具有品牌专属特性且方便进行品牌或者网站等任何产品的推广运用。在不久的将来,这将在广告中越来越普遍。
本文来自华尔街见闻,欢迎***APP查看更多
本文系作者个人观点,不代表本站立场,转载请注明出处!