更实用 谷歌人工智能可对图像插入对象_对象_图像
幸运的是,人工智能(AI)承诺供应帮助。NeurIPS 2018会议上的一篇论文中(高下文感知合成和匹配工具实例),首尔国立大学的研究职员,加州大学默塞德,和谷歌AI描述一个别系,学会把一个工具插入一个图像,在语义上,令人信服 。
在符合场景语义的图像中插入工具是一项具有寻衅性和意见意义性的任务。研究职员写道,这项任务与许多实际运用密切干系,包括图像合成、AR和VR内容编辑。这样的工具插入模型可以潜在地促进许多图像编辑和场景解析运用程序。
他们的端到端框架包括两个模块,决定了插入的工具,该当是和第二个决定它该当是什么样子,利用甘斯( GANs),或两个神经网络组成,试图区分天生的样本和实际样品。由于系统同时对插入的图像进行分布建模,因此两个模块可以相互互通并优化。
人工智能
该论文的作者写道,这项事情的紧张技能新颖之处在于,它构建了一个端到真个可培训神经网络,该网络可以重新工具的联合分布中对其可能的位置和形状进行采样。合成的工具实例既可以作为基于GAN的方法的输入,也可以从现有数据集中检索最近的所需部分,从而天生新的图像。
正如他们阐明的那样,在这种情形下,天生器可以预测合理的位置,天生语义上同等的比例、姿势和形状的工具掩码,特殊是工具如何在场景等分布,以及如何自然地插入工具,以便使其看起来是场景的一部分。随着韶光的推移,在演习过程中,AI系统会根据场景学习不同的工具种别分布,例如在城市街道的图像中,人们每每在人行道上,而汽车常日在路上。
在测试中,研究职员通过插入形状逼真的物体,使模型优于基线。当将YOLOv3图像识别器运用于人工智能天生的图像时,检测合成目标能够以0.79的召回率。更能解释问题的是,在对亚马逊的(Mechanical Turk)公司员工进行的一项调查中,43%的人认为人工智能天生的物体是真实的。
研究职员写道,这表明我们的方法能够实行工具合成和插入任务。由于我们的方法是在什么地方和什么东西上联合建模的,因此可以用于办理其它打算机视觉问题。未来有趣的事情之一将是处理工具之间的遮挡。
本文系作者个人观点,不代表本站立场,转载请注明出处!