借助机械进修技能 研究人员将单声道音频转为2.5D格式_音频_办法
人类之以是能感知到 3D 空间的立体声,得益于双耳的独特构造。基于声音传播的时差,大脑才能够确定物体的间隔和位置。这种 3D 音频体验,可以通过仿照双耳的立体声设备来录制和复现。
遗憾的是,大多数音频都是单声道格式的(录制时就只利用了单个麦克风)。虽然日常生活中已经“够用”,但它并不适宜 VR 等追求沉浸式体验的运用处景。
2.5D Visual Sound(via)
有鉴于此,将单声道音频转换成双声道,就变得很有必要。好是,研究职员 Ruohan Gao 和 Kristen Grauman,已经找到了一种相称靠近的方法。
该方法依赖于***,在深度学习技能的加持下,通过剖析画面中各个物体的空间位置,即可转换出更加立体的 2.5D 音频。
当然,这项方法也存在着一定的限定,尤其是存在一些让 AI 无法理解的工具的时候。感兴趣的朋友,可以不雅观看上面这段演示***。
[编译自:SlashGear]
本文系作者个人观点,不代表本站立场,转载请注明出处!