声智科技——交互让机械更智能_技巧_科技
由声智科技研发的“AI数字人垃圾分类管家”领悟了人脸识别、智能语音交互、行为识别等技能,使垃圾分类管理更加方便快速。(资料图片)
一台可以书写的智能交互机器臂,用羊毫写下“一起向未来”;一部多足行走机器人和一部舞蹈机器人,共同跳起了一段舞蹈,随后,舞蹈机器人还单独进行了一段武术演出,抱拳开臂,马步弓步,一招一式憨态可掬。这是在北京声智科技有限公司(以下称“声智科技”)展厅里看到的景象。
声智科技成立于2016年,专注于声学前沿技能和人工智能领域,紧张面向数智康健、数智城市等场景供应产品和解决方案。凭借持续创新研发,声智科技得到了吴文俊人工智能科学技能奖、北京市科技进步二等奖等多个奖项。
打破技能难点
“声智科技是从研发远场语音交互技能起步的,你刚才看到的那几个机器人搭载了声智科技研发的智能语音交互技能。”声智科技创始人陈孝良说,随着物联网技能的遍及,语音成为人机交互的新入口,支持远场语音交互的产品市场潜力很大。
“远场语音识别技能面临诸多研发难点,比如环境噪声、人声、房间混响的滋扰等。若采取常规语音处理方法,会导致旗子暗记失落真和资源花费大,使得语音识别技能准确率低,运用困难。”陈孝良说。
凭借深厚技能积累和持续研发,声智科技先后占领了多项远场语音交互关键技能,包括反应抵消技能、噪声肃清技能、声源定位技能、语音识别技能等。如今,这些技能已运用于一些消费级电子产品中,声智科技也成为海内不少有名企业的互助伙伴。
“我们意识到,伴随着人工智能的快速发展,人机交互、协同过程中的多数问题,都不能靠单一技能办理,须要将语音、图像识别、大数据等技能结合起来。只有推进多模态、多技能的领悟,才能实现更多场景的运用。”声智科技副总裁李良斌说。
他先容,声智科技的做法是,用“多模态”确保机器具有“声、光、电、热、力、磁”多种感知技能;用“远场”办理机器在远间隔场域中对多模态旗子暗记的剖析;用“多技能”授予智能系统多种能力,通过多技能相互协同,完成繁芜任务。
基于这种技能理念,声智科技研发推出核心技能产品——壹元人工智能开拓框架。基于这个框架,声智科技领悟了远场声光、多模态识别等多项技能,环绕聪慧社区、聪慧交通、聪慧办公、聪慧医院等运用处景,供应AI产品及办理方案。
截至目前,声智科技已经参与了50余项国家行业标准的制订,拥有海内专利2000余项。在2020年前,声智科技总融资金额超过3亿元。陈孝良说,这些融资全部投入到核心技能的持续研发上。
助力聪慧防疫
新冠肺炎疫情暴发以来,声智科技自主研发的技能产品,用于多地的防疫做事中。
刚走进中关村落前沿技能创新中央的一楼大厅,就听到清脆的声音:“您现在的体温是36.5摄氏度,没有发热症状”。声音来自一台测温机器人,在机器人显示屏上,除了实时显示被检测者的红外热成像信息和温度值,还能查看全国疫情数据,测温精度在正负0.2摄氏度。
声智科技首席知识官常乐先容,这个测温机器人可在几秒钟内完成1米至6米范围内多个目标的高精度测温,支持实时AI语音合成播报,自动上传预警信息。目前,该机器人已在北京、广州、青岛、成都等地落地利用。
“小易小易,上楼”“小易小易,去10楼”,在北京海淀医院的电梯里,只须要一句大略的指令,就能实现乘梯高下楼,全程免按键,实现零打仗。
“声智科技研发的聪慧语音电梯,领悟语音与图像等交互技能,不依赖手机、IC卡等设备,无论利用者是在电梯外,还是在电梯轿厢内,都可以通过可视化人机交互办法搭乘电梯。”常乐先容,这方便了老人、儿童等用户的日常生活,在疫情防控期间还有效降落了打仗传播传染风险。
目前,声智科技已推出第二代AI智能电梯系统,增加手势识别功能,残障人士也可以实现免打仗掌握电梯。2021年,为办理电动自行车入户充电的监管难题,减少电池充电爆炸动怒等隐患,企业又迭代推出了第三代AI智能电梯。
“未来,我们希望AI技能能知足繁芜场景的灵巧、大范围运用。”李良斌表示,声智科技将连续加强核心技能研发,让更多AI产品落地,使万物互联更智能。 (经济日报 韩秉志)
本文系作者个人观点,不代表本站立场,转载请注明出处!