深度:警务措辞智能检索系统分析(“人工智能”+“智能语音”)_措辞_语音
整体系统基于大数据全文检索干系功能上,增加了语音和自然措辞形式的交互,同时在数据层面搭载了知识图谱引擎,除了纯挚以字符串匹配办法返回原始结果,还能自动识别出信息中包含的实体和关系,将信息提取精髓精辟展示。
二、系统功能剖析
1、语音检索功能。
措辞检索功能紧张实现:对用户口述语音的实时笔墨转录;识别专用术语等干系语音输入;识别包含数字字串的各种表示符号,如***号,车牌号,电话号码等关键信息;识别地名,公司、单位、组织构造名称;准识别特定语音查询命令。
2、语料库预处理功能。
基于行业语料库的关键词识别预处理和检索技能,基于大词汇量连续语音转写技能,快速检测出海量连续语音流中的行业特有的敏感内容以及涌现位置,进而更准确的理解语音的含义。
行业语料库的关键词识别,首先将海量语音进行预处理、关键内容识别,建立行业语料库关键词和语音的对应关系的索引,后续可输入文本汉字,快速检索出包含特定关键词的语音。
3、自然措辞检索功能。
用户通过输入自然措辞办法查询出须要的结果。紧张包括,
1)识别出自然措辞中的人名、地名、组织机构名、韶光、***号、车牌号、案件号、地址编码、电话号码、邮箱、***和微旗子暗记码等,以及属性描述信息。
2)识别出自然措辞中的关系查询需求。包括,人物关系,如父亲、母亲、子女、家庭成员、支属、朋友等关系;人车关系,如车主;人案关系,如报案人,嫌疑人;人地关系,如产权人、任务人、户籍关系、入住关系等。返回相应关系查询结果。
3)对抽象的自然措辞查询需求做出详细相应。包括,查询目标人物活动信息,实行出行、住宿信息查询;查询目标人物亲密关系,实行同户籍关系、支属关系、同住宿关系查询;查询目标人物位置,实行地址干系信息的查询;查询目标人物联系办法,实行电话、***、微信、邮箱等信息查询。
4、智能实体识别和关系推举功能。
对检索结果进行精髓精辟并优先显示。紧张包括,
1)针对人、车、案、地、物等五大类信息,将搜索结果中属于同一实体的信息聚合精简优先于原始数据展示;例如,将人分散在各条表记录中的信息聚合展示,并对属性排序,将主要属性优先展示;
2)对查询的结果做智能干系关系推举,包括一层关系推举和二层紧密关系推举。例如,查询人,自动推举其所属户籍、配偶、子女、父母、入住记录等信息;并推举同户籍、同住宿下其它人的信息。
三、技能细节剖析
在语音系统根本物理举动步伐之上,支配各语音剖析根本能力引擎,包括语音识别、语义理解、语音合成、声纹识别、大数据剖析和模型自适应等能力。
各能力引擎通过负载均衡系统进行语音/语义识别能力的运行调度和分布式扩展。语音云平台通过HTTP接口同其他业务系统平台、终端进行互联网协议数据交互,通过MRCP接口同级业务系统平台对接交互。
1、演习。基于语音、措辞学、旗子暗记处理技能、数据挖掘技能、统计学等领域知识,利用业界领先的RNN技能进行声学建模,并基于海量且话题广泛的文本数据进行超大规模措辞模型演习,天生声学模型和措辞模型。
2、解码。针对输入的语音数据,在进行端点检测、降噪后,提取声学,在演习好的声学模型和措辞模型资源根本上,利用解码器进行解码,得到最适宜的结果。
3、语音识别接口哀求。语音识别接口是运用开拓者利用识别引擎和语音听写引擎进行语音运用开拓所必需利用的接口,该接口接管用户输入的语音,把语音识别结果返回给运用程序。
4、输入数据规格哀求。在进行语音识别时,音频数据格式由独立的参数写入语音识别引擎,引擎以此参数来获知将要进行识别的音频数据格式。输出数据规格哀求。语音识别结果格式应包括纯文本、json格式文本和xml格式文本三种。
总之,基于人工智能和智能措辞的警务措辞智能检索系统以警务大数据为支撑,实现对措辞自动转换笔墨、笔墨语义理解和信息的实体关系抽象等功能,为警务聪慧大脑的实现奠定坚实根本。
本文系作者个人观点,不代表本站立场,转载请注明出处!