CN108847225A - 一种机场多人语音服务的机器人及其方法 - Google Patents

一种机场多人语音服务的机器人及其方法 Download PDF

Info

Publication number
CN108847225A
CN108847225A CN201810566071.6A CN201810566071A CN108847225A CN 108847225 A CN108847225 A CN 108847225A CN 201810566071 A CN201810566071 A CN 201810566071A CN 108847225 A CN108847225 A CN 108847225A
Authority
CN
China
Prior art keywords
airport
passenger
content
target
exchange
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810566071.6A
Other languages
English (en)
Other versions
CN108847225B (zh
Inventor
蒋化冰
孙锐
苏合检
陆士达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Haihang Artificial Intelligence Robot Co ltd
Shanghai Noah Wood Robot Technology Co ltd
Original Assignee
Shanghai Hai Hang Artificial Intelligent Robot Co Ltd
Shanghai Wood Wood Robot Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Hai Hang Artificial Intelligent Robot Co Ltd, Shanghai Wood Wood Robot Technology Co Ltd filed Critical Shanghai Hai Hang Artificial Intelligent Robot Co Ltd
Priority to CN201810566071.6A priority Critical patent/CN108847225B/zh
Publication of CN108847225A publication Critical patent/CN108847225A/zh
Application granted granted Critical
Publication of CN108847225B publication Critical patent/CN108847225B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L15/222Barge in, i.e. overridable guidance for interrupting prompts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Abstract

本发明提供了一种机场多人语音服务的机器人及其方法,机场多人语音服务的机器人包括:获取模块,获取机场内各个目标机场旅客的语音信号;所述目标机场旅客为在机场多人语音服务的机器人的语音采集范围内的机场旅客;解析模块,解析所述语音信号得到对应目标机场旅客的交流内容;处理模块,根据预设的机场服务响应优先级规则,响应所述交流内容。本发明能更加友好的根据机场旅客需求进行交流响应,提升机场旅客使用体验。

Description

一种机场多人语音服务的机器人及其方法
技术领域
本发明涉及语音交互领域,尤指一种机场多人语音服务的机器人及其方法。
背景技术
近几年,“人工智能”已经成为互联网圈里面出现频次最高的一个词汇,随着技术的进步和社会的发展,物联网时代已经成为继移动互联时代之后的下一个浪潮,在即将到来的物联网时代,人工智能会是流量入口,那么语音交互就成了极具竞争力的交互方式,机场也逐渐采用人机智能交互设备替代人工客服的方式对机场内的机场旅客提供全面,高效,优质的服务。
现有机场服务的人机交互方法多是基于端点检测技术确定机场旅客有效交互语音,再对所述交互语音进行识别、语义理解,最后系统针对语义理解结果做出相应的响应。然而,现有机场服务的人机交互常存在一台人机智能交互设备面向多人参与交互的情况,在该种情况下,现有的机场服务语音人机交互,某一个机场旅客与人机智能交互设备进行语音交互的过程中,如果有人插嘴问新的问题,人机交互设备如机场语音服务机器人就不能智能的进行响应回答,可能是将当前机场旅客的问题回答结束后,才会回答下一个机场旅客的问题,导致多人向机场语音服务机器人输入语音信息进行交互时降低机场旅客的语音交互体验。
发明内容
本发明的目的是提供一种机场多人语音服务的机器人及其方法,实现提升应用于机场的多人语音交流服务使用体验。
本发明提供的技术方案如下:
一种机场多人语音服务的机器人,包括:
获取模块,获取机场内各个目标机场旅客的语音信号;所述目标机场旅客为在机场多人语音服务的机器人的语音采集范围内的机场旅客;
解析模块,解析所述语音信号得到对应目标机场旅客的交流内容;
处理模块,根据预设的机场服务响应优先级规则,响应所述交流内容。
进一步的,所述解析模块包括:
第一识别单元,对所述语音信号进行特征识别,得到特征识别结果;
储存单元,根据所述特征识别结果,分别储存所述语音信号至对应的储存区域;
第二识别单元,对各个储存区域中的语音信号进行语义识别,得到机场内每个目标机场旅客的交流内容。
进一步的,所述处理模块包括:
第一判断单元,判断第一目标机场旅客的第一语音信号对应的第一交流内容是否属于所述机场业务内容,并得到第一判断结果;
第二判断单元,当所述第一判断单元完成判断第一目标机场旅客的第一语音信号对应的第一交流内容是否属于所述机场业务内容,并得到第一判断结果后,判断第二目标机场旅客的第二语音信号对应的第二交流内容是否属于所述机场业务内容,并得到第二判断结果;
处理单元,根据所述第一判断单元和所述第二判断单元的判断结果,响应所述交流内容;
其中,所述第一目标机场旅客为机场多人语音服务的机器人当前语音交流的目标机场旅客,所述第二目标机场旅客为新加入交流的目标机场旅客;所述机场业务内容包括机场航班服务咨询内容和/或机场公共场所服务咨询内容。
进一步的,所述处理单元,当所述第一判断结果为所述第一交流内容属于所述机场业务内容,且所述第二判断结果为所述第二交流内容属于所述机场业务内容时,储存所述第一交流内容和所述第二交流内容,并根据获取语音信号的时间先后顺序或者响应优先级,依次响应对应的交流内容;
所述处理单元,当所述第一判断结果为所述第一交流内容属于所述机场业务内容,但所述第二判断结果为所述第二交流内容不属于所述机场业务内容时,优先响应所述第一目标机场旅客对应的第一交流内容;
所述处理单元,当所述第一判断结果为所述第一交流内容不属于所述机场业务内容,但所述第二判断结果为所述第二交流内容属于所述机场业务内容时,优先响应所述第二目标机场旅客对应的第二交流内容;
所述处理单元,当所述第一判断结果为所述第一交流内容不属于所述机场业务内容,且所述第二判断结果为所述第二交流内容不属于所述机场业务内容时,根据获取语音信号的时间先后顺序,依次响应对应的交流内容。
进一步的,所述获取模块包括:
获取单元,获取机场旅客的位置信息;
第三判断单元,判断所述位置信息是否在麦克阵列对应的语音采集范围内;
确定单元,当所述位置信息在所述语音采集范围内时,确定所述位置信息对应的机场旅客为所述目标机场旅客;
采集单元,获取机场内各个目标机场旅客的语音信号;
其中,所述麦克阵列为在机场多人语音服务的机器人上预先设置的包括三个以上的麦克组成的阵列。
本发明提供一种机场多人语音的服务方法,包括步骤:
获取机场内各个目标机场旅客的语音信号;所述目标机场旅客为在机场多人语音服务的机器人的语音采集范围内的机场旅客;
解析所述语音信号得到对应目标机场旅客的交流内容;
根据预设的机场服务响应优先级规则,响应所述交流内容。
进一步的,所述解析所述语音信号得到对应目标机场旅客的交流内容包括步骤:
对所述语音信号进行特征识别,得到特征识别结果;
根据所述特征识别结果,分别储存所述语音信号至对应的储存区域;
对各个储存区域中的语音信号进行语义识别,得到机场内每个目标机场旅客的交流内容。
进一步的,所述根据预设的机场服务响应优先级规则,响应所述交流内容包括步骤:
判断第一目标机场旅客的第一语音信号对应的第一交流内容是否属于所述机场业务内容,并得到第一判断结果;
判断第二目标机场旅客的第二语音信号对应的第二交流内容是否属于所述机场业务内容,并得到第二判断结果;
根据所述第一判断单元和所述第二判断单元的判断结果,响应所述交流内容;
其中,所述第一目标机场旅客为机场多人语音服务的机器人当前语音交流的目标机场旅客,所述第二目标机场旅客为新加入交流的目标机场旅客;所述机场业务内容包括机场航班服务咨询内容和/或机场公共场所服务咨询内容。
进一步的,所述根据所述第一判断结果和第二判断结果以及所述预设的机场服务响应优先级规则进行响应包括步骤:
当所述第一判断结果为所述第一交流内容属于所述机场业务内容,且所述第二判断结果为所述第二交流内容属于所述机场业务内容时,储存所述第一交流内容和所述第二交流内容,并根据获取语音信号的时间先后顺序或者响应优先级,依次响应对应的交流内容;
当所述第一判断结果为所述第一交流内容属于所述机场业务内容,但所述第二判断结果为所述第二交流内容不属于所述机场业务内容时,优先响应所述第一目标机场旅客对应的第一交流内容;
当所述第一判断结果为所述第一交流内容不属于机场业务内容,但所述第二判断结果为所述第二交流内容属于所述机场业务内容时,优先响应所述第二目标机场旅客对应的第二交流内容;
当所述第一判断结果为所述第一交流内容不属于机场业务内容,且所述第二判断结果为所述第二交流内容不属于所述机场业务内容时,根据获取语音信号的时间先后顺序,依次响应对应的交流内容。
进一步的,所述获取机场内各个目标机场旅客的语音信号包括步骤:
获取机场旅客的位置信息;
判断所述位置信息是否在麦克阵列对应的语音采集范围内;若是,确定所述位置信息对应的机场旅客为所述目标机场旅客;
获取机场内各个目标机场旅客的语音信号;
其中,所述麦克阵列为在机场多人语音服务的机器人上预先设置的包括三个以上的麦克组成的阵列。
通过本发明提供的一种机场多人语音服务的机器人及其方法,能够带来以下至少一种有益效果:
1)本发明通过语义识别后根据预设的机场服务响应优先级规则响应机场内目标机场旅客的交流内容,能更加友好的根据机场旅客需求进行交流响应,提升机场旅客使用体验。
2)本发明机场多人语音服务的机器人对获取到的语音信号进行特征识别,根据预设的机场服务响应优先级规则响应交流,避免同时获取到机场旅客的语音信号时,无法判断优先响应回答哪个交流内容而出现停顿现象,提升交流友善度。
3)本发明将获取到的目标机场旅客的语音信号进行解析得到对应的交流内容与机场业务内容进行匹配,根据匹配结果以及获取到语音信号的时间先后顺序或者响应优先级来进行响应回答,能够优先处理属于机场业务内容的目标机场旅客的语音信号中的问题,提升机场旅客的使用体验,增加机场的多人语音交流服务的友好度。
4)本发明通过麦克阵列精准获取到目标机场旅客的语音信息,从而减少获取其他繁杂的噪声信息,或者在麦克阵列对应的语音采集范围外的其他机场旅客的语音信息,减少解析响应回答的干扰,提升对机场内目标机场旅客的响应效率和机场旅客体验度。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种机场多人语音服务的机器人及其方法的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明一种机场多人语音服务的机器人的一实施例的结构示意图;
图2是本发明一种机场多人语音服务的机器人的另一实施例的结构示意图;
图3是本发明一种机场多人语音服务的机器人的另一实施例的结构示意图;
图4是本发明一种机场多人语音服务的机器人的另一实施例的结构示意图;
图5是本发明一种机场多人语音的服务方法的一实施例的流程图;
图6是本发明一种机场多人语音的服务方法的另一实施例的流程图;
图7是本发明一种机场多人语音的服务方法的另一实施例的流程图;
图8是本发明一种机场多人语音的服务方法的另一实施例的流程图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
本发明的第一实施例,如图1所示,一种机场多人语音服务的机器人,包括:
获取模块110,获取机场内各个目标机场旅客的语音信号;所述目标机场旅客为在机场多人语音服务的机器人的语音采集范围内的机场旅客;
解析模块120,解析所述语音信号得到对应目标机场旅客的交流内容;
处理模块130,根据预设的机场服务响应优先级规则,响应所述交流内容。
具体的,本实施例中,机场多人语音服务的机器人在人工智能多人使用的应用场景中是不可或缺的设备,机场多人语音服务的机器人获取每个目标机场旅客的语音信号,目标机场旅客是在机场多人语音服务的机器人的有效的语音采集范围内的机场旅客,获取到所有目标机场旅客的语音信号后,就对每个目标机场旅客的语音信号进行解析,即语义识别各个目标机场旅客的语音信号中的交流内容,解析得到每个目标机场旅客与机场多人语音服务的机器人之间的交流内容后,根据预设的机场服务响应优先级规则对目标机场旅客进行响应。假如当前与机场多人语音服务的机器人进行语音交流的目标机场旅客有A、B和C,那么机场多人语音服务的机器人就会获取机场内目标机场旅客A、B和C的语音信号,机场多人语音服务的机器人将获取到的所有语音信号进行解析识别每个目标机场旅客想要与机场多人语音服务的机器人进行沟通的交流内容,根据预设的机场服务响应优先级规则,分别依次响应目标机场旅客的交流内容。通过本发明能够在多人与机场多人语音服务的机器人同时(同一时刻或者在预设时间范围如1min内)进行语音交流时,避免机场多人语音服务的机器人在同时获取到目标机场旅客的语音信号时,无法判断优先响应回答哪个交流内容而出现停顿现象,甚至直接根据时间先后顺序进行响应目标机场旅客,但是由于目标机场旅客的需求不同,根据时间先后顺序响应回答机场旅客,交流友善度不够,通过本发明语义识别后,根据预设的机场服务响应优先级规则响应交流,能更加友好的根据机场内各个目标机场旅客的需求进行交流响应,提升机场旅客的语音服务使用体验。
本发明的第二实施例,如图2所示,是基于上述第一实施例的优化实施例,本实施例与上述实施例相比,主要改进在于,所述解析模块120包括:
第一识别单元121,对所述语音信号进行特征识别,得到特征识别结果;
储存单元122,根据所述特征识别结果,分别储存所述语音信号至对应的储存区域;
第二识别单元123,对各个储存区域中的语音信号进行语义识别,得到机场内每个目标机场旅客的交流内容。
具体的,本实施例中,由于不同的人的音色、音调等等声学特征是不同的,延述上述例子,在机场多人语音服务的机器人分别获取到各个目标机场旅客的语音信号后,就对获取到的语音信号进行特征识别,即识别每个语音信号的声学特征,从而识别出哪个是目标机场旅客A的语音信号,哪个是目标机场旅客B的语音信号,哪个是目标机场旅客C的语音信号,分辨出目标机场旅客的语音信号后,将这些语音信号分别储存在不同的储存区域内,然后分别对各个储存区域内的语音信号进行语义识别,如目标机场旅客A的语音信号是“登机楼在哪里?”,目标机场旅客B的语音信号是“卫生间在哪里?”,目标机场旅客C的语音信号是“我觉得这个机场好漂亮啊,你觉得呢?”等等,那么机场多人语音服务的机器人就分别对这些语音信号进行语义识别得到对应的交流内容,从而使得本发明能够在与多个目标机场旅客同时进行语音交流时,避免机场多人语音服务的机器人在同时获取到机场旅客的语音信号时,无法判断优先响应回答哪个交流内容而出现停顿现象,通过对各个机场旅客的语音信号进行音色识别并分别进行语义识别后,根据预设的机场服务响应优先级规则响应交流,能更加友好的根据机场旅客需求进行交流响应,提升机场旅客使用体验。
本发明的第三实施例,如图3所示,是基于上述第一实施例的优化实施例,本实施例与上述实施例相比,主要改进在于,所述处理模块130包括:
第一判断单元131,判断第一目标机场旅客的第一语音信号对应的第一交流内容是否属于所述机场业务内容,并得到第一判断结果;
第二判断单元132,当所述第一判断单元131完成判断第一目标机场旅客的第一语音信号对应的第一交流内容是否属于所述机场业务内容,并得到第一判断结果后,判断第二目标机场旅客的第二语音信号对应的第二交流内容是否属于所述机场业务内容,并得到第二判断结果;
处理单元133,根据所述第一判断单元131和所述第二判断单元132的判断结果,响应所述交流内容;
其中,所述第一目标机场旅客为机场多人语音服务的机器人当前语音交流的目标机场旅客,所述第二目标机场旅客为新加入交流的目标机场旅客;所述机场业务内容包括机场航班服务咨询内容和/或机场公共场所服务咨询内容。
具体的,机场业务内容由机场多人语音服务的机器人的使用方自行定义,机场业务内容包括但是不限于:机场航班服务咨询内容(如航班号查询、登机时间查询,登机楼查询等等),机场公共场所服务咨询内容(如机场服务台位置指引、机场卫生间位置指引,安检托运地点查询等等),对第一目标机场旅客的第一交流内容进行判断是否于机场业务内容,并还需要判断新加入进来与机场多人语音服务的机器人进行交流的第二目标机场旅客的第二语音信号对应的第二交流内容是否属于机场业务内容。不同的判断结果组合对应不同的响应方式,这样使得在多人与机场多人语音服务的机器人同时进行语音交流时,对各个目标机场旅客的语音信号对应的交流内容进行分析判断是否是机场业务内容后,根据判断结果结合预设的机场服务响应优先级规则对机场旅客的交流内容进行响应,能更加友好的根据机场旅客需求进行交流响应,提升机场旅客使用体验。
本发明的第四实施例,是基于上述第三实施例的优化实施例,本实施例与上述实施例相比,主要改进在于,包括:
所述处理单元133,当所述第一判断结果为所述第一交流内容属于所述机场业务内容,且所述第二判断结果为所述第二交流内容属于所述机场业务内容时,储存所述第一交流内容和所述第二交流内容,并根据获取语音信号的时间先后顺序或者响应优先级,依次响应对应的交流内容;
所述处理单元133,当所述第一判断结果为所述第一交流内容属于所述机场业务内容,但所述第二判断结果为所述第二交流内容不属于所述机场业务内容时,优先响应所述第一目标机场旅客对应的第一交流内容;
所述处理单元133,当所述第一判断结果为所述第一交流内容不属于所述机场业务内容,但所述第二判断结果为所述第二交流内容属于所述机场业务内容时,优先响应所述第二目标机场旅客对应的第二交流内容;
所述处理单元133,当所述第一判断结果为所述第一交流内容不属于所述机场业务内容,且所述第二判断结果为所述第二交流内容不属于所述机场业务内容时,根据获取语音信号的时间先后顺序,依次响应对应的交流内容。
具体的,如果第一目标机场旅客的第一交流内容和第二目标机场旅客的第二交流内容都属于机场业务内容时,那么就储存第一交流内容和第二交流内容,并根据获取到语音信号的时间先后或者预设的响应优先级顺序依次进行响应。假设第一目标机场旅客为目标机场旅客A,第二目标机场旅客为目标机场旅客B,假设使用机场多人语音服务的机器人的使用方是XX机场,由于机场多人语音服务的机器人此时正在与目标机场旅客A进行沟通交流机场业务内容如“登机楼在哪里?”,新加入进来的目标机场旅客B也与机场多人语音服务的机器人沟通交流机场业务内容如“卫生间在哪里?”,因此即使目标机场旅客A和目标机场旅客B的交流内容都属于机场业务内容,这时,由于目标机场旅客A的语音信号的获取时间要早于目标机场旅客B的语音信号的获取时间,因此机场多人语音服务的机器人根据获取到目标机场旅客A的第一交流内容进行响应回答,响应回答完第一交流内容“登机楼在哪里?”之后,再响应回答目标机场旅客B的第二交流内容“卫生间在哪里?”。此外,可能目标机场旅客A和目标机场旅客B两者会一直不间断的与机场多人语音服务的机器人进行交流,并且沟通的交流内容都是属于机场业务内容时,这时就根据获取到语音信号的时间先后顺序依次进行响应回答。当然,也可以进行限定机场业务内容中各个业务内容的响应优先等级,例如当目标机场旅客乘坐的飞机的起飞时间即将达到时,询问登机路线指引的优先级要大于卫生间、服务站等路线指引的优先级,即既使目标机场旅客B的语音信号获取时间要晚于目标机场旅客A的语音信号获取时间,但是只要目标机场旅客A和目标机场旅客B两者的语音获取时间在预设时间间隔内,都会优先响应回答目标机场旅客B的第二交流内容。此处只是示例性进行说明,其他响应优先级均在本发明的保护范围内。
如果第一目标机场旅客的第一交流内容属于机场业务内容,但是第二目标机场旅客的第二交流内容不属于机场业务内容时,可以先忽略第二目标机场旅客的第二交流内容,响应回答第一目标机场旅客对应的第一交流内容后,如果在预设时长内无其他机场旅客新插入进行交流沟通,或者无新的属于业务内容的交流内容时,机场多人语音服务的机器人就响应回答第二目标机场旅客的第二交流内容。
如果第一目标机场旅客的第一交流内容不属于机场业务内容,但是第二目标机场旅客的第二交流内容属于机场业务内容时,既使第一目标机场旅客的第一语音信号的获取时间要先于第二目标机场旅客的第二语音新的获取时间,但是可以先忽略第一目标机场旅客的第一交流内容,响应回答第二目标机场旅客对应的第二交流内容后,如果在预设时长内无其他机场旅客新插入进行交流沟通,或者无新的属于业务内容的交流内容时,机场多人语音服务的机器人就响应回答第一目标机场旅客的第一交流内容。
而如果第一目标机场旅客的第一交流内容和第二目标机场旅客的第二交流内容均不属于机场业务内容时,可以直接根据获取语音信号的先后顺序依次进行响应回答,但是如果在此期间有任何解析后的交流内容属于机场业务内容时,打断响应回答非业务内容的交流内容,并即时响应回答属于响应回答机场业务内容的交流内容。
本发明将获取到的目标机场旅客的语音信号进行解析得到对应的交流内容与机场业务内容进行匹配,根据匹配结果以及获取到语音信号的时间先后顺序或者响应优先级来进行响应回答,能够优先处理属于机场业务内容的目标机场旅客的语音信号中的问题,提升机场旅客的使用体验,增加应用于机场的多人语音交流服务的友好度。
本发明的第五实施例,如图4所示,是基于上述第一至第四实施例的优化实施例,本实施例与上述实施例相比,主要改进在于,所述获取模块110包括:
获取单元111,获取机场旅客的位置信息;
第三判断单元112,判断所述位置信息是否在麦克阵列对应的语音采集范围内;
确定单元113,当所述位置信息在所述语音采集范围内时,确定所述位置信息对应的机场旅客为所述目标机场旅客;
采集单元114,获取机场内各个目标机场旅客的语音信号;
其中,所述麦克阵列为在机场多人语音服务的机器人上预先设置的包括三个以上的麦克组成的阵列。
具体的,本实施例中,麦克阵列(Microphone Array)是多个声学传感器(一般是麦克风)排列成的,用来对声场的空间特性进行采样并处理的系统,这样即使在复杂的声学环境下,融合了语音信号的空时信息,麦克阵列采集到的语音信号可以在语音采集范围内提取声源并抑制噪声,从而提升获取目标机场旅客的语音信号的可靠性,因此,通过声音传播原理或者定位等方式获取各个机场旅客的位置信息,然后判断每个机场旅客的位置信息是否在麦克阵列对应的语音采集范围内,如果当前机场旅客的位置信息在麦克阵列对应的语音采集范围内,那么位置信息对应的当前机场旅客就是目标机场旅客之一,这样就能够通过麦克阵列精准获取到目标机场旅客的语音信息,从而减少获取其他繁杂的噪声信息,或者在麦克阵列对应的语音采集范围外的其他机场旅客的语音信息,减少解析响应回答的干扰,提升向目标机场旅客响应回答的响应效率和机场旅客体验度。
本发明的第六实施例,如图5所示,一种机场多人语音服务的方法,包括:
S100获取机场内各个目标机场旅客的语音信号;所述目标机场旅客为在机场多人语音服务的方法的语音采集范围内的机场旅客;
S200解析所述语音信号得到对应目标机场旅客的交流内容;
S300根据预设的机场服务响应优先级规则,响应所述交流内容。
具体的,本实施例是上述系统实施例对应的方法实施例,具体效果参见上述第一实施例,在此不再一一赘述。
本发明第七实施例,是基于上述第六实施例的优化实施例,如图6所示,本实施例与上述实施例相比,主要改进在于,所述S200解析所述语音信号得到对应目标机场旅客的交流内容包括:
S210对所述语音信号进行特征识别,得到特征识别结果;
S220根据所述特征识别结果,分别储存所述语音信号至对应的储存区域;
S230对各个储存区域中的语音信号进行语义识别,得到机场内每个目标机场旅客的交流内容。
具体的,本实施例是上述系统实施例对应的方法实施例,具体效果参见上述第二实施例,在此不再一一赘述。
本发明第八实施例,是基于上述第六实施例的优化实施例,如图7所示,本实施例与上述实施例相比,主要改进在于,所述S300根据预设的机场服务响应优先级规则,响应所述交流内容包括步骤:
S310判断第一目标机场旅客的第一语音信号对应的第一交流内容是否属于所述机场业务内容,并得到第一判断结果;
S320判断第二目标机场旅客的第二语音信号对应的第二交流内容是否属于所述机场业务内容,并得到第二判断结果;
S330根据所述第一判断单元和所述第二判断单元的判断结果,响应所述交流内容;
其中,所述第一目标机场旅客为机场多人语音服务的机器人当前语音交流的目标机场旅客,所述第二目标机场旅客为新加入交流的目标机场旅客;所述机场业务内容包括机场航班服务咨询内容和/或机场公共场所服务咨询内容。
具体的,本实施例是上述系统实施例对应的方法实施例,具体效果参见上述第三实施例,在此不再一一赘述。
本发明第九实施例,是基于上述第八实施例的优化实施例,相同部分的效果在此不再一一赘述,如图8所示,包括,
S310判断第一目标机场旅客的第一语音信号对应的第一交流内容是否属于所述机场业务内容,并得到第一判断结果;
S320判断第二目标机场旅客的第二语音信号对应的第二交流内容是否属于所述机场业务内容,并得到第二判断结果;
S330根据所述第一判断单元和所述第二判断单元的判断结果,响应所述交流内容具体包括步骤:
S331当所述第一判断结果为所述第一交流内容属于所述机场业务内容,且所述第二判断结果为所述第二交流内容属于所述机场业务内容时,储存所述第一交流内容和所述第二交流内容,并根据获取语音信号的时间先后顺序或者响应优先级,依次响应对应的交流内容;
S332当所述第一判断结果为所述第一交流内容属于所述机场业务内容,但所述第二判断结果为所述第二交流内容不属于所述机场业务内容时,优先响应所述第一目标机场旅客对应的第一交流内容;
S333当所述第一判断结果为所述第一交流内容不属于机场业务内容,但所述第二判断结果为所述第二交流内容属于所述机场业务内容时,优先响应所述第二目标机场旅客对应的第二交流内容;
S334当所述第一判断结果为所述第一交流内容不属于机场业务内容,且所述第二判断结果为所述第二交流内容不属于所述机场业务内容时,根据获取语音信号的时间先后顺序,依次响应对应的交流内容。
具体的,S331-S334为并列关系,无先后顺序,本实施例是上述系统实施例对应的方法实施例,具体效果参见上述第四实施例,在此不再一一赘述。
本发明第十实施例,是基于上述第六至第九实施例的优化实施例,本实施例与上述实施例相比,主要改进在于,所述S100获取机场内各个目标机场旅客的语音信号包括步骤:
S110获取机场旅客的位置信息;
S120判断所述位置信息是否在麦克阵列对应的语音采集范围内;若是,确定所述位置信息对应的机场旅客为所述目标机场旅客;
S130获取机场内各个目标机场旅客的语音信号;
其中,所述麦克阵列为在机场多人语音服务的机器人上预先设置的包括三个以上的麦克组成的阵列。
具体的,本实施例是上述系统实施例对应的方法实施例,具体效果参见上述第五实施例,在此不再一一赘述。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种机场多人语音服务的机器人,其特征在于,包括:
获取模块,获取机场内各个目标机场旅客的语音信号;所述目标机场旅客为在机场多人语音服务的机器人的语音采集范围内的机场旅客;
解析模块,解析所述语音信号得到对应目标机场旅客的交流内容;
处理模块,根据预设的机场服务响应优先级规则,响应所述交流内容。
2.根据权利要求1所述的机场多人语音服务的机器人,其特征在于,所述解析模块包括:
第一识别单元,对所述语音信号进行特征识别,得到特征识别结果;
储存单元,根据所述特征识别结果,分别储存所述语音信号至对应的储存区域;
第二识别单元,对各个储存区域中的语音信号进行语义识别,得到机场内每个目标机场旅客的交流内容。
3.根据权利要求1所述的机场多人语音服务的机器人,其特征在于,所述处理模块包括:
第一判断单元,判断第一目标机场旅客的第一语音信号对应的第一交流内容是否属于所述机场业务内容,并得到第一判断结果;
第二判断单元,当所述第一判断单元完成判断第一目标机场旅客的第一语音信号对应的第一交流内容是否属于所述机场业务内容,并得到第一判断结果后,判断第二目标机场旅客的第二语音信号对应的第二交流内容是否属于所述机场业务内容,并得到第二判断结果;
处理单元,根据所述第一判断单元和所述第二判断单元的判断结果,响应所述交流内容;
其中,所述第一目标机场旅客为机场多人语音服务的机器人当前语音交流的目标机场旅客,所述第二目标机场旅客为新加入交流的目标机场旅客;所述机场业务内容包括机场航班服务咨询内容和/或机场公共场所服务咨询内容。
4.根据权利要求3所述的机场多人语音服务的机器人,其特征在于:
所述处理单元,当所述第一判断结果为所述第一交流内容属于所述机场业务内容,且所述第二判断结果为所述第二交流内容属于所述机场业务内容时,储存所述第一交流内容和所述第二交流内容,并根据获取语音信号的时间先后顺序或者响应优先级,依次响应对应的交流内容;
所述处理单元,当所述第一判断结果为所述第一交流内容属于所述机场业务内容,但所述第二判断结果为所述第二交流内容不属于所述机场业务内容时,优先响应所述第一目标机场旅客对应的第一交流内容;
所述处理单元,当所述第一判断结果为所述第一交流内容不属于所述机场业务内容,但所述第二判断结果为所述第二交流内容属于所述机场业务内容时,优先响应所述第二目标机场旅客对应的第二交流内容;
所述处理单元,当所述第一判断结果为所述第一交流内容不属于所述机场业务内容,且所述第二判断结果为所述第二交流内容不属于所述机场业务内容时,根据获取语音信号的时间先后顺序,依次响应对应的交流内容。
5.根据权利要求1-4任一项所述的机场多人语音服务的机器人,其特征在于,所述获取模块包括:
获取单元,获取机场旅客的位置信息;
第三判断单元,判断所述位置信息是否在麦克阵列对应的语音采集范围内;
确定单元,当所述位置信息在所述语音采集范围内时,确定所述位置信息对应的机场旅客为所述目标机场旅客;
采集单元,获取机场内各个目标机场旅客的语音信号;
其中,所述麦克阵列为在机场多人语音服务的机器人上预先设置的包括三个以上的麦克组成的阵列。
6.一种机场多人语音的服务方法,其特征在于,包括步骤:
获取机场内各个目标机场旅客的语音信号;所述目标机场旅客为在机场多人语音服务的机器人的语音采集范围内的机场旅客;
解析所述语音信号得到对应目标机场旅客的交流内容;
根据预设的机场服务响应优先级规则,响应所述交流内容。
7.根据权利要求6所述的机场多人语音的服务方法,其特征在于,所述解析所述语音信号得到对应目标机场旅客的交流内容包括步骤:
对所述语音信号进行特征识别,得到特征识别结果;
根据所述特征识别结果,分别储存所述语音信号至对应的储存区域;
对各个储存区域中的语音信号进行语义识别,得到机场内每个目标机场旅客的交流内容。
8.根据权利要求6所述的机场多人语音的服务方法,其特征在于,所述根据预设的机场服务响应优先级规则,响应所述交流内容包括步骤:
判断第一目标机场旅客的第一语音信号对应的第一交流内容是否属于所述机场业务内容,并得到第一判断结果;
判断第二目标机场旅客的第二语音信号对应的第二交流内容是否属于所述机场业务内容,并得到第二判断结果;
根据所述第一判断单元和所述第二判断单元的判断结果,响应所述交流内容;
其中,所述第一目标机场旅客为机场多人语音服务的机器人当前语音交流的目标机场旅客,所述第二目标机场旅客为新加入交流的目标机场旅客;所述机场业务内容包括机场航班服务咨询内容和/或机场公共场所服务咨询内容。
9.根据权利要求8所述的机场多人语音的服务方法,其特征在于,所述根据所述第一判断结果和第二判断结果以及所述预设的机场服务响应优先级规则进行响应包括步骤:
当所述第一判断结果为所述第一交流内容属于所述机场业务内容,且所述第二判断结果为所述第二交流内容属于所述机场业务内容时,储存所述第一交流内容和所述第二交流内容,并根据获取语音信号的时间先后顺序或者响应优先级,依次响应对应的交流内容;
当所述第一判断结果为所述第一交流内容属于所述机场业务内容,但所述第二判断结果为所述第二交流内容不属于所述机场业务内容时,优先响应所述第一目标机场旅客对应的第一交流内容;
当所述第一判断结果为所述第一交流内容不属于机场业务内容,但所述第二判断结果为所述第二交流内容属于所述机场业务内容时,优先响应所述第二目标机场旅客对应的第二交流内容;
当所述第一判断结果为所述第一交流内容不属于机场业务内容,且所述第二判断结果为所述第二交流内容不属于所述机场业务内容时,根据获取语音信号的时间先后顺序,依次响应对应的交流内容。
10.根据权利要求6-9任一项所述的机场多人语音的服务方法,其特征在于,所述获取机场内各个目标机场旅客的语音信号包括步骤:
获取机场旅客的位置信息;
判断所述位置信息是否在麦克阵列对应的语音采集范围内;若是,确定所述位置信息对应的机场旅客为所述目标机场旅客;
获取机场内各个目标机场旅客的语音信号;
其中,所述麦克阵列为在机场多人语音服务的机器人上预先设置的包括三个以上的麦克组成的阵列。
CN201810566071.6A 2018-06-04 2018-06-04 一种机场多人语音服务的机器人及其方法 Active CN108847225B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810566071.6A CN108847225B (zh) 2018-06-04 2018-06-04 一种机场多人语音服务的机器人及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810566071.6A CN108847225B (zh) 2018-06-04 2018-06-04 一种机场多人语音服务的机器人及其方法

Publications (2)

Publication Number Publication Date
CN108847225A true CN108847225A (zh) 2018-11-20
CN108847225B CN108847225B (zh) 2021-01-12

Family

ID=64210181

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810566071.6A Active CN108847225B (zh) 2018-06-04 2018-06-04 一种机场多人语音服务的机器人及其方法

Country Status (1)

Country Link
CN (1) CN108847225B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109841216A (zh) * 2018-12-26 2019-06-04 珠海格力电器股份有限公司 语音数据的处理方法、装置和智能终端
CN109841207A (zh) * 2019-03-01 2019-06-04 深圳前海达闼云端智能科技有限公司 一种交互方法及机器人、服务器和存储介质
CN110111782A (zh) * 2019-02-26 2019-08-09 百度国际科技(深圳)有限公司 语音交互方法及设备
CN110232924A (zh) * 2019-06-03 2019-09-13 中国第一汽车股份有限公司 车载语音管理方法、装置、车辆及存储介质
CN110299152A (zh) * 2019-06-28 2019-10-01 北京猎户星空科技有限公司 人机对话的输出控制方法、装置、电子设备及存储介质
CN113516998A (zh) * 2021-06-25 2021-10-19 和美(深圳)信息技术股份有限公司 机器人音色自动切换方法、装置、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030101054A1 (en) * 2001-11-27 2003-05-29 Ncc, Llc Integrated system and method for electronic speech recognition and transcription
US20140039893A1 (en) * 2012-07-31 2014-02-06 Sri International Personalized Voice-Driven User Interfaces for Remote Multi-User Services
CN105280183A (zh) * 2015-09-10 2016-01-27 百度在线网络技术(北京)有限公司 语音交互方法和系统
CN106297794A (zh) * 2015-05-22 2017-01-04 西安中兴新软件有限责任公司 一种语音文字的转换方法及设备
CN106445654A (zh) * 2016-08-31 2017-02-22 北京康力优蓝机器人科技有限公司 确定响应控制命令优先顺序的方法及装置
CN107437415A (zh) * 2017-08-09 2017-12-05 科大讯飞股份有限公司 一种智能语音交互方法及系统
CN107831903A (zh) * 2017-11-24 2018-03-23 科大讯飞股份有限公司 多人参与的人机交互方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030101054A1 (en) * 2001-11-27 2003-05-29 Ncc, Llc Integrated system and method for electronic speech recognition and transcription
US20140039893A1 (en) * 2012-07-31 2014-02-06 Sri International Personalized Voice-Driven User Interfaces for Remote Multi-User Services
CN106297794A (zh) * 2015-05-22 2017-01-04 西安中兴新软件有限责任公司 一种语音文字的转换方法及设备
CN105280183A (zh) * 2015-09-10 2016-01-27 百度在线网络技术(北京)有限公司 语音交互方法和系统
CN106445654A (zh) * 2016-08-31 2017-02-22 北京康力优蓝机器人科技有限公司 确定响应控制命令优先顺序的方法及装置
CN107437415A (zh) * 2017-08-09 2017-12-05 科大讯飞股份有限公司 一种智能语音交互方法及系统
CN107831903A (zh) * 2017-11-24 2018-03-23 科大讯飞股份有限公司 多人参与的人机交互方法及装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109841216A (zh) * 2018-12-26 2019-06-04 珠海格力电器股份有限公司 语音数据的处理方法、装置和智能终端
CN109841216B (zh) * 2018-12-26 2020-12-15 珠海格力电器股份有限公司 语音数据的处理方法、装置和智能终端
CN110111782A (zh) * 2019-02-26 2019-08-09 百度国际科技(深圳)有限公司 语音交互方法及设备
CN110111782B (zh) * 2019-02-26 2022-04-12 阿波罗智联(北京)科技有限公司 语音交互方法及设备
CN109841207A (zh) * 2019-03-01 2019-06-04 深圳前海达闼云端智能科技有限公司 一种交互方法及机器人、服务器和存储介质
CN110232924A (zh) * 2019-06-03 2019-09-13 中国第一汽车股份有限公司 车载语音管理方法、装置、车辆及存储介质
CN110299152A (zh) * 2019-06-28 2019-10-01 北京猎户星空科技有限公司 人机对话的输出控制方法、装置、电子设备及存储介质
CN113516998A (zh) * 2021-06-25 2021-10-19 和美(深圳)信息技术股份有限公司 机器人音色自动切换方法、装置、电子设备及存储介质
CN113516998B (zh) * 2021-06-25 2024-03-12 和美(深圳)信息技术股份有限公司 机器人音色自动切换方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN108847225B (zh) 2021-01-12

Similar Documents

Publication Publication Date Title
CN108847225A (zh) 一种机场多人语音服务的机器人及其方法
CN108000526B (zh) 用于智能机器人的对话交互方法及系统
KR101659649B1 (ko) 구조화된 통신을 이용하기 위한 관측 플랫폼
WO2016175354A1 (ko) 인공지능 대화 장치 및 방법
CN106406806A (zh) 一种用于智能设备的控制方法及装置
CN108777751A (zh) 一种呼叫中心系统及其语音交互方法、装置和设备
CN103116576A (zh) 一种语音手势交互翻译装置及其控制方法
CN110299152A (zh) 人机对话的输出控制方法、装置、电子设备及存储介质
CN109902957A (zh) 一种数据处理方法和装置
CN102640084A (zh) 用于多用户和系统的通信接口设备和方法
CN109271503A (zh) 智能问答方法、装置、设备及存储介质
KR20200092166A (ko) 감정을 인식하는 서버, 방법 및 컴퓨터 프로그램
CN110490428A (zh) 空中交通管制工作质量评估方法及相关装置
CN111028834B (zh) 语音信息提醒方法、装置、服务器和语音信息提醒设备
CN111384778B (zh) 一种配电网设备智能运维系统
JP2015152948A (ja) ライフログ記録システム及びそのプログラム
CN108182939A (zh) 用于自助服务的语音处理方法及装置
CN102056093A (zh) 将文字短信转换成语音短信的方法
CN107766336A (zh) 远程实时翻译运营系统及其运营方法
CN112242135A (zh) 一种语音数据的处理方法及智能客服装置
CN105869631B (zh) 语音预测的方法和装置
CN206938783U (zh) 智能占线板
CN109427327B (zh) 音频通话评估方法、评估设备及计算机存储介质
JP2013115622A (ja) 音声情報解析装置および音声情報解析プログラム
CN114201596A (zh) 虚拟数字人使用方法、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 200335 402 rooms, No. 33, No. 33, Guang Shun Road, Shanghai

Applicant after: Shanghai zhihuilin Medical Technology Co.,Ltd.

Applicant after: SHANGHAI HAIHANG ARTIFICIAL INTELLIGENCE ROBOT Co.,Ltd.

Address before: 200335 402 rooms, No. 33, No. 33, Guang Shun Road, Shanghai

Applicant before: Shanghai Zhihui Medical Technology Co.,Ltd.

Applicant before: SHANGHAI HAIHANG ARTIFICIAL INTELLIGENCE ROBOT Co.,Ltd.

Address after: 200335 402 rooms, No. 33, No. 33, Guang Shun Road, Shanghai

Applicant after: Shanghai Zhihui Medical Technology Co.,Ltd.

Applicant after: SHANGHAI HAIHANG ARTIFICIAL INTELLIGENCE ROBOT Co.,Ltd.

Address before: 200335 402 rooms, No. 33, No. 33, Guang Shun Road, Shanghai

Applicant before: SHANGHAI MROBOT TECHNOLOGY Co.,Ltd.

Applicant before: SHANGHAI HAIHANG ARTIFICIAL INTELLIGENCE ROBOT Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 202150 room 205, zone W, second floor, building 3, No. 8, Xiushan Road, Chengqiao Town, Chongming District, Shanghai (Shanghai Chongming Industrial Park)

Patentee after: Shanghai Noah Wood Robot Technology Co.,Ltd.

Patentee after: SHANGHAI HAIHANG ARTIFICIAL INTELLIGENCE ROBOT Co.,Ltd.

Address before: 200335 402 rooms, No. 33, No. 33, Guang Shun Road, Shanghai

Patentee before: Shanghai zhihuilin Medical Technology Co.,Ltd.

Patentee before: SHANGHAI HAIHANG ARTIFICIAL INTELLIGENCE ROBOT Co.,Ltd.

CP03 Change of name, title or address