CN107742516B - 智能识别方法、机器人及计算机可读存储介质 - Google Patents

智能识别方法、机器人及计算机可读存储介质 Download PDF

Info

Publication number
CN107742516B
CN107742516B CN201710909101.4A CN201710909101A CN107742516B CN 107742516 B CN107742516 B CN 107742516B CN 201710909101 A CN201710909101 A CN 201710909101A CN 107742516 B CN107742516 B CN 107742516B
Authority
CN
China
Prior art keywords
voice
speaker
robot
voice information
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710909101.4A
Other languages
English (en)
Other versions
CN107742516A (zh
Inventor
李承敏
王文斌
包振毅
周金虎
禹杰
李亚军
林虎
安丽朋
黄俊岚
叶巧莉
余登武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Wangchao Data Technology Co ltd
Original Assignee
Shanghai Wangchao Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Wangchao Data Technology Co Ltd filed Critical Shanghai Wangchao Data Technology Co Ltd
Priority to CN202010878823.XA priority Critical patent/CN111968643A/zh
Priority to CN201710909101.4A priority patent/CN107742516B/zh
Publication of CN107742516A publication Critical patent/CN107742516A/zh
Application granted granted Critical
Publication of CN107742516B publication Critical patent/CN107742516B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Manipulator (AREA)

Abstract

本发明实施例涉及智能机器人领域,公开了一种智能识别方法、机器人及计算机可读存储介质。本发明中,获取发声者在第一次回答预设问题时的第一语音信息;获取发声者在第二次回答预设问题时的第二语音信息;检测第一语音信息与第二语音信息的相似度;如果第一语音信息与第二语音信息的相似度大于预设阈值,则将发声者识别为机器人,使得机器人在接收到指令时,能判断发出指令的是自然人还是机器人,从而准确地执行自然人发出的指令。

Description

智能识别方法、机器人及计算机可读存储介质
技术领域
本发明实施例涉及智能机器人领域,特别涉及一种智能识别方法、机器人及计算机可读存储介质。
背景技术
人工智能(Artificial Intelligence,简称“AI”),它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。随着人工智能时代的到来,机器人的数量日益增多,在生活中、工作中都能看到机器人的存在,它给人类的生活带来了很多便利。
然而,发明人发现现有技术中至少存在如下问题:随着机器人数量的增多以及机器人在生活中扮演的角色越来越多,在很多时候,当其他机器人向某个机器人发出语音指令时,该机器人无法区分语音指令是其他机器人还是自然人发出的,容易造成机器人错误执行某项指令。
发明内容
本发明实施方式的目的在于提供一种智能识别方法和机器人,使得机器人在接收到语音指令时能区分语音指令是机器人发出的还是自然人发出的,从而准确地执行自然人发出的指令。
为解决上述技术问题,本发明的实施方式提供了一种智能识别方法,包括:
获取发声者在第一次回答预设问题时的第一语音信息;
获取发声者在第二次回答预设问题时的第二语音信息;
检测第一语音信息与第二语音信息的相似度;
如果第一语音信息与第二语音信息的相似度大于预设阈值,则将发声者识别为机器人。
本发明的实施方式还提供了一种机器人,包括:
至少一个处理器;以及,
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述的智能识别方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述的智能识别方法。
本发明实施方式相对于现有技术而言,通过获取发声者在第一次回答预设问题时的第一语音信息;获取发声者在第二次回答预设问题时的第二语音信息;得到发声者在两次回答同一个预设问题的语音信息,有利于对第一语音信息和第二语音信息进行有效的对比。通过检测第一语音信息与第二语音信息的相似度;如果第一语音信息与第二语音信息的相似度大于预设阈值,则将发声者识别为机器人。由于机器人在重复同一句话时,语音的相似度极高,而自然人在重复同一句话时,语音的相似度较低。因此通过判断第一语音信息与第二语音信息的相似度可以准确的识别发声者是否为机器人。
另外,在获取发声者在第一次回答预设问题时的第一语音信息之前,还包括:接收语音指令。通过在接收到语音指令后,再识别发声者是自然人还是机器人,有利于在确定接收到语音指令后,才触发对发声者进行识别的操作,从而避免在接收到非语音指令的语音信息时,对发声者做出不必要的识别操作。
另外,检测第一语音信息与第二语音信息的相似度,具体包括:将第一语音信息的频率和第二语音信息的频率进行比较;如果第一语音信息与第二语音信息的相似度大于预设阈值,则将发声者识别为机器人,具体包括:如果第一语音信息的频率和第二语音信息的频率的相似度大于预设阈值,则将发声者识别为机器人。因为每一段语音都会对应一个频率值,而机器人在两次回答同一个问题时,相似度很高,因此,将第一语音信息的频率和第二语音信息的频率进行比较,如果第一语音信息的频率和第二语音信息的频率的相似度大于预设阈值,则将发声者识别为机器人。通过两段语音信息频率的比较,可以更准确的识别发声者是自然人还是机器人。
另外,在检测第一语音信息与第二语音信息的相似度之后,还包括:如果第一语音信息与第二语音信息的相似度小于预设阈值,则将发声者识别为自然人;在将发声者识别为自然人后,执行语音指令。通过将发声者识别为自然人之后,再执行语音指令,有利于提高执行语音指令的有效性,避免了因执行机器人的指令而造成不必要的麻烦。
另外,在检测第一语音信息与第二语音信息的相似度之后,还包括:如果第一语音信息与第二语音信息的相似度小于预设阈值,则将发声者识别为自然人;在将发声者识别为自然人后,判断语音指令在当前环境下是否具备可行性;在语音指令在当前环境下具备可行性时,执行语音指令。通过在执行语音指令之前,判断语音指令在当前环境下是否具备可行性,在具备可行性时再执行语音指令,有利于保证执行指令的机器人的安全。
另外,在获取发声者在第一次回答预设问题时的第一语音信息之前,还包括:检测语音指令中是否携带底噪;如果语音指令中未携带底噪,则再执行获取发声者在第一次回答预设问题时的第一语音信息;如果检测到语音中携带底噪,则将发声者识别为机器人。由于机器人发出的语音中可以加入底噪,但自然人的语音中不存在该标志,因此,通过检测语音指令中是否携带底噪,可以准确的判断出发出指令的是自然人还是机器人,使识别过程更加简单、便捷。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是根据本发明第一实施方式中的智能识别方法的流程图;
图2是根据本发明第二实施方式中的智能识别方法的流程图;
图3是根据本发明第三实施方式中的智能识别方法的流程图;
图4是根据本发明第四实施方式中的智能识别方法的流程图;
图5是根据本发明第五实施方式中机器人的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
本发明的第一实施方式涉及一种智能识别方法,应用于机器人。本实施方式的核心在于,获取发声者在第一次回答预设问题时的第一语音信息;获取发声者在第二次回答预设问题时的第二语音信息;检测第一语音信息与第二语音信息的相似度;如果第一语音信息与第二语音信息的相似度大于预设阈值,则将发声者识别为机器人。由于机器人在重复一句话时,语音的相似度极高,而自然人在重复同一句话时,语音的相似度较低。因此通过判断第一语音信息与第二语音信息的相似度可以准确的识别发声者是否为机器人,有利于提高机器人的智能性。下面对本实施方式的智能识别方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
本实施方式中的智能识别方法如图1所示,具体包括:
步骤101:获取发声者在第一次回答预设问题时的第一语音信息。
具体地说,机器人可以对发声者提出一个预设问题,预设问题可以是根据用户的要求提前设置的。比如说用户设置的预设问题可以是“你是谁”,那么发声者需要对这一问题进行回答,机器人在发声者第一次回答这个问题时,获取发声者在第一次回答预设问题时的第一语音信息。
步骤102:获取所述发声者在第二次回答所述预设问题时的第二语音信息。
具体地说,机器人在获取发声者在第一次回答预设问题时的第一语音信息后,会再次提出和第一次相同的问题。比如说,步骤101中机器人第一次提出了“你是谁”的问题,那么在发声者回答问题后,机器人会第二次提出“你是谁”的问题,发声者需要对这一问题进行第二次回答,机器人在发声者第二次回答这个问题时,获取发声者在第二次回答预设问题时的第二语音信息。
步骤103:检测第一语音信息与第二语音信息的相似度。
具体地说,机器人可以根据获取的第一语音信息和第二语音信息的相似度来判断发声者的身份。机器人可以将第一语音信息的频率和第二语音信息的频率进行比较,从而得到第一语音信息与第二语音信息的相似度。可以理解的是当第一语音信息的频率和第二语音信息的频率相近时,认为相似度较高;当第一语音信息的频率和第二语音信息的频率相差较大时,认为相似度较低。机器人还可以将第一语音信息的波形和第二语音信息的波形进行比较,从而得到第一语音信息与第二语音信息的相似度。波形同时体现了语音信息的频率和振幅,能够更准确的反映第一语音信息与第二语音信息的相似度。可以理解的是当第一语音信息的波形和第二语音信息的波形相近时,认为相似度较高;当第一语音信息的波形和第二语音信息的波形相差较大时,认为相似度较低。
步骤104:判断相似度是否大于预设阈值,如果是,则执行步骤105,如果否,则执行步骤106。
具体地说,机器人会判断第一语音信息与第二语音信息的相似度是否大于预设阈值,预设阈值可以由本领域技术人员基于不同机器人的性能所设定。比如说预设阈值为95%,那么当机器人判断第一语音信息与第二语音信息的相似度大于95%时,执行步骤105,否则执行步骤106。如果机器人采用检测到的第一语音信息的频率和第二语音信息的频率得到相似度,那么当机器人判断第一语音信息的频率与第二语音信息的频率的相似度大于95%时,即第一语音信息的频率与第二语音信息的频率十分接近,则执行步骤105,否则执行步骤106。如果机器人采用检测到的第一语音信息的波形和第二语音信息的波形得到相似度,那么当机器人判断第一语音信息的波形与第二语音信息的波形的相似度大于95%时,即第一语音信息的波形与第二语音信息的波形几乎可以重合,则执行步骤105,否则执行步骤106。
步骤105:将发声者识别为机器人。
具体地说,如果第一语音信息与第二语音信息的相似度大于预设阈值,则将发声者识别为机器人。因为机器人在回答预设问题时,通常是在预先存储的数据库中搜索与预设问题对应的答案,因此,两次回答问题的语音信息几乎是一摸一样的。而自然人在两次重复回答同一个问题时很难做到一模一样,语速、语音、语调都会存在一定程度上的差异,可能还会因为重复回答相同的问题带有不同的情绪,而且自然人在回答同一个问题时,可能还会出现不同的答案。这就会使两次语音信息的频率或是波形不可避免的存在差异。所以在第一语音信息与第二语音信息的相似度大于预设阈值时,可以将发声者识别为机器人。
步骤106:将发声者识别为自然人。
比如说,第一语音信息与第二语音信息的相似度小于预设阈值时,说明第一语音信息与第二语音信息相差较大,机器人可以将发声者识别为自然人。
与现有技术相比,本发明实施方式通过获取发声者在第一次回答预设问题时的第一语音信息;获取发声者在第二次回答预设问题时的第二语音信息;得到发声者在两次回答同一个预设问题的语音信息,有利于对第一语音信息和第二语音信息进行有效的对比。通过检测第一语音信息与第二语音信息的相似度;如果第一语音信息与第二语音信息的相似度大于预设阈值,则将发声者识别为机器人。由于机器人在重复一句话时,相似度极高,而自然人在重复同一句话时,相似度较低。因此通过判断第一语音信息与第二语音信息的相似度可以准确的识别发声者是否为机器人,有利于提高机器人的智能性。因为每一段语音都会对应一个频率值,而机器人在两次回答同一个问题时,相似度很高,因此,将第一语音信息的频率和第二语音信息的频率进行比较,如果第一语音信息的频率和第二语音信息的频率的相似度大于预设阈值,则将发声者识别为机器人。通过两段语音信息频率的比较,可以有效的识别发声者是自然人还是机器人。由于波形不仅涵盖了语音信息的频率还涵盖了语音信息的振幅,因此通过两段语音信息波形的比较,可以更有效的识别发声者是自然人还是机器人。
本发明的第二实施方式涉及一种智能识别方法。第二实施方式是第一实施方式的进一步改进,主要改进之处在于:本发明第二实施方式中,在获取发声者在第一次回答预设问题时的第一语音信息之前,还包括:接收语音指令。在将发声者识别为自然人后,执行语音指令。本实施方式中的智能识别方法如图2所示,具体包括:
步骤201:接收语音指令。
具体地说,机器人可以先接收发声者的语音指令,这里的语音指令指的是发声者命令机器人执行的相关指令。比如说发声者发出开门、关门等语音指令,机器人接收到这些语音指令后,即确定收到的语音信息是发声者发出的语音指令时,触发对发声者是自然人还是机器人的识别的相关操作。也就是说,在接收语音指令后开始执行步骤202。
步骤202:获取发声者在第一次回答预设问题时的第一语音信息。
步骤203:获取所述发声者在第二次回答所述预设问题时的第二语音信息。
步骤204:检测第一语音信息与第二语音信息的相似度。
步骤205:判断相似度是否大于预设阈值,如果是,则执行步骤206,如果否,则执行步骤207。
步骤206:将发声者识别为机器人。
步骤207:将发声者识别为自然人。
本发明第二实施方式中步骤202至步骤207,分别与第一实施方式中步骤101至步骤106大致相同,为避免重复在此不再赘述。
步骤208:执行语音指令。
具体地说,在机器人将发声者识别为自然人后,机器人执行发声者发出的语音指令。比如说,发声者对机器人发出“开门”这一语音指令,机器人对发声者的身份进行识别,如果发声者被识别为机器人,则机器人不执行语音指令,即不去“开门”;如果发声者被识别为自然人,则机器人执行语音指令,即去“开门”。
与现有技术相比,本发明实施方式通过在接收到语音指令后,再识别发声者是自然人还是机器人,有利于在确定接收到语音指令后,才触发对发声者进行识别的操作,从而避免在接收到非语音指令的语音信息时,对发声者做出不必要的识别操作。通过将发声者识别为自然人之后,再执行语音指令,有利于提高执行语音指令的有效性,避免了因执行机器人的指令而造成不必要的麻烦。
本发明的第三实施方式涉及一种智能识别方法。第三实施方式是第二实施方式的进一步改进,主要改进之处在于:在获取发声者在第一次回答预设问题时的第一语音信息之前,还包括:检测语音指令中是否携带底噪;如果语音指令中未携带底噪,则再执行获取发声者在第一次回答预设问题时的第一语音信息;如果检测到语音中携带底噪,则将发声者识别为机器人。本实施方式中的智能识别方法如图3所示,具体包括:
步骤301:接收语音指令。
本实施方式中步骤301与第二实施方式中步骤201大致相同,为避免重复在此不再赘述。
步骤302:检测语音指令中是否携带底噪,如果是,则执行步骤307,如果否,则执行步骤303。
具体地说,机器人的语音指令中可以预先添加底噪,添加的方法就是添加一个声音,类似于,我是机器人,我型号是001,我说话了,这句话时长1分钟,把这段内容和正常语音一起播放出去即可。比如说,在传达语音指令的时候,机器人会连同底噪一同播放,无需传达语音指令时,底噪就暂停播放,因为底噪和语音指令同时播放和暂停,所以可以很简单的区分语音指令中是否携带底噪。底噪可以增加到人类不可能发声的低频区间,比如20HZ-50HZ之间,这样的噪音是只有机器人才能发出的超低频率的声音,自然人是发不出超低频率的声音的。因此,如果机器人检测到接收到的语音指令中携带底噪,则可以直接判断出发声者就是机器人。
步骤303:获取发声者在第一次回答预设问题时的第一语音信息。
步骤304:获取所述发声者在第二次回答所述预设问题时的第二语音信息。
步骤305:检测第一语音信息与第二语音信息的相似度。
步骤306:判断相似度是否大于预设阈值,如果是,则执行步骤307,如果否,则执行步骤308。
步骤307:将发声者识别为机器人。
步骤308:将发声者识别为自然人。
步骤309:执行语音指令。
本发明第二实施方式中步骤303至步骤309,分别与第二实施方式中步骤202至步骤208大致相同,为避免重复在此不再赘述。
现有技术相比,本发明实施方式通过检测语音指令中是否携带底噪;如果语音指令中未携带底噪,则再执行获取发声者在第一次回答预设问题时的第一语音信息;如果检测到语音中携带底噪,则将发声者识别为机器人。由于机器人发出的语音中可以加入底噪,但自然人的语音中不存在该标志,因此,通过检测语音指令中是否携带底噪,可以判断出发出指令的是自然人还是机器人,使识别过程更加简单、便捷。
本发明的第四实施方式涉及一种智能识别方法。第四实施方式是第二实施方式的进一步改进,主要改进之处在于:本发明第四实施方式中,在将发声者识别为自然人后,判断语音指令在当前环境下是否具备可行性;在语音指令在当前环境下具备可行性时,执行语音指令。本实施方式中的智能识别方法如图4所示,具体包括:
步骤401:接收语音指令。
步骤402:获取发声者在第一次回答预设问题时的第一语音信息。
步骤403:获取所述发声者在第二次回答所述预设问题时的第二语音信息。
步骤404:检测第一语音信息与第二语音信息的相似度。
步骤405:判断相似度是否大于预设阈值,如果是,则执行步骤406,如果否,则执行步骤407。
步骤406:将发声者识别为机器人。
步骤407:将发声者识别为自然人。
本发明第四实施方式中步骤401至步骤407,分别与第二实施方式中步骤201至步骤207大致相同,为避免重复在此不再赘述。
步骤408:判断语音指令在当前环境下是否具备可行性,如果是,则执行步骤409,如果否,则该流程结束。
具体地说,在机器人将发声者识别为自然人之后,还要判断语音指令在当前环境下是否具备可行性,在具备可行性的前提下,执行指令。比如说,机器人收到“向前走”的指令,但如果执行“向前走”的指令,可能会有撞墙的可能性,此时机器人会判定“向前走”这一语音指令在当前环境下并不具备可行性,因此不会执行指令,从而保证了机器人自身的安全。
与现有技术相比,本发明实施方式通过在执行语音指令之前,判断语音指令在当前环境下是否具备可行性,在具备可行性时再执行语音指令,有利于保证执行指令的机器人的安全。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明第五实施方式涉及一种机器人,如图5所示,包括:
至少一个处理器501;以及,
与至少一个处理器501通信连接的存储器502;其中,
存储器502存储有可被至少一个处理器501执行的指令,指令被至少一个处理器501执行,以使至少一个处理器501能够执行如上所述的智能识别方法。
其中,存储器502和处理器501采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器501和存储器502的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器501处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器501。
处理器501负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器502可以被用于存储处理器501在执行操作时所使用的数据。
本发明第六实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (6)

1.一种智能识别方法,其特征在于,包括:
获取发声者在第一次回答预设问题时的第一语音信息;
获取所述发声者在第二次回答所述预设问题时的第二语音信息;
检测所述第一语音信息与所述第二语音信息的相似度;
如果所述第一语音信息与所述第二语音信息的相似度大于预设阈值,则将所述发声者识别为机器人;
在所述获取发声者在第一次回答预设问题时的第一语音信息之前,还包括:
接收语音指令;
所述检测所述第一语音信息与所述第二语音信息的相似度,具体包括:
将第一语音信息的频率和第二语音信息的频率进行比较;
所述如果所述第一语音信息与所述第二语音信息的相似度大于预设阈值,则将所述发声者识别为机器人,具体包括:
如果所述第一语音信息的频率和所述第二语音信息的频率的相似度大于预设阈值,则将所述发声者识别为机器人;
所述检测所述第一语音信息与所述第二语音信息的相似度,具体包括;
将第一语音信息的波形和第二语音信息的波形进行比较;
所述如果所述第一语音信息与所述第二语音信息的相似度大于预设阈值,则将所述发声者识别为机器人,具体包括:
如果所述第一语音信息的波形和所述第二语音信息的波形的相似度大于预设阈值,则将所述发声者识别为机器人。
2.根据权利要求1所述的智能识别方法,其特征在于,在所述检测所述第一语音信息与所述第二语音信息的相似度之后,还包括:
如果所述第一语音信息与所述第二语音信息的相似度小于预设阈值,则将所述发声者识别为自然人;
在将所述发声者识别为自然人后,执行所述语音指令。
3.根据权利要求1所述的智能识别方法,其特征在于,在所述检测所述第一语音信息与所述第二语音信息的相似度之后,还包括:
如果所述第一语音信息与所述第二语音信息的相似度小于预设阈值,则将所述发声者识别为自然人;
在所述将所述发声者识别为自然人后,判断所述语音指令在当前环境下是否具备可行性;
在所述语音指令在当前环境下具备可行性时,执行所述语音指令。
4.根据权利要求1所述的智能识别方法,其特征在于,在所述获取发声者在第一次回答预设问题时的第一语音信息之前,还包括:
检测所述语音指令中是否携带底噪;
如果所述语音指令中未携带底噪,则再执行所述获取发声者在第一次回答预设问题时的第一语音信息;
如果检测到所述语音中携带底噪,则将所述发声者识别为机器人。
5.一种机器人,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至4中任一所述的智能识别方法。
6.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的智能识别方法。
CN201710909101.4A 2017-09-29 2017-09-29 智能识别方法、机器人及计算机可读存储介质 Expired - Fee Related CN107742516B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010878823.XA CN111968643A (zh) 2017-09-29 2017-09-29 智能识别方法、机器人及计算机可读存储介质
CN201710909101.4A CN107742516B (zh) 2017-09-29 2017-09-29 智能识别方法、机器人及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710909101.4A CN107742516B (zh) 2017-09-29 2017-09-29 智能识别方法、机器人及计算机可读存储介质

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202010878823.XA Division CN111968643A (zh) 2017-09-29 2017-09-29 智能识别方法、机器人及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN107742516A CN107742516A (zh) 2018-02-27
CN107742516B true CN107742516B (zh) 2020-11-17

Family

ID=61236423

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201710909101.4A Expired - Fee Related CN107742516B (zh) 2017-09-29 2017-09-29 智能识别方法、机器人及计算机可读存储介质
CN202010878823.XA Withdrawn CN111968643A (zh) 2017-09-29 2017-09-29 智能识别方法、机器人及计算机可读存储介质

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202010878823.XA Withdrawn CN111968643A (zh) 2017-09-29 2017-09-29 智能识别方法、机器人及计算机可读存储介质

Country Status (1)

Country Link
CN (2) CN107742516B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109003607B (zh) * 2018-07-12 2021-06-01 Oppo广东移动通信有限公司 语音识别方法、装置、存储介质及电子设备
CN110797048B (zh) * 2018-08-01 2022-09-13 珠海格力电器股份有限公司 语音信息的获取方法及装置
CN110931020B (zh) * 2019-12-11 2022-05-24 北京声智科技有限公司 一种语音检测方法及装置
CN112382282B (zh) * 2020-11-06 2022-02-11 北京五八信息技术有限公司 一种语音去噪处理方法、装置、电子设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009078665A1 (en) * 2007-12-17 2009-06-25 Electronics And Telecommunications Research Institute Method and apparatus for lexical decoding
CN105702253A (zh) * 2016-01-07 2016-06-22 北京云知声信息技术有限公司 一种语音唤醒方法及装置
CN106448663A (zh) * 2016-10-17 2017-02-22 海信集团有限公司 语音唤醒方法及语音交互装置
CN106469553A (zh) * 2015-08-13 2017-03-01 中兴通讯股份有限公司 语音识别方法及装置
CN106601216A (zh) * 2016-11-30 2017-04-26 宇龙计算机通信科技(深圳)有限公司 通过音乐实现电子设备控制的方法及系统
CN106611597A (zh) * 2016-12-02 2017-05-03 百度在线网络技术(北京)有限公司 基于人工智能的语音唤醒方法和装置
CN106653031A (zh) * 2016-10-17 2017-05-10 海信集团有限公司 语音唤醒方法及语音交互装置
CN106796790A (zh) * 2016-11-16 2017-05-31 深圳达闼科技控股有限公司 机器人语音指令识别的方法及相关机器人装置
CN106971720A (zh) * 2016-01-14 2017-07-21 芋头科技(杭州)有限公司 一种更新噪声数据库的机器人语音识别方法及装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4204541B2 (ja) * 2004-12-24 2009-01-07 株式会社東芝 対話型ロボット、対話型ロボットの音声認識方法および対話型ロボットの音声認識プログラム
CN101059830A (zh) * 2007-06-01 2007-10-24 华南理工大学 一种可结合游戏特征的机器人外挂识别方法
JP5075664B2 (ja) * 2008-02-15 2012-11-21 株式会社東芝 音声対話装置及び支援方法
US9293130B2 (en) * 2008-05-02 2016-03-22 Nuance Communications, Inc. Method and system for robust pattern matching in continuous speech for spotting a keyword of interest using orthogonal matching pursuit
CN102820033B (zh) * 2012-08-17 2013-12-04 南京大学 一种声纹识别方法
US20140126743A1 (en) * 2012-11-05 2014-05-08 Aliphcom, Inc. Acoustic voice activity detection (avad) for electronic systems
CN103065629A (zh) * 2012-11-20 2013-04-24 广东工业大学 一种仿人机器人的语音识别系统
JP6054283B2 (ja) * 2013-11-27 2016-12-27 シャープ株式会社 音声認識端末、サーバ、サーバの制御方法、音声認識システム、音声認識端末の制御プログラム、サーバの制御プログラムおよび音声認識端末の制御方法
CN105788595A (zh) * 2014-12-15 2016-07-20 肖伟 机器人语音识别方法
CN105773640A (zh) * 2014-12-23 2016-07-20 肖伟 机器人主人语音密码识别方法
US9747926B2 (en) * 2015-10-16 2017-08-29 Google Inc. Hotword recognition
CN105512535A (zh) * 2016-01-08 2016-04-20 广东德生科技股份有限公司 一种用户认证的方法及装置
CN105931633A (zh) * 2016-05-30 2016-09-07 深圳市鼎盛智能科技有限公司 语音识别的方法及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009078665A1 (en) * 2007-12-17 2009-06-25 Electronics And Telecommunications Research Institute Method and apparatus for lexical decoding
CN106469553A (zh) * 2015-08-13 2017-03-01 中兴通讯股份有限公司 语音识别方法及装置
CN105702253A (zh) * 2016-01-07 2016-06-22 北京云知声信息技术有限公司 一种语音唤醒方法及装置
CN106971720A (zh) * 2016-01-14 2017-07-21 芋头科技(杭州)有限公司 一种更新噪声数据库的机器人语音识别方法及装置
CN106448663A (zh) * 2016-10-17 2017-02-22 海信集团有限公司 语音唤醒方法及语音交互装置
CN106653031A (zh) * 2016-10-17 2017-05-10 海信集团有限公司 语音唤醒方法及语音交互装置
CN106796790A (zh) * 2016-11-16 2017-05-31 深圳达闼科技控股有限公司 机器人语音指令识别的方法及相关机器人装置
CN106601216A (zh) * 2016-11-30 2017-04-26 宇龙计算机通信科技(深圳)有限公司 通过音乐实现电子设备控制的方法及系统
CN106611597A (zh) * 2016-12-02 2017-05-03 百度在线网络技术(北京)有限公司 基于人工智能的语音唤醒方法和装置

Also Published As

Publication number Publication date
CN107742516A (zh) 2018-02-27
CN111968643A (zh) 2020-11-20

Similar Documents

Publication Publication Date Title
CN107742516B (zh) 智能识别方法、机器人及计算机可读存储介质
JP6613347B2 (ja) 情報をプッシュする方法及び装置
US9583102B2 (en) Method of controlling interactive system, method of controlling server, server, and interactive device
KR102611751B1 (ko) 키 문구 사용자 인식의 증강
US9026443B2 (en) Context based voice activity detection sensitivity
WO2020125457A1 (zh) 多轮交互的语义理解方法、装置及计算机存储介质
CN108711429B (zh) 电子设备及设备控制方法
CN110047481A (zh) 用于语音识别的方法和装置
CN105336324A (zh) 一种语种识别方法及装置
CN111161726B (zh) 一种智能语音交互方法、设备、介质及系统
KR20210128039A (ko) 화자 구분
KR20200074690A (ko) 전자 장치 및 이의 제어 방법
CN109712610A (zh) 用于识别语音的方法和装置
CN111178081B (zh) 语义识别的方法、服务器、电子设备及计算机存储介质
CN109785846A (zh) 单声道的语音数据的角色识别方法及装置
CN114385800A (zh) 语音对话方法和装置
CN113674742A (zh) 人机交互方法、装置、设备以及存储介质
CN108908377A (zh) 说话人识别方法、装置和机器人
CN109741744B (zh) 基于大数据搜索的ai机器人对话控制方法和系统
CN109065026B (zh) 一种录音控制方法及装置
CN110262278B (zh) 智能家电设备的控制方法及装置、智能电器设备
CN112420043A (zh) 基于语音的智能唤醒方法、装置、电子设备及存储介质
CN112700767A (zh) 人机对话打断方法及装置
CN112037772B (zh) 基于多模态的响应义务检测方法、系统及装置
CN115831109A (zh) 语音唤醒方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200515

Address after: 750021 No.2 Shuangyong street, Xixia District, Yinchuan City, Ningxia Hui Autonomous Region

Applicant after: Zhao Chengzhi

Address before: 201506 Shanghai city Jinshan District Industry Road No. 218 Building 2 layer 3

Applicant before: SHANGHAI YUDE COMMUNICATION TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20201029

Address after: Room 2006s, No.24 Guoding Branch Road, Yangpu District, Shanghai, 200082

Applicant after: Shanghai Wangchao Data Technology Co.,Ltd.

Address before: 750021 No.2 Shuangyong street, Xixia District, Yinchuan City, Ningxia Hui Autonomous Region

Applicant before: Zhao Chengzhi

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201117

CF01 Termination of patent right due to non-payment of annual fee