CN109271480B - 一种语音搜题方法及电子设备 - Google Patents

一种语音搜题方法及电子设备 Download PDF

Info

Publication number
CN109271480B
CN109271480B CN201811002306.5A CN201811002306A CN109271480B CN 109271480 B CN109271480 B CN 109271480B CN 201811002306 A CN201811002306 A CN 201811002306A CN 109271480 B CN109271480 B CN 109271480B
Authority
CN
China
Prior art keywords
voice
sound
external
decibel
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811002306.5A
Other languages
English (en)
Other versions
CN109271480A (zh
Inventor
朱文辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201811002306.5A priority Critical patent/CN109271480B/zh
Publication of CN109271480A publication Critical patent/CN109271480A/zh
Application granted granted Critical
Publication of CN109271480B publication Critical patent/CN109271480B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Educational Technology (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例公开了一种语音搜题方法及电子设备,该方法包括:检测电子设备当前所处环境的外界第一声音;判断外界第一声音的当前分贝是否大于预设的分贝阈值;若大于分贝阈值,确定外界第一声音的音源位置并输出用于提示用户向背离音源位置的方向移动的提示信息;实时检测电子设备与外界第一声音的音源位置的相对距离并判断该相对距离是否大于预设的距离阈值;若相对距离大于距离阈值,获取用户输入的第一语音作为搜题语音;从搜题语音中识别出待搜索问题并搜索与待搜索问题相匹配的答案信息;输出答案信息。实施本发明实施例,能够通过远离外界声音音源的方式,减少外界声音源对语音搜题的干扰,提高了包含家教机在内的电子设备的搜题准确率。

Description

一种语音搜题方法及电子设备
技术领域
本发明涉及语音交互技术领域,具体涉及一种语音搜题方法及电子设备。
背景技术
随着教育科技的发展,家教机作为一种辅助学习工具在现今儿童的学习过程中广泛地被孩子们所使用。在正常的环境条件下,家教机能够容易识别用户输入的语音,从而正常地实现语音搜题。但是在实践中发现,当有嘈杂的外界声音源时,外界声音源发出的声音容易被家教机所接收,并且极易干扰家教机与用户的语音搜题交互,家教机难以分辨用户输入的语音和外界音源之间的区别,导致家教机的语音识别准确率较低,从而导致搜题的准确率较低。
发明内容
针对上述缺陷,本发明实施例公开了一种语音搜题方法及电子设备,能够提高家教机的语音搜题准确率。
本发明实施例第一方面公开了一种语音搜题方法,包括:
检测电子设备当前所处环境的外界第一声音;
判断所述外界第一声音的当前分贝是否大于预设的分贝阈值;
若所述外界第一声音的当前分贝大于所述分贝阈值,确定所述外界第一声音的音源位置并输出用于提示用户向背离所述音源位置的方向移动的提示信息;
实时检测所述电子设备与所述外界第一声音的音源位置的相对距离并判断所述相对距离是否大于预设的距离阈值;
若所述相对距离大于所述距离阈值,获取用户输入的第一语音作为搜题语音;
从所述搜题语音中识别出待搜索问题并搜索与所述待搜索问题相匹配的答案信息;
输出所述答案信息。
作为一种可选的实施方式,在本发明实例第一方面中,在判断出所述相对距离大于所述距离阈值之后,以及在所述获取用户输入的第一语音作为搜题语音之前,所述方法还包括:
检测所述电子设备当前所处环境的外界第二声音;
判断所述外界第二声音的当前分贝是否小于所述分贝阈值;
若所述外界第二声音的当前分贝小于所述分贝阈值,执行所述获取用户输入第一语音作为搜题语音。
作为一种可选的实施方式,在本发明实例第一方面中,在判断出所述外界第一声音的当前分贝大于所述分贝阈值之后,以及在所述输出用于提示用户向背离所述音源位置的方向移动的提示信息之前,所述方法还包括:
检测当前时刻是否正在接收用户输入的第二语音,如果是,保存所述第二语音;
以及,在判断出所述外界第二声音的当前分贝小于所述分贝阈值之后,所述获取用户输入的第一语音作为搜题语音,包括:
获取用户输入的第一语音以及保存的所述第二语音,根据所述第一语音与所述第二语音的共有部分,将所述第一语音与所述第二语音整合为一有序整体语音,并将所述有序整体语音确定为搜题语音。
作为一种可选的实施方式,在本发明实例例第一方面中,在判断出所述外界第一声音的当前分贝大于所述分贝阈值之后,以及在所述输出用于提示用户向背离所述音源位置的方向移动的提示信息之前,所述方法还包括:
检测当前时刻是否正在播放音频信息,如果是,记录所述音频信息在当前时刻的播放进度;
以及,在判断出所述外界第二声音的当前分贝小于所述分贝阈值之后,所述方法还包括:
读取所述音频信息的所述播放进度,并按照所述播放进度继续播放所述音频信息。
作为一种可选的实施方式,在本发明实例第一方面中,所述从所述搜题语音中识别出待搜索问题,包括:
从所述搜题语音中分离出与预设的用户声纹特征相匹配的子信号,从所述子信号中识别出待搜索问题。
本发明实施例第二方面公开了一种电子设备,包括:
第一检测单元,用于检测所述电子设备当前所处环境的外界第一声音;
第一判断单元,用于判断所述外界第一声音的当前分贝是否大于预设的分贝阈值;
提示单元,用于在所述第一判断单元判断出所述外界第一声音的当前分贝大于所述分贝阈值之后,确定所述外界第一声音的音源位置并输出用于提示用户向背离所述音源位置的方向移动的提示信息;
第二判断单元,用于实时检测所述电子设备与所述外界第一声音的音源位置的相对距离并判断所述相对距离是否大于预设的距离阈值;
获取单元,用于在所述第二判断单元判断出所述相对距离大于所述距离阈值之后,获取用户输入的第一语音作为搜题语音;
处理单元,用于从所述搜题语音中识别出待搜索问题并搜索与所述待搜索问题相匹配的答案信息;
输出单元,用于输出所述答案信息。
作为一种可选的实施方式,在本发明实施例第二方面中:
所述第一检测单元,还用于在所述第二判断单元判断出所述相对距离大于所述距离阈值之后,以及在所述获取单元获取用户输入的第一语音作为搜题语音之前,检测所述电子设备当前所处环境的外界第二声音;
所述第一判断单元,还用于判断所述外界第二声音的当前分贝是否小于所述分贝阈值;
所述获取单元,具体用于在所述第二判断单元判断出所述相对距离大于所述距离阈值并且所述第一判断单元判断出所述外界第二声音的当前分贝小于所述分贝阈值之后,获取用户输入的第一语音作为搜题语音。
作为一种可选的实施方式,在本发明实施例第二方面中,所述电子设备还包括:
第二检测单元,用于在所述第一判断单元判断出所述外界第一声音的当前分贝大于所述分贝阈值之后,以及在所述提示单元输出用于提示用户向背离所述音源位置的方向移动的提示信息之前,检测当前时刻是否正在接收用户输入的第二语音;
存储单元,用于在所述第二检测单元检测到当前时刻正在接收所述第二语音时,保存所述第二语音;
所述获取单元用于在所述第二判断单元判断出所述相对距离大于所述距离阈值并且所述第一判断单元判断出所述外界第二声音的当前分贝小于所述分贝阈值之后,获取用户输入的第一语音作为搜题语音的方式具体为:
所述获取单元,用于在所述第二判断单元判断出所述相对距离大于所述距离阈值并且所述第一判断单元判断出所述外界第二声音的当前分贝小于所述分贝阈值之后,获取用户输入的第一语音以及保存的所述第二语音,根据所述第一语音与所述第二语音的共有部分,将所述第一语音与所述第二语音整合为一有序整体语音,并将所述有序整体语音确定为搜题语音。
作为一种可选的实施方式,在本发明实施例第二方面中,所述第二检测单元,还用于在所述第一判断单元判断出所述外界第一声音的当前分贝大于所述分贝阈值之后,以及在所述提示单元输出用于提示用户向背离所述音源位置的方向移动的提示信息之前,检测当前时刻是否正在输出音频信息;
以及,所述电子设备还包括:
记录单元,用于在所述第二检测单元检测到当前时刻正在播放所述音频信息时,记录所述音频信息在当前时刻的播放进度;
所述输出单元,用于在所述第一判断单元判断出所述外界第二声音的当前分贝小于所述分贝阈值之后,读取所述音频信息的所述播放进度,并按照所述播放进度继续播放所述音频信息。
作为一种可选的实施方式,在本发明实施例第二方面中,所述处理单元用于从所述搜题语音中识别出待搜索问题的方式具体为:
所述处理单元,用于从所述搜题语音中分离出与预设的用户声纹特征相匹配的子信号,从所述子信号中识别出待搜索问题。
本发明实施例第三方面公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行本发明实施例第一方面公开的语音搜题方法。
本发明实施例第四方面公开一种计算机程序产品,该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,且该计算机程序可操作来使计算机执行本发明实施例第一方面公开的语音搜题方法。
从以上技术方案可以看出,本发明实施例具有以下有益效果:
本发明实施例中,电子设备在外边所处当前环境的外界声音大于预设阈值后,确定外界声音音源的位置,并输出用户提示用户远离声音音源的方式降低外界声音音源对人机语音搜题的交互的影响;让用户在外界声音音源较小的环境中进行语音搜题,提高了家教机的语音搜题准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种语音搜题方法的流程示意图;
图2是本发明实施例公开的另一种语音搜题方法的流程示意图;
图3是本发明实施例公开的一种电子设备的结构示意图;
图4是本发明实施例公开的另一种电子设备的结构示意图;
图5是本发明实施例公开的另一种电子设备的结构示意图。
具体实施方式
本发明实施例提供了一种语音搜题方法及电子设备,通过远离外界声音音源的方式,减少外界声音源对人机语音搜题的干扰,提高了包含家教机在内的电子设备的搜题准确率。
下面将结合本发明实施例的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、移动终端、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。
本发明实施公开了一种语音搜题方法及电子设备,能够提高家教机的语音搜题的准确率。
实施例一
请参阅图1,图1是本发明实施例公开的一种语音搜题方法流程示意图。其中,图1所描述的语音搜题方法适用于手机、平板电脑、家教机等具有语音交互功能,能够进行语音搜题的电子设备,本发明实施例不做限定。其中,上述的电子设备的操作系统可包括但不限于Android操作系统、IOS操作系统、Symbian(塞班)操作系统、Black Berry(黑莓)操作系统、Windows Phone8操作系统等等,本发明实施例不做限定。如图1所示,该语音搜题方法可以包括以下步骤:
101、电子设备检测其当前所处环境的外界第一声音。
本发明实施例中,电子设备可以包括家教机、早教机以及平板电脑等电子设备,本发明实例不作限定。
作为一种可选的实施方式,电子设备可以通过内置的背景声音采集模块(麦克风或麦克风阵列等)实时的检测电子设备当前所处环境的外界声音源发出的声音,进行外界声音源强度的采集,以确定电子设备当前所处环境的外界声音强度;对检测到的电子设备当前所处环境的外界声音进行强度分析,分析出当前电子设备所处环境外界声音强度的分贝值大小。
102、电子设备判断外界第一声音的当前分贝是否大于预设分贝阈值,如果是,执行103,如果否,执行106。
103、电子设备确定外界第一声音的音源位置。
作为一种可选的实施方式,电子设备可以通过内置的麦克风阵列或安装在电子设备不同位置处的麦克风来检测外界第一声音到达电子设备麦克风或麦克风阵列的声音强度和到达时间,并且通过检测到的外界第一声音到达麦克风或麦克风阵列声音强度差和时间差,确定外界第一声音音源的位置。
104、电子设备输出用于提示用户向背离音源位置的方向移动的提示信息。
作为一种可选的实施方式,电子设备通过语音提示或者显示于电子设备显示屏上的提示信息提示用户向背离音源的位置的方向移动。
105、电子设备实时检测电子设备与外界第一声音的音源位置的相对距离并判断相对距离是否大于预设的距离阈值,如果是,执行106;如果否,继续执行104。
本发明实施例中,电子设备在输出提示信息之后,可以按照特定的频率实时检测电子设备与外界第一声音的音源位置的相对距离,一旦判断出该相对距离大于预设的距离阈值,执行步骤106。
106、电子设备获取用户输入的第一语音作为搜题语音,从搜题语音中识别出待搜索问题并搜索与该待搜索问题相匹配的答案信息。
作为一种可选的实施方式,电子设备可以通过语音识别(Automatic SpeechRecognition,ASR)模块、自然语言处理(Natural Language Processing,NLP)模块和语音合成(Text To Speech,TTS)模块处理用户输入的搜题语音;具体地,首先经过语音激活检测即从输入的搜题语音切除前后静音筛选出有效片段,从而能够减小语音识别系统噪音误识别率与系统功耗,然后进行特征选取即将语音切为小段语音与识别建模即将音频序列转化为文字序列,文字序列再经自然语音处理模块对其进行分词、句法分析、语义分析以及篇章分析最终理解用户输入的搜题语音包含的事件问题,最后依据自然语言处理模块的处理结果生成对应的语言句子,而后将对应的语言句子转换成语音输出。
107、电子设备输出第一答案信息。
可见,实施图1所描述的方法,电子设备可以根据检测到的外界声音,定位外界声音音源的位置,并且在检测到外界声音过大时,通过提示用户向背离外界声音音源的方式减少外界声音对人机语音搜题影响,从而提高了包含家教机在内的电子设备进行语音搜题时的准确率。
实施例二
请参阅图2,图2是本发明实施例公开的另一种语音搜题方法流程示意图。如图2所示,该语音搜题方法可以包括以下步骤:
201、电子设备检测其当前所处环境的外界第一声音。
202、电子设备判断外界第一声音的当前分贝是否大于预设的分贝阈值,如果是,执行203,如果否,执行步骤208。
203、电子设备确定外界第一声音的音源位置。
204、电子设备输出用于提示用户向背离音源位置的方向移动的提示信息。
205、电子设备实时检测电子设备与外界第一声音的音源位置的相对距离并判断相对距离是否大于预设的距离阈值,如果是,执行步骤206;如果否,返回执行步骤204。
206、电子设备检测其当前所处环境的外界第二声音。
在实际应用中,电子设备所处的环境可以包括卧室、自习室等安静的区域,也可以包括客厅、校园操场等嘈杂的区域,因此噪声的来源也可能是多样的,可能是自习室中学生的说话声,也可能是客厅中的电视播放节目的声音。电子设备在执行步骤205时,距离阈值可以根据不同的应用场景选取不同取值,可以认为在某一应用场景下,当电子设备与音源的相对距离超过距离阈值时,电子设备距离音源足够远,接收到的搜题语音中包含的噪声较少,噪声对语音识别的影响较低。然而,该距离阈值只是通过经验预估出的值,在一些可能的应用场景中,当电子设备与音乐的相对距离超过距离阈值之后,电子设备在当前位置仍然能接收到信号强度较大的外界声音,如果在该位置接收用户输入的搜题语音,这些外界声音仍可能会影响对搜题语音进行语音识别的准确度。因此,在本发明实施例中,电子设备在判断出与外界第一声源的相对距离大于距离阈值时,在当前位置接收第二外界声音,并执行下述的步骤208,以判断该位置的环境声音的音量是否较低(即该位置是否适合进行语音搜题),在验证出该位置适合进行语音搜题时,再接收用户输入的搜题语音,从而可以进一步提高对搜题语音进行语音识别的准确率,以提高语音搜题的准确率。
作为一种可选的实施方式,在本发明实施例中,电子设备在执行步骤205之前,还可以控制电子设备的摄像头拍摄其当前所处场景的图像,通过对上述图像进行图像识别,识别出电子设备当前所处的场景,并根据电子设备当前所处的场景确定距离阈值的取值。
207、电子设备判断外界第二声音的当前分贝是否小于分贝阈值,如果是,执行步骤208,如果否,继续执行步骤204。
208、电子设备获取用户输入的第一语音作为搜题语音,从搜题语音中识别出待搜索问题并搜索与该待搜索问题相匹配的答案信息。
本发明实施例中,电子设备从搜题语音中识别出待搜索问题的方式具体可以为:电子设备从搜题语音中分离出与预设的用户声纹特征相匹配的子信号,从子信号中识别出待搜索问题。具体地,电子设备可以预先采集用户输入的用户声音信号,分析用户声音信号以确定该用户声音的频率范围;按照该频率范围对搜题语音进行滤波,以过滤得到频率落入该频率范围的信号作为上述的与用户声纹特征相匹配的子信号。
209、电子设备输出答案信息。
在一些可能的应用场景中,电子设备正在与用户进行语音交互,此时,电子设备所处环境中可能突然出现新增的噪声源(比如客厅中的电视被打开),电子设备当前所处的位置不再适合进行语音交互。作为一种可选的实施方式,在本发明实施例中,电子设备在执行步骤202判断出外界第一声音的当前分贝大于预设的分贝阈值时(即判断出电子设备当前所处的位置不再适合进行语音交互),如果电子设备正在进行语音交互,那么电子设备可以暂时中断语音交互并保存语音交互进度,在电子设备远离噪声源之后,再根据保存的语音交互进度继续进行语音交互。
具体地,电子设备进行语音交互的方式可以包括:接收用户输入的语音信息或者播放音频信息。因此,电子设备在执行步骤202判断出外界第一声音的当前分贝大于预设的分贝阈值时,还可以检测当前时刻是否正在接收用户输入的第二语音或者是否正在播放音频信息。
如果当前时刻正在接收用户输入的第二语音,那么保存该第二语音,并且在电子设备执行步骤208判断出外界第二声音的当前分贝小于分贝阈值之后,获取用户输入的第一语音以及上述保存的第二语音,根据第一语音与第二语音的共有部分,将第一语音与第二语音整合为一有序整体语音,并将该有序整体语音确定为搜题语音,然后从搜题语音中识别出待搜索问题并搜索与该待搜索问题相匹配的答案信息。实施该实施方式,如果用户正在使用语音输入一道字数较多的题目时(比如一道数学应用题),突然出现新增的噪声源,电子设备可以保存用户已输入的信息,当电子设备远离噪声源之后,用户可以接着上次输入的内容继续输入题目,电子设备自动接续前后接收到的两段语音,生成一段完整的有序整体语音,从而可以减少用户需要重复输入的部分,提高语音输入的效率,改善用户体验。可选的,电子设备在远离噪声源之后,可以提示用户再次输入语音题目,并且以上次输入的最后一个语句作为该次输入的第一个语句,该语句可以作为上述的第一语音和第二语音的共有部分。
如果当前时刻正在播放音频信息,那么记录音频信息在当前时刻的播放进度,并且在电子设备执行步骤208判断出外界第二声音的当前分贝小于分贝阈值之后,读取该音频信息的播放进度,并按照播放进度继续播放该音频信息。实施该实施方式,电子设备可以在远离噪声源之后,按照保存的播放进度接着播放音频信息,从而无需再次重复已经播放过的音频信息,减少用户的等待时间,改善用户体验。
在一些可能的实施方式中,电子设备正在接收用户输入的第二语音,此时电子设备接收到的语音信号中包含了上述的第二语音以及外界声音,此时电子设备可以对语音信号进行滤波,以分离得到第二语音以及第一外界声音,以判断外界第一声音的当前分贝是否超过指定阈值。
可见,实施图2所描述的方法,电子设备可以根据不同情景下实时检测到的外界声音定位外界声音音源,并输出提示用户向背离外界声音音源方向移动的提示信息,降低外界声音对人机语音搜题的干扰,不仅提高了包含家教机在内的电子设备的语音识别准确率,而且提升了语音搜题效率;进一步地,实施图2所描述的方法,电子设备还可以即时保存正在进行的语音交互进度,在电子设备远离外界声音音源之后,再根据保存的语音交互进度继续进行语音交互,可以提高语音搜题的效率,改善用户体验。
实施例三
请参阅图3,图3为本发明实施例公开的一种电子设备的结构示意图。如图3所示,该电子设备可以包括:
第一检测单元301,用于检测电子设备当前所处环境的外界第一声音;
作为一种可选的实施方式,检测单元301可以通过内置背景噪音采集模块(听筒、麦克风或麦克风阵列等)实时的检测电子设备当前所处环境的外界声音源发出的声音,进行外界声音音源强度的采集,确定电子设备当前所处环境外界声音强度;对检测到的电子设备当前的所处环境的外界声音进行强度分析,以确定当前电子设备所处环境外界声音强度的分贝大小。
第一判断单元302,用于判断第一检测单元301检测到的外界第一声音的当前分贝是否大于预设的分贝阈值;
提示单元303,用于在第一判断单元302判断出外界第一声音的当前分贝大于分贝阈值之后,确定外界第一声音的音源位置并输出用于提示用户向背离检测单元301检测到的外界第一声音的音源位置的方向移动的提示信息;
第二判断单元304,用于实时检测电子设备与检测单元301检测到的外界第一声音的音源位置的相对距离并判断相对距离是否大于预设的距离阈值;
本发明实施例中,提示单元303在输出提示信息之后,可以触发第二判断单元304执行上述的操作。作为一种可选的实施方式,第二判断单元304可以通过内置的麦克风阵列或安装在电子设备不同位置处的麦克风来检测外界第一声音到达电子设备麦克风或麦克风阵列的声音强度和到达时间,并且通过检测到的外界第一声音到达麦克风或麦克风阵列声音强度差和时间差,确定外界第一声音音源的位置;
获取单元305,用于在第二判断单元304判断出电子设备与检测单元301检测到的外界第一声音的音源位置的相对距离大于预设的距离阈值之后,获取用户输入的第一语音作为搜题语音;
处理单元306,用于从获取单元305获取到的搜题语音中识别出待搜索问题并搜索与该待搜索问题相匹配的答案信息;
输出单元307,用于输出与待搜索问题相匹配的答案信息。
可见,实施图3所描述的电子设备,电子设备可以根据检测到外界声音,定位外界声音音源的位置,通过提示用户向背离外界声音音源的降噪方式减少外界声音对人机语音搜题的影响,提高了包含家教机在内的电子设备的语音识别准确率,从而提高了语音搜题的准确率。
实施例四
请参阅图4,图4时本发明实施例公开的另一种电子设备的结果示意图。其中,图4所示的电子设备是由图3所示的电子设备进行优化得到的。与图3所示的电子设备相比较,在图4所示的电子设备中:
上述的第一检测单元301,还用于在第二判断单元304判断出上述的相对距离大于距离阈值之后,以及在获取单元305获取用户输入的第一语音作为搜题语音之前,检测电子设备当前所处环境的外界第二声音;
上述的第一判断单元302,还用于判断第一检测单元301检测到的外界第二声音的当前分贝是否小于分贝阈值;
上述的获取单元305,具体用于在第二判断单元304判断出上述的相对距离大于距离阈值并且第一判断单元302判断出外界第二声音的当前分贝小于分贝阈值之后,获取用户输入的第一语音作为搜题语音。
本发明实施例中,上述的距离阈值可以根据不同的应用场景选取不同取值,然而,该距离阈值只是通过经验预估出的值,在一些可能的应用场景中,当电子设备与音乐的相对距离超过距离阈值之后,电子设备在当前位置仍然能接收到信号强度较大的外界声音,如果在该位置接收用户输入的搜题语音,这些外界声音仍可能会影响对搜题语音进行语音识别的准确度。因此,在图4所示的电子设备中,第一检测单元301会再次判断该位置的外界第二声音的当前分别是否超过分贝阈值(即该位置是否适合进行语音搜题),在验证出该位置适合进行语音搜题时,再触发获取单元305接收用户输入的搜题语音,从而可以进一步提高对搜题语音进行语音识别的准确率,以提高语音搜题的准确率。此外,在图4所示的电子设备中,第一判断单元302还可以获取摄像头拍摄到的电子设备当前所处场景的图像,通过对上述图像进行图像识别,识别出电子设备当前所处的场景,并根据电子设备当前所处的场景确定距离阈值的取值。
可选的,图4所示的电子设备还可以包括:
第二检测单元308,用于在第一判断单元302判断出外界第一声音的当前分贝大于分贝阈值之后,以及在提示单元303输出用于提示用户向背离音源位置的方向移动的提示信息之前,检测当前时刻是否正在接收用户输入的第二语音;
存储单元309,用于在第二检测单元308检测到当前时刻正在接收第二语音时,保存该第二语音;
相应地,上述的获取单元305用于在第二判断单元304判断出上述的相对距离大于距离阈值并且第一判断单元302判断出外界第二声音的当前分贝小于分贝阈值之后,获取用户输入的第一语音作为搜题语音的方式具体为:
上述的获取单元305,用于第二判断单元304判断出上述的相对距离大于距离阈值并且第一判断单元302判断出外界第二声音的当前分贝小于分贝阈值之后,获取用户输入的第一语音以及存储单元309保存的第二语音,根据第一语音与第二语音的共有部分,将第一语音与第二语音整合为一有序整体语音,并将有序整体语音确定为搜题语音。
进一步可选的,上述的第二检测单元308,还用于在第一判断单元302判断出外界第一声音的当前分贝大于分贝阈值之后,以及在提示单元303输出用于提示用户向背离音源位置的方向移动的提示信息之前,检测当前时刻是否正在输出音频信息;
以及,图4所示的电子设备还可以包括:
记录单元310,用于在第二检测单元308检测到当前时刻正在播放音频信息时,记录音频信息在当前时刻的播放进度;
上述的输出单元307,用于在第一判断单元302判断出外界第二声音的当前分贝小于分贝阈值之后,读取记录单元310记录的音频信息的播放进度,并按照该播放进度继续播放音频信息。具体地,第二检测单元308检测当前时刻是否正在输出音频信息的方式可以为:第二检测单元308检测当前时刻输出单元307是否正在输出音频信息。
可见,在本发明实施例中,当电子设备正在与用户进行语音交互时,电子设备所处环境中突然出现新增的噪声源,电子设备可以暂时中断语音交互并保存语音交互进度,在电子设备远离噪声源之后,再根据保存的语音交互进度继续进行语音交互,从而可以在减少题目中用户需要通过语音重复输入的部分或者在用户再次听取电子设备播放的音频信息时减少用户的等待时间,从而可以提高语音搜题的效率,改善用户体验。
更进一步可选的,上述的处理单元306用于从获取单元305获取到的搜题语音中识别出待搜索问题的方式具体可以为:
处理单元306,用于从获取单元305获取到的搜题语音中分离出与预设的用户声纹特征相匹配的子信号,从该子信号中识别出待搜索问题。
实施图4所示的电子设备,可以根据不同情景下实时检测到的外界声音定位外界声音音源,并输出提示用户向背离外界声音音源方向移动的提示信息,降低外界声音对人机语音搜题的干扰,不仅提高了包含家教机在内的电子设备的语音识别准确率,而且提升了语音搜题效率;进一步地,实施图4所示的电子设备,还可以即时保存正在进行的语音交互进度,在电子设备远离外界声音音源之后,再根据保存的语音交互进度继续进行语音交互,可以提高语音搜题的效率,改善用户体验。
实施例五
请参阅图5,图5是本发明实施例公开的另一种电子设备的结构示意图。如图5所示,该电子设备可以包括:
存储有可执行程序代码的存储器501;
与存储器501耦合的处理器502;
其中,处理器502调用存储器501中存储的可执行程序代码,执行图1或图2所示的语音搜题方法。
需要说明的是,图5所示的电子设备还可以包括电源、输入按键、摄像头、扬声器、屏幕、RF电路、Wi-Fi模块、蓝牙模块、传感器等未显示的组件,本实施例不作赘述。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行图1或图2所示的语音搜题方法。
本发明实施例公开一种计算机程序产品,该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,且该计算机程序可操作来使计算机执行图1或图2所示的语音搜题方法。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定特征、结构或特性可以以任意适合的方式结合在一个或多个实施例中。本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在本发明的各种实施例中,应理解,上述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物单元,即可位于一个地方,或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例上述方法的部分或全部步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种语音搜题方法及电子设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种语音搜题方法,其特征在于,包括:
检测电子设备当前所处环境的外界第一声音,其中,所述当前所处环境包括以下至少一项:卧室、自习室、客厅、校园操场;
判断所述外界第一声音的当前分贝是否大于预设的分贝阈值;
若所述外界第一声音的当前分贝大于所述分贝阈值,确定所述外界第一声音的音源位置并输出用于提示用户向背离所述音源位置的方向移动的提示信息;
实时检测所述电子设备与所述外界第一声音的音源位置的相对距离并判断所述相对距离是否大于预设的距离阈值,其中,所述距离阈值的取值是根据所述当前所处环境确定的;
若所述相对距离大于所述距离阈值,获取用户输入的第一语音作为搜题语音;
从所述搜题语音中识别出待搜索问题并搜索与所述待搜索问题相匹配的答案信息;
输出所述答案信息。
2.根据权利要求1所述的方法,其特征在于,在判断出所述相对距离大于所述距离阈值之后,以及在所述获取用户输入的第一语音作为搜题语音之前,所述方法还包括:
检测所述电子设备当前所处环境的外界第二声音;
判断所述外界第二声音的当前分贝是否小于所述分贝阈值;
若所述外界第二声音的当前分贝小于所述分贝阈值,执行所述获取用户输入第一语音作为搜题语音。
3.根据权利要求2所述的方法,其特征在于,在判断出所述外界第一声音的当前分贝大于所述分贝阈值之后,以及在所述输出用于提示用户向背离所述音源位置的方向移动的提示信息之前,所述方法还包括:
检测当前时刻是否正在接收用户输入的第二语音,如果是,保存所述第二语音;
以及,在判断出所述外界第二声音的当前分贝小于所述分贝阈值之后,所述获取用户输入的第一语音作为搜题语音,包括:
获取用户输入的第一语音以及保存的所述第二语音,根据所述第一语音与所述第二语音的共有部分,将所述第一语音与所述第二语音整合为一有序整体语音,并将所述有序整体语音确定为搜题语音。
4.根据权利要求2所述的方法,其特征在于,在判断出所述外界第一声音的当前分贝大于所述分贝阈值之后,以及在所述输出用于提示用户向背离所述音源位置的方向移动的提示信息之前,所述方法还包括:
检测当前时刻是否正在播放音频信息,如果是,记录所述音频信息在当前时刻的播放进度;
以及,在判断出所述外界第二声音的当前分贝小于所述分贝阈值之后,所述方法还包括:
读取所述音频信息的所述播放进度,并按照所述播放进度继续播放所述音频信息。
5.根据权利要求1~4任一项所述的方法,其特征在于,所述从所述搜题语音中识别出待搜索问题,包括:
从所述搜题语音中分离出与预设的用户声纹特征相匹配的子信号,从所述子信号中识别出待搜索问题。
6.一种电子设备,其特征在于,包括:
第一检测单元,用于检测所述电子设备当前所处环境的外界第一声音,其中,所述当前所处环境包括以下至少一项:卧室、自习室、客厅、校园操场;
第一判断单元,用于判断所述外界第一声音的当前分贝是否大于预设的分贝阈值;
提示单元,用于在所述第一判断单元判断出所述外界第一声音的当前分贝大于所述分贝阈值之后,确定所述外界第一声音的音源位置并输出用于提示用户向背离所述音源位置的方向移动的提示信息;
第二判断单元,用于实时检测所述电子设备与所述外界第一声音的音源位置的相对距离并判断所述相对距离是否大于预设的距离阈值,其中,所述距离阈值的取值是根据所述当前所处环境确定的;
获取单元,用于在所述第二判断单元判断出所述相对距离大于所述距离阈值之后,获取用户输入的第一语音作为搜题语音;
处理单元,用于从所述搜题语音中识别出待搜索问题并搜索与所述待搜索问题相匹配的答案信息;
输出单元,用于输出所述答案信息。
7.根据权利要求6所述的电子设备,其特征在于:
所述第一检测单元,还用于在所述第二判断单元判断出所述相对距离大于所述距离阈值之后,以及在所述获取单元获取用户输入的第一语音作为搜题语音之前,检测所述电子设备当前所处环境的外界第二声音;
所述第一判断单元,还用于判断所述外界第二声音的当前分贝是否小于所述分贝阈值;
所述获取单元,具体用于在所述第二判断单元判断出所述相对距离大于所述距离阈值并且所述第一判断单元判断出所述外界第二声音的当前分贝小于所述分贝阈值之后,获取用户输入的第一语音作为搜题语音。
8.根据权利要求7所述的电子设备,其特征在于,所述电子设备还包括:
第二检测单元,用于在所述第一判断单元判断出所述外界第一声音的当前分贝大于所述分贝阈值之后,以及在所述提示单元输出用于提示用户向背离所述音源位置的方向移动的提示信息之前,检测当前时刻是否正在接收用户输入的第二语音;
存储单元,用于在所述第二检测单元检测到当前时刻正在接收所述第二语音时,保存所述第二语音;
所述获取单元用于在所述第二判断单元判断出所述相对距离大于所述距离阈值并且所述第一判断单元判断出所述外界第二声音的当前分贝小于所述分贝阈值之后,获取用户输入的第一语音作为搜题语音的方式具体为:
所述获取单元,用于在所述第二判断单元判断出所述相对距离大于所述距离阈值并且所述第一判断单元判断出所述外界第二声音的当前分贝小于所述分贝阈值之后,获取用户输入的第一语音以及保存的所述第二语音,根据所述第一语音与所述第二语音的共有部分,将所述第一语音与所述第二语音整合为一有序整体语音,并将所述有序整体语音确定为搜题语音。
9.根据权利要求8所述的电子设备,其特征在于:
所述第二检测单元,还用于在所述第一判断单元判断出所述外界第一声音的当前分贝大于所述分贝阈值之后,以及在所述提示单元输出用于提示用户向背离所述音源位置的方向移动的提示信息之前,检测当前时刻是否正在输出音频信息;
以及,所述电子设备还包括:
记录单元,用于在所述第二检测单元检测到当前时刻正在播放所述音频信息时,记录所述音频信息在当前时刻的播放进度;
所述输出单元,用于在所述第一判断单元判断出所述外界第二声音的当前分贝小于所述分贝阈值之后,读取所述音频信息的所述播放进度,并按照所述播放进度继续播放所述音频信息。
10.根据权利要求6~9任一项所述的电子设备,其特征在于,所述处理单元用于从所述搜题语音中识别出待搜索问题的方式具体为:
所述处理单元,用于从所述搜题语音中分离出与预设的用户声纹特征相匹配的子信号,从所述子信号中识别出待搜索问题。
CN201811002306.5A 2018-08-30 2018-08-30 一种语音搜题方法及电子设备 Active CN109271480B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811002306.5A CN109271480B (zh) 2018-08-30 2018-08-30 一种语音搜题方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811002306.5A CN109271480B (zh) 2018-08-30 2018-08-30 一种语音搜题方法及电子设备

Publications (2)

Publication Number Publication Date
CN109271480A CN109271480A (zh) 2019-01-25
CN109271480B true CN109271480B (zh) 2021-06-01

Family

ID=65154576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811002306.5A Active CN109271480B (zh) 2018-08-30 2018-08-30 一种语音搜题方法及电子设备

Country Status (1)

Country Link
CN (1) CN109271480B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111081080B (zh) * 2019-05-29 2022-05-03 广东小天才科技有限公司 一种语音检测方法及学习设备
CN112836226B (zh) * 2021-02-07 2023-04-18 重庆满集网络科技有限公司 用于外勤业务员的任务管理系统及方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103677234B (zh) * 2012-09-17 2016-12-21 联想(北京)有限公司 一种信息处理的方法及电子设备
CN103077727A (zh) * 2013-01-04 2013-05-01 华为技术有限公司 一种用于语音质量监测和提示的方法和装置
US10269352B2 (en) * 2016-12-23 2019-04-23 Nice Ltd. System and method for detecting phonetically similar imposter phrases
CN107331405A (zh) * 2017-06-30 2017-11-07 深圳市金立通信设备有限公司 一种语音信息处理方法及服务器
CN107967333A (zh) * 2017-11-28 2018-04-27 广东小天才科技有限公司 语音搜索方法、语音搜索装置及电子设备
CN107908801A (zh) * 2017-12-25 2018-04-13 广东小天才科技有限公司 一种基于语音的题目搜索方法及电子设备

Also Published As

Publication number Publication date
CN109271480A (zh) 2019-01-25

Similar Documents

Publication Publication Date Title
US12026241B2 (en) Detection of replay attack
EP3611895B1 (en) Method and device for user registration, and electronic device
CN102568478B (zh) 一种基于语音识别的视频播放控制方法和系统
CN106463112B (zh) 语音识别方法、语音唤醒装置、语音识别装置及终端
CN107274916B (zh) 基于声纹信息对音频/视频文件进行操作的方法及装置
JP2019117623A (ja) 音声対話方法、装置、デバイス及び記憶媒体
CN104123115A (zh) 一种音频信息处理方法及电子设备
CN110581915B (zh) 稳定性测试方法、装置、存储介质及电子设备
CN111343028A (zh) 配网控制方法及装置
CN109065036A (zh) 语音识别的方法、装置、电子设备及计算机可读存储介质
CN109271480B (zh) 一种语音搜题方法及电子设备
CN111724781A (zh) 音频数据的存储方法、装置、终端及存储介质
US10424292B1 (en) System for recognizing and responding to environmental noises
CN111161746A (zh) 声纹注册方法及系统
CN107977187B (zh) 一种混响调节方法及电子设备
CN110660393B (zh) 语音交互方法、装置、设备及存储介质
CN113709291A (zh) 音频处理方法、装置、电子设备及可读存储介质
CN110197663B (zh) 一种控制方法、装置及电子设备
CN108899011A (zh) 一种空调的语音功能测试方法、装置和系统
US10818298B2 (en) Audio processing
CN110660385A (zh) 一种命令词检测方法及电子设备
CN113270099B (zh) 智能语音提取方法、装置、电子设备及存储介质
Joshi et al. Voice recognition system
CN112820281B (zh) 一种语音识别方法、装置及设备
CN114999457A (zh) 语音系统的测试方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant