CN111063356A - 电子设备响应方法及系统、音箱和计算机可读存储介质 - Google Patents

电子设备响应方法及系统、音箱和计算机可读存储介质 Download PDF

Info

Publication number
CN111063356A
CN111063356A CN201811212146.7A CN201811212146A CN111063356A CN 111063356 A CN111063356 A CN 111063356A CN 201811212146 A CN201811212146 A CN 201811212146A CN 111063356 A CN111063356 A CN 111063356A
Authority
CN
China
Prior art keywords
information
command information
input
command
responding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811212146.7A
Other languages
English (en)
Other versions
CN111063356B (zh
Inventor
施国强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
iFlytek Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201811212146.7A priority Critical patent/CN111063356B/zh
Publication of CN111063356A publication Critical patent/CN111063356A/zh
Application granted granted Critical
Publication of CN111063356B publication Critical patent/CN111063356B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72454User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本公开提供了一种电子设备响应方法,包括:获取输入的语音信息;在语音信息包括呼叫信息和命令信息的情况下,判断呼叫信息与命令信息之间的输入时间间隔是否小于或等于预设时长,其中,呼叫信息早于命令信息输入,呼叫信息用于指示电子设备应答用户,命令信息用于指示电子设备执行目标操作,目标操作与应答用户不同;以及在呼叫信息与命令信息之间的输入时间间隔小于或等于预设时长的情况下,响应于命令信息,执行目标操作,而不响应于呼叫信息。本公开还提供了一种电子设备响应系统、一种音箱和一种计算机可读存储介质。

Description

电子设备响应方法及系统、音箱和计算机可读存储介质
技术领域
本公开涉及智能设备技术领域,更具体地,涉及一种电子设备响应方法及系统、音箱和计算机可读存储介质。
背景技术
目前,用户可以通过语音交互方式与智能设备如智能音箱进行交互,例如,用户通过语音控制智能设备播放音乐。一般情况下,用户需要在语音唤醒智能设备之后,用户再发出实质性的命令词。具体地,例如,用户向智能音箱发出唤醒词“叮咚叮咚”,智能音箱接收到唤醒词并被唤醒作出应答之后,用户再发出“帮忙放首歌”的命令词。在这种交互方式下,一方面,如果用户语速较快,在发出唤醒词后紧接着发出命令词,会出现用户和智能设备同时说话的情况,对用户造成干扰。另一方面,在交互过程中强行加入了智能设备反馈的流程,使得整体交互流程繁琐。
因此,在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:
智能设备在响应用户指令时过程复杂,导致交互流程繁琐。
发明内容
有鉴于此,本公开提供了一种电子设备响应方法及系统、音箱和计算机可读存储介质。
本公开的一个方面提供了一种电子设备响应方法,包括获取输入的语音信息;在上述语音信息包括呼叫信息和命令信息的情况下,判断上述呼叫信息与上述命令信息之间的输入时间间隔是否小于或等于预设时长,其中,上述呼叫信息早于上述命令信息输入,上述呼叫信息用于指示上述电子设备应答用户,上述命令信息用于指示上述电子设备执行目标操作,上述目标操作与上述应答用户不同;以及在上述呼叫信息与上述命令信息之间的输入时间间隔小于或等于上述预设时长的情况下,响应于上述命令信息,执行上述目标操作,而不响应于上述呼叫信息。
根据本公开的实施例,上述方法还包括:在上述呼叫信息与上述命令信息之间的输入时间间隔大于上述预设时长的情况下,响应于上述呼叫信息,输出应答信息以应答用户;在响应于上述呼叫信息之后,响应于上述命令信息,执行上述目标操作。
根据本公开的实施例,在判断上述呼叫信息与上述命令信息之间的输入时间间隔是否小于或等于预设时长之前,上述方法还包括:确定上述呼叫信息与上述命令信息之间的输入时间间隔,包括:确定输入上述呼叫信息时的终止时间;确定输入上述命令信息时的起始时间;根据上述终止时间和上述起始时间确定上述输入时间间隔。
根据本公开的实施例,上述方法还包括:在响应于上述命令信息之前,判断上述命令信息是否为噪声;在上述命令信息为噪声的情况下,响应于上述呼叫信息,输出应答信息以应答用户;以及在上述命令信息不是噪声的情况下,响应于上述命令信息,执行上述目标操作。
根据本公开的实施例,上述电子设备包括音箱。
本公开的另一个方面提供了一种电子设备响应系统,包括:获取模块,用于获取输入的语音信息;第一判断模块,用于在上述语音信息包括呼叫信息和命令信息的情况下,判断上述呼叫信息与上述命令信息之间的输入时间间隔是否小于或等于预设时长,其中,上述呼叫信息早于上述命令信息输入,上述呼叫信息用于指示上述电子设备应答用户,上述命令信息用于指示上述电子设备执行目标操作,上述目标操作与上述应答用户不同;以及执行模块,用于在上述呼叫信息与上述命令信息之间的输入时间间隔小于或等于上述预设时长的情况下,响应于上述命令信息,执行上述目标操作,而不响应于上述呼叫信息。
根据本公开的实施例,上述系统还包括:输出模块,用于在上述呼叫信息与上述命令信息之间的输入时间间隔大于上述预设时长的情况下,响应于上述呼叫信息,输出应答信息以应答用户;上述执行模块用于在响应于上述呼叫信息之后,响应于上述命令信息,执行上述目标操作。
根据本公开的实施例,上述系统还包括:确定模块,用于在判断上述呼叫信息与上述命令信息之间的输入时间间隔是否小于或等于预设时长之前,确定上述呼叫信息与上述命令信息之间的输入时间间隔,确定模块包括:第一确定单元,用于确定输入上述呼叫信息时的终止时间;第二确定单元,用于确定输入上述命令信息时的起始时间;第三确定单元,用于根据上述终止时间和上述起始时间确定上述输入时间间隔。
根据本公开的实施例,上述系统还包括:第二判断模块,用于在响应于上述命令信息之前,判断上述命令信息是否为噪声;上述输出模块用于在上述命令信息为噪声的情况下,响应于上述呼叫信息,输出应答信息以应答用户;以及上述执行模块用于在上述命令信息不是噪声的情况下,响应于上述命令信息,执行上述目标操作。
根据本公开的实施例,上述电子设备包括音箱。
本公开的另一个方面提供了一种音箱,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如上所述的电子设备响应方法。
本公开的另一个方面提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现如上所述的电子设备响应方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
根据本公开的实施例,因为采用了通过判断呼叫信息与命令信息之间的输入时间间隔是否小于或等于预设时长,在呼叫信息与命令信息之间的输入时间间隔小于或等于预设时长的情况下,直接执行与命令信息对应的目标操作的技术手段,在这种情况下,由于不响应于呼叫信息以应答用户,所以至少部分地克服了电子设备在响应用户指令时过程复杂,导致交互流程繁琐的技术问题,进而达到了提高电子设备智能程度,提高用户体验的技术效果。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的可以应用电子设备响应方法及系统的示例性应用场景;
图2示意性示出了根据本公开实施例的电子设备响应方法的流程图;
图3示意性示出了根据本公开另一实施例的电子设备响应方法的流程图;
图4示意性示出了根据本公开实施例的确定呼叫信息与命令信息之间的输入时间间隔的流程图;
图5示意性示出了根据本公开另一实施例的电子设备响应方法的流程图;
图6示意性示出了根据本公开实施例的电子设备响应系统的框图;
图7示意性示出了根据本公开另一实施例的电子设备响应系统的框图;以及
图8示意性示出了根据本公开实施例的适于实现上文描述的方法的音箱的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
本公开的实施例提供了一种电子设备响应方法及系统,该方法包括:获取输入的语音信息;在语音信息包括呼叫信息和命令信息的情况下,判断呼叫信息与命令信息之间的输入时间间隔是否小于或等于预设时长,其中,呼叫信息早于命令信息输入,呼叫信息用于指示电子设备应答用户,命令信息用于指示电子设备执行目标操作,目标操作与应答用户不同;以及在呼叫信息与命令信息之间的输入时间间隔小于或等于预设时长的情况下,响应于命令信息,执行目标操作,而不响应于呼叫信息。
图1示意性示出了根据本公开实施例的可以应用电子设备响应方法及系统的示例性应用场景。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的应用场景可以包括电子设备101和用户102。
用户102可以通过语音与第一电子设备101进行交互,例如,用户语音输出“叮咚叮咚,帮忙放首歌。”,第一电子设备101接收到语音信息之后,采用本公开的方法进行响应。
第一电子设备101上可以安装有各种通讯客户端应用,例如购物,娱乐类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。
第一电子设备101可以是各种电子设备,包括但不限于智能音箱、智能手机、平板电脑等等。
需要说明的是,本公开实施例所提供的电子设备响应方法一般可以由第一电子设备101执行。相应地,本公开实施例所提供的电子设备响应系统一般可以设置于第一电子设备101中。本公开实施例所提供的应用于第一电子设备的方法也可以由不同于第一电子设备101且能够与第一电子设备101通信的其它电子设备执行。相应地,本公开实施例所提供的电子设备响应系统也可以设置于不同于第一电子设备101且能够与第一电子设备101通信的其它电子设备中。
应该理解,图1中的电子设备的数目仅仅是示意性的。根据实现需要,可以具有任意数目的电子设备。
图2示意性示出了根据本公开实施例的电子设备响应方法的流程图。
如图2所示,该方法包括操作S210~S230。
在操作S210,获取输入的语音信息。
在操作S220,在语音信息包括呼叫信息和命令信息的情况下,判断呼叫信息与命令信息之间的输入时间间隔是否小于或等于预设时长,其中,呼叫信息早于命令信息输入,呼叫信息用于指示电子设备应答用户,命令信息用于指示电子设备执行目标操作,目标操作与应答用户不同。
根据本公开的实施例,呼叫信息可以是唤醒词,用于唤醒电子设备,例如,电子设备处于休眠状态时,用户输入唤醒词叮咚叮咚,唤醒电子设备进行工作。根据本公开的实施例,呼叫信息也可以是接收命令的启动词,用于提醒电子设备即将有命令信息输出。例如,电子设备处于工作状态时,用户输入启动词“机器人你好”,提醒工作中的电子设备准备接收命令信息。
根据本公开的实施例,命令信息包括用户实际想要进行的操作,即指示电子设备执行的目标操作,例如,命令信息表示用户想要放首歌,用户想要听相声,用户想要打开家里电动控制的窗户等等。
在操作S230,在呼叫信息与命令信息之间的输入时间间隔小于或等于预设时长的情况下,响应于命令信息,执行目标操作,而不响应于呼叫信息。
根据本公开的实施例,在时间间隔非常短的情况下,可以认为用户的呼叫信息与命令信息是连续说的,电子设备可以不做应答,在时间间隔稍长的情况下,可以认为用户唤醒设备后有迟疑,这时才做出应答。在相关技术中,如果用户语速较快,在发出唤醒词后紧接着发出命令词,会出现用户和智能设备同时说话的情况,对用户造成干扰。而本公开可以通过判断用户说话过程中呼叫信息与命令信息之间的间隔时长来决定是否做唤醒后的应答语。
根据本公开的实施例,以电子设备是音箱为例,用户通过语音输入“叮咚叮咚,帮我把电视打开”。其中,“叮咚叮咚”可以是呼叫信息,“帮我把电视打开”可以是命令信息。通过判断“叮咚叮咚”与“帮我把电视打开”之间的输入时间间隔是否小于或等于预设时长,如果小于或等于预设时长,直接执行打开电视的目标操作。
根据本公开的实施例,预设时长可以是通过大量实际数据分析后得到的,例如,可以是1.5秒,2秒等等。
通过本公开的实施例,因为采用了通过判断呼叫信息与命令信息之间的输入时间间隔是否小于或等于预设时长,在呼叫信息与命令信息之间的输入时间间隔小于或等于预设时长的情况下,直接执行与命令信息对应的目标操作的技术手段,在这种情况下,由于不响应于呼叫信息以应答用户,所以至少部分地克服了电子设备在响应用户指令时过程复杂,导致交互流程繁琐的技术问题,进而达到了提高电子设备智能程度,提高用户体验的技术效果。
下面参考图3~图5,结合具体实施例对图2所示的方法做进一步说明。
图3示意性示出了根据本公开另一实施例的电子设备响应方法的流程图。
如图3所示,该电子设备响应方法还包括操作S240~S250。
在操作S240,在呼叫信息与命令信息之间的输入时间间隔大于预设时长的情况下,响应于呼叫信息,输出应答信息以应答用户。
在操作S250,在响应于呼叫信息之后,响应于命令信息,执行目标操作。
根据本公开的实施例,在呼叫信息与命令信息之间的输入时间间隔大于预设时长的情况下,说明用户输入时有迟疑,此时电子设备可以响应于呼叫信息,输出应答信息以应答用户。例如,用户输入叮咚叮咚,电子设备对此响应,输出应答信息“您好,有什么需要帮忙的?”。
通过本公开的实施例,在间隔时间非常短的情况下,可以认为用户的呼叫信息与命令信息是连续说的,不做应答,间隔时间稍长,可以认为用户唤醒设备后有迟疑,这时才做出应答,可以提高用户体验。
根据本公开的实施例,在判断呼叫信息与命令信息之间的输入时间间隔是否小于或等于预设时长之前,还可以确定呼叫信息与命令信息之间的输入时间间隔。
图4示意性示出了根据本公开实施例的确定呼叫信息与命令信息之间的输入时间间隔的流程图。
如图4所示,该方法包括操作S261~S263。
在操作S261,确定输入呼叫信息时的终止时间。
根据本公开的实施例,确定输入呼叫信息时的终止时间可以是通过采集大量的呼叫音频进行数据训练,用以对呼叫音频进行准确的切分,将切分呼叫音频的开始点和结束点的整体误差控制在50ms以内,从而可以检测用户呼叫信息的结束,可以较准确的找到呼叫信息的结束点。
具体地,例如,可以按照如下步骤进行训练,1、先采集大量的用户说“叮咚叮咚”时的录音,由于截取的不够准确,对于结尾的判断往往会误差近0.5s。2、从录音中选取训练集和测试集。3、对训练集中的样本进行人工标注,准确切分到第二个“咚”字的结尾。4、对训练集中的数据使用卷积神经网络CNN进行训练,形成模型。5、使用测试集验证模型,人工评判模型输出的效果,对于误差超过50ms的认为是不通过的。6、分析不通过的测试样本,纠正模型。
在操作S262,确定输入命令信息时的起始时间。
根据本公开的实施例,由于绝大部分用户的应用场景,设备周边还是较安静的,因此如果检测到声音的能量能达到一定的阈值可以认为是用户开始说具体的指令了。因此,通过检测声音的能量可以确定输入命令信息时的起始时间。
在操作S263,根据终止时间和起始时间确定输入时间间隔。
通过本公开的实施例,通过确定输入呼叫信息时的终止时间和输入命令信息时的起始时间,可以较准确的确定呼叫信息与命令信息之间的输入时间间隔。
图5示意性示出了根据本公开另一实施例的电子设备响应方法的流程图。
如图5所示,该方法包括操作S270~S290。
在操作S270,在响应于命令信息之前,判断命令信息是否为噪声。
根据本公开的实施例,可以将命令信息输入训练好的模型中,判断命令信息是否为噪声。具体地,模型训练的步骤如下:先通过TTS合成拼音的发音。可以选取不同性别不同年龄段的共6个典型的发音人,针对不同的拼音,共生成近4000个,这部分样本认为不是噪音。然后,采集不同情况下在家庭环境中较容易出现的噪音样本,这部分样本认为是噪音的。将以上的样本作为训练集,使用卷积神经网络CNN进行训练,形成模型。人工选取测试集,包括部分人说话的声音以及环境噪声。如果测试结果不符合要求,可以采用特定的样本对模型进行修正。
在操作S280,在命令信息为噪声的情况下,响应于呼叫信息,输出应答信息以应答用户。
在操作S290,在命令信息不是噪声的情况下,响应于命令信息,执行目标操作。
通过本公开的实施例,由于可能存在周围环境引起的噪声使得电子设备既不应答用户,也无法执行目标操作的情况,通过判断命令信息是否为噪声,在是情况下,应答用户,可以提高设备的智能度,避免用户以为设备发生故障,在不是的情况,可以响应于命令信息,执行目标操作,或者可以先判断呼叫信息与命令信息之间的时间间隔是否小于或等于预设时长的操作,再确定是应答用户还是直接执行目标操作,提高了用户体验。
图6示意性示出了根据本公开实施例的电子设备响应系统的框图。
如图6所示,电子设备响应系统400包括获取模块410、第一判断模块420和执行模块430。
获取模块410用于获取输入的语音信息。
第一判断模块420用于在语音信息包括呼叫信息和命令信息的情况下,判断呼叫信息与命令信息之间的输入时间间隔是否小于或等于预设时长,其中,呼叫信息早于命令信息输入,呼叫信息用于指示电子设备应答用户,命令信息用于指示电子设备执行目标操作,目标操作与应答用户不同。
执行模块430用于在呼叫信息与命令信息之间的输入时间间隔小于或等于预设时长的情况下,响应于命令信息,执行目标操作,而不响应于呼叫信息。
通过本公开的实施例,因为采用了通过判断呼叫信息与命令信息之间的输入时间间隔是否小于或等于预设时长,在呼叫信息与命令信息之间的输入时间间隔小于或等于预设时长的情况下,直接执行与命令信息对应的目标操作的技术手段,在这种情况下,由于不响应于呼叫信息以应答用户,所以至少部分地克服了电子设备在响应用户指令时过程复杂,导致交互流程繁琐的技术问题,进而达到了提高电子设备智能程度,提高用户体验的技术效果。
图7示意性示出了根据本公开另一实施例的电子设备响应系统的框图。
如图7所示,电子设备响应系统400还包括输出模块440。
输出模块440用于在呼叫信息与命令信息之间的输入时间间隔大于预设时长的情况下,响应于呼叫信息,输出应答信息以应答用户。
执行模块430还用于在响应于呼叫信息之后,响应于命令信息,执行目标操作。
通过本公开的实施例,在间隔时间非常短的情况下,可以认为用户的呼叫信息与命令信息是连续说的,不做应答,间隔时间稍长,可以认为用户唤醒设备后有迟疑,这时才做出应答,可以提高用户体验。
如图7所示,电子设备响应系统400还包括确定模块450。
确定模块450用于在判断呼叫信息与命令信息之间的输入时间间隔是否小于或等于预设时长之前,确定呼叫信息与命令信息之间的输入时间间隔,确定模块450包括第一确定单元451、第二确定单元452和第三确定单元453。
第一确定单元451用于确定输入呼叫信息时的终止时间。
第二确定单元452用于确定输入命令信息时的起始时间。
第三确定单元453用于根据终止时间和起始时间确定输入时间间隔。
通过本公开的实施例,通过确定输入呼叫信息时的终止时间和输入命令信息时的起始时间,可以较准确的确定呼叫信息与命令信息之间的输入时间间隔。
如图7所示,电子设备响应系统400还包括第二判断模块460。
第二判断模块460用于在响应于命令信息之前,判断命令信息是否为噪声。
输出模块440还用于在命令信息为噪声的情况下,响应于呼叫信息,输出应答信息以应答用户。
执行模块430还用于在命令信息不是噪声的情况下,响应于命令信息,执行目标操作。
通过本公开的实施例,由于可能存在周围环境引起的噪声使得电子设备既不应答用户,也无法执行目标操作的情况,通过判断命令信息是否为噪声,在是情况下,应答用户,可以提高设备的智能度,避免用户以为设备发生故障,在不是的情况,可以响应于命令信息,执行目标操作,或者可以先判断呼叫信息与命令信息之间的时间间隔是否小于或等于预设时长的操作,再确定是应答用户还是直接执行目标操作,提高了用户体验。
根据本公开的实施例,电子设备包括音箱。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,获取模块410、第一判断模块420、执行模块430、输出模块440、确定模块450、第二判断模块460、第一确定单元451、第二确定单元452和第三确定单元453中的任意多个可以合并在一个模块/单元/子单元中实现,或者其中的任意一个模块/单元/子单元可以被拆分成多个模块/单元/子单元。或者,这些模块/单元/子单元中的一个或多个模块/单元/子单元的至少部分功能可以与其他模块/单元/子单元的至少部分功能相结合,并在一个模块/单元/子单元中实现。根据本公开的实施例,获取模块410、第一判断模块420、执行模块430、输出模块440、确定模块450、第二判断模块460、第一确定单元451、第二确定单元452和第三确定单元453中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,获取模块410、第一判断模块420、执行模块430、输出模块440、确定模块450、第二判断模块460、第一确定单元451、第二确定单元452和第三确定单元453中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
根据本公开的实施例,还提供了一种音箱,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现所述的电子设备响应方法。
图8示意性示出了根据本公开实施例的适于实现上文描述的方法的音箱的框图。图8示出的音箱仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图8所示,根据本公开实施例的音箱500包括处理器501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。处理器501例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器501还可以包括用于缓存用途的板载存储器。处理器501可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 503中,存储有音箱500操作所需的各种程序和数据。处理器501、ROM 502以及RAM 503通过总线504彼此相连。处理器501通过执行ROM 502和/或RAM 503中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 502和RAM 503以外的一个或多个存储器中。处理器501也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,音箱500还可以包括输入/输出(I/O)接口505,输入/输出(I/O)接口505也连接至总线504。音箱500还可以包括连接至I/O接口505的以下部件中的一项或多项:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被处理器501执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备如音箱中所包含的;也可以是单独存在,而未装配入该设备如音箱中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质。例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、设备如音箱使用或者与其结合使用。
例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 502和/或RAM 503和/或ROM 502和RAM 503以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (12)

1.一种电子设备响应方法,包括:
获取输入的语音信息;
在所述语音信息包括呼叫信息和命令信息的情况下,判断所述呼叫信息与所述命令信息之间的输入时间间隔是否小于或等于预设时长,其中,所述呼叫信息早于所述命令信息输入,所述呼叫信息用于指示所述电子设备应答用户,所述命令信息用于指示所述电子设备执行目标操作,所述目标操作与所述应答用户不同;以及
在所述呼叫信息与所述命令信息之间的输入时间间隔小于或等于所述预设时长的情况下,响应于所述命令信息,执行所述目标操作,而不响应于所述呼叫信息。
2.根据权利要求1所述的方法,其中,所述方法还包括:
在所述呼叫信息与所述命令信息之间的输入时间间隔大于所述预设时长的情况下,响应于所述呼叫信息,输出应答信息以应答用户;
在响应于所述呼叫信息之后,响应于所述命令信息,执行所述目标操作。
3.根据权利要求1所述的方法,其中,在判断所述呼叫信息与所述命令信息之间的输入时间间隔是否小于或等于预设时长之前,所述方法还包括:
确定所述呼叫信息与所述命令信息之间的输入时间间隔,包括:
确定输入所述呼叫信息时的终止时间;
确定输入所述命令信息时的起始时间;
根据所述终止时间和所述起始时间确定所述输入时间间隔。
4.根据权利要求3所述的方法,其中,所述方法还包括:
在响应于所述命令信息之前,判断所述命令信息是否为噪声;
在所述命令信息为噪声的情况下,响应于所述呼叫信息,输出应答信息以应答用户;以及
在所述命令信息不是噪声的情况下,响应于所述命令信息,执行所述目标操作。
5.根据权利要求1所述的方法,其中,所述电子设备包括音箱。
6.一种电子设备响应系统,包括:
获取模块,用于获取输入的语音信息;
第一判断模块,用于在所述语音信息包括呼叫信息和命令信息的情况下,判断所述呼叫信息与所述命令信息之间的输入时间间隔是否小于或等于预设时长,其中,所述呼叫信息早于所述命令信息输入,所述呼叫信息用于指示所述电子设备应答用户,所述命令信息用于指示所述电子设备执行目标操作,所述目标操作与所述应答用户不同;以及
执行模块,用于在所述呼叫信息与所述命令信息之间的输入时间间隔小于或等于所述预设时长的情况下,响应于所述命令信息,执行所述目标操作,而不响应于所述呼叫信息。
7.根据权利要求6所述的系统,其中,所述系统还包括:
输出模块,用于在所述呼叫信息与所述命令信息之间的输入时间间隔大于所述预设时长的情况下,响应于所述呼叫信息,输出应答信息以应答用户;
所述执行模块用于在响应于所述呼叫信息之后,响应于所述命令信息,执行所述目标操作。
8.根据权利要求6所述的系统,其中,所述系统还包括:
确定模块,用于在判断所述呼叫信息与所述命令信息之间的输入时间间隔是否小于或等于预设时长之前,确定所述呼叫信息与所述命令信息之间的输入时间间隔,包括:
第一确定单元,用于确定输入所述呼叫信息时的终止时间;
第二确定单元,用于确定输入所述命令信息时的起始时间;
第三确定单元,用于根据所述终止时间和所述起始时间确定所述输入时间间隔。
9.根据权利要求8所述的系统,其中,所述系统还包括:
第二判断模块,用于在响应于所述命令信息之前,判断所述命令信息是否为噪声;
所述输出模块用于在所述命令信息为噪声的情况下,响应于所述呼叫信息,输出应答信息以应答用户;以及
所述执行模块用于在所述命令信息不是噪声的情况下,响应于所述命令信息,执行所述目标操作。
10.根据权利要求6所述的系统,其中,所述电子设备包括音箱。
11.一种音箱,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至5中任一项所述的电子设备响应方法。
12.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现权利要求1至5中任一项所述的电子设备响应方法。
CN201811212146.7A 2018-10-17 2018-10-17 电子设备响应方法及系统、音箱和计算机可读存储介质 Active CN111063356B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811212146.7A CN111063356B (zh) 2018-10-17 2018-10-17 电子设备响应方法及系统、音箱和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811212146.7A CN111063356B (zh) 2018-10-17 2018-10-17 电子设备响应方法及系统、音箱和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111063356A true CN111063356A (zh) 2020-04-24
CN111063356B CN111063356B (zh) 2023-05-09

Family

ID=70297099

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811212146.7A Active CN111063356B (zh) 2018-10-17 2018-10-17 电子设备响应方法及系统、音箱和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111063356B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111986682A (zh) * 2020-08-31 2020-11-24 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备以及存储介质
CN112037794A (zh) * 2020-08-31 2020-12-04 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备以及存储介质
CN112037786A (zh) * 2020-08-31 2020-12-04 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备以及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140079194A1 (en) * 2012-09-14 2014-03-20 Samsung Electronics Co., Ltd Terminal and method for managing call function
CN104464723A (zh) * 2014-12-16 2015-03-25 科大讯飞股份有限公司 一种语音交互方法及系统
CN104538030A (zh) * 2014-12-11 2015-04-22 科大讯飞股份有限公司 一种可以通过语音控制家电的控制系统与方法
CN105261357A (zh) * 2015-09-15 2016-01-20 百度在线网络技术(北京)有限公司 基于统计模型的语音端点检测方法及装置
CN105869637A (zh) * 2016-05-26 2016-08-17 百度在线网络技术(北京)有限公司 语音唤醒方法和装置
CN106448678A (zh) * 2012-05-29 2017-02-22 三星电子株式会社 用于在电子装置中执行语音命令的方法和设备
CN107895578A (zh) * 2017-11-15 2018-04-10 百度在线网络技术(北京)有限公司 语音交互方法和装置
US20180108357A1 (en) * 2016-10-14 2018-04-19 Beijing Baidu Netcom Science And Technology Co., L Td. Virtual reality speech control method and apparatus
US9953634B1 (en) * 2013-12-17 2018-04-24 Knowles Electronics, Llc Passive training for automatic speech recognition
CN108154878A (zh) * 2017-12-12 2018-06-12 北京小米移动软件有限公司 控制监控设备的方法及装置
CN108428448A (zh) * 2017-02-13 2018-08-21 芋头科技(杭州)有限公司 一种语音端点检测方法及语音识别方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106448678A (zh) * 2012-05-29 2017-02-22 三星电子株式会社 用于在电子装置中执行语音命令的方法和设备
US20140079194A1 (en) * 2012-09-14 2014-03-20 Samsung Electronics Co., Ltd Terminal and method for managing call function
US9953634B1 (en) * 2013-12-17 2018-04-24 Knowles Electronics, Llc Passive training for automatic speech recognition
CN104538030A (zh) * 2014-12-11 2015-04-22 科大讯飞股份有限公司 一种可以通过语音控制家电的控制系统与方法
CN104464723A (zh) * 2014-12-16 2015-03-25 科大讯飞股份有限公司 一种语音交互方法及系统
CN105261357A (zh) * 2015-09-15 2016-01-20 百度在线网络技术(北京)有限公司 基于统计模型的语音端点检测方法及装置
CN105869637A (zh) * 2016-05-26 2016-08-17 百度在线网络技术(北京)有限公司 语音唤醒方法和装置
US20180108357A1 (en) * 2016-10-14 2018-04-19 Beijing Baidu Netcom Science And Technology Co., L Td. Virtual reality speech control method and apparatus
CN108428448A (zh) * 2017-02-13 2018-08-21 芋头科技(杭州)有限公司 一种语音端点检测方法及语音识别方法
CN107895578A (zh) * 2017-11-15 2018-04-10 百度在线网络技术(北京)有限公司 语音交互方法和装置
CN108154878A (zh) * 2017-12-12 2018-06-12 北京小米移动软件有限公司 控制监控设备的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孟猛;王晓瑞;梁家恩;徐波;: "一种基于互补声学模型的多系统融合语音关键词检测方法", 自动化学报 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111986682A (zh) * 2020-08-31 2020-11-24 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备以及存储介质
CN112037794A (zh) * 2020-08-31 2020-12-04 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备以及存储介质
CN112037786A (zh) * 2020-08-31 2020-12-04 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备以及存储介质
CN112037786B (zh) * 2020-08-31 2024-09-24 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
CN111063356B (zh) 2023-05-09

Similar Documents

Publication Publication Date Title
US11502859B2 (en) Method and apparatus for waking up via speech
JP6751433B2 (ja) アプリケーションプログラムをウェイクアップする処理方法、装置及び記憶媒体
US11217230B2 (en) Information processing device and information processing method for determining presence or absence of a response to speech of a user on a basis of a learning result corresponding to a use situation of the user
US20200151258A1 (en) Method, computer device and storage medium for impementing speech interaction
CN107886944B (zh) 一种语音识别方法、装置、设备及存储介质
US11200899B2 (en) Voice processing method, apparatus and device
US11587560B2 (en) Voice interaction method, device, apparatus and server
US20200265843A1 (en) Speech broadcast method, device and terminal
CN111063356B (zh) 电子设备响应方法及系统、音箱和计算机可读存储介质
US11062708B2 (en) Method and apparatus for dialoguing based on a mood of a user
CN110225386A (zh) 一种显示控制方法、显示设备
CN112017650B (zh) 电子设备的语音控制方法、装置、计算机设备和存储介质
CN110706707B (zh) 用于语音交互的方法、装置、设备和计算机可读存储介质
CN113096692B (zh) 语音检测方法及装置、设备、存储介质
US20180166073A1 (en) Speech Recognition Without Interrupting The Playback Audio
US20200211545A1 (en) Voice interaction method, apparatus and device, and storage medium
CN111292737A (zh) 语音交互及语音唤醒检测方法、装置、设备及存储介质
CN111370004A (zh) 人机交互方法、语音处理方法及设备
CN111312243B (zh) 设备交互方法和装置
CN113157240A (zh) 语音处理方法、装置、设备、存储介质及计算机程序产品
CN109686372B (zh) 资源播放控制方法和装置
CN108492826B (zh) 音频处理方法、装置、智能设备及介质
CN111339881A (zh) 基于情绪识别的宝宝成长监护方法及系统
CN107632813A (zh) 一种关闭闹钟功能的方法及装置
CN109859773A (zh) 一种声音的录制方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant