CN111276141A - 语音交互方法、装置、存储介质、处理器和电子设备 - Google Patents
语音交互方法、装置、存储介质、处理器和电子设备 Download PDFInfo
- Publication number
- CN111276141A CN111276141A CN202010062735.2A CN202010062735A CN111276141A CN 111276141 A CN111276141 A CN 111276141A CN 202010062735 A CN202010062735 A CN 202010062735A CN 111276141 A CN111276141 A CN 111276141A
- Authority
- CN
- China
- Prior art keywords
- voice
- frequency
- preset
- noise
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 110
- 238000000034 method Methods 0.000 title claims abstract description 81
- 238000012545 processing Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000010411 cooking Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请提供了一种语音交互方法、装置、存储介质、处理器和电子设备,该语音交互方法包括:接收用户发出的预定语音指令,进入唤醒状态;根据预定语音指令,在预定时间内识别语音控制指令;根据语音控制指令执行预定步骤。该方法根据预定语音指令从噪声环境中识别用户发出语音,并在预定时间识别语音中包含的语音控制指令,以避免噪声干扰并提高交互效率,最后根据语音控制指令执行预定步骤,从而实现高效且准确语音交互,便于用户控制厨房产品,提高用户使用体验。
Description
技术领域
本申请涉及语音交互技术领域,具体而言,涉及一种语音交互方法、装置、存储介质、处理器和电子设备。
背景技术
随着智能家居的高速发展,智慧厨房也是人们关注的一个热点,目前语音技术也逐渐走入人们的生活,家用电器都逐步的增加了语音接口,开启了语音交互。
在厨房场景中可能会有炒菜产生的噪音、可能会有人们聊天说话的声音,而厨房场景的语音交互因为这些噪声而受到干扰,产品有可能识别不出用户的指令,从而没有执行用户想要的程序,也有可能在执行完预定程序后,产品播报了告知用户程序执行完的语音内容,但是用户没有听到。
在背景技术部分中公开的以上信息只是用来加强对本文所描述技术的背景技术的理解,因此,背景技术中可能包含某些信息,这些信息对于本领域技术人员来说并未形成在本国已知的现有技术。
发明内容
本申请的主要目的在于提供一种语音交互方法、装置、存储介质、处理器和电子设备,以解决现有技术中的厨房产品在语音交互中由于噪声的干扰而导致的交互效率较低的问题。
根据本发明实施例的一个方面,提供了一种语音交互方法,包括:接收用户发出的预定语音指令,进入唤醒状态;根据所述预定语音指令,在预定时间内识别语音控制指令;根据所述语音控制指令执行预定步骤。
进一步地,根据所述预定语音指令,在预定时间内识别语音控制指令,包括:获取所述预定语音指令对应的预定声纹;在所述预定时间内,识别声纹为所述预定声纹的指令为所述语音控制指令。
进一步地,在所述预定时间内,识别声纹为所述预定声纹的指令为所述控制指令,包括:在所述预定时间内,获取具有所述预定声纹的语句;确定所述语句是否为语音指令;在所述语句为所述语音指令的情况下,确定所述语句为所述语音控制指令。
进一步地,确定所述语句是否为语音指令,包括:将所述语句转化为文本信息;确定所述文本信息是否为指令语句;在所述文本信息为所述指令语句的情况下,确定所述语句为所述语音指令。
进一步地,所述方法还包括:获取预定区域内的声音频率信息;根据预定关系以及所述声音频率信息确定语音播报的频率,所述预定关系为所述声音频率信息与所述语音播报的频率的关系;按照确定的频率进行语音播报。
进一步地,在根据所述声音频率信息确定播报声音的频率之前,所述方法还包括:确定所述预定关系,并保存。
进一步地,确定所述预定关系,包括:将预定频率段的噪声按照频率分为多个噪声段;确定各所述噪声段对应的所述语音播报的频率,得到所述噪声段的频率与所述语音播报的频率的关系;根据多个所述噪声段的频率与对应所述语音播报的频率的关系,确定所述预定关系。
进一步地,将预定频率段的噪声按照频率分为多个噪声段,包括:将预定频率段的噪声按照频率分为第一噪声段、第二噪声段、第三噪声段和第四噪声段,其中,所述第一噪声段的频率为f1,0≤f1≤200Hz,所述第二噪声段的频率为f2,200Hz<f2≤400Hz,所述第三噪声段的频率为f3,400Hz<f2≤600Hz,所述第四噪声段的频率为f4,600Hz<f4≤1000Hz。
进一步地,所述语音播报的频率为人声频率,确定各所述噪声段对应的所述语音播报的频率,包括:在所述声音频率信息对应的频率位于所述第一噪声段范围内的情况下,确定所述语音播报为男低音或者女低音;在所述声音频率信息对应的频率位于所述第二噪声段范围内的情况下,确定所述语音播报为男中音或者女中音;在所述声音频率信息对应的频率位于所述第三噪声段范围内的情况下,确定所述语音播报为男高音;在所述声音频率信息对应的频率位于所述第四噪声段范围内的情况下,确定所述语音播报为女高音。
进一步地,所述语音交互方法应用在厨房产品中。
根据本发明实施例的另一方面,还提供了一种语音交互方法,所述方法包括:获取预定区域内的声音频率信息;根据预定关系以及所述声音频率信息确定语音播报的频率,所述预定关系为所述声音频率信息与所述语音播报的频率的关系;按照确定的频率进行语音播报。
根据本发明实施例的再一方面,还提供了一种语音交互装置,包括:接收单元,用于接收用户发出的预定语音指令,进入唤醒状态;识别单元,用于根据所述预定语音指令,在预定时间内识别语音控制指令;执行单元,用于根据所述语音控制指令执行预定步骤。
根据本发明实施例的又一方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,所述程序执行任意一种所述的语音交互方法。
根据本发明实施例的另一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行任意一种所述的语音交互方法。
根据本发明实施例的又一方面,还提供了一种电子设备,包括:一个或多个处理器,存储器,显示装置以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行任意一种所述的语音交互方法。
在本发明实施例中,上述语音交互方法中,首先接收用户发出的预定语音指令,进入唤醒状态,即在接收到预定语音指令的情况下进入唤醒状态,以开启语音交互模式,然后根据预定语音指令,在预定时间内识别语音控制指令,即根据预定语音指令从噪声环境中识别用户发出语音,并在预定时间识别语音中包含的语音控制指令,以避免噪声干扰并提高交互效率,最后根据语音控制指令执行预定步骤,从而实现高效且准确语音交互,便于用户控制厨房产品,提高用户使用体验。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了根据本申请的一种实施例的语音交互方法的流程图;
图2示出了根据本申请的一种实施例的唤醒和识别的逻辑图;
图3示出了根据本申请的一种实施例的语音播报的逻辑图;
图4示出了根据本申请的另一种实施例的语音交互方法的流程图;以及
图5示出了根据本申请的一种实施例的语音交互装置的结构示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应该理解的是,当元件(诸如层、膜、区域、或衬底)描述为在另一元件“上”时,该元件可直接在该另一元件上,或者也可存在中间元件。而且,在说明书以及权利要求书中,当描述有元件“连接”至另一元件时,该元件可“直接连接”至该另一元件,或者通过第三元件“连接”至该另一元件。
正如背景技术中所说的,现有技术中的厨房产品在语音交互中由于噪声的干扰而导致的交互效率较低,为了解决上述问题,本申请的一种典型的实施方式中,提供了一种语音交互方法、装置、存储介质、处理器和电子设备。
根据本申请的实施例,提供了一种语音交互方法。
图1是根据本申请实施例的语音交互方法的流程图。如图1所示,该方法包括以下步骤:
步骤S101,接收用户发出的预定语音指令,进入唤醒状态;
步骤S102,根据上述预定语音指令,在预定时间内识别语音控制指令;
步骤S103,根据上述语音控制指令执行预定步骤。
上述语音交互方法中,首先接收用户发出的预定语音指令,进入唤醒状态,即在接收到预定语音指令的情况下进入唤醒状态,以开启语音交互模式,然后根据预定语音指令,在预定时间内识别语音控制指令,即根据预定语音指令从噪声环境中识别用户发出语音,并在预定时间识别语音中包含的语音控制指令,以避免噪声干扰并提高交互效率,最后根据语音控制指令执行预定步骤,从而实现高效且准确语音交互,便于用户控制厨房产品,提高用户使用体验。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
需要说明的是,本领域技术人员可以根据实际情况选择合适的预定语音指令,例如,预定语音指令为“开机”,本领域技术人员可以根据实际情况选择合适的预定时间,例如,30s。
本申请的一种实施例中,根据上述预定语音指令,在预定时间内识别语音控制指令,包括:获取上述预定语音指令对应的预定声纹;在上述预定时间内,识别声纹为上述预定声纹的指令为上述语音控制指令。具体地,上述方法通过识别预定语音指令对应的预定声纹,确定预定声纹对应的指令为用户发出的语音控制指令,从而有效避免噪音干扰,进而准确识别用户的语音控制指令。
本申请的一种实施例中,在上述预定时间内,识别声纹为上述预定声纹的指令为上述控制指令,包括:在上述预定时间内,获取具有上述预定声纹的语句;确定上述语句是否为语音指令;在上述语句为上述语音指令的情况下,确定上述语句为上述语音控制指令。具体地,将获取具有预定声纹的语句的时间限定在预定时间内,减少语音识别的工作量,提高语音交互的效率,并且通过判断语句是否为语音指令,避免将用户交谈的语音确定为语音控制指令,提高语音交互的识别效率和识别准确性。
需要说明的是,上述语音指令为指令语句,本领域技术人员可以实际情况选择合适的指令语句,例如,“开灯”,“抽风”等。
本申请的一种实施例中,确定上述语句是否为语音指令,包括:将上述语句转化为文本信息;确定上述文本信息是否为指令语句;在上述文本信息为上述指令语句的情况下,确定上述语句为上述语音指令。具体地,上述方法通过将语句转换为文本信息来确定文本信息是否为指令语句,即将文本信息与所有预设的指令语句进行比对,在指令语句包含该文本信息的情况下,确定文本信息为指令语句,进而确定该文本信息对应的语句为语音控制指令。
更为具体地,如图2所示,唤醒状态下,保存预定语音指令的声纹,即保存预定声纹,在预定时间内,接收预定区域内的语句,判断语句的声纹与预定声纹是否匹配,在匹配的情况下,将语句通过语音识别转化为文本信息,通过文本信息确定文本信息对应的语句为语音控制指令,若是,则根据语音控制指令执行预定步骤。
在实际的语音交互过程中,安静的环境下,语音播报的频率过高会导致用户感觉声音刺耳,而在嘈杂的环境中,语音播报的频率过低会导致用户难以听清语音播报的内容,造成语音交互障碍,因此,噪声的频率对语音播报具有很大的影响。
为了进一步降低噪声对语音播报的影响,本申请的一种实施例中,上述方法还包括:获取预定区域内的声音频率信息;根据预定关系以及上述声音频率信息确定语音播报的频率,上述预定关系为上述声音频率信息与上述语音播报的频率的关系;按照确定的频率进行语音播报。具体地,上述方法通过采集预定区域内的声音频率信息,即采集预定区域内的噪声的频率,根据噪声的频率音播报的频率的关系确定合适的语音播报的频率,以保证用户既不会感觉刺耳也不会难以听清播报内容。
需要说明的是,上述的步骤可以在根据上述语音控制指令执行预定步骤之前,也可以在根据上述语音控制指令执行预定步骤之后。
本申请的一种实施例中,在根据上述声音频率信息确定播报声音的频率之前,上述方法还包括:确定上述预定关系,并保存。具体地,噪声按照声音的频率可以分为低频噪声、中频噪声和高频噪声,低频噪声的频率小于400Hz,中频噪声的频率为400~1000Hz,高频噪声大于1000Hz,确定各噪声的频率区间对应的语音播报的频率,使得用户既不会感觉刺耳也不会难以听清播报内容,上述预定关系为各噪声的频率区间对应的语音播报的频率之间的对应关系。
本申请的一种实施例中,确定上述预定关系,包括:将预定频率段的噪声按照频率分为多个噪声段;确定各上述噪声段对应的上述语音播报的频率,得到上述噪声段的频率与上述语音播报的频率的关系;根据多个上述噪声段的频率与对应上述语音播报的频率的关系,确定上述预定关系。具体地,本领域技术人员可以根据实际情况选择划分合适的噪声段,确定各噪声段对应的语音播报的频率,以保证任意一个噪声段对应的语音播报的频率,均可以保证用户既不会感觉刺耳也不会难以听清播报内容。
本申请的一种实施例中,将预定频率段的噪声按照频率分为多个噪声段,包括:将预定频率段的噪声按照频率分为第一噪声段、第二噪声段、第三噪声段和第四噪声段,其中,上述第一噪声段的频率为f1,0≤f1≤200Hz,上述第二噪声段的频率为f2,200Hz<f2≤400Hz,上述第三噪声段的频率为f3,400Hz<f2≤600Hz,上述第四噪声段的频率为f4,600Hz<f4≤1000Hz。具体地,将噪声按照频率分为上述多个噪声段,便于后续选择合适的语音播报的频率,进一步保证用户既不会感觉刺耳也不会难以听清播报内容。当然,上述多个噪声段不限于此,本领域技术人员可以根据实际分为其他合适的噪声段。
本申请的一种实施例中,上述语音播报的频率为人声频率,确定各上述噪声段对应的上述语音播报的频率,包括:在上述声音频率信息对应的频率位于上述第一噪声段范围内的情况下,确定上述语音播报为男低音或者女低音;在上述声音频率信息对应的频率位于上述第二噪声段范围内的情况下,确定上述语音播报为男中音或者女中音;在上述声音频率信息对应的频率位于上述第三噪声段范围内的情况下,确定上述语音播报为男高音;在上述声音频率信息对应的频率位于上述第四噪声段范围内的情况下,确定上述语音播报为女高音。具体地,采用人声频率作为语音播报的频率可以提高用户的舒适度,人声频率包括:男低音为82~392Hz,男中音为123~493Hz,男高音为164~698Hz,女低音为82~392Hz,女中音为123~493Hz,女高音为220~1.1KHz,即从上述人声频率范围内选择合适的语音播报的频率。
更为具体地,如图3所示,采用预定区间长度对0~1000Hz的噪声频率进行分段,例如,预定区间长度为50Hz,对各个区间的噪声频率选择合适的人声频率存到数据库中,得到各噪声的频率区间对应的语音播报的频率之间的预定关系,从而根据采集的预定区域内的声音频率信息,并判段声音频率信息对应的噪声段,然后通过数据库查询确定合适的语音播报的频率,以保证用户既不会感觉刺耳也不会难以听清播报内容。
本申请的一种实施例中,上述语音交互方法应用在厨房产品中。具体地,由于厨房中的噪声较多,例如,炒菜的声音、聊天的声音等,将上述语音交互方法应用在厨房产品中,可以避免噪声的干扰,提高厨房产品语音交互效率,提高用户体验。
本申请的实例中,还提供了另一种语音交互方法,图4是根据本申请实施例的语音交互方法的流程图。如图4所示,该方法包括以下步骤:
步骤S201,获取预定区域内的声音频率信息;
步骤S202,根据预定关系以及上述声音频率信息确定语音播报的频率,上述预定关系为上述声音频率信息与上述语音播报的频率的关系;
步骤S203,按照确定的频率进行语音播报。
上述语音交互方法中,首先获取预定区域内的声音频率信息,然后根据预定关系以及上述声音频率信息确定语音播报的频率,上述预定关系为上述声音频率信息与上述语音播报的频率的关系,最后按照确定的频率进行语音播报。该方法通过采集预定区域内的声音频率信息,即采集预定区域内的噪声的频率,根据噪声的频率音播报的频率的关系确定合适的语音播报的频率,以保证用户既不会感觉刺耳也不会难以听清播报内容。
本申请的一种实施例中,在根据预定关系以及上述声音频率信息确定语音播报的频率之前,上述方法还包括:确定上述预定关系,并保存。具体地,噪声按照声音的频率可以分为低频噪声、中频噪声和高频噪声,低频噪声的频率小于400Hz,中频噪声的频率为400~1000Hz,高频噪声大于1000Hz,确定各噪声的频率区间对应的语音播报的频率,使得用户既不会感觉刺耳也不会难以听清播报内容,上述预定关系为各噪声的频率区间对应的语音播报的频率之间的对应关系。
本申请的一种实施例中,确定上述预定关系,包括:将预定频率段的噪声按照频率分为多个噪声段;确定各上述噪声段对应的上述语音播报的频率,得到上述噪声段的频率与上述语音播报的频率的关系;根据多个上述噪声段的频率与对应上述语音播报的频率的关系,确定上述预定关系。具体地,本领域技术人员可以根据实际情况选择划分合适的噪声段,确定各噪声段对应的语音播报的频率,以保证任意一个噪声段对应的语音播报的频率,均可以保证用户既不会感觉刺耳也不会难以听清播报内容。
本申请的一种实施例中,将预定频率段的噪声按照频率分为多个噪声段,包括:将预定频率段的噪声按照频率分为第一噪声段、第二噪声段、第三噪声段和第四噪声段,其中,上述第一噪声段的频率为f1,0≤f1≤200Hz,上述第二噪声段的频率为f2,200Hz<f2≤400Hz,上述第三噪声段的频率为f3,400Hz<f2≤600Hz,上述第四噪声段的频率为f4,600Hz<f4≤1000Hz。具体地,将噪声按照频率分为上述多个噪声段,便于后续选择合适的语音播报的频率,进一步保证用户既不会感觉刺耳也不会难以听清播报内容。当然,上述多个噪声段不限于此,本领域技术人员可以根据实际分为其他合适的噪声段。
本申请的一种实施例中,上述语音播报的频率为人声频率,确定各上述噪声段对应的上述语音播报的频率,包括:在上述声音频率信息对应的频率位于上述第一噪声段范围内的情况下,确定上述语音播报为男低音或者女低音;在上述声音频率信息对应的频率位于上述第二噪声段范围内的情况下,确定上述语音播报为男中音或者女中音;在上述声音频率信息对应的频率位于上述第三噪声段范围内的情况下,确定上述语音播报为男高音;在上述声音频率信息对应的频率位于上述第四噪声段范围内的情况下,确定上述语音播报为女高音。具体地,采用人声频率作为语音播报的频率可以提高用户的舒适度,人声频率包括:男低音为82~392Hz,男中音为123~493Hz,男高音为164~698Hz,女低音为82~392Hz,女中音为123~493Hz,女高音为220~1.1KHz,即从上述人声频率范围内选择合适的语音播报的频率。
更为具体地,如图3所示,采用预定区间长度对0~1000Hz的噪声频率进行分段,例如,预定区间长度为50Hz,对各个区间的噪声频率选择合适的人声频率存到数据库中,得到各噪声的频率区间对应的语音播报的频率之间的预定关系,从而根据采集的预定区域内的声音频率信息,并判段声音频率信息对应的噪声段,然后通过数据库查询确定合适的语音播报的频率,以保证用户既不会感觉刺耳也不会难以听清播报内容。
本申请的一种实施例中,上述语音交互方法应用在厨房产品中。具体地,由于厨房中的噪声较多,例如,炒菜的声音、聊天的声音等,将上述语音交互方法应用在厨房产品中,可以避免噪声的干扰,提高厨房产品语音交互效率,提高用户体验。
本申请的一种实施例中,上述方法还包括:接收用户发出的预定语音指令,进入唤醒状态;根据上述预定语音指令,在预定时间内识别语音控制指令;根据上述语音控制指令执行预定步骤。具体地,上述方法中,首先接收用户发出的预定语音指令,进入唤醒状态,即在接收到预定语音指令的情况下进入唤醒状态,以开启语音交互模式,然后根据预定语音指令,在预定时间内识别语音控制指令,即根据预定语音指令从噪声环境中识别用户发出语音,并在预定时间识别语音中包含的语音控制指令,以避免噪声干扰并提高交互效率,最后根据语音控制指令执行预定步骤,从而实现高效且准确语音交互,便于用户控制厨房产品,提高用户使用体验。
需要说明的是,本领域技术人员可以根据实际情况选择合适的预定语音指令,例如,预定语音指令为“开机”,本领域技术人员可以根据实际情况选择合适的预定时间,例如,30s。
本申请的一种实施例中,根据上述预定语音指令,在预定时间内识别语音控制指令,包括:获取上述预定语音指令对应的预定声纹;在上述预定时间内,识别声纹为上述预定声纹的指令为上述语音控制指令。具体地,上述方法通过识别预定语音指令对应的预定声纹,确定预定声纹对应的指令为用户发出的语音控制指令,从而有效避免噪音干扰,进而准确识别用户的语音控制指令。
本申请的一种实施例中,在上述预定时间内,识别声纹为上述预定声纹的指令为上述控制指令,包括:在上述预定时间内,获取具有上述预定声纹的语句;确定上述语句是否为语音指令;在上述语句为上述语音指令的情况下,确定上述语句为上述语音控制指令。具体地,将获取具有预定声纹的语句的时间限定在预定时间内,减少语音识别的工作量,提高语音交互的效率,并且通过判断语句是否为语音指令,避免将用户交谈的语音确定为语音控制指令,提高语音交互的识别效率和识别准确性。
需要说明的是,上述语音指令为指令语句,本领域技术人员可以实际情况选择合适的指令语句,例如,“开灯”,“抽风”等。
本申请的一种实施例中,确定上述语句是否为语音指令,包括:将上述语句转化为文本信息;确定上述文本信息是否为指令语句;在上述文本信息为上述指令语句的情况下,确定上述语句为上述语音指令。具体地,上述方法通过将语句转换为文本信息来确定文本信息是否为指令语句,即将文本信息与所有预设的指令语句进行比对,在指令语句包含该文本信息的情况下,确定文本信息为指令语句,进而确定该文本信息对应的语句为语音控制指令。
更为具体地,如图2所示,唤醒状态下,保存预定语音指令的声纹,即保存预定声纹,在预定时间内,接收预定区域内的语句,判断语句的声纹与预定声纹是否匹配,在匹配的情况下,将语句通过语音识别转化为文本信息,通过文本信息确定文本信息对应的语句为语音控制指令,若是,则根据语音控制指令执行预定步骤。
在实际的语音交互过程中,安静的环境下,语音播报的频率过高会导致用户感觉声音刺耳,而在嘈杂的环境中,语音播报的频率过低会导致用户难以听清语音播报的内容,造成语音交互障碍,因此,噪声的频率对语音播报具有很大的影响。
为了进一步降低噪声对语音播报的影响,本申请的一种实施例中,上述方法还包括:获取预定区域内的声音频率信息;根据预定关系以及上述声音频率信息确定语音播报的频率,上述预定关系为上述声音频率信息与上述语音播报的频率的关系;按照确定的频率进行语音播报。具体地,上述方法通过采集预定区域内的声音频率信息,即采集预定区域内的噪声的频率,根据噪声的频率音播报的频率的关系确定合适的语音播报的频率,以保证用户既不会感觉刺耳也不会难以听清播报内容。
需要说明的是,上述的步骤可以在根据上述语音控制指令执行预定步骤之前,也可以在根据上述语音控制指令执行预定步骤之后。
根据本发明实施例还提供了一种语音交互装置,需要说明的是,本发明实施例的语音交互装置可以用于执行本发明实施例所提供的语音交互方法。以下对本发明实施例提供的语音交互装置进行介绍。
图5是根据本发明实施例的语音交互装置的示意图,如图5所示,该装置包括:
接收单元10,用于接收用户发出的预定语音指令,进入唤醒状态;
识别单元20,用于根据上述预定语音指令,在预定时间内识别语音控制指令;
执行单元30,用于根据上述语音控制指令执行预定步骤。
上述语音交互装置中,接收单元接收用户发出的预定语音指令,进入唤醒状态,即在接收到预定语音指令的情况下进入唤醒状态,以开启语音交互模式,识别单元根据预定语音指令,在预定时间内识别语音控制指令,即根据预定语音指令从噪声环境中识别用户发出语音,并在预定时间识别语音中包含的语音控制指令,以避免噪声干扰并提高交互效率,执行单元根据语音控制指令执行预定步骤,从而实现高效且准确语音交互,便于用户控制厨房产品,提高用户使用体验。
需要说明的是,本领域技术人员可以根据实际情况选择合适的预定语音指令,例如,预定语音指令为“开机”,本领域技术人员可以根据实际情况选择合适的预定时间,例如,30s。
本申请的一种实施例中,上述识别单元包括第一获取子单元和识别子单元,其中,上述第一获取子单元用于获取上述预定语音指令对应的预定声纹;上述识别子单元用于在上述预定时间内,识别声纹为上述预定声纹的指令为上述语音控制指令。具体地,上述装置通过识别预定语音指令对应的预定声纹,确定预定声纹对应的指令为用户发出的语音控制指令,从而有效避免噪音干扰,进而准确识别用户的语音控制指令。
本申请的一种实施例中,上述识别子单元包括获取模块、第一确定模块和第二确定模块,其中,上述获取模块用于在上述预定时间内,获取具有上述预定声纹的语句;上述第一确定模块用于确定上述语句是否为语音指令;上述第二确定模块用于在上述语句为上述语音指令的情况下,确定上述语句为上述语音控制指令。具体地,将获取具有预定声纹的语句的时间限定在预定时间内,减少语音识别的工作量,提高语音交互的效率,并且通过判断语句是否为语音指令,避免将用户交谈的语音确定为语音控制指令,提高语音交互的识别效率和识别准确性。
需要说明的是,上述语音指令为指令语句,本领域技术人员可以实际情况选择合适的指令语句,例如,“开灯”,“抽风”等。
本申请的一种实施例中,上述第一确定模块包括处理子模块、第一确定子模块和第二确定子模块,其中,上述处理子模块用于将上述语句转化为文本信息;上述第一确定子模块用于确定上述文本信息是否为指令语句;上述第二确定子模块用于在上述文本信息为上述指令语句的情况下,确定上述语句为上述语音指令。具体地,上述装置通过将语句转换为文本信息来确定文本信息是否为指令语句,即将文本信息与所有预设的指令语句进行比对,在指令语句包含该文本信息的情况下,确定文本信息为指令语句,进而确定该文本信息对应的语句为语音控制指令。
更为具体地,如图2所示,唤醒状态下,保存预定语音指令的声纹,即保存预定声纹,在预定时间内,接收预定区域内的语句,判断语句的声纹与预定声纹是否匹配,在匹配的情况下,将语句通过语音识别转化为文本信息,通过文本信息确定文本信息对应的语句为语音控制指令,若是,则根据语音控制指令执行预定步骤。
在实际的语音交互过程中,安静的环境下,语音播报的频率过高会导致用户感觉声音刺耳,而在嘈杂的环境中,语音播报的频率过低会导致用户难以听清语音播报的内容,造成语音交互障碍,因此,噪声的频率对语音播报具有很大的影响。
为了进一步降低噪声对语音播报的影响,本申请的一种实施例中,上述装置还包括播报单元,上述播报单元包括第二获取子单元、第一确定子单元和执行子单元,其中,上述第二获取子单元用于获取预定区域内的声音频率信息;上述第一确定子单元用于根据预定关系以及上述声音频率信息确定语音播报的频率,上述预定关系为上述声音频率信息与上述语音播报的频率的关系;上述执行子单元用于按照确定的频率进行语音播报。具体地,上述装置通过采集预定区域内的声音频率信息,即采集预定区域内的噪声的频率,根据噪声的频率音播报的频率的关系确定合适的语音播报的频率,以保证用户既不会感觉刺耳也不会难以听清播报内容。
本申请的一种实施例中,上述装置还包括确定单元,上述确定单元用于在根据上述声音频率信息确定播报声音的频率之前,确定上述预定关系,并保存。具体地,噪声按照声音的频率可以分为低频噪声、中频噪声和高频噪声,低频噪声的频率小于400Hz,中频噪声的频率为400~1000Hz,高频噪声大于1000Hz,确定各噪声的频率区间对应的语音播报的频率,使得用户既不会感觉刺耳也不会难以听清播报内容,上述预定关系为各噪声的频率区间对应的语音播报的频率之间的对应关系。
本申请的一种实施例中,上述确定单元包括处理子单元、第二确定子单元和第三确定子单元,其中,上述处理子单元用于将预定频率段的噪声按照频率分为多个噪声段;上述第二确定子单元用于确定各上述噪声段对应的上述语音播报的频率,得到上述噪声段的频率与上述语音播报的频率的关系;上述第三确定子单元用于根据多个上述噪声段的频率与对应上述语音播报的频率的关系,确定上述预定关系。具体地,本领域技术人员可以根据实际情况选择划分合适的噪声段,确定各噪声段对应的语音播报的频率,以保证任意一个噪声段对应的语音播报的频率,均可以保证用户既不会感觉刺耳也不会难以听清播报内容。
本申请的一种实施例中,上述处理子单元包括处理模块,上述处理模块用于将预定频率段的噪声按照频率分为第一噪声段、第二噪声段、第三噪声段和第四噪声段,其中,上述第一噪声段的频率为f1,0≤f1≤200Hz,上述第二噪声段的频率为f2,200Hz<f2≤400Hz,上述第三噪声段的频率为f3,400Hz<f2≤600Hz,上述第四噪声段的频率为f4,600Hz<f4≤1000Hz。具体地,将噪声按照频率分为上述多个噪声段,便于后续选择合适的语音播报的频率,进一步保证用户既不会感觉刺耳也不会难以听清播报内容。当然,上述多个噪声段不限于此,本领域技术人员可以根据实际分为其他合适的噪声段。
本申请的一种实施例中,上述语音播报的频率为人声频率,上述第二确定子单元包括第三确定模块、第四确定模块、第五确定模块和第六确定模块,其中,上述第三确定模块用于在上述声音频率信息对应的频率位于上述第一噪声段范围内的情况下,确定上述语音播报为男低音或者女低音;上述第四确定模块用于在上述声音频率信息对应的频率位于上述第二噪声段范围内的情况下,确定上述语音播报为男中音或者女中音;上述第五确定模块用于在上述声音频率信息对应的频率位于上述第三噪声段范围内的情况下,确定上述语音播报为男高音;上述第六确定模块用于在上述声音频率信息对应的频率位于上述第四噪声段范围内的情况下,确定上述语音播报为女高音。具体地,采用人声频率作为语音播报的频率可以提高用户的舒适度,人声频率包括:男低音为82~392Hz,男中音为123~493Hz,男高音为164~698Hz,女低音为82~392Hz,女中音为123~493Hz,女高音为220~1.1KHz,即从上述人声频率范围内选择合适的语音播报的频率。
更为具体地,如图3所示,采用预定区间长度对0~1000Hz的噪声频率进行分段,例如,预定区间长度为50Hz,对各个区间的噪声频率选择合适的人声频率存到数据库中,得到各噪声的频率区间对应的语音播报的频率之间的预定关系,从而根据采集的预定区域内的声音频率信息,并判段声音频率信息对应的噪声段,然后通过数据库查询确定合适的语音播报的频率,以保证用户既不会感觉刺耳也不会难以听清播报内容。
本申请的一种实施例中,上述语音交互装置应用在厨房产品中。具体地,由于厨房中的噪声较多,例如,炒菜的声音、聊天的声音等,将上述语音交互装置应用在厨房产品中,可以避免噪声的干扰,提高厨房产品语音交互效率,提高用户体验。
本申请的实例中,还提供了一种电子设备,包括:一个或多个处理器,存储器,显示装置以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置为由上述一个或多个处理器执行,上述一个或多个程序包括用于执行任意一种上述的语音交互方法。
上述电子设备中,接收单元接收用户发出的预定语音指令,进入唤醒状态,即在接收到预定语音指令的情况下进入唤醒状态,以开启语音交互模式,识别单元根据预定语音指令,在预定时间内识别语音控制指令,即根据预定语音指令从噪声环境中识别用户发出语音,并在预定时间识别语音中包含的语音控制指令,以避免噪声干扰并提高交互效率,执行单元根据语音控制指令执行预定步骤,从而实现高效且准确语音交互,便于用户控制厨房产品,提高用户使用体验。
上述语音交互装置包括处理器和存储器,上述接收单元、识别单元格执行单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决现有技术中的厨房产品在语音交互中由于噪声的干扰而导致的交互效率较低的问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现上述语音交互方法。
本发明实施例提供了一种处理器,上述处理器用于运行程序,其中,上述程序运行时执行上述语音交互方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现至少以下步骤:
步骤S101,接收用户发出的预定语音指令,进入唤醒状态;
步骤S102,根据上述预定语音指令,在预定时间内识别语音控制指令;
步骤S103,根据上述语音控制指令执行预定步骤。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有至少如下方法步骤的程序:
步骤S101,接收用户发出的预定语音指令,进入唤醒状态;
步骤S102,根据上述预定语音指令,在预定时间内识别语音控制指令;
步骤S103,根据上述语音控制指令执行预定步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例上述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
从以上的描述中,可以看出,本申请上述的实施例实现了如下技术效果:
1)、本申请的语音交互方法中,首先接收用户发出的预定语音指令,进入唤醒状态,即在接收到预定语音指令的情况下进入唤醒状态,以开启语音交互模式,然后根据预定语音指令,在预定时间内识别语音控制指令,即根据预定语音指令从噪声环境中识别用户发出语音,并在预定时间识别语音中包含的语音控制指令,以避免噪声干扰并提高交互效率,最后根据语音控制指令执行预定步骤,从而实现高效且准确语音交互,便于用户控制厨房产品,提高用户使用体验。
2)、本申请的语音交互方法中,首先获取预定区域内的声音频率信息,然后根据预定关系以及上述声音频率信息确定语音播报的频率,上述预定关系为上述声音频率信息与上述语音播报的频率的关系,最后按照确定的频率进行语音播报。该方法通过采集预定区域内的声音频率信息,即采集预定区域内的噪声的频率,根据噪声的频率音播报的频率的关系确定合适的语音播报的频率,以保证用户既不会感觉刺耳也不会难以听清播报内容。
3)、本申请的语音交互装置中,接收单元接收用户发出的预定语音指令,进入唤醒状态,即在接收到预定语音指令的情况下进入唤醒状态,以开启语音交互模式,识别单元根据预定语音指令,在预定时间内识别语音控制指令,即根据预定语音指令从噪声环境中识别用户发出语音,并在预定时间识别语音中包含的语音控制指令,以避免噪声干扰并提高交互效率,执行单元根据语音控制指令执行预定步骤,从而实现高效且准确语音交互,便于用户控制厨房产品,提高用户使用体验。
4)、本申请的电子设备中,接收单元接收用户发出的预定语音指令,进入唤醒状态,即在接收到预定语音指令的情况下进入唤醒状态,以开启语音交互模式,识别单元根据预定语音指令,在预定时间内识别语音控制指令,即根据预定语音指令从噪声环境中识别用户发出语音,并在预定时间识别语音中包含的语音控制指令,以避免噪声干扰并提高交互效率,执行单元根据语音控制指令执行预定步骤,从而实现高效且准确语音交互,便于用户控制厨房产品,提高用户使用体验。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (15)
1.一种语音交互方法,其特征在于,包括:
接收用户发出的预定语音指令,进入唤醒状态;
根据所述预定语音指令,在预定时间内识别语音控制指令;
根据所述语音控制指令执行预定步骤。
2.根据权利要求1所述的方法,其特征在于,根据所述预定语音指令,在预定时间内识别语音控制指令,包括:
获取所述预定语音指令对应的预定声纹;
在所述预定时间内,识别声纹为所述预定声纹的指令为所述语音控制指令。
3.根据权利要求2所述的方法,其特征在于,在所述预定时间内,识别声纹为所述预定声纹的指令为所述控制指令,包括:
在所述预定时间内,获取具有所述预定声纹的语句;
确定所述语句是否为语音指令;
在所述语句为所述语音指令的情况下,确定所述语句为所述语音控制指令。
4.根据权利要求3所述的方法,其特征在于,确定所述语句是否为语音指令,包括:
将所述语句转化为文本信息;
确定所述文本信息是否为指令语句;
在所述文本信息为所述指令语句的情况下,确定所述语句为所述语音指令。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取预定区域内的声音频率信息;
根据预定关系以及所述声音频率信息确定语音播报的频率,所述预定关系为所述声音频率信息与所述语音播报的频率的关系;
按照确定的频率进行语音播报。
6.根据权利要求5所述的方法,其特征在于,在根据所述声音频率信息确定播报声音的频率之前,所述方法还包括:
确定所述预定关系,并保存。
7.根据权利要求6所述的方法,其特征在于,确定所述预定关系,包括:
将预定频率段的噪声按照频率分为多个噪声段;
确定各所述噪声段对应的所述语音播报的频率,得到所述噪声段的频率与所述语音播报的频率的关系;
根据多个所述噪声段的频率与对应所述语音播报的频率的关系,确定所述预定关系。
8.根据权利要求7所述的方法,其特征在于,将预定频率段的噪声按照频率分为多个噪声段,包括:
将预定频率段的噪声按照频率分为第一噪声段、第二噪声段、第三噪声段和第四噪声段,其中,所述第一噪声段的频率为f1,0≤f1≤200Hz,所述第二噪声段的频率为f2,200Hz<f2≤400Hz,所述第三噪声段的频率为f3,400Hz<f2≤600Hz,所述第四噪声段的频率为f4,600Hz<f4≤1000Hz。
9.根据权利要求8所述的方法,其特征在于,所述语音播报的频率为人声频率,确定各所述噪声段对应的所述语音播报的频率,包括:
在所述声音频率信息对应的频率位于所述第一噪声段范围内的情况下,确定所述语音播报为男低音或者女低音;
在所述声音频率信息对应的频率位于所述第二噪声段范围内的情况下,确定所述语音播报为男中音或者女中音;
在所述声音频率信息对应的频率位于所述第三噪声段范围内的情况下,确定所述语音播报为男高音;
在所述声音频率信息对应的频率位于所述第四噪声段范围内的情况下,确定所述语音播报为女高音。
10.根据权利要求1所述的方法,其特征在于,所述语音交互方法应用在厨房产品中。
11.一种语音交互方法,其特征在于,所述方法包括:
获取预定区域内的声音频率信息;
根据预定关系以及所述声音频率信息确定语音播报的频率,所述预定关系为所述声音频率信息与所述语音播报的频率的关系;
按照确定的频率进行语音播报。
12.一种语音交互装置,其特征在于,包括:
接收单元,用于接收用户发出的预定语音指令,进入唤醒状态;
识别单元,用于根据所述预定语音指令,在预定时间内识别语音控制指令;
执行单元,用于根据所述语音控制指令执行预定步骤。
13.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行权利要求1至11中任意一项所述的语音交互方法。
14.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至11中任意一项所述的语音交互方法。
15.一种电子设备,其特征在于,包括:一个或多个处理器,存储器,显示装置以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行权利要求1至11中任意一项所述的语音交互方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010062735.2A CN111276141A (zh) | 2020-01-19 | 2020-01-19 | 语音交互方法、装置、存储介质、处理器和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010062735.2A CN111276141A (zh) | 2020-01-19 | 2020-01-19 | 语音交互方法、装置、存储介质、处理器和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111276141A true CN111276141A (zh) | 2020-06-12 |
Family
ID=71001751
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010062735.2A Pending CN111276141A (zh) | 2020-01-19 | 2020-01-19 | 语音交互方法、装置、存储介质、处理器和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111276141A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113778226A (zh) * | 2021-08-26 | 2021-12-10 | 江西恒必达实业有限公司 | 一种基于语音识别技术控制智能家居的红外ai智能眼镜 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140249817A1 (en) * | 2013-03-04 | 2014-09-04 | Rawles Llc | Identification using Audio Signatures and Additional Characteristics |
CN105810196A (zh) * | 2016-06-02 | 2016-07-27 | 佛山市顺德区美的电热电器制造有限公司 | 烹饪器具的语音控制方法、语音控制装置和烹饪器具 |
CN108062949A (zh) * | 2017-12-11 | 2018-05-22 | 广州朗国电子科技有限公司 | 语音控制跑步机的方法及装置 |
CN108766446A (zh) * | 2018-04-18 | 2018-11-06 | 上海问之信息科技有限公司 | 声纹识别方法、装置、存储介质及音箱 |
CN108766441A (zh) * | 2018-05-29 | 2018-11-06 | 广东声将军科技有限公司 | 一种基于离线声纹识别和语音识别的语音控制方法及装置 |
TWI662544B (zh) * | 2018-05-28 | 2019-06-11 | 塞席爾商元鼎音訊股份有限公司 | 偵測環境噪音以改變播放語音頻率之方法及其聲音播放裝置 |
CN110364156A (zh) * | 2019-08-09 | 2019-10-22 | 广州国音智能科技有限公司 | 语音交互方法、系统、终端及可读存储介质 |
-
2020
- 2020-01-19 CN CN202010062735.2A patent/CN111276141A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140249817A1 (en) * | 2013-03-04 | 2014-09-04 | Rawles Llc | Identification using Audio Signatures and Additional Characteristics |
CN105810196A (zh) * | 2016-06-02 | 2016-07-27 | 佛山市顺德区美的电热电器制造有限公司 | 烹饪器具的语音控制方法、语音控制装置和烹饪器具 |
CN108062949A (zh) * | 2017-12-11 | 2018-05-22 | 广州朗国电子科技有限公司 | 语音控制跑步机的方法及装置 |
CN108766446A (zh) * | 2018-04-18 | 2018-11-06 | 上海问之信息科技有限公司 | 声纹识别方法、装置、存储介质及音箱 |
TWI662544B (zh) * | 2018-05-28 | 2019-06-11 | 塞席爾商元鼎音訊股份有限公司 | 偵測環境噪音以改變播放語音頻率之方法及其聲音播放裝置 |
CN108766441A (zh) * | 2018-05-29 | 2018-11-06 | 广东声将军科技有限公司 | 一种基于离线声纹识别和语音识别的语音控制方法及装置 |
CN110364156A (zh) * | 2019-08-09 | 2019-10-22 | 广州国音智能科技有限公司 | 语音交互方法、系统、终端及可读存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113778226A (zh) * | 2021-08-26 | 2021-12-10 | 江西恒必达实业有限公司 | 一种基于语音识别技术控制智能家居的红外ai智能眼镜 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107704275B (zh) | 智能设备唤醒方法、装置、服务器及智能设备 | |
CN109326289B (zh) | 免唤醒语音交互方法、装置、设备及存储介质 | |
CN107564518B (zh) | 智能设备控制方法、装置及计算机设备 | |
WO2018188586A1 (zh) | 一种用户注册方法、装置及电子设备 | |
EP3547706B1 (en) | Method and device for switching play modes of wireless speaker, and wireless speaker | |
CN108962262B (zh) | 语音数据处理方法和装置 | |
CN109493849A (zh) | 语音唤醒方法、装置及电子设备 | |
CN108711429B (zh) | 电子设备及设备控制方法 | |
JP6783339B2 (ja) | 音声を処理する方法及び装置 | |
CN109166575A (zh) | 智能设备的交互方法、装置、智能设备和存储介质 | |
CN111968644B (zh) | 智能设备唤醒方法、装置及电子设备 | |
CN110782891B (zh) | 一种音频处理方法、装置、计算设备及存储介质 | |
CN110347367A (zh) | 音量调节方法、终端设备、存储介质及电子设备 | |
CN111161714A (zh) | 一种语音信息处理方法、电子设备及存储介质 | |
US20200265843A1 (en) | Speech broadcast method, device and terminal | |
CN110875045A (zh) | 一种语音识别方法、智能设备和智能电视 | |
CN108509225B (zh) | 一种信息处理方法及电子设备 | |
WO2016029849A1 (en) | Left and right brain recognition method and device | |
CN110277092A (zh) | 一种语音播报方法、装置、电子设备及可读存储介质 | |
CN108922522B (zh) | 设备的控制方法、装置、存储介质及电子装置 | |
CN106302930A (zh) | 一种音量的调节方法及调节装置 | |
CN108932947B (zh) | 语音控制方法及家电设备 | |
CN109903748A (zh) | 一种基于自定义语音库的语音合成方法及装置 | |
CN111276141A (zh) | 语音交互方法、装置、存储介质、处理器和电子设备 | |
CN109686372B (zh) | 资源播放控制方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200612 |
|
RJ01 | Rejection of invention patent application after publication |