CN107135445A - 一种信息处理方法及电子设备 - Google Patents
一种信息处理方法及电子设备 Download PDFInfo
- Publication number
- CN107135445A CN107135445A CN201710194226.3A CN201710194226A CN107135445A CN 107135445 A CN107135445 A CN 107135445A CN 201710194226 A CN201710194226 A CN 201710194226A CN 107135445 A CN107135445 A CN 107135445A
- Authority
- CN
- China
- Prior art keywords
- voice
- voice data
- units
- unit
- electronic device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 13
- 238000003672 processing method Methods 0.000 title claims abstract description 12
- 238000004458 analytical method Methods 0.000 claims abstract description 84
- 238000000034 method Methods 0.000 claims abstract description 37
- 238000012545 processing Methods 0.000 claims description 55
- 238000004891 communication Methods 0.000 claims description 14
- 238000010586 diagram Methods 0.000 description 8
- 206010011469 Crying Diseases 0.000 description 4
- 238000000605 extraction Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/02—Spatial or constructional arrangements of loudspeakers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2205/00—Details of stereophonic arrangements covered by H04R5/00 but not provided for in any of its subgroups
- H04R2205/024—Positioning of loudspeaker enclosures for spatial sound reproduction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种信息处理方法及电子设备,所述方法包括:获取至少一个语音采集单元中至少部分语音采集单元采集得到的语音数据;针对采集得到的语音数据进行解析得到解析结果,基于所述解析结果进行处理得到针对所述语音的响应信息;通过与所述至少部分语音采集单元处于相同空间的语音输出单元,输出所述响应信息。
Description
技术领域
本发明涉及通信领域中的信息处理技术,尤其涉及一种信息处理方法及电子设备。
背景技术
因为智能手机、平板电脑等智能设备的普及和大量使用,现在传统意义上的电脑(如台式机,笔记本)被使用的机会已经越来越少,特别是家用电脑,使用频率越来越低。有电脑的用户,基本上都还是在将电脑作为一个工具使用,当用户使用电脑进行操作的时候,通常需要打开电脑,处理完成后关闭电脑。但是,这种用户亲身靠近电子设备以采用电子设备进行处理的场景,造成了传统电脑的利用率非常低,并且使得用户和电子设备(电脑)的交互方式受到了限制。
发明内容
本发明的主要目的在于提出一种信息处理方法及电子设备,旨在解决现有技术中存在的上述问题。
为实现上述目的,本发明提供一种信息处理方法,应用于电子设备,所述电子设备能够与至少一个语音采集单元建立通信连接,所述至少一个语音采集单元中至少部分语音采集单元与所述电子设备所处的物理位置不同,所述方法包括:
获取至少一个语音采集单元中至少部分语音采集单元采集得到的语音数据;
针对采集得到的语音数据进行解析得到解析结果,基于所述解析结果进行处理得到针对所述语音的响应信息;
通过与所述至少部分语音采集单元处于相同空间的语音输出单元,输出所述响应信息。
本发明实施例还提供了一种电子设备,所述电子设备能够与至少一个语音采集单元建立通信连接,所述至少一个语音采集单元中至少部分语音采集单元与所述电子设备所处的物理位置不同,其特征在于,所述电子设备包括:
数据获取单元,用于获取至少一个语音采集单元中至少部分语音采集单元采集得到的语音数据;
处理单元,用于针对采集得到的语音数据进行解析得到解析结果,基于所述解析结果进行处理得到针对所述语音的响应信息;
输出控制单元,用于通过与所述至少部分语音采集单元处于相同空间的语音输出单元,输出所述响应信息。
本发明提出的一种信息处理方法及电子设备,基于多个语音采集单元中的至少部分语音采集单元采集得到的语音数据,得到相应的解析结果,并根据解析结果得到对应的响应结果,基于与至少部分语音采集单元处于相同空间的语音输出单元输出响应信息。如此,就能够提升用户使用电子设备的便利性,使得操作电子设备的场景更加丰富,提升了用户使用电子设备的使用率以及电子设备的使用效率。
附图说明
图1为本发明实施例信息处理方法流程示意图;
图2为本发明实施例场景示意图1;
图3a为本发明实施例场景示意图2;
图3b为本发明实施例场景示意图3;
图4为本发明实施例场景示意图4;
图5为本发明实施例场景示意图5;
图6为本发明实施例场景示意图6;
图7为本发明实施例场景示意图7;
图8为本发明实施例场景示意图8;
图9为本发明实施例电子设备组成结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步详细说明。
实施例一、
本发明实施例提供一种信息处理方法,应用于电子设备,所述电子设备能够与至少一个语音采集单元建立通信连接,所述至少一个语音采集单元中至少部分语音采集单元与所述电子设备所处的物理位置不同,如图1所示,所述方法包括:
步骤101:获取至少一个语音采集单元中至少部分语音采集单元采集得到的语音数据;
步骤102:针对采集得到的语音数据进行解析得到解析结果,基于所述解析结果进行处理得到针对所述语音的响应信息;
步骤103:通过与所述至少部分语音采集单元处于相同空间的语音输出单元,输出所述响应信息。
本实施例中所提供的语音采集单元可以为麦克风;至少一个语音采集单元可以组成语音采集阵列。另外,当本实施例提供的至少一个语音采集单元分别设置在目标空间中的不同物理位置的时候,能够采集不同物理位置及其附近的声音。
上述步骤101中,获取至少一个语音采集单元至少部分语音采集单元采集得到的语音数据。
其中,所述至少部分语音采集单元可以为一个也可以为多个,通过该步骤,能够获取到的为采集到的语音数据。
当至少部分语音采集单元为一个时,可以理解为,当前仅有一个语音采集单元采集得到语音数据;
当至少部分语音采集单元为两个及以上时,可以理解为,当前用户处于多个语音采集单元都能够采集到用户的语音数据的空间中,那么可以通过多个语音采集单元均采集得到语音数据。
目标空间中可能存在两个子空间,这两个子空间可以通过连接装置互通,比如,如图2所示,两个子空间为两个房间,目标空间指的为一个房子;在这两个房间中均设置有语音采集单元,如图所示,在房间1中设置有4个语音采集单元,分别为语音采集单元211、212、213和214,房间2中可能就设置有一个语音采集单元,为语音采集单元221。然后这些语音采集单元均可以通过通信链路,比如有线或无线的连接方式与进行语音数据处理的电子设备建立连接;其中,电子设备可以如图2中所示的笔记本电脑。
在图2的基础上,参见图3a,当前主人回家,处于房间1的位置A处,当主人发声时,可能语音采集单元211、212、213和214均能采集到主人的语音数据,也就是说,此时语音采集单元211、212、213和214均可以认为是至少部分语音采集单元;当然,此时,若主人距离语音采集单元211较近的时候,可能仅有语音采集单元211采集到的语音数据,也就是说,语音采集单元211为至少部分语音采集单元。
或者,如图3b所示,假设当前主人在房间2的位置B处,那么此时可能只有语音采集单元221采集到的主人的语音数据。
上述步骤102中,针对采集得到的语音数据进行解析得到解析结果,可以进行语音分析,以得到语音数据具体的语义;
相应的,基于所述解析结果进行处理得到针对所述语音的响应信息,可以为基于解析得到的语音进行响应,也就是说,根据语音的语义判断当前用户所要得到什么,比如,当用户发出的语音为“笔记本打开XX应用”,那么相应的,可以得到的响应为笔记本“开启XX应用”。
进一步地,响应信息则是在所述电子设备得到响应结果的时候,将响应结果反馈给用户,具体的响应信息可以理解为一条语音提示信息,比如,还如前述场景,响应信息可以为“XX应用已开启”。
需要理解的是,响应信息为基于响应结果得到的信息,或者,理解为一条语音提示信息。响应信息的具体内容与响应结果相关,比如,当用户发出的语音数据,无法得到对应的响应结果时,响应信息可以提示为“处理失败”。具体的响应信息的内容与其处理场景有关,这里不进行穷举。
另外,得到响应信息的方法可以基于预设的响应信息与响应结果之间的关系列表确定,比如,在电子设备中设置一个列表,通过该列表得知多种应用对应的响应结果所需要输出的响应信息。当然,该列表中响应信息与响应结果之间的对应关系,还可以随着电子设备中安装或卸载应用的情况进行更新,比如,电子设备中又新安装了一个应用,那么就更新响应信息与响应结果之间的对应关系;若电子设备中卸载了一个应用,可以将该应用对应的多种响应结果及其对应的响应信息进行删除。
上述步骤103中,在设置语音采集单元的时候,还可以在相应的位置处设置语音输出单元;其中,语音输出单元可以为一个扬声器。
进一步地,语音输出单元与语音采集单元可以设置为1:1的数量配置,也就是说,在一个语音采集单元旁边设置一个语音输出单元,这种场景下,语音输出单元的物理位置可以类似的认为成语音采集单元的物理位置。
语音输出单元与语音采集单元之间的数量配比也可以不是1:1,也就是说,语音输出单元的数量可以多于或少于语音采集单元。但是,在一个空间中,需要设置语音输出单元。
比如,参见图4,在图2和图3的基础上,以其中的房间1为例,在房间1中设置有语音采集单元211、212、213和214;当语音采集单元和语音输出单元配比为1:1时,在每一个语音采集单元旁边设置语音输出单元,也就是图中所示,语音输出单元41、42、43和44。
另一种场景,则参见图5,语音输出单元少于语音采集单元,假设在房间1中设置语音采集单元211、212、213和214,仅设置有两个语音输出单元,分别设置在房间1中的最长对角线的两端,也就是图中所示的语音输出单元45和46。
另外,与所述至少部分语音采集单元处于相同空间的语音输出单元,需要说明的是,当语音采集单元与语音输出单元为相同物理位置的配置的时候,可以从采集到语音数据的至少部分语音采集单元所对应的多个语音输出单元中,选取得到一个目标语音输出单元进行响应信息的输出。
比如,参见图6,在图4的基础上,用户在位置A处发出语音数据,采集到语音输出的语音采集单元为211、212,经过电子设备的分析,得到响应信息;此时语音输出单元41和42均可以进行输出;可以进行的处理为,从两个语音输出单元中选取一个语音输出单元41进行输出,如图中所示。当然,可以控制两个语音输出单元均进行语音输出。
确定语音输出单元是否与至少部分语音采集单元处于相同空间的方法,可以为:
基于所述至少部分语音采集单元的物理位置,以及至少一个语音输出单元的物理位置,选取与所述至少部分语音采集单元的距离最小的语音输出单元,输出所述响应信息;
或者,
基于所述至少部分语音采集单元的物理位置,选取与所述至少部分语音采集单元之间的距离小于距离门限值的至少一个语音输出单元,输出所述响应信息。
根据电子设备内预设的每一个语音采集单元的物理位置,以及每一个语音输出单元的物理位置,基于至少部分语音采集单元中每一个语音采集单元与语音输出单元之间距离最小的一个或多个语音输出单元,输出响应信息;或者,选取距离小于门限值的一个或多个语音输出单元输出响应信息。
本实施例提供的场景,结合图3a所示进行示例说明,用户发出的语音信息中解析得到的内容信息为“今天天气怎么样”,麦克风211将采集到的语音信息发送到笔记本电脑,由笔记本电脑进行处理之后,获取当前的天气情况,通过211附近的扬声器向用户发出回馈“今天天气晴,31度”。
可见,通过采用上述方案,电子设备就能够基于多个语音采集单元中的至少部分语音采集单元采集得到的语音数据,得到相应的解析结果,并根据解析结果得到对应的响应结果,基于与至少部分语音采集单元处于相同空间的语音输出单元输出响应信息。如此,就能够提升用户使用电子设备的便利性,使得操作电子设备的场景更加丰富,提升了用户的使用效率。
实施例二、
本发明实施例提供一种信息处理方法,应用于电子设备,所述电子设备能够与至少一个语音采集单元建立通信连接,所述至少一个语音采集单元中至少部分语音采集单元与所述电子设备所处的物理位置不同,如图1所示,所述方法包括:
步骤101:获取至少一个语音采集单元中至少部分语音采集单元采集得到的语音数据;
步骤102:针对采集得到的语音数据进行解析得到解析结果,基于所述解析结果进行处理得到针对所述语音的响应信息;
步骤103:通过与所述至少部分语音采集单元处于相同空间的语音输出单元,输出所述响应信息。
本实施例中所提供的语音采集单元可以为麦克风;至少一个语音采集单元可以组成语音采集阵列。另外,当本实施例提供的至少一个语音采集单元分别设置在目标空间中的不同物理位置的时候,能够采集不同物理位置及其附近的声音。
上述步骤101中,获取至少一个语音采集单元至少部分语音采集单元采集得到的语音数据。
其中,所述至少部分语音采集单元可以为一个也可以为多个,通过该步骤,能够获取到的为采集到的语音数据。
当至少部分语音采集单元为一个时,可以理解为,当前仅有一个语音采集单元采集得到语音数据;
当至少部分语音采集单元为两个及以上时,可以理解为,当前用户处于多个语音采集单元都能够采集到用户的语音数据的空间中,那么可以通过多个语音采集单元均采集得到语音数据。
目标空间中可能存在两个子空间,这两个子空间可以通过连接装置互通,比如,如图2所示,两个子空间为两个房间,目标空间指的为一个房子;在这两个房间中均设置有语音采集单元,如图所示,在房间1中设置有4个语音采集单元,分别为语音采集单元211、212、213和214,房间2中可能就设置有一个语音采集单元,为语音采集单元221。
在图2的基础上,参见图3,当前主人回家,处于房间1的位置A处,当主人发声时,可能语音采集单元211、212、213和214均能采集到主人的语音数据,也就是说,此时语音采集单元211、212、213和214均可以认为是至少部分语音采集单元;当然,此时,若主人距离语音采集单元211较近的时候,可能仅有语音采集单元211采集到的语音数据,也就是说,语音采集单元211为至少部分语音采集单元。
或者,如图3所示,假设当前主人在房间2的位置B处,那么此时可能只有语音采集单元221采集到的主人的语音数据。
上述步骤102中可以存在两种处理场景,具体如下:
场景一、
所述针对采集得到的语音数据进行解析得到解析结果,还包括:
针对采集得到的语音数据进行解析得到所述语音数据对应的语音特征信息;
基于所述语音数据对应的语音特征信息,检测所述语音数据是否由至少两个用户发出;
当所述语音数据由至少两个用户发出时,获取每一个用户的身份特征。
基于本场景的处理,可以确定语音信息具体由几个用户发出,比如,参见图7,图中示出多个用户的场景,那么通过前述方式,就能够通过在一定时长内获取到的语音数据提取得到至少一个用户对应的语音特征信息。比如,图中示出有三个用户在同一个空间内,那么可能当前检测到三个不同的语音特征信息,从而确定当前有三个用户。在一定时长内可以根据实际情况设置,比如,可以为10分钟之内。
需要理解的是,不同的用户对应的语音特征信息是不同的,具体的不同的特征可以为主频、次频的不同,或者,还可以结合声音的幅度特征来确定是否存在多个用户发出语音。
进一步地,当确定语音数据由至少两个用户发出时,可以基于用户的语音特征信息,获取每一个用户的身份特征;其中,所述身份特征可以包括成人、婴儿、儿童;或者可以包括有男生、女生等特征。
基于本场景,进一步地,还可以包括:当确定至少两个用户发出语音数据时,可以判断其中是否存在目标类型的用户,若存在,则不对该用户的语音进行信息提取。比如,参见图8,在图中所示的场景中有大人81和婴儿82,若大人和婴儿同时发出语音,那么此时通过语音采集单元可以采集到语音信息,然后进行分析,能够获取这两个用户的身份特征;当确定其中一个用户的身份特征为婴儿时,可以不对该用户进行响应。或者,当确定其中一个用户的身份特征为婴儿时,仅分析婴儿发出的语音数据是否为啼哭,若是,可以发出响应信息,响应信息可以为一段舒缓的音乐,使得婴儿减少啼哭。
当前本场景提供的图示仅为示例,实际上可能存在其他的情况,只是这里不进行穷举。
场景二、
针对采集得到的语音数据提取到所述语音数据对应的语音特征信息;
基于所述语音数据对应的语音特征信息,检测所述语音数据是否由至少一个用户发出;
当所述语音数据有至少一个用户发出时,基于所述语音特征信息判断所述至少一个用户中是否存在目标用户;
当至少一个用户中存在目标用户时,基于所述目标用户的语音数据的解析结果进行处理得到针对所述语音的响应信息;否则,不对所述解析结果进行处理。
本场景在执行之前,电子设备侧还会保存至少一个目标用户的语音特征信息,其中,语音特征信息中包含的内容如前所述,这里不再进行赘述。
进一步地,判断发出语音数据的至少一个用户中是否存在目标用户的方法,可以为,将至少一个用户的语音特征信息提取出来之后,用每一个用户的语音特征信息与预存的目标用户的语音特征信息进行匹配,判断是否存在目标用户。
本场景中,在判断出存在目标用户时,可以仅对目标用户发出的语音信息进行解析,或者,可以对所有用户的语音数据均进行解析,但是仅提取目标用户的解析结果。
需要指出的是语音数据的解析结果为包含有信息内容的解析结果,并非仅指语音特征信息。比如,提取目标用户的语音数据,然后对语音数据进行分析提取得到具体的内容;具体的信息内容可以为用户发出的指令,可以为“开启XX应用”这类具体的有所指代的内容。
然后基于具体的解析结果进行处理,以得到对应的响应信息。
基于所述解析结果进行处理得到针对所述语音的响应信息,可以为基于解析得到的语音进行响应,也就是说,根据语音的语义判断当前用户所要得到什么,比如,当用户发出的语音为“笔记本打开XX应用”,那么相应的,可以得到的响应为笔记本“开启XX应用”。
进一步地,响应信息则是在所述电子设备得到响应结果的时候,将响应结果反馈给用户,具体的响应信息可以理解为一条语音提示信息,比如,还如前述场景,响应信息可以为“XX应用已开启”。
需要理解的是,响应信息为基于响应结果得到的信息,或者,理解为一条语音提示信息。响应信息的具体内容与响应结果相关,比如,当用户发出的语音数据,无法得到对应的响应结果时,响应信息可以提示为“处理失败”。具体的响应信息的内容与其处理场景有关,这里不进行穷举。
另外,得到响应信息的方法可以基于预设的响应信息与响应结果之间的关系列表确定,比如,在电子设备中设置一个列表,通过该列表得知多种应用对应的响应结果所需要输出的响应信息。当然,该列表中响应信息与响应结果之间的对应关系,还可以随着电子设备中安装或卸载应用的情况进行更新,比如,电子设备中又新安装了一个应用,那么就更新响应信息与响应结果之间的对应关系;若电子设备中卸载了一个应用,可以将该应用对应的多种响应结果及其对应的响应信息进行删除。
上述步骤103中,在设置语音采集单元的时候,还可以在相应的位置处设置语音输出单元;其中,语音输出单元可以为一个扬声器。
进一步地,语音输出单元与语音采集单元可以设置为1:1的数量配置,也就是说,在一个语音采集单元旁边设置一个语音输出单元,这种场景下,语音输出单元的物理位置可以类似的认为成语音采集单元的物理位置。
语音输出单元与语音采集单元之间的数量配比也可以不是1:1,也就是说,语音输出单元的数量可以多于或少于语音采集单元。但是,在一个空间中,需要设置语音输出单元。
另外,与所述至少部分语音采集单元处于相同空间的语音输出单元,需要说明的是,当语音采集单元与语音输出单元为相同物理位置的配置的时候,可以从采集到语音数据的至少部分语音采集单元所对应的多个语音输出单元中,选取得到一个目标语音输出单元进行响应信息的输出。
确定语音输出单元是否与至少部分语音采集单元处于相同空间的方法,可以为:
基于所述至少部分语音采集单元的物理位置,以及至少一个语音输出单元的物理位置,选取与所述至少部分语音采集单元的距离最小的语音输出单元,输出所述响应信息;
或者,
基于所述至少部分语音采集单元的物理位置,选取与所述至少部分语音采集单元之间的距离小于距离门限值的至少一个语音输出单元,输出所述响应信息。
根据电子设备内预设的每一个语音采集单元的物理位置,以及每一个语音输出单元的物理位置,基于至少部分语音采集单元中每一个语音采集单元与语音输出单元之间距离最小的一个或多个语音输出单元,输出响应信息;或者,选取距离小于门限值的一个或多个语音输出单元输出响应信息。
可见,通过采用上述方案,电子设备就能够基于多个语音采集单元中的至少部分语音采集单元采集得到的语音数据,得到相应的解析结果,并根据解析结果得到对应的响应结果,基于与至少部分语音采集单元处于相同空间的语音输出单元输出响应信息。如此,就能够提升用户使用电子设备的便利性,使得操作电子设备的场景更加丰富,提升了用户的使用效率。
实施例三、
本发明实施例提供一种信息处理方法,应用于电子设备,所述电子设备能够与至少一个语音采集单元建立通信连接,所述至少一个语音采集单元中至少部分语音采集单元与所述电子设备所处的物理位置不同,如图1所示,所述方法包括:
步骤101:获取至少一个语音采集单元中至少部分语音采集单元采集得到的语音数据;
步骤102:针对采集得到的语音数据进行解析得到解析结果,基于所述解析结果进行处理得到针对所述语音的响应信息;
步骤103:通过与所述至少部分语音采集单元处于相同空间的语音输出单元,输出所述响应信息。
本实施例中所提供的语音采集单元可以为麦克风;至少一个语音采集单元可以组成语音采集阵列。另外,当本实施例提供的至少一个语音采集单元分别设置在目标空间中的不同物理位置的时候,能够采集不同物理位置及其附近的声音。
上述步骤101中,获取至少一个语音采集单元至少部分语音采集单元采集得到的语音数据。
其中,所述至少部分语音采集单元可以为一个也可以为多个,通过该步骤,能够获取到的为采集到的语音数据。
当至少部分语音采集单元为一个时,可以理解为,当前仅有一个语音采集单元采集得到语音数据;
当至少部分语音采集单元为两个及以上时,可以理解为,当前用户处于多个语音采集单元都能够采集到用户的语音数据的空间中,那么可以通过多个语音采集单元均采集得到语音数据。
目标空间中可能存在两个子空间,这两个子空间可以通过连接装置互通,比如,如图2所示,两个子空间为两个房间,目标空间指的为一个房子;在这两个房间中均设置有语音采集单元,如图所示,在房间1中设置有4个语音采集单元,分别为语音采集单元211、212、213和214,房间2中可能就设置有一个语音采集单元,为语音采集单元221。
在图2的基础上,参见图3,当前主人回家,处于房间1的位置A处,当主人发声时,可能语音采集单元211、212、213和214均能采集到主人的语音数据,也就是说,此时语音采集单元211、212、213和214均可以认为是至少部分语音采集单元;当然,此时,若主人距离语音采集单元211较近的时候,可能仅有语音采集单元211采集到的语音数据,也就是说,语音采集单元211为至少部分语音采集单元。
或者,如图3所示,假设当前主人在房间2的位置B处,那么此时可能只有语音采集单元221采集到的主人的语音数据。
上述步骤102,与前述实施例不同之处在于,在本实施例提供的场景基础上,还可以结合用户所在的位置,确定是否进行解析。具体如下:
获取发出所述语音数据的目标位置;
基于所述语音数据所处的目标位置,确定是否针对所述语音数据进行解析。
其中,所述获取发出所述语音数据的目标位置,包括:
通过至少一个语音采集单元获取所述语音数据的音频幅度特征;
基于所述每一个语音采集单元对应的物理位置、以及每一个语音采集单元获取所述语音数据的音频幅度特征,确定发出所述语音数据的目标位置。
具体来说,如图2所示,在设置每一个语音采集单元时,可以在电子设备中预存每一个语音采集单元的物理位置,比如,可以为坐标信息,或者可以为所在空间的相对坐标信息。其中,坐标信息可以为经度以及维度信息,还可以配合高度信息;所述相对坐标信息可以以当前空间为基础参考坐标,然后以在该空间内所在位置及高度作为相对坐标信息。
另外,基于目标位置,确定是否针对语音数据进行解析,可以为,根据预设的不进行语音数据的处理的子空间坐标,确定是否对语音数据进行解析;比如,首先设置在某些子空间内不对语音数据进行处理,这些子空间可以为客厅或者洗手间,这些地方可以分时段的不对语音数据进行处理,或者,可以根据用户选取开启或关闭对语音数据进行处理的功能。
进一步地,当采集到语音数据的时候,可能存在多个语音采集单元都能够采集到语音数据,在不同的语音采集单元中可以采集到不同的音频幅度特征,该音频幅度特征可以用于描述不同语音采集单元采集到声音的大小。
基于不同语音采集单元的物理位置,以及采集到的声音的大小,计算得到当前发出语音数据的目标位置。比如,可以在电子设备中建立一个矢量图,将声音的幅度特征作为半径,然后基于采集到语音数据的语音采集单元的位置为中心,以半径画圆,找到多个语音采集单元对应的圆的交点,将该交点作为目标位置。
本场景中,在判断出存在目标用户时,可以仅对目标用户发出的语音信息进行解析,或者,可以对所有用户的语音数据均进行解析,但是仅提取目标用户的解析结果。
需要指出的是语音数据的解析结果为包含有信息内容的解析结果,并非仅指语音特征信息。比如,提取目标用户的语音数据,然后对语音数据进行分析提取得到具体的内容;具体的信息内容可以为用户发出的指令,可以为“开启XX应用”这类具体的有所指代的内容。
然后基于具体的解析结果进行处理,以得到对应的响应信息。
基于所述解析结果进行处理得到针对所述语音的响应信息,可以为基于解析得到的语音进行响应,也就是说,根据语音的语义判断当前用户所要得到什么,比如,当用户发出的语音为“笔记本打开XX应用”,那么相应的,可以得到的响应为笔记本“开启XX应用”。
进一步地,响应信息则是在所述电子设备得到响应结果的时候,将响应结果反馈给用户,具体的响应信息可以理解为一条语音提示信息,比如,还如前述场景,响应信息可以为“XX应用已开启”。
需要理解的是,响应信息为基于响应结果得到的信息,或者,理解为一条语音提示信息。响应信息的具体内容与响应结果相关,比如,当用户发出的语音数据,无法得到对应的响应结果时,响应信息可以提示为“处理失败”。具体的响应信息的内容与其处理场景有关,这里不进行穷举。
另外,得到响应信息的方法可以基于预设的响应信息与响应结果之间的关系列表确定,比如,在电子设备中设置一个列表,通过该列表得知多种应用对应的响应结果所需要输出的响应信息。当然,该列表中响应信息与响应结果之间的对应关系,还可以随着电子设备中安装或卸载应用的情况进行更新,比如,电子设备中又新安装了一个应用,那么就更新响应信息与响应结果之间的对应关系;若电子设备中卸载了一个应用,可以将该应用对应的多种响应结果及其对应的响应信息进行删除。
上述步骤103中,在设置语音采集单元的时候,还可以在相应的位置处设置语音输出单元;其中,语音输出单元可以为一个扬声器。
进一步地,语音输出单元与语音采集单元可以设置为1:1的数量配置,也就是说,在一个语音采集单元旁边设置一个语音输出单元,这种场景下,语音输出单元的物理位置可以类似的认为成语音采集单元的物理位置。
语音输出单元与语音采集单元之间的数量配比也可以不是1:1,也就是说,语音输出单元的数量可以多于或少于语音采集单元。但是,在一个空间中,需要设置语音输出单元。
另外,与所述至少部分语音采集单元处于相同空间的语音输出单元,需要说明的是,当语音采集单元与语音输出单元为相同物理位置的配置的时候,可以从采集到语音数据的至少部分语音采集单元所对应的多个语音输出单元中,选取得到一个目标语音输出单元进行响应信息的输出。
确定语音输出单元是否与至少部分语音采集单元处于相同空间的方法,可以为:
基于所述至少部分语音采集单元的物理位置,以及至少一个语音输出单元的物理位置,选取与所述至少部分语音采集单元的距离最小的语音输出单元,输出所述响应信息;
或者,
基于所述至少部分语音采集单元的物理位置,选取与所述至少部分语音采集单元之间的距离小于距离门限值的至少一个语音输出单元,输出所述响应信息。
根据电子设备内预设的每一个语音采集单元的物理位置,以及每一个语音输出单元的物理位置,基于至少部分语音采集单元中每一个语音采集单元与语音输出单元之间距离最小的一个或多个语音输出单元,输出响应信息;或者,选取距离小于门限值的一个或多个语音输出单元输出响应信息。
可见,通过采用上述方案,电子设备就能够基于多个语音采集单元中的至少部分语音采集单元采集得到的语音数据,得到相应的解析结果,并根据解析结果得到对应的响应结果,基于与至少部分语音采集单元处于相同空间的语音输出单元输出响应信息。如此,就能够提升用户使用电子设备的便利性,使得操作电子设备的场景更加丰富,提升了用户的使用效率。
实施例四、
本发明实施例提供一种电子设备,所述电子设备能够与至少一个语音采集单元建立通信连接,所述至少一个语音采集单元中至少部分语音采集单元与所述电子设备所处的物理位置不同,如图9所示,所述电子设备包括:
数据获取单元91,用于获取至少一个语音采集单元中至少部分语音采集单元采集得到的语音数据;
处理单元92,用于针对采集得到的语音数据进行解析得到解析结果,基于所述解析结果进行处理得到针对所述语音的响应信息;
输出控制单元93,用于通过与所述至少部分语音采集单元处于相同空间的语音输出单元,输出所述响应信息。
本实施例中所提供的语音采集单元可以为麦克风;至少一个语音采集单元可以组成语音采集阵列。另外,当本实施例提供的至少一个语音采集单元分别设置在目标空间中的不同物理位置的时候,能够采集不同物理位置及其附近的声音。
上述数据获取单元91,用于获取至少一个语音采集单元至少部分语音采集单元采集得到的语音数据。
其中,所述至少部分语音采集单元可以为一个也可以为多个,通过该步骤,能够获取到的为采集到的语音数据。
当至少部分语音采集单元为一个时,可以理解为,当前仅有一个语音采集单元采集得到语音数据;
当至少部分语音采集单元为两个及以上时,可以理解为,当前用户处于多个语音采集单元都能够采集到用户的语音数据的空间中,那么可以通过多个语音采集单元均采集得到语音数据。
目标空间中可能存在两个子空间,这两个子空间可以通过连接装置互通,比如,如图2所示,两个子空间为两个房间,目标空间指的为一个房子;在这两个房间中均设置有语音采集单元,如图所示,在房间1中设置有4个语音采集单元,分别为语音采集单元211、212、213和214,房间2中可能就设置有一个语音采集单元,为语音采集单元221。
在图2的基础上,参见图3,当前主人回家,处于房间1的位置A处,当主人发声时,可能语音采集单元211、212、213和214均能采集到主人的语音数据,也就是说,此时语音采集单元211、212、213和214均可以认为是至少部分语音采集单元;当然,此时,若主人距离语音采集单元211较近的时候,可能仅有语音采集单元211采集到的语音数据,也就是说,语音采集单元211为至少部分语音采集单元。
或者,如图3所示,假设当前主人在房间2的位置B处,那么此时可能只有语音采集单元221采集到的主人的语音数据。
上述处理单元,用于针对采集得到的语音数据进行解析得到解析结果,可以进行语音分析,以得到语音数据具体的语义;
相应的,基于所述解析结果进行处理得到针对所述语音的响应信息,可以为基于解析得到的语音进行响应,也就是说,根据语音的语义判断当前用户所要得到什么,比如,当用户发出的语音为“笔记本打开XX应用”,那么相应的,可以得到的响应为笔记本“开启XX应用”。
进一步地,响应信息则是在所述电子设备得到响应结果的时候,将响应结果反馈给用户,具体的响应信息可以理解为一条语音提示信息,比如,还如前述场景,响应信息可以为“XX应用已开启”。
需要理解的是,响应信息为基于响应结果得到的信息,或者,理解为一条语音提示信息。响应信息的具体内容与响应结果相关,比如,当用户发出的语音数据,无法得到对应的响应结果时,响应信息可以提示为“处理失败”。具体的响应信息的内容与其处理场景有关,这里不进行穷举。
另外,得到响应信息的方法可以基于预设的响应信息与响应结果之间的关系列表确定,比如,在电子设备中设置一个列表,通过该列表得知多种应用对应的响应结果所需要输出的响应信息。当然,该列表中响应信息与响应结果之间的对应关系,还可以随着电子设备中安装或卸载应用的情况进行更新,比如,电子设备中又新安装了一个应用,那么就更新响应信息与响应结果之间的对应关系;若电子设备中卸载了一个应用,可以将该应用对应的多种响应结果及其对应的响应信息进行删除。
在设置语音采集单元的时候,还可以在相应的位置处设置语音输出单元;其中,语音输出单元可以为一个扬声器。
进一步地,语音输出单元与语音采集单元可以设置为1:1的数量配置,也就是说,在一个语音采集单元旁边设置一个语音输出单元,这种场景下,语音输出单元的物理位置可以类似的认为成语音采集单元的物理位置。
语音输出单元与语音采集单元之间的数量配比也可以不是1:1,也就是说,语音输出单元的数量可以多于或少于语音采集单元。但是,在一个空间中,需要设置语音输出单元。
比如,参见图4,在图2和图3的基础上,以其中的房间1为例,在房间1中设置有语音采集单元211、212、213和214;当语音采集单元和语音输出单元配比为1:1时,在每一个语音采集单元旁边设置语音输出单元,也就是图中所示,语音输出单元41、42、43和44。
另一种场景,则参见图5,语音输出单元少于语音采集单元,假设在房间1中设置语音采集单元211、212、213和214,仅设置有两个语音输出单元,分别设置在房间1中的最长对角线的两端,也就是图中所示的语音输出单元45和46。
另外,与所述至少部分语音采集单元处于相同空间的语音输出单元,需要说明的是,当语音采集单元与语音输出单元为相同物理位置的配置的时候,可以从采集到语音数据的至少部分语音采集单元所对应的多个语音输出单元中,选取得到一个目标语音输出单元进行响应信息的输出。
比如,参见图6,在图4的基础上,用户在位置A处发出语音数据,采集到语音输出的语音采集单元为211、212,经过电子设备的分析,得到响应信息;此时语音输出单元41和42均可以进行输出;可以进行的处理为,从两个语音输出单元中选取一个语音输出单元41进行输出,如图中所示。当然,可以控制两个语音输出单元均进行语音输出。
输出控制单元,用于基于所述至少部分语音采集单元的物理位置,以及至少一个语音输出单元的物理位置,选取与所述至少部分语音采集单元的距离最小的语音输出单元,输出所述响应信息;
或者,
基于所述至少部分语音采集单元的物理位置,选取与所述至少部分语音采集单元之间的距离小于距离门限值的至少一个语音输出单元,输出所述响应信息。
根据电子设备内预设的每一个语音采集单元的物理位置,以及每一个语音输出单元的物理位置,基于至少部分语音采集单元中每一个语音采集单元与语音输出单元之间距离最小的一个或多个语音输出单元,输出响应信息;或者,选取距离小于门限值的一个或多个语音输出单元输出响应信息。
可见,通过采用上述方案,电子设备就能够基于多个语音采集单元中的至少部分语音采集单元采集得到的语音数据,得到相应的解析结果,并根据解析结果得到对应的响应结果,基于与至少部分语音采集单元处于相同空间的语音输出单元输出响应信息。如此,就能够提升用户使用电子设备的便利性,使得操作电子设备的场景更加丰富,提升了用户的使用效率。
实施例五、
本发明实施例提供一种电子设备,所述电子设备能够与至少一个语音采集单元建立通信连接,所述至少一个语音采集单元中至少部分语音采集单元与所述电子设备所处的物理位置不同,如图9所示,所述电子设备包括:
数据获取单元91,用于获取至少一个语音采集单元中至少部分语音采集单元采集得到的语音数据;
处理单元92,用于针对采集得到的语音数据进行解析得到解析结果,基于所述解析结果进行处理得到针对所述语音的响应信息;
输出控制单元93,用于通过与所述至少部分语音采集单元处于相同空间的语音输出单元,输出所述响应信息。
本实施例中所提供的语音采集单元可以为麦克风;至少一个语音采集单元可以组成语音采集阵列。另外,当本实施例提供的至少一个语音采集单元分别设置在目标空间中的不同物理位置的时候,能够采集不同物理位置及其附近的声音。
上述数据获取单元91,用于获取至少一个语音采集单元至少部分语音采集单元采集得到的语音数据。
其中,所述至少部分语音采集单元可以为一个也可以为多个,通过该步骤,能够获取到的为采集到的语音数据。
当至少部分语音采集单元为一个时,可以理解为,当前仅有一个语音采集单元采集得到语音数据;
当至少部分语音采集单元为两个及以上时,可以理解为,当前用户处于多个语音采集单元都能够采集到用户的语音数据的空间中,那么可以通过多个语音采集单元均采集得到语音数据。
目标空间中可能存在两个子空间,这两个子空间可以通过连接装置互通,比如,如图2所示,两个子空间为两个房间,目标空间指的为一个房子;在这两个房间中均设置有语音采集单元,如图所示,在房间1中设置有4个语音采集单元,分别为语音采集单元211、212、213和214,房间2中可能就设置有一个语音采集单元,为语音采集单元221。
在图2的基础上,参见图3,当前主人回家,处于房间1的位置A处,当主人发声时,可能语音采集单元211、212、213和214均能采集到主人的语音数据,也就是说,此时语音采集单元211、212、213和214均可以认为是至少部分语音采集单元;当然,此时,若主人距离语音采集单元211较近的时候,可能仅有语音采集单元211采集到的语音数据,也就是说,语音采集单元211为至少部分语音采集单元。
或者,如图3所示,假设当前主人在房间2的位置B处,那么此时可能只有语音采集单元221采集到的主人的语音数据。
场景一、
所述处理单元,用于针对采集得到的语音数据进行解析得到所述语音数据对应的语音特征信息;
基于所述语音数据对应的语音特征信息,检测所述语音数据是否由至少两个用户发出;
当所述语音数据由至少两个用户发出时,获取每一个用户的身份特征。
基于本场景的处理,可以确定语音信息具体由几个用户发出,比如,参见图7,图中示出多个用户的场景,那么通过前述方式,就能够通过在一定时长内获取到的语音数据提取得到至少一个用户对应的语音特征信息。
需要理解的是,不同的用户对应的语音特征信息是不同的,具体的不同的特征可以为主频、次频的不同,或者,还可以结合声音的幅度特征来确定是否存在多个用户发出语音。
进一步地,当确定语音数据由至少两个用户发出时,可以基于用户的语音特征信息,获取每一个用户的身份特征;其中,所述身份特征可以包括成人、婴儿、儿童;或者可以包括有男生、女生等特征。
基于本场景,进一步地,还可以包括:当确定至少两个用户发出语音数据时,可以判断其中是否存在目标类型的用户,若存在,则不对该用户的语音进行信息提取。比如,参见图8,在图中所示的场景中有大人和婴儿,若大人和婴儿同时发出语音,那么此时通过语音采集单元可以采集到语音信息,然后进行分析,能够获取这两个用户的身份特征;当确定其中一个用户的身份特征为婴儿时,可以不对该用户进行响应。或者,当确定其中一个用户的身份特征为婴儿时,仅分析婴儿发出的语音数据是否为啼哭,若是,可以发出响应信息,响应信息可以为一段舒缓的音乐,使得婴儿减少啼哭。
当前本场景提供的图示仅为示例,实际上可能存在其他的情况,只是这里不进行穷举。
场景二、
处理单元,用于针对采集得到的语音数据提取到所述语音数据对应的语音特征信息;
基于所述语音数据对应的语音特征信息,检测所述语音数据是否由至少一个用户发出;
当所述语音数据有至少一个用户发出时,基于所述语音特征信息判断所述至少一个用户中是否存在目标用户;
当至少一个用户中存在目标用户时,基于所述目标用户的语音数据的解析结果进行处理得到针对所述语音的响应信息;否则,不对所述解析结果进行处理。
本场景在执行之前,电子设备侧还会保存至少一个目标用户的语音特征信息,其中,语音特征信息中包含的内容如前所述,这里不再进行赘述。
进一步地,判断发出语音数据的至少一个用户中是否存在目标用户的方法,可以为,将至少一个用户的语音特征信息提取出来之后,用每一个用户的语音特征信息与预存的目标用户的语音特征信息进行匹配,判断是否存在目标用户。
本场景中,在判断出存在目标用户时,可以仅对目标用户发出的语音信息进行解析,或者,可以对所有用户的语音数据均进行解析,但是仅提取目标用户的解析结果。
需要指出的是语音数据的解析结果为包含有信息内容的解析结果,并非仅指语音特征信息。比如,提取目标用户的语音数据,然后对语音数据进行分析提取得到具体的内容;具体的信息内容可以为用户发出的指令,可以为“开启XX应用”这类具体的有所指代的内容。
然后基于具体的解析结果进行处理,以得到对应的响应信息。
基于所述解析结果进行处理得到针对所述语音的响应信息,可以为基于解析得到的语音进行响应,也就是说,根据语音的语义判断当前用户所要得到什么,比如,当用户发出的语音为“笔记本打开XX应用”,那么相应的,可以得到的响应为笔记本“开启XX应用”。
进一步地,响应信息则是在所述电子设备得到响应结果的时候,将响应结果反馈给用户,具体的响应信息可以理解为一条语音提示信息,比如,还如前述场景,响应信息可以为“XX应用已开启”。
需要理解的是,响应信息为基于响应结果得到的信息,或者,理解为一条语音提示信息。响应信息的具体内容与响应结果相关,比如,当用户发出的语音数据,无法得到对应的响应结果时,响应信息可以提示为“处理失败”。具体的响应信息的内容与其处理场景有关,这里不进行穷举。
另外,得到响应信息的方法可以基于预设的响应信息与响应结果之间的关系列表确定,比如,在电子设备中设置一个列表,通过该列表得知多种应用对应的响应结果所需要输出的响应信息。当然,该列表中响应信息与响应结果之间的对应关系,还可以随着电子设备中安装或卸载应用的情况进行更新,比如,电子设备中又新安装了一个应用,那么就更新响应信息与响应结果之间的对应关系;若电子设备中卸载了一个应用,可以将该应用对应的多种响应结果及其对应的响应信息进行删除。
可见,通过采用上述方案,电子设备就能够基于多个语音采集单元中的至少部分语音采集单元采集得到的语音数据,得到相应的解析结果,并根据解析结果得到对应的响应结果,基于与至少部分语音采集单元处于相同空间的语音输出单元输出响应信息。如此,就能够提升用户使用电子设备的便利性,使得操作电子设备的场景更加丰富,提升了用户的使用效率。
实施例六、
本发明实施例提供一种电子设备,所述电子设备能够与至少一个语音采集单元建立通信连接,所述至少一个语音采集单元中至少部分语音采集单元与所述电子设备所处的物理位置不同,如图9所示,所述电子设备包括:
数据获取单元91,用于获取至少一个语音采集单元中至少部分语音采集单元采集得到的语音数据;
处理单元92,用于针对采集得到的语音数据进行解析得到解析结果,基于所述解析结果进行处理得到针对所述语音的响应信息;
输出控制单元93,用于通过与所述至少部分语音采集单元处于相同空间的语音输出单元,输出所述响应信息。
本实施例中所提供的语音采集单元可以为麦克风;至少一个语音采集单元可以组成语音采集阵列。另外,当本实施例提供的至少一个语音采集单元分别设置在目标空间中的不同物理位置的时候,能够采集不同物理位置及其附近的声音。
其中,所述至少部分语音采集单元可以为一个也可以为多个,通过该步骤,能够获取到的为采集到的语音数据。
当至少部分语音采集单元为一个时,可以理解为,当前仅有一个语音采集单元采集得到语音数据;
当至少部分语音采集单元为两个及以上时,可以理解为,当前用户处于多个语音采集单元都能够采集到用户的语音数据的空间中,那么可以通过多个语音采集单元均采集得到语音数据。
目标空间中可能存在两个子空间,这两个子空间可以通过连接装置互通,比如,如图2所示,两个子空间为两个房间,目标空间指的为一个房子;在这两个房间中均设置有语音采集单元,如图所示,在房间1中设置有4个语音采集单元,分别为语音采集单元211、212、213和214,房间2中可能就设置有一个语音采集单元,为语音采集单元221。
在图2的基础上,参见图3,当前主人回家,处于房间1的位置A处,当主人发声时,可能语音采集单元211、212、213和214均能采集到主人的语音数据,也就是说,此时语音采集单元211、212、213和214均可以认为是至少部分语音采集单元;当然,此时,若主人距离语音采集单元211较近的时候,可能仅有语音采集单元211采集到的语音数据,也就是说,语音采集单元211为至少部分语音采集单元。
或者,如图3所示,假设当前主人在房间2的位置B处,那么此时可能只有语音采集单元221采集到的主人的语音数据。
与前述实施例不同之处在于,在本实施例提供的场景基础上,还可以结合用户所在的位置,确定是否进行解析。具体如下:
处理单元,用于获取发出所述语音数据的目标位置;
基于所述语音数据所处的目标位置,确定是否针对所述语音数据进行解析。
其中,所述获取发出所述语音数据的目标位置,包括:
通过至少一个语音采集单元获取所述语音数据的音频幅度特征;
基于所述每一个语音采集单元对应的物理位置、以及每一个语音采集单元获取所述语音数据的音频幅度特征,确定发出所述语音数据的目标位置。
具体来说,如图2所示,在设置每一个语音采集单元时,可以在电子设备中预存每一个语音采集单元的物理位置,比如,可以为坐标信息,或者可以为所在空间的相对坐标信息。其中,坐标信息可以为经度以及维度信息,还可以配合高度信息;所述相对坐标信息可以以当前空间为基础参考坐标,然后以在该空间内所在位置及高度作为相对坐标信息。
另外,基于目标位置,确定是否针对语音数据进行解析,可以为,根据预设的不进行语音数据的处理的子空间坐标,确定是否对语音数据进行解析;比如,首先设置在某些子空间内不对语音数据进行处理,这些子空间可以为客厅或者洗手间,这些地方可以分时段的不对语音数据进行处理,或者,可以根据用户选取开启或关闭对语音数据进行处理的功能。
进一步地,当采集到语音数据的时候,可能存在多个语音采集单元都能够采集到语音数据,在不同的语音采集单元中可以采集到不同的音频幅度特征,该音频幅度特征可以用于描述不同语音采集单元采集到声音的大小。
基于不同语音采集单元的物理位置,以及采集到的声音的大小,计算得到当前发出语音数据的目标位置。比如,参见图9,可以在电子设备中建立一个矢量图,将声音的幅度特征作为半径,然后基于采集到语音数据的语音采集单元的位置为中心,以半径画圆,找到多个语音采集单元对应的圆的交点,将该交点作为目标位置。
本场景中,在判断出存在目标用户时,可以仅对目标用户发出的语音信息进行解析,或者,可以对所有用户的语音数据均进行解析,但是仅提取目标用户的解析结果。
需要指出的是语音数据的解析结果为包含有信息内容的解析结果,并非仅指语音特征信息。比如,提取目标用户的语音数据,然后对语音数据进行分析提取得到具体的内容;具体的信息内容可以为用户发出的指令,可以为“开启XX应用”这类具体的有所指代的内容。
然后基于具体的解析结果进行处理,以得到对应的响应信息。
基于所述解析结果进行处理得到针对所述语音的响应信息,可以为基于解析得到的语音进行响应,也就是说,根据语音的语义判断当前用户所要得到什么,比如,当用户发出的语音为“笔记本打开XX应用”,那么相应的,可以得到的响应为笔记本“开启XX应用”。
进一步地,响应信息则是在所述电子设备得到响应结果的时候,将响应结果反馈给用户,具体的响应信息可以理解为一条语音提示信息,比如,还如前述场景,响应信息可以为“XX应用已开启”。
需要理解的是,响应信息为基于响应结果得到的信息,或者,理解为一条语音提示信息。响应信息的具体内容与响应结果相关,比如,当用户发出的语音数据,无法得到对应的响应结果时,响应信息可以提示为“处理失败”。具体的响应信息的内容与其处理场景有关,这里不进行穷举。
另外,得到响应信息的方法可以基于预设的响应信息与响应结果之间的关系列表确定,比如,在电子设备中设置一个列表,通过该列表得知多种应用对应的响应结果所需要输出的响应信息。当然,该列表中响应信息与响应结果之间的对应关系,还可以随着电子设备中安装或卸载应用的情况进行更新,比如,电子设备中又新安装了一个应用,那么就更新响应信息与响应结果之间的对应关系;若电子设备中卸载了一个应用,可以将该应用对应的多种响应结果及其对应的响应信息进行删除。
在设置语音采集单元的时候,还可以在相应的位置处设置语音输出单元;其中,语音输出单元可以为一个扬声器。
进一步地,语音输出单元与语音采集单元可以设置为1:1的数量配置,也就是说,在一个语音采集单元旁边设置一个语音输出单元,这种场景下,语音输出单元的物理位置可以类似的认为成语音采集单元的物理位置。
语音输出单元与语音采集单元之间的数量配比也可以不是1:1,也就是说,语音输出单元的数量可以多于或少于语音采集单元。但是,在一个空间中,需要设置语音输出单元。
另外,与所述至少部分语音采集单元处于相同空间的语音输出单元,需要说明的是,当语音采集单元与语音输出单元为相同物理位置的配置的时候,可以从采集到语音数据的至少部分语音采集单元所对应的多个语音输出单元中,选取得到一个目标语音输出单元进行响应信息的输出。
确定语音输出单元是否与至少部分语音采集单元处于相同空间的方法,可以为:
基于所述至少部分语音采集单元的物理位置,以及至少一个语音输出单元的物理位置,选取与所述至少部分语音采集单元的距离最小的语音输出单元,输出所述响应信息;
或者,
基于所述至少部分语音采集单元的物理位置,选取与所述至少部分语音采集单元之间的距离小于距离门限值的至少一个语音输出单元,输出所述响应信息。
根据电子设备内预设的每一个语音采集单元的物理位置,以及每一个语音输出单元的物理位置,基于至少部分语音采集单元中每一个语音采集单元与语音输出单元之间距离最小的一个或多个语音输出单元,输出响应信息;或者,选取距离小于门限值的一个或多个语音输出单元输出响应信息。
可见,通过采用上述方案,电子设备就能够基于多个语音采集单元中的至少部分语音采集单元采集得到的语音数据,得到相应的解析结果,并根据解析结果得到对应的响应结果,基于与至少部分语音采集单元处于相同空间的语音输出单元输出响应信息。如此,就能够提升用户使用电子设备的便利性,使得操作电子设备的场景更加丰富,提升了用户的使用效率。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,装置,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种信息处理方法,应用于电子设备,所述电子设备能够与至少一个语音采集单元建立通信连接,所述至少一个语音采集单元中至少部分语音采集单元与所述电子设备所处的物理位置不同,所述方法包括:
获取至少一个语音采集单元中至少部分语音采集单元采集得到的语音数据;
针对采集得到的语音数据进行解析得到解析结果,基于所述解析结果进行处理得到针对所述语音的响应信息;
通过与所述至少部分语音采集单元处于相同空间的语音输出单元,输出所述响应信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
针对采集得到的语音数据提取得到所述语音数据对应的语音特征信息;
基于所述语音数据对应的语音特征信息,检测所述语音数据是否由至少两个用户发出;
当所述语音数据由至少两个用户发出时,获取每一个用户的身份特征。
3.根据权利要求1所述的方法,其特征在于,所述针对采集得到的语音数据进行解析得到解析结果,基于所述解析结果进行处理得到针对所述语音的响应信息,还包括:
针对采集得到的语音数据提取到所述语音数据对应的语音特征信息;
基于所述语音数据对应的语音特征信息,检测所述语音数据是否由至少一个用户发出;
当所述语音数据有至少一个用户发出时,基于所述语音特征信息判断所述至少一个用户中是否存在目标用户;
当至少一个用户中存在目标用户时,基于所述目标用户的语音数据的解析结果进行处理得到针对所述语音的响应信息;否则,不对所述解析结果进行处理。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取发出所述语音数据的目标位置;
基于所述语音数据所处的目标位置,确定是否针对所述语音数据进行解析。
5.根据权利要求1所述的方法,其特征在于,所述电子设备还能够与至少一个语音输出单元建立通信连接,所述至少一个语音输出单元中至少部分语音采集单元与所述电子设备所处的物理位置不同;
相应的,所述通过与所述至少部分语音采集单元处于相同空间的语音输出单元,输出所述响应信息还包括:
基于所述至少部分语音采集单元的物理位置,以及至少一个语音输出单元的物理位置,选取与所述至少部分语音采集单元的距离最小的语音输出单元,输出所述响应信息;
或者,
基于所述至少部分语音采集单元的物理位置,选取与所述至少部分语音采集单元之间的距离小于距离门限值的至少一个语音输出单元,输出所述响应信息。
6.一种电子设备,所述电子设备能够与至少一个语音采集单元建立通信连接,所述至少一个语音采集单元中至少部分语音采集单元与所述电子设备所处的物理位置不同,其特征在于,所述电子设备包括:
数据获取单元,用于获取至少一个语音采集单元中至少部分语音采集单元采集得到的语音数据;
处理单元,用于针对采集得到的语音数据进行解析得到解析结果,基于所述解析结果进行处理得到针对所述语音的响应信息;
输出控制单元,用于通过与所述至少部分语音采集单元处于相同空间的语音输出单元,输出所述响应信息。
7.根据权利要求6所述的电子设备,其特征在于,所述处理单元,用于针对采集得到的语音数据提取得到所述语音数据对应的语音特征信息;基于所述语音数据对应的语音特征信息,检测所述语音数据是否由至少两个用户发出;当所述语音数据由至少两个用户发出时,获取每一个用户的身份特征。
8.根据权利要求6所述的电子设备,其特征在于,所述处理单元,用于针对采集得到的语音数据提取到所述语音数据对应的语音特征信息;基于所述语音数据对应的语音特征信息,检测所述语音数据是否由至少一个用户发出;当所述语音数据有至少一个用户发出时,基于所述语音特征信息判断所述至少一个用户中是否存在目标用户;当至少一个用户中存在目标用户时,基于所述目标用户的语音数据的解析结果进行处理得到针对所述语音的响应信息;否则,不对所述解析结果进行处理。
9.根据权利要求6所述的电子设备,其特征在于,所述处理单元,用于获取发出所述语音数据的目标位置;基于所述语音数据所处的目标位置,确定是否针对所述语音数据进行解析。
10.根据权利要求6所述的电子设备,其特征在于,所述电子设备还能够与至少一个语音输出单元建立通信连接,所述至少一个语音输出单元中至少部分语音采集单元与所述电子设备所处的物理位置不同;
相应的,所述输出控制单元,用于基于所述至少部分语音采集单元的物理位置,以及至少一个语音输出单元的物理位置,选取与所述至少部分语音采集单元的距离最小的语音输出单元,输出所述响应信息;
或者,
基于所述至少部分语音采集单元的物理位置,选取与所述至少部分语音采集单元之间的距离小于距离门限值的至少一个语音输出单元,输出所述响应信息。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710194226.3A CN107135445A (zh) | 2017-03-28 | 2017-03-28 | 一种信息处理方法及电子设备 |
US15/813,724 US20180285064A1 (en) | 2017-03-28 | 2017-11-15 | Information processing method and electronic apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710194226.3A CN107135445A (zh) | 2017-03-28 | 2017-03-28 | 一种信息处理方法及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107135445A true CN107135445A (zh) | 2017-09-05 |
Family
ID=59721403
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710194226.3A Pending CN107135445A (zh) | 2017-03-28 | 2017-03-28 | 一种信息处理方法及电子设备 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20180285064A1 (zh) |
CN (1) | CN107135445A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109003609A (zh) * | 2018-08-15 | 2018-12-14 | 珠海格力电器股份有限公司 | 语音设备、智能语音系统、设备控制方法及装置 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117632482A (zh) | 2017-12-08 | 2024-03-01 | 谷歌有限责任公司 | 数字语音助理计算设备当中的信号处理协调 |
US10971173B2 (en) | 2017-12-08 | 2021-04-06 | Google Llc | Signal processing coordination among digital voice assistant computing devices |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104049721A (zh) * | 2013-03-11 | 2014-09-17 | 联想(北京)有限公司 | 信息处理方法及电子设备 |
CN105206275A (zh) * | 2015-08-31 | 2015-12-30 | 小米科技有限责任公司 | 一种设备控制方法、装置及终端 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6219645B1 (en) * | 1999-12-02 | 2001-04-17 | Lucent Technologies, Inc. | Enhanced automatic speech recognition using multiple directional microphones |
US20040215453A1 (en) * | 2003-04-25 | 2004-10-28 | Orbach Julian J. | Method and apparatus for tailoring an interactive voice response experience based on speech characteristics |
US8880047B2 (en) * | 2005-08-03 | 2014-11-04 | Jeffrey C. Konicek | Realtime, location-based cell phone enhancements, uses, and applications |
US8042961B2 (en) * | 2007-12-02 | 2011-10-25 | Andrew Massara | Audio lamp |
BR112013024734A2 (pt) * | 2011-03-30 | 2016-12-27 | Koninkl Philips Nv | método para determinar a distância e/ou qualidade acústica entre um dispositivo móvel, método para reduzir o consumo de energia de um dispositivo móvel e sistema |
US9569593B2 (en) * | 2012-03-08 | 2017-02-14 | Nuance Communications, Inc. | Methods and apparatus for generating clinical reports |
US9245527B2 (en) * | 2013-10-11 | 2016-01-26 | Apple Inc. | Speech recognition wake-up of a handheld portable electronic device |
US20150228281A1 (en) * | 2014-02-07 | 2015-08-13 | First Principles,Inc. | Device, system, and method for active listening |
EP3111332B1 (en) * | 2014-02-24 | 2018-08-29 | Hewlett-Packard Development Company, L.P. | Privacy zone |
US9338493B2 (en) * | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9965685B2 (en) * | 2015-06-12 | 2018-05-08 | Google Llc | Method and system for detecting an audio event for smart home devices |
US20160373909A1 (en) * | 2015-06-17 | 2016-12-22 | Hive Life, LLC | Wireless audio, security communication and home automation |
US9898250B1 (en) * | 2016-02-12 | 2018-02-20 | Amazon Technologies, Inc. | Controlling distributed audio outputs to enable voice output |
-
2017
- 2017-03-28 CN CN201710194226.3A patent/CN107135445A/zh active Pending
- 2017-11-15 US US15/813,724 patent/US20180285064A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104049721A (zh) * | 2013-03-11 | 2014-09-17 | 联想(北京)有限公司 | 信息处理方法及电子设备 |
CN105206275A (zh) * | 2015-08-31 | 2015-12-30 | 小米科技有限责任公司 | 一种设备控制方法、装置及终端 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109003609A (zh) * | 2018-08-15 | 2018-12-14 | 珠海格力电器股份有限公司 | 语音设备、智能语音系统、设备控制方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
US20180285064A1 (en) | 2018-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101954550B1 (ko) | 음량조절 방법, 시스템, 디바이스 및 컴퓨터 저장매체 | |
US10805470B2 (en) | Voice-controlled audio communication system | |
US10062304B1 (en) | Apparatus and method for wireless sound recognition to notify users of detected sounds | |
US20180103376A1 (en) | Device and method for authenticating a user of a voice user interface and selectively managing incoming communications | |
CN109473095B (zh) | 一种智能家居控制系统及控制方法 | |
CN112053683A (zh) | 一种语音指令的处理方法、设备及控制系统 | |
CN110875045A (zh) | 一种语音识别方法、智能设备和智能电视 | |
CN113010139B (zh) | 一种投屏方法、装置及电子设备 | |
CN107135445A (zh) | 一种信息处理方法及电子设备 | |
CN108932947B (zh) | 语音控制方法及家电设备 | |
WO2021042799A1 (zh) | 一种身份识别预处理、身份识别方法及设备 | |
CN105022297A (zh) | 一种音箱参数配置方法、移动终端、服务器及系统 | |
CN108124130A (zh) | 一种门铃提醒方法、装置、计算机设备及可读存储介质 | |
CN113709629A (zh) | 频响参数调节方法、装置、设备及存储介质 | |
CN112420043A (zh) | 基于语音的智能唤醒方法、装置、电子设备及存储介质 | |
CN116582382A (zh) | 智能设备控制方法、装置、存储介质及电子设备 | |
CN112700770A (zh) | 语音控制方法、音箱设备、计算设备和存储介质 | |
KR20060102601A (ko) | 로봇 컨텐츠 제공 서비스 시스템 및 그 방법 | |
CN111596557B (zh) | 设备控制方法、装置、电子设备及计算机可读存储介质 | |
CN104200817A (zh) | 语音控制方法和系统 | |
CN109791476A (zh) | 通信装置 | |
KR20200092480A (ko) | Em 신호의 특징을 등록하여 외부 장치를 식별하는 방법 및 상기 방법을 적용한 전자 장치 | |
CN109729209A (zh) | 智能通讯的方法、装置、终端设备及存储介质 | |
CN116504246B (zh) | 基于蓝牙设备的语音遥控方法、设备、存储介质及装置 | |
CN111596556B (zh) | 设备控制方法、装置、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170905 |