CN113014460B - 语音处理方法、家居主控设备、语音系统及存储介质 - Google Patents
语音处理方法、家居主控设备、语音系统及存储介质 Download PDFInfo
- Publication number
- CN113014460B CN113014460B CN201911329273.XA CN201911329273A CN113014460B CN 113014460 B CN113014460 B CN 113014460B CN 201911329273 A CN201911329273 A CN 201911329273A CN 113014460 B CN113014460 B CN 113014460B
- Authority
- CN
- China
- Prior art keywords
- voice data
- voice
- distance
- determining
- home
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 37
- 238000012545 processing Methods 0.000 claims abstract description 26
- 238000000034 method Methods 0.000 claims abstract description 13
- 238000004590 computer program Methods 0.000 claims description 14
- 238000001914 filtration Methods 0.000 claims description 10
- 238000004891 communication Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/80—Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Quality & Reliability (AREA)
- Selective Calling Equipment (AREA)
Abstract
本申请涉及智能家居技术领域,具体公开了一种语音处理方法、家居主控设备、语音系统及存储介质。该方法包括:接收多个家电设备的麦克风采集的语音数据,确定每个语音数据的采集来源信息;根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据,其中,所述采集距离为家电设备与语音来源物体之间的距离;将所述至少一个语音数据确定为待处理语音数据。本申请可以通过多个家电设备上的麦克风提高语音处理的效率。
Description
技术领域
本申请涉及智能家居技术领域,尤其涉及一种语音处理方法、家居主控设备、语音系统及存储介质。
背景技术
随着物联网技术的发展,智能家居的功能变得越来越丰富,家电设备上一般都带有麦克风,用户可以使用通过家电设备的麦克风实现不同的语音功能,例如,通过一个家电设备的麦克风控制其他家电设备执行相应的功能。但是现有的家电设备上语音控制功能还不够完善,导致语音处理效率较低,因此如何提高多个家电设备之间的语音处理效率成为亟需解决的问题。
发明内容
本申请提供了一种语音处理方法、家居主控设备、语音系统及存储介质,可以通过多个家电设备上的麦克风提高语音处理的效率。
第一方面,本申请提供了一种语音处理方法,所述方法包括:
接收多个家电设备的麦克风采集的语音数据,确定每个语音数据的采集来源信息;
根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据,其中,所述采集距离为家电设备与语音来源物体之间的距离;
将所述至少一个语音数据确定为待处理语音数据。
第二方面,本申请还提供了一种家居中控设备,所述家居中控设备包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上述的语音处理方法。
第三方面,本申请还提供了一种语音系统,包括家居主控设备和多个家电设备,所述多个家电设备和所述家居主控设备通信连接;所述家电设备用于将麦克风采集的语音数据发送至所述家居主控设备;所述家居主控设备用于执行如上述的语音处理方法。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上述的语音处理方法。
本申请公开了一种语音处理方法、家居中控设备、语音系统及存储介质,所述方法包括接收多个家电设备的麦克风采集的语音数据,确定每个语音数据的采集来源信息;根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据,其中,所述采集距离为家电设备与语音来源物体之间的距离;将所述至少一个语音数据确定为待处理语音数据。本申请提供的语音处理方法可以在家电设备的麦克风采集到的语音数据中选择采集质量较高的语音数据作为待处理语音数据,可以采集到更有效的语音数据,进一步可以提高后续对待处理语音数据进行处理的处理效率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请的实施例提供的一种语音处理方法的示意流程图;
图2为本申请实施例提供的一种语音处理方法的一个场景示意;
图3为本申请实施例提供的另一种语音处理方法的示意流程图;
图4为本申请实施例提供的一种语音处理方法的另一个场景示意;
图5为本申请实施例提供的另一种语音处理方法的示意流程图;
图6为本申请实施例提供的一种语音处理方法的另一个场景示意;
图7为本申请实施例提供的另一种语音处理方法的示意流程图;
图8为本申请实施例提供的另一种语音处理方法的示意流程图;
图9是本申请的实施例提供的一种家居主控设备的结构示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
本申请的实施例提供了一种语音处理方法、家居中控设备、语音系统及存储介质。下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1是本申请的实施例提供的一种语音处理方法的示意流程图。所述语音处理方法可以是应用在家居主控设备中,家居主控设备可以是智能家居中任一具备处理功能的家电设备。示例性地,家居主控设备可以是智能电视机。所述方法包括步骤S101至步骤S103。
S101、接收多个家电设备的麦克风采集的语音数据,确定每个语音数据的采集来源信息。
其中,家电设备可以是具备麦克风功能的电子设备,家电设备可以包括:智能冰箱、智能电视、智能洗衣机、智能音箱和智能手机等等。家电设备的麦克风可以采集家电设备的周围环境中的声音,例如,用户在家电设备的周围环境里说话,家电设备的麦克风可以采集用户说话的语音数据。
需要说明的是,智能家居中具有多个家电设备,可以从中任选一个家电设备作为家居中控设备。家居中控设备用于执行本申请提供的语音处理方法,家居中控设备同时也可以作为采集语音数据的家电设备。例如,家居中控设备中的麦克风采集到语音数据后,再把语音数据发送到家居中控设备的处理器中,以便家居中控设备可以执行本申请提供的语音处理方法。家居中控设备也可以是不具备麦克风的家电设备,仅用于接收其他家电设备发送给的语音数据,并进行处理。
其他家电设备与家居中控设备建立了连接,可以是通过家居网络与家居中控设备连接,也可以是通过短距离通信方式与家居中控设备连接。示例性地,短距离通信方式可以是蓝牙和ZigBee等。其他家电设备的麦克风在采集到语音数据后,将语音数据发送给家居中控设备。
所述采集来源信息包括语音来源物体和麦克风之间的位置关系,或体现所述位置关系的语音参数信息。例如,用户站在某处说话,距离用户较近的家电设备的麦克风所采集到的语音数据,以及距离用户较远的家电设备的麦克风所采集到的语音数据,两个语音数据存在一定区别,因为两个麦克风与用户的位置关系不同,导致两个麦克风采集的语音数据的采集来源信息有所不同。
在接收到语音数据时,确定每个语音数据的采集来源信息,进而可以确定每个麦克风与语音来源物体之间的位置关系。
S102、根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据,其中,所述采集距离为家电设备与语音来源物体之间的距离。
其中,在确定来源物体和麦克风之间的位置关系后就可以确定每个麦克风和语音来源物体之间的距离。根据麦克风采集原理,距离麦克风越近的麦克风可以采集到质量越高的语音数据,包括更多的实际语音数据以及更少的噪声。
在确定语音数据的采集来源信息后,根据每个语音数据的采集来源信息确定距离来源物体最近的语音数据,可以作为待处理语音数据。
图2为本申请实施例提供的一种语音处理方法的场景示意,如图2所示,用户10站在家庭内的某处进行说话,家庭内有多个具备麦克风11的家电设备,每个家电设备的麦克风11在用户10说话时,可以采集到用户10的语音数据。根据采集距离不同,每个麦克风采集到的语音数据的采集来源信息有所不同。可以将采集距离最短的一个语音数据确定为待处理语音数据。
还可以确定采集距离最短的多个语音数据作为待处理语音数据,可以是将多个语音数据依据采集距离依据长短进行排序,将排在最后的多个语音数据确定为待处理语音数据。以便可以根据多个的待处理语音数据进行多声道的语音处理,示例性地,可以根据采集方位不同的麦克风的采集的语音数据生成立体语音。
作为本申请的一个实施方式,所述采集来源信息包括语音幅值。
其中,采集距离不同的麦克风所采集到的语音数据的语音幅值有所不同。示例性地,可以预先设置不同采集距离和语音幅值的关系模型,如此可以根据采集到的每个语音数据的语音幅值,依据所述关系模型确定所述语音数据的采集距离。在得到所有语音数据的采集距离后,就可以确定采集距离最短的至少一个语音数据。
可选地,所述根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据还可以通过如下方式实施:
从多个语音数据中确定语音幅值最大的至少一个语音数据。
其中,可以无需计算语音数据的采集距离,而是直接从多个语音数据中选择语音幅值最大的语音数据作为待处理语音数据,语音幅值越大的语音数据表示采集距离越短,如此可以确定出采集距离最短的至少一个语音数据。
作为本申请的另一个实施方式,所述采集来源信息包括语音来源物体与家电设备的方位关系信息。
其中,语音来源物体和家电设备的方位关系信息,可以体现家电设备的麦克风与语音来源物体之间的位置关系。根据语音来源物体与家电设备的方位关系信息也可以确定语音来源物体与麦克风之间的采集距离。
示例性地,可以通过家电设备上的声波设备发送声波信号以检测语音来源物体的方位角和距离,将方位角和距离作为语音来源物体与家电设备的方位关系信息。
S103、将所述至少一个语音数据确定为待处理语音数据。
其中,在确定采集距离最短的至少一个语音数据未待处理语音数据后,可以根据实际应用需求对所述待处理语音数据进行相应的处理。示例性地,可以对待处理语音数据进行语音识别,或者将待处理语音数据作为通话语音数据发送到通信终端。
本申请提供的语音处理方法可以在家电设备的麦克风采集到的语音数据中选择采集质量较高的语音数据作为待处理语音数据,可以采集到更有效的语音数据,进一步可以提高后续对待处理语音数据进行处理的处理效率。
图3为本申请实施例提供的另一种语音处理方法的示意流程图。在上述实施例的基础上,所述采集来源信息包括语音来源物体与家电设备的方位关系信息,以及对所述接收多个家电设备的麦克风采集的语音数据,确定每个语音数据的采集来源信息的操作进行了优化,如图3所示,所述方法包括:
S201、接收多个家电设备的麦克风采集的语音数据,其中,每个家电设备包括多个麦克风。
其中,家电设备上可以设置有多个麦克风,所述多个麦克风设置在家电设备上的不同位置。示例性地,多个麦克风可以是环绕麦克风。如图4所示,家电设备12上设置有第一麦克风111,第二麦克风112,第三麦克风113和第四麦克风114,四个麦克风沿着家电设备12的边缘依次设置,用户10在进行说话时,四个麦克风均可以采集到用户10的语音数据,但是因为每个麦克风的设置位置不同,其相对于用户10的位置关系也有差别,所以家电设备12上的每个麦克风所采集到的语音数据都有差别。
S202、根据每个家电设备的多个麦克风采集的语音数据以及多个麦克风在所述每个家电设备上的位置,确定语音来源物体与所述每个家电设备的方位关系信息。
根据家电设备上的每个麦克风所采集到的语音数据,以及每个麦克风在家电设备上的位置,可以确定语音来源物体与该家电设备的方位关系信息;可选地,可以是根据家电设备上每个麦克风采集的语音数据的语音幅值以及每个麦克风在家电设备上的位置,来确定语音来源物体与家电设备的方位关系信息。
示例性地,以点钟方向为例,家电设备的7点钟方向到12点钟方向依次设置有六个麦克风,其中,9点钟方向的麦克风采集到的语音数据的语音幅值最大,7点钟方向的麦克风到9点钟方向到麦克风采集的语音数据的语音幅值依次升高,9点钟方向的麦克风到12点钟方向的麦克风采集的语音数据的语音幅值依次降低。由此可以确定语音来源物体在家电设备的9点钟方向。
S203、根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据,其中,所述采集距离为家电设备与语音来源物体之间的距离。
S204、将所述至少一个语音数据确定为待处理语音数据。
上述操作的具体实施方式可以参考上文的相关描述,在此不再赘述。
可选地,如图5所示,所述根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据的操作可以通过如下方式实施:
S2031、根据语音来源物体与至少两个家电设备的方位关系信息确定所述语音来源物体的来源位置;
S2032、根据所述语音来源物体的来源位置与每个家电设备的设备位置,确定每个家电设备与语音来源物体之间的距离,得到采集距离;
S2033、从多个语音数据中确定采集距离最短的至少一个语音数据。
其中,所述方位关系信息可以包括语音来源物体与家电设备的相位角,以及所述家电设备的设备位置。家电设备的设备位置可以是预设,还可以是通过家电设备上自带的定位模块所确定的定位信息。
示例性地,语音来源物体为用户10,如图6所示,在确定用户10与一个家电设备121的方位关系信息后,从该家电设备121到用户10可以假设为一个向量;而另一个家电设备122到用户10可以假设为另一个向量;两个向量相交的位置即用户10的来源位置。所以根据语音来源物体与至少两个家电设备的方位关系信息确定所述语音来源物体的来源位置。
确定了语音来源物体的来源位置,再根据每个家电设备的设备位置,即可以确定语音来源位置与每个家电设备之间的距离,得到采集距离。进而可以从多个语音数据中确定采集距离最短的至少一个语音数据。
其中,家电设备的设备位置可以是预设的,也可以是根据家电设备上的定位模块的定位信息进行确定的。
本申请实施例提供的语音处理方法通过家电设备上的多个麦克风确定语音来源物体与家电设备的方位关系信息,可以确定语音来源物体的来源位置,进而确定采集距离,根据采集距离选择采集质量较高的语音数据作为待处理语音数据,可以采集到更有效的语音数据,进一步可以提高后续对待处理语音数据进行处理的处理效率。
作为本申请实施例提供的另一种语音处理方法,如图7所示,在上述任一实施例的基础上,在所述将所述至少一个语音数据确定为待处理语音数据之后,还包括如下操作:
S301、对所述待处理语音数据进行噪声过滤处理,以得到目标语音数据;
S302、根据所述目标语音数据进行语音识别处理。
其中,噪声过滤处理可以是对待处理语音数据进行分析,确定待处理语音数据中的噪声部分,并将待处理语音数据中的噪声数据进行去除,得到较为干净的有用语音数据。示例性地,所述待处理语音数据可以是用户的说话声音,而麦克风采集到的待处理语音数据中除了包括用户实际的人声数据,同时还采集了环境中的背景噪声。如果要对用户的声音数据进行语音识别处理,可以对待处理语音数据进行噪声过滤处理,以得到去除掉背景噪声的较为干净的人声数据,如此可以对人声数据进行语音识别处理,可以提高语音识别处理的准确性。
可选地,如图8所示,所述对所述待处理语音数据进行噪声过滤处理,以得到目标语音数据,可以通过如下方式实施:
S3011、从所述多个语音数据中确定采集距离大于预设距离的语音数据;
S3012、确定所述采集距离大于预设距离的语音数据的语音特征信息;
S3013、根据所述语音特征信息对所述待处理语音数据中进行过滤处理,以得到目标语音数据。
其中,预设距离可以是用于衡量采集质量的距离,大于预设距离的采集距离去采集会得到较弱的实际语音数据,而较强的噪声数据。
在多个家庭设备的麦克风采集的多个语音数据中,与语音来源物体相距大于预设距离的家庭设备的麦克风采集的语音数据包括较强的噪声数据和较弱的有用语音数据。
通过采集距离大于预设距离的语音数据可以去除待处理语音数据中的噪声数据。通过确定所述采集距离大于预设距离的语音数据的语音特征信息,该语音特征信息中包括较强的噪声特征。进而可以根据该语音特征信息来去除待处理语音数据中和语音特征信息相近的声音,若语音特征信息中包括较强的噪声特征,则可以去除待处理语音数据中的噪声。
可选地,还可以将所述采集距离大于预设距离的语音数据进行反向处理,反向后与所述待处理语音数据进行叠加,叠加后生成的语音数据即目标语音数据。
本申请实施例通过对所述待处理语音数据进行噪声过滤处理,以得到目标语音数据,而后根据所述目标语音数据进行语音识别处理,可以提高对待处理语音数据进行语音识别处理的准确率。
请参阅图9,图9是本申请的实施例提供的一种家居中控设备的结构示意性框图。该家居中控设备100可以是智能电视、智能冰箱或智能手机。
参阅图9,该家居中控设备100包括通过系统总线连接的处理器110与存储器120。可选地,还包括网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种语音处理方法。
处理器用于提供计算和控制能力,支撑整个家居中控设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种语音处理方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的家居中控设备的限定,具体的家居中控设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
接收多个家电设备的麦克风采集的语音数据,确定每个语音数据的采集来源信息;
根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据,其中,所述采集距离为家电设备与语音来源物体之间的距离;
将所述至少一个语音数据确定为待处理语音数据。
在一个实施例中,所述采集来源信息包括语音幅值。
在一个实施例中,所述处理器在实现所述根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据时,用于实现:
从多个语音数据中确定语音幅值最大的至少一个语音数据。
在一个实施例中,所述采集来源信息包括语音来源物体与家电设备的方位关系信息。
在一个实施例中,所述处理器在实现所述接收多个家电设备的麦克风采集的语音数据,确定每个语音数据的采集来源信息时,用于实现:
接收多个家电设备的麦克风采集的语音数据,其中,每个家电设备包括多个麦克风;
根据每个家电设备的多个麦克风采集的语音数据以及多个麦克风在所述每个家电设备上的位置,确定语音来源物体与每个家电设备的方位关系信息。
在一个实施例中,所述处理器在实现所述根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据时,用于实现:
根据语音来源物体与至少两个家电设备的方位关系信息确定所述语音来源物体的来源位置;
根据所述语音来源物体的来源位置与每个家电设备的设备位置,确定每个家电设备与语音来源物体之间的距离,得到采集距离;
从多个语音数据中确定采集距离最短的至少一个语音数据。
在一个实施例中,所述处理器在实现所述将所述至少一个语音数据确定为待处理语音数据之后,还用于实现:
对所述待处理语音数据进行噪声过滤处理,以得到目标语音数据;
根据所述目标语音数据进行语音识别处理。
在一个实施例中,所述处理器在实现所述对所述待处理语音数据进行噪声过滤处理,以得到目标语音数据时,用于实现:
从所述多个语音数据中确定采集距离大于预设距离的语音数据;
确定所述采集距离大于预设距离的语音数据的语音特征信息;
根据所述语音特征信息对所述待处理语音数据中进行过滤处理,以得到目标语音数据。
本申请的实施例中还提供一种语音系统,包括家居主控设备和多个家电设备,所述多个家电设备和所述家居主控设备通信连接;所述家电设备用于将麦克风采集的语音数据发送至所述家居主控设备;所述家居主控设备用于执行如上述任意实施例提供的语音处理方法。
本申请的实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现本申请实施例提供的任一项语音处理方法。
其中,所述计算机可读存储介质可以是前述实施例所述的家居中控设备的内部存储单元,例如所述家居中控设备的硬盘或内存。所述计算机可读存储介质也可以是所述家居中控设备的外部存储设备,例如所述家居中控设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (9)
1.一种语音处理方法,其特征在于,包括:
接收多个家电设备的麦克风采集的语音数据,确定每个语音数据的采集来源信息;
根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据,其中,所述采集距离为家电设备与语音来源物体之间的距离;
将所述至少一个语音数据确定为待处理语音数据;
从所述多个语音数据中确定采集距离大于预设距离的语音数据;
确定所述采集距离大于预设距离的语音数据的语音特征信息;
根据所述语音特征信息对所述待处理语音数据中进行过滤处理,以得到目标语音数据。
2.根据权利要求1所述的方法,其特征在于,所述采集来源信息包括语音幅值。
3.根据权利要求2所述的方法,其特征在于,所述根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据,包括:
从多个语音数据中确定语音幅值最大的至少一个语音数据。
4.根据权利要求1所述的方法,其特征在于,所述采集来源信息包括语音来源物体与家电设备的方位关系信息。
5.根据权利要求4所述的方法,其特征在于,所述接收多个家电设备的麦克风采集的语音数据,确定每个语音数据的采集来源信息,包括:
接收多个家电设备的麦克风采集的语音数据,其中,每个家电设备包括多个麦克风;
根据每个家电设备的多个麦克风采集的语音数据以及多个麦克风在所述每个家电设备上的位置,确定语音来源物体与每个家电设备的方位关系信息。
6.根据权利要求4所述的方法,其特征在于,所述根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据,包括:
根据语音来源物体与至少两个家电设备的方位关系信息确定所述语音来源物体的来源位置;
根据所述语音来源物体的来源位置与每个家电设备的设备位置,确定每个家电设备与语音来源物体之间的距离,得到采集距离;
从多个语音数据中确定采集距离最短的至少一个语音数据。
7.一种家居主控设备,其特征在于,所述家居中控设备包括存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至6中任一项所述的语音处理方法。
8.一种语音系统,其特征在于,包括家居主控设备和多个家电设备,所述多个家电设备和所述家居主控设备通信连接;
所述家电设备用于将麦克风采集的语音数据发送至所述家居主控设备;
所述家居主控设备用于执行如权利要求1至6中任一项所述的语音处理方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至6中任一项所述的语音处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911329273.XA CN113014460B (zh) | 2019-12-20 | 2019-12-20 | 语音处理方法、家居主控设备、语音系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911329273.XA CN113014460B (zh) | 2019-12-20 | 2019-12-20 | 语音处理方法、家居主控设备、语音系统及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113014460A CN113014460A (zh) | 2021-06-22 |
CN113014460B true CN113014460B (zh) | 2023-03-14 |
Family
ID=76381860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911329273.XA Active CN113014460B (zh) | 2019-12-20 | 2019-12-20 | 语音处理方法、家居主控设备、语音系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113014460B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112992140B (zh) * | 2021-02-18 | 2021-11-16 | 珠海格力电器股份有限公司 | 智能设备的控制方法、装置、设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109309607A (zh) * | 2018-10-15 | 2019-02-05 | 珠海格力电器股份有限公司 | 家电设备操作执行方法、装置、家电设备及可读存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101533090B (zh) * | 2008-03-14 | 2013-03-13 | 华为终端有限公司 | 一种阵列麦克的声音定位方法和装置 |
US10388273B2 (en) * | 2016-08-10 | 2019-08-20 | Roku, Inc. | Distributed voice processing system |
KR20180023617A (ko) * | 2016-08-26 | 2018-03-07 | 삼성전자주식회사 | 외부 기기를 제어하는 휴대 기기 및 이의 오디오 신호 처리 방법 |
CN110085233B (zh) * | 2019-04-08 | 2021-02-09 | 广东美的制冷设备有限公司 | 语音控制方法及其装置、电子设备和计算机可读存储介质 |
-
2019
- 2019-12-20 CN CN201911329273.XA patent/CN113014460B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109309607A (zh) * | 2018-10-15 | 2019-02-05 | 珠海格力电器股份有限公司 | 家电设备操作执行方法、装置、家电设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113014460A (zh) | 2021-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10629226B1 (en) | Acoustic signal processing with voice activity detector having processor in an idle state | |
CN107591152B (zh) | 基于耳机的语音控制方法、装置及其设备 | |
US20190355354A1 (en) | Method, apparatus and system for speech interaction | |
US20160187453A1 (en) | Method and device for a mobile terminal to locate a sound source | |
CN108320751B (zh) | 一种语音交互方法、装置、设备和服务器 | |
CN109087660A (zh) | 用于回声消除的方法、装置、设备以及计算机可读存储介质 | |
CN103871419A (zh) | 一种信息处理方法及电子设备 | |
CN108234793B (zh) | 一种通讯方法、装置、电子设备和存储介质 | |
CN111060874B (zh) | 一种声源定位方法、装置、存储介质及终端设备 | |
CN111077496B (zh) | 一种基于麦克风阵列的语音处理方法、装置及终端设备 | |
US20140278415A1 (en) | Voice Recognition Configuration Selector and Method of Operation Therefor | |
CN110931035B (zh) | 音频处理方法、装置、设备及存储介质 | |
CN109493883A (zh) | 一种智能设备及其智能设备的音频时延计算方法和装置 | |
CN105847566A (zh) | 移动终端音频的音量调节方法及装置 | |
WO2017000772A1 (zh) | 一种前端音频处理系统 | |
CN113014460B (zh) | 语音处理方法、家居主控设备、语音系统及存储介质 | |
CN107452398B (zh) | 回声获取方法、电子设备及计算机可读存储介质 | |
US9733714B2 (en) | Computing system with command-sense mechanism and method of operation thereof | |
CN113766385B (zh) | 耳机降噪方法及装置 | |
CN112804043B (zh) | 时钟不同步的检测方法、装置及设备 | |
CN113436613A (zh) | 语音识别方法、装置、电子设备及存储介质 | |
CN112002339B (zh) | 语音降噪方法和装置、计算机可读的存储介质及电子装置 | |
CN111988702B (zh) | 音频信号的处理方法、电子设备及存储介质 | |
CN111757211B (zh) | 降噪方法、终端设备及存储介质 | |
CN111145770B (zh) | 音频处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |