CN111145775A - 语音分离方法和装置及系统、存储介质 - Google Patents
语音分离方法和装置及系统、存储介质 Download PDFInfo
- Publication number
- CN111145775A CN111145775A CN201911320561.9A CN201911320561A CN111145775A CN 111145775 A CN111145775 A CN 111145775A CN 201911320561 A CN201911320561 A CN 201911320561A CN 111145775 A CN111145775 A CN 111145775A
- Authority
- CN
- China
- Prior art keywords
- recording device
- voice
- voice information
- sound
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000926 separation method Methods 0.000 title claims abstract description 57
- 230000008859 change Effects 0.000 claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 41
- 238000004891 communication Methods 0.000 claims description 22
- 238000001514 detection method Methods 0.000 claims description 9
- 238000004806 packaging method and process Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 7
- 230000003993 interaction Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 10
- 230000001960 triggered effect Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/0308—Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种语音分离方法和装置及系统、存储介质。其中,该方法包括:检测安装在目标设备上的第一录音装置的姿态变化;在检测到第一录音装置的姿态变化到目标姿态的情况下,控制第一录音装置进入语音采集状态,并向与第一录音装置匹配的第二录音装置发送采集指令,其中,采集指令用于指示第二录音装置进入语音采集状态;获取第一录音装置所采集到的第一语音信息,及第二录音装置所采集到的第二语音信息,其中,第一语音信息为位于第一录音装置采集范围内的第一角色音源对象的语音信息,第二语音信息为佩戴有第二录音装置的第二角色音源对象的语音信息。本发明解决了相关技术语音分离操作的复杂度较高的技术问题。
Description
技术领域
本发明涉及计算机领域,具体而言,涉及一种语音分离方法和装置及系统、存储介质。
背景技术
在很多服务行业,通常会有对服务人员提供服务的过程进行录音并对录音进行分析的需求。但是在相关技术提供的语音识别方法,很难将服务过程中不同角色的声音进行区分,从而导致语音分离操作复杂度高的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种语音分离方法和装置及系统、存储介质,以至少解决相关技术语音分离操作的复杂度较高的技术问题。
根据本发明实施例的一个方面,提供了一种语音分离方法,包括:检测安装在目标设备上的第一录音装置的姿态变化;在检测到上述第一录音装置的姿态变化到目标姿态的情况下,控制上述第一录音装置进入语音采集状态,并向与上述第一录音装置匹配的第二录音装置发送采集指令,其中,上述采集指令用于指示上述第二录音装置进入语音采集状态;获取上述第一录音装置所采集到的第一语音信息,及上述第二录音装置所采集到的第二语音信息,其中,上述第一语音信息为位于上述第一录音装置采集范围内的第一角色音源对象的语音信息,上述第二语音信息为佩戴有上述第二录音装置的第二角色音源对象的语音信息。
根据本发明实施例的另一方面,还提供了一种语音分离装置,包括:检测单元,用于检测安装在目标设备上的第一录音装置的姿态变化;第一控制单元,用于在检测到上述第一录音装置的姿态变化到目标姿态的情况下,控制上述第一录音装置进入语音采集状态,并向与上述第一录音装置匹配的第二录音装置发送采集指令,其中,上述采集指令用于指示上述第二录音装置进入语音采集状态;分离获取单元,用于获取上述第一录音装置所采集到的第一语音信息,及上述第二录音装置所采集到的第二语音信息,其中,上述第一语音信息为位于上述第一录音装置采集范围内的第一角色音源对象的语音信息,上述第二语音信息为佩戴有上述第二录音装置的第二角色音源对象的语音信息。
根据本发明实施例的又一方面,还提供了一种语音分离系统,包括:水平仪,安装在目标设备上,用于检测上述目标设备的外壳表面相对水平面的角度变化;第一录音装置,垂直安装在上述目标设备的上述外壳表面上,与上述水平仪链接,用于采集第一角色音源对象的语音信息;第二录音装置,佩戴在第二角色音源对象身上,用于采集上述第二角色音源对象的语音信息;通信部件,用于在上述第一录音装置及上述第二录音装置之间进行数据通信。
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述语音分离方法。
在本发明实施例中,在检测到安装在目标设备上的第一录音装置的姿态变化到目标姿态的情况下,控制第一录音装置进入语音采集状态,并通知与第一录音装置匹配的第二录音装置进入语音采集状态,然后获取通过第一录音装置所采集到的第一角色音源对象的第一语音信息,及通过第二录音装置所采集到的第二角色音源对象的第二语音信息,从而实现直接利用对目标设备上的第一录音装置的姿态变化检测的结果,来触发第一录音装置及第二录音装置开始进入语音采集状态,以通过分体式的录音装置分别采集到不同角色音源对象各自的语音信息,而无需在采集到全部的语音交互内容之后再复杂的识别分离操作,达到简化语音分离操作的目的,进而克服相关技术语音分离操作的复杂度较高的问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的语音分离方法的流程图;
图2是根据本发明实施例的一种可选的语音分离方法的场景示意图;
图3是根据本发明实施例的一种可选的语音分离方法的示意图;
图4是根据本发明实施例的一种可选的语音分离装置的结构示意图;
图5是根据本发明实施例的一种可选的语音分离系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种语音分离方法,如图1所示,上述语音分离方法包括:
S102,检测安装在目标设备上的第一录音装置的姿态变化;
S104,在检测到第一录音装置的姿态变化到目标姿态的情况下,控制第一录音装置进入语音采集状态,并向与第一录音装置匹配的第二录音装置发送采集指令,其中,采集指令用于指示第二录音装置进入语音采集状态;
S106,获取第一录音装置所采集到的第一语音信息,及第二录音装置所采集到的第二语音信息,其中,第一语音信息为位于第一录音装置采集范围内的第一角色音源对象的语音信息,第二语音信息为佩戴有第二录音装置的第二角色音源对象的语音信息。
可选地,在本实施例中,上述语音分离方法可以但不限于应用于至少两个角色音源对象之间的语音交互过程中。比如,在服务人员与顾客两种角色之间进行交易服务/咨询服务等业务服务的语音交互过程中,可以采用上述语音分离方法来对两个角色的语音内容进行直接分离。也就是说,在检测到安装在目标设备上的第一录音装置的姿态变化到目标姿态的情况下,控制第一录音装置进入语音采集状态,并通知与第一录音装置匹配的第二录音装置进入语音采集状态,然后获取通过第一录音装置所采集到的第一角色音源对象的第一语音信息,及通过第二录音装置所采集到的第二角色音源对象的第二语音信息,从而实现直接利用对目标设备上的第一录音装置的姿态变化检测的结果,来触发第一录音装置及第二录音装置开始进入语音采集状态,以通过分体式的录音装置分别采集到不同角色音源对象各自的语音信息,而无需在采集到全部的语音交互内容之后再复杂的识别分离操作,达到简化语音分离操作的目的,进而克服相关技术语音分离操作的复杂度较高的问题。
可选地,在本实施例中,上述目标设备可以但不限于是在提供业务服务的服务人员所持有的终端设备,如笔记本电脑、平板电脑等。上述第一录音装置可以但不限于固定在上述目标设备的外壳表面。这里录音装置可以包括但不限于录音笔,该录音笔的一端用于安装固定,另一端设置有用于采集语音信息的麦克风。
例如,假设目标设备为服务人员所使用的笔记本电脑。如图2所示,在该服务人员使用的笔记本电脑200的外壳表面上安装有第一录音装置202,该第一录音装置202朝向顾客,用于采集顾客的语音信息。此外,在服务人员身上还佩戴有第二录音装置204,用于采集服务人员的语音信息。
此外,在本实施例中,在目标设备的外壳表面还封装有用于检测姿态变化的水平仪,其中,上述录音装置与水平仪垂直安装。可选地,在本实施例中,上述水平仪和第一录音装置可以但不限于是分体式装置,也可以但不限于为一体式装置,例如整体构成一个T型装置。
例如,如图3所示,这里的T型装置的横向可以是封装有水平仪306的封装部件308,用于将该T型装置固定在目标设备的外壳(如翻盖)表面上;竖向是录音笔304,该录音笔304的顶端为麦克风302。也就是说,在检测到目标设备的外壳发生姿态变化时,垂直于外壳的第一录音装置(即录音笔304)的姿态也将随之发生变化。
可选地,在本实施例中,上述水平仪可以用于检测目标设备的外壳的角度变化,也即用于检测垂直于外壳的第一录音装置的角度变化。从而实现利用该角度变化,判定上述目标设备是否被开启使用,以便于及时触发第一录音装置进入语音采集状态。
可选地,在本实施例中,上述第一录音装置与第二录音装置可以但不限于通过无线通信方式进行数据传输。比如,第一录音装置与第二录音装置预先实现蓝牙配对链接。进一步,在第一录音装置进入语音采集状态之后,通过上述蓝牙链接可以通知第二录音装置也进入语音采集状态,从而保证两个录音装置可以同时进入语音采集状态,开始同步采集语音信息。
具体结合以下示例进行说明:
S1,在服务人员使用的笔记本电脑上安装第一录音装置,其中,这里第一录音装置可以为图3所示T型装置中安装有麦克风的录音笔,此外,该T型装置中还包括封装有水平仪的封装部件,二者是垂直关系。服务人员身上佩戴第二录音装置。
S2,在第一录音装置与第二录音装置之间进行蓝牙配对链接。
S3,在检测到笔记本电脑被打开时,外壳上安装的T型装置中的水平仪将检测到角度变化,在角度变化到目标角度时,上述T型装置上的麦克风将会朝向顾客。此时控制T型装置中录音笔进入语音采集状态。
S4,在确定T型装置中的录音笔进入语音采集状态之后,生成用于指示启动第二录音装置进行语音采集的采集指令,并将该采集指令通过蓝牙链接发送给服务人员身上佩戴的第二录音装置,以控制打开该第二录音装置的录音开关,使得第二录音装置进入语音采集状态。
S5,通过第一录音装置采集顾客的语音信息,通过第二录音装置采集服务人员的语音信息。
S6,获取第一录音装置采集到的顾客的语音信息,及第二录音装置采集到的服务人员的语音信息,并按照采集时间进行排列以建立二者之间的关联关系,从而生成与当前语音交互场景匹配的语音文件。
通过本申请提供的实施例,在检测到安装在目标设备上的第一录音装置的姿态变化到目标姿态的情况下,控制第一录音装置进入语音采集状态,并通知与第一录音装置匹配的第二录音装置进入语音采集状态,然后获取通过第一录音装置所采集到的第一角色音源对象的第一语音信息,及通过第二录音装置所采集到的第二角色音源对象的第二语音信息,从而实现直接利用对目标设备上的第一录音装置的姿态变化检测的结果,来触发第一录音装置及第二录音装置开始进入语音采集状态,以通过分体式的录音装置分别采集到不同角色音源对象各自的语音信息,而无需在采集到全部的语音交互内容之后再复杂的识别分离操作,达到简化语音分离操作的目的,进而克服相关技术语音分离操作的复杂度较高的问题。
作为一种可选的方案,检测安装在目标设备上的第一录音装置的姿态变化包括:
S1,检测第一录音装置相对水平面的角度变化;
S2,在检测第一录音装置相对水平面达到目标角度的情况下,确定检测到第一录音装置的姿态变化到目标姿态。
可选地,在本实施例中,上述姿态变化可以包括但不限于角度变化、摆放位置变化等。
可选地,在本实施例中,在检测安装在目标设备上的第一录音装置的姿态变化之前,还包括:在目标设备的外壳表面封装水平仪,其中,水平仪用于检测外壳表面相对水平面的角度变化;将第一录音装置垂直于外壳表面固定。
需要说明的是,在本实施例中,由于目标设备的外壳表面封装的水平仪与第一录音装置之间的安装关系为相互垂直,则可以通过目标设备的外壳表面封装的水平仪检测到的目标设备的外壳的角度变化,来检测第一录音装置相对水平面的角度变化。比如,在目标设备的外壳相对水平面垂直的情况下,则可间接确定上述第一录音装置相对水平面平行。
此外,在本实施例中,上述第一录音装置与水平仪可以是一体式装置,如图3所示T型装置;此外,上述第一录音装置与水平仪还可以是分体式装置,比如水平仪封装在目标设备的外壳表面的A点,第一录音装置垂直于目标设备的外壳表面,固定在B点。其中A点与B点可以为同一位置,也可以为不同位置,本实施例中对此不作限定。
通过本申请提供的实施例,通过上述水平仪和第一录音装置的相对位置关系,来实现利用水平仪检测第一录音装置的角度变化,从而便于根据上述角度变化来自动触发第一录音装置被开启进入语音采集状态,进而达到简化对第一录音装置的控制操作的目的。
作为一种可选的方案,在控制第一录音装置进入语音采集状态,并向与第一录音装置匹配的第二录音装置发送采集指令之后,还包括:
S1,控制第一录音装置采集第一角色音源对象的语音信息,得到第一语音信息,其中,第一角色音源对象所在对象位置与第一录音装置所在位置之间的距离小于第一阈值,第一录音装置的采集方向朝向第一角色音源对象。
可选地,在本实施例中,上述第一角色音源对象可以但不限于位于第一录音装置的采集范围内,其中,该采集范围的判定条件可以包括但不限于:采集距离的判定条件和采集方向的判定条件。例如,第一角色音源对象所在对象位置与第一录音装置所在位置之间的距离小于第一阈值,第一角色音源对象所在方位与第一录音装置的方向朝向一致。
通过本申请提供的实施例,在第一角色音源对象靠近第一录音装置,且位于第一录音装置的朝向上的情况下,将进一步保证采集到的第一语音信息的清晰度和准确度。
作为一种可选的方案,在控制第一录音装置进入语音采集状态,并向与第一录音装置匹配的第二录音装置发送采集指令之前,还包括:
S1,在第一录音装置与第二录音装置之间建立通信链接,其中,通信链接用于从第一录音装置向第二录音装置传输采集指令,还用于从第二录音装置向第一录音装置传输第二语音信息。
可选地,在本实施例中,上述通信链接可以但不限于是无线通信链接,如蓝牙链接。
例如,在第一录音装置与第二录音之间进行蓝牙配对连接,并使得二者保持该连接关系。在检测到第一录音装置进入语音采集状态之后,则自动触发生成用于指示第二录音装置进入语音采集状态的采集指令,并将该采集指令通过上述蓝牙链接发送给第二录音装置,以使其打开录音开关。进一步,在第二录音装置采集到第二角色音源对象的第二语音信息之后,还可以通过上述蓝牙链接发送给第一录音装置或第一录音装置所在目标设备中。
通过本申请提供的实施例,通过预先建立通信链接来使得第一录音装置与第二录音装置可以及时实现数据交互通信,保证数据传输的效率,避免数据交互延迟,进而达到实时记录语音信息的目的。
作为一种可选的方案,在获取第一录音装置所采集到的第一语音信息,及第二录音装置所采集到的第二语音信息之后,还包括:
S1,根据第一语音信息对应的第一采集时间及第二语音信息对应的第二采集时间,建立第一语音信息及第二语音信息之间的关联关系,以生成语音文件。
通过本申请提供的实施例,通过上述分体式的第一录音装置和第二录音装置,分别采集不同角色音源对象的第一语音信息和第二语音信息,从而实现从音源开始分离采集到的语音信息,而无需再执行额外的语音分离操作,从而达到简化语音分离操作,提高语音分离效率的效果。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的另一个方面,还提供了一种用于实施上述语音分离方法的语音分离装置。如图4所示,该装置包括:
1)检测单元402,用于检测安装在目标设备上的第一录音装置的姿态变化;
2)第一控制单元404,用于在检测到第一录音装置的姿态变化到目标姿态的情况下,控制第一录音装置进入语音采集状态,并向与第一录音装置匹配的第二录音装置发送采集指令,其中,采集指令用于指示第二录音装置进入语音采集状态;
3)分离获取单元406,用于获取第一录音装置所采集到的第一语音信息,及第二录音装置所采集到的第二语音信息,其中,第一语音信息为位于第一录音装置采集范围内的第一角色音源对象的语音信息,第二语音信息为佩戴有第二录音装置的第二角色音源对象的语音信息。
可选地,在本实施例中,上述语音分离装置可以但不限于应用于至少两个角色音源对象之间的语音交互过程中。比如,在服务人员与顾客两种角色之间进行交易服务/咨询服务等业务服务的语音交互过程中,可以采用上述语音分离方法来对两个角色的语音内容进行直接分离。也就是说,在检测到安装在目标设备上的第一录音装置的姿态变化到目标姿态的情况下,控制第一录音装置进入语音采集状态,并通知与第一录音装置匹配的第二录音装置进入语音采集状态,然后获取通过第一录音装置所采集到的第一角色音源对象的第一语音信息,及通过第二录音装置所采集到的第二角色音源对象的第二语音信息,从而实现直接利用对目标设备上的第一录音装置的姿态变化检测的结果,来触发第一录音装置及第二录音装置开始进入语音采集状态,以通过分体式的录音装置分别采集到不同角色音源对象各自的语音信息,而无需在采集到全部的语音交互内容之后再复杂的识别分离操作,达到简化语音分离操作的目的,进而克服相关技术语音分离操作的复杂度较高的问题。
本方案中的实施例,可以但不限于参照上述方法实施例,本实施例中对此不作任何限定。
作为一种可选的方案,检测单元402包括:
1)检测模块,用于检测第一录音装置相对水平面的角度变化;
2)确定模块,用于在检测第一录音装置相对水平面达到目标角度的情况下,确定检测到第一录音装置的姿态变化到目标姿态。
本方案中的实施例,可以但不限于参照上述方法实施例,本实施例中对此不作任何限定。
作为一种可选的方案,还包括:
1)封装单元,用于在检测安装在目标设备上的第一录音装置的姿态变化之前,在目标设备的外壳表面封装水平仪,其中,水平仪用于检测外壳表面相对水平面的角度变化;
2)固定单元,用于将第一录音装置垂直于外壳表面固定。
本方案中的实施例,可以但不限于参照上述方法实施例,本实施例中对此不作任何限定。
作为一种可选的方案,还包括:
1)第二控制单元,用于在控制第一录音装置进入语音采集状态,并向与第一录音装置匹配的第二录音装置发送采集指令之后,控制第一录音装置采集第一角色音源对象的语音信息,得到第一语音信息,其中,第一角色音源对象所在对象位置与第一录音装置所在位置之间的距离小于第一阈值,第一录音装置的采集方向朝向第一角色音源对象。
本方案中的实施例,可以但不限于参照上述方法实施例,本实施例中对此不作任何限定。
作为一种可选的方案,还包括:
1)第一建立单元,用于在控制第一录音装置进入语音采集状态,并向与第一录音装置匹配的第二录音装置发送采集指令之前,在第一录音装置与第二录音装置之间建立通信链接,其中,通信链接用于从第一录音装置向第二录音装置传输采集指令,还用于从第二录音装置向第一录音装置传输第二语音信息。
本方案中的实施例,可以但不限于参照上述方法实施例,本实施例中对此不作任何限定。
作为一种可选的方案,还包括:
1)第二建立单元,用于在获取第一录音装置所采集到的第一语音信息,及第二录音装置所采集到的第二语音信息之后,根据第一语音信息对应的第一采集时间及第二语音信息对应的第二采集时间,建立第一语音信息及第二语音信息之间的关联关系,以生成语音文件。
本方案中的实施例,可以但不限于参照上述方法实施例,本实施例中对此不作任何限定。
根据本发明实施例的另一个方面,还提供了一种用于实施上述语音分离方法的语音分离系统。如图5所示,该装置包括:
1)水平仪502,安装在目标设备上,用于检测目标设备的外壳表面相对水平面的角度变化;
2)第一录音装置504,垂直安装在目标设备的外壳表面上,与水平仪链接,用于采集第一角色音源对象的语音信息;
3)第二录音装置506,佩戴在第二角色音源对象身上,用于采集第二角色音源对象的语音信息;
4)通信部件508,用于在第一录音装置及第二录音装置之间进行数据通信。
需要说明的是,水平仪502与第一录音装置504可以为一体式装置,也可以是分体式装置。如图5所示,水平仪502与第一录音装置504二者之间用虚线连接,用于表示二者之间具有关联位置关系,可以具有直接的连接关系,也可以没有直接的连接关系。此外,通信部件508可以包括但不限于有线通信链接,也可以包括但不限于无线通信链接。此处不作限定。
可选地,在本实施例中,上述语音分离系统可以但不限于应用于至少两个角色音源对象之间的语音交互过程中。比如,在服务人员与顾客两种角色之间进行交易服务/咨询服务等业务服务的语音交互过程中,可以采用上述语音分离方法来对两个角色的语音内容进行直接分离。也就是说,在检测到安装在目标设备上的第一录音装置的姿态变化到目标姿态的情况下,控制第一录音装置进入语音采集状态,并通知与第一录音装置匹配的第二录音装置进入语音采集状态,然后获取通过第一录音装置所采集到的第一角色音源对象的第一语音信息,及通过第二录音装置所采集到的第二角色音源对象的第二语音信息,从而实现直接利用对目标设备上的第一录音装置的姿态变化检测的结果,来触发第一录音装置及第二录音装置开始进入语音采集状态,以通过分体式的录音装置分别采集到不同角色音源对象各自的语音信息,而无需在采集到全部的语音交互内容之后再复杂的识别分离操作,达到简化语音分离操作的目的,进而克服相关技术语音分离操作的复杂度较高的问题。
本方案中的实施例,可以但不限于参照上述方法实施例,本实施例中对此不作任何限定。
根据本发明的实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,检测安装在目标设备上的第一录音装置的姿态变化;
S2,在检测到第一录音装置的姿态变化到目标姿态的情况下,控制第一录音装置进入语音采集状态,并向与第一录音装置匹配的第二录音装置发送采集指令,其中,采集指令用于指示第二录音装置进入语音采集状态;
S3,获取第一录音装置所采集到的第一语音信息,及第二录音装置所采集到的第二语音信息,其中,第一语音信息为位于第一录音装置采集范围内的第一角色音源对象的语音信息,第二语音信息为佩戴有第二录音装置的第二角色音源对象的语音信息。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信链接可以是通过一些接口,单元或模块的间接耦合或通信链接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种语音分离方法,其特征在于,包括:
检测安装在目标设备上的第一录音装置的姿态变化;
在检测到所述第一录音装置的姿态变化到目标姿态的情况下,控制所述第一录音装置进入语音采集状态,并向与所述第一录音装置匹配的第二录音装置发送采集指令,其中,所述采集指令用于指示所述第二录音装置进入语音采集状态;
获取所述第一录音装置所采集到的第一语音信息,及所述第二录音装置所采集到的第二语音信息,其中,所述第一语音信息为位于所述第一录音装置采集范围内的第一角色音源对象的语音信息,所述第二语音信息为佩戴有所述第二录音装置的第二角色音源对象的语音信息。
2.根据权利要求1所述的方法,其特征在于,所述检测安装在目标设备上的第一录音装置的姿态变化包括:
检测所述第一录音装置相对水平面的角度变化;
在检测所述第一录音装置相对水平面达到目标角度的情况下,确定检测到所述第一录音装置的姿态变化到目标姿态。
3.根据权利要求2所述的方法,其特征在于,在所述检测安装在目标设备上的第一录音装置的姿态变化之前,还包括:
在所述目标设备的外壳表面封装水平仪,其中,所述水平仪用于检测所述外壳表面相对所述水平面的角度变化;
将所述第一录音装置垂直于所述外壳表面固定。
4.根据权利要求2所述的方法,其特征在于,在所述控制所述第一录音装置进入语音采集状态,并向与所述第一录音装置匹配的第二录音装置发送采集指令之后,还包括:
控制所述第一录音装置采集所述第一角色音源对象的语音信息,得到所述第一语音信息,其中,所述第一角色音源对象所在对象位置与所述第一录音装置所在位置之间的距离小于第一阈值,所述第一录音装置的采集方向朝向所述第一角色音源对象。
5.根据权利要求2所述的方法,其特征在于,在所述控制所述第一录音装置进入语音采集状态,并向与所述第一录音装置匹配的第二录音装置发送采集指令之前,还包括:
在所述第一录音装置与所述第二录音装置之间建立通信链接,其中,所述通信链接用于从所述第一录音装置向所述第二录音装置传输所述采集指令,还用于从所述第二录音装置向所述第一录音装置传输所述第二语音信息。
6.根据权利要求2所述的方法,其特征在于,在所述获取所述第一录音装置所采集到的第一语音信息,及所述第二录音装置所采集到的第二语音信息之后,还包括:
根据所述第一语音信息对应的第一采集时间及所述第二语音信息对应的第二采集时间,建立所述第一语音信息及所述第二语音信息之间的关联关系,以生成语音文件。
7.一种语音分离装置,其特征在于,包括:
检测单元,用于检测安装在目标设备上的第一录音装置的姿态变化;
第一控制单元,用于在检测到所述第一录音装置的姿态变化到目标姿态的情况下,控制所述第一录音装置进入语音采集状态,并向与所述第一录音装置匹配的第二录音装置发送采集指令,其中,所述采集指令用于指示所述第二录音装置进入语音采集状态;
分离获取单元,用于获取所述第一录音装置所采集到的第一语音信息,及所述第二录音装置所采集到的第二语音信息,其中,所述第一语音信息为位于所述第一录音装置采集范围内的第一角色音源对象的语音信息,所述第二语音信息为佩戴有所述第二录音装置的第二角色音源对象的语音信息。
8.一种语音分离系统,其特征在于,包括:
水平仪,安装在目标设备上,用于检测所述目标设备的外壳表面相对水平面的角度变化;
第一录音装置,垂直安装在所述目标设备的所述外壳表面上,与所述水平仪链接,用于采集第一角色音源对象的语音信息;
第二录音装置,佩戴在第二角色音源对象身上,用于采集所述第二角色音源对象的语音信息;
通信部件,用于在所述第一录音装置及所述第二录音装置之间进行数据通信。
9.根据权利要求8所述的系统,其特征在于,所述第一录音装置在接收到用于指示所述水平仪检测到的角度变化到目标角度的第一指示信息时,触发进入语音采集状态;所述第二录音装置在接收到所述第一录音装置发送的采集指令时,触发进入语音采集状态。
10.一种计算机可读的存储介质,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行所述权利要求1至6任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911320561.9A CN111145775A (zh) | 2019-12-19 | 2019-12-19 | 语音分离方法和装置及系统、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911320561.9A CN111145775A (zh) | 2019-12-19 | 2019-12-19 | 语音分离方法和装置及系统、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111145775A true CN111145775A (zh) | 2020-05-12 |
Family
ID=70518979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911320561.9A Pending CN111145775A (zh) | 2019-12-19 | 2019-12-19 | 语音分离方法和装置及系统、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111145775A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111883186A (zh) * | 2020-07-10 | 2020-11-03 | 上海明略人工智能(集团)有限公司 | 录音设备、语音采集方法及装置、存储介质及电子设备 |
CN111986715A (zh) * | 2020-08-19 | 2020-11-24 | 科大讯飞股份有限公司 | 一种录音系统及录音方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100100209A1 (en) * | 2008-10-17 | 2010-04-22 | Sanyo Electric Co., Ltd. | Sound-recording apparatus |
CN103905638A (zh) * | 2014-03-10 | 2014-07-02 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN104252330A (zh) * | 2013-06-28 | 2014-12-31 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN106448722A (zh) * | 2016-09-14 | 2017-02-22 | 科大讯飞股份有限公司 | 录音方法、装置和系统 |
CN207149252U (zh) * | 2017-08-01 | 2018-03-27 | 安徽听见科技有限公司 | 语音处理系统 |
CN110189764A (zh) * | 2019-05-29 | 2019-08-30 | 深圳壹秘科技有限公司 | 展示分离角色的系统、方法和录音设备 |
-
2019
- 2019-12-19 CN CN201911320561.9A patent/CN111145775A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100100209A1 (en) * | 2008-10-17 | 2010-04-22 | Sanyo Electric Co., Ltd. | Sound-recording apparatus |
CN104252330A (zh) * | 2013-06-28 | 2014-12-31 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN103905638A (zh) * | 2014-03-10 | 2014-07-02 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN106448722A (zh) * | 2016-09-14 | 2017-02-22 | 科大讯飞股份有限公司 | 录音方法、装置和系统 |
CN207149252U (zh) * | 2017-08-01 | 2018-03-27 | 安徽听见科技有限公司 | 语音处理系统 |
CN110189764A (zh) * | 2019-05-29 | 2019-08-30 | 深圳壹秘科技有限公司 | 展示分离角色的系统、方法和录音设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111883186A (zh) * | 2020-07-10 | 2020-11-03 | 上海明略人工智能(集团)有限公司 | 录音设备、语音采集方法及装置、存储介质及电子设备 |
CN111883186B (zh) * | 2020-07-10 | 2022-12-23 | 上海明略人工智能(集团)有限公司 | 录音设备、语音采集方法及装置、存储介质及电子设备 |
CN111986715A (zh) * | 2020-08-19 | 2020-11-24 | 科大讯飞股份有限公司 | 一种录音系统及录音方法 |
CN111986715B (zh) * | 2020-08-19 | 2024-05-31 | 科大讯飞股份有限公司 | 一种录音系统及录音方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2688296B1 (en) | Video monitoring system and method | |
CN105518755A (zh) | 安全系统、安全方法和非暂时性计算机可读介质 | |
US20190333633A1 (en) | Medical device information providing system, medical device information providing method, and program | |
CN111145775A (zh) | 语音分离方法和装置及系统、存储介质 | |
CN104503888A (zh) | 告警提示的方法及装置 | |
WO2020214412A3 (en) | Theft monitoring and identification system for self-service point of sale | |
CN104376619A (zh) | 一种监控方法和设备 | |
CN110060441A (zh) | 用于终端防盗的方法和装置 | |
JP7043601B2 (ja) | 環境モデルを生成するための方法および装置ならびに記憶媒体 | |
WO2022133099A3 (en) | Automated viewpoint detection and screen obfuscation of secure content | |
CN112817814A (zh) | 异常监控方法、系统、存储介质及电子装置 | |
CN103942903A (zh) | 一种具有防盗功能的数据采集处理装置、系统及方法 | |
CN109032911B (zh) | 用于移动设备的帧率检测方法、装置及电子设备 | |
CN110517415A (zh) | 用于输出信息的方法和装置 | |
CN110505438A (zh) | 一种排队数据的获取方法和摄像机 | |
KR20160137008A (ko) | 사용자 상황 인지 장치 및 방법 | |
CN104506734A (zh) | 一种信息展示的方法及终端 | |
CN109598488B (zh) | 群红包异常行为识别方法、装置、介质及电子设备 | |
CN111128132A (zh) | 语音分离方法和装置及系统、存储介质 | |
CN110619734A (zh) | 信息推送方法和装置 | |
CN110196633A (zh) | 使用增强现实系统提供实体位置的方法及设备 | |
CN109923562A (zh) | 经由显示装置控制向人的数据显示 | |
CN111276155B (zh) | 语音分离方法、装置及存储介质 | |
CN111210828A (zh) | 设备绑定方法和装置及系统、存储介质 | |
CN109672921A (zh) | 录制包装视频的方法、装置和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200512 |