CN107346663B - 一种通话语音角色分离方法及装置 - Google Patents
一种通话语音角色分离方法及装置 Download PDFInfo
- Publication number
- CN107346663B CN107346663B CN201710586048.9A CN201710586048A CN107346663B CN 107346663 B CN107346663 B CN 107346663B CN 201710586048 A CN201710586048 A CN 201710586048A CN 107346663 B CN107346663 B CN 107346663B
- Authority
- CN
- China
- Prior art keywords
- telephone
- signal
- voltage signal
- local
- phase relation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000000926 separation method Methods 0.000 claims abstract description 24
- 238000001514 detection method Methods 0.000 claims abstract description 23
- 238000004458 analytical method Methods 0.000 claims description 22
- 238000005070 sampling Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/0308—Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
Abstract
本公开提供一种通话语音角色分离方法及装置、电话信号回路、存储设备、电子设备。所述方法包括:获取电话信号回路中信号源的电压信号,所述电话信号回路包括串接在本地话机的入户电话线上的检流电阻Rf,所述本地话机为固定电话终端;基于所述信号源的电压信号,获取所述检流电阻Rf的电压信号Vf和所述电话信号回路的电话线电压信号Vr;分析Vf和Vr的相位关系,确定出通话语音角色。如此方案,有助于提高通话语音角色分离结果的准确性和稳定性。
Description
技术领域
本公开涉及语音识别技术领域,具体地,涉及一种通话语音角色分离方法及装置、电话信号回路、存储设备、电子设备。
背景技术
随着信息技术的不断发展,人们对于高精度信息化分析的需求越来越高。基于电子设备实现的通话是人们生活中不可或缺的一部分,对应于此,通话内容的记录、分析已成为相关技术领域人员研究的热点,例如,在公众报警电话、各类热线等领域,可以对通话内容进行记录、分析,用以实现后期信息总结、检索等工作。
角色分离作为通话内容分析的一个重要步骤,其分离的准确性直接影响后续语音内容分析结果的准确性。目前,大多基于声纹特征实现角色分离,具体地,接收到语音信号后,可以先基于BIC(英文:Bayesian Information Criterion,中文:贝叶斯信息准则)对语音信号进行说话人转折点检测,将语音信号分割成多个语音片段;然后分别提取每个声音片段的声纹特征,例如,声纹特征可以为i-vector特征;最后基于声纹特征,对多个语音片段进行聚类,实现角色分离,即从语音信号中分离出通话人。
上述基于声纹特征实现角色分离的方案,在理想情况下的分离效果较好,其中,理想情况可以为语音信号质量好、两个通话人的声纹特征区别性大等。但在实际应用中,可能受当前通话环境、通话信道质量等影响,导致语音信号的质量变差;或者,可能受通话人的身体状态、心理状态等因素的影响,导致声纹特征发生变化。如此,采用现有方案进行角色分离,很难确保分离结果的准确性和稳定性。
发明内容
本公开的主要目的是提供一种通话语音角色分离方法及装置、电话信号回路、存储设备、电子设备,有助于提高通话语音角色分离结果的准确性和稳定性。
为了实现上述目的,本公开提供一种通话语音角色分离方法,包括:
获取电话信号回路中信号源的电压信号,所述电话信号回路包括串接在本地话机的入户电话线上的检流电阻Rf,所述本地话机为固定电话终端;
基于所述信号源的电压信号,获取所述检流电阻Rf的电压信号Vf和所述电话信号回路的电话线电压信号Vr;
分析Vf和Vr的相位关系,确定出通话语音角色。
可选地,所述基于所述信号源的电压信号,获取Vf和Vr,包括:
如果所述信号源的电压信号为本地话机的发话信号源VS1的电压信号V1,则,
Vr=(V1/Rz)*(RL1+RL2+RS2+Rf)
Vf=(V1/Rz)*Rf
如果所述信号源的电压信号为远地话机的发话信号源VS2的电压信号V2,则,
Vr=(V2/Rz)*(RL1+RL2+RS1+Rf)
Vf=-(V2/Rz)*Rf
其中,Rz=RS1+RS2+RL1+RL2+Rf
RS1为本地话机的源阻抗,RS2为远地话机的源阻抗,RL1、RL2为两根电话线的线路阻抗。
可选地,所述分析Vf和Vr的相位关系,确定出通话语音角色,包括:
计算Vf和Vr的相关度C;如果C表示Vf和Vr的相位关系为正相关,则确定通话语音角色为本地通话人;如果C表示Vf和Vr的相位关系为负相关,则确定通话语音角色为远地通话人;
或者,
通过相位比较器分析Vf和Vr的相位关系;如果所述相位比较器输出的结果表示Vf和Vr的相位关系为正相关,则确定通话语音角色为本地通话人;如果所述相位比较器输出的结果表示Vf和Vr的相位关系为负相关,则确定通话语音角色为远地通话人。
可选地,如果通过相关度分析所述Vf和Vr的相位关系,则Vf和Vr的相关度的计算公式为:
其中,n表示分析窗口的宽度,i表示分析窗口中第i个采样点。
本公开还提供一种通话语音角色分离装置,包括:
第一电压信号获取模块,用于获取电话信号回路中信号源的电压信号,所述电话信号回路包括串接在本地话机的入户电话线上的检流电阻Rf,所述本地话机为固定电话终端;
第二电压信号获取模块,用于基于所述信号源的电压信号,获取所述检流电阻Rf的电压信号Vf和所述电话信号回路的电话线电压信号Vr;
通话语音角色确定模块,用于分析Vf和Vr的相位关系,确定出通话语音角色。
可选地,所述第二电压信号获取模块,用于在所述信号源的电压信号为本地话机的发话信号源VS1的电压信号V1时,按照以下公式获得Vf和Vr:
Vr=(V1/Rz)*(RL1+RL2+RS2+Rf)
Vf=(V1/Rz)*Rf
所述第二电压信号获取模块,还用于在所述信号源的电压信号为远地话机的发话信号源VS2的电压信号V2时,按照以下公式获得Vf和Vr:
Vr=(V2/Rz)*(RL1+RL2+RS1+Rf)
Vf=-(V2/Rz)*Rf
其中,Rz=RS1+RS2+RL1+RL2+Rf
RS1为本地话机的源阻抗,RS2为远地话机的源阻抗,RL1、RL2为两根电话线的线路阻抗。
可选地,所述通话语音角色确定模块,用于计算Vf和Vr的相关度C;如果C表示Vf和Vr的相位关系为正相关,则确定通话语音角色为本地通话人;如果C表示Vf和Vr的相位关系为负相关,则确定通话语音角色为远地通话人;
或者,
所述通话语音角色确定模块,用于通过相位比较器分析Vf和Vr的相位关系;如果所述相位比较器输出的结果表示Vf和Vr的相位关系为正相关,则确定通话语音角色为本地通话人;如果所述相位比较器输出的结果表示Vf和Vr的相位关系为负相关,则确定通话语音角色为远地通话人。
可选地,如果通过相关度分析所述Vf和Vr的相位关系,则所述通话语音角色确定模块计算Vf和Vr的相关度的公式为:
其中,n表示分析窗口的宽度,i表示分析窗口中第i个采样点。
本公开还提供一种电话信号回路,包括相互串接的本地话机的发话信号源VS1、远地话机的发话信号源VS2、本地话机的源阻抗RS1、远地话机的源阻抗RS2、检流电阻Rf、两根电话线的线路阻抗RL1和RL2,
所述本地话机为固定电话终端,且所述检流电阻Rf串接在所述本地话机的入户电话线上。
本公开还提供一种存储设备,其中存储有多条指令,所述指令由处理器加载,执行上述通话语音角色分离方法的步骤。
本公开还提供一种电子设备,所述电子设备包括;
上述的存储设备;以及
处理器,用于执行所述存储设备中的指令。
本公开方案中,可以在电话信号回路中串接检流电阻Rf,通过采集检流电阻Rf的电压信号Vf、电话信号回路的电话线电压信号Vr,并分析二者相位关系的方式,实现通话语音角色分离的目的。如此方案,不依赖于语音信号质量、通话人的声纹特征差异等信息,与现有技术相比,可以显著提高通话语音角色分离结果的准确性和稳定性。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1为现有电话信号回路的简化电路图;
图2为本公开方案中电话信号回路的简化电路图;
图3为本公开方案中通话语音角色分离方法的流程示意图;
图4为本公开方案中通话语音角色分离装置的构成示意图;
图5为本公开方案中用于通话语音角色分离的电子设备的结构示意图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
在介绍本公开方案前,先对本公开方案中的电话信号回路做以下解释说明。
通常,依据两线制有线电话机的原理,在不影响对目标分析的前提下,可以将电话信号回路简化为图1所示电路,该简化电路不考虑供电、振铃和消侧音、线路分布电容和受话等环节。其中,VS1为本地话机的发话信号源、VS2为远地话机的发话信号源、RS1为本地话机的源阻抗、RS2为远地话机的源阻抗、RL1和RL2为两根电话线的线路阻抗。由图1可知,本地话机的发话信号源、远地话机的发话信号源利用两线电话线,形成信号回路,实现全双工语音通话。
本公开方案进行通话语音角色分离时,可以在图1所示的电话信号回路中串接检流电阻Rf。具体地,检流电阻Rf可以串接在固定电话终端的入户电话线上,例如,本地话机为固定电话终端,则可形成图2所示电路图。
需要说明的是,本公开方案中的远地话机可以为固定电话终端,或者也可以为移动电话终端,本公开对此可不做具体限定。以报警电话为例,通常,报警端可能是固定电话终端,也可能是移动电话终端,但是接警端一般为固定电话终端,故可将检流电阻Rf布置在接警电话的入户电话线上。
获得图2所示电路图后,便可基于此进行电压信号的采集、分析,最终实现本公开通话语音角色分离的目的,具体可参见下文图3处所做介绍。
参见图3,示出了本公开通话语音角色分离方法的流程示意图。可以包括以下步骤:
S101,获取电话信号回路中信号源的电压信号。
S102,基于所述信号源的电压信号,获取所述检流电阻Rf的电压信号Vf和所述电话信号回路的电话线电压信号Vr。
S103,分析Vf和Vr的相位关系,确定出通话语音角色。
发明人在研发过程中发现,在电话信号回路中增设检流电阻Rf后,可以结合检流电阻Rf的电压信号Vf、电话信号回路的电话线电压信号Vr二者之间的相位关系,实现通话语音角色分离。具体地,可以先获得以下电压信号:
1.信号源的电压信号
本公开方案中,信号源的电压信号可以是本地话机的发话信号源的电压信号V1、远地话机的发话信号源的电压信号V2。多数情况下,在同一时刻,只可获取V1或者V2。也就是说,在本地通话人讲话时,可以获取到本地话机的发话信号源的电压信号V1,在远地通话人讲话时,可以获取到远地话机的发话信号源的电压信号V2。
2.Vf和Vr
获得信号源的电压信号后,可以结合整个回路的阻抗Rz,计算得到Vf和Vr。其中,Rz=RS1+RS2+RL1+RL2+Rf。
(1)获取到本地话机的发话信号源的电压信号V1时,
Vr=(V1/Rz)*(RL1+RL2+RS2+Rf);
Vf=(V1/Rz)*Rf。
(2)获取到远地话机的发话信号源的电压信号V2时,
Vr=(V2/Rz)*(RL1+RL2+RS1+Rf);
Vf=-(V2/Rz)*Rf。
按照上述过程,获得Vf和Vr后,便可分析二者的相位关系,进行通话语音角色分离。
可以理解地,本公开方案可在电话信号回路的任意位置设置参考地,作为一种示例,可以在图2所示位置设置接地点。
分析上文电压信号可知,当获取到本地话机的发话信号源的电压信号V1时,即本地通话人讲话时,Vf和Vr为同相位但幅度不同的信号,二者属于正相关;当获取到远地话机的发话信号源的电压信号V2时,即远地通话人讲话时,Vf和Vr为反相位但幅度不同的信号,二者属于负相关。因此,可以通过分析Vf和Vr的相位关系,确定出通话语音角色。
本公开方案中,至少可通过以下方式分析Vf和Vr的相位关系。
1.通过相位比较器分析Vf和Vr的相位关系
当相位比较器输出的结果为Vf和Vr的相位相同,即Vf和Vr的相位关系为正相关时,可以确定通话语音角色为本地通话人;当相位比较器输出的结果为Vf和Vr的相位相反,即Vf和Vr的相位关系为负相关时,可以确定通话语音角色为远地通话人。
2.通过计算信号相关度的方式分析Vf和Vr的相位关系
作为一种示例,可以按照以下公式计算Vf和Vr的相关度C:
其中,n表示分析窗口的宽度,i表示分析窗口中第i个采样点。
作为一种示例,分析窗口的宽度可以为经验值,例如,8k的采样率,对应32毫秒的窗口长度,n=256;或者,还可结合实际应用需求调整分析窗口的宽度,例如,结合通话人的语言特点调整分析窗口的宽度,当通话人的语速较快时,可以视情况调小窗口宽度,反之可以视情况调大窗口宽度。本公开方案对窗口宽度的取值、窗口宽度的调整方式等可不做具体限定。
作为一种示例,如果Vf和Vr的相关度为正数,即Vf和Vr的相位关系为正相关时,可以确定通话语音角色为本地通话人;如果Vf和Vr的相关度为负数,即Vf和Vr的相位关系为负相关时,可以确定通话语音角色为远地通话人。
作为一种示例,考虑到本地通话人讲话时,Vf和Vr的相关度接近1,即Vf与Vr属于高度正相关;远地通话人讲话时,Vf和Vr的相关度接近-1,即Vf与Vr属于高度负相关。本公开方案还可以结合实际应用需求,设置相关度阈值,并结合相关度阈值分离通话语音角色。
具体地,当Vf和Vr的相关度为正数且不小于第一阈值,即Vf和Vr的相位关系为高度正相关时,可以确定通话语音角色为本地通话人;当Vf和Vr的相关度为负数且不大于第二阈值,即Vf和Vr的相位关系为高度负相关时,可以确定通话语音角色为远地通话人。
本公开方案对第一阈值、第二阈值的取值不做具体限定,可结合实际应用需求设定。
综上所述,本公开方案可以采集电话信号回路中的电压信号Vf和Vr,并通过分析二者相位关系的方式,确定出通话语音角色,实现本公开通话语音角色分离的目的。本公开方案不依赖于语音信号质量、通话人的声纹特征差异等信息,与现有技术相比,可以显著提高通话语音角色分离结果的准确性和稳定性。
获得通话语音角色分离结果后,可以将该结果输出,以备后续语音信号分析处理时使用。作为一种示例,还可以从电话线上获取包含主叫号码的编码信息,并通过对编码信息进行解码处理的方式,从编码信息中提取出主叫号码以及呼叫时间,同样可供后续语音信号分析处理时使用。
参见图4,示出了本公开通话语音角色分离装置的构成示意图。所述装置可以包括:
第一电压信号获取模块201,用于获取电话信号回路中信号源的电压信号,所述电话信号回路包括串接在本地话机的入户电话线上的检流电阻Rf,所述本地话机为固定电话终端;
第二电压信号获取模块202,用于基于所述信号源的电压信号,获取所述检流电阻Rf的电压信号Vf和所述电话信号回路的电话线电压信号Vr;
通话语音角色确定模块203,用于分析Vf和Vr的相位关系,确定出通话语音角色。
可以理解地,本公开方案中的通话语音角色确定模块203可以与第一电压信号获取模块201、第二电压信号获取模块202部署在同一实体设备上;或者,通话语音角色确定模块203可以与第一电压信号获取模块201、第二电压信号获取模块202部署在不同实体设备上,本公开方案对此可不做具体限定。
可选地,所述第二电压信号获取模块,用于在所述信号源的电压信号为本地话机的发话信号源VS1的电压信号时,按照以下公式获得Vf和Vr:
Vf=(VS1/Rz)*(RL1+RL2+RS2+Rf)
Vr=(VS1/Rz)*Rf
所述第二电压信号获取模块,还用于在所述信号源的电压信号为远地话机的发话信号源VS2的电压信号时,按照以下公式获得Vf和Vr:
Vf=(VS2/Rz)*(RL1+RL2+RS1+Rf)
Vr=-(VS2/Rz)*Rf
其中,Rz=RS1+RS2+RL1+RL2+Rf
RS1为本地话机的源阻抗,RS2为远地话机的源阻抗,RL1、RL2为两根电话线的线路阻抗。
可选地,所述通话语音角色确定模块,用于计算Vf和Vr的相关度C;如果C表示Vf和Vr的相位关系为正相关,则确定通话语音角色为本地通话人;如果C表示Vf和Vr的相位关系为负相关,则确定通话语音角色为远地通话人;
或者,
所述通话语音角色确定模块,用于通过相位比较器分析Vf和Vr的相位关系;如果所述相位比较器输出的结果表示Vf和Vr的相位关系为正相关,则确定通话语音角色为本地通话人;如果所述相位比较器输出的结果表示Vf和Vr的相位关系为负相关,则确定通话语音角色为远地通话人。
可选地,如果通过相关度分析所述Vf和Vr的相位关系,则Vf和Vr的相关度的计算公式为:
其中,n表示分析窗口的宽度,i表示分析窗口中第i个采样点。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
参见图5,示出了本公开用于通话语音角色分离的电子设备300的结构示意图。参照图5,电子设备300包括处理组件301,其进一步包括一个或多个处理器,以及由存储设备302所代表的存储设备资源,用于存储可由处理组件301的执行的指令,例如应用程序。存储设备302中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件301被配置为执行指令,以执行上述通话语音角色分离方法。
电子设备300还可以包括一个电源组件303,被配置为执行电子设备300的电源管理;一个有线或无线网络接口304,被配置为将电子设备300连接到网络;和一个输入输出(I/O)接口305。电子设备300可以操作基于存储在存储设备302的操作系统,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。
Claims (7)
1.一种通话语音角色分离方法,其特征在于,包括:
获取电话信号回路中信号源的电压信号,所述电话信号回路包括串接在本地话机的入户电话线上的检流电阻Rf,所述本地话机为固定电话终端;
基于所述信号源的电压信号,获取所述检流电阻Rf的电压信号Vf和所述电话信号回路的电话线电压信号Vr;
分析Vf和Vr的相位关系,确定出通话语音角色,包括:计算Vf和Vr的相关度C;如果C表示Vf和Vr的相位关系为正相关,则确定通话语音角色为本地通话人;如果C表示Vf和Vr的相位关系为负相关,则确定通话语音角色为远地通话人;或者,
通过相位比较器分析Vf和Vr的相位关系;如果所述相位比较器输出的结果表示Vf和Vr的相位关系为正相关,则确定通话语音角色为本地通话人;如果所述相位比较器输出的结果表示Vf和Vr的相位关系为负相关,则确定通话语音角色为远地通话人。
2.根据权利要求1所述的方法,其特征在于,所述基于所述信号源的电压信号,获取Vf和Vr,包括:
如果所述信号源的电压信号为本地话机的发话信号源VS1的电压信号V1,则,
Vr=(V1/Rz)*(RL1+RL2+RS2+Rf)
Vf=(V1/Rz)*Rf
如果所述信号源的电压信号为远地话机的发话信号源VS2的电压信号V2,则,
Vr=(V2/Rz)*(RL1+RL2+RS1+Rf)
Vf=-(V2/Rz)*Rf
其中,Rz=RS1+RS2+RL1+RL2+Rf
RS1为本地话机的源阻抗,RS2为远地话机的源阻抗,RL1、RL2为两根电话线的线路阻抗。
3.根据权利要求1所述的方法,其特征在于,如果通过相关度分析所述Vf和Vr的相位关系,则Vf和Vr的相关度的计算公式为:
其中,n表示分析窗口的宽度,i表示分析窗口中第i个采样点。
4.一种通话语音角色分离装置,其特征在于,包括:
第一电压信号获取模块,用于获取电话信号回路中信号源的电压信号,所述电话信号回路包括串接在本地话机的入户电话线上的检流电阻Rf,所述本地话机为固定电话终端;
第二电压信号获取模块,用于基于所述信号源的电压信号,获取所述检流电阻Rf的电压信号Vf和所述电话信号回路的电话线电压信号Vr;
通话语音角色确定模块,用于分析Vf和Vr的相位关系,确定出通话语音角色,包括:计算Vf和Vr的相关度C;如果C表示Vf和Vr的相位关系为正相关,则确定通话语音角色为本地通话人;如果C表示Vf和Vr的相位关系为负相关,则确定通话语音角色为远地通话人;或者,
通过相位比较器分析Vf和Vr的相位关系;如果所述相位比较器输出的结果表示Vf和Vr的相位关系为正相关,则确定通话语音角色为本地通话人;如果所述相位比较器输出的结果表示Vf和Vr的相位关系为负相关,则确定通话语音角色为远地通话人。
5.一种电话信号回路,其特征在于,包括相互串接的本地话机的发话信号源VS1、远地话机的发话信号源VS2、本地话机的源阻抗RS1、远地话机的源阻抗RS2、检流电阻Rf、两根电话线的线路阻抗RL1和RL2,
所述本地话机为固定电话终端,且所述检流电阻Rf串接在所述本地话机的入户电话线上;
基于信号源的电压信号以及整个回路的阻抗,获取所述检流电阻Rf的电压信号Vf和所述电话信号回路的电话线电压信号Vr;
分析Vf和Vr的相位关系,确定出通话语音角色,包括:计算Vf和Vr的相关度C;如果C表示Vf和Vr的相位关系为正相关,则确定通话语音角色为本地通话人;如果C表示Vf和Vr的相位关系为负相关,则确定通话语音角色为远地通话人;或者,
通过相位比较器分析Vf和Vr的相位关系;如果所述相位比较器输出的结果表示Vf和Vr的相位关系为正相关,则确定通话语音角色为本地通话人;如果所述相位比较器输出的结果表示Vf和Vr的相位关系为负相关,则确定通话语音角色为远地通话人。
6.一种存储设备,其中存储有多条指令,其特征在于,所述指令由处理器加载,执行权利要求1至3任一项所述方法的步骤。
7.一种电子设备,其特征在于,所述电子设备包括;
权利要求6所述的存储设备;以及
处理器,用于执行所述存储设备中的指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710586048.9A CN107346663B (zh) | 2017-07-18 | 2017-07-18 | 一种通话语音角色分离方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710586048.9A CN107346663B (zh) | 2017-07-18 | 2017-07-18 | 一种通话语音角色分离方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107346663A CN107346663A (zh) | 2017-11-14 |
CN107346663B true CN107346663B (zh) | 2024-02-23 |
Family
ID=60256826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710586048.9A Active CN107346663B (zh) | 2017-07-18 | 2017-07-18 | 一种通话语音角色分离方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107346663B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5127043A (en) * | 1990-05-15 | 1992-06-30 | Vcs Industries, Inc. | Simultaneous speaker-independent voice recognition and verification over a telephone network |
CN102572124A (zh) * | 2011-12-16 | 2012-07-11 | 西安大唐电信有限公司 | 利用交换机no.7信令消息进行防范电信诈骗的方法和系统 |
WO2015100659A1 (zh) * | 2013-12-31 | 2015-07-09 | 华为终端有限公司 | 一种话机上承载电压的调节方法、装置及系统 |
CN106453760A (zh) * | 2016-10-11 | 2017-02-22 | 努比亚技术有限公司 | 一种改善环境噪声的方法及终端 |
CN207319685U (zh) * | 2017-07-18 | 2018-05-04 | 安徽听见科技有限公司 | 一种通话语音角色分离装置、电话信号回路 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9300790B2 (en) * | 2005-06-24 | 2016-03-29 | Securus Technologies, Inc. | Multi-party conversation analyzer and logger |
-
2017
- 2017-07-18 CN CN201710586048.9A patent/CN107346663B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5127043A (en) * | 1990-05-15 | 1992-06-30 | Vcs Industries, Inc. | Simultaneous speaker-independent voice recognition and verification over a telephone network |
CN102572124A (zh) * | 2011-12-16 | 2012-07-11 | 西安大唐电信有限公司 | 利用交换机no.7信令消息进行防范电信诈骗的方法和系统 |
WO2015100659A1 (zh) * | 2013-12-31 | 2015-07-09 | 华为终端有限公司 | 一种话机上承载电压的调节方法、装置及系统 |
CN106453760A (zh) * | 2016-10-11 | 2017-02-22 | 努比亚技术有限公司 | 一种改善环境噪声的方法及终端 |
CN207319685U (zh) * | 2017-07-18 | 2018-05-04 | 安徽听见科技有限公司 | 一种通话语音角色分离装置、电话信号回路 |
Non-Patent Citations (1)
Title |
---|
高康 ; .立体声技术讲座 第八讲 立体声广播接收机(下).电子技术.1982,(08),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN107346663A (zh) | 2017-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019227672A1 (zh) | 说话人分离模型训练方法、两说话人分离方法及相关设备 | |
EP2994910B1 (en) | Method and apparatus for detecting a target keyword | |
US10832696B2 (en) | Speech signal cascade processing method, terminal, and computer-readable storage medium | |
CN110890083B (zh) | 音频数据的处理方法、装置、电子设备及存储介质 | |
CN106302933B (zh) | 通话语音信息处理方法及终端 | |
WO2016008311A1 (zh) | 一种根据频域能量对音频信号进行检测的方法和装置 | |
CN103190139A (zh) | 用于提供会议信息的系统和方法 | |
CN109360572A (zh) | 通话分离方法、装置、计算机设备及存储介质 | |
CN111883182B (zh) | 人声检测方法、装置、设备及存储介质 | |
CN109151148B (zh) | 通话内容的记录方法、装置、终端及计算机可读存储介质 | |
CN110931028B (zh) | 一种语音处理方法、装置和电子设备 | |
CN112017630A (zh) | 一种语种识别方法、装置、电子设备及存储介质 | |
CN105657165A (zh) | 一种通话音量的调节方法及装置 | |
EP2913822B1 (en) | Speaker recognition | |
CN106911706A (zh) | 通话背景添加方法及装置 | |
CN110895930B (zh) | 语音识别方法及装置 | |
JP2015082093A (ja) | 異常会話検出装置、異常会話検出方法及び異常会話検出用コンピュータプログラム | |
CN107346663B (zh) | 一种通话语音角色分离方法及装置 | |
CN106340310A (zh) | 语音检测方法及装置 | |
US11601750B2 (en) | Microphone control based on speech direction | |
CN109887492A (zh) | 一种数据处理方法、装置和电子设备 | |
CN107154996B (zh) | 来电拦截方法、装置、存储介质及终端 | |
CN112185413B (zh) | 一种语音处理方法、装置和用于语音处理的装置 | |
CN115174724A (zh) | 通话降噪方法、装置、设备及可读存储介质 | |
CN207319685U (zh) | 一种通话语音角色分离装置、电话信号回路 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |