CN111694539A - 在听筒和扬声器之间切换的方法、装置及介质 - Google Patents

在听筒和扬声器之间切换的方法、装置及介质 Download PDF

Info

Publication number
CN111694539A
CN111694539A CN202010578289.0A CN202010578289A CN111694539A CN 111694539 A CN111694539 A CN 111694539A CN 202010578289 A CN202010578289 A CN 202010578289A CN 111694539 A CN111694539 A CN 111694539A
Authority
CN
China
Prior art keywords
voice
speaker
call voice
microphone
time difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010578289.0A
Other languages
English (en)
Other versions
CN111694539B (zh
Inventor
艾必涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Pinecone Electronic Co Ltd
Original Assignee
Beijing Xiaomi Pinecone Electronic Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Pinecone Electronic Co Ltd filed Critical Beijing Xiaomi Pinecone Electronic Co Ltd
Priority to CN202010578289.0A priority Critical patent/CN111694539B/zh
Publication of CN111694539A publication Critical patent/CN111694539A/zh
Application granted granted Critical
Publication of CN111694539B publication Critical patent/CN111694539B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path

Abstract

本公开是关于一种在听筒和扬声器之间切换的方法、装置及介质。该方法应用于设置有两个话筒的终端,包括:确定用于判断切换的时间阈值;在所述终端通话的过程中,获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差;基于所述第一时间差与所述时间阈值的大小关系,确定语音的播放是否在所述听筒和所述扬声器之间切换。该方法根据真实的声音采样进行判断,因此更加方便和精准,避免了现有技术方法的误判断问题。

Description

在听筒和扬声器之间切换的方法、装置及介质
技术领域
本公开涉及扬声器技术领域,尤其涉及在听筒和扬声器之间切换的方法、装置及介质。
背景技术
随着电子技术的发展,人们越来越多地使用智能终端,而扬声器是人们使用智能终端时常用的部件。人们在通话过程中,如果不想让别人听见,一般会使用终端的听筒播放声音;如果觉得声音有些小,听不到,人们又会使用扬声器播放声音。因此,在使用终端进行通话过程中,人们有时候会将听筒播放切换为扬声器播放,或者将扬声器播放切换为听筒播放。
现有的在听筒和扬声器之间切换的方法是在手机顶部内置一个距离传感器,通过检测头部与手机的距离来判断是否进行切换。但是这种切换方法可能受到下面情况的影响而误判断:(1)将手机放入口袋时候,也可会误开启听筒模式;(2)如果距离传感器正上面有遮挡物,如一些尺寸大小不合适的手机壳或者手机贴膜也会引起距离传感器的误判断。
因此,需要能够准确进行听筒播放与扬声器播放的切换的方法。
发明内容
为克服相关技术中存在的问题,本公开提供一种在听筒和扬声器之间切换的方法、装置及介质。
根据本公开实施例的第一方面,提供一种在听筒和扬声器之间切换的方法,所述方法应用于设置有两个话筒的终端,所述方法包括:
确定用于判断切换的时间阈值;
在所述终端通话的过程中,获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差;
基于所述第一时间差与所述时间阈值的大小关系,确定语音的播放是否在所述听筒和所述扬声器之间切换。
其中,所述确定用于判断切换的时间阈值,包括:
获取进行听筒和扬声器切换时的说话人距离所述终端的嘴部位置;
基于所述嘴部位置,确定所述第一话筒和所述第二话筒接收到相同语音的第二时间差;
将所述第二时间差确定为所述时间阈值。
其中,所述获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差,包括:
获取设定时间段内所述第一话筒接收到的第一段通话语音和所述第二话筒接收到的第二段通话语音;
获取所述第一段通话语音和所述第二段通话语音中相同通话语音的所述第一时间差。
其中,所述获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差还包括:
当确定存在多于一个的说话人时,确定所述第一段通话语音和所述第二段通话语音为同一说话人的通话语音。
其中,所述确定所述第一段通话语音和所述第二段通话语音为同一说话人的通话语音,包括:
获取所述第一段通话语音的频域信号和所述第二段通话语音的频域信号;
确定所述第一段通话语音的频域信号的前N个特征频率和所述第二段通话语音的频域信号的前N个特征频率,N为大于1的正整数;
当所述第一段通话语音的频域信号的前N个特征频率与所述第二段通话语音的频域信号的前N个特征频率相同时,确定所述第一段通话语音和所述第二段通话语音为同一说话人的通话语音。
其中,所述基于所述第一时间差与所述时间阈值的大小关系,确定语音的播放是否在所述听筒和所述扬声器之间切换,包括:
当所述第一时间差小于所述时间阈值且当前通过所述听筒播放语音时,确定切换为通过所述扬声器播放语音;
当所述第一时间差大于所述时间阈值且当前通过所述扬声器播放语音时,确定切换为通过所述听筒播放语音。
根据本公开实施例的第二方面,提供一种在听筒和扬声器之间切换的装置,所述装置应用于设置有两个话筒的终端,所述装置包括:
第一确定模块,被设置为确定用于判断切换的时间阈值;
获取模块,被设置为在所述终端通话的过程中,获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差;
第二确定模块,被设置为基于所述第一时间差与所述时间阈值的大小关系,确定语音的播放是否在所述听筒和所述扬声器之间切换。
其中,第一确定模块还被设置为:
获取进行听筒和扬声器切换时的说话人距离所述终端的嘴部位置;
基于所述嘴部位置,确定所述第一话筒和所述第二话筒接收到相同语音的第二时间差;
将所述第二时间差确定为所述时间阈值。
其中,所述获取模块还被设置为:
获取设定时间段内所述第一话筒接收到的第一段通话语音和所述第二话筒接收到的第二段通话语音;
获取所述第一段通话语音和所述第二段通话语音中相同通话语音的所述第一时间差。
其中,所述获取模块还被设置为:
当确定存在多于一个的说话人时,确定所述第一段通话语音和所述第二段通话语音为同一说话人的通话语音。
其中,所述获取模块还被设置为通过下述方式确定所述第一段通话语音和所述第二段通话语音为同一说话人的通话语音,包括:
获取所述第一段通话语音的频域信号和所述第二段通话语音的频域信号;
确定所述第一段通话语音的频域信号的前N个特征频率和所述第二段通话语音的频域信号的前N个特征频率,N为大于1的正整数;
当所述第一段通话语音的频域信号的前N个特征频率与所述第二段通话语音的频域信号的前N个特征频率相同时,确定所述第一段通话语音和所述第二段通话语音为同一说话人的通话语音。
其中,所述第二确定模块还被设置为:
当所述第一时间差小于所述时间阈值且当前通过所述听筒播放语音时,确定切换为通过所述扬声器播放语音;
当所述第一时间差大于所述时间阈值且当前通过所述扬声器播放语音时,确定切换为通过所述听筒播放语音。
根据本公开实施例的第三方面,提供一种在听筒和扬声器之间切换的装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为在运行所述可执行指令时实现以下步骤:
确定用于判断切换的时间阈值;
在所述终端通话的过程中,获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差;
基于所述第一时间差与所述时间阈值的大小关系,确定语音的播放是否在所述听筒和所述扬声器之间切换。
根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置的处理器执行时,使得装置能够执行一种在听筒和扬声器之间切换的方法,所述方法包括:
确定用于判断切换的时间阈值;
在所述终端通话的过程中,获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差;
基于所述第一时间差与所述时间阈值的大小关系,确定语音的播放是否在所述听筒和所述扬声器之间切换。
本公开提供了一种能够准确地在听筒和扬声器之间切换的方法,该方法应用于设置有两个话筒的终端。在该方法中,先确定用于判断切换的时间阈值。然后在终端通话的过程中,实时获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差;基于第一时间差与时间阈值的大小关系,确定语音的播放是否在听筒和扬声器之间切换。该方法根据真实的声音采样进行判断,因此更加方便和精准,避免了现有技术方法的误判断问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种在听筒和扬声器之间切换的方法的流程图。
图2是根据一示例性实施例示出的两个听筒位置和嘴部位置的关系的示意图。
图3是根据一示例性实施例示出的一段语音的时域信号示意图。
图4是根据一示例性实施例示出的一段语音的频域信号示意图。
图5是根据一示例性实施例示出的一种在听筒和扬声器之间切换的方法的流程图。
图6是根据一示例性实施例示出的一种在听筒和扬声器之间切换的装置的框图。
图7是根据一示例性实施例示出的一种装置的框图。
图8是根据一示例性实施例示出的一种装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
现有的在在手机顶部内置一个距离传感器,通过检测头部与手机的距离来判断是否在听筒和扬声器之间切换的方法可能受到误接触或遮挡的影响而误判断。
本公开提供了一种能够准确地在听筒和扬声器之间切换的方法,该方法应用于设置有两个话筒的终端。在该方法中,先确定用于判断切换的时间阈值。然后在终端通话的过程中,实时获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差;基于第一时间差与时间阈值的大小关系,确定语音的播放是否在听筒和扬声器之间切换。该方法根据真实的声音采样进行判断,因此更加方便和精准,避免了现有技术方法的误判断问题。
本公开方法所应用于的终端是可以进行通话、并设置有两个扬声器的终端,可以是手机、PAD、穿戴式设备等。
图1是根据一示例性实施例示出的一种在听筒和扬声器之间切换方法的流程图,所述方法应用于设置有两个话筒的终端,如图1所示,该方法包括以下步骤:
步骤101,确定用于判断切换的时间阈值;
步骤102,在所述终端通话的过程中,获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差;
步骤103,基于所述第一时间差与所述时间阈值的大小关系,确定语音的播放是否在所述听筒和所述扬声器之间切换。
该方法的应用场景是我们打电话的时候,由于各种原因,耳朵与电话的距离发生变化时,能够方便地进行听筒播放和扬声器播放之间的切换,从而不管耳朵与电话的距离远近都能清楚地听到通话声音。
该方法应用于具有两个话筒的终端上。其原理如下:
图2示出了终端上两个话筒mic1、mic2和嘴部位置的示意图。其中,a表示第一话筒的位置,b表示第二话筒的位置,c表示嘴部位置。在人说话的时候,声音会分别被mic1和mic2拾取,但是由于mic1和mic2的位置不同,所以声音到达mic1和mic2的时间不同。例如,当用户说“你好吗?”时,mic1可能刚刚录制到“你”,mic2已经录制到“好”,用mic1录制“你”的时间,减去mic2录制“你”的时间,得到时间差T,T就是声音传播到mic1和mic2的时间差。
时间差T的大小取决于人嘴说话的位置,这样就可以通过时间差T来区分当前的嘴部位置。因此,由于嘴部位置变化时,同一个声音传播到mic1和mic2的时间差就会发生变化,因此通过这个时间差就可以确定嘴部离终端的远近,从而确定是否需要进行听筒播放和扬声器播放之间的切换。
通过需要切换时的嘴部位置预先得到时间阈值T0。在用户的通话场景中,用户在通话过程中嘴会离下面的mic很近,离上面的那个mic偏远。这样通过判断时间差T与T0的大小关系来确定是否进行听筒播放和扬声器播放之间的切换。具体地,当实际检测到时间差大于T0,那么就可以判断用户需要使用听筒播放;当实际检测到时间差值小于T0,就可以判断用户需要使用扬声器播放。原因如下:
如图2所示,线段ab表示手机的两个听筒mic1和mic2之间的距离,是一个固定值。线段cb和ca分别表示声音传播到两个听筒mic1和mic2的距离。随着c逐渐向右移动,cb-ca单调递减,证明如下:
为便于分析,令ac=x,
Figure BDA0002552095980000061
又令ab=h,则
Figure BDA0002552095980000062
为了分析单调性,f(x)求导,则:
Figure BDA0002552095980000063
就是说f(x)是单调递减函数,即随着x(人嘴到手机底部的距离)增加,声音传播到两个听筒mic1和mic2的距离差减小,也即声音传播到mic1和mic2的时间差减小。因此,当时间差由大减小到一定程度时(小于T0)就需要切换为扬声器播放。
下面回到参考图1描述的方法。
在步骤101中,首先需要确定在通话过程判断是否进行听筒播放和扬声器播放切换所需的时间阈值,该时间阈值的具体确定方法将结合下面的实施方式进行描述。
在步骤102和103中,在终端通话过程中,获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差,然后基于该第一时间差与上述确定的时间阈值的大小关系,来确定是否进行听筒播放和扬声器播放的切换。
采用这种方法,能够通过检测用户通话声音传播到第一话筒和第二话筒的时间差来进行听筒播放和扬声器播放的切换,而不会受到误接触或遮挡的影响而误判断。这种方法简便准确,提高了用户的使用体验。
在可选实施方式中,所述确定用于判断切换的时间阈值,包括:
获取进行听筒和扬声器切换时的说话人距离所述终端的嘴部位置;
基于所述嘴部位置,确定所述第一话筒和所述第二话筒接收到相同语音的第二时间差;
将所述第二时间差确定为所述时间阈值。
确定用于判断切换的时间阈值时,需要先确定进行听筒和扬声器切换时的说话人距离所述终端的嘴部位置。也就是说,实际的位置远于该嘴部位置时,就需要切换为扬声器播放,实际的位置近于该嘴部位置时,就可以切换为听筒播放。如前所述,确定切换时的嘴部位置后,就可以确定声音从该嘴部位置传播到第一话筒和第二话筒的第二时间差,也即上述的时间差T0,该时间差T0就是用于判断切换的时间阈值。
在可选实施方式中,所述获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差,包括:
获取设定时间段内所述第一话筒接收到的第一段通话语音和所述第二话筒接收到的第二段通话语音;
获取所述第一段通话语音和所述第二段通话语音中相同通话语音的所述第一时间差。
人们在说话时,在不同的句子中可能会出现同一个字。例如在“今天下雨了,我明天再去跑步”中出现了两次“天”。在获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差时,如果计算的是第一话筒接收到的“今天下雨了”中的“天”与第二话筒接收到的“我明天再去跑步”中的“天”的时间差,则此时判断是否需要切换就出现了误差。
为了避免上述误差,就需要第一话筒和第二话筒接收到的相同通话语音都是在同一设定时间段内的。还以上面例子为例,第一话筒接收到的“天”和第二话筒接收到的“天”或者是“今天下雨了”这个句子中的,或者是“我明天再去跑步”这个句子中的。因此,设定时间段需要相对小,例如将设定时间段设置为0.1秒-0.5秒之间的数值。
在可选实施方式中,所述获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差还包括:
当确定存在多于一个的说话人时,确定所述第一段通话语音和所述第二段通话语音为同一说话人的通话语音。
有时,人们在通话时不可避免地会同时有其他人在说话。这种情况下,第一话筒和第二话筒就会拾取到多个人的说话声音。而在本方案中,确定第一话筒和第二话筒接收到相同通话语音的第一时间差时,必须是同一个说话人的相同通话语音的时间差。如果第一话筒接收的通话语音和第二话筒接收的通话语音不是来自于同一说话人,则此时计算的第一时间差就出现了错误。可以采用关于下述实施方式描述的方法来确定第一段通话语音和第二段通话语音是否为同一说话人的通话语音。
在可选实施方式中,所述确定所述第一段通话语音和所述第二段通话语音为同一说话人的通话语音,包括:
获取所述第一段通话语音的频域信号和所述第二段通话语音的频域信号;
确定所述第一段通话语音的频域信号的前N个特征频率和所述第二段通话语音的频域信号的前N个特征频率,N为大于1的正整数;
当所述第一段通话语音的频域信号的前N个特征频率与所述第二段通话语音的频域信号的前N个特征频率相同时,确定所述第一段通话语音和所述第二段通话语音为同一说话人的通话语音。
图3示例性地示出了一段语音的时域信号,图4示例性地示出了该段语音的频域信号。从图4可以看出该语音的前三个特征频率为150Hz、320Hz、450Hz。本领域技术人员已知的是,当两段语音的特征频率相同时,可以确定该两段语音来自同一个说话人。通常,只需判断两段语音的前几个特征频率相同就可以确定这两段语音来自同一个说话人。
因此,在本实施方式中,为了确定第一段通话语音和第二段通话语音是否为同一说话人的通话语音,可以判断该两段通话语音的频域中的特征频率是否相同。
在可选实施方式中,所述基于所述第一时间差与所述时间阈值的大小关系,确定语音的播放是否在所述听筒和所述扬声器之间切换,包括:
当所述第一时间差小于所述时间阈值且当前通过所述听筒播放语音时,确定切换为通过所述扬声器播放语音;
当所述第一时间差大于所述时间阈值且当前通过所述扬声器播放语音时,确定切换为通过所述听筒播放语音。
如前所述,f(x)是单调递减函数,即随着x的增加,声音传播到两个听筒mic1和mic2的距离差减小,也即声音传播到mic1和mic2的时间差减小。因此,当第一时间差小于时间阈值且当前通过听筒播放语音时,就需要切换为通过扬声器播放语音;当第一时间差大于时间阈值且当前通过扬声器播放语音时,就需要切换为通过听筒播放语音。
下面结合具体的应用场景描述根据本公开的具体实施例。在该实施例中,终端为手机,如图5所示,包括以下步骤:
步骤501,确定听筒和扬声器切换时的说话人距离终端的嘴部位置。
步骤502,通过实验方式,确定在该嘴部位置说话时第一话筒和第二话筒接收到相同语音的时间差T0
步骤503,将该时间差T0作为时间阈值。
步骤504,在说话人使用手机通话的过程中,实时获取0.5秒内第一话筒接收到的第一段通话语音和第二话筒接收到的第二段通话语音。
步骤505,获取第一段通话语音和第二段通话语音中相同通话语音的第一时间差。
步骤506,获取当前的播放途径,即是听筒播放还是扬声器播放。
步骤507,当第一时间差小于T0且当前通过听筒播放语音时,确定切换为通过扬声器播放语音。
步骤508,当第一时间差大于T0且当前通过扬声器播放语音时,确定切换为通过听筒播放语音。
本公开还提供了一种在听筒和扬声器之间切换的装置,所述装置应用于设置有两个话筒的终端,如图6所示,所述装置包括:
第一确定模块601,被设置为确定用于判断切换的时间阈值;
获取模块602,被设置为在所述终端通话的过程中,获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差;
第二确定模块603,被设置为基于所述第一时间差与所述时间阈值的大小关系,确定语音的播放是否在所述听筒和所述扬声器之间切换。
在可选实施方式中,第一确定模块601还被设置为:
获取进行听筒和扬声器切换时的说话人距离所述终端的嘴部位置;
基于所述嘴部位置,确定所述第一话筒和所述第二话筒接收到相同语音的第二时间差;
将所述第二时间差确定为所述时间阈值。
在可选实施方式中,所述获取模块602还被设置为:
获取设定时间段内所述第一话筒接收到的第一段通话语音和所述第二话筒接收到的第二段通话语音;
获取所述第一段通话语音和所述第二段通话语音中相同通话语音的所述第一时间差。
在可选实施方式中,所述获取模块602还被设置为:
当确定存在多于一个的说话人时,确定所述第一段通话语音和所述第二段通话语音为同一说话人的通话语音。
在可选实施方式中,所述获取模块602还被设置为通过下述方式确定所述第一段通话语音和所述第二段通话语音为同一说话人的通话语音,包括:
获取所述第一段通话语音的频域信号和所述第二段通话语音的频域信号;
确定所述第一段通话语音的频域信号的前N个特征频率和所述第二段通话语音的频域信号的前N个特征频率,N为大于1的正整数;
当所述第一段通话语音的频域信号的前N个特征频率与所述第二段通话语音的频域信号的前N个特征频率相同时,确定所述第一段通话语音和所述第二段通话语音为同一说话人的通话语音。
在可选实施方式中,所述第二确定模块603还被设置为:
当所述第一时间差小于所述时间阈值且当前通过所述听筒播放语音时,确定切换为通过所述扬声器播放语音;
当所述第一时间差大于所述时间阈值且当前通过所述扬声器播放语音时,确定切换为通过所述听筒播放语音。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
该装置根据真实的声音采样进行判断,因此更加方便和精准,避免了现有技术方法的误判断问题。
图7是根据一示例性实施例示出的一种在听筒和扬声器之间切换的装置700的框图。
参照图7,装置700可以包括以下一个或多个组件:处理组件702,存储器704,电力组件706,多媒体组件708,音频组件710,输入/输出(I/O)的接口712,传感器组件714,以及通信组件716。
处理组件702通常控制装置700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器720来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理组件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
存储器704被配置为存储各种类型的数据以支持在设备700的操作。这些数据的示例包括用于在装置700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件706为装置700的各种组件提供电力。电力组件706可以包括电源管理系统,一个或多个电源,及其他与为装置700生成、管理和分配电力相关联的组件。
多媒体组件708包括在所述装置700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当设备700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(MIC),当装置700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
I/O接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件714包括一个或多个传感器,用于为装置700提供各个方面的状态评估。例如,传感器组件714可以检测到设备700的打开/关闭状态,组件的相对定位,例如所述组件为装置700的显示器和小键盘,传感器组件714还可以检测装置700或装置700一个组件的位置改变,用户与装置700接触的存在或不存在,装置700方位或加速/减速和装置700的温度变化。传感器组件714可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件716被配置为便于装置700和其他设备之间有线或无线方式的通信。装置700可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件716还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器704,上述指令可由装置700的处理器720执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种在听筒和扬声器之间切换的方法,所述方法包括:确定用于判断切换的时间阈值;在所述终端通话的过程中,获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差;基于所述第一时间差与所述时间阈值的大小关系,确定语音的播放是否在所述听筒和所述扬声器之间切换。
图8是根据一示例性实施例示出的一种在听筒和扬声器之间切换的装置800的框图。例如,装置800可以被提供为一服务器。参照图8,装置800包括处理组件822,其进一步包括一个或多个处理器,以及由存储器832所代表的存储器资源,用于存储可由处理组件822的执行的指令,例如应用程序。存储器832中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件822被配置为执行指令,以执行上述方法:确定用于判断切换的时间阈值;在所述终端通话的过程中,获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差;基于所述第一时间差与所述时间阈值的大小关系,确定语音的播放是否在所述听筒和所述扬声器之间切换。
装置800还可以包括一个电源组件826被配置为执行装置800的电源管理,一个有线或无线网络接口850被配置为将装置800连接到网络,和一个输入输出(I/O)接口858。装置800可以操作基于存储在存储器832的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (14)

1.一种在听筒和扬声器之间切换的方法,所述方法应用于设置有两个话筒的终端,其特征在于,所述方法包括:
确定用于判断切换的时间阈值;
在所述终端通话的过程中,获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差;
基于所述第一时间差与所述时间阈值的大小关系,确定语音的播放是否在所述听筒和所述扬声器之间切换。
2.如权利要求1所述的方法,其特征在于,所述确定用于判断切换的时间阈值,包括:
获取进行听筒和扬声器切换时的说话人距离所述终端的嘴部位置;
基于所述嘴部位置,确定所述第一话筒和所述第二话筒接收到相同语音的第二时间差;
将所述第二时间差确定为所述时间阈值。
3.如权利要求1所述的方法,其特征在于,所述获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差,包括:
获取设定时间段内所述第一话筒接收到的第一段通话语音和所述第二话筒接收到的第二段通话语音;
获取所述第一段通话语音和所述第二段通话语音中相同通话语音的所述第一时间差。
4.如权利要求3所述的方法,其特征在于,所述获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差还包括:
当确定存在多于一个的说话人时,确定所述第一段通话语音和所述第二段通话语音为同一说话人的通话语音。
5.如权利要求4所述的方法,其特征在于,所述确定所述第一段通话语音和所述第二段通话语音为同一说话人的通话语音,包括:
获取所述第一段通话语音的频域信号和所述第二段通话语音的频域信号;
确定所述第一段通话语音的频域信号的前N个特征频率和所述第二段通话语音的频域信号的前N个特征频率,N为大于1的正整数;
当所述第一段通话语音的频域信号的前N个特征频率与所述第二段通话语音的频域信号的前N个特征频率相同时,确定所述第一段通话语音和所述第二段通话语音为同一说话人的通话语音。
6.如权利要求1所述的方法,其特征在于,所述基于所述第一时间差与所述时间阈值的大小关系,确定语音的播放是否在所述听筒和所述扬声器之间切换,包括:
当所述第一时间差小于所述时间阈值且当前通过所述听筒播放语音时,确定切换为通过所述扬声器播放语音;
当所述第一时间差大于所述时间阈值且当前通过所述扬声器播放语音时,确定切换为通过所述听筒播放语音。
7.一种在听筒和扬声器之间切换的装置,所述装置应用于设置有两个话筒的终端,其特征在于,所述装置包括:
第一确定模块,被设置为确定用于判断切换的时间阈值;
获取模块,被设置为在所述终端通话的过程中,获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差;
第二确定模块,被设置为基于所述第一时间差与所述时间阈值的大小关系,确定语音的播放是否在所述听筒和所述扬声器之间切换。
8.如权利要求7所述的装置,其特征在于,第一确定模块还被设置为:
获取进行听筒和扬声器切换时的说话人距离所述终端的嘴部位置;
基于所述嘴部位置,确定所述第一话筒和所述第二话筒接收到相同语音的第二时间差;
将所述第二时间差确定为所述时间阈值。
9.如权利要求7所述的装置,其特征在于,所述获取模块还被设置为:
获取设定时间段内所述第一话筒接收到的第一段通话语音和所述第二话筒接收到的第二段通话语音;
获取所述第一段通话语音和所述第二段通话语音中相同通话语音的所述第一时间差。
10.如权利要求9所述的装置,其特征在于,所述获取模块还被设置为:
当确定存在多于一个的说话人时,确定所述第一段通话语音和所述第二段通话语音为同一说话人的通话语音。
11.如权利要求10所述的装置,其特征在于,所述获取模块还被设置为通过下述方式确定所述第一段通话语音和所述第二段通话语音为同一说话人的通话语音,包括:
获取所述第一段通话语音的频域信号和所述第二段通话语音的频域信号;
确定所述第一段通话语音的频域信号的前N个特征频率和所述第二段通话语音的频域信号的前N个特征频率,N为大于1的正整数;
当所述第一段通话语音的频域信号的前N个特征频率与所述第二段通话语音的频域信号的前N个特征频率相同时,确定所述第一段通话语音和所述第二段通话语音为同一说话人的通话语音。
12.如权利要求7所述的装置,其特征在于,所述第二确定模块还被设置为:
当所述第一时间差小于所述时间阈值且当前通过所述听筒播放语音时,确定切换为通过所述扬声器播放语音;
当所述第一时间差大于所述时间阈值且当前通过所述扬声器播放语音时,确定切换为通过所述听筒播放语音。
13.一种在听筒和扬声器之间切换的装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为在运行所述可执行指令时实现以下步骤:
确定用于判断切换的时间阈值;
在所述终端通话的过程中,获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差;
基于所述第一时间差与所述时间阈值的大小关系,确定语音的播放是否在所述听筒和所述扬声器之间切换。
14.一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置的处理器执行时,使得装置能够执行一种在听筒和扬声器之间切换的方法,所述方法包括:
确定用于判断切换的时间阈值;
在所述终端通话的过程中,获取第一话筒和第二话筒接收到同一说话人的相同通话语音的第一时间差;
基于所述第一时间差与所述时间阈值的大小关系,确定语音的播放是否在所述听筒和所述扬声器之间切换。
CN202010578289.0A 2020-06-23 2020-06-23 在听筒和扬声器之间切换的方法、装置及介质 Active CN111694539B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010578289.0A CN111694539B (zh) 2020-06-23 2020-06-23 在听筒和扬声器之间切换的方法、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010578289.0A CN111694539B (zh) 2020-06-23 2020-06-23 在听筒和扬声器之间切换的方法、装置及介质

Publications (2)

Publication Number Publication Date
CN111694539A true CN111694539A (zh) 2020-09-22
CN111694539B CN111694539B (zh) 2024-01-30

Family

ID=72483158

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010578289.0A Active CN111694539B (zh) 2020-06-23 2020-06-23 在听筒和扬声器之间切换的方法、装置及介质

Country Status (1)

Country Link
CN (1) CN111694539B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116506545A (zh) * 2023-06-26 2023-07-28 荣耀终端有限公司 通话方法、电子设备及可读介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102809742A (zh) * 2011-06-01 2012-12-05 杜比实验室特许公司 声源定位设备和方法
JP2016111383A (ja) * 2014-12-02 2016-06-20 Necプラットフォームズ株式会社 表示情報切替装置、表示情報切替システム、表示情報切替方法及び表示情報切替プログラム
CN105827812A (zh) * 2015-10-30 2016-08-03 维沃移动通信有限公司 一种通话模式切换方法和移动通信终端
CN106453835A (zh) * 2016-09-09 2017-02-22 深圳市金立通信设备有限公司 一种切换接听方式的方法和终端
CN106971737A (zh) * 2016-01-14 2017-07-21 芋头科技(杭州)有限公司 一种基于多人说话的声纹识别方法
CN107367723A (zh) * 2016-05-13 2017-11-21 华为技术有限公司 一种测量距离的方法及设备
CN108028977A (zh) * 2015-09-09 2018-05-11 微软技术许可有限责任公司 用于声源方向估计的话筒放置
WO2019061292A1 (zh) * 2017-09-29 2019-04-04 深圳传音通讯有限公司 一种终端降噪方法及终端
CN109598510A (zh) * 2018-10-26 2019-04-09 北京三快在线科技有限公司 语音指令的处理方法、装置、电子设备及可读存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102809742A (zh) * 2011-06-01 2012-12-05 杜比实验室特许公司 声源定位设备和方法
JP2016111383A (ja) * 2014-12-02 2016-06-20 Necプラットフォームズ株式会社 表示情報切替装置、表示情報切替システム、表示情報切替方法及び表示情報切替プログラム
CN108028977A (zh) * 2015-09-09 2018-05-11 微软技术许可有限责任公司 用于声源方向估计的话筒放置
CN105827812A (zh) * 2015-10-30 2016-08-03 维沃移动通信有限公司 一种通话模式切换方法和移动通信终端
CN106971737A (zh) * 2016-01-14 2017-07-21 芋头科技(杭州)有限公司 一种基于多人说话的声纹识别方法
CN107367723A (zh) * 2016-05-13 2017-11-21 华为技术有限公司 一种测量距离的方法及设备
CN106453835A (zh) * 2016-09-09 2017-02-22 深圳市金立通信设备有限公司 一种切换接听方式的方法和终端
WO2019061292A1 (zh) * 2017-09-29 2019-04-04 深圳传音通讯有限公司 一种终端降噪方法及终端
CN109598510A (zh) * 2018-10-26 2019-04-09 北京三快在线科技有限公司 语音指令的处理方法、装置、电子设备及可读存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
RAFAL SAMBORSKI.ETC: "Speaker Localization in Conferencing Systems Employing Phase Features and Wavelet Transform", IEEE *
赵圣;崔牧凡;尤磊;王鸿鹏;: "基于小型麦克风阵列的声源定位技术", 华中科技大学学报(自然科学版), no. 1 *
镜花水月;: "如何切换微信/QQ的语音模式", 电脑爱好者, no. 02 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116506545A (zh) * 2023-06-26 2023-07-28 荣耀终端有限公司 通话方法、电子设备及可读介质

Also Published As

Publication number Publication date
CN111694539B (zh) 2024-01-30

Similar Documents

Publication Publication Date Title
CN107493500B (zh) 多媒体资源播放方法及装置
CN106454644B (zh) 音频播放方法及装置
EP3163887A1 (en) Method and apparatus for performing media synchronization
CN109360549B (zh) 一种数据处理方法、穿戴设备和用于数据处理的装置
CN104991754A (zh) 录音方法及装置
CN108076199B (zh) 麦克风的气密性检测方法及装置
CN108845787B (zh) 音频调节的方法、装置、终端及存储介质
KR20090121914A (ko) 모바일 단말기의 전화 수신 모드 결정 방법 및 장치
CN106888327B (zh) 语音播放方法及装置
CN105391477A (zh) 蓝牙设备间的通信方法和装置
CN111049984A (zh) 音频播放控制方法和设备以及存储介质
CN108093132B (zh) 终端设备及铃声音量的控制方法
CN111694539B (zh) 在听筒和扬声器之间切换的方法、装置及介质
CN106657621B (zh) 一种声音信号自适应调节装置及方法
CN111698593B (zh) 主动降噪方法及装置、终端
CN111988704B (zh) 声音信号处理方法、装置以及存储介质
CN107124512B (zh) 音频播放模式的切换方法和装置
WO2018058331A1 (zh) 控制音量的方法及装置
US11388281B2 (en) Adaptive method and apparatus for intelligent terminal, and terminal
CN106936972B (zh) 控制音频通路的方法、装置及系统
CN114513571A (zh) 设备连接方法、装置、电子设备及可读储存介质
CN112689051B (zh) 音频播放控制方法、装置、移动终端及存储介质
CN109408025B (zh) 音频播放方法、装置及存储介质
CN112511686A (zh) 一种录音方法和耳机设备
CN115811720A (zh) 音频数据处理方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant