CN106686185B - 提高免提通话设备通话质量的方法、装置和免提通话设备 - Google Patents
提高免提通话设备通话质量的方法、装置和免提通话设备 Download PDFInfo
- Publication number
- CN106686185B CN106686185B CN201611147270.0A CN201611147270A CN106686185B CN 106686185 B CN106686185 B CN 106686185B CN 201611147270 A CN201611147270 A CN 201611147270A CN 106686185 B CN106686185 B CN 106686185B
- Authority
- CN
- China
- Prior art keywords
- phonetic feature
- acquisition angles
- loudspeaker
- mike
- feature signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000001514 detection method Methods 0.000 claims description 40
- 238000012790 confirmation Methods 0.000 claims description 15
- 241000209140 Triticum Species 0.000 claims description 3
- 235000021307 Triticum Nutrition 0.000 claims description 3
- 238000007689 inspection Methods 0.000 claims 2
- 239000011800 void material Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 8
- 230000001755 vocal effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
- H04M1/6033—Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
- H04M1/6033—Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
- H04M1/6041—Portable telephones adapted for handsfree use
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01L—MEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
- G01L21/00—Vacuum gauges
- G01L21/02—Vacuum gauges having a compression chamber in which gas, whose pressure is to be measured, is compressed
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/02—Constructional features of telephone sets
- H04M1/03—Constructional features of telephone transmitters or receivers, e.g. telephone hand-sets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/725—Cordless telephones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/326—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Acoustics & Sound (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Telephone Set Structure (AREA)
Abstract
本发明公开了一种提高免提通话设备通话质量的方法、装置和免提通话设备,该免提通话设备包括一个主麦克和至少一个辅麦克组成的送话端,该方法包括:在送话端初始的第一采集角度内进行扫描;当在第一采集角度内扫描到的语音特征信号后,根据该语音特征信号的方向,在第一采集角度内确定一个比第一采集角度小的第二采集角度;将送话端校准至该第二采集角度确定的方向。本方法使用较小的语音保护角度进行拾音,可以极大地降低周围环境噪声的干扰,达到提高送话信噪比的目的,使得免提通话设备通话时的语音更有指向性,提高通话的质量。
Description
本发明专利申请是申请日为2014年06月30日、申请号为201410307430.8、名称为“提高免提通话设备通话质量的方法、装置和免提通话设备”的中国发明专利申请的分案申请。
技术领域
本发明涉及免提通话设备领域,具体涉及一种提高免提通话设备通话质量的方法、装置和一种免提通话设备。
背景技术
现有技术中的免提通话设备,例如智能手表、智能手环等智能腕戴设备,在进行免提通话模式时,由于智能手表和用户嘴部相对位置的不确定性,通常采用较大的语音保护角度,这样在拾取语音的同时也采集到较多的环境噪声,影响送话的信噪比;同时由于智能手表等免提通话设备扬声器发出的声音不但能被通话人自己听到,也会被其附近的其他人听到,容易泄露比较私密的信息。总之,送话端和受话端的上述缺陷导致了现有技术中免提通话设备的通话质量不高。
发明内容
本发明提供了一种提高免提通话设备通话质量的方法、装置和一种免提通话设备,以解决免提通话设备通话时,采集较多环境噪声,送话信噪比低的问题。
根据本发明的一个方面,提供了一种提高免提通话设备通话质量的方法,该免提通话设备包括一个主麦克和至少一个辅麦克组成的送话端,还包括至少一个扬声器组成的受话端,该方法包括:
在送话端初始的第一采集角度内进行语音特征信号的扫描;
当在第一采集角度内扫描到γ1方向有语音特征信号后,根据该语音特征信号的方向,在第一采集角度内确定一个比第一采集角度小的第二采集角度;
将送话端校准至该第二采集角度确定的方向;
设置所述受话端中一个扬声器的虚拟扬声器,该扬声器和其虚拟扬声器的连线指向所述γ1方向,并定义第三采集角度,所述第三采集角度所包括的区域范围包含所述第二采集角度确定的方向。
其中,在第一采集角度内扫描到γ1方向有语音特征信号后,根据该语音特征信号的方向,在第一采集角度内确定一个比初始采集角度小的第二采集角度包括:
在送话端初始的第一采集角度内扫描到γ1方向有语音特征信号后,沿着γ1方向,经过主麦克做一条反向延长线,并以主麦克为圆心,以主麦克和其中一个辅麦克连线为半径画圆,圆弧与反向延长线相交的位置即为主麦克的虚拟麦克风;
以主麦克和主麦克的虚拟麦克风为新的语音阵列,并定义一个角度β1,实时判断角度β1内是否有语音特征信号;是则,确认角度β1为第二采集角度;
否则,以主麦克和其中一个辅麦克的连线为对称轴,定义角度β1关于对称轴的镜像角度β2,确认角度β2为第二采集角度。
其中,实时判断角度β1内是否有语音特征信号包括:
对γ1方向的语音特征信号进行包络能量检测,当能量检测值大于第一预设阀值时,对γ1方向的语音特征信号进行过零率检测;
当γ1方向的语音特征的过零率达到第二预设阀值时,确认角度β1内有语音特征信号。
其中,对γ1方向的语音特征信号进行包络能量检测包括:
通过如下公式进行包络能量检测:
其中,power为语音特征信号的能量值,参数alpha为计权因子,参数x为某一时点上的采集的语音特征信号,n为离散时点序列值,N为一段时间内时点序列的最大值;
对γ1方向的语音特征信号进行过零率检测包括:通过如下公式进行过零检测:
其中,Z_rate为语音特征信号的过零率,n为离散时间序列中的一个值,
根据本发明的另一个方面,提供了一种提高免提通话设备通话质量的装置;所述免提通话设备包括一个主麦克和至少一个辅麦克组成的送话端,还包括至少一个扬声器组成的受话端,该装置包括:
语音特征确定单元,用于在送话端初始的第一采集角度内进行语音特征信号的扫描;当在第一采集角度内扫描到γ1方向有语音特征信号后,根据该语音特征信号的方向,在第一采集角度内确定一个比第一采集角度小的第二采集角度;
方向校准单元,用于将送话端校准至该第二采集角度确定的方向;
送话端定位单元,用于设置受话端中一个扬声器的虚拟扬声器,该某一扬声器和其虚拟扬声器的连线指向所述γ1方向,并定义第三采集角度,所述第三采集角度所包括的区域范围包含所述第二采集角度确定的方向。
其中,该装置还包括:虚拟麦克风创建单元,用于在送话端初始的第一采集角度内扫描到γ1方向有语音特征信号后,沿着γ1方向,经过主麦克做一条反向延长线,并以主麦克为圆心,以主麦克和其中一个辅麦克连线为半径画圆,圆弧与反向延长线相交的位置即为主麦克的虚拟麦克风;
角度确认单元,用于以主麦克和主麦克的虚拟麦克风为新的语音阵列,并定义角度β1,实时判断角度β1内是否有语音特征信号;是则,确认角度β1为第二采集角度;否则,以主麦克和其中一个辅麦克的连线为对称轴,定义角度β1关于对称轴的镜像角度β2,确认角度β2为第二采集角度。
其中,角度确认单元还用于,
对γ1方向的语音特征信号进行包络能量检测,当能量检测值大于第一预设阀值时,对γ1方向的语音特征信号进行过零率检测;
当γ1方向的语音特征信号的过零率达到第二预设阀值时,确认角度β1内包含语音特征。
其中,角度确认单元包括:
包络检测单元,用于通过如下公式对γ1方向的语音特征信号进行包络能量检测:
其中,power为语音特征信号的能量值,参数alpha为计权因子,所述参数x为某一时点上的采集的语音特征信号,n为离散时点序列值,N为一段时间内时点序列的最大值;
过零检测单元,用于通过如下公式对γ1方向的语音特征信号进行过零率检测:
其中,Z_rate为语音特征信号的过零率,n为离散时间序列中的一个值,
根据本发明的再一个方面,提供了一种免提通话设备,该免提通话设备包括一个主麦克和至少一个辅麦克组成的送话端、至少一个扬声器组成的受话端以及上述的提高免提通话设备通话质量的装置。
本发明的这种提高免提通话设备通话质量的方法和装置,通过对送话端进行语音校准定位,将送话端的语音拾取角度缩小到一个相对精确的范围内,以此避免了送话端拾取的语音信号中包括较多环境噪声,影响语音的信噪比,解决了免提通话设备通话质量不高的问题,提高免提通话设备的通话质量。
附图说明
图1是本发明一个实施例提供一种提高免提通话设备通话质量的方法的流程图;
图2是本发明一个实施例提供的一种提高免提通话设备通话质量的方法的原理示意图;
图3a是本发明一个实施例提供的送话端校准的示意图;
图3b是本发明一个实施例提供的送话端校准的示意图;
图4是本发明一个实施例提供的确定语音特征的流程图;
图5是本发明一个实施例提供的受话端校准示意图;
图6是本发明一个实施例提供的一种提高免提通话设备通话质量的装置的框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
本发明的核心思想是通过麦克风阵列声源定位技术来实时的跟踪语音源的方向,同时确定一个比初始语音保护角度小的语音保护角度进行拾音,可以极大地降低周围环境噪声的干扰,达到提高送话信噪比的目的;同时利用语音源的方位信息,对扬声器阵列进行方向补偿,使其发出的声音刚好指向语音,提高了受话的私密性私密性。
图1是本发明一个实施例提供一种提高免提通话设备通话质量的方法的流程图;参见图1,该免提通话设备包括一个主麦克和至少一个辅麦克组成的送话端,该方法包括:
步骤S110,在送话端初始的第一采集角度内进行扫描;
步骤S120,当在第一采集角度内扫描到的语音特征信号后,根据该语音特征信号的方向,在第一采集角度内确定一个比第一采集角度小的第二采集角度;
步骤S130,将送话端校准至该第二采集角度确定的方向。
通过上述步骤,将送话端的语音保护角度缩小到一个比较小的角度内,并再重新确定的较小的角度内进行拾音,因而避免了环境噪声对语音信号的干扰,提高送话的信噪比,进而提高了免提通话设备的通话质量。
图2是本发明一个实施例提供的一种提高免提通话设备通话质量的方法的原理示意图;参见图2,该免提通话设备1包括:送话端和受话端;
送话端包括主麦克MIC-a和辅麦克MIC-b,受话端包括主扬声器SPK-a和辅扬声器SPK-b;
角度α为送话端初始的扫描角度,正常进行通讯时,送话端采集信号,先按照较大的采集角度α进行扫描,在角度α内检测到语音特征后,再减小采集角度到角度β,进而实现送话端语音定位的目的。送话端语音定位的过程为:送话端在一个初始的扫描角度α内进行语音特征信号的扫描,当确定β角度内具有语音特征时,将送话端定位到该角度确定的方向,该角度确定的方向即是用户说话的位置或者方位(如图2中角度β张开的范围恰好地覆盖了人头的位置,相比角度α对人头的定位更准确),本发明的方法的作用在于将初始的扫描角度缩小到一个较小的第二采集角度β,这样,语音保护角度较小,能够更加精确的定位到用户说话的位置,减少语音信号中的环境噪声,提高语音质量。
图3a是本发明一个实施例提供的送话端校准的示意图;参见图3a,附图标记1表示免提通话设备、2表示辅扬声器、3表示辅麦克、4表示主麦克的虚拟麦克风。
本发明的提高免提通话设备的具体实现方式为:
参见图3a,进行通讯时,送话端先在较大的第一采集角度α进行语音扫描,当扫描到第一采集角度α内γ1方向有语音特征后,在通过主麦克MIC-a的γ1方向的反向延长线上设置虚拟麦克风MIC-c,虚拟麦克风MIC-c位于以主麦克MIC-a为圆心、主麦克MIC-a和辅助MIC-b连线为半径的弧形上,之后主麦克MIC-a和虚拟麦克风MIC-c组成新的阵列,定义新阵列的指向性角度为非常小的第二采集角度β1,角度β1指向γ1方向的较小范围内;β1的值根据不同的应用场景进行具体的选择。
由于缺少辅助阵元,两个点阵元(MIC-a和MIC-c)组成的阵列,难以区分γ方向来自主麦克MIC-a和辅助MIC-b连线的左侧(γ1)还是右侧(γ2),本发明提供的方法的核心内容之一就是:利用虚拟麦克风MIC-c来判断γ方向,判断的方法是,首先在图3a中的γ1方向设置虚拟麦克风MIC-c并形成指向角β1,实时地判断β1指向角内的语音特征,如果发现了语音特征就将指向角β1确定为送话端的第二采集角度,将送话端校准至该第二采集角度(β1)确定的方向。如果没有发现语音特征,那么立刻重新在主麦克MIC-a和辅助MIC-b连线的镜像异侧设置虚拟麦克风MIC-c判断语音的方向。
图3b是本发明一个实施例提供的送话端校准的示意图;参见图3b,附图标记1表示免提通话设备、2表示辅扬声器、3表示辅麦克、4表示主麦克的虚拟麦克风。
在所述β1的指向角度内没有发现语音特征,在所述主麦克MIC-a和辅麦克MIC-b的连线的另一侧设置β1的对称角,确定β2的角度内有语音特征,将送话端校准至β2确定的方向。经过上述步骤完成送话端的定位和校准,提高拾音的指向性。
下面结合语音特征的判断来具体说明送话端的定位。
图4是本发明一个实施例提供的确定语音特征的流程图,参见图4,具体的实时判断角度β1内是否有语音特征包括:
1、采集信号,其中,该采集的信号即扫描到的γ1方向的语音特征;
2、将该语音特征进行包络检测,并判断能量值是否大于预设的第一阀值,是则,将该语音特征进行过零率检测;否则,返回重新确定语音特征的方向和语音特征信号。
3、对该语音特征信号的过零率进行判断,当该过零率大于第二预设阀值时,确定该采集角度β1内具有语音特征信号;将该指向角β1作为较小的那个第二采集角度进而根据该第二采集角度对送话端进行校准。
在本实施例中,对γ1方向的语音特征信号进行包络能量检测包括:
通过如下公式进行包络能量检测:
其中,power为语音特征信号的能量值,参数alpha为计权因子,所述参数x为某一时点上的采集的语音特征信号,n为离散时点序列值,N为一段时间内时点序列的最大值;其中通过alpha和N两个参数调节来控制检测灵敏度,保证包络能量检测的稳定性,一旦发现包络能量power大于第一预设阀值(根据实际情况设定),进入过零率检测步骤。
对γ1方向的语音特征信号进行过零率检测包括:通过如下公式进行过零检测:
其中,Z_rate为语音特征的过零率,n为离散时间序列中的一个值,
当过零率Z_rate大于第二预设阈值时,认为β1角度内有采集信号有语音特征信号,判定语音动作。
在判断β1角度内具有语音特征信号后,将送话端的定位和校准至角度β1确定的范围。如果β1角度内没有语音特征信号(γ1不是语音源方向),那么在与β1关于MIC-a MIC-b的连线对称的角度β2内有语音特征信号,此时也可以运用包络能量检测和过零检测进一步验证β2内的语音特征信号。
综上,通过虚拟阵元定位及语音特征信号检测实现了送话端的精确定位。
图5是本发明一个实施例提供的受话端校准示意图;附图标记1表示免提通话设备、2表示辅扬声器、3表示主麦克。
在送话端定位完成后,利用语音源的方位信息,对扬声器阵列进行方向补偿,使其发出的声音刚好指向语音,即将扬声器阵列的发声方向尽量调整到送话端定位出的用户说话的位置,即第二采集角度所确定的方向,提高了受话的私密性。具体是应用虚拟阵元技术,对扬声器SPK-b进行虚拟,虚拟扬声器SPK-c和扬声器SPK-a的连线指向语音方向,之后设置一个指向角度,将该第三采集角度的覆盖区域(即第三采集角度所包括的声音传播的区域范围)覆盖到第二采集角度确定的语音方向即可(如图5中所示SPK-a下方的角度张开范围覆盖了人头的位置),优选的,该第三采集角度直接指向所述第二采集角度所述确定的语音方向。
参见图5,该免提通话设备还包括至少一个扬声器组成的受话端,在确定了第二采集角度和方向完成送话端校准后,该方法还包括:对免提设备的受话端进行校准,
设置受话端中一个扬声器的虚拟扬声器,该扬声器和其虚拟扬声器的连线指向γ1方向,并定义第三采集角度,第三采集角度指向第二采集角度确定的方向,第三采集角度实际上是播放声音的角度范围,该角度范围将第二采集角度和方向包括在内,使得扬声器尽可能准确的朝向语音源的方位播放,缩小播放语音范围,提高受话的私密性。
在免提通话设备的使用过程中,由于麦克风与扬声器之间的距离较近,因而可以使用送话端校准时确定的语音特征的方向来对送话端进行校准。
参见图5,设置辅扬声器SPK-b的虚拟扬声器SPK-c,在通过主扬声器SPK-a和γ1方向的反向延长线上设置虚拟扬声器SPK-c,虚拟扬声器SPK-c在以主扬声器SPK-a为圆心、主扬声器SPK-a和辅扬声器SPK-b连线为半径的弧形上,将主扬声器SPK-a和虚拟扬声器SPK-c组成新的阵列,定义新阵列的指向性角度为第三采集角度。将该第三采集角度指向送话端校准时确定的第二采集角度确定的方向完成受话端定位校准。
可以理解,附图3a、3b和图5中出现的角度β和α是为了示意性的说明送话端和受话端定位时的角度范围,来达到对送话端进行定位和校准提高免提语音信号的信噪比,以及对受话端定位提高受话的私密性,附图中出现的角度并非实际的角度大小。
综上,本发明的这种提高免提设备通话质量的方法经过送话端校准和受话端校准后,既降低了周围环境噪声的干扰,提高送话信噪比,达到提高免提通话设备的通话质量的目的。又对扬声器阵列进行方向补偿,使其发出的声音刚好指向语音,提高了受话的私密性,增强用户使用体验。本方法可以应用在智能手表等具有免提通话功能的智能设备上,能大大提高智能设备通话性能。
根据本发明的另一个方面,提供了一种提高免提通话设备通话质量的装置;图6是本发明一个实施例提供的一种提高免提通话设备通话质量的装置的框图,该装置600包括:
语音特征确定单元601,用于在送话端初始的第一采集角度内进行扫描;当在第一采集角度内扫描到的语音特征信号后,根据该语音特征信号的方向,在第一采集角度内确定一个比第一采集角度小的第二采集角度;
方向校准单元602,用于将送话端校准至该第二采集角度确定的方向。
其中,该装置还包括:虚拟麦克风创建单元,用于在送话端初始的第一采集角度内扫描到γ1方向有语音特征后,沿着γ1方向,经过主麦克做一条反向延长线,并以主麦克为圆心,以主麦克和其中一个辅麦克连线为半径画圆,圆弧与反向延长线相交的位置即为主麦克的虚拟麦克风;
角度确认单元,用于以主麦克和主麦克的虚拟麦克风为新的语音阵列,并定义角度β1,实时判断角度β1内是否有语音特征信号;是则,确认角度β1为第二采集角度;否则,以主麦克和其中一个辅麦克的连线为对称轴,定义角度β1关于对称轴的镜像角度β2,确认角度β2为第二采集角度。
其中,角度确认单元还用于,
对γ1方向的语音特征信号进行包络能量检测,当能量检测值大于第一预设阀值时,对γ1方向的语音特征信号进行过零率检测;
当γ1方向的语音特征信号的过零率达到第二预设阀值时,确认角度β1内包含语音特征信号。
其中,角度确认单元包括:
包络检测单元,用于通过如下公式对γ1方向的语音特征信号进行包络能量检测:
其中,power为语音特征信号的能量值,参数alpha为计权因子,所述参数x为某一时点上的采集的语音特征信号,n为离散时点序列值,N为一段时间内时点序列的最大值;
过零检测单元,用于通过如下公式对γ1方向的语音特征信号进行过零率检测:
其中,Z_rate为语音特征信号的过零率,n为离散时间序列中的一个值,
其中,该装置还包括:送话端定位单元,用于设置受话端中一个扬声器的虚拟扬声器,该某一扬声器和其虚拟扬声器的连线指向γ1方向,并定义第三采集角度,所述第三采集角度所包括的区域范围包含所述第二采集角度确定的方向。
根据本发明的又一个方面,提供了一种免提通话设备,包括一个主麦克和至少一个辅麦克组成的送话端、至少一个扬声器组成的受话端以及上述的提高免提通话设备通话质量的装置。
需要说明的是,本发明的免提通话设备由于具有送话端和受话端,可以按照上述提高免提通话质量的方法在其受话端和送话端进行改进,但是在某些应用场合下,免提通话设备仅仅具有送话端或受话端,此时可以按照本发明具体实施例在受话端如何提高免提通话质量的方法来改进受话端或者在送话端如何提高免提通话质量的方法来改进送话端。即本发明的受话端和送话端的提高免提通话质量的方法可以单独分开实施,在此不再赘述。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (8)
1.一种提高免提通话设备通话质量的方法,所述免提通话设备包括一个主麦克和至少一个辅麦克组成的送话端,还包括至少一个扬声器组成的受话端,其特征在于,该方法包括:
在送话端初始的第一采集角度内进行语音特征信号的扫描;
当在所述第一采集角度内扫描到γ1方向有语音特征信号后,根据该语音特征信号的方向,在所述第一采集角度内确定一个比所述第一采集角度小的第二采集角度;
将所述送话端校准至该所述第二采集角度确定的方向;
设置所述受话端中一个扬声器的虚拟扬声器,该扬声器和其虚拟扬声器的连线指向所述γ1方向,并定义第三采集角度,所述第三采集角度所包括的区域范围包含所述第二采集角度确定的方向;
其中,所述设置所述受话端中一个扬声器的虚拟扬声器,该扬声器和其虚拟扬声器的连线指向所述γ1方向,并定义第三采集角度包括:
在通过主扬声器和γ1方向的反向延长线上设置虚拟扬声器,虚拟扬声器在以主扬声器为圆心、主扬声器和辅扬声器连线为半径的弧形上,将主扬声器和虚拟扬声器组成新的阵列,定义新阵列的指向性角度为第三采集角度。
2.如权利要求1所述的方法,其特征在于,所述在第一采集角度内扫描到γ1方向有语音特征信号后,根据该语音特征信号的方向,在第一采集角度内确定一个比初始采集角度小的第二采集角度包括:
在送话端初始的所述第一采集角度内扫描到γ1方向有语音特征信号后,沿着γ1方向,经过所述主麦克做一条反向延长线,并以所述主麦克为圆心,以所述主麦克和其中一个辅麦克连线为半径画圆,圆弧与所述反向延长线相交的位置即为所述主麦克的虚拟麦克风;
以所述主麦克和所述主麦克的虚拟麦克风为新的语音阵列,并定义一个角度β1,实时判断所述角度β1内是否有语音特征信号;是则,确认所述角度β1为所述第二采集角度;
否则,以所述主麦克和其中一个辅麦克的连线为对称轴,定义角度β1关于所述对称轴的镜像角度β2,确认所述角度β2为所述第二采集角度。
3.如权利要求2所述的方法,其特征在于,所述实时判断所述角度β1内是否有语音特征信号包括:
对γ1方向的语音特征信号进行包络能量检测,当所述能量检测值大于第一预设阀值时,对所述γ1方向的语音特征信号进行过零率检测;
当所述γ1方向的语音特征信号的过零率达到第二预设阀值时,确认所述角度β1内有语音特征信号。
4.如权利要求3所述的方法,其特征在于,所述对γ1方向的语音特征进行包络能量检测包括:
通过如下公式进行包络能量检测:
其中,power为所述语音特征信号的能量值,所述参数alpha为计权因子,所述参数x为某一时点上的采集的语音特征信号,n为离散时点序列值,N为一段时间内时点序列的最大值;所述对所述γ1方向的语音特征信号进行过零率检测包括:通过如下公式进行过零检测:
其中,Z_rate为语音特征信号的过零率,n为离散时间序列中的一个值,
5.一种提高免提通话设备通话质量的装置,其特征在于,该装置包括:
语音特征确定单元,用于在送话端初始的第一采集角度内进行语音特征信号的扫描;当在所述第一采集角度内扫描到γ1方向有语音特征信号后,根据该语音特征信号的方向,在所述第一采集角度内确定一个比所述第一采集角度小的第二采集角度;
方向校准单元,用于将所述送话端校准至该所述第二采集角度确定的方向;
送话端定位单元,用于设置受话端中一个扬声器的虚拟扬声器,该某一扬声器和其虚拟扬声器的连线指向所述γ1方向,并定义第三采集角度,所述第三采集角度所包括的区域范围包含所述第二采集角度确定的方向;
其中,所述设置所述受话端中一个扬声器的虚拟扬声器,该扬声器和其虚拟扬声器的连线指向所述γ1方向,并定义第三采集角度包括:
在通过主扬声器和γ1方向的反向延长线上设置虚拟扬声器,虚拟扬声器在以主扬声器为圆心、主扬声器和辅扬声器连线为半径的弧形上,将主扬声器和虚拟扬声器组成新的阵列,定义新阵列的指向性角度为第三采集角度。
6.如权利要求5所述的装置,其特征在于,该装置还包括:
虚拟麦克风创建单元,用于在送话端初始的所述第一采集角度内扫描到γ1方向有语音特征后,沿着γ1方向,经过主麦克做一条反向延长线,并以所述主麦克为圆心,以所述主麦克和其中一个辅麦克连线为半径画圆,圆弧与所述反向延长线相交的位置即为所述主麦克的虚拟麦克风;
角度确认单元,用于以所述主麦克和所述主麦克的虚拟麦克风为新的语音阵列,并定义角度β1,实时判断所述角度β1内是否有语音特征;是则,确认所述角度β1为所述第二采集角度;否则,以所述主麦克和其中一个辅麦克的连线为对称轴,定义角度β1关于所述对称轴的镜像角度β2,确认所述角度β2为所述第二采集角度。
7.如权利要求6所述的装置,其特征在于,所述角度确认单元还用于:
对γ1方向的语音特征进行包络能量检测,当所述能量检测值大于第一预设阀值时,对所述γ1方向的语音特征进行过零率检测;
当所述γ1方向的语音特征的过零率达到第二预设阀值时,确认所述角度β1内包含语音特征;
所述角度确认单元包括:
包络检测单元,用于通过如下公式对γ1方向的语音特征信号进行包络能量检测:
其中,power为语音特征信号的能量值,所述参数alpha为计权因子,所述参数x为某一时点上的采集的语音特征信号,n为离散时点序列值,N为一段时间内时点序列的最大值;
过零检测单元,用于通过如下公式对所述γ1方向的语音特征信号进行过零率检测:
其中,Z_rate为语音特征信号的过零率,n为离散时间序列中的一个值,
8.一种免提通话设备,其特征在于,该免提通话设备包括一个主麦克和至少一个辅麦克组成的送话端、至少一个扬声器组成的受话端以及如权利要求5至7中任一项所述的提高免提通话设备通话质量的装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611147270.0A CN106686185B (zh) | 2014-06-30 | 2014-06-30 | 提高免提通话设备通话质量的方法、装置和免提通话设备 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611147270.0A CN106686185B (zh) | 2014-06-30 | 2014-06-30 | 提高免提通话设备通话质量的方法、装置和免提通话设备 |
CN201410307430.8A CN104052851B (zh) | 2014-06-30 | 2014-06-30 | 提高免提通话设备通话质量的方法、装置和免提通话设备 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410307430.8A Division CN104052851B (zh) | 2014-06-30 | 2014-06-30 | 提高免提通话设备通话质量的方法、装置和免提通话设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106686185A CN106686185A (zh) | 2017-05-17 |
CN106686185B true CN106686185B (zh) | 2019-07-19 |
Family
ID=51505197
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611147270.0A Active CN106686185B (zh) | 2014-06-30 | 2014-06-30 | 提高免提通话设备通话质量的方法、装置和免提通话设备 |
CN201410307430.8A Active CN104052851B (zh) | 2014-06-30 | 2014-06-30 | 提高免提通话设备通话质量的方法、装置和免提通话设备 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410307430.8A Active CN104052851B (zh) | 2014-06-30 | 2014-06-30 | 提高免提通话设备通话质量的方法、装置和免提通话设备 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9648154B1 (zh) |
EP (1) | EP3089431A4 (zh) |
JP (2) | JP6211716B2 (zh) |
KR (1) | KR101673123B1 (zh) |
CN (2) | CN106686185B (zh) |
WO (1) | WO2016000585A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106686185B (zh) * | 2014-06-30 | 2019-07-19 | 歌尔科技有限公司 | 提高免提通话设备通话质量的方法、装置和免提通话设备 |
CN106162427B (zh) * | 2015-03-24 | 2019-09-17 | 青岛海信电器股份有限公司 | 一种声音获取元件的指向性调整方法和装置 |
CN106604183B (zh) * | 2015-10-20 | 2020-06-26 | 华为终端有限公司 | 控制终端的多麦克风降噪的拾音范围的方法和装置 |
US10063967B2 (en) * | 2016-03-22 | 2018-08-28 | Panasonic Intellectual Property Management Co., Ltd. | Sound collecting device and sound collecting method |
KR101847070B1 (ko) * | 2016-07-07 | 2018-04-09 | 고준석 | 신체활용형 스마트 통화장치 |
CN106303832B (zh) | 2016-09-30 | 2019-12-27 | 歌尔科技有限公司 | 扬声器及提高指向性的方法、头戴式设备及方法 |
CN110390947B (zh) * | 2018-04-23 | 2024-04-05 | 北京京东尚科信息技术有限公司 | 声源位置的确定方法、系统、设备和存储介质 |
US11140477B2 (en) * | 2019-01-06 | 2021-10-05 | Frank Joseph Pompei | Private personal communications device |
CN110225195B (zh) * | 2019-05-30 | 2021-06-08 | 维沃移动通信有限公司 | 一种语音通话方法及终端 |
CN111398904A (zh) * | 2020-02-28 | 2020-07-10 | 云知声智能科技股份有限公司 | 一种加速语音控制设备声源定位的方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1206161A1 (en) * | 2000-11-10 | 2002-05-15 | Sony International (Europe) GmbH | Microphone array with self-adjusting directivity for handsets and hands free kits |
CN1813284A (zh) * | 2003-06-17 | 2006-08-02 | 索尼爱立信移动通讯股份有限公司 | 语音活动检测的装置和方法 |
CN101588524A (zh) * | 2009-07-08 | 2009-11-25 | 电子科技大学 | 指向可调式微型声频定向扬声器系统 |
CN103366756A (zh) * | 2012-03-28 | 2013-10-23 | 联想(北京)有限公司 | 一种声音信号的接收方法及装置 |
CN106686185A (zh) * | 2014-06-30 | 2017-05-17 | 歌尔科技有限公司 | 提高免提通话设备通话质量的方法、装置和免提通话设备 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19990046294A (ko) * | 1999-02-03 | 1999-07-05 | 박귀원 | 이어마이크에서의오디오/통화서비스장치및방법 |
JP2001359185A (ja) * | 2000-06-13 | 2001-12-26 | Matsushita Electric Ind Co Ltd | ハンズフリー装置とその音声信号処理方法 |
US7783061B2 (en) * | 2003-08-27 | 2010-08-24 | Sony Computer Entertainment Inc. | Methods and apparatus for the targeted sound detection |
US20070171524A1 (en) | 2002-09-03 | 2007-07-26 | Stereo Vision Imaging, Inc. | Focusing mechanism for stereoscopic systems |
CN101488981A (zh) * | 2008-01-18 | 2009-07-22 | 上海晨兴电子科技有限公司 | 一种提高手机语音通话质量的手机结构及方法 |
KR20100104978A (ko) * | 2009-03-20 | 2010-09-29 | 고재준 | 접촉 소음 송출 방지 기능을 갖는 전화기 |
CN102111697B (zh) * | 2009-12-28 | 2015-03-25 | 歌尔声学股份有限公司 | 一种麦克风阵列降噪控制方法及装置 |
JP2012133250A (ja) * | 2010-12-24 | 2012-07-12 | Sony Corp | 音情報表示装置、音情報表示方法およびプログラム |
JP5333559B2 (ja) * | 2011-10-07 | 2013-11-06 | 株式会社デンソー | 車両用装置 |
DE102012214081A1 (de) | 2012-06-06 | 2013-12-12 | Siemens Medical Instruments Pte. Ltd. | Verfahren zum Fokussieren eines Hörinstruments-Beamformers |
CN103634721A (zh) | 2012-08-20 | 2014-03-12 | 联想(北京)有限公司 | 一种数据处理方法以及一种电子设备 |
CN103079148B (zh) | 2012-12-28 | 2018-05-04 | 中兴通讯股份有限公司 | 一种终端双麦克风降噪的方法及装置 |
CN103873977B (zh) * | 2014-03-19 | 2018-12-07 | 惠州Tcl移动通信有限公司 | 基于多麦克风阵列波束成形的录音系统及其实现方法 |
CN203981982U (zh) | 2014-07-08 | 2014-12-03 | 廊坊市艺鸿电子科技有限公司 | 3d电影手机观看装置 |
KR20160066344A (ko) * | 2014-12-02 | 2016-06-10 | 현대모비스 주식회사 | 차량용 핸즈프리 제어 장치 및 방법 |
CN104570355A (zh) | 2015-01-19 | 2015-04-29 | 青岛歌尔声学科技有限公司 | 可调式头戴显示器 |
CN204705768U (zh) | 2015-05-12 | 2015-10-14 | 北京小鸟看看科技有限公司 | 一种头戴式显示器 |
-
2014
- 2014-06-30 CN CN201611147270.0A patent/CN106686185B/zh active Active
- 2014-06-30 CN CN201410307430.8A patent/CN104052851B/zh active Active
-
2015
- 2015-06-29 EP EP15814169.7A patent/EP3089431A4/en not_active Ceased
- 2015-06-29 WO PCT/CN2015/082634 patent/WO2016000585A1/zh active Application Filing
- 2015-06-29 JP JP2016548670A patent/JP6211716B2/ja active Active
- 2015-06-29 US US15/122,835 patent/US9648154B1/en active Active
- 2015-06-29 KR KR1020167024556A patent/KR101673123B1/ko active IP Right Grant
-
2017
- 2017-09-13 JP JP2017175698A patent/JP6596049B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1206161A1 (en) * | 2000-11-10 | 2002-05-15 | Sony International (Europe) GmbH | Microphone array with self-adjusting directivity for handsets and hands free kits |
CN1813284A (zh) * | 2003-06-17 | 2006-08-02 | 索尼爱立信移动通讯股份有限公司 | 语音活动检测的装置和方法 |
CN101588524A (zh) * | 2009-07-08 | 2009-11-25 | 电子科技大学 | 指向可调式微型声频定向扬声器系统 |
CN103366756A (zh) * | 2012-03-28 | 2013-10-23 | 联想(北京)有限公司 | 一种声音信号的接收方法及装置 |
CN106686185A (zh) * | 2014-06-30 | 2017-05-17 | 歌尔科技有限公司 | 提高免提通话设备通话质量的方法、装置和免提通话设备 |
Also Published As
Publication number | Publication date |
---|---|
US20170142243A1 (en) | 2017-05-18 |
EP3089431A4 (en) | 2017-11-22 |
CN104052851A (zh) | 2014-09-17 |
JP6211716B2 (ja) | 2017-10-11 |
JP2017513258A (ja) | 2017-05-25 |
JP6596049B2 (ja) | 2019-10-23 |
KR20160110531A (ko) | 2016-09-21 |
EP3089431A1 (en) | 2016-11-02 |
CN104052851B (zh) | 2017-07-21 |
WO2016000585A1 (zh) | 2016-01-07 |
JP2018019413A (ja) | 2018-02-01 |
KR101673123B1 (ko) | 2016-11-04 |
US9648154B1 (en) | 2017-05-09 |
CN106686185A (zh) | 2017-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106686185B (zh) | 提高免提通话设备通话质量的方法、装置和免提通话设备 | |
CN104902418B (zh) | 用于估计目标和噪声谱方差的多传声器方法 | |
CN102045618B (zh) | 自动调整的麦克风阵列、方法和携带麦克风阵列的装置 | |
CN101843118B (zh) | 用于无线听力辅助的方法和系统 | |
CN106782585A (zh) | 一种基于麦克风阵列的拾音方法及系统 | |
CN107004424A (zh) | 噪声降低和语音增强的方法、设备和系统 | |
CN101729654A (zh) | 调整移动终端通话语音的方法及移动终端 | |
CN106898348A (zh) | 一种出声设备的去混响控制方法和装置 | |
CN103456305A (zh) | 终端和基于多个声音采集单元的语音处理方法 | |
CN203219384U (zh) | 一种处理通话环境噪声的装置及移动终端 | |
CN104376847A (zh) | 一种语音信号处理方法和装置 | |
CN206559550U (zh) | 一种内置麦克风阵列的遥控器及电视系统 | |
US11910852B2 (en) | Facemask with automated voice display | |
CN108235208A (zh) | 用于运行助听器设备的方法 | |
CN105225665A (zh) | 一种语音识别方法及语音识别装置 | |
CN107124647A (zh) | 一种全景视频录制时自动生成字幕文件的方法及装置 | |
CN103546617A (zh) | 一种声音调节的方法及终端 | |
CN106302974A (zh) | 一种信息处理的方法及电子设备 | |
CN102685658B (zh) | 实际噪声场的实验室回放装置和方法 | |
CN107659328A (zh) | 通话控制方法、装置、终端、通话系统以及可读存储介质 | |
CN109389852A (zh) | 一种盲人乘坐公交车的车内报站辅助装置 | |
CN104079420A (zh) | 一种信息处理方法及电子设备 | |
CN105025149A (zh) | 一种自动调节通话音量的方法及装置 | |
CN206470756U (zh) | 一种实时语音互译装置 | |
CN105824597A (zh) | 一种终端音频处理的方法及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |