CN106340300A - 针对电话时钟的计算高效数据率失配补偿 - Google Patents
针对电话时钟的计算高效数据率失配补偿 Download PDFInfo
- Publication number
- CN106340300A CN106340300A CN201610534522.9A CN201610534522A CN106340300A CN 106340300 A CN106340300 A CN 106340300A CN 201610534522 A CN201610534522 A CN 201610534522A CN 106340300 A CN106340300 A CN 106340300A
- Authority
- CN
- China
- Prior art keywords
- sample
- frame
- audio signal
- signal
- window
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 84
- 238000000034 method Methods 0.000 claims description 29
- 238000004891 communication Methods 0.000 claims description 18
- 238000005070 sampling Methods 0.000 claims description 18
- 230000003247 decreasing effect Effects 0.000 claims description 17
- 230000005540 biological transmission Effects 0.000 claims description 8
- 230000013011 mating Effects 0.000 claims description 5
- 230000008878 coupling Effects 0.000 claims description 4
- 238000010168 coupling process Methods 0.000 claims description 4
- 238000005859 coupling reaction Methods 0.000 claims description 4
- 238000012886 linear function Methods 0.000 claims description 2
- 230000010267 cellular communication Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 62
- 239000013078 crystal Substances 0.000 description 16
- 239000010453 quartz Substances 0.000 description 8
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 8
- 230000008859 change Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 4
- 241001062009 Indigofera Species 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 238000007620 mathematical function Methods 0.000 description 2
- 238000012421 spiking Methods 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003973 paint Substances 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
- G10L21/043—Time compression or expansion by changing speed
- G10L21/045—Time compression or expansion by changing speed using thinning out or insertion of a waveform
- G10L21/049—Time compression or expansion by changing speed using thinning out or insertion of a waveform characterised by the interconnection of waveforms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Synchronisation In Digital Transmission Systems (AREA)
Abstract
本发明涉及针对电话时钟的计算高效数据率失配补偿。将来自第一和第二音频信号的不同的第一和第二音频信号采样率彼此匹配。如果信号采样率不同,则复制第一音频信号的样本的帧。将复制的副本乘以窗口函数及其反函数以产生“取窗的帧”,其第一个和最后一个样本可以被删除或添加以增加或减少帧速率。
Description
背景技术
当对音频信号采样用于数字传输时,采样率由通常被体现为石英晶体振荡器的时钟确定,时钟的输出频率出于多个原因可能不同于所期望的标称速率。在其中网络接入设备具有独立时钟的电信系统中,两个时钟率之间的数据率失配将不可避免地发生。这种差异在从数字样本重构音频信号时引起音频信号中的假象(artifact)。那些假象可以被表现为卡搭声、砰然声和/或短暂的静默,其所有都是恼人的。
简单地从数字信号添加或去除零样本或重复样本的现有技术“强力(bruteforce)”方法未解决由不相似的时钟造成的问题。添加或去除样本将替代地在音频信号中引入不连续并且生成可听见假象(卡搭声或砰然声),其将恶化最终用户体验。引入周围样本的平均样本仍然未完全解决可听见假象。
基于历史数据预测样本的另一现有技术方法可能对于嵌入类型的应用而言在计算上变得昂贵得太多。
匹配不同数字样本传输速率的简单、计算上高效的方法将是对于现有技术的改进。
附图说明
图1 描绘了电话系统,该电话系统的不同部件可以以由于不同时钟信号频率引起的不同速率生成脉冲调制(PCM)话音样本;
图2A是音频信号的八十个脉冲编码调制(PCM)样本的值的曲线图,并且其包括样本帧以及逐渐增加的窗口函数的曲线图;
图2B是样本的第一取窗的帧(即图2A中示出的八十个PCM样本的值乘以图2A中示出的逐渐增加的窗口函数的同时发生值)的曲线图。
图2C是图2A中示出的相同音频信号的八十个脉冲编码调制(PCM)样本的曲线图以及逐渐减少的窗口函数的曲线图;
图2D是样本的第二取窗的帧(即图2C中示出的八十个PCM样本的值乘以图2C中示出的逐渐减少的窗口函数的同时发生值)的曲线图。
图3A是从单个帧去除最后一个样本(即样本号80)之后的两个取窗的帧的总和的曲线图;
图3B是向帧添加一个新的最终或最后一个样本(即样本号81)之后的两个取窗的帧的总和的曲线图;
图4A和4B描绘匹配不同的音频信号采样率的方法步骤;
图5描绘了用于匹配不同的音频信号采样率的装置的第一实施例;
图6描绘了用于匹配不同的音频信号采样率的装置的第二和优选实施例;以及
图7A描绘了用强力样本校正的语音的频谱表示。
图7B 描绘了用所提出的样本校正方法的语音的频谱表示。
具体实施方式
图1描绘了常规电话系统100的一个实施例。图1中示出的系统100包括车辆收音机102,车辆收音机102的示例将是未示出的针对机动车辆的“娱乐信息(infotainment)”系统的收音机部分。
收音机102包括具有射频收发器106的蓝牙收发器104,该射频收发器106分别从蓝牙功能的设备接收蓝牙信号和向蓝牙功能的设备传输蓝牙信号,收发器106与该蓝牙功能的设备“配对”。收发器106的操作由通过常规石英晶体108提供到收发器106的定时信号或时钟来控制或定时,收发器106的操作包括其音频信号向脉冲编码调制(PCM)的转换。
如本文中所使用的,术语“实时”指代其间某事发生的实际时间。
蓝牙收发器104实时提供PCM样本114到在收音机102中的蜂窝收发器108以及从该蜂窝收发器 108接收PCM样本114。蜂窝收发器108包括中央处理单元(CPU)或计算机120。CPU 120从其自身石英晶体122接收其自身定时信号,石英晶体122也是收音机102的部分。实时提供到收发器108和从收发器108接收的PCM样本114也实时被提供到CPU 120和从CPU120接收。
中央处理单元120从蓝牙收发器104实时接收的PCM样本114由CPU 120 实时以由CPU的石英晶体122而不是蓝牙收发器104的石英晶体108确定的速率发送或转发到编码器/解码器(CODEC(编解码器))126。中央处理单元120发送到蓝牙收发器104的PCM样本114由CPU 120实时以由CPU的石英晶体122确定的速率从编码器/解码器(CODEC)126接收,因为CPU 120也提供时钟信号124到CODEC。可以包括音频的来自CODEC 126的输出信号127可以被提供到扬声器130。
本领域普通技术人员知道标称相同的石英晶体的实际频率和稳定性是很少同样的。从具有相同的标称频率的两个晶体输出的实际频率将几乎总是不同的。如果两个晶体经受不同的环境条件,则它们的频率也将不同或不同地偏移。
在图1中,当两个晶体108和122的频率仅稍微不同时,由蓝牙收发器104以其发送PCM样本114到CPU 120的速率将不同于以其将相同的PCM样本112从CPU 120传输到CODEC126的速率。类似地,由CPU 120发送到蓝牙收发器104的样本的速率将是不同的。
不管为什么两个晶体110和122可能具有不同的输出频率的理由或原因如何,从蓝牙收发器104(所述蓝牙收发器104从其自身晶体108接收定时信号)提供到CPU 120的PCM样本114的流的定时(并且反之亦然),将几乎总是具有与从CPU 120输出的PCM样本112的频率或采样率稍微不同的频率或采样率,因为针对CPU 120的晶体122的频率将稍微不同于蓝牙收发器晶体108的频率。
PCM信号采样率114、112之间的差异将不可避免地在从PCM样本重建的音频中产生假象,即卡搭声、砰然声和类似恼人的声音。在图1中示出的系统中,从CPU 120输出的PCM样本112本质上是从CODEC126传输到天线128的,从所述天线128通过网络140将所述PCM样本112路由到在遥远的位置处的用户142的行动电话144。PCM样本也可以被用于重建从扬声器130输出的音频。当CPU 120“用完”用于发送的PCM样本时,正如在CPU 120以比样本114从蓝牙收发器104到达CPU 120更快的速率输出PCM样本112时发生那样,远端处的用户142或听着扬声器130的人将听到从用户的行动电话144输出的音频中的一个或多个假象。
本领域普通技术人员将认识到从遥远的行动电话 144发送到车辆中的收音机102的信号也将具有其自身的传输速率。当图1中的两个晶体108和122具有不同的频率时,从CODEC126获得并且提供给CPU 120用于传输到蓝牙收发器104的PCM样本也将处于与收发器104可以将那些采样样本转换用于传输到成对的设备相比不同的速率。从晶体108和122生成的时钟之间的定时频率失配或偏斜因此将引起从行动电话110输出的音频中的假象或噪声,蓝牙收发器104与所述行动电话110配对。
简单地说,本文中公开的方法和装置使音频信号的数字样本能够在以不同速率处理那些音频信号样本的各音频设备之间交换。另一种方式来说,本文中的方法和装置控制表示以不同的速率处理这种数据的各音频设备之间交换的音频信号的数字数据的接收和传输。解释地说,本文中公开的方法和装置使一个或两个音频设备缩短或延长在它们之间传递并经过它们的的音频样本的帧,以便补偿数据率失配。
如本文中使用的,术语“窗口”指代一组系数,将数据记录中的对应样本乘以该组系数,以便更准确地估计从其获得样本的信号的某些性质。通常,系数值平稳地增加。
“窗口函数”是数学函数,该数学函数在选择的间隔外部是零值的。作为示例,在间隔内部是单个值并且在其他地方为零的函数被称为矩形窗口,该矩形窗口也描述了其图形表示的形状。“三角”窗口函数将具有跨间隔逐渐增加并且在间隔外部为零的值。
当将包括样本帧的多个PCM样本乘以三角窗口函数时,该三角窗口函数具有等于帧的时间长度的间隔时间并且其具有间隔开始处的初始零值和间隔结束处的最终值,窗口函数和PCM样本的帧的乘积将是PCM样本的调整的或“取窗”的帧,其值从零逐渐增加。取窗的帧的第一个样本或值将是零;乘以一的PCM帧的最后一个样本的值将不变。
图2A是包括第一音频信号“帧”205诸如从蓝牙收发器104输出到CPU 120的PCM音频信号或者从CPU 120输出到蓝牙收发器104的PCM音频信号的帧的八十(80)个PCM样本的幅值203的曲线图202。帧205因此包括八十(80)个离散样本。样本彼此分离1/8000秒。帧205的标称持续时间或“宽度”因此是大约10毫秒。曲线图202因此示出音频信号的样本的幅值可以在非常短的时间段上如何变化。
图2A也描绘了逐渐增加的窗口函数的曲线图。由参考数字204标识窗口函数的曲线图。图2A中示出窗口函数204。
在样本205的帧的开始207处,窗口函数204具有零(0.0)的起始值。在样本205的帧的终点或相反端209处,窗口函数204具有1.0的结束值。
对于帧207的开始与帧209的结束之间的每个PCM样本,窗口函数204具有对应的值,其跨帧205的持续时间或“宽度”在帧205的开始和结束之间连续地增加,即,从零逐渐增加到一。
图2B是图2A中描绘的每个PCM样本在帧205中的每个PCM样本的时间处乘以逐渐增加的窗口函数204的值的曲线图或绘图210。
如图2B示出的,逐渐增加的窗口函数204乘以对应的PCM样本的值对于帧205的第一八至十个样本(211)而言实质上等于零。然而,随着逐渐增加的窗口函数204的值从零增加,两个函数乘积的曲线图210的形状开始类似于图2A中示出的样本的曲线图202的形状。
图2C描绘了在图2A中示出的相同的八十(80)个样本的相同曲线图202以及图2A中示出的窗口函数204的反函数(inverse)的曲线图208。图2C因此描绘了逐渐减少的窗口函数208。图2D描绘了图2C的八十个样本乘以图2C中示出的减少的窗口函数208的曲线图或绘图212。
图2B中示出的曲线图210与图2D中示出的曲线图212的比较示出两个曲线图210、212是彼此的近似镜像图像。当两个曲线图210、212被添加到彼此时,它们的总和将事实上重建图2A和2C中示出的样本的原始曲线图202。另一种方式来说,将样本205的帧乘以逐渐增加的窗口函数来产生第一取窗的帧210和将相同帧的副本乘以逐渐增加的窗口函数的反函数来产生第二取窗的帧212以及将两个取窗的帧210、212加在一起的有效效应实质上导致原始帧202被重建。
在将取窗的帧210、212添加到彼此之前,可以有效降低帧速率,并且通过控制两个通信设备(例如,蓝牙收发器104和CPU 120或者CPU 120和蓝牙收发器104)中的至少一个补偿两个不同通信设备的失配的数据率以便从取窗的帧210、212去除样本。类似地,在将取窗的帧添加到彼此之前,可以有效地增加帧速率并且通过控制用于将样本添加到两个取窗的帧的设备中的一个补偿失配的数据率。
在优选的实施例中,通过以下降低帧速率,从通过将样本205的帧乘以逐渐增加的窗口函数210生成的取窗的帧的副本去除第一个样本,以及从通过将样本205的相同帧乘以逐渐减少的窗口函数212创建的取窗的帧的副本去除最后一个样本。增加的窗口函数204的值从零(0.0)到一(1.0)变动。减少的窗口函数208的值从一(1.0)到零(0.0)变动。因此,增加和减少的窗口函数是彼此的反函数。
图3A是在图2A和图2C中描绘的但其中删除了一个样本的PCM样本205的帧的曲线图310。图3B是在图2A和图2C中描绘的其中插入了新的样本的PCM样本205的帧的曲线图。
关于图3A,在优选的实施例中,为了减少帧速率、乘以逐渐增加的窗口函数的帧205(“第一取窗的帧”)的副本的第一个样本被删除或去除,其是乘以逐渐减少的窗口函数的帧(“第二取窗的帧”)的副本的最后一个样本。当将两个取窗的帧加在一起时,结果是有七十九(79)个PCM样本但在与原始的八十样本帧相同的时间长度上彼此均匀地间隔开的缩短的帧305。
在图3A中,将样本从二(2)到八十(80)进行编号,如图3A中示出的那样。图2A和2C的帧 205因此成为减少长度的帧305,即,“调整”或“修改”的帧305,其长度是七十九(79)个样本,所述样本中的每一个彼此分离大约1/8000秒。七十九个帧因此在大约10 ms的相同标称时间段中被发送。帧速率因此被降低。
如图3B中示出的,增加帧速率通过将新的第一个样本添加到第一取窗的帧的第一副本并且将新的最后一个样本添加到第二取窗的帧的第二副本来实现。添加的示例具有等于0.0的值。当将两个取窗、81 样本的帧添加到彼此时,新的81样本帧305A如图3B中示出的那样增加帧速率而不使从其获得原始、80样本帧的音频信号的原始内容失真。
图4A和4B描绘了方法400的步骤,方法400用于在采样率彼此不同时将第一音频信号采样率匹配到第二音频信号采样率。按照第一步骤402,接收音频信号PCM样本的流,诸如通过蜂窝电话108从蓝牙收发器104接收的PCM样本。在这种实施例中,将来自蓝牙收发器104的流116的采样率与从CPU 120提供给CODEC 126的样本的流的帧速率或采样率进行比较。步骤404和406因此描绘了第一和第二信号采样率的确定。
在步骤408处,做出第一和第二信号采样率是否彼此不同的确定。如果速率是相同的,则不需要对信号采样率做出调整。
如果在步骤408处,两个信号采样率被确定为不同,则方法400进行到步骤410,在步骤410中来自信号中的一个的样本的帧,例如来自蓝牙收发器104的帧的样本,被复制,从而从相同的信号产生两个复制的样本的帧。在步骤412处,将在步骤410处创建的帧的副本中的一个乘以逐渐增加的窗口函数。将样本的帧的每个样本乘以针对要乘的样本的帧中的“位置”处的逐渐增加的窗口函数的数字值。作为示例,针对帧的第一示例的窗口函数值接近零。针对帧的最后一个样本的窗口函数值是零。因此帧的第一和最后一个样本分别乘以零和一。窗口函数可以是线性、非线性、或S形的,但优选地具有连续地或至少几乎连续地在0.0与1.0之间变化的值。
在步骤414处,将音频信号的帧的第二副本乘以逐渐增加的窗口函数的镜像或反函数。因此,将第二副本乘以逐渐减少的窗口函数。其初始值为0.0;其最终值为1.0。
在步骤416处,在图4B中,方法 400在两个不同路径或方向中的一个中进行。如果第一帧速率大于第二帧速率,则第一音频信号的帧速率需要被减缓或降低。可以从一个或多个帧去除样本。
如上文所述,可以有效地通过消除样本的帧中的样本中的一个来降低帧速率。在步骤418处,删除了来自第一取窗的帧的第一副本的第一个样本。对于原始是80个样本的帧而言,在步骤418的执行之后,该帧将具有仅79个样本。在步骤420处,也删除了来自第一窗口帧的第二副本的最后一个样本。因此,相同帧的该第二副本将具有79个样本。
在步骤422处,两个“调整的”帧被添加到彼此。而且,正如上文所阐述的,两个取窗的帧的算术加法(其中的一个通过另一个的反函数而取窗)导致本质上原始帧的重建,即原始帧的近似复制,但在步骤422之后,原始帧中的PCM样本数将已经被减少1个样本,从而留下七十九个样本(样本2-80)。在步骤424处,减少1个样本的帧被传输到收音机收发器、扬声器或其它通信设备,其配置为从PCM样本创建或重构可听见的声音,PCM样本的示例被描绘在图1中。
再次参考步骤416,如果第一帧速率不大于第二帧速率,则第一帧速率由于在步骤408处做出的两个帧速率是不同的确定而必定小于第二帧速率。第一帧速率因此需要增加并且可以通过将样本添加到帧来增加。
在步骤426处,将新的第一个样本添加到通过将样本的帧乘以逐渐增加的窗口函数而创建的取窗的帧。第一取窗的帧此后将具有八十一(81)个样本而不是原始的八十(80)个样本。
在步骤428处,将新的最后一个样本添加到通过将样本的帧的第二副本乘以逐渐减少的窗口函数而创建的取窗的帧。因此,第二取窗的帧将具有81个样本。
两个新的样本优选地是相同的值并且优选地是零。当两个取窗的帧在步骤430处被添加在一起时,所得到的帧将具有81个样本而不是80个样本。
图5描绘了用于匹配第一和第二音频信号之间的不同信号采样率的装置500的第一实施例。在图5中示出的装置执行在图4A和4B中陈述或公开的步骤。在优选的实施例中,在图5中描绘的装置可以被体现为分离的组合和时序逻辑电路或如图6所示,作为执行存储的程序指令的处理器。
在图5中,信号采样率确定器502接收两个输入信号504和506并且确定两个信号的信号采样率是否相同,以及如果不相同,则他们中的哪一个采样率大于另一个采样率。可以使用两个计数器和数字比较器实施这种速率确定器502。
如果信号采样率被确定为彼此不同,则信号样本复制器508从信号中的一个接收样本的帧,并且将它们复制成两个同样的副本(如所示的副本A,507和副本B,509)。否则,采样率是同样的。不需要时钟率补偿。
可能实施为配置为充当积分器的运算放大器的窗口函数发生器 514创建逐渐增加的窗口函数518。可用窗口函数的示例是在帧周期上从 0.0到1.0的值连续地斜坡变化的线性函数、在相同的帧持续时间上从0.0到1.0逐渐增加的非线性函数、或者在帧持续时间上从0.0到1.0逐渐增加的S形型函数。窗口函数发生器514的替代实施例创建从非零值到稍微大于和/或稍微小于1.0的值连续地斜坡变化的窗口函数。
窗口函数发生器518的输出自身被提供到乘法器520。窗口函数反相器516也接收窗口函数发生器514的输出518,并提供窗口函数的反函数到第二乘法器521。可以使用一个或多个现有技术移位寄存器或加法器容易地实施乘法器。
如图5所示,将信号帧即样本的帧的第一副本507乘以第一窗口函数518。这种乘法的结果是第一取窗的帧524。将信号帧的第二副本509提供到第二乘法器522,其将帧的每个样本乘以窗口函数514的反函数值517来提供第二取窗的帧526。两个乘法器的输出524和526因此是数据524、526的第一和第二取窗的帧,其中的每个被输入到对应加法器/减法器528和530。
取决于哪个采样率被确定为最快,信号速率样本确定器502指示加法器和减法器528和530将第一个样本添加到第一取窗的帧524或从第一取窗的帧524减去第一个样本。类似地,信号速率确定器502控制第二加法器/减法器从第二取窗的帧526减去最后一个样本或将最后一个样本添加到第二取窗的帧526。来自加法器和减法器528、530的输出是“调整的窗口帧”529和531。
加法器530接收调整的取窗的帧529、531,将它们添加在一起并且提供增加或减少的帧速率信号532,其速率对提供到信号帧速率确定器502的第一和第二帧速率中的一个实质上是相同或同样的。
图6描绘了用于将第一音频信号采样率匹配到第二音频信号采样率的装置的第二和优选实施例600。在图6中,装置600包括处理器或CPU 602,其耦合到存储器设备604,在存储器设备604中将程序指令存储用于CPU 602。那些指令经由常规总线606传递到CPU和从CPU传递。
存储在存储器中的指令当由CPU 602执行时执行图4A和4B中描绘和上文所述的步骤。简单来说,将具有第一帧速率的第一输入音频信号608与可能具有相同或不同的帧速率的第二音频信号610进行比较。在确定帧不同时,CPU 602执行上文所述的步骤和操作。CPU输出减少或增加的第一音频信号612或者增加或减少的帧速率的第二音频信号614。
图7A和7B示出了随时间的语音701的相同频谱表示的绘图。在图7A中,由参考数字702标识语音701中的短持续时间“尖峰信号”。尖峰信号702产生音频中的可听见的卡搭声和砰然声,并且由补偿时钟偏斜的前述现有技术强力方法引起,其示例将“零”插入到语音样本的帧中。
图7B示出在图7A中示出的相同音频信号701,但是图7B的音频频谱701具有使用本文中公开的方法提供的时钟偏斜补偿。在图7A中可见的噪声尖峰信号702正从图7B中示出的频谱701失去。卡搭声和砰然声正失去,音频保真度被改进。
再次参考图1,本领域普通技术人员将认识到,当电话设备诸如图1的蓝牙收发器104具有不同于它可操作地耦合到的行动电话110或CPU 120的帧速率的帧速率时,则它们之间流动的音频信号样本的帧速率将需要补偿,即传输到蓝牙收发器104和从蓝牙收发器104传输的音频信号样本的帧速率以及由蓝牙收发器104接收和发送到蓝牙收发器104的音频信号样本的帧速率将需要补偿。类似地,从行动电话110或CPU 120传输的音频信号样本的帧速率以及由它们接收的音频信号样本的帧速率将需要相同的补偿量。可以使用上文所述的方法和装置匹配或补偿两个相异的帧速率。
在各种实施例中,具有第一帧速率的音频信号可以从在USB通信链路以及通过网间协议链路的话音(VOIP)上承载的音频信号获得。这两种媒介对电信领域的普通技术人员是公知的。因为它们是公知的,因此对它们本身的描绘为了简短起见而被省略。
前述描述出于说明的目的。在以下权利要求中阐述本发明的真正范围。
Claims (22)
1.一种匹配第一音频信号的第一音频信号采样率到第二音频信号的第二音频信号采样率的方法,第一和第二音频信号采样率彼此不同,所述方法包括:
确定第一信号采样率是大于还是小于第二信号采样率;
如果信号采样率不同,则创建第一音频信号的样本的第一帧的副本,然后:
将第一音频信号的样本的帧的第一副本乘以第一逐渐增加的窗口函数,以提供第一取窗的帧;
将第一音频信号的样本的帧的第二副本乘以第二逐渐减少的窗口函数,以提供第二取窗的帧;
如果第一信号采样率被确定为大于第二信号采样率,则:
从第一取窗的帧去除第一个样本;
从第二取窗的帧去除最后一个样本;和
对第一和第二取窗的帧求和,以创建减少样本的帧;
如果第一信号采样率被确定为小于第二信号采样率,则:
将新的第一个样本添加到第一取窗的帧;
将新的最后一个样本添加到第二取窗的帧;
对第一和第二取窗的帧求和,以创建增加样本的帧;
以及;
传输减少样本的帧或增加的样本的帧到配置为从音频信号样本创建可听见的音频信号的通信设备。
2.权利要求1的方法,其中从电信设备接收第一音频信号,并且其中将第二音频信号传输到电信设备。
3.权利要求1的方法,其中将第一音频信号传输到电信设备,并且其中从电信设备接收第二音频信号。
4.权利要求1的方法,其中第一逐渐增加的窗口函数和第二逐渐减少的窗口函数是彼此的反函数。
5.权利要求1的方法,其中添加到帧的样本和从帧去除的样本具有基本上相同的值。
6.权利要求1的方法,其中添加到帧的样本和从帧去除的样本具有基本上等于零的值。
7.权利要求2的方法,其中第一逐渐增加的窗口函数和第二逐渐减少的窗口函数是S形函数。
8.权利要求2的方法,其中第一逐渐增加的窗口函数和第二逐渐减少的窗口函数是线性函数。
9.权利要求2的方法,其中第一逐渐增加的窗口函数和第二逐渐减少的窗口函数是非线性函数。
10.权利要求1的方法,其中第一音频信号采样率和第二音频信号采样率中的至少一个从蓝牙通信链路上承载的音频信号获得。
11.权利要求1的方法,其中第一音频信号采样率和第二音频信号采样率中的至少一个从蜂窝电话通信链路上承载的音频信号获得。
12.权利要求1的方法,其中第一音频信号采样率和第二音频信号采样率中的至少一个从USB通信链路上承载的音频信号获得。
13.权利要求1的方法,其中第一音频信号采样率和第二音频信号采样率中的至少一个从通过网间协议的话音(VOIP)通信链路上承载的音频信号获得。
14.一种用于匹配第一音频信号的第一音频信号采样率到第二音频信号的第二音频信号采样率的装置,第一和第二音频信号采样率彼此不同,所述装置包括:
确定器,配置为确定第一信号采样率是大于还是小于第二信号采样率;
复制器,耦合到确定器并配置为创建第一音频信号的样本的第一帧的副本;
窗口函数发生器,配置为生成逐渐增加的窗口函数;
除法器,耦合到窗口函数发生器和配置为生成逐渐减少的窗口函数;
第一乘法器,耦合到窗口函数发生器和复制器,第一乘法器配置为将第一音频信号的样本的帧的第一副本乘以逐渐增加的窗口函数,以提供第一取窗的帧;
第二乘法器,耦合到除法器和复制器,第二乘法器配置为将第一音频信号的样本的帧的第二副本乘以逐渐减少的窗口函数,以提供第二取窗的帧;
以及,
样本减法器/发生器,配置为从第一取窗的帧添加和去除第一个样本以及从第二取窗的帧添加和去除最后一个样本;以及
帧加法器,配置为组合从样本减法器/发生器输出的信号。
15.权利要求14的装置,其中第一音频信号是从电信设备接收的信号,并且其中第二音频信号是传输到电信设备的信号。
16.权利要求14的装置,其中第一音频信号是传输到电信设备的信号,并且其中第二音频信号是从电信设备接收的信号。
17.一种用于匹配第一音频信号的第一音频信号采样率到第二音频信号的第二音频信号采样率的装置,第一和第二音频信号采样率彼此不同,所述装置包括:
第一和第二通信设备,第一和第二通信设备生成具有对应的第一和第二信号采样率的第一和第二音频信号样本;
处理器,耦合到第一和第二通信设备;和
存储器设备,通过总线耦合到处理器,存储器设备存储用于处理器的可执行指令,可执行指令当被执行时使处理器:
确定第一信号采样率是大于还是小于第二信号采样率;
如果信号采样率不同,则创建第一音频信号的样本的第一帧的副本,然后可执行指令使处理器:
将第一音频信号的样本的帧的第一副本乘以第一逐渐增加的窗口函数,以提供第一取窗的帧;
将第一音频信号的样本的帧的第二副本乘以第二逐渐减少的窗口函数,以提供第二取窗的帧;
如果第一信号采样率被确定为大于第二信号采样率, 则可执行指令使处理器:
(1) 从第一取窗的帧去除第一个样本;
(2) 从第二取窗的帧去除最后一个样本;和
(3) 对第一和第二取窗的帧求和,以创建减少样本的帧;
如果第一信号采样率被确定小于第二信号采样率,则可执行指令使处理器:
(1) 将新的第一个样本添加到第一取窗的帧;
(2) 将新的最后一个样本添加到第二取窗的帧;以及
(3) 将第一和第二取窗的帧添加到彼此,以创建增加样本的帧;
以及;
传输减少样本的帧或增加样本的帧到配置为从音频信号样本创建可听见音频信号的通信设备。
18.权利要求17的装置,其中第一音频信号是从电信设备接收的信号,并且其中第二音频信号是传输到电信设备的信号。
19.权利要求17的装置,其中第一音频信号是传输到电信设备的信号,并且其中第二音频信号是从电信设备接收的信号。
20.权利要求17的装置,其中第一通信设备是蓝牙耳机,并且其中第二通信设备是蜂窝电话。
21.权利要求17的装置,其中第一通信设备是USB通信链路。
22.权利要求17的装置,其中第一通信设备是VOIP通信链路。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/794,670 US9514766B1 (en) | 2015-07-08 | 2015-07-08 | Computationally efficient data rate mismatch compensation for telephony clocks |
US14/794670 | 2015-07-08 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106340300A true CN106340300A (zh) | 2017-01-18 |
CN106340300B CN106340300B (zh) | 2021-12-31 |
Family
ID=54063044
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610534522.9A Active CN106340300B (zh) | 2015-07-08 | 2016-07-08 | 针对电话时钟的计算高效数据率失配补偿 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9514766B1 (zh) |
CN (1) | CN106340300B (zh) |
DE (1) | DE102016212393A1 (zh) |
GB (1) | GB2542754A (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10375199B2 (en) * | 2015-12-30 | 2019-08-06 | Facebook, Inc. | Systems and methods for surveying users |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6252919B1 (en) * | 1998-12-17 | 2001-06-26 | Neomagic Corp. | Re-synchronization of independently-clocked audio streams by fading-in with a fractional sample over multiple periods for sample-rate conversion |
CN1585503A (zh) * | 2003-08-19 | 2005-02-23 | 中兴通讯股份有限公司 | 一种Pi/4DQPSK解调器及其解调方法 |
CN101558444A (zh) * | 2006-12-12 | 2009-10-14 | 皇家飞利浦电子股份有限公司 | 将水印与主采样率相匹配 |
US7949015B2 (en) * | 2006-08-28 | 2011-05-24 | Telefonaktiebolaget Lm Ericsson (Publ) | Clock skew compensation |
CN102150201A (zh) * | 2008-07-11 | 2011-08-10 | 弗劳恩霍夫应用研究促进协会 | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 |
CN102939628A (zh) * | 2010-03-09 | 2013-02-20 | 弗兰霍菲尔运输应用研究公司 | 用以使用级联滤波器组处理输入音频信号的装置及方法 |
CN103688522A (zh) * | 2011-05-18 | 2014-03-26 | 谷歌公司 | 时钟漂移补偿方法和装置 |
CN104183234A (zh) * | 2013-05-28 | 2014-12-03 | 展讯通信(上海)有限公司 | 语音信号的处理、实现多方通话的方法及装置、通信终端 |
CN204272094U (zh) * | 2014-10-24 | 2015-04-15 | 中国科学院嘉兴微电子与系统工程中心 | 低中频接收机的i/q失配检测电路 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE0004838D0 (sv) | 2000-12-22 | 2000-12-22 | Ericsson Telefon Ab L M | Method and communication apparatus in a communication system |
-
2015
- 2015-07-08 US US14/794,670 patent/US9514766B1/en active Active
- 2015-07-31 GB GB1513624.5A patent/GB2542754A/en not_active Withdrawn
-
2016
- 2016-07-07 DE DE102016212393.9A patent/DE102016212393A1/de active Pending
- 2016-07-08 CN CN201610534522.9A patent/CN106340300B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6252919B1 (en) * | 1998-12-17 | 2001-06-26 | Neomagic Corp. | Re-synchronization of independently-clocked audio streams by fading-in with a fractional sample over multiple periods for sample-rate conversion |
CN1585503A (zh) * | 2003-08-19 | 2005-02-23 | 中兴通讯股份有限公司 | 一种Pi/4DQPSK解调器及其解调方法 |
US7949015B2 (en) * | 2006-08-28 | 2011-05-24 | Telefonaktiebolaget Lm Ericsson (Publ) | Clock skew compensation |
CN101558444A (zh) * | 2006-12-12 | 2009-10-14 | 皇家飞利浦电子股份有限公司 | 将水印与主采样率相匹配 |
CN102150201A (zh) * | 2008-07-11 | 2011-08-10 | 弗劳恩霍夫应用研究促进协会 | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 |
CN102939628A (zh) * | 2010-03-09 | 2013-02-20 | 弗兰霍菲尔运输应用研究公司 | 用以使用级联滤波器组处理输入音频信号的装置及方法 |
CN103688522A (zh) * | 2011-05-18 | 2014-03-26 | 谷歌公司 | 时钟漂移补偿方法和装置 |
CN104183234A (zh) * | 2013-05-28 | 2014-12-03 | 展讯通信(上海)有限公司 | 语音信号的处理、实现多方通话的方法及装置、通信终端 |
CN204272094U (zh) * | 2014-10-24 | 2015-04-15 | 中国科学院嘉兴微电子与系统工程中心 | 低中频接收机的i/q失配检测电路 |
Also Published As
Publication number | Publication date |
---|---|
GB201513624D0 (en) | 2015-09-16 |
GB2542754A (en) | 2017-04-05 |
DE102016212393A1 (de) | 2017-01-12 |
CN106340300B (zh) | 2021-12-31 |
US9514766B1 (en) | 2016-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5881848B2 (ja) | 会議システムにおけるエコー・キャンセルのための方法および構成 | |
KR0131823B1 (ko) | 디지탈 데이터 신호 처리 장치 및 방법 | |
CN101060550B (zh) | 语音通信终端的杂音去除装置 | |
CN107231587A (zh) | 音频播放系统 | |
US8073132B2 (en) | Echo canceler and echo canceling program | |
US6735192B1 (en) | Method and apparatus for dynamically varying a packet delay in a packet network based on a log-normal delay distribution | |
CN207399510U (zh) | 听力仪器及系统 | |
CN107666534A (zh) | 转录音频通信会话 | |
US8433057B2 (en) | Voice band extender separately extending frequency bands of an extracted-noise signal and a noise-suppressed signal | |
JP2001332999A (ja) | 適応等化器のトレーニング回路及びモデム装置並びに通信装置 | |
CN106657507A (zh) | 一种声学回声消除方法及装置 | |
JP2002500458A (ja) | 通信ネットワークにおけるpcmアップストリームデジタル損傷を検出するための装置および方法 | |
US20100324911A1 (en) | Cvsd decoder state update after packet loss | |
EP1098468A1 (en) | Method and apparatus for multiple access in a communication system | |
CN106340300A (zh) | 针对电话时钟的计算高效数据率失配补偿 | |
CN107316652B (zh) | 侧音消除方法及装置 | |
US7418013B2 (en) | Techniques to synchronize packet rate in voice over packet networks | |
US6963643B1 (en) | Method and apparatus for canceling echo in a telephone communication system | |
JPH07154308A (ja) | デジタルフィルタ装置 | |
US5917853A (en) | Method of and apparatus for training high speed digital telephonic modems to obviate imperfections in the telephone channel, while simultaneously allowing conversation | |
JP2820457B2 (ja) | アナログ形態にて受信のデジタル信号の等化回路装置 | |
JP3132175B2 (ja) | モデム等化器の係数の適応法および適応回路 | |
US9787825B1 (en) | Cyclically variable signal delays for acoustic echo cancellation | |
CN105554245A (zh) | 一种通信方法及装置 | |
EP1251494A2 (en) | Equalizer apparatus and equalizing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |