CN103843064B - 在特技模式中播放音频 - Google Patents
在特技模式中播放音频 Download PDFInfo
- Publication number
- CN103843064B CN103843064B CN201280049185.4A CN201280049185A CN103843064B CN 103843064 B CN103843064 B CN 103843064B CN 201280049185 A CN201280049185 A CN 201280049185A CN 103843064 B CN103843064 B CN 103843064B
- Authority
- CN
- China
- Prior art keywords
- fragment
- speed
- play
- audio
- sampling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000012634 fragment Substances 0.000 claims abstract description 134
- 238000000034 method Methods 0.000 claims abstract description 64
- 238000005070 sampling Methods 0.000 claims description 63
- 230000005236 sound signal Effects 0.000 claims description 44
- 238000001514 detection method Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 5
- 230000009191 jumping Effects 0.000 claims description 2
- 230000001276 controlling effect Effects 0.000 claims 1
- 230000002596 correlated effect Effects 0.000 claims 1
- 230000017105 transposition Effects 0.000 description 17
- 230000002085 persistent effect Effects 0.000 description 15
- 230000008859 change Effects 0.000 description 12
- 238000004590 computer program Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000000052 comparative effect Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003139 buffering effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 201000006549 dyspepsia Diseases 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000013707 sensory perception of sound Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/005—Reproducing at a different information rate from the information rate of recording
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
Abstract
一种以不同于记录数字音频信号的速度来播放数字音频信号的方法。该方法包括:播放信号的第一片段;跳至与第一片段不相邻的第二片段;以及播放第二片段,其中以不同于记录第一和第二片段中的至少一个的速率来播放第一和第二片段中的至少一个。
Description
技术领域
本发明涉及回放数字音频。具体地,本发明涉及用于在所谓的“特技(trick)”的模式(例如,快进或快退)中播放音频的技术。
背景技术
数字音频信号包括表示所记录声音的数字采样序列。记录的特征在于通常表示为以Hz为单位的频率的采样率,即,每单位时间的采样个数。例如,用于音频压缩盘的采样率是44.1kHz。为了在正常回放中再现所记录声音,以采样的原本采样率来播放采样,也就是说,以记录采样的采样率。播放包括使用数模转换器(DAC)将数字采样转换为模拟信号。
现有领域知道用于实现数字音频快进或快退的多种方法。用于快进的第一方法在于播放包括采样序列的短片段,接着跳过连续片段。只要播放器仍处于快进模式,就重复此操作。通过跳过相邻的采样群,播放器实现在短于记录该采样时的持续时间内播放音频信号的效果。相较于播放的采样的个数,由跳过的采样的个数确定速度增加的倍数。例如,为了实现2倍,播放的每个序列的长度等于跳过的每个序列的长度。
用于快进的第二已知方法在于对形成音频信号的采样序列进行下采样(抽取)。这通常涉及子采样之后的抗混叠滤波(anti aliasfiltering),以衰减高频。接着以原始采样率播放得到的减少后的采样数。速度的增加取决于对信号抽取的程度。例如,为了实现将速度增加2倍,保留和废弃交替的采样,也就是说,半速率抽取。由于以原始采样率来播放抽取后的采样,因此这种方法导致音频音高的增加。一半的抽取导致将聆听者听到的频率加倍。
在消除移调(pitch shift)的同时仍改变播放音频的速率方面投入了大量精力。例如,US 2003/0165326描述了一种用于在快进回放期间补偿移调的方法。
发明内容
根据本发明的一个方面,提供了一种以不同于记录数字音频信号的速度来播放该数字音频信号的方法,所述方法包括:
播放信号的第一片段;
跳至与该第一片段不相邻的第二片段;以及
播放该第二片段,
其中以不同于记录第一和第二片段中的至少一个的速率来播放所述第一和第二片段中的至少一个。
通常,所述方法可以包括快于或慢于原始记录音频信号地播放该音频信号。然而,当比正常更块地播放音频信号时,所述方法可能是特别有利的。所述方法可以包括向前或向后(例如,快进或快退)播放音频信号。根据所述方法,跳过片段,修改播放的片段的回放速度(相较于音频的原始速度)。由于以不同速率播放片段,因此这意味着片段的播放持续时间也与原始记录的持续时间不同。例如,可以以比原始记录更高的速率播放片段,意味着片段在播放时的持续时间短于记录持续时间。不同速率的回放可能导致所播放片段中音频音高的移位。
相较于跳过的持续时间,播放音频信号的总体速度由播放的每个片段的持续时间部分地确定。播放音频信号的总体速度同样由播放所播放片段的速率来部分地确定。也就是说,通过将(i)跳过音频的一部分和(ii)以不同速率播放音频的一部分的组合来改变音频的速度。
发明人已经认识到,相较于用于特技模式回放的先前方法,这种组合技术可以令音频对聆听者更清晰,同时以不同速度来播放该信号。这种技术在所谓“特技模式”回放中是有利的。例如,如果用户在对整个音频快进以便搜索特定部分,则声音的清晰度可以帮助用户更容易地确定他们是否发现了他们想要聆听的音频信号部分。如果在快进时用户无法理解音频,则用户可能需要重复地恢复正常回放速度,以便聆听音频从而发现是否在所期望时刻附近。在快进时,用户可能错失(超过)音频信号中的所期望点,可能需要倒回以便搜寻所期望点。本方法帮助用户避免这些不便。
在跳至第二片段的步骤中,优选地,使用参考位置(第一片段开始的位置)来计算音频信号中第二片段的位置。这可以使得容易并可靠地定位第二片段。作为备选,可以使用第一片段的结束作为参考来计算第二片段的位置;然而,由于第一片段的结束的位置依赖于播放第一片段的速率,因此后者可能更复杂。这将导致后者方案实现起来不方便或计算成本高。
可以根据要播放音频信号的速率来选择至少一个片段的回放速率。
有利的是回放速率根据想要播放音频信号的总体速度自动变化。也就是说,至少部分地根据所期望速度选择回放速率。因此,例如,当增加音频速度时,同样可以增加播放片段的速率。在一些实施例中,所播放片段的回放速率确定移调。因此,在这种实施例中,当增加所期望的音频速度时会增加音高。例如,这可能与用户根据对例如磁带的传统模拟介质进行快进或快退的经验得到的直观期望匹配。
优选地,播放至少一个片段的速率取决于要增加的音频速率的倍数的对数。
例如,如果要将音频加速2倍,则可以以依赖于2的对数的速率来播放片段。
回放速率可以与速度倍数的对数线性相关。
例如,可以将播放片段的速率定义为原始记录速率的(1+Klog2n)倍,其中K是常数,n是音频速度要改变的倍数。
备选地,回放速率可以与速度倍数的对数非线性相关。
例如,可以将播放片段的速率定义为原始记录速率的(1+Klog2n)倍,其中n是音频速度要改变的倍数,K是n的函数,K=f(n)。这里,函数f(n)可以是一对一函数,也就是说,对于每个不同的n值,提供唯一的K值。例如,可以将函数定义在查找表中。优选地,K值在0.1到0.4的范围中,更优选地0.1到0.3,最优选地为大约0.2。这样能够确保在大多数情况下音频内容的良好清晰度。在一些实施例中,可以在给定范围内随机选择K值。
总言之,优选地,回放速率改变的倍数在1.1到3的范围内。也就说,1.1≤(1+Klog2(n))≤3。更优选地,回放速率增加的倍数在1.1到2的范围内。
在一些实施例中,播放至少一个片段的速率可能至少部分地取决于音频信号的内容。
使回放速率适应于内容可以帮助针对不同类型音频信号优化该方法。根据信号的内容,聆听者可以对在播放片段时速率和/或移调的改变更敏感或更不敏感。例如,如果原始记录的音频信号已包含较高音高的信号,则较大速率增加可能令人烦恼或声音可能变得不清晰。
可以基于与音频信号相关联的元数据来选择播放片段的速率。
这里,根据元数据推断音频信号的内容,基于该结果来选择适合速率。例如,可以基于语音出现在音频信号中的歌手的性别来选择速率,其中相较于女性语音,针对男性语音选择较高回放速率。元数据通常与数字音频信号相关联,例如,MPEG-1或MPEG-2音频层III(“MP3”)格式的音频文件可以包括ID3格式的元数据。
所述方法还可以包括检测音频信号中的内容的音高,其中,根据所检测的音高来选择播放片段的速率。
这样可以避免分析元数据以便确定音频信号的内容的需要。相较于根据元数据标签推断音高,该方法可以更准确的测量音高。此外,即使在没有与音频信号相关联的元数据的情况下,仍能够应用该方法。同样可以随着时间改变所播放片段的回放速率,例如,二重唱的男性部分的回放速率可能不同于女性部分的回放速率。
优选地,至少一个片段的回放速率是可变的。优选地,可以至少部分地独立于要播放音频信号的速度,来变化回放速率。
在一些实施例中,回放速率可以完全独立于要播放音频信号的速度n。也就是说,可以任意选择回放速率(优选地,在预定范围内)。
在其他实施例中,回放速率取决于要播放音频信号的速度n。在这种情况下,可以独立于该速度,附加调整回放速率。因此,尽管回放速率依赖于速度,然而并非由速度唯一确定回放速率,即,存在附加自由度。例如,如果由公式(1+Klog2(n))确定播放片段的速率,则K值能够由用户改变。因此,尽管速率取决于n,然而可以由用户调整速率取决于n的方式。在另一示例中,由公式(1+Klog2(n)+Ki)确定播放片段的速率。这里,能够由用户调整附加偏移Ki。因此,尽管速率取决于n,然而还可以由用户改变。
该方法能够允许用户精细地控制片段的回放速率,因此在一些实施例中,控制向音频信号的所播放片段施加的移调。这种方法是令人期望的,这是因为如果以完全不同于其原始速率的速率和/或移调播放一些类型的音频文件,则所述类型的音频文件可能变得不清晰。用户可以调整回放速率,直到内容足够清楚。
在另一实施例中,播放至少一个片段的速率是常数。
在这种情况下,所播放片段的回放速率是固定的,而与要播放音频信号的速度的变化无关。通常,速度的改变仅由所播放片段的持续时间和跳过的(未播放的)片段的持续时间之间的比率确定。由于回放装置不需要迎合以多种不同速度回放的多个不同速率,因此该方法提供了简单的实现方式。这里,可以根据等式1±C来定义恒定回放速率,其中C是分数常数。
通常,要播放音频信号的速度优选地在2x到32x的范围内。也就是说,信号速度增加的倍数是在2到32的范围内。
优选地,以不同速率播放至少一个片段的持续时间是在300ms到700ms的范围内,更优选地400ms到600ms,最优选地大约500ms。
在音频信号中,第一片段可以在第二片段之后,使得跳至第二片段的步骤包括在信号中向后跳,其中向前播放第一和第二片段中的每一个。
这种方法提供了一种实现快退的便利方法。向前播放每个单独片段,也就是说,在片段内播放的采样的顺序与记录所述采样时采样的顺序相对应。该方法允许使得声音对聆听者更清晰。相反,如果向后播放声音(相反顺序采样),则难以理解该声音,尤其在说话或歌词的情况下。不论怎样,反转片段的排序,使得每个播放的片段来自音频信号中较早的点(时间上进一步后退)。这可以使用户在能够一直理解音频内容的同时向后搜寻整个音频。
每个片段可以包括采样序列,以不同速率播放片段可以包括:以不同于记录采样的采样率的速率播放该采样;和/或通过抽取或内插来改变采样的个数,播放改变个数的采样。
分样和内插是采样速率转换的示例。如果限制播放采样的真正速率,则该备选方法可以是有用的。例如,一些数模转换器可以仅支持一个固定的采样速率或对采样速率的有限选择。在这种情况下,采样速率转换可以用于独立于播放采样的速率,将播放片段的速率高效地改变任意倍。
优选地,以记录所播放采样的相同顺序来播放播放的采样。也就是说,优选地,以修改后的速率向前播放每个片段。然而,也能够反向播放采样,例如,当倒回时,可以向后(与它们的正常时间顺序相比)播放采样。
还提供了一种包括计算机程序代码装置的计算机程序,其中,该计算机程序代码装置适用于如果在计算机上运行所述程序,则控制物理计算设备执行任何前述权利要求所述的所有步骤;且这种计算机程序嵌入在计算机可读介质中。
根据本发明的另一方面,提供了一种音频播放器装置,适用于以不同于记录数字音频信号的速度播放该数字音频信号,所述装置包括:
文件读取器,可操作于读取数字音频信号;
音频呈现器,可操作于播放所述信号;以及
控制器,适用于控制所述文件读取器,以便
读取信号的第一片段;
跳至与所述第一片段不相邻的第二片段;以及
读取所述第二片段,
所述控制器还适用于控制呈现器,以不同于记录第一和第二片段中的至少一个的速率来播放第一和第二片段中的至少一个。
所述音频播放器还可以包括:音高检测器,适用于检测音频信号中的内容的音高,其中所述控制器还适用于根据检测到的音高选择播放至少一个片段的速率。
附图说明
现参考附图示例性地描述了本发明,附图中:
图1是根据比较性示例示出了4x快进特技模式的时序图;
图2是示出了根据本发明实施例的4x快进特技模式的时序图;
图3是示出了根据实施例的不同回放速度的移调倍数的变化的图;
图4是示出了根据比较性示例的4x快退特技模式的时序图;
图5是示出了根据本发明实施例的4x快退特技模式的时序图;
图6是示出了根据本发明第一实施例的方法的流程图;
图7是适用于实现图6的方法的装置的框图;
图8是根据本发明第二实施例的方法的流程图;
图9是根据第二实施例的装置的框图。
应注意,这些附图是图示性的,并未按比例绘制。为了附图的清楚和方便,尺寸上放大或缩小地示出了这些附图中的部件的相对尺寸和比例。
具体实施方式
图1示出了根据比较性示例的快进模式的示例。在附图中,水平轴表示诸如MP3文件等数字音频文件内的时间索引。快进模式通过播放间歇的片段和跳过文件的其它片段,在所播放片段之间操作。将音频采样的第一片段播放d毫秒(ms)的固定持续时间。跳过持续时间为(n-1)d ms的后续片段。这里,n是特技模式速度(例如,2x、4x、…)。通过播放d ms和跳过(n-1)d ms,将所播放音频的持续时间降低1/n倍。也就是说,对于文件中所记录音频的每个nd ms而言,仅播放d ms。可以适当选择所播放片段的持续时间d,以便增强清晰度。非常小的d会不清晰。实验表明通常300ms到700ms是d的适当范围。用于下文所述实施例的值为500ms。
图2示出了根据本发明实施例的快进的示例。这里,除了跳过音频信号的片段之外,以不同于记录所播放片段的速率来播放所播放的片段。将原始采样率定义为f0,将修改后的采样的回放速率定义为f1。在该实施例中,以原始采样的采样率的(1+Klog2(n))倍来播放所播放片段中的采样,其中K是分数常数。也就是说:
f1=(1+Klog2(n))f0
这给出当播放音频文件中的声音时所述声音的音高(频率)移位的效果。音频信号的声学频率与采样率的增加成比例地增加。选择K和n的最大值,以便将倍数(1+Klog2(n))限制在2与3之间的最大值。实验表明大于2的移调倍数能够引起典型音频信号的内容变得不清晰。图3示出了在K=0.2的情况下移调倍数相对特技模式速度n的图。
当K是常数时,如示例所示,移调与速度倍数n的对数线性相关。注意,移调比率与回放采样率(播放采样的速率)和用于记录该音频信号的采样率之间的比率相同。
由于以修改后的采样速率f1在固定持续时间d ms内播放采样,因此所播放采样的持续时间在原始(记录)采样率f0下对应于d(1+Klog2(n))ms。这是令人期望的特征,因为所播放采样的实际个数随着移调升高而按比例增加,这帮助改善清晰度。然而,在跳过的采样的持续时间(在原始采样率下测量的)和播放的片段的实际持续时间之间,必须将跳过的采样正好保持为比率(n-1)d:d。
上述通过在流中搜寻绝对时间的方法来实现。首选,播放器搜寻所述流中的一些位置(称为原始位置),在该位置中期望开始使用特技模式。接着,实时地播放该流d ms。接着,在播放d ms结束时,播放器再次搜寻原始位置+(d+(n-1n)d)f0采样。换言之,搜寻操作的参考点是所播放片段的开始,即原始位置,而不是结束。搜寻操作从原始位置测量ndf0。因此,搜寻所述流中的绝对时间解决了上述问题。
图4示出了根据比较性示例的采用快退的特技模式。该方法类似于图1的快进。播放音频信号的片段,接着播放器跳至另一不相邻片段。与图1的差别在于时间上依次向后移位连续播放的片段。也就是说,下一播放的片段来自于在先前所播放片段之前的时刻。这种方法实现在音频信号中倒回或向后搜寻。
根据本发明,当使用移调时实现图4的机制是复杂的。图5是示出了根据本发明实施例的快退特技模式的图。类似于图2所示的快进方法,通过跳过片段并且通过以修改后的采样率播放其余片段,来改变播放速度。
类似于图2,该方法通过用根据先前搜寻位置(也就是说,先前播放的片段的开始,而不是结束)计算出的新位置来搜寻绝对时间,解决移调引起的问题。这里,存储先前搜寻位置,如下所示计算新位置。
新位置=新位置-nd
if(新位置>0)
搜寻新位置
所述方法与所播放片段的持续时间无关,并因此即使在使用不同采样速率进行回放的情况下,仍可以工作。
实验表明相较于具有相似参数的快进,在快退期间的清晰度并不好。无论怎样,相信这根本上是由于人对声音的感知,而不是本方法的任何特定缺点。
现将参考图6和7来描述本发明的示例性实施例。图6是方法的流程图,图7是实现该方法的装置的框图。
图7的音频回放装置包括文件读取器160;音频解码器170;和音频呈现器180。文件读取器160;音频解码器170;和音频呈现器180受控制器150的控制。文件读取器160的输出耦接到音频解码器170的输入;解码器170的输出耦接到音频呈现器180的输入。文件读取器160从MP3文件读取数字音频信号。控制器150控制读取器160读取文件的特定部分。解码器170从文件读取器160接收数字音频信号,并进行解码。解码可以包括解码MP3音频的传统处理。音频呈现器180从解码器170接收解码后的音频并进行播放。
当播放器操作在特技模式下(例如,快进或快退)时,控制器150控制文件读取器160从MP3文件读取信号的第一片段。通过解码器170对信号的第一片段进行解码,通过呈现器进行播放(图6的步骤110)。控制器控制音频呈现器180使得相较于原始记录采样速率,以增加的采样速率播放第一片段。
控制器控制文件读取器160搜寻MP3文件的不同部分,跳过片段(步骤120)。接着,文件读取器读取第二片段。再次,通过解码器170对所读取片段进行解码,由呈现器180以增加的采样速率进行播放(步骤130)。只要音频播放器处于特技模式下,就重复所述播放片段和跳至另一片段的处理。这样,实现以增加的速度进行回放。
如前所述,确定读取器160在音频文件中搜寻的位置、每个片段的持续时间和修改后的采样速率。
进行了其他实验以便针对不同类型的音频内容,检查在使用特技模式时音频的清晰度。发现不同K值适合于男性和女性语音。具体地,当针对男性语音调谐K时,相同值不适于具有较高音高语音的女性歌手。在16x和32x的速度下,结果将是“太刺耳”,无法愉悦地聆听。发明人认识到需要基于歌手的音高来调谐K。定义两个方案来解决该问题。
在第一方案中,检查音频文件的元数据以便推断歌手的性别。在音频播放器的存储器中提供表格,在表格中将每个艺术家与K值相关联。当文件读取器160读取MP3文件时,检查ID3标签中包含的元数据,以便确定艺术家。接着在表格中查找该艺术家,以便确定准确K值。这能够确保将适合采样速率用于回放。
在第二方案中,音频播放器自动检测音频信号的音高,基于所检测的音高直接改变K。现将参考图8和9描述使用该方法的本发明的实施例。在图9的框图中,文件读取器260、音频解码器270和音频呈现器280分别实质上类似于上述第一实施例的文件读取器160、音频解码器170和音频呈现器180。
音频播放器包括音高检测器275。将音高检测器275的输入耦接到音频解码器270的输出,将音高检测器275的输出耦接到音频呈现器的输入。控制器250从音高检测器275接收检测到的音高。
类似于第一实施例,控制器250控制文件读取器260从文件读取第一片段。通过解码器270进行解码。音高检测器275处理音频信号的第一片段,以便确定音频内容的音高(频率)(步骤202)。用于音高检测的方法对于本领域技术人员而言是熟知的。通常,本发明的方法对音高检测方法的选择不敏感。需要的仅是大约估计音频的主导音高。可以使用传统时域或频域音高检测。例如,可以通过倒谱(cepstrum)分析来检测音高。
控制器250使用所检测音高值来确定适合的K值。这可以使用预定查找表来进行,查找表将不同音高间隔映射到适合K值。在这种表格中,增加的音高与减小的K值相关联。对于男性嗓音而言,发现K=0.2是合适的。对于高音高的女性嗓音,发现K=0.1是合适的。使用所选K值,利用上述方程,来确定回放第一片段的采样速率(步骤204)。接着,控制器250控制呈现器280以所选采样速率播放第一片段(步骤210)。
在步骤220,控制器控制文件读取器跳至另一片段。该步骤类似于图6的步骤120。接着,在步骤230,通过读取、解码和播放第二片段来重复该方法。
注意,第一片段的所检测音高和第二片段的所检测音高可以彼此不同。例如,音频信号的第一片段可以包含男性语音,第二片段可以包含女性语音。在这种情况下,可以以低于第一片段的采样速率来播放第二片段。相较于仅依赖音频文件的元数据的音高检测的方法,这种实时适应是优点。例如,自适应方法可以改变二重唱歌曲(男性和女性语音轮流演唱)期间的采样速率。当音频文件不包含任何元数据的情况下,由于自适应方法与关于艺术家的任何认识无关,该方法同样是有优势的。
根据本发明的方法可以在播放数字音频的所有系统中应用。这些系统包括但不限于DVD或CD播放器,和MP3/AC3/WMA便携式媒体播放器。如果接收器设备将模拟音频信号转化为数字形式并对其进行存储(缓冲),则本发明同样可以用于模拟音频信号,例如,模拟无线电传输。
在上述实施例中,以修改后的采样速率播放音频片段。许多现有的音频系统使用强大的音频呈现器,例如过采样内插数模转换器(DAC),能够接收从8到100kHz的采样速率而没有任何困难。如上所述,利用这种系统和适合的DAC控制器,能够以定制的采样速率播放音频。
备选地,如果DAC仅支持单个固定采样速率,则可以需要内插采样速率转换器(SRC)以便将不同采样率转换为该固定采样率。这样,本发明也可以用不支持以可变采样速率进行回放的DAC来实现。
尽管附图和以上描述中详细示出并描述了本发明,然而应将这种说明和描述认为仅是说明性的或示例性的,而不是限制性的;本发明不限于所公开的实施例。
例如,能够在可以有区别地限定播放每个片段的速率的实施例中操作本发明。现描述两个这种变化。
在第一变化中,使用公式(1+Klog2(n))来选择采样速率增加的倍数。然而,K值对于不同速度n而变化。这导致移调不仅随速度而变化而且还随变量Ki而变化。因此,可以针对每个速度n1、n2、…、nmax计算移调倍数,作为(1+Kilog2(ni))。优选地,Ki值在0.1到0.4的范围中。
在第二变化中,使用公式(1+Klog2(n)+Ki)来选择采样速率增加的倍数。也就是说,向基本公式(1+Klog2(n))添加小分数偏移。可以根据n来选择偏移值Ki。得到的倍数(1+Klog2(n)+Ki)可以在1.1到3的范围内。在试验中已经发现这产生可接受的结果。
根据本发明的方法能够与音高补偿技术相结合。这可以允许以不同速率(例如,比记录所播放片段快地)播放每个所播放片段,而不令聆听者感知到移调。音高补偿技术在本领域中是已知的。
根据对附图、公开和所附权利要求的学习,可以由本领域技术人员在实践要求保护的发明的过程中理解和影响本公开的其它变化。在权利要求中,术语“包括”不排除其它元件或步骤,不定冠词“一”或“一个”不排除多个。单个处理器或其它单元可以实现权利要求所述的若干项目的功能。在相互不同的独立权利要求中引用特定措施的事实不表示不能有利地使用这些措施的组合。计算机程序可以存储/分布在适合介质上,例如,与其它硬件一同提供的或作为其它硬件一部分的光存储介质或固态介质,此外,计算机程序也可以以其它形式分布,例如通过互联网或其它有线或无线通信系统。不应将权利要求中的任何附图标记理解为限制本发明的范围。
Claims (14)
1.一种以不同于记录数字音频信号的速度来播放所述数字音频信号的方法,所述方法包括:
播放(110,210)信号的第一片段;
跳至(120,220)与所述第一片段不相邻的第二片段;以及
播放(130,230)所述第二片段,
其中以不同于记录第一和第二片段中的至少一个的速率来播放所述第一和第二片段中的至少一个。
2.根据权利要求1所述的方法,其中根据播放音频信号的特技模式速度来选择至少一个片段的回放速率。
3.根据权利要求2所述的方法,其中播放至少一个片段的速率依赖于音频速度倍数的对数。
4.根据权利要求3所述的方法,其中所述回放速率与速度倍数的对数线性相关。
5.根据权利要求3所述的方法,其中所述回放速率与速度倍数的对数非线性相关。
6.根据任何前述权利要求所述的方法,其中播放至少一个片段的速率至少部分依赖于音频信号的内容。
7.根据权利要求6所述的方法,其中基于与音频信号相关联的元数据来选择播放片段的速率。
8.根据权利要求6所述的方法,还包括:检测(202)音频信号中的内容的音高,
其中基于所检测的音高来选择(204)播放(210,230)片段的速率。
9.根据权利要求1-5、7-8中任一项所述的方法,其中至少一个片段的回放速率是可变的,至少部分地独立于播放音频信号的速度。
10.根据权利要求1所述的方法,其中播放至少一个片段的速率是常数。
11.根据权利要求1-5、7-8、10中任一项所述的方法,其中在音频信号中,所述第一片段在第二片段之后,使得跳至第二片段的步骤包括在信号中向后跳,以及
其中向前播放所述第一和第二片段中的每一个。
12.根据权利要求1-5、7-8、10中任一项所述的方法,其中每个片段包括采样序列,并且以不同速率播放至少一个片段包括:
以不同于记录采样的速率来播放所述采样;和/或
通过抽取或内插来改变采样的个数,播放个数改变的采样。
13.一种音频播放器装置,适用于以不同于记录数字音频信号的速率播放所述数字音频信号,所述装置包括:
文件读取器(160,260),可操作于读取数字音频信号;
音频呈现器(180,280),可操作于播放所述信号;以及
控制器(150,250),适用于控制所述文件读取器(160,260),以便
读取信号的第一片段;
跳至与所述第一片段不相邻的第二片段;以及
读取所述第二片段,
所述控制器(150,250)还适用于控制呈现器以不同于记录第一和第二片段中的至少一个的速率来播放所述第一和第二片段中的至少一个。
14.根据权利要求13所述的音频播放器装置,还包括:音高检测器(275),适用于检测音频信号中的内容的音高,其中所述控制器还适用于根据检测到的音高,选择播放至少一个片段的速率。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IN2901DE2011 | 2011-10-07 | ||
IN2901/DEL/2011 | 2011-10-07 | ||
PCT/EP2012/068064 WO2013050228A1 (en) | 2011-10-07 | 2012-09-14 | Playing audio in trick-modes |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103843064A CN103843064A (zh) | 2014-06-04 |
CN103843064B true CN103843064B (zh) | 2016-10-05 |
Family
ID=47044954
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280049185.4A Active CN103843064B (zh) | 2011-10-07 | 2012-09-14 | 在特技模式中播放音频 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9336823B2 (zh) |
EP (1) | EP2764511B1 (zh) |
CN (1) | CN103843064B (zh) |
WO (1) | WO2013050228A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6136218B2 (ja) * | 2012-12-03 | 2017-05-31 | 富士通株式会社 | 音響処理装置、方法、及びプログラム |
US10178344B2 (en) | 2015-07-01 | 2019-01-08 | Rovi Guides, Inc. | Methods and systems for customizing skip-forward functionality |
US9940968B2 (en) | 2016-08-30 | 2018-04-10 | The Nielsen Company (Us), Llc | Methods and apparatus to perform speed-enhanced playback of recorded media |
US11102523B2 (en) | 2019-03-19 | 2021-08-24 | Rovi Guides, Inc. | Systems and methods for selective audio segment compression for accelerated playback of media assets by service providers |
US11039177B2 (en) * | 2019-03-19 | 2021-06-15 | Rovi Guides, Inc. | Systems and methods for varied audio segment compression for accelerated playback of media assets |
US10708633B1 (en) | 2019-03-19 | 2020-07-07 | Rovi Guides, Inc. | Systems and methods for selective audio segment compression for accelerated playback of media assets |
EP4087235A1 (de) * | 2021-05-06 | 2022-11-09 | Siemens Aktiengesellschaft | Abspielen von akustischen daten |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1675686A (zh) * | 2002-03-01 | 2005-09-28 | 汤姆森特许公司 | 特技模式的音频播放 |
JP2007334366A (ja) * | 2007-08-16 | 2007-12-27 | Kenwood Corp | 配信システム、サーバ、オーディオ機器、配信制御方法および再生制御方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5479007A (en) * | 1977-12-05 | 1979-06-23 | Victor Co Of Japan Ltd | Music selector of tape recorders |
WO1993024930A1 (en) * | 1992-05-27 | 1993-12-09 | Tandy Corporation | Digital compact cassette automatic search system |
US7889969B2 (en) | 2002-03-01 | 2011-02-15 | Thomson Licensing | Audio frequency shifting during video trick modes |
US20040267388A1 (en) | 2003-06-26 | 2004-12-30 | Predictive Media Corporation | Method and system for recording and processing of broadcast signals |
KR20060029161A (ko) * | 2003-06-30 | 2006-04-04 | 코닌클리즈케 필립스 일렉트로닉스 엔.브이. | 트릭 모드 분야에서 사용하는 방법, 플레이어, 리코더,신호 및 리코드 캐리어 |
US20070261537A1 (en) * | 2006-05-12 | 2007-11-15 | Nokia Corporation | Creating and sharing variations of a music file |
JP4573130B2 (ja) * | 2006-07-21 | 2010-11-04 | ソニー株式会社 | 再生装置、記録媒体、再生方法及び再生プログラム |
JP2009063714A (ja) * | 2007-09-05 | 2009-03-26 | Sony Computer Entertainment Inc | オーディオ再生装置およびオーディオ早送り再生方法 |
US20100172626A1 (en) * | 2009-01-07 | 2010-07-08 | Microsoft Corporation | Trick Mode Based Advertisement Portion Selection |
US20110123173A1 (en) * | 2009-11-24 | 2011-05-26 | Verizon Patent And Licensing Inc. | Trick play advertising systems and methods |
US8925021B2 (en) * | 2011-07-11 | 2014-12-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and system for trick play in over-the-top video delivery |
-
2012
- 2012-09-14 US US14/345,446 patent/US9336823B2/en not_active Expired - Fee Related
- 2012-09-14 CN CN201280049185.4A patent/CN103843064B/zh active Active
- 2012-09-14 WO PCT/EP2012/068064 patent/WO2013050228A1/en active Application Filing
- 2012-09-14 EP EP12774937.2A patent/EP2764511B1/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1675686A (zh) * | 2002-03-01 | 2005-09-28 | 汤姆森特许公司 | 特技模式的音频播放 |
JP2007334366A (ja) * | 2007-08-16 | 2007-12-27 | Kenwood Corp | 配信システム、サーバ、オーディオ機器、配信制御方法および再生制御方法 |
Also Published As
Publication number | Publication date |
---|---|
US9336823B2 (en) | 2016-05-10 |
EP2764511B1 (en) | 2018-04-18 |
EP2764511A1 (en) | 2014-08-13 |
US20150078562A1 (en) | 2015-03-19 |
WO2013050228A1 (en) | 2013-04-11 |
CN103843064A (zh) | 2014-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103843064B (zh) | 在特技模式中播放音频 | |
US8332059B2 (en) | Apparatus and method for synchronizing additional data and base data | |
JP5179881B2 (ja) | オーディオソースのパラメトリックジョイント符号化 | |
US8481839B2 (en) | System and methods for synchronizing audio and/or visual playback with a fingering display for musical instrument | |
KR101320756B1 (ko) | 재생 장치, 재생 방법, 프로그램 | |
US8027487B2 (en) | Method of setting equalizer for audio file and method of reproducing audio file | |
JP4442585B2 (ja) | 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置 | |
CN101807894A (zh) | 音量校正装置,音量校正方法,音量校正程序以及电子设备 | |
JP2007180669A (ja) | 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置 | |
JP2004086189A (ja) | 楽曲検索システム | |
CN100380950C (zh) | 在视频特技模式期间利用数字信号处理的音频缩放 | |
JP2007292847A (ja) | 楽曲編集・再生装置 | |
US8612031B2 (en) | Audio player and audio fast-forward playback method capable of high-speed fast-forward playback and allowing recognition of music pieces | |
US7171367B2 (en) | Digital audio with parameters for real-time time scaling | |
JP4990375B2 (ja) | 記録再生装置 | |
WO2006087891A1 (ja) | 情報選択方法及び情報選択装置 | |
JP2006293697A (ja) | 車載用音楽装置 | |
EP1150299A2 (en) | Play back apparatus | |
WO2006077769A1 (ja) | 提示データ選択装置及び提示データ選択方法等 | |
JP4537490B2 (ja) | オーディオ再生装置およびオーディオ早送り再生方法 | |
JP2005266571A (ja) | 変速再生方法及び装置、並びにプログラム | |
JP2005004820A (ja) | ストリームデータ編集方法及びその装置 | |
RU2800626C2 (ru) | Кодирование звука высокого разрешения | |
JP2008079047A (ja) | データ再生装置、データ再生方法及びデータ再生プログラム | |
JP2007157254A (ja) | コンテンツ再生装置、検索サーバおよびコンテンツ選択再生方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |