CN1113345C - 重现音频信号的方法和一种放音机 - Google Patents
重现音频信号的方法和一种放音机 Download PDFInfo
- Publication number
- CN1113345C CN1113345C CN97113136A CN97113136A CN1113345C CN 1113345 C CN1113345 C CN 1113345C CN 97113136 A CN97113136 A CN 97113136A CN 97113136 A CN97113136 A CN 97113136A CN 1113345 C CN1113345 C CN 1113345C
- Authority
- CN
- China
- Prior art keywords
- audio signal
- original audio
- frame
- reproduction speed
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 151
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000012545 processing Methods 0.000 claims description 41
- 230000000630 rising effect Effects 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 6
- 230000008878 coupling Effects 0.000 description 17
- 238000010168 coupling process Methods 0.000 description 17
- 238000005859 coupling reaction Methods 0.000 description 17
- 230000008859 change Effects 0.000 description 8
- 238000005070 sampling Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000033228 biological regulation Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 210000001260 vocal cord Anatomy 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 description 1
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/40—Rhythm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/01—Correction of time axis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/005—Reproducing at a different information rate from the information rate of recording
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/375—Tempo or beat alterations; Music timing control
- G10H2210/385—Speed change, i.e. variations from preestablished tempo, tempo change, e.g. faster or slower, accelerando or ritardando, without change in pitch
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/09—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being zero crossing rates
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
- G11B2220/25—Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
- G11B2220/2537—Optical discs
- G11B2220/2545—CDs
Abstract
一种重现音频信号的方法,可以在不改变音频信号的音调和质量的情况下改变重现速度。对音频信号滤波以提取基本音频信号(d)。检测基本音频信号(d)中的零交叉点(D)。在时间轴上根据零交叉点(D)将原始音频信号(a)划分成多个帧。使帧变窄,并根据余下的帧将原始音频信号(a)重现为声音,以加速重现速度。另一方面,通过重复帧(C1,C2,…)重现原始音频信号(a),以使重现速度放慢。
Description
技术领域
本发明涉及一种重现音频信号的方法和一种放音机,尤其涉及将已经记录在某一记录媒体(例如紧致磁盘(CD))上的音频信号重现为声音的方法和采用这种方法的放音机。
背景技术
在某些情况下,需要将放音机(例如,CD放音机、盒式录音机、放像机)的重现速度降低到比正常的重现速度低或快。例如,当听众想在短时间内收听记录的音频数据时,需要加快重现速度;如果音频数据快速被记录下来时,需要放慢重现速度。
通常情况下,改变CD的旋转速度或磁带的运行速度来改变放音机的重现速度。
采用改变重现速度的普通方法,已经从记录媒体(例如CD)读取的音频信号的频率也按照重现速度的变化而改变,从而被重现的声音的音调也发生变化并且变差。
下面参照图8描述改变重现速度但保持原有音调的普通方法。将原始的音频信号划分成多个帧(A1,A2,A3,A4,A5,A6…),每一帧具有固定的时间长度(t)。通过选择帧(A1,A2,A3,A4,A5,A6…),可以改变音频重现速度。例如,为了重现比正常的重现速度快两倍的音频信号,使帧(A1,A2,A3,A4,A5,A6…)部分变窄,将相应于剩余的帧(例如帧(A1,A3,A5…))的音频信号重现为声音。采用这种方法,可以使被重现的音频信号(c)的重现时间为原始记录时间的二分之一。即,可以将收听时间减少二分之一。另外,原始音频信号(a)的频率或其周期(T)变化不大,音频信号(a)可以被重现为具有原来音调的声音。
如果仅仅连接与所选帧(A1,A3,A5…)对应的音频信号,那么在连接部分(B1,B2,B3,B4)中不会遇到如音频信号(b)所示的信号,在每一连接部分(B1,B2,B3,B4)中会产生不悦耳的噪声。
为了减少这些噪声,在一个所选帧(例如帧(A1))的端点处的信号电平,与相邻所选帧(例如帧(A3))的起点处的信号电平在函数上相互重叠在一起。一例函数式为
W(n)=0.5-0.5cos(2πn/M)
n:该帧中的信号电平;
M:n=0,1,…M。
通过这一过程,可以将原始音频信号(a)变成在连接部分(B1,B2,B3,B4)中继续的音频信号(c),从而可以减少被重现的音频信号(声音)中的不悦耳的噪声。
但是,普通的方法具有下面一些缺点。
在普通的方法中,连接部分(B1,B2,B3,B4)中原始音频信号(a)的信号电平被强制改变成规定的电平(例如零),所以某些连接部分中经改变的音频信号(c)的周期与原始音频信号(a)的周期完全不同。如果变化的音频信号(c)的周期部分地与原始音频信号(a)的周期不同,重现音频信号(话音)的音调就与原始话音完全不同。另外,与连接部分(B1,B2,B3,B4)相应的被重现的音频信号(c)的频率也不同于原始的音频信号(a),所以声音质量也变坏。
发明内容
本发明的目的是提供一种重现音频信号的方法,这种方法可以改变音频重现速度而不改变音调和音频信号的质量。另一个目的是提供一种采用所述方法的放音机。
为实现这些目的,本发明提供了一种用于重现记录在记录媒体上的原始音频信号的方法,它包括以下步骤:
按记录顺序,读取一预定量的所述原始音频信号;
通过对被读取的所述原始音频信号进行低通滤波,提取基本音频信号;和
检测所述基本音频信号之上升沿或下降沿的的零交叉点,
其中,如果检测到所述零交叉点,那么相对于时间轴将被读取的所述原始音频信号划分成多个帧;并且
如果重现速度f为1或更大,那么将忽略了一部分所述帧的所述原始音频信号进行重现;或者
如果重现速度f小于1,那么将一部分所述帧被重复的所述原始音频信号进行重现;
如果没有检测到所述零交叉点,那么
如果重现速度f为1或更大,那么重现每帧中1/f的所述原始音频信号;或者
如果重现速度f小于1,那么连续重现每帧中(1/f)-1的所述原始音频信号以及已被读取的所有所述原始音频信号。
本发明还提供了一种放音机,它包括:
读取装置,用于按记录顺序读取一预定量的原始音频信号,所述原始音频信号记录在一记录媒体上;
滤波装置,用于对所述原始音频信号进行低通滤波,从而提取基本音频信号;
检测装置,用于检测所述基本音频信号之上升沿或下降沿的的零交叉点;和
信号处理装置,用于划分和重现所述原始音频信号,
其中,如果检测到所述零交叉点,那么所述信号处理装置将被读取的所述原始音频信号相对于时间轴划分成多个帧;并且
如果重现速度f为1或更大,那么所述信号处理装置将忽略了一部分所述帧的所述原始音频信号进行重现;或者
如果重现速度f小于1,那么所述信号处理装置将一部分所述帧被重复的所述原始音频信号进行重现;
如果没有检测到所述零交叉点,那么
如果重现速度f为1或更大,那么所述信号处理装置重现每帧中1/f的所述原始音频信号;或者
如果重现速度f小于1,那么所述信号处理装置连续重现每帧中(1/f)-1的所述原始音频信号以及已被读取的所有所述原始音频信号。
本发明的方法和放音机中,对应于帧之间的连接部分的重现音频信号的周期与基本音频信号的周期相同,并且它们在连接部分中光滑连接起来。所以,即使根据余下的帧重现原始音频信号,也可以重现音频信号,而不会改变音频信号的音调和质量,从而加速重现速度,或通过使帧重复进行重现而使重现速度放慢。
附图说明
下面参照附图,举例描述本发明的一个实施例,图中:
图1描述的是本发明音频重现方法基本思想;
图2是本发明一个实施例的放音机的方框图;
图3是图2所示运算单元的方框图;
图4是图2所示放音机动作的流程图,其中,主帧内的原始音频信号是话音;
图5是图2所示放音机动作的流程图,其中,主帧内的原始音频信号不是话音;
图6描述的是图4所示情况处理过程;
图7描述的是图5所示情况处理过程;
图8描述的是普通放音机的处理过程。
具体实施方式
下面参照附图详细描述本发明的较佳实施例。
首先参照图1描述本发明重现音频信号的方法基本思想。
声音包括:有声声音,例如元音,它具有周期波形式并由声带的振动而产生;无声声音,例如辅音[s],它由嘴中狭窄空间中通过的气流产生而不振动声带。如果在帧的连接部分(B1,B2,B3,B4)有声声音相互不连续(图8),就会听到不悦耳的声音(噪声)。另一方面,即使无声声音相互不连续,因为无声声音的频率比有声声音的频率(等于声带的振动频率:约70-350Hz)高得多,所以听到的不悦耳声音很少。基于这样的事实,即使通过使帧(A1,A2,A3,A4,A5,A6)变窄以加速重现速度或重复该帧使重现速度放慢来将音频信号重现为话音,也可以通过使连接部分(B1,B2,B3,B4)中的有声声音连续来保持音调、声音电平(sound level)和声音质量。
在重现音频信号的方法中,通过低通滤波,从原始音频信号中提取具有基本频率Fp和基本周期Tp的基本音频信号(d)。检测基本信号(d)的上升部分和下降部分中的零交叉点(D)。图1中,示出了上升部分中的零交叉点(D)。图中,零交叉点(D)在时间轴上用黑圆圈表示。并且将原始音频信号(a)划分成多个帧(C1,C2,C3,C4,C5,C5,C6),每一帧具有4×Tp的时间长度。
如果帧(C1,C2,C3,C4,C5,C5,C6)部分地变窄,例如每一第二帧被跳过以加速重现速度,或者重复每一帧(C1,C2,C3,C4,C5,C6)重复一次或多次以使重现速度放慢,则在帧之间的连续部分中零交叉点(D)处可以使重现的音频信号(e)始终连续,而不必调整信号电平。图1示出的是通过跳过每一第二帧(C2,C4)来使帧(C1,C2,C3,C4,C5,C5,C6)部分地变窄以加速重现速度因而被重现的音频信号(e)在选择的帧(C1,C3,C5)之间的连接部分的零交叉点上光滑连续的情况。另外,因为基本信号(d)的上升部分(图1所示的情况)或下降部分中必须包括零交叉点(D),所以连接部分中被重现的音频信号(e)的相位不会反相,从而与余下的帧(C1,C3,C5)相应的重现音频信号(e)可以光滑连续。
采用这种方法,与帧之间的连接部分相应的重现音频信号的频率不会与基本频率Fp偏移很多。并且重现的音频信号(e)可以在连接部分连续。所以无法保持重现的音频信号(话音和声音)的音调和质量。注意,连接部分中的基本信号(d)示于图1中,用以清楚地说明,但重现的音频信号(e)实际上是由与选择的帧(C1,C3,C5)相应的原始音频信号(a)构成的。
如上所述,图1描述的是使比正常速度快的重现速度加速的情况。另一方面,为了使重现速度比正常重现速度慢,采用使每一帧(C1,C2,C3,C4,C5,C6)重复一次或多次,来连续重现帧(C1,C2,C3,C4,C5,C6)的原始音频信号(a)。例如,可以以如下顺序来重现原始音频信号(a):C1,C1,C2,C2,C3,C3,C4,C4,C5,C5,C6,C6。通过该例,可以以0.5倍于正常重现速度的速度来重现原始音频信号(a)。如果原始音频信号(a)是以C1,C1,C2,C3,C4,C4,C5,C6的顺序重现的,所以原始音频信号(a)可以以0.75倍的正常重现速度的速度来重现。
下面参照图2-7描述采用上述方法的放音机。注意,将要描述的是作为一例放音机的CD-ROM书的声音重现电路10,但是,磁带、软盘、包括半导体存储器(例如RAM等)的IC卡也可以作为记录媒体。作为读故事的话音信号的原始音频信号(a)是记录在由规定的取样频率取样的CD上作为PCM数据的。
下面参照图2和图6描述声音重现电路10。
PCM数据由包括光学拾取的读取部分12从CD14读取,并输入到声音重现电路10内。
由读取部分12读取的PCM数据按顺序的存储在输入存储器16内。
运算单元18以存储顺序从输入存储器16读取规定的PCM数据量,该数据量等于主帧(E)的数据量,并将其存储在运算存储器20内。运算单元18从一个主帧(E)的原始声音信号(a)中获取具有基本频率Fp(按照声音略有变化)的基本音频信号(d),随后运算单元18在基本音频信号(d)的上升部分或下降部分中检测零交叉点(D)。已经存储在运算存储器20中的主帧(E)的原始音频信号(a)由时间轴上的零交叉点划分成多个子帧(C1-C11)。当由控制单元22(一微处理机)输入重现速度(f)时,如果重现速度比正常速度快,则运算单元18使子帧(C1-C11)变窄,以简略恰当数量的子帧,随后,运算单元18从运算存储器20读取与所选子帧(剩余子帧)相应的数据,并顺序地将这些数据存储到输出存储器24内。另一方面,如果重现速度(f)比正常重现速度慢,则运算单元18重复一次或多次恰当的子帧,随后运算单元18按照子帧的重复速度从运算存储器20读取数据,并按顺序地将这些数据存储到输出存储器24内。输出存储器24中存储的PCM数据将构成重现音频信号(e)。
DAC(数/模转换器)26以固定的速度从输出存储器24读取与子帧相应的原始音频信号(a)的数据。读取的数据被转换成模拟信号,并且可以在指定的重现速度(f)下重现为重现的音频信号(e)。已经从DAC26输出的重现音频信号(e)作为话音从扬声器(未图示)输出。
注意,控制单元22将重现速度(f)分配给运算单元18。运算单元18的控制程序被存放在嵌入式存储器(flush memory)28内。输入存储器16和输出存储器24的容量是按照运算单元18的处理速度设计的,即在工作时,存储器16和24不会空着和全满。一个存储单元的存储空间可以划分为存储器16、20和22。
下面参照图3-7描述运算单元18。
滤波部分(数字滤波部分)30通过低通滤波器对原始音频信号(a)的PCM数据进行滤波,以去除无声部分,从而可以提取基本频率为Fp(约70-350Hz)的基本音频信号(d)。本实施例中,采用了一对IIR型低通滤波器,并且它们的截止频率为200Hz(基频的中间频率为70-350Hz)。采用这种滤波器,从滤波部分30输出具有基频Fp和基本周期Tp(见图1、6和7)的基本音频信号(d)。
检测部分32检测每一主帧(E)的基本音频信号(d)的上升(或下降)部分中包括的零交叉点(D)。本实施例中,检测的是基本音频信号(d)的上升部分中的零交叉点(D)。检测部分32通过零交叉点(D)将一个主帧(E)的音频信号(d)划分成多个子帧(C1,…Cn;“n”为自然数),并且每一子帧(C1,…Cn)具有规定的时间长度,该时间长度与基本周期Tp的时间一样长。检测部分32将运算存储器20中存储的相邻子帧之间连接部分的地址数据,例如子帧起点的位置,作为零交叉数据(g)输出。
话音检测部分34检测是否检测部分32检测到了零交叉点(D)。当检测部分32检测到没有零交叉点(D)时,声音检测部分34输出无声音信号(h),该信号表示无声声音或没有话音被记录下来。注意,检测部分32可以代替话音检测部分34输出无声信号(h)。
当控制单元22分配重现速度(f)时,信号处理部分36定义重现速度(f)。即,重现的音频信号(e)在分配的速度下重现,该速度是正常重现速度的f(“f”是正实数)倍。如果检测到主帧(E)内的零交叉点(D),则信号处理部分36的动作与检测到无零交叉点(D)的情况下的动作不同。
首先描述检测到零交叉点(D),即从声音检测部分34不发送无声信号(h)的情况。
如同4所示,信号处理部分36根据零交叉数据(g)对子帧(C1,…Cn)的个数进行计数,并从运算存储器20读取原始音频信号(a)。信号处理部分36根据预定的规则(步骤S100),从包括“f”(自然数)个子帧的每一组子帧中选择出一个子帧。将所选子帧的原始音频信号(a)存储到输出存储器24内(步骤S102);非选(跳过或变窄)子帧的原始音频信号(a)是不被存储起来的(步骤S104)。注意,为了连续重现音频信号(话音),以重现的音频信号(e)的形式将与所选子帧对应的原始音频信号(a)存储在输出存储器24中。
信号处理部分36检测运算存储器20中存储的主帧(E)中是否留有任何子帧(步骤S106)。如果主帧(E)中留有子帧,则信号处理部分36读取留下的子帧(步骤S108)并返回到步骤S100。另一方面,如果主帧(E)中没有留下子帧,那么信号处理部分36停止对运算存储器20中存储的主帧(E)的原始PCM数据(a)的处理。注意,在存在剩余子帧(I)的情况下,并且其长度比周期Tp短,则在主帧(E)的尾部,将剩余子帧(I)存储到运算存储器20中,并将剩余子帧(I)加到下一个主帧(E)。即,剩余子帧(I)的长度被加到下一个主帧(E)的长度中。
在完成运算存储器20中存储的主帧(E)的原始音频信号(a)的PCM数据处理以后,运算单元18从输入存储器16读取下一个主帧(E)的PCM数据,并将它们存储到输出存储器20中,随后重复上述处理过程。
下面参照图6描述具体例子。本例中,重现速度(f)指定为二(f=2),因而重现的音频信号(e)以二倍于正常重现速度的重现速度而重现。信号处理部分36对来自第一子帧(C1)的子帧(C1,…C11)的个数进行计数。信号处理部分36从包括两个子帧的每一组子帧中选择出一个子帧。所选子帧(画斜线的区域)的原始音频信号(a)从运算存储器20中读出并按顺序存入输出存储器24内。信号处理部分36还处理所有的主帧。由于这一动作,输出存储器24中被重现的音频信号(e)的PCM数据量减半,因而可以在二倍于正常重现速度的重现速度下重现音频数据(e)。
如果“f”=1.5,即指定的重现速度是正常重现速度的1.5倍,则信号处理部分36从每一组子帧中选择出两个子帧,该组子帧中包括三个子帧。所选子帧(画斜线的区域)的原始音频信号(a)从运算存储器20读出,并顺序存入输出存储器24。由于这一动作,输出存储器24中被重现的音频信号(e)的PCM数据量减为2/3,因而可以在1.5倍于正常重现速度的重现速度下重现音频数据(e)。
如果“f”=1,则信号处理部分36从包括一个子帧的每一组子帧中选出一个子帧。即,选择每一子帧,从而所有子帧(C1-C11)的原始音频信号(a)从运算存储器20中读出并存储到输出存储器24内。因此,可以在正常速度下重现音频数据(e)。
上面已经描述了“f”1的情况。如果“f”<1,即重现速度放慢,则重复每一子帧或所选的子帧,从而使输出存储器24中重现的音频信号(e)的PCM数据量为主帧(E)的PCM数据量的1/f倍。因此,可以使重现速度(f)比正常重现速度慢。
下面参照图6描述更慢重现速度的例子。如果“f”=0.75,即指定重现速度为正常重现速度的0.75倍,则信号处理部分36对子帧的个数计数,并读取每一子帧的原始音频信号(a)。信号处理部分36从每三个子帧中选出一个子帧,并重复读取所选子帧的信号(a)。已经由信号处理部分36读取并重复的原始音频信号(a)以读-重复的顺序接连存储到输出存储器24中。对所有的主帧(E)均执行这一处理过程。由于这一动作,输出存储器24中重现音频信号(e)的PCM数据量为4/3(=1/0.75)、从而可以在0.75倍与正常重现速度的重现速度来重现音频数据(e)。即,在本例中,图中用黑色区域表示的所选子帧(C1,C4,C7,C10)的原始音频信号(d)被重复两次。
在某些情况下,根据“f”的值,主帧(E)中的数据量与输出存储器24中的数据量不一致。通过选择(变窄)或重复子帧使(主帧中的数据量)/(输出存储器中的数据)的值接近于的指定值“f”。
下面描述检测无零交叉点和从话声检测部分34发送无声信号(h)的情况。
如同5所示,如果“f”1,则从主帧(E)的起点读取(一个主帧中PCM数据的取样个数)/主帧(E)中PCM数据的f(正整数),并将其按顺序存储到输出存储器24中。通过这一过程,使输出存储器24中主帧(E)的重现音频信号(e)的PCM数据量为1/f,从而可以以“f”倍于正常重现速度的速度来重现音频信号(e)。
图7中示出了一个具体例子。当输入“f=2”时,重现速度被指定为二倍于正常的重现速度。信号处理部分36读取主帧(E)中PCM数据的1/2取样值,并接着将已经读取的PCM数据按顺序存储到输出存储器24中。采用这一处理过程,使输出存储器24中主帧的重现音频信号(e)的PCM数据量为1/2,从而可以在二倍于正常重现速度的速度下重现音频信号(e)。如果“f=1.5”,则信号处理部分36采用同样的方式处理该数据。
如果“f”<1,则从主帧(E)的起点读取主帧(E)中PCM数据取样的“(一个主帧中PCM数据的取样数)/f)-1”(正整数),并按顺序存入输出存储器24。接着按顺序存储主帧(E)中的所有PCM数据。采用这一处理过程,使输出存储器24中主帧(E)的重现音频信号(e)的PCM数据量为1/f(f<1),从而可以在正常重现速度f倍的速度下重现音频信号。
图7中示出了一个具体例子。当输入“f=0.75”时,重现速度指定为0.75倍于正常重现速度。信号处理部分36读取主帧(E)中PCM数据取样的“1/0.75-1(=1/3)”,并把已经读取的PCM数据存储到输出存储器24中。接着按顺序存储主帧(E)中的所有PCM数据。采用这一过程,使输出存储器24中主帧(E)的重现音频信号(e)的PCM数据量为4/3(=1/3+1=1/f),从而可以在正常重现速度3/4(f)位的速度下重现音频信号。
如果不包括声音的主帧(E)连续,则重复上述处理过程。
另外,如果“f<0.5”,则即使所有的子帧都重复一次,或者当没有话音信号(h)发送时重复PCM数据的所有取样,则使输出存储器24中存储的PCM数据量仅二倍于主帧(E)中的数据量。为了按照指定的“f”值增加输出存储器24中PCM数据量,则重复两次或更多次所有或选择的子帧,或者当发送无话音信号(h)时重复所需PCM数据量所需的次数。通过重复两次或更多次,可以将PCM数据取样所需的个数存储到输出存储器24中,并且可以在指定的重现速度(f<0.5)下重现重现的音频信号(e)。
本发明可以在不偏离其精神或基本特征的情况下以其他形式实施。所以本实施例应当被认为在所有方面都是描述性的而非限定性的,本发明的保护范围由后文的权利要求限定,而不是由上述说明描述限定,因而在与权利要求等效的范围内的所有变更都应视为落在本发明的范围内。
Claims (2)
1.一种用于重现记录在记录媒体上的原始音频信号的方法,其特征在于,包括以下步骤:
按记录顺序,读取一预定量的所述原始音频信号;
通过对被读取的所述原始音频信号进行低通滤波,提取基本音频信号;和
检测所述基本音频信号之上升沿或下降沿的的零交叉点,
其中,如果检测到所述零交叉点,那么相对于时间轴将被读取的所述原始音频信号划分成多个帧;并且
如果重现速度f为1或更大,那么将忽略了一部分所述帧的所述原始音频信号进行重现;或者
如果重现速度f小于1,那么将一部分所述帧被重复的所述原始音频信号进行重现;如果没有检测到所述零交叉点,那么
如果重现速度f为1或更大,那么重现每帧中1/f的所述原始音频信号;或者
如果重现速度f小于1,那么连续重现每帧中(1/f)-1的所述原始音频信号以及已被读取的所有所述原始音频信号。
2.一种放音机,其特征在于,包括:
读取装置,用于按记录顺序读取一预定量的原始音频信号,所述原始音频信号记录在一记录媒体上;
滤波装置,用于对所述原始音频信号进行低通滤波,从而提取基本音频信号;
检测装置,用于检测所述基本音频信号之上升沿或下降沿的的零交叉点;和
信号处理装置,用于划分和重现所述原始音频信号,
其中,如果检测到所述零交叉点,那么所述信号处理装置将被读取的所述原始音频信号相对于时间轴划分成多个帧;并且
如果重现速度f为1或更大,那么所述信号处理装置将忽略了一部分所述帧的所述原始音频信号进行重现;或者
如果重现速度f小于1,那么所述信号处理装置将一部分所述帧被重复的所述原始音频信号进行重现;
如果没有检测到所述零交叉点,那么
如果重现速度f为1或更大,那么所述信号处理装置重现每帧中1/f的所述原始音频信号;或者
如果重现速度f小于1,那么所述信号处理装置连续重现每帧中(1/f)-1的所述原始音频信号以及已被读取的所有所述原始音频信号。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP350852/1996 | 1996-12-27 | ||
JP350852/96 | 1996-12-27 | ||
JP8350852A JPH10187188A (ja) | 1996-12-27 | 1996-12-27 | 音声再生方法と音声再生装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1186303A CN1186303A (zh) | 1998-07-01 |
CN1113345C true CN1113345C (zh) | 2003-07-02 |
Family
ID=18413331
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN97113136A Expired - Lifetime CN1113345C (zh) | 1996-12-27 | 1997-05-16 | 重现音频信号的方法和一种放音机 |
Country Status (5)
Country | Link |
---|---|
US (2) | US6026067A (zh) |
JP (1) | JPH10187188A (zh) |
CN (1) | CN1113345C (zh) |
DE (1) | DE19714688C2 (zh) |
GB (1) | GB2320791B (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19713286A1 (de) * | 1997-03-29 | 1998-10-01 | Thomson Brandt Gmbh | Gerät zur CD-Wiedergabe mit veränderbarer Geschwindigkeit oder Richtung |
JPH1168576A (ja) * | 1997-08-22 | 1999-03-09 | Hitachi Ltd | データ伸張装置 |
US6292454B1 (en) * | 1998-10-08 | 2001-09-18 | Sony Corporation | Apparatus and method for implementing a variable-speed audio data playback system |
US8290351B2 (en) | 2001-04-03 | 2012-10-16 | Prime Research Alliance E., Inc. | Alternative advertising in prerecorded media |
US6738059B1 (en) * | 1998-12-18 | 2004-05-18 | Kabushiki Kaisha Sega Enterprises | Apparatus and methods for image processing using mixed display objects |
EP1309965B1 (en) * | 2000-08-09 | 2010-12-15 | Thomson Licensing | Method and system for enabling audio speed conversion |
US20020184047A1 (en) * | 2001-04-03 | 2002-12-05 | Plotnick Michael A. | Universal ad queue |
US7161887B2 (en) * | 2001-11-13 | 2007-01-09 | Digeo, Inc. | Method and apparatus for extracting digital data from a medium |
US7286749B2 (en) * | 2002-04-16 | 2007-10-23 | Canon Kabushiki Kaisha | Moving image playback apparatus, moving image playback method, and computer program thereof with determining of first voice period which represents a human utterance period and second voice period other than the first voice period |
JP2005244751A (ja) * | 2004-02-27 | 2005-09-08 | Kyocera Corp | 音声通信システム及び移動局 |
US7464028B2 (en) * | 2004-03-18 | 2008-12-09 | Broadcom Corporation | System and method for frequency domain audio speed up or slow down, while maintaining pitch |
JP4096915B2 (ja) | 2004-06-01 | 2008-06-04 | 株式会社日立製作所 | デジタル情報再生装置及び方法 |
TWI253059B (en) * | 2004-08-04 | 2006-04-11 | Via Tech Inc | Sound fast-forward method and device |
JP4413809B2 (ja) * | 2005-03-29 | 2010-02-10 | 富士通マイクロエレクトロニクス株式会社 | 半導体装置の製造方法 |
EP1739676A1 (en) * | 2005-06-29 | 2007-01-03 | Hitachi, Ltd. | Digital broadcasting receiving device and digital information receiving device, and playback method |
CN101110247B (zh) | 2007-08-17 | 2011-04-20 | 华为技术有限公司 | 音频文件的播放方法及装置 |
JP4952469B2 (ja) * | 2007-09-19 | 2012-06-13 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
JP2010002937A (ja) * | 2009-10-07 | 2010-01-07 | Casio Comput Co Ltd | 音声分析合成装置、音声分析装置、音声合成装置、及びプログラム |
JP5956936B2 (ja) | 2013-01-28 | 2016-07-27 | シナノケンシ株式会社 | 音声データ再生速度変換方法および音声データ再生速度変換装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4091242A (en) * | 1977-07-11 | 1978-05-23 | International Business Machines Corporation | High speed voice replay via digital delta modulation |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB599090A (en) * | 1944-10-11 | 1948-03-04 | Oerlikon Maschf | Bipolar electrolyser |
US3104284A (en) * | 1961-12-29 | 1963-09-17 | Ibm | Time duration modification of audio waveforms |
JPS6066365A (ja) * | 1983-09-21 | 1985-04-16 | Sony Corp | ミュ−ティング回路 |
JPH04216353A (ja) * | 1990-12-14 | 1992-08-06 | Sanyo Electric Co Ltd | 音声時間軸圧縮伸長方法 |
US5175769A (en) * | 1991-07-23 | 1992-12-29 | Rolm Systems | Method for time-scale modification of signals |
-
1996
- 1996-12-27 JP JP8350852A patent/JPH10187188A/ja active Pending
-
1997
- 1997-04-07 US US08/827,909 patent/US6026067A/en not_active Expired - Lifetime
- 1997-04-08 GB GB9707160A patent/GB2320791B/en not_active Expired - Lifetime
- 1997-04-09 DE DE19714688A patent/DE19714688C2/de not_active Expired - Lifetime
- 1997-05-16 CN CN97113136A patent/CN1113345C/zh not_active Expired - Lifetime
-
1999
- 1999-08-27 US US09/384,543 patent/US6088313A/en not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4091242A (en) * | 1977-07-11 | 1978-05-23 | International Business Machines Corporation | High speed voice replay via digital delta modulation |
Also Published As
Publication number | Publication date |
---|---|
US6026067A (en) | 2000-02-15 |
US6088313A (en) | 2000-07-11 |
CN1186303A (zh) | 1998-07-01 |
JPH10187188A (ja) | 1998-07-14 |
DE19714688A1 (de) | 1998-07-02 |
GB9707160D0 (en) | 1997-05-28 |
DE19714688C2 (de) | 2002-10-31 |
GB2320791B (en) | 2001-02-07 |
GB2320791A (en) | 1998-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1113345C (zh) | 重现音频信号的方法和一种放音机 | |
CN1301506C (zh) | 播放表管理设备和方法 | |
CN1229977A (zh) | 伴随着表示音乐拍音的信息再现音乐的装置和方法 | |
CN1122996C (zh) | 用于产生光盘再现时间的装置和方法 | |
CN1144216C (zh) | 记录/再现方法和设备 | |
CN1115687C (zh) | 记录介质及重放设备 | |
CN1221949A (zh) | 音频信息记录介质和音频信息重现装置 | |
CN1131471A (zh) | 音响重放装置 | |
CN1617182A (zh) | 门铃系统中录制和播放激光唱盘音质声音的方法及接收器 | |
CN1150513C (zh) | 速度可变的语音信号再生方法 | |
CN1746800A (zh) | 信息处理设备、信息处理方法以及程序 | |
CN1066837C (zh) | 用于卡啦ok的记录媒体、重放装置和方法 | |
CN1145519A (zh) | 音频信号保真变速处理方法 | |
CN1465070A (zh) | 信号电平检测装置和方法,以及信号电平指示装置 | |
CN1074849C (zh) | 音频信号保真变速处理方法 | |
CN1947196A (zh) | 记录再现装置、同时记录再现控制方法以及同时记录再现控制程序 | |
CN1201300C (zh) | 用于记录和重现记录媒体的设备和方法 | |
CN1489148A (zh) | 便携(可录音)式卡拉ok装置 | |
CN1276415C (zh) | 光盘的数据记录及其播放方法 | |
CN1298182A (zh) | 可安装于汽车上的收音、特别是播放录音的音响设备 | |
CN1117368C (zh) | 向/自光盘再现语言学习信息的方法 | |
CN1906690B (zh) | 再生装置、再生处理电路、再生方法 | |
CN1731525A (zh) | 定时播放音乐的系统和方法 | |
CN1231907C (zh) | 光盘装置中控制重放操作的方法 | |
CN1305066C (zh) | 在记录介质上记录的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term |
Granted publication date: 20030702 |
|
CX01 | Expiry of patent term |