CN1239571A - 声音处理方法、声音处理装置和记录重放装置 - Google Patents

声音处理方法、声音处理装置和记录重放装置 Download PDF

Info

Publication number
CN1239571A
CN1239571A CN98801333A CN98801333A CN1239571A CN 1239571 A CN1239571 A CN 1239571A CN 98801333 A CN98801333 A CN 98801333A CN 98801333 A CN98801333 A CN 98801333A CN 1239571 A CN1239571 A CN 1239571A
Authority
CN
China
Prior art keywords
sampling frequency
data
sound
conversion
variable velocity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN98801333A
Other languages
English (en)
Other versions
CN1125459C (zh
Inventor
今井笃
清山信正
都木徹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK filed Critical Nippon Hoso Kyokai NHK
Publication of CN1239571A publication Critical patent/CN1239571A/zh
Application granted granted Critical
Publication of CN1125459C publication Critical patent/CN1125459C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/90Tape-like record carriers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Analogue/Digital Conversion (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

在以与录音时不同的速度重放声音信号时,利用抽样频率转换部分(4),把A/D转换时的抽样频率f1(Hz)与D/A转换时抽样频率f0(Hz)进行匹配,同时根据VTR可变速度重放部分(2)的可变速度比r和声音属性,通过把声音数据分割为有预定时间宽度的块单位,进行依次插入或抽出操作,使VTR可变速度重放部分(2)中可变速度重放的图象信号与声音提示定时同步,同时输出没有音程变化的高品质的声音。

Description

声音处理方法、声音处理装置和记录重放装置
本发明涉及在专业用VTR装置、6mm磁带录音机装置等输出与重放速度成比例的音程变化的音响装置中,在按任意速度重放所记录的声音时,输出带有不拘泥于重放速度的正规音程声音的声音处理方法、声音处理装置和记录重放装置,特别涉及当用于VTR装置时,输出适应最佳的重放速度并且与图象同步的高品质声音的声音处理方法、声音处理装置和记录重放装置。
一般来说,在按任意速度重放记录在磁带等模拟记录介质中的声音时,音程与其重放速度成比例地变化。
此外,在专业用的VTR装置中,近年来,在图象和声音上同时采用数字方式的记录成为主流,而在声音输出中,为了编辑作业的高效率化,与模拟方式的VTR装置一样,输出音程与重放速度成比例地变化的声音。
但是,对于VTR装置,在现有技术中,尽管可以进行图象的可变速度重放,但至今还不具有与可变速度重放图象同步,同时把音程校正至正规高度的功能的装置。
此外,如果限于校正音程的装置,则使用在卡拉OK装置等中的音调移相器(音调转换器)是公知的,但如果把该音调移相器用于所述VTR装置的音程校正,那么在对象为人声时,或在其校正范围大时,例如象1/2倍速重放,每当把下降了1个八度音程的声音恢复为原样时,在被校正的声音中伴随有过多的失真感和回声感等,而在音质上存在问题。
由此可知,在校正音程的变化时,在考虑广播品质的情况下,至今还没有适当的装置,在用于广播等中的VTR装置进行慢速重放时,除去有意采用音程变化的非真实的声音情况外,存在不能在图象重放的同时使用被重放的声音的问题。
鉴于上述情况,本发明的目的在于提供声音处理方法、声音处理装置和记录重放装置,象在进行1/2倍速重放或2倍速重放时,在可变速度的实际使用范围内,通过取入可变速度重放的音程变化的声音,保持声音的清晰度,同时在与图象高精度地同步的状态下,在±1八度左右的范围内,使音程恢复为原样。
为了实现上述目的,按照权利要求1所述的声音处理方法,当以与在记录介质上记录声音信号时的速度不同的重放速度重放所述记录介质上的声音信号时,调整被重放的声音信号的音程,其特征在于,按相对于正规的重放速度的可变速度比r,设定各抽样频率fi、fo,以便使从所述记录介质重放的声音信号经A/D转换变为声音数据时的抽样频率fi、把所述声音数据进行数字信号处理后经D/A转换变为声音信号时的抽样频率fo、以及所述可变速度比r满足预定的条件。
按照权利要求2所述的声音处理方法,其特征在于,在权利要求1所述的声音处理方法中,按所述可变速度比r,在对把从所述记录介质所重放的声音信号按抽样频率fi进行A/D转换而得到的声音数据进行数字信号处理时,分析处理所述声音数据的属性,然后根据按该分析处理得到的信息,把所述声音数据分割为有预定时间宽度的块(block)单位,用块单位对所述声音数据依次进行插补处理或抽去处理,进行使其数据长度依次达到1/r倍的一连串处理,而制成输出声音数据,然后,按所述抽样频率fo将所述输出声音数据进行D/A转换,生成声音信号。
按照权利要求3所述的声音处理方法,其特征在于,在权利要求1所述的声音处理方法中,作为预定条件,在所述各抽样频率fi、fo和所述可变速度比r满足fi/fo=r时,使用可达到fi=r·fo的抽样频率fi,而在所述各抽样频率fi、fo和所述可变速度比r为fi/fo≠r时,使用包含抽样频率转换系数c的可达到fi=r·fo/c的抽样频率fi
按照权利要求4所述的声音处理方法,其特征在于,在权利要求2所述的声音处理方法中,作为预定条件,当所述各抽样频率fi、fo和所述可变速度比r满足fi/fo=r时,使用可达到fi=r·fo的抽样频率fi,而在所述各抽样频率fi、fo和所述可变速度比r为fi/fo≠r时,使用包含抽样频率转换系数c的可达到fi=r·fo/c的抽样频率fi
按照权利要求5所述的声音处理方法,其特征在于,在权利要求4所述的声音处理方法中,按所述可变速度比r,在对把从所述记录介质重放的声音信号按抽样频率fi进行A/D转换而得到的声音数据进行数字信号处理时,监视从所述记录介质所读出的声音信号的时刻信息和经所述一连串处理得到的输出声音数据的时刻信息,校正在所述声音信号和所述输出声音数据之间产生的时间偏差。
按照权利要求6所述的声音处理装置,当以与在记录介质中记录声音信号时的速度不同的重放速度重放所述记录介质上的声音信号时,调整被重放的声音信号的音程,其特征在于,该装置包括:A/D转换装置,把从所述记录介质所重放的声音信号按抽样频率fi进行A/D转换;分析处理装置,对A/D转换得到的声音数据根据属性进行分析处理;块数据分割装置,根据由该分析处理得到的信息,将所述声音数据分割为有预定时间宽度的块单位;输出声音数据制作装置,按分割的块单位将所述声音数据依次进行插补处理或抽去处理,进行使其数据长度达到1/r倍的一连串处理,作成输出声音数据;声音输出装置,把作成的输出声音数据按抽样频率fo进行D/A转换,输出与图象同步的声音;抽样频率设定装置,设定各抽样频率fi、fo,以使所述A/D转换时的抽样频率fi、把所述声音数据经D/A转换变为声音信号时的抽样频率fo、所述可变速度比r能够满足预定的条件。
按照权利要求7所述的声音处理装置,其特征在于,在权利要求6所述的声音处理装置中,作为由所述抽样频率设定装置所设定的预定条件,在所述各抽样频率fi、fo和所述可变速度比r满足fi/fo=r时,使用可达到fi=r·fo的抽样频率fi,而在所述各抽样频率fi、fo和所述可变速度比r为fi/fo≠r时,使用包含抽样频率转换系数c的可达到fi=r·fo/c的抽样频率fi
按照权利要求8所述的声音处理装置,其特征在于,在权利要求7所述的声音处理装置中,所述输出声音数据制作装置包括监视从所述记录介质读出的声音信号的时刻信息和经所述一连串处理得到的输出声音数据的时刻信息,来校正在所述声音信号和所述输出声音数据之间产生的时间偏差的装置。
按照权利要求9所述的记录重放装置,其特征在于,包括权利要求6所述的声音处理装置。
按照权利要求10所述的记录重放装置,其特征在于,包括权利要求7所述的声音处理装置。
按照权利要求11所述的记录重放装置,其特征在于,包括权利要求8所述的声音处理装置。
如上所述,按照本发明,提供一种声音处理方法,当以与在记录介质中记录声音信号时的记录速度不同的重放速度来重放记录在所述记录介质中的声音信号时,调整被重放声音信号的音程,其特征在于设定各抽样频率fi、fo以相对于正规重放速度的可变速度比r把从所述记录介质重放的声音信号经A/D转换变为声音数据时的抽样频率fI,对所述声音数据进行数字信号处理后,进行D/A转换变为声音信号时的抽样频率fo和所述可变速度比r能够满足预定的条件。由此,在象1/2倍速重放或2倍速重放时那样的可变速度的实际使用范围内,取入可变速度重放的音程变化的声音,在保持声音的清晰度,同时与图象高精度地同步的状态下,±1八度音程左右的范围内,使音程恢复为原状。
此外,相对于以往使用的电路,可以通过仅附加少量电路来构成电路。
附图的简要说明
图1是表示使用本发明的声音处理方法、声音处理装置和记录重放装置的附带声音的VTR可变速度重放装置的主要部分的方框图。
图2是表示图1所示的连接数据生成部分的连接数据生成操作例的模式图。
图3是表示处于图1所示的连接顺序生成部分内的时间信息监视操作部分的详细电路结构例的方框图。
图4是表示在使图1所示的附带声音的VTR可变速度重放装置变‘慢速’时,连接顺序生成部分的块连接指示操作例的模式图。
图5是表示在使图1所示的附带声音的VTR可变速度重放装置变为‘快速’时,连接顺序生成部分的块连接指示操作例的模式图。
实施发明的优选实施例
图1是表示使用本发明的声音处理方法、声音处理装置和记录重放装置的附带声音的VTR可变速度重放装置主要部分的方框图。
图中所示的附带声音的VTR可变速度重放装置1配有VTR可变速度重放部分2、A/D转换部分3、抽样频率转换部分4、分析处理部分5、块数据分割部分6、块数据存储部分7、连接数据生成部分8、连接数据存储部分9、连接顺序生成部分10、声音数据连接部分11和D/A转换部分12,在控制VTR可变速度重放部分2,并按与录音时不同的速度重放声音信号时,通过抽样频率转换部分4,使A/D转换时的抽样频率fi(Hz)与D/A转换时的抽样频率fo(Hz)匹配,同时根据VTR可变速度重放部分2的可变速度比r和声音的属性,把声音数据分割为有预定时间宽度的块单位,通过依次插补或抽去,使声音的提示定时与用VTR可变速度重放部分2进行可变速度重放的图象信号同步,同时输出没有音程变化的高品质的声音。
此时,在以与录音时不同的速度把重放的声音信号进行A/D转换,并利用数字信号处理进行音程校正和数据时间长度伸缩后,在经D/A转换而输出与图象同步的声音的一连串过程中,当A/D转换时的抽样频率为fi(Hz),D/A转换时的抽样频率为fo(Hz),VTR可变速度重放部分2的可变速度比为r时,可以设定抽样频率fi、fo以满足fi/fo=r的关系式,在此情况下,按可达到fi=r·fo(Hz)的抽样频率fi,进行声音信号的A/D转换。此外,在不能把抽样频率fi、fo设定成任意值,而为fi/fo≠r关系的情况下,利用在A/D转换部分3的后段所设置的抽样频率转换部分4,转换成按抽样频率转换系数c=r·fo/fi(Hz)进行抽样的状态下的声音数据。而且,根据声音的属性实施分析处理,根据由该分析处理得到的信息,把声音数据分割为具有预定时间宽度的块单位,按该块单位,通过依次插补或抽去,在进行使数据时间长度依次达到1/r倍的一连串处理后,按抽样频率fo(Hz),进行D/A转换,由此使声音提示定时与在VTR可变速度重放部分2的可变速度重放中得到的图象信号相同步,同时输出没有音程变化的高品质声音。
VTR可变速度重放部分2由能够与任意的图象重放速度一致地取出记录在VTR装置中的声音信号,并在可变重放速度时,可以电气输出相对于正规重放速度的可变速度比r的VTR装置构成,或由带有视觉显示可变速度比r功能的原有VTR装置等构成,按指定的重放速度重放用通常记录速度记录的图象信号、声音信号,把由此得到的图象信号(变速重放图象信号)输出给监视器装置等,同时把与该图象信号一起重放的声音信号(变速重放声音信号)和可变速度比信息(包括可变速度比r信息)供给A/D转换部分3,并把变速重放图象信号的时刻信息和可变速度比信息供给连接顺序生成部分10。再有,作为附加该声音的VTR可变速度重放装置1所要求的功能,在仅要求声音处理功能时,VTR可变速度重放部分2也可以使用VTR装置以外的装置,例如6mm磁带声音重放装置等只有声音的介质记录重放装置等。
A/D转换部分3把从VTR可变速度重放部分2输出的声音信号(变速重放声音信号)按从VTR可变速度重放部分2输出的可变速度比信息(相对于正规重放速度的可变速度比r)对应的抽样频率fi进行A/D转换,将由此得到的声音数据供给抽样频率转换部分4。
此时,在可以设定各抽样频率fi、fo以使A/D转换时的抽样频率fi、D/A转换时的抽样频率fo和可变速度比r满足fi/fo=r的关系式时,按抽样频率fi=r·fo(Hz),把从VTR可变速度重放部分2输出的声音信号(变速重放声音信号)进行A/D转换,生成声音数据。此外,如在各抽样频率fi、fo为固定值等情况下那样,在A/D转换时的抽样频率fi、D/A转换时的抽样频率fo和可变速度比r为fi/fo≠r时,按预定的抽样频率fi(Hz),把从VTR可变速度重放部分2输出的声音信号(变速重放声音信号)进行A/D转换,生成声音数据,把由此得到的声音数据供给抽样频率转换部分4。
抽样频率转换部分4在从A/D转换部分3输出的声音数据被A/D转换为满足fi/fo=r的关系的声音数据时,作为抽样频率转换系数c,生成c=1。此外,在从A/D转换部分3输出的声音数据是按fi/fo≠r声关系进行A/D转换的声音数据时,作为抽样频率转换系数c,生成c=r·fo/fi根据这些抽样频率转换系数c,转换从A/D转换部分3输出的声音数据的抽样频率,把按抽样频率fiA/D转换的声音数据转换成与按正规重放速度重放时相同的抽样频率fo(Hz)进行A/D转换相当的声音数据,将其供给分析处理部分5和块数据分割部分6。
分析处理部分5顺序进行:取入从抽样频率转换部分4输出的声音数据(与按抽样频率fo(Hz)进行A/D转换相当的声音数据)的输入处理,把由该输入处理得到的声音数据抽样率降低(在本实施例中,为4kHz),使以后的处理量减少的抽取(decimation)处理,分析从A/D转换部分3输出的声音数据和由抽取处理得到的声音数据,区分成有声音、无声音、无音的属性处理,对用该属性分析处理得到的各有声音、无声音、无音进行自相关分析,检测周期性,根据该检测结果,决定分割声音数据所必需的块长度的块长度决定处理,把由此得到的分割信息(表示各有声音、无声音、无音的块长度信息)供给块数据分割部分6。
这种情况下,在属性分析处理中,对于从抽样频率转换部分4输出的声音数据,使用30ms前后窗口宽度,计算数据的平方和,按5ms前后的间隔,算出声音数据的功率值P,同时把该功率值P与预先设定的阈值Pmin进行比较,把满足‘P<Pmin’的部分判定为无声音区间,而把满足‘Pmin≤P’的部分判定为有声音区间。然后,对于从抽样频率转换部分4输出的声音数据,进行零交叉分析和相对于由上述抽取处理得到的声音数据的自相关分析等,根据这些分析结果和功率值P,在声音数据内,判定满足‘Pmin≤P’的部分是在伴随声带振动的声音区间(有声音区间),还是在没有伴随声带振动的声音区间(无声区间)。再有,作为从抽样频率转换部分4输出的声音数据的各属性,还考虑了杂音和音乐等背景音的属性,但一般来说,由于难以正确地自动判别杂音和背景音的信号及声音信号,所以把杂音、背景音都分类于有声音、无声音的其中之一。
此外,在块长度决定处理中,对于由属性分析处理判定为有声音区间的数据来说,在有声音的音调周期分布的1.25ms~28.0ms左右的整个宽范围中,使用长度不同的多个窗口宽度进行自相关分析,尽可能检测正确的音调周期(作为声带振动周期的基本周期),根据该检测结果,决定块长度,以使各音调周期成为各自块长度。此外,对于由属性分析处理得到的无声音区间、无音区间的情况来说,检测10ms以内的周期性,根据该检测结果,决定块长度,把这些有声音区间、无声音区间、无音区间的各块长度作为分割信息供给块数据分割部分6。
块数据分割部分6根据从分析处理部分5输出的分割信息中表示的有声音区间的块长度、无声音区间的块长度,分割从抽样频率转换部分4输出的声音数据,把由该分割处理得到的块单位的声音数据和该声音数据的块长度供给块数据存储部分7和连接数据生成部分8。
块数据存储部分7配有环形缓冲器,取入从块数据分割部分6输出的声音数据(块单位的声音数据)和该声音数据的块长度,将它们暂时存储在环形缓冲器中,同时适当读出暂时存储的各块长度,把该块长度供给连接顺序生成部分10,同时适当读出暂时存储的块单位的声音数据,把该声音数据供给声音数据连接部分11。
此外,连接数据生成部分8取入从块数据分割部分6输出的块单位的声音数据,同时如图2所示,使用直线变化的窗口A、B,在切去该块中包含的声音数据的开始部分、该块之后或者两个之后的块对应的声音数据的开始部分后,重复相加这些开始部分,生成连接数据,把该连接数据供给数据存储部分9。
这种情况下,例如当附带声音的VTR可变速度重放装置1的重放速度设定为‘慢速’时,取入从块数据分割部分6输出的块单位的声音数据,对于各块中处于该块开始部分的声音数据,在时间长度d(ms)期间进行使用直线变化窗口A的遮蔽,同时对于处于该块后面的块开始部分的声音数据,在时间长度d(ms)期间进行使用直线变化窗口B的遮蔽后,重复相加后面块的开始部分和该块的开始部分,生成时间长度d(ms)的连接数据,把该数据供给连接数据存储部分9。此外,如果附加声音的VTR可变速度重放装置1的重放速度设定为‘快速’,那么取入从块数据分割部分6输出的块单位的声音数据,对于各块中处于该块开始部分的声音数据,在时间长度d(ms)期间进行使用直线变化窗口A的遮蔽,同时对于处于该块后面的两个块开始部分的声音数据,在时间长度d(ms)期间进行使用直线变化窗口B的遮蔽后,重复相加后面块的开始部分和该块的开始部分,生成时间长度d(ms)的连接数据,把该数据供给连接数据存储部分9。此时,作为时间长度d,可以任意地选择处于‘5(ms)’~‘该块、后面的块、后面两个块的各块长度内最短的长度’范围内的某个值,但时间长度短的一方可以减少连接数据存储部分9的缓冲容量。
连接数据存储部分9配有环形缓冲器,取入从连接数据生成部分8输出的连接数据,把该连接数据暂时存储在环形缓冲器中,适当读出暂时存储的各连接数据,把该连接数据供给声音数据连接部分11。
此外,连接顺序生成部分10根据从VTR可变速度重放部分2输出的可变速度比信息和变速重放图象的时间信息,算出使变速重放图象的输出定时与声音输出定时一致所必需的时间上的伸缩倍率,把该算出的伸缩倍率暂时存储在自备的可写入存储器中。此外,连接顺序生成部分10配有连接顺序决定部分,该部分按预先设定的预定时间间隔,例如按50~100ms左右的时间间隔,读出在可写入存储器中存储的时间上的伸缩倍率,同时根据该伸缩倍率、从块数据存储部分7输出的各块长度、从声音数据连接部分11输出的已连接信息,按块单位的各声音数据和块单位的各连接数据的连接顺序,即按从VTR可变速度重放部分2输出的可变速度信息,随时生成使被指定的变速重放图象的输出定时与声音输出定时一致所必需的连接顺序。
这种情况下,在连接顺序生成部分10的连接顺序决定部分中,作为使变速重放图象的输出定时与声音输出定时一致的方法,可采用计算由从VTR可变速度重放部分2输出的可变速度比信息示出的可变速度比r的倒数1/r,把它作为用分析处理部分5得到的分割信息(被分割的块的伸缩倍率),根据该伸缩倍率,进行时间上的伸缩操作,对于从VTR可变速度重放部分2输出的变速重放图象,为了进行高精度地同步,监视从声音数据连接部分11输出的已连接信息和从VTR可变速度重放部分2输出的变速重放图象的时刻信息(数据长度和CTL等信息),适当修正伸缩倍率,以便不累积这些偏差的方法。
此外,在连接顺序生成部分10的连接顺序决定部分中,作为进行时间信息监视的方法,可考虑按图3所示的结构进行。就是说,利用输入数据长度监视部分21,常时地计算从块存储部分7输出的块单位长度,求出输入数据长度leng_in,同时利用输出数据目标长度运算部分22,根据输入数据长度leng_in和从VTR可变速度重放部分2输出的可变速度比r,计算伸缩倍率(反倍率)1/r,求出输出数据目标长度target(target=leng_in/r)。此外,与此同时,利用输出数据监视部分23,根据从声音数据连接部分11输出的已连接信息,求出输出数据长度leng_out。然后,利用比较部分24,求出这些输出数据目标长度target与输出数据长度leng_out的差t(t=target-leng_out),把该差供给声音数据连接部分11。
而且,在连接顺序生成部分10的连接顺序决定部分中,作为连接顺序的生成方法,使用图4、图5模式图所示的方法。
首先,在操作附加声音的VTR可变速度重放装置1,把重放速度设定为‘慢速’的情况下,在有声音区间、无声音区间、无音区间顺序交替出现的声音信号被输入状态下,根据从声音数据连接部分11输出的已连接信息,检测出声音数据属性已被替换,或者,VTR可变速度重放部分2的重放速度变更、即使是相同属性,在检测出声音数据的伸缩倍率已变更时,判定连接顺序的生成工序的开始条件齐备,如图4(A)所示,把此时刻决定为开始时刻To
然后,以该开始时刻To为基准,从块数据存储部分7,对于声音数据连接部分11,求出把已经输出的声音数据的块长度全部相加的输入总和Si,同时如图4(A)所示,求出把已经连接的声音数据的块长度全部相加的输出总和So后,按这些输入总和Si、输出总和So、目标伸缩倍率R(R=1/r,但是R≥1.0)、最后连接的声音数据的块长度L满足下式(1)所示条件的定时,进行以下处理。
L/2<R·Si-So        …(1)
就是说,在最后连接的块后,从连接数据存储部分9输出的连接数据内,在置换、插入与最后连接的块对应的连接数据后,在最后连接的块内,再次重复连接比连接数据生成中使用部分靠后的部分,在该块后,生成表示依次连接残留块的连接顺序,把该连接顺序供给声音数据连接部分11。
由此,在图4(A)、(B)所示例中,按顺序连接从第一个块至第八个块的时刻,通过满足(1)式所示的条件,在第八个块后,置换、插入与该块(第八个块)对应的连接数据,在第八个块内,重复连接比在连接数据的生成中使用的部分靠后的部分。再有,在图4所示的例中,第四个块已被再次重复连接。
此外,在操作附加声音的VTR可变速度重放装置1,把重放速度设定为‘快速’的情况下,按下式(2)所示条件成立的定时,进行以下处理。
L/2<So-R·Si        …(2)
就是说,抽出最后要连接的块,在从连接数据存储部分9输出的连接数据中,连接用于连接该被抽出块之前和之后的块的连接数据,而且,在其后的块中,连接比在该连接数据生成中使用部分靠后的部分,然后,生成把顺序连接残留块的连接顺序,把该连接顺序供给声音数据连接部分11。
由此,在图5(A)、(B)所示的连接例中,按顺序连接从第一个块至第八个块的时刻,通过满足(2)式所示的条件,抽出第八个块后面要连接的第九个块,在第十个块中,连接比连接数据生成中使用部分靠后的部分。再有,在图5所示的例中,第四个块已被再次抽出。
此外,声音数据11把已经连接的声音数据等连接内容(已连接信息)供给连接顺序生成部分10,同时适当地修正伸缩倍率,以便使从该连接顺序生成部分10输出的差t变为零,并且根据从该连接顺序生成部分10输出的连接顺序,连接从块存储部分7输出的块单位的声音数据和从连接数据存储部分9输出的连接数据,把由此得到的一连串声音数据暂时缓冲,同时供给D/A转换部分12。
D/A转换部分12配有存储声音数据按FIFO形式输出的存储器,按预定的抽样速率从该存储器中读出声音数据,把该声音数据进行D/A转换,生成声音信号的D/A转换电路,取入从声音数据连接部分11输出的一连串声音数据,并缓冲该声音数据,同时进行D/A转换,生成声音信号,并输出该声音信号。
这样,在本实施例中,在控制VTR可变速度重放部分2,按与录音时不同的速度重放声音信号时,利用抽样频率转换部分4,把A/D转换时的抽样频率fi(Hz)与D/A转换时抽样频率fo(Hz)进行匹配,同时根据VTR可变速度重放部分2的可变速度比r和声音属性,通过把声音数据分割为有预定时间宽度的块单位,并依次插入或抽出,用VTR可变速度重放部分2使声音提示定时与可变速度重放的图象信号同步,以便输出没有音程变化的高品质的声音。因此,象1/2倍速重放或2倍速重放时那样,在可变速度的实际使用范围内,取入可变速度重放的音程变化的声音,保持声音的清晰度,同时在与图象高精度同步状态下,在±1八度音程左右的范围内,原样地恢复音程。
此外,在本实施例中,按相对于正规的重放速度的可变速度比r,在把从记录介质重放的声音信号按抽样频率fi经A/D转换得到的声音数据进行数字信号处理时,分析处理声音数据的属性,接着依据由该分析处理得到的信息,把声音数据分割为有预定时间宽度的块单位,按块单位依次进行插入处理或抽出处理,在进行把数据长达到1/r倍的一连串处理,作成声音数据后,按抽样频率fo把输出声音数据进行D/A转换,以便生成声音信号。因此,象1/2倍速重放或2倍速重放时那样,在可变速度的实际使用范围内,取入可变速度重放的音程变化的声音,保持声音的清晰度,同时在与图象高精度地同步状态下,可以使声音的连接部分最佳化,并且在±1八度音程左右的范围内,原样地恢复音程。
而且,在本实施例中,在从VTR可变速度重放部分2输出的声音信号的可变速度比r、把该声音信号进行A/D转换时使用的抽样频率fi和把声音数据进行D/A转换时使用的抽样频率fo满足fi/fo=r时,使用可达到fi=r·fo的抽样频率fi,此外,在可变速度比r为fi/fo≠r时,可使用包含抽样频率转换系数c的可达到fi=r·fo/c的抽样频率fi。在A/D转换部分3和块数据分割部分6(分析处理部分5)之间,相对于插入抽样频率转换部分6的以往使用的电路,仅附加很少的电路,象1/2倍速重放或2倍速重放时那样,在可变速度的实际使用范围内,取入可变速度重放的音程变化的声音,保持声音的清晰度,同时在与图象高精度地同步状态下,可以使声音的连接部分最佳化,并且在±1八度音程左右的范围内,原样地恢复音程。
而且,在本实施例中,在把从VTR可变速度重放部分2输出的声音信号按抽样频率fi经A/D转换得到的声音数据进行数字信号处理时,利用构成连接顺序生成部分10的输入数据长度监视部分21,常时地计算从块存储部分7输出的块单位的长度,求出输入数据长度leng_in,同时利用输出数据目标长度运算部分22,根据输入数据长度leng_in和从VTR可变速度重放部分2输出的可变速度比r,计算伸缩倍率(反倍率)1/r,求出输出数据目标长度target(target=leng_in/r)。此外,与此同时,利用输出数据监视部分23,根据从声音数据连接部分11输出的已连接信息,求出输出数据长度leng_out。然后,利用比较部分24,求出这些输出数据目标长度target与输出数据长度leng_out的差t(t=target-leng_out),把该差供给声音数据连接部分11,为了使该差t为零,可调整伸缩倍率。因此,象1/2倍速重放或2倍速重放时那样,在可变速度的实际使用范围内,取入可变速度重放的音程变化的声音,保持声音的清晰度,同时完全校正声音与图象的偏差,在与图象高精度地同步的状态下,可以使声音的连接部分最佳化,并且在±1八度音程左右的范围内,原样地恢复音程。
再有,在上述实施例中,利用连接顺序生成部分10,求出输出数据目标长度target与输出数据长度leng_out的差t(t=target-leng_out),在声音数据连接部分11中,必须适当地修正控制伸缩倍率,以便差t变为零,但也可以把从VTR可变速度重放部分2输出的时刻信息直接反馈给声音数据连接部分11,以便使图象定时与声音定时一致,并可控制伸缩倍率。
此外,在上述实施例中,必须使A/D转换部分3中使用的抽样频率fi、D/A转换部分12的抽样频率fo和可变速度比r成为预定关系地决定各抽样频率fi的频率,但为了确保此时地面上TV广播或卫星广播A模式的频带宽度(15kHz),也可以把D/A转换的抽样频率fo固定在32kHz。同样,不管VTR可变速度重放装置的重放速度如何,为了固定输出声音的频带宽度,最好固定D/A转换的抽样频率fo
而且,在上述实施例中,由于仅对声音部分进行伸缩处理、音程调整处理等,所以也可以使用本发明的主要部分,依据专业用VTR装置的统一格式构成控制接口,把该控制接口附加在原有的工作VTR装置上,以便进行上述音程的复原处理。
因此,即使采用目前使用的VTR装置的记录重放方式,例如高清晰度方式、NTSC方式等的VTR装置,无论哪种机型,例如HDD-1000、D5-VTR等机型,都可以获得上述实施例的效果。
工业上的利用可能性
按照以上说明的本发明,象1/2倍速重放或2倍速重放时那样,在可变速度的实际使用范围内,能够取入可变速度重放的音程变化的声音,保持声音的清晰度,同时在与图象高精度同步状态下,使声音的连接部分最佳化,并且在±1八度音程左右的范围内,原样地恢复音程。
此外,相对以往使用的电路来说,可以仅附加几个电路的简单结构来实现装置。

Claims (11)

1.一种声音处理方法,当以与在记录介质上记录声音信号时的速度不同的重放速度重放所述记录介质上的声音信号时,调整被重放的声音信号的音程,其特征在于,按相对于正规的重放速度的可变速度比r,设定各抽样频率fi、fo,以便使从所述记录介质重放的声音信号经A/D转换变为声音数据时的抽样频率fi、把所述声音数据进行数字信号处理后经D/A转换变为声音信号时的抽样频率fo、以及所述可变速度比r满足预定的条件。
2.如权利要求1所述的声音处理方法,其特征在于,按所述可变速度比r,在对把从所述记录介质所重放的声音信号按抽样频率fi进行A/D转换而得到的声音数据进行数字信号处理时,分析处理所述声音数据的属性,然后根据按该分析处理得到的信息,把所述声音数据分割为有预定时间宽度的块(block)单位,用块单位对所述声音数据依次进行插补处理或抽去处理,进行使其数据长度依次达到1/r倍的一连串处理,而割成输出声音数据,然后,按所述抽样频率fo将所述输出声音数据进行D/A转换,生成声音信号。
3.如权利要求1所述的声音处理方法,其特征在于,作为所述预定条件,在所述各抽样频率fi、fo和所述可变速度比r满足fi/fo=r时,使用可达到fi=r·fo的抽样频率fi,而在所述各抽样频率fi、fo和所述可变速度比r为fi/fo≠r时,使用包含抽样频率转换系数c的可达到fi=r·fo/c的抽样频率fi
4.如权利要求2所述的声音处理方法,,其特征在于,作为所述预定条件,当所述各抽样频率fi、fo和所述可变速度比r满足fi/fo=r时,使用可达到fi=r·fo的抽样频率fi,而在所述各抽样频率fi、fo和所述可变速度比r为fi/fo≠r时,使用包含抽样频率转换系数c的可达到fi=r·fo/c的抽样频率fi
5.如权利要求4所述的声音处理方法,其特征在于,按所述可变速度比r,在对把从所述记录介质重放的声音信号按抽样频率fi进行A/D转换而得到的声音数据进行数字信号处理时,监视从所述记录介质所读出的声音信号的时刻信息和经所述一连串处理得到的输出声音数据的时刻信息,校正在所述声音信号和所述输出声音数据之间产生的时间偏差。
6.一种声音处理装置,当以与在记录介质中记录声音信号时的速度不同的重放速度重放所述记录介质上的声音信号时,调整被重放的声音信号的音程,其特征在于,该装置包括:
A/D转换装置(3),把从所述记录介质所重放的声音信号按抽样频率fi进行A/D转换;
分析处理装置(5),对A/D转换得到的声音数据根据属性进行分析处理;
块数据分割装置(6),根据由该分析处理得到的信息,将所述声音数据分割为有预定时间宽度的块单位;
输出声音数据制作装置(11),按分割的块单位将所述声音数据依次进行插补处理或抽去处理,进行使其数据长度达到1/r倍的一连串处理,作成输出声音数据;
声音输出装置(12),把作成的输出声音数据按抽样频率fo进行D/A转换,输出与图象同步的声音;
抽样频率设定装置,设定各抽样频率fi、fo,以使所述A/D转换时的抽样频率fi、把所述声音数据经D/A转换变为声音信号时的抽样频率fo、所述可变速度比r能够满足预定的条件。
7.如权利要求6所述的声音处理装置,其特征在于,作为由所述抽样频率设定装置所设定的预定条件,在所述各抽样频率fi、fo和所述可变速度比r满足fi/fo=r时,使用可达到fi=r·fo的抽样频率fi,而在所述各抽样频率fi、fo和所述可变速度比r为fi/fo≠r时,使用包含抽样频率转换系数c的可达到fi=r·fo/c的抽样频率fi
8.如权利要求7所述的声音处理装置,其特征在于,所述输出声音数据制作装置(11)包括监视从所述记录介质读出的声音信号的时刻信息和经所述一连串处理得到的输出声音数据的时刻信息,来校正在所述声音信号和所述输出声音数据之间产生的时间偏差的装置。
9.一种记录重放装置,其特征在于,包括权利要求6所述的声音处理装置。
10.一种记录重放装置,其特征在于,包括权利要求7所述的声音处理装置。
11.一种记录重放装置,其特征在于,包括权利要求8所述的声音处理装置。
CN98801333A 1997-09-12 1998-09-01 声音处理方法、声音处理装置和记录重放装置 Expired - Lifetime CN1125459C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP249220/97 1997-09-12
JP249220/1997 1997-09-12
JP09249220A JP3073942B2 (ja) 1997-09-12 1997-09-12 音声処理方法、音声処理装置および記録再生装置

Publications (2)

Publication Number Publication Date
CN1239571A true CN1239571A (zh) 1999-12-22
CN1125459C CN1125459C (zh) 2003-10-22

Family

ID=17189712

Family Applications (1)

Application Number Title Priority Date Filing Date
CN98801333A Expired - Lifetime CN1125459C (zh) 1997-09-12 1998-09-01 声音处理方法、声音处理装置和记录重放装置

Country Status (10)

Country Link
US (1) US6360198B1 (zh)
EP (1) EP0939401B1 (zh)
JP (1) JP3073942B2 (zh)
KR (1) KR100303913B1 (zh)
CN (1) CN1125459C (zh)
CA (1) CA2271463C (zh)
DE (1) DE69836472T2 (zh)
DK (1) DK0939401T3 (zh)
NO (1) NO324336B1 (zh)
WO (1) WO1999014751A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109587543A (zh) * 2018-12-27 2019-04-05 秒针信息技术有限公司 音频同步方法和装置及存储介质
CN113490043A (zh) * 2021-09-08 2021-10-08 北京百瑞互联技术有限公司 一种蓝牙音频数据处理方法、装置、介质及设备

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000082260A (ja) * 1998-09-04 2000-03-21 Sony Corp オーディオ信号再生装置及び方法
JP4596197B2 (ja) * 2000-08-02 2010-12-08 ソニー株式会社 ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
TW525146B (en) * 2000-09-22 2003-03-21 Matsushita Electric Ind Co Ltd Method and apparatus for shifting pitch of acoustic signals
US7809241B2 (en) 2002-03-01 2010-10-05 Thomson Licensing Audio frequency scaling during video trick modes utilizing digital signal processing
US8214216B2 (en) * 2003-06-05 2012-07-03 Kabushiki Kaisha Kenwood Speech synthesis for synthesizing missing parts
JP2006243128A (ja) * 2005-03-01 2006-09-14 Matsushita Electric Ind Co Ltd 再生装置及び再生方法
US7664558B2 (en) * 2005-04-01 2010-02-16 Apple Inc. Efficient techniques for modifying audio playback rates
EP1739676A1 (en) * 2005-06-29 2007-01-03 Hitachi, Ltd. Digital broadcasting receiving device and digital information receiving device, and playback method
JP2007114840A (ja) * 2005-10-18 2007-05-10 Nec Electronics Corp データ同期装置及びそのデータ同期方法
TWI314015B (en) * 2005-10-28 2009-08-21 Novatek Microelectronics Corp Digital audio/video playback system capable of controlling audio and video playback speed
KR100735417B1 (ko) * 2006-01-24 2007-07-04 삼성전자주식회사 음성 신호에서의 피크 특징 추출이 가능한 윈도우를정렬하는 방법 및 그 시스템
KR100667370B1 (ko) * 2006-02-23 2007-01-12 충남대학교산학협력단 핫멜트 블로운 점착방식 기능성 복합필터 제조장치
US7643820B2 (en) * 2006-04-07 2010-01-05 Motorola, Inc. Method and device for restricted access contact information datum
US8145490B2 (en) * 2007-10-24 2012-03-27 Nuance Communications, Inc. Predicting a resultant attribute of a text file before it has been converted into an audio file
JP4924513B2 (ja) * 2008-03-31 2012-04-25 ブラザー工業株式会社 タイムストレッチシステムおよびプログラム
EP3349213B1 (en) * 2012-02-16 2020-07-01 BlackBerry Limited System and method for noise estimation with music detection
US10726851B2 (en) * 2017-08-31 2020-07-28 Sony Interactive Entertainment Inc. Low latency audio stream acceleration by selectively dropping and blending audio blocks
KR20220106295A (ko) 2021-01-22 2022-07-29 엘지전자 주식회사 집진 필터

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4586191A (en) * 1981-08-19 1986-04-29 Sanyo Electric Co., Ltd. Sound signal processing apparatus
DE3484901D1 (de) * 1983-09-09 1991-09-12 Sony Corp Wiedergabevorrichtung fuer audiosignal.
US4734495A (en) 1985-07-17 1988-03-29 President And Fellows Of Harvard College Process and intermediates for beta-lactam antibiotics
IL84902A (en) * 1987-12-21 1991-12-15 D S P Group Israel Ltd Digital autocorrelation system for detecting speech in noisy audio signal
US5583652A (en) * 1994-04-28 1996-12-10 International Business Machines Corporation Synchronized, variable-speed playback of digitally recorded audio and video
JPH0896514A (ja) * 1994-07-28 1996-04-12 Sony Corp オーディオ信号処理装置
EP0702354A1 (en) * 1994-09-14 1996-03-20 Matsushita Electric Industrial Co., Ltd. Apparatus for modifying the time scale modification of speech
US5828995A (en) * 1995-02-28 1998-10-27 Motorola, Inc. Method and apparatus for intelligible fast forward and reverse playback of time-scale compressed voice messages
US5842172A (en) * 1995-04-21 1998-11-24 Tensortech Corporation Method and apparatus for modifying the play time of digital audio tracks
US5806023A (en) * 1996-02-23 1998-09-08 Motorola, Inc. Method and apparatus for time-scale modification of a signal
US5828994A (en) * 1996-06-05 1998-10-27 Interval Research Corporation Non-uniform time scale modification of recorded audio

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109587543A (zh) * 2018-12-27 2019-04-05 秒针信息技术有限公司 音频同步方法和装置及存储介质
CN109587543B (zh) * 2018-12-27 2021-04-02 秒针信息技术有限公司 音频同步方法和装置及存储介质
CN113490043A (zh) * 2021-09-08 2021-10-08 北京百瑞互联技术有限公司 一种蓝牙音频数据处理方法、装置、介质及设备

Also Published As

Publication number Publication date
NO992283D0 (no) 1999-05-11
DK0939401T3 (da) 2007-04-02
CA2271463A1 (en) 1999-03-25
NO324336B1 (no) 2007-09-24
KR20000068955A (ko) 2000-11-25
JPH1186448A (ja) 1999-03-30
DE69836472D1 (de) 2007-01-04
KR100303913B1 (ko) 2001-09-29
CA2271463C (en) 2002-01-15
JP3073942B2 (ja) 2000-08-07
EP0939401A4 (en) 2000-07-19
NO992283L (no) 1999-06-14
EP0939401A1 (en) 1999-09-01
US6360198B1 (en) 2002-03-19
WO1999014751A1 (fr) 1999-03-25
EP0939401B1 (en) 2006-11-22
DE69836472T2 (de) 2007-03-15
CN1125459C (zh) 2003-10-22

Similar Documents

Publication Publication Date Title
CN1125459C (zh) 声音处理方法、声音处理装置和记录重放装置
CN102387292B (zh) 运动图像处理装置、运动图像再现装置、运动图像处理方法及运动图像再现方法
US8606079B2 (en) Recording apparatus, recording method, reproduction apparatus, reproduction method, recording and reproduction apparatus, recording and reproduction method, image capturing and recording apparatus, and image capturing and recording method
CN1359231A (zh) 快速或慢速重放模式下不造成音调变化的音频信号重现方法及其重现装置
CN100464578C (zh) 用于以高质量的可变速度播放视听媒体的系统和方法
CN100372376C (zh) 信号记录/再现装置和记录/再现方法、信号再现装置和再现方法
CN101039440A (zh) 用于数字屏幕广告的视频文件创建系统
CN106886178A (zh) 一种基于音频匹配的动感座椅同步控制方法及系统
US20210390937A1 (en) System And Method Generating Synchronized Reactive Video Stream From Auditory Input
JP4432823B2 (ja) 特定条件区間検出装置および特定条件区間検出方法
CN1131864A (zh) 数字视频记录器
US8538244B2 (en) Recording/reproduction apparatus and recording/reproduction method
JP4760786B2 (ja) 映像音声符号化データ編集装置
US8059167B2 (en) Shooting apparatus and shooting method, and program
CN2711852Y (zh) 演奏信息再现设备
CN1122219C (zh) 内插电路和配有该电路的重放设备或存储设备及其内插法
JP3947352B2 (ja) 再生装置
JP2010066675A (ja) 音声情報処理システム及び音声情報処理プログラム
JP5223948B2 (ja) 電子機器
JP4648183B2 (ja) 連続メディアデータ短縮再生方法、複合メディアデータ短縮再生方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
KR100697854B1 (ko) 멀티미디어 정보 제공 및 재생 시스템 및 이의 멀티미디어정보 제공 및 재생 방법
JP2005204003A (ja) 連続メディアデータ高速再生方法、複合メディアデータ高速再生方法、多チャンネル連続メディアデータ高速再生方法、映像データ高速再生方法、連続メディアデータ高速再生装置、複合メディアデータ高速再生装置、多チャンネル連続メディアデータ高速再生装置、映像データ高速再生装置、プログラム、および、記録媒体
JPH08320940A (ja) 複合情報処理装置
TW200403634A (en) Digital content separation method
CN103763457A (zh) 自动调节信号同步的电视接收机及其调节方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20031022

CX01 Expiry of patent term