CN1413347A - 对拼接的不连续音频流进行平滑的方法和装置 - Google Patents

对拼接的不连续音频流进行平滑的方法和装置 Download PDF

Info

Publication number
CN1413347A
CN1413347A CN 00817682 CN00817682A CN1413347A CN 1413347 A CN1413347 A CN 1413347A CN 00817682 CN00817682 CN 00817682 CN 00817682 A CN00817682 A CN 00817682A CN 1413347 A CN1413347 A CN 1413347A
Authority
CN
China
Prior art keywords
value
audio sample
sample sequence
audio
transition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 00817682
Other languages
English (en)
Inventor
史密斯·弗雷曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sarnoff Corp
Original Assignee
Sarnoff Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sarnoff Corp filed Critical Sarnoff Corp
Publication of CN1413347A publication Critical patent/CN1413347A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/038Cross-faders therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

在一个实施例中,基于第一音频采样序列的最终采样的捕获值和所接收的第二音频采样序列的多个采样,可以生成多个过渡音频采样值。至少部分地基于第二音频采样序列的相应采样,可以生成每一个过渡音频采样值。每一个过渡音频采样值能够表示所捕获的最终采样值,并用在该最终采样值和第二音频采样序列的相应采样值之间的一个变化的加权差值进行调整。该变化的加权差值可以基于一个变化加权函数,该加权函数从0值增加到1值,使得第一过渡音频采样值的生成是基于具有0值的变化加权函数,随后的每一个过渡音频采样值的生成是基于具有逐渐增大的值的变化加权函数,直到最终过渡音频采样值的生成是基于具有1值的变化加权函数为止。

Description

对拼接的不连续音频流进行平滑的方法和装置
发明领域
本发明的实施例涉及采样音频流的平滑。更具体地说,本发明的实施例涉及对拼接音频流之不连续性进行平滑。
本发明的背景技术
在已知的数字音频系统中,误差掩蔽和音频视频(AV)同步能够要求拼接不连续的音频采样序列。在一系列音频采样序列的传输中的误差可能导致音频采样序列的丢失。补偿音频采样序列丢失的已知方法和装置包含:复制一个相邻的音频采样序列(例如,在前面的音频采样序列,随后的音频采样序列,等等)。这种方法和装置能够产生一个不连续的音频流,它能够导致砰然声和卡搭声,除非该不连续性被平滑。
图1显示了一系列已知的音频采样序列,例如,第一块101、第二块102、第三块103。每个音频采样序列能够包含100毫秒(msecs)的采样音频数据,其中该采样音频数据具有一个在时间期间内变化的音频值(例如,分贝(dB)等)。该音频值从第一块101到第二块102到第三块103是连续的。图2说明了用于补偿一个音频采样序列丢失的已知方法。当丢失的音频序列是第二块102时,第一块101能够被复制并且代替丢失的第二块102,从而使得一个复制的第一块202位于第一块101和和第三块103之间。这种复制和代替不利的是能够在音频流中产生不连续性,例如,在从第一块101到复制的第一块202的音频流中的不连续性,从复制的第一块202到第三块103的不连续性。
图3显示了一种用于连接不连续的音频采样序列的已知方法的一个说明。该已知的方法包含:向下倾斜一个在前的序列到零,并且从零向上倾斜随后的序列。图3显示了第一块301的后沿正向下倾斜到零,而且复制的第一块302的前沿正从零向上倾斜。类似地,复制的第一块302的后沿向下倾斜到零,而且第三块303的前沿从零向上倾斜。这种方法具有以下缺点:(1)要求足够快速地标识倾斜到零以把前面序列向下倾斜到零的需要;以及(2)向下倾斜到零和从零上升返回不是音频采样序列拼接流的一个可获得的最低失真。
根据以上所述,人们可以认识到,非常需要实现这样的方法和装置,即这些方法和装置能够有利地平滑拼接的不连续音频流。
发明概述
在一个实施例中,基于第一音频采样序列的最终采样的一个捕获值和所接收的第二音频采样序列的多个采样,可以生成多个过渡(transition)音频采样值。至少部分地基于第二音频采样序列的相应采样,可以生成每一个过渡音频采样值。每一个过渡音频采样值能够表示所捕获的最终采样值,并用在该最终采样值与第二音频采样序列的相应采样值之间的一个变化的加权差值来调整。该变化的加权差值可以基于一个变化加权函数,该函数从0值增加到1值,从而使得第一过渡音频采样值的生成是基于具有零值的变化加权函数,每个随后的过渡音频采样值的生成是基于具有逐渐增大的值的变化加权函数,直到最终的过渡音频采样值的生成是基于具有等于1值的变化加权函数为止。
附图简要说明
图1示出一系列已知的音频采样序列。
图2示出用于补偿一个音频采样序列之丢失的一种已知方法。
图3示出连接不连续的音频采样序列的一种已知方法的例图。
图4是依据本发明一个实施例、用于平滑一个拼接的不连续音频流的一种方法的例图。
图5显示了依据本发明一个实施例的一个装置。
图6显示了依据本发明另一个实施例的一个装置。
图7说明了依据本发明另一个实施例的一种方法。
图8显示了依据本发明另一个实施例的一个装置。
图9显示了依据本发明另一个实施例的一个装置。
详细说明
下面描述的方法和装置的实施例用于平滑拼接的音频流的不连续性。在下面的描述中,为了说明起见,阐述了大量细节以便提供对本发明的全面了解。然而,本领域技术人员将会理解的是,没有这些细节也可以实现本发明。在其它情况下,结构和设备用方框图的形式被示出。此外,本领域技术人员能够容易地理解:其中体现和执行了方法的特定序列是说明性的,所预期的是,这些序列能够进行变化并且仍然在本发明的精神和范围之内。
图4是依据本发明一个实施例、用于平滑一个拼接的不连续音频流的一种方法的例图。第一块403和复制的第一块402能够包含一个音频流的一系列音频采样序列,它们具有随时间变化的值s(t)。第一块403和复制的块402中每一个都能够包含100毫秒的音频采样。第一块403的音频采样的音频值能够这样变化,从而使得在t=0时音频值大约为40dB,而在t=100时音频值大约为60dB。第一块403和复制的第一块402能够在一个连接点(例如,在t=100毫秒时)被连接,从而使得在t=100左右的s(t)值中存在一个不连续点。由于在连接第一块403到复制的第一块402中的不连续性,所以在该连接点处(例如,t=100毫秒左右),s(t)的值能够从大约60dB下降到40dB。
为了平滑在第一块403和复制的第一块402之间在连接之后的不连续点,一个过渡输出音频值能够基于在s(t)和音频采样的一个延迟序列s(t-x)之间的插值。在一个实施例中,采用了一种插值法,它用一个基于s(t-x)+f(t)*[s(t)-s(t-x)]的输出代替一个采样流s(t),其中f(t)是一个从0到1平滑增加的函数。s(t-x)能够表示采样流s(t)的一个延迟形式,其中x是一段时间(例如,若干毫秒的时间间隔,多个采样周期,等)。
如图4所示,s(t)在t=100时具有一个大约60dB的值。在t=100之后s(t)立即具有一个大约40 dB的值。截至并且包含100时,输出信号能够具有一个基于s(t)的值。在t=100之后的一个连接点过渡周期例如四毫秒期间,输出的值能够基于s(t-x)+f(t)*[s(t)-s(t-x)],其中f(t)是一个从0到1平滑增加的函数,且x=4毫秒。线410显示了从t=100之后到t=104的一个延迟的采样流信号s(t-4)。曲线411显示了s(t-x)+f(t)*[s(t)-s(t-x)]随时间变化的值,其中f(t)是一个从0到1平滑增加的函数(例如,f(100)=0,f(101)=.25,f(102)=.50,f(103)=.75,f(104)=1.0,等),且x=4毫秒。
图5显示了依据本发明一个实施例的一个装置。一个多路复用器450能够在标准输出S451和过渡输出T452之间做出选择以提供输出o(t)。在一个实施例中的采样流s(t)被传递到标准输出S451。s(t)能够被传递到延迟402以输出一个延迟了的采样流s(t-x),其中x可以是一段时间(例如,4毫秒,一个或多个采样周期,等等)。减法器403能够输出s(t)和s(t-x)之间的差值,例如s(t)-s(t-x)。乘法器404能够输出f(t)与减法器403之输出的乘积,其中f(t)是一个在一段时间内能够从0到1平滑增加的函数。加法器405能够输出乘法器404和延迟402的输出的总和,从而使得一个过渡输出信号s(t-x)+f(t)*[s(t)-s(t-x)]被传递到过渡输出T452。
在典型操作期间(例如,当没有复制的音频采样序列被拼接成为采样流以代替一个丢失的音频采样序列时,等等),多路复用器450能够选择出现于标准输出S451处的采样流s(t)作为输出o(t)。当一个复制的音频采样序列被拼接成为采样流时,多路复用器450能够在一个过渡时期内选择过渡输出T452,以平滑在拼接的音频采样序列之间的不连续性。在过渡时期之后,多路复用器451能够选择出现于标准输出S451处的采样流s(t)作为输出o(t)。
例如,参见图4和5,多路复用器450能够在0≤t≤100时期内,通过输出出现在标准输出S451处的信号,输出s(t)作为输出o(t)。在t=100之后,多路复用器450能够在100<t≤104期间,通过输出出现在过渡输出T452处的信号,输出过渡输出信号s(t-x)+f(t)*[s(t)-s(t-x)]作为输出o(t)。在t=104之后,多路复用器450能够通过输出出现在标准输出S451处的信号,再次输出s(t)作为输出o(t)。
图6显示了依据本发明另一个实施例的一个装置。一个多路复用器550能够在标准输出S551、第一过渡输出T1 552、和第二过渡输出T2 553之间做出选择以提供输出o(t)。依据图6所示的实施例,函数f(t)可以是一个具有在零和二分之一之间的动态范围的函数。在一个实施例中,f(t)平滑地从零增加到二分之一,然后从二分之一平滑地减少到零。
在一个实施例中,采样流s(t)被传递到标准输出S551。s(t)能够被传递到延迟502以输出一个延迟了的采样流s(t-x),其中x可以是一段时间(例如,4毫秒,一个或多个采样周期,等等)。减法器503能够输出s(t)与s(t-x)之间的差值,例如s(t)-s(t-x)。乘法器504能够输出f(t)和减法器503之输出的乘积,其中f(t)是一个在一段时间内能够从零增加到二分之一、然后从二分之一减少到零的函数。加法器505能够输出乘法器504和延迟502的输出的总和,从而使得一个第一过渡输出信号s(t-x)+f(t)*[s(t)-s(t-x)]被传递到第一过渡输出T1 552。
减法器513能够输出在s(t-x)和s(t)之间的差值,例如s(t-x)-s(t)。乘法器514能够输出f(t)和减法器513之输出的乘积,其中f(t)是一个在一段时间内能够从零增加到二分之一、然后从二分之一减少到零的函数。加法器515能够输出s(t)和乘法器514的输出的总和,从而使得一个第二过渡输出信号s(t)+f(t)*[s(t-x)-s(t)]被传递到第二过渡输出T2 553。
在典型操作期间(例如,当没有复制的音频采样序列被拼接到采样流中以代替一个丢失的音频采样序列时,等等),多路复用器550能够选择出现于标准输出S551处的采样流s(t)作为输出o(t)。当一个复制的音频采样序列被拼接到采样流中时,多路复用器550能够在一个过渡时期的第一半期间内选择出现于第一过渡输出T1处的第一过渡输出信号s(t-x)+f(t)*[s(t)-s(t-x)]作为输出o(t)。第一半的过渡时期能够与f(t)从零平滑增加到二分之一的时期重合。在第一半过渡时期之后,多路复用器550能够在第二半过渡时期期间内选择出现于第二过渡输出T2 553处的第二过渡输出信号s(t)+f(t)*[s(t-x)-s(t)]作为输出o(t)。第二半过渡时期能够与f(t)从二分之一平滑下降到零的期间重合。在过渡时期之后,多路复用器550能够选择出现于标准输出S551处的采样流s(t)作为输出o(t)。
图7说明了依据本发明另一个实施例的一种方法。一个音频流能够包含一系列音频采样序列,而且第一块703和复制的第一块702能够被拼接在一起。第一块703和复制的第一块702中每一块都可以是一个音频采样序列。在音频值s(t)中的不连续性可以存在于在第一块703和复制的第一块702之间的连接点处。为了平滑在s(t)中的不连续性,在该连接后,多个过渡音频采样值能够基于在s(t)和在该连接点处s(t)的值(即,s(tjuncture))之间的插值。
在一个实施例中,基于第一音频采样序列的一个最终采样的一个捕获值和所接收的第二音频采样序列的多个采样,可以生成多个过渡音频采样值。每个过渡音频采样值能够至少部分地基于第二音频采样序列的一个相应采样而生成。每个过渡音频采样值能够表示所捕获的最终采样值,并用在该最终采样值和第二音频采样序列中相应采样值之间一个变化的加权差值来调整。该变化的加权差值能够基于一个变化加权函数,该加权函数从0值增加到1值,从而使得第一过渡音频采样值的生成是基于具有0值的变化加权函数,随后的每个过渡音频采样值的生成是基于具有逐渐增大的值的变化加权函数,直到最终过渡音频采样值的生成是基于具有1值的变化加权函数为止。
在另一个实施例中,采用了一种插值法,它用一个基于s(tjuncture)-f(t)*[s(t)-s(tjuncture)]的输出代替采样流s(t),其中f(t)是一个从0到1平滑增加的函数。如图7所示,s(t)在t=100时具有一个大约60dB的值。在t=100之后s(t)立即具有一个大约40dB的值。截至并且包含t=100时,输出信号能够具有基于s(t)的值。在t=100之后的一个连接点过渡时期例如四毫秒期间内,输出的值能够基于s(tjuncture)+f(t)*[s(t)-s(tjuncture)],其中s(tjuncture)是对应于第一块703的最终采样的s(t)值,而f(t)是一个从0到1平滑增加的函数。线710显示从t=100到t=104的s(tjuncture)的值。曲线711显示了s(tjuncture)+f(t)*[s(t)-s(tjuncture)]之随时间变化的值,其中f(t)是一个从0到1平滑增加的函数(例如f(100)=0,f(101)=.25,f(102)=.50,f(103)=.75,f(104)=1.0,等)。在本发明的另一个实施例中,f(t)从0增加到1如下:0,.125,25,.50,1。本领域技术人员能够理解f(t)之不同实施例,这些实施例是基于在过渡时期的长度差别、从0到1的增长率差别、从0到1增加的平滑性中的差别、在实现f(t)的逻辑中的差别等等。
图8显示了依据本发明另一个实施例的一个装置。一个多路复用器850能够在标准输出S851和过渡输出T852之间做出选择以提供输出o(t)。在一个实施例中,采样流s(t)被传递到标准输出S851,s(t)能够被传递到寄存器802,它能够存储在恰好在连接点之前的最终音频采样值、即s(tjuncture)。在一个实施例中,寄存器802是一个锁存寄存器。减法器803能够输出在s(t)和s(tjuncture)之间的差值,例如s(t)-s(tjuncture)。乘法器804能够输出f(t)和减法器803之输出的乘积,其中f(t)是一个在一段时间内能够从0到1平滑变化的函数。加法器805能够输出乘法器804和寄存器802的输出的总和,从而使得一个过渡输出信号s(tjuncture)+f(t)*[s(t)-s(tjuncture)]被传递到过渡输出T852。在典型操作期间(例如,当没有复制的音频采样序列被拼接到采样流中以代替一个丢失的音频采样序列时,等等),多路复用器850能够选择出现于标准输出S851处的采样流s(t)作为输出o(t)。当一个复制的音频采样序列被拼接到采样流中时,多路复用器850能够在一个过渡时期内选择出现于过渡输出T852处的过渡输出信号s(tjuncture)+f(t)*[s(t)-s(tjuncture)],以平滑在拼接的音频采样序列之间的不连续性。在过渡时期之后,多路复用器850能够选择出现于标准输出S851处的采样流s(t)作为输出o(t)。
例如,参见图7和8,通过输出出现在标准输出S851处的信号,多路复用器850能够输出s(t)作为在0≤t≤100期间内的输出o(t)。在t=100之后,多路复用器850能够在100<t≤104期间通过输出出现在过渡输出T852处的信号,输出过渡输出信号s(tjuncture)+f(t)*[s(t)-s(tjuncture)]作为输出o(t)。在t=104之后多路复用器850能够通过输出出现在标准输出S851处的信号,再次输出s(t)作为输出o(t)。
图9显示了依据本发明另一个实施例的一个装置。一个输出多路复用器950能够在标准输出S951和过渡输出T952之间做出选择以提供输出o(t)。依据图9所示的实施例,函数f(t)可以是一个具有在零和二分之一之问的动态范围的函数。在一个实施例中,f(t)从零到二分之一平滑地增加,然后从二分之一到零平滑地减少。
在一个实施例中,采样流s(t)被传递到标准输出S951。s(t)能够被传递到寄存器902,它能够存储在恰好在连接点之前的最终音频采样值、即s(tjuncture)。减法器903能够输出在s(t)和s(tjuncture)之间的差值,例如s(t)-s(tjuncture)。反相器911能够接收减法器903的输出并且使其反相,即反相器911能够输出s(tjuncture)-s(t)。
第一多路复用器921能够接收减法器903和反相器911的每一个输出,并且因此能够基于一个多路复用器控制信号m(t)有选择地输出s(t)-s(tjuncture)和S(tjuncture)-s(t)中的一个。m(t)的值能够至少部分地基于f(t)的值,当f(t)从零到二分之一平滑地增加时m(t)能够具有一个逻辑1的值(例如,5伏特,3.3伏特,2.5伏特等等),当f(t)从二分之一到零平滑地减少时,m(t)能够具有一个逻辑0的值(例如,大约零伏特,等等)。当f(t)从零到二分之一平滑地增加时,第一多路复用器922能够输出s(t)-s(tjuncture),而当f(t)从二分之一到零平滑地减少时,能够输出s(tjuncture)-s(t)。
乘法器904能够输出f(t)和第一多路复用器921之输出的乘积。第二多路复用器922能够基于多路复用器控制信号m(t)有选择地接收s(tjuncture)和s(t)中一个的输出。当f(t)从零到二分之一平滑地增加时,第二多路复用器922能够输出s(tjuncture),而当f(t)从二分之一到零平滑地减少时,能够输出s(t)。
加法器905能够输出乘法器904和第二多路复用器922的输出的总和。当f(t)从零到二分之一平滑地增加时,m(t)具有一个逻辑1的值,而且加法器905能够输出s(tjuncture)+f(t)*[s(t)-s(tjuncture)]。当f(t)从二分之一到零平滑地减少时,m(t)具有一个逻辑0的值,而且加法器905能够输出s(t)+f(t)*[s(tjuncture)-s(t)]。
在典型操作期间(例如,当没有复制的音频采样序列被拼接到采样流中以代替一个丢失的音频采样序列时,等等),多路复用器950能够选择出现于标准输出S951处的采样流s(t)作为输出o(t)。当一个复制的音频采样序列被拼接到采样流中时,多路复用器950能够在一个过渡时期的两个对半期间内选择出现于过渡输出T952处的过渡输出信号作为输出o(t)。过渡时期的第一半能够与以下这个时期一致,在该时期内f(t)从零到二分之一平滑地增加,而且m(t)具有一个逻辑1的值,而且出现于过渡输出T952处的过渡输出信号为s(tjuncture)+f(t)*[s(t)-s(tjuncture)]。过渡时期的第二半能够与以下这个时期一致,在该时期内f(t)从二分之一到零平滑地减少,m(t)具有一个逻辑0的值,而且出现于过渡输出T952处的过渡输出信号为s(t)+f(t)*[s(tjuncture)-s(t)]。
根据如上所述的实施例,通过用一个随时间变化的加权函数产生基于插值的输出信号,以及至少基于在具有不连续性的连接点之前的音频采样序列的最终采样产生一个参考值,在拼接的音频流中的不连续性被平滑了。例如,在一个实施例中,该插值至少部分地基于一个延迟的音频流s(t-x)。在本发明的另一个实施例中,该插值至少部分地基于在具有不连续性的连接点之前的音频采样序列的最后采样值。本领域技术人员能够理解的是,依据本发明的实施例能够使用其它的类似插值,例如,一个至少部分地基于在具有不连续性的连接点之前音频采样序列的最后四个采样之平均值的插值,一个至少部分地基于在具有不连续性的连接点之前音频采样序列的最终采样(例如,最后五个采样,采样的数目对应于过渡时期的长度,等)的平均值的插值,等。
本发明的实施例包含结合了这里所述的这些装置中至少一个、或者执行了这些方法中至少一个的系统。依据本发明的实施例的系统之示例包含:计算机的数字音频系统、电视机、高清晰度电视(HighDefinition television,HDTV)接收器/解码器、光盘(CD)播放器、数字通用光盘(DVD)播放器、便携式音频播放器、家庭立体声系统、数字无线电接收机等。
依据在此描述的本发明的实施例,被拼接的不连续音频流能够被平滑以避免听得见的噪声(例如,砰然声、卡嗒声等),而不必修改在具有不连续性的连接点之前的音频采样序列。在音频流中可能发生拼接的点能够被预先标识(例如,在一个复制的音频采样序列被插入到该音频流中时或者在此之后)。因此,在具有不连续性的连接点之前的音频采样序列的最后采样的值能够被捕获、存储、平均等。有利地是,依据本发明实施例的方法和装置可能不需要:在不连续点之前向下倾斜音频采样序列的要求被很快识别,以足以向下倾斜该在前的序列。此外,使该音频流向下倾斜到一个不连续点之后的音频采样序列的音频采样,能够减少音频采样序列的拼接流的失真。
依据本发明一个实施例,适于由一个处理器执行以实现依据本发明之实施例的一种方法的指令作为软件被存储在计算机可读介质上并被分发。计算机可读介质可以是适于存储数字信息的设备。例如,计算机可读介质包含便携式磁盘,诸如软盘;或者由犹他州罗依市的Iomega公司制造的Zip盘片;或者在用于分发软件的技术领域内已知的只读光盘存储器(CD-ROM)。计算机可读介质能够被分发给具有处理器的用户,其中该处理器适合于执行适于被执行的指令。术语“适于被执行”意味着:包含准备以其现有形式(例如,机器码)由处理器执行的、或者需要进一步处理(例如,编译、解密、或者提供访问代码,等)以准备由处理器执行的任何指令。
有利的是,本发明的实施例允许平滑一种拼接的不连续音频流。在不连续点之前的音频采样序列可以不需要被修改(例如,向下倾斜降至零,等)。在平滑不连续性的同时,可以提供音频流之降低的失真量。在一个实施例中,只有在不连续点之前的音频采样序列的最后采样需要被捕获。那个最后采样(例如,在发生拼接处的一个点)通常可以被容易地预先识别。
在上述详细说明中,已经结合具体的示范性实施例对依据本发明实施例的装置和方法进行了描述。因此,本说明书和附图应被认为是说明性的而不是限制性的。

Claims (11)

1.一种用于平滑音频流的第一音频采样序列和第二音频采样序列之间的不连续性的方法,包括:
捕获第一音频采样序列的最终采样值;
接收第二音频采样序列的多个采样;以及
产生在一个过渡时期内的多个过渡音频采样值,每一个过渡音频采样值的产生至少部分地基于该最终采样值,并用在该最终采样值和第二音频采样序列的相应采样值之间的一个变化的加权差值进行调整,每一个变化的加权差值至少部分地基于一个变化加权函数,该函数在该过渡时期内从0值增加到1值。
2.如权利要求1所述的方法,进一步包括:
接收第一音频采样序列;
复制第一音频采样序列;以及
把该第一音频采样序列的副本拼接到该音频流中并作为第二音频采样序列,并且将其拼接到紧接在第一音频采样序列之后的位置中。
3.如权利要求2所述的方法,进一步包括:识别在第一音频采样序列和第二音频采样序列之间的不连续性。
4.如权利要求1所述的方法,其中,产生多个过渡音频采样值是基于:计算s(tjuncture)+f(t)*[s(t)-s(tjuncture)],s(tjuncture)表示第一音频采样序列的最终采样值,f(t)表示一个从0增加到1的函数,s(t)表示第二音频采样序列的多个采样。
5.如权利要求1所述的方法,其中,产生多个过渡音频采样值包括:
确定多个加权值,该多个加权值的值从0值增加到1值,并包括一个第一加权值和一个第二加权值,该第二加权值具有一个比该第一加权值大的值;
确定一个第一过渡音频采样值,该确定是至少部分地基于向最终音频采样值增加一个第一乘积,该第一乘积是第一加权值和在该最终音频值与第一音频采样值之间的第一差值的乘积,该第一差值至少部分地基于从该第一音频采样值中减去该最终音频采样值;以及
确定一个第二过渡音频采样值,该确定是至少部分地基于向最终音频采样值增加一个第二乘积,该第二乘积是第二加权值和在该最终音频值与第二音频采样值之间的第二差值的乘积,该第二差值至少部分地基于从该第一音频采样值中减去该最终音频采样值。
6.一种用于平滑音频流的第一音频采样序列和第二音频采样序列之间的不连续性的方法,包括:
根据第一音频采样序列的多个终止采样,确定一个参考值;
接收第二音频采样序列的多个采样;以及
产生在一段时间内的多个过渡音频采样值,
每个过渡音频采样值至少部分地基于该参考值,并用在该参考值和第二音频采样序列的相应采样值之间的一个变化的加权差值进行调整。
7.一种用于平滑音频流的第一音频采样序列和第二音频采样序列之间的不连续性的方法,包括:
产生一个延迟的第一音频采样序列,该延迟的第一音频采样序列包括多个延迟的第一音频采样值;
接收第二音频采样序列的多个采样;以及
产生多个过渡音频采样值,每个过渡音频采样值是为第二音频采样序列的该多个采样的一个相应采样而被产生的,每个过渡音频采样值表示一个延迟的第一音频采样值,并用在该延迟的第一音频采样值与第二音频采样序列的该相应采样值之间的一个变化的加权差值进行调整。
8.一种用于平滑音频流的第一音频采样序列和第二音频采样序列之间的不连续性的装置,包括:
一个寄存器,用以捕获和输出第一音频采样序列的最终采样值;
一个第一减法器,连接到所述寄存器,以输出在该音频流的一个随时间变化的值和最终采样值之间的差值,该差值至少部分地基于从该音频流之随时间变化的值中减去该最终采样值;
一个第一乘法器,连接到所述第一减法器,以输出该第一减法器的输出和从0值增加到1值的一个加权函数的乘积;以及
一个第一加法器,连接到所述第一乘法器,以输出该最终采样值和该第一乘法器之输出的总和。
9.如权利要求8所述的装置,进一步包括:
一个多路复用器,连接到该第一加法器,以有选择地输出该音频流之随时间变化的值和该第一加法器之输出中的一个。
10.一种用于平滑音频流的第一音频采样序列和第二音频采样序列之间的不连续性的装置,包括:
一个寄存器,用于捕获和输出第一音频采样序列的最终采样值;
一个第一减法器,连接到所述寄存器,以输出在该音频流之一个随时间变化的值和该最终采样值之间的差值,该差值至少部分地基于从该音频流之随时间变化的值中减去该最终采样值;
一个第一反相器,连接到所述第一减法器,以输出所述第一减法器的反相输出;
一个第一多路复用器,连接到所述第一减法器和所述第一反相器,以有选择地输出所述减法器之输出和所述第一反相器之输出中的一个;
一个第一乘法器,连接到所述第一多路复用器,以输出所述第一多路复用器之输出与一个加权函数的乘积,该加权函数在一个过渡时期的第一半时间内从零值增加到二分之一值,并在该过渡时期的第二半时间内从二分之一值减少到零值;
一个第二多路复用器,连接到所述寄存器,以有选择地输出该音频流之随时间变化的值和该最终采样值中的一个;以及
一个第一加法器,连接到所述第一乘法器和所述第二多路复用器,以输出所述第一乘法器之输出和所述第二多路复用器之输出的总和。
11.一种计算机可读介质,在其上已存储有多条指令,该多条指令包括的指令被一处理器执行时,导致该处理器执行以下步骤:
捕获第一音频采样序列的最终采样值;
接收第二音频采样序列的多个采样;以及
产生在一个过渡时期内的多个过渡音频采样值,其中每一个过渡音频采样值至少部分地基于该最终采样值,并用在该最终采样值和该第二音频采样序列的一个相应采样值之间的一个变化的加权差值进行调整,每一个变化的加权差值至少部分地基于一个变化加权函数,该函数在该过渡时期内从0值增加到1值。
CN 00817682 1999-12-22 2000-12-14 对拼接的不连续音频流进行平滑的方法和装置 Pending CN1413347A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US47050199A 1999-12-22 1999-12-22
US09/470,501 1999-12-22

Publications (1)

Publication Number Publication Date
CN1413347A true CN1413347A (zh) 2003-04-23

Family

ID=23867868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 00817682 Pending CN1413347A (zh) 1999-12-22 2000-12-14 对拼接的不连续音频流进行平滑的方法和装置

Country Status (3)

Country Link
JP (1) JP2003518268A (zh)
CN (1) CN1413347A (zh)
WO (1) WO2001046957A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104780438A (zh) * 2015-03-20 2015-07-15 广东欧珀移动通信有限公司 一种视频与歌曲音频拼接的方法及装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3963141B2 (ja) * 2002-03-22 2007-08-22 ヤマハ株式会社 歌唱合成装置、歌唱合成用プログラム及び歌唱合成用プログラムを記録したコンピュータで読み取り可能な記録媒体
US9319820B2 (en) * 2004-04-16 2016-04-19 Dolby Laboratories Licensing Corporation Apparatuses and methods for use in creating an audio scene for an avatar by utilizing weighted and unweighted audio streams attributed to plural objects
US8069051B2 (en) * 2007-09-25 2011-11-29 Apple Inc. Zero-gap playback using predictive mixing
EP2996269A1 (en) * 2014-09-09 2016-03-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio splicing concept

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3233287A1 (de) * 1982-09-08 1984-03-08 Robert Bosch Gmbh, 7000 Stuttgart Verfahren zum speichern digital codierter bildsynchroner tonsignale

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104780438A (zh) * 2015-03-20 2015-07-15 广东欧珀移动通信有限公司 一种视频与歌曲音频拼接的方法及装置

Also Published As

Publication number Publication date
JP2003518268A (ja) 2003-06-03
WO2001046957A1 (en) 2001-06-28

Similar Documents

Publication Publication Date Title
US9111580B2 (en) Time alignment of recorded audio signals
US6421636B1 (en) Frequency converter system
US7425674B2 (en) Method and apparatus for time compression and expansion of audio data with dynamic tempo change during playback
EP2327213B1 (en) Feature based calculation of audio video synchronization errors
US8445768B1 (en) Method and apparatus for audio mixing
US20070025482A1 (en) Flexible sampling-rate encoder
EP1050045B1 (en) Extracting supplemental data in an information signal
CN1114312C (zh) 同频道干扰消除器及其驱动方法
EP1554716A1 (en) Signal filtering
CN1211781C (zh) 音频速度变换的方法和系统
EP0682344A2 (en) Movie processing system
CN1413347A (zh) 对拼接的不连续音频流进行平滑的方法和装置
US20080222525A1 (en) Method and Apparatus for Efficiently Accounting for the Temporal Nature of Audio Processing
US7092774B1 (en) Multi-channel audio processing system with real-time program duration alteration
US6480234B1 (en) Method and apparatus for synchronously encoding audio signals with corresponding video frames
US8204255B2 (en) Method of distortion-free signal compression
CN1185628C (zh) 用于实现音频速度转换的系统和方法
US5621851A (en) Method of expanding differential PCM data of speech signals
JP2000021137A (ja) 編集装置
JP2002217740A (ja) 圧縮方法及び装置、伸長方法及び装置、圧縮伸長システム、記録媒体
JP3147562B2 (ja) 音声速度変換方法
JP3156020B2 (ja) 音声速度変換方法
JP2000156840A (ja) 複数のフォ―マットのデ―タを同期させる方法及び装置
CN1320822C (zh) 以不同检测原则交叉检测广告片段的方法及相关系统
CN114582376B (zh) 一种数字音频剪辑高质量优化拼接方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication