CN101136234B - 用以估计音频文件的音频长度的方法及装置 - Google Patents

用以估计音频文件的音频长度的方法及装置 Download PDF

Info

Publication number
CN101136234B
CN101136234B CN200610125699XA CN200610125699A CN101136234B CN 101136234 B CN101136234 B CN 101136234B CN 200610125699X A CN200610125699X A CN 200610125699XA CN 200610125699 A CN200610125699 A CN 200610125699A CN 101136234 B CN101136234 B CN 101136234B
Authority
CN
China
Prior art keywords
audio
frequency length
audio frequency
length
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200610125699XA
Other languages
English (en)
Other versions
CN101136234A (zh
Inventor
洪宪忠
蔡宪明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quanta Computer Inc
Original Assignee
Quanta Computer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quanta Computer Inc filed Critical Quanta Computer Inc
Priority to CN200610125699XA priority Critical patent/CN101136234B/zh
Publication of CN101136234A publication Critical patent/CN101136234A/zh
Application granted granted Critical
Publication of CN101136234B publication Critical patent/CN101136234B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明提供一种音频播放器中估计音频长度的方法。本发明首先根据该音频文件中数个音频帧的平均位率,产生一预测音频长度,并以此预测音频长度初始化一可调音频长度。在该音频文件的每个音频帧被播放过程中,本发明持续根据该音频文件已被播放的部份计算一新的参考音频长度。若最新音频帧的参考音频长度与前一个音频帧的参考音频长度的差异小于一阈值,则本发明根据最新参考音频长度校正可调音频长度。然后,依该音频文件已被播放的部分相对于整个音频文件的数据量的比例,在可调音频长度和参考音频长度间取比重得到估计音频长度。

Description

用以估计音频文件的音频长度的方法及装置
技术领域
本发明涉及一种应用在音频播放器中的方法及装置。并且特别地,本发明涉及一种用以估计音频文件的音频长度的方法及装置。
背景技术
一般的音频播放器(Audio player)都设有搜寻(Seek)的功能。一般而言,音频播放器的搜寻功能显示一搜寻条(Seek Bar)表示此音频文件的音频长度,并且在其上加以注记目前已播放时间;使用者可点选此搜寻条的任意点以指定播放的时间点;在使用者点选搜寻条之后,音频播放器将会计算该点选位置与整个搜寻条的比例,并且乘上目前音频文件的音频长度,计算出使用者欲播放的时间点,进而找出使用者欲播放的音频帧位置。因此,音频播放器搜寻前必须取得音频文件的估计音频长度,且该估计音频长度误差不可过大。若该估计音频长度误差过大,则可能会造成搜寻到的音频帧不符合使用者预期的时间点,甚至无法搜寻到对应的音频帧。
目前音频文件的压缩格式主要可分为两种:固定位率(Cons tant bit rate)和可变位率(Variable bit rate)。以固定位率压缩的音频文件采用固定的数据量来储存固定时间的音频数据,因此,采用固定位率的音频文件的音频长度很容易估计。以可变位率压缩的音频文件,为了维持音频的品质,会根据音频数据本身的特性来调整储存时的位率,因此,每一笔固定时间的音频数据的数据量可能都不相同。因此采用可变位率的音频文件的音频长度较不容易估计。
为解决音频长度难以估计的问题,某些采用可变位率压缩的音频文件会利用一些卷标(例如,ID3与VBRI/Xing Header)预先将音频长度相关信息储存在音频文件中。然而,并非所有的音频文件都有提供相关的信息。在播放不包含音频长度相关信息的音频文件时,一音频播放器必须自行计算该音频文件的音频长度。最准确的计算音频长度的方法是读取整个音频文件并且分析计算所有音频帧的个数,进而取得音频长度。由于读取并分析整个音频文件需要大量的时间和系统资源,该方法运用于资源限制的嵌入式系统并不实际。
目前主要的音频长度估计法也可分为两类:预先估计(Predictiveestimation)和实时估计(Real-time estimation)。预先估计法是在开始播放一音频文件前,由该音频文件中选取几个音频帧,并且以该等被挑选的音频帧的平均位率来估计即将被播放的音频文件的音频长度;在该音频文件开始被播放后,音频播放器即固定显示一开始估算出的音频长度,不再计算或调整。预先估计法的好处是容易实作,缺点则是估计结果不准确。由于被挑选出的音频帧的平均位率与整个音频文件的平均位率不尽相同,用预先估计法算出的音频长度可能和该音频文件的实际音频长度差异很大。
实时估计法是在一音频文件被播放的过程中持续统计已播放过的部份的平均位率,并根据此平均位率不断更新显示出的音频长度。实时估计法的好处是随着播放的音频帧增加,估计的音频长度会趋近正确的音频长度,缺点则是刚开始播放时估计出的音频长度可能和正确的音频长度差异很大。比方说,若某一音频文件的前几个音频帧的平均位率较低,则实时估计法一开始估计出的音频长度就会远大于正确音频长度;该估计音频长度后来才会慢慢收敛至该音频文件的正确音频长度。
由上述说明可知,现行的预先估计法与实时估计法都有各自的缺点,皆非理想的音频长度估计方式。
发明内容
本发明的主要目的是提供一个方法让音频播放器能够在搜寻前可估计一个较精准的音频长度。本方法结合上述预先估计法与实时估计法,在一音频文件刚开始被播放时,提供预先估计法所估计的音频长度,之后随拨放过程调整至实时估计法所估计的音频长度。
由文件系统可得知该音频文件总数据量为Stotal字节(不包含额外的标签)。首先,本发明使用预先估计法事先算出一预测估计长度L0。然后,当本发明的音频播放器已播放至第i个音频帧(假设N为该音频文件的所有音频帧个数,i为范围在1到N之间的整数指针),已播放的数据量可累计为Splayed(i),已播放的音频长度时间累计为Tplayed(i)。本发明的主要目的即根据上述数据计算在第i个音频帧时的估计音频长度LE(i)(Estimated Audio Length)。
根据本发明的一较佳具体实施例的估计方法,在该音频文件播放前,使用预先估计法计算得出一预测音频长度L0,并令初始可调音频长度LA(0)等于L0。然后,在第i个音频帧被播放完毕后,执行一程序。首先,该程序使用实时估计法,根据Stotal、Splayed(i)与Tplayed(i)计算一第i个音频帧的参考音频长度LR(i)。接着根据LR(i)和LR(i-1)计算第i个音频帧的变化比例R(i),确认R(i)是否小于一预设的阈值(threshold)判断LR(i)是否稳定。若稳定,则参考LR(i)及LA(i-1)计算第i个音频帧的可调音频长度LA(i);若否,则维持LA(i)=LA(i-1)。最后,根据LA(i)与LR(i),以音频文件的已播放部份相对整个音频文件的比例Splayed(i)/Stotal为比重,产生一第i个音频帧的估计音频长度LE(i),以供查询时回传与输出。
根据本发明的另一较佳具体实施例的估计装置,包含一处理器与一内存。内存用以储存软件程序代码,音频文件,以及暂存音频长度数据。处理器执行存放在内存的软件程序代码,该软件程序代码执行步骤,包含使用预先估计法计算一预测音频长度L0,再使用如前所述的实时估计法在每个音频帧产生一估计音频长度LE,最后将估计音频长度存回内存,以供搜寻查询时回传与输出。
关于本发明的优点与精神可以藉由以下的发明详述及附图得到进一步的了解。
附图说明
图1示出了根据本发明在文件播放前应用预先估计法计算预测音频长度的方法流程图。
图2示出了根据本发明在第i个音频帧播放时计算估计音频长度的方法流程图。
图3A示出了一可变位率音频文件随所播放的音频帧增加,比较预先估计法、实时估计法、与本发明的计算音频长度结果的一具体实施例。
图3B表示本发明的方法在图3A实施例中个别音频帧的变化比例值。
图4示出了根据本发明在文件播放前根据文件头信息直接取得预测音频长度的方法流程图。
图5示出了根据本发明在文件播放前根据音频文件大小直接计算预测音频长度的流程图方法。
图6示出了根据本发明的估计装置的方块图。
附图符号说明
100-110:流程步骤    200-230:流程步骤
400-410:流程步骤    500-510:流程步骤
60:估计装置         62:处理器
63:内存
具体实施方式
本发明的主要目的是提供一个方法让音频播放器能够在搜寻前可估计一个较精准的音频长度。本方法结合上述预先估计法与实时估计法,在一音频文件刚开始被播放时,提供预先估计法所估计的音频长度,之后随拨放过程调整至实时估计法所估计的音频长度。
由文件系统可得知该音频文件总数据量为Stotal字节(不包含额外的标签)。首先,本发明使用预先估计法事先算出一预测估计长度L0。然后,当本发明的音频播放器已播放至第i个音频帧(假设N为该音频文件的所有音频帧个数,i为范围在1到N之间的整数指针),已播放的数据量可累计为Splayed(i),已播放的音频长度时间累计为Tplayed(i)。本发明的主要目的即根据上述数据计算在第i个音频帧时的估计音频长度LE(i)(Estimated Audio Length)。
图1示出了根据本发明在文件播放前应用预先估计法计算预测音频长度L0的方法流程图。步骤100使用先前技术中的预先估计法计算一预测音频长度L0。在实际应用中,首先,步骤101由该N个音频帧中选择至少一个音频帧做为一取样音频帧;然后,步骤102计算所有取样音频帧的平均位率;步骤103将该音频文件的总数据量Stotal除以步骤102得出的平均位率,得到预测音频长度L0。最后,步骤110设定一可调音频长度LA(0)等于L0
图2示出了根据本发明在第i个音频帧播放时计算估计音频长度LE(i)的方法流程图。该估计方法在该音频文件的第i个音频帧被播放时执行一程序。在步骤200,该估计方法使用实时估计法计算第i个音频帧的参考音频长度LR(i)。在实际应用中,根据本发明的方法及装置是由第一方程式计算LR(i),该第一方程式可表示如下:
LR(i)=[Stotal/Splayed(i)]*Tplayed(i),.........(式一)
其中,Stotal为该音频文件的总数据量、Splayed(i)表示该音频文件的第一个音频帧至第i个音频帧的数据量总和,Tplayed(i)表示该音频文件开始被播放的时间与该第i个音频帧被播放完毕的时间之间的时间间隔。
步骤210根据第二方程式计算第i个音频帧的变化比例R(i),并根据此变化比例是否小于一预设的阈值(threshold)判断LR(i)是否已稳定。该第二方程式可表示如下:
R(i)=abs[LR(i)-LR(i-1)]/LR(i),.........(式二)
其中,LR(0)被设为零。
该变化比例R(i)用以表示第i个音频帧的参考音频长度LR(i)相较于第(i-1)个音频帧的参考音频长度LR(i-1)的变化程度。若R(i)太大,即表示该音频文件的平均位率尚未稳定,或者是该第i个音频帧的位率相较于之前其它的音频帧的位率有大幅变化。阈值可根据实验结果决定。
若步骤210的判断结果为是,则表示该音频文件的平均位率已趋于稳定。步骤211是根据一第三方程式计算该第i个音频帧的可调音频长度LA(i),该第三方程式可表示如下:
LA(i)=LA(i-1)*(1-P)+LR(i)*P,.........(式三)
其中,P为一预设的常数,0<P<1,此常数可根据实验结果决定。
如式三所示,当该音频文件的平均位率已趋于稳定时,本发明的估计方法以固定比例的LA(i-1)和该最新的参考音频长度LR(i)组合出第i个音频帧的可调音频长度LA(i),将使LA(i)逐步趋近稳定后的参考音频长度。
若步骤210的判断结果为否,则步骤212根据一第四方程式计算该第i个音频帧的可调音频长度LA(i),该第四方程式可表示如下:
LA(i)=LA(i-1)。.........(式四)
如式四所示,因该音频文件的平均位率尚未稳定,根据本发明的估计方法并不立即根据最新的参考音频长度LR(i)调整LA(i),而是保持LA(i)与前一个可调音频长度LA(i-1)相等。藉此,可避免该等可调音频长度随着瞬时的位率产生大幅变化。
在实际情况中,某些音频文件的最后几个音频帧是不包含任何音频数据的空白音频帧。这些空白音频帧的位率远小于平均的位率,导致平均位率瞬间下降,因此造成参考音频长度LR(i)瞬间上升,然而可调音频长度LA(i)并不会立刻跟着参考音频长度LR(i)上升。此现象导致拨放到最后一个音频帧时,可调音频长度LA(i)和正确音频长度不相等。根据本发明的估计方法是以步骤220解决上述问题。
步骤220根据一第五方程式计算最后将被音频播放器显示第i个音频帧的估计音频长度(LE(i),该第五方程式可表示如下:
LE(i)=LA(i)*(1-W)+LR(i)*W,.........(式五)
其中,W=[Splayed(i)/Stotal],亦即已被播放的部份相对于整个音频文件的数据量的比例。
经式五计算出的第N估计音频长度LE(N)必定会等同于LR(N),也就是确保第N估计音频长度收敛在该音频文件的正确音频长度。
最后,步骤230储存步骤220中计算得出的第i估计音频长度(LE(i)),以供搜寻功能查询时回传与输出。
图3A示出了一可变位率音频文件随所播放的音频帧增加,比较预先估计法(L0)、实时估计法(LR)、与本发明(LE)的计算音频长度结果的一范例。在图3A中,预先估计法所计算的结果L0,与正确音频长度有误差;而实时估计法计算出来的结果LR,在刚开始播放时误差极大。因此,本发明的方法可以估计一较稳定且越来越准确的音频长度。图3B表示本发明的方法在图3A实施例中第i音频帧的变化比例R(i)值。在图3B中,若R(i)值大于阈值(如:0.00003),表示该音频帧的平均位率尚未稳定。
图4示出了根据本发明在文件播放前根据文件头信息(File HeaderInformation)直接取得预测音频长度L0的方法流程图。相较于图1的方法,本发明的方法在开始执行所有程序前增加下列步骤。首先,在步骤400判断该音频文件的文件头信息是否有具备该音频文件音频长度的相关信息(例如,ID3或VBRI/Xing Header信息)。若是,则执行步骤401,直接取得预测音频长度L0;若否,则执行步骤100,使用图1的预先估计法取得音频长度L0
图5示出了根据本发明在文件播放前根据音频文件大小直接计算预测音频长度L0的流程图方法。相较于图1的方法,本发明的方法也是在开始执行所有程序前增加下列步骤。首先,步骤500判断该音频文件的总数据量Stotal是否小于一总量阈值。若是,则执行步骤401,直接读取并分析计算该音频文件中的所有音频帧总数,计算取得音频长度信息L0;若否,则执行步骤100,使用图1的预先估计法。由于本实施例已直接取得准确音频长度,本发明不须在每个音频帧使用实时估计法计算估计音频长度。
图6示出了根据本发明的估计装置的方块图。估计装置60包含一处理器62与一内存63。内存63用以储存软件程序代码,音频文件,以及暂存音频长度数据。处理器62执行存放在内存63的软件程序代码,该软件程序代码包含下列步骤:
(1)在播放音频文件前,计算预测音频长度L0,并设定初始可调音频长度LA(0)等于预测音频长度L0
(2)在播放该音频文件第i个音频帧时,执行下列子步骤:
(2a)计算该音频帧的参考音频长度LR(i);
(2b)根据LR(i)和LR(i-1)计算该音频帧的变化比例R(i),并确认R(i)小于一阈值;若是,则执行子步骤(2c);若否,则执行子步骤(2d);
(2c)根据LA(i-1)和LR(i)计算该音频帧的可调音频长度LA(i),并执行子步骤(2e);
(2d)设定该音频帧的可调音频长度LA(i)等于LA(i-1),并执行子步骤(2e);
(2e)根据LA(i)LR(i)已播放的累计数据量Splayed(i)以及该音频文件总数据量Stotal,计算该音频帧的估计音频长度LE(i);
(2f)储存该音频帧的估计音频长度LE(i)在内存63,待搜寻功能查询时回传与输出。
值得注意的是,处理器62所执行的软件程序代码的步骤(1)可使用预先估计法计算预测音频长度L0,预先估计法包含下列子步骤:
(1a)在该音频文件中选取多个音频帧;
(1b)计算所选取多个音频帧的平均位率;
(1c)将该音频文件的总数据量Stotal除平均位率,可得到预测音频长度L0
在实际应用中,处理器62所执行的软件程序代码的步骤(1)可再根据文件头信息直接取得预测音频长度L0,本方法包含下列子步骤:
(3a)确认音频文件文件头信息包含音频长度相关信息;若是,则执行子步骤(3b);若否,则执行预先估计法的子步骤(1a)、(1b)、与(1c);
(3b)直接取得预测音频长度L0
在实际应用中,处理器62所执行的软件程序代码的步骤(1)可再根据音频文件大小直接计算预测音频长度L0,本方法包含下列子步骤:
(4a)确认该音频文件的总数据量Stotal小于一总量阈值;若是,则执行子步骤(4b);若否,则执行预先估计法的子步骤(1a)、(1b)、与(1c);
(4b)直接读取并分析计算该音频文件中的所有音频帧总数,以取得音频长度信息L0
根据本发明的方法及装置可适用于各种利用音频帧方式编码的音频文件,并可在一音频文件播放的过程中提供稳定且愈来愈准确的估计音频长度,减少音频播放器搜寻到非使用者指定的时间点所对应的音频帧或搜寻不到使用者指定的时间点所对应的音频帧的机率。
藉由以上较佳具体实施例的详述,是希望能更加清楚描述本发明的特征与精神,而并非以上述所揭露的较佳具体实施例来对本发明的范畴加以限制。相反地,其目的是希望能涵盖各种改变及具相等性的安排在本发明所欲申请的专利范围的范畴内。

Claims (8)

1.一种用以估计一音频文件的一音频长度的方法,该音频文件包含N个音频帧,N为一自然数,i为一范围在1到N之间的整数索引,该方法包含下列步骤:
(1)在该音频文件被播放前,计算一预测音频长度L0,并设定一初始可调音频长度LA(0)等于该预测音频长度L0;以及
(2)在该音频文件中的第i个音频帧被播放时,执行下列子步骤:
(2a)计算该第i个音频帧的一参考音频长度LR(i);
(2b)根据LR(i)和LR(i-1)计算该第i个音频帧的一变化比例R(i),并确认R(i)是否小于一阈值;若是,则执行子步骤(2c);若否,则执行子步骤(2d);
(2c)根据该音频文件中的第(i-1)个音频帧的一第(i-1)可调音频长度LA(i-1)与LR(i),计算该第i个音频帧的一第i可调音频长度LA(i),并执行子步骤(2e);
(2d)设定该第i个音频帧的一可调音频长度LA(i)等于该音频文件中的第(i-1)个音频帧的一第(i-1)可调音频长度LA(i-1),并执行子步骤(2e);
(2e)根据LA(i)、LR(i)、一已播放的累计数据量Splayed(i)以及该音频文件的一总数据量Stotal,计算该第i个音频帧的估计音频长度LE(i);以及
(2f)储存该第i个音频帧的估计音频长度LE(i)。
2.如权利要求1所述的方法,其中,步骤(1)使用一预先估计法计算该预测音频长度L0,该预先估计法包含下列子步骤:
(1a)在该音频文件中选取多个音频帧;
(1b)计算该多个被选取的音频帧的一平均位率;以及
(1c)将该音频文件的该总数据量Stotal除该平均位率,以得到该预测音频长度L0
3.如权利要求2所述的方法,其中,步骤(1)进一步包含下列子步骤:
(3a)确认该音频文件的一文件头信息中是否包含一音频长度相关信息;若是,则执行子步骤(3b);若否,则执行该预先估计法的子步骤(1a)、(1b)、与(1c);以及
(3b)由该音频长度相关信息取得该预测音频长度L0
4.如权利要求2所述的方法,其中,步骤(1)进一步包含下列子步骤:
(4a)确认该音频文件的该总数据量Stotal是否小于一总量阈值;若是,则执行子步骤(4b);若否,则执行该预先估计法的子步骤(1a)、(1b)、与(1c);以及
(4b)读取并分析该音频文件中的所有音频帧,以取得该音频长度信息L0
5.如权利要求1所述的方法,其中,子步骤(2a)根据一第一方程式计算该第i个音频帧的该参考音频长度LR(i),该第一方程式表示如下:
LR(i)=[Stotal/Splayed(i)]*Tplayed(i),
其中,Tplayed(i)表示音频文件开始被播放的时间与该第i个音频帧被播放完毕的时间之间的时间间隔。
6.如权利要求1所述的方法,其中,子步骤(2b)根据一第二方程式计算该第i个音频帧的该变化比例R(i),该第二方程式表示如下:
R(i)=abs[LR(i)-LR(i-1)]/LR(i)。
7.如权利要求1所述的方法,其中,子步骤(2c)根据一第三方程式计算该第i个音频帧的该可调音频长度LA(i),该第三方程式表示如下:
LA(i)=LA(i-1)*(1-P)+LR(i)*P,
其中,P为一预设的常数。
8.如权利要求1所述的方法,其中,子步骤(2e)根据一第五方程式计算该第i个音频帧的该估计音频长度LE(i),该第五方程式表示如下:
LE(i)=LA(i)*(1-W)+LR(i)*W,其中W=[Splayed(i)/Stotal]。
CN200610125699XA 2006-08-31 2006-08-31 用以估计音频文件的音频长度的方法及装置 Expired - Fee Related CN101136234B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200610125699XA CN101136234B (zh) 2006-08-31 2006-08-31 用以估计音频文件的音频长度的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200610125699XA CN101136234B (zh) 2006-08-31 2006-08-31 用以估计音频文件的音频长度的方法及装置

Publications (2)

Publication Number Publication Date
CN101136234A CN101136234A (zh) 2008-03-05
CN101136234B true CN101136234B (zh) 2010-06-23

Family

ID=39160273

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200610125699XA Expired - Fee Related CN101136234B (zh) 2006-08-31 2006-08-31 用以估计音频文件的音频长度的方法及装置

Country Status (1)

Country Link
CN (1) CN101136234B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106469559B (zh) * 2015-08-19 2020-10-16 中兴通讯股份有限公司 语音数据的调整方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0676758A1 (en) * 1994-04-08 1995-10-11 Kabushiki Kaisha Toshiba Method and apparatus for forming unit from image data, sound data, and header data divided at predetermined positions therein, and method, apparatus, and recording medium for reproducing unit
EP1005218B1 (en) * 1994-10-04 2002-07-03 Sony Corporation Decoder for decoding still picture data
CN1804788A (zh) * 2005-11-25 2006-07-19 北京中星微电子有限公司 在可变比特率格式的mp3文件中实现定位的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0676758A1 (en) * 1994-04-08 1995-10-11 Kabushiki Kaisha Toshiba Method and apparatus for forming unit from image data, sound data, and header data divided at predetermined positions therein, and method, apparatus, and recording medium for reproducing unit
EP1005218B1 (en) * 1994-10-04 2002-07-03 Sony Corporation Decoder for decoding still picture data
CN1804788A (zh) * 2005-11-25 2006-07-19 北京中星微电子有限公司 在可变比特率格式的mp3文件中实现定位的方法

Also Published As

Publication number Publication date
CN101136234A (zh) 2008-03-05

Similar Documents

Publication Publication Date Title
US9633696B1 (en) Systems and methods for automatically synchronizing media to derived content
KR101828186B1 (ko) 개선된 펄스 재동기화를 사용하여 acelp-형 은폐 내에서 적응적 코드북의 개선된 은폐를 위한 장치 및 방법
CN107533850B (zh) 音频内容识别方法和装置
CN109819282B (zh) 一种视频用户类别识别方法、装置和介质
JP2015505629A (ja) 情報検索を行う方法及びサーバ
US20180158469A1 (en) Audio processing method and apparatus, and terminal
CN100444106C (zh) 在可变比特率格式的mp3文件中实现定位的方法
JP2019066867A (ja) 改善されたピッチラグ推定を採用するacelp型封じ込めにおける適応型コードブックの改善された封じ込めのための装置および方法
TWI281657B (en) Method and system for speech coding
US10147443B2 (en) Matching device, judgment device, and method, program, and recording medium therefor
CN113223485A (zh) 节拍检测模型的训练方法、节拍检测方法及装置
DK1477909T3 (da) Fremgangsmåde og brugergrænseflade til at lave en præsentation af data under anvendelse metamorfning
TWI312962B (en) Method and apparatus for estimating audio length of audio file
CN101136234B (zh) 用以估计音频文件的音频长度的方法及装置
CN113297412B (zh) 音乐推荐方法、装置、电子设备和存储介质
KR20180049182A (ko) 누락 데이터에 대한 사인곡선 보간
CN104637496B (zh) 计算机系统及音频比对方法
CN111198669A (zh) 一种用于计算机的音量调节系统
CN116489449A (zh) 一种视频冗余片段检测方法及系统
TW201923755A (zh) 音調滯後選擇技術
CN107133344B (zh) 一种数据处理方法及装置
US20180248810A1 (en) Method and device for regulating playing delay and method and device for modifying time scale
CN106101573A (zh) 一种视频标注的锚定及匹配方法
JP6114702B2 (ja) ユーザ体感品質推定装置、ユーザ体感品質推定方法及びプログラム
JP2000259200A (ja) 話速変換方法および装置および話速変換プログラムを格納した記録媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100623

Termination date: 20210831