CN1451153A - 对具有同步数据的音频序列进行编码并输出的方法和系统 - Google Patents
对具有同步数据的音频序列进行编码并输出的方法和系统 Download PDFInfo
- Publication number
- CN1451153A CN1451153A CN00819334A CN00819334A CN1451153A CN 1451153 A CN1451153 A CN 1451153A CN 00819334 A CN00819334 A CN 00819334A CN 00819334 A CN00819334 A CN 00819334A CN 1451153 A CN1451153 A CN 1451153A
- Authority
- CN
- China
- Prior art keywords
- data
- signal
- tonic train
- sound
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000001360 synchronised effect Effects 0.000 title claims abstract description 15
- 230000005236 sound signal Effects 0.000 claims abstract description 48
- 230000001256 tonic effect Effects 0.000 claims description 68
- 238000007906 compression Methods 0.000 claims description 24
- 230000006835 compression Effects 0.000 claims description 23
- 238000005070 sampling Methods 0.000 claims description 21
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 claims description 12
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 claims description 12
- 101000848724 Homo sapiens Rap guanine nucleotide exchange factor 3 Proteins 0.000 claims description 3
- 102100034584 Rap guanine nucleotide exchange factor 3 Human genes 0.000 claims description 3
- 239000012530 fluid Substances 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 14
- 239000000203 mixture Substances 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 238000012856 packing Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
一种涉及对具有同步信号的音频序列进行编码的方法,该方法提供了一音频取样和一数据取样。音频取样被转换成音频信号,数据取样被转换成数据信号。数据信号包括多个数据段,利用数据信号对音频信号进行编码以形成音频序列,该音频信号包括具有字段的帧以接收数据段或接收数据段的指示信号。为了输出,与序列中的压缩的音频信号相同步的压缩的数据信号被解码并被输出。
Description
技术领域
本发明涉及音频序列,尤其涉及对具有同步数据的音频序列进行编码并输出已编码的文件。
背景技术
卡拉OK是一种音乐演奏方法,在该方法中人们(例如歌手)可以随着预先录制的歌曲通过读取特定的歌词来演唱某一序号的歌曲,歌词最好是显示在处于歌手视野之内的诸如电视屏这样的显示设备上。歌手的声音超过了预先录制的歌曲的原唱歌手的声音。常被称为音乐电视的电视影片也通常伴随着音乐和歌手被显示。提供该机会的设备被称为卡拉OK音乐再现设备,并被称作卡拉OK设备。
目前的卡拉OK设备使用磁带,高密度磁盘(CDs),数字化视频光盘(DVDs),计算机磁盘,视频高密光盘(VCDs)或其他类型的电子介质以记录并播放音乐和歌词。随着作为娱乐设备的卡拉OK机的普及性的提高,越来越多的歌曲被处理成卡拉OK演唱的格式。其结果是,传送并存储这些不断增长的音乐库的需求越来越重要。在一些情况下,利用标准的数字压缩技术来压缩表示乐曲和歌词的数字数据。例如,当前流行的一种数字压缩技术采用了被称为乐器数字化接口(MIDI)的标准压缩算法。美国专利No.5648628公开了一种设备,该设备结合了卡拉OK的乐曲和歌词。`628专利中的设备利用了可存储MIDI文件的可变盒式磁带的标准MIDI格式。
国际标准化组织(ISO/IEC)提出了多个公知的用于对运动图像和有关的音频数据进行编码的压缩标准。该压缩标准称为MPEG标准(运动图像专家组)。在文档ISO/IEC11172(该文档定义了MPSG1标准)和ISO/IEC13818(该文档定义了MPSG2标准)中定义了MPEG标准,在这里通过参考引入了这两个文档。另一个流行的非标准压缩算法被称为MPEG2.5,该压缩算法基于MPEG1和MPEG2标准。这三个MPEG版本(MPEG1,MPEG2,MPEG2.5)被统称为“MPEG1/2”。美国专利5856973公开了这一方法,该方法利用MPEG2格式将专用的应用数据和音频和视频数据一起从源点传送到终点。
MPEG1/2进一步被划分成数个“层”。通常,MPEG1/2层被标记的越高,则其所涉及的复杂性越高。MPEG1/2 III(MP3)是一个近来出现的流行的压缩格式,MPEG1/2III被用于对音频数据进行编码以努力制造出接近CD音质的效果。
MP3播放器是一种便携式设备,通常包括一个“闪速”存储器,一个液晶显示屏(LCD),一个控制面板,声响耳机的输出插孔以及其他类似的设备。音乐乐曲通过与MP3播放器相连的个人计算机(PC)或其他类似设备而被装载到MP3播放器的“闪速”存储器中,并被播放以供个人享受。
MP3标准定义了一个“音频序列”,该序列被划分成可变大小的“帧”,这些可变大小的“帧”进一步被划分成“字段”。虽然在MP3标准中描述了每个帧的排列,但是没有定义每个帧内的字段内容,每个帧内的字段内容是本发明的主题。
一般的卡拉OK设备是酒吧和夜总会中所使用的大型的、合成的、昂贵的系统。卡拉OK设备包括大的显示屏,高保真度音响系统以及多个诸如CDs这样的存储媒体。一般的MP3播放器是较小的且是买的起的,但是只能用来播放音乐。MP3播放器具有仅仅用于显示歌曲的曲名和播放时间的小的播放器,输出到耳机的有限音频输出,以及最小的扩音器(如果有的话)。
当前一般的MP3播放器不具备将数字字段与音频信号同步成单个音频序列文件的能力,数字字段包含有歌曲的歌词信息,音频信号包含有歌曲的音乐形式,单个的音频序列文件可通过卡拉OK播放设备而被存储,操作,传送并被播放。
因此,希望具有一个可克服上述缺点的程序和方法。
附图说明
图1说明了在MP3规格标准中所描述的MP3音频序列的排序的框图;
图2说明了在MP3规格标准中所描述的MP3编码器的示意图;
图3说明了根据本发明的改进型MP3编码器的示意图,该编码器将卡拉OK数据嵌入音频信号以形成MP3音频序列;
图4说明了根据本发明的编码过程的流程图;
图5是在MP3规格标准中所描述的MP3译码器的示意图;
图6说明了根据本发明的改进型MP3译码器的示意图,该译码器将卡拉OK数据和音频信号从MP3音频序列中取出;
图7说明了根据本发明的解码过程的流程图;
图8给出了MP3卡拉OK播放器的设备。
相应的附图标记表示全部几个附图的相应部分。这里所提出的例子从一个方面说明了本发明的一个优先实施例,并且在任何方面不能把这些例子看作是对本发明范围的限制。
具体实施方式
在本发明中,如上所述,一优选实施例根据MP3标准对具有同步数据的音频序列进行编码。或者,根据其他类似标准的范围来执行下述的编码标准。这些其他的标准例如包括MPEG1/2层III,AC-3,微软窗口媒体声音存储器(WWA),高级的音频编码(AAC),美国朗讯科技公司制造的感性声频信号编码器(EPAC),流音,real.com’s G2,以及基于音频帧标准的其他帧。对本发明来说,MPEG1/2层III是指MPEG1,MPEG2以及MPEG2.5层1和层2格式。因此本发明可适用于任何基于帧的音频格式。
如上所提到的,MP3标准定义了一个“音频序列”。图1说明了MP3标准的一个通常的音频序列。音频序列10(图1-A给出了更加详细的描述)被划分成可变大小的“帧”12。图1-B给出了音频序列一个帧的例子。
每个帧进一步被划分成多个字段14和子字段16。图1-C,1-D和1-E给出了图1-B中帧12的字段14和子字段16的例子。在优选实施例中,音频序列10的每个帧12包括由部首字段,误差检验字段,主数据字段,以及辅助数据字段所组成的固定格式。另外,每个字段进一步被划分成子字段16,在图1-C,D和E中给出了所划分的子字段的例子。虽然在MP3标准中描述了每个帧12的排序,但是没有定义每个帧12内的字段14和子字段16的内容。此外,在部首和音频数据帧以及辅助数据帧内所定义的专用位可用于对音频序列10中的歌词数据和控制信号进行编码,或插入歌词数据和控制信号,以便与音频信号同步以形成音频序列10。
最重要的是注意每个帧12的部首字段出现在一固定周期内并且具有特定的大小。然而,与每个帧12相关的数据字段是可变大小的并且不能出现在固定周期内。
更具体的说,本发明涉及使用在部首字段中的专用位(图1-E,字段8),在主数据字段中的专用位(图1-C,字段2)和嵌入有歌词文本,视频的辅助数据字段(图1-D),插入歌词文本或视频,和/或控制信息。该控制信息被总称为卡拉OK数据。值得注意的是每个帧可包括也可不包括任何卡拉OK数据。
如果帧包括卡拉OK数据,那么这些数据被存储在上述可用数据字段的任一部分或全部中。最好是上述信息按照下列顺序而存储在数据字段中:第一,部首字段的专用位;第二,主数据字段的专用位;以及第三,辅助数据字段。
图2给出了在MP3规格标准中所描述的MP3编码器的高级别方框图。如上所述,对部首字段的专用位中的卡拉OK数据,主数据字段的专用位中的卡拉OK数据,或辅助数据内的卡拉OK数据进行编码。图3说明了用于对卡拉OK数据进行编码的改进型MP3编码器的高级示意图。编码器的帧打包阶段必须提高以使输入的音频数据与卡拉Ok数据同步以从而压缩帧。这可通过发送标记符和卡拉OK数据的控制信息而完成。“合成帧打包”单元利用该信息以适当的排序具有音频取样的卡拉OK数据。图4说明了根据本发明编码过程的流程图,该过程把焦点集中在装配有卡拉Ok数据的帧。此外,图5说明了在MP3规格中所描述的MP3译码器的高级示意图。图6说明了改进型MP3译码器的高级示意图。图7描述了译码过程的流程图,该过程把焦点集中在取出卡拉OK数据。在译码处理的过程中,在帧拆包阶段的过程中产生了卡拉OK数据,同时产生了音频数据以作为逆映射阶段的最终产物。于是在解码器之外利用音频数据对卡拉OK数据进行排序。
参考附图1-4,提出了如下的用于对音频序列进行编码的方法。根据本发明,编码器接收一音频取样和一数据取样(步骤100)。最好是,编码器是一个被开发成可同步的利用数据信号对音频信号进行编码并创建一音频序列的系统。在优选实施例中,音频取样是一音乐乐曲。或者,音频取样可是诸如文本的音频译本这样的口头信号,该文本例如可以是书,报纸和外语书。在优选实施例中,数据取样可以是音乐乐曲的词。或者,数据取样可以是诸如英语文本的音频译本或视频数据这样的文本的口头译本,该视频数据例如与体现在音频取样中的歌曲的音乐电视相对应。
在接收到音频取样和数据取样之后,编码器于是将音频取样转换成音频信号(未给出)。最好是,转换处理确保根据音频序列的优选格式来读出该音频信号并了解该音频信号。例如,如果音频格式是MP3,那么最好是根据MP3格式可读出音频信号。
同样,数据取样被转换成数据信号(步骤102)。此外,数据信号包括多个数据段。每个数据段最好是与数据取样的一部分相对应,以便它可嵌入到合成的音频序列中。不是数据信号的所有部分都必须在数据段内被编码。相反,每个数据段可包括与数据信号相对应的数据信号的一小部分。
例如,如果数据取样包括歌曲的歌词,那么数据信号可包括各种数据段,每个数据段例如与一个词或一个节拍相对应。为此,允许数据段按一顺序和一位置而嵌入到音频序列中,以至数据信号与音频信号相对应(例如,用这样一种方式即将数据信号与音频信号相同步),下面将对此进行详细的描述。
数据信号也可包括一控制信号。最好是,控制信号包含与嵌入到音频序列中的数据信号的顺序相关的信息。例如,在编码的过程当中,控制信号可规定包含在数据信号内的歌词的一个特定词可包括三个音节,每个音节需要位于歌曲的不同节拍上。这样的信息最好是包含在控制信号内。
在对音频信号和数据信号进行转换之后,于是对音频序列进行解码。音频序列由如上所转换的嵌入有数据信号的音频信号组成,并且如上的转换是按照这样的一种方法,即,使数据信号与音频信号相同步,这种同步最好是通过将一个数据段嵌入到音频序列的一个帧中而发生。
更具体的说,编码过程最好是以下述方式而发生。首先,音频信号被映射成多个音频段(步骤105),实质上与上述数据段相似的这些音频段最好是与歌曲的一个音节相对应。在控制信号被编码并且被包含在数据信号之后,每个音频段被打包到音频序列的一个帧中(步骤110)。因此,一个数据段被打包到音频序列的一个帧中,以便数据段与装配到音频序列中的音频段相对应。
最好是,对序列进行编码以至数据段首先嵌入到部首字段的专用位中的音频序列中(步骤115)。一旦装入专用位,此外的任何数据段最好是都装入到主数据字段的专用位中(步骤120)。如果两个专用位都被装入了,那么所有的剩余数据段都嵌入到辅助的数据字段中(步骤125)。
值得注意的是数据信号嵌入到音频序列的较低层(例如字段和子字段),与诸如帧本身这样的较高层相比而言。按照这种方式,标准的MPEG译码器都支持所有嵌入的数据,并且不需要捕获数据的附加电路。
在操作中,例如,假设音乐乐曲是音乐乐曲“Layla”,那么音频取样可包含乐曲的乐谱。数据取样可以是乐曲的歌词。两种取样于是都被转换成诸如MP3格式。在编码处理的过程中,根据音乐的节拍或节奏来划分歌曲的歌词。这样,歌曲的第一行(“What would you do if you getlonely”)将被划分成音乐的前九个节拍,每个音节的一个。数据信号和音频信号于是被编码以按照一方式形成了音频序列,以便包含第一节拍的帧还包含第一个词等等。
另外的,在可替代的实施例中,利用一系列指示信号对音频序列进行编码以替代利用数据对音频序列进行编码。在该实施例中指示信号对存储在一分离文件中的数据信号进行定位。此外,指示信号根据包含在控制信号中的指令来定位数据信号,并且按照与优选实施例中对数据信号进行同步一样的方式来对指示信号进行同步(例如,指示信号按照这样一种方式来定位数据信号,即将音频序列与数据信号同步)。在这种情况下,音频序列按照这样一种方式来编码,即包含第一节拍的帧也可包含一个定位分离数据文件的指示信号。
在编码处理之后,音频序列被输出到卡拉OK播放器或目前所知的存储媒体中以在将来播放(步骤130)。参考附图1-7,提出了输出具有同步数据信号的音频信号的方法。提供一音频序列(步骤200),该序列按照上述所提出的方法被编码。音频序列包含一压缩的音频信号。该压缩的音频信号与上述的音频信号相对应,该音频信号包含有音乐乐曲的歌曲部分。此外,提供了与音乐乐曲的歌词部分相对应的压缩数据信号。压缩的数据信号位于音频信号内或位于如上所述的分离数据文件内(在这种情况下,音频序列包括指示信号)。就此,压缩数据信号一般与压缩音频信号同步。拆取出压缩的数据信号并存储在缓冲器内(步骤205,210,215)。同样的拆取出压缩的音频信号。输出到输出设备的两种信号于是被同步(步骤220,225),输出设备例如可以是卡拉OK播放机系统。或者,输出设备也可以是一个扬声器,一个立体声系统,一个视频系统或其他的类似设备。
现转向设备的讨论,图8给出了MP3播放器设备的示意图。参考图8,结合图1-7,接口端口50最好通过配接站或电缆最好与外部存储源相联接。接口端口50用于将来自外部源的“mp3”文件传输到卡拉OK设备中以存储在卡拉OK播放器设备的闪速存储器52中。外部存储源可以是一个人计算机或其他类似的设备。
闪速存储器52用于存储一个或多个“mp3”文件以由MP3播放器播放。存储器的这种类型可以是用新的信息来覆盖,但是它将“记忆”存储在其上的任何文件直到有目的被覆盖。
存储控制器54用于协调接口端口50与闪速存储器52之间的接口,闪速存储器52与MP3译码器56之间的接口,以及闪速存储器52与LCD控制器58之间的接口。此外,存储控制器54最好通过按钮控制60来与使用卡拉OK播放器设备的人相互作用。
MP3译码器56提供了如下的功能。也就是说,对MP3卡拉OK文件(例如,“mp3”文件)进行译码,并将音频数据输出到音频混频器62以及将卡拉OK数据输出到LCD/卡拉OK控制器58。
LCD/卡拉OK控制器58具有几个功能。首先,它控制LCD显示器以显示文字和歌词,使词高亮度,以及文字的滚动。LCD/卡拉OK控制器58还将来自MP3译码器56的电视的插入信号发送到电视外部信号插孔64以在外部处理。最后,它控制音频混频器62以允许利用设备声音的人们盖过原始歌曲的歌手声音。
按钮控制60允许用户利用设备来控制卡拉OK播放器设备的操作。最好是,按钮控制60包括用于播放,进带,倒带,暂停,停止以及其他基本功能的按钮。按钮控制60允许用户根据用户的要求来选择一首特定的歌曲以播放和/或演唱歌曲以及跳过歌曲,暂停或对歌曲的其他操作。
电视外部信号插孔64与控制音乐电视显示的外部设备接口。它也可将MP3译码器56所译码的信号发送到该外部设备以随着MP3卡拉OK播放器所播放的文件来排列音乐电视。
LCD显示器66为使用卡拉OK设备的人们提供了可视化接口。LCD显示器66足够的大并具有足够的灵活性以至可播放几行文字,高亮显示的文字,文字的滚动等等。LCD显示器66还可提供卡拉OK的功能。显示器66最好是具有足够的灵活性以至可显示多种语言的文字,因为除显示器显示之外还要用不同的语言播放歌曲。
音频混频器62把MP3译码器56所提供的源音频与来自麦克风68的使用该设备的人的声音混合起来。用户的声音盖过了原始歌曲的歌手声音。音频混频器62的输出最好被发送到耳机插孔70和音频输出插孔72中,最好是通过一数模转换器74。
最好,当播放歌曲时扩音器68允许使用设备的人们随着音乐乐曲根据在LCD显示器66所显示的歌词来演唱。
完全可以理解上述实施例在各个方面都被仅仅认为是示意性的且不是限制性的。本发明的保护范围是由随后的权利要求来指定的而不是由前述说明来指定的。在其含义和等价的范围内的各种修改都包含在它们的保护范围内。
Claims (29)
1.对具有同步数据的音频序列进行编码的方法,包括步骤:
提供一音频取样和一数据取样;
将音频取样转换成音频信号;
将数据取样转换成一数据信号,该数据信号包括多个数据段;以及
利用数据信号对音频信号进行编码以形成音频序列,音频序列包括多个帧,每个帧包括至少一个字段以接收数据信号的至少一个数据段。
2、根据权利要求1的方法,其中数据信号进一步包括一控制信号;并且进一步包括步骤:
按照包含在控制信号内的指令对音频序列进行编码。
3、根据权利要求2的方法,进一步包括输出音频序列的步骤。
4、根据权利要求1的方法,其中从由MPEG1/2层1/2,AC-3,WMA,AAC,EPAC,流音以及G-2格式所组成的格式组中选择音频序列的格式。
5、根据权利要求1的方法,其中数据取样进一步包括文本数据。
6、根据权利要求1的方法,其中数据取样进一步包括视频数据。
7、根据权利要求1的方法,其中音频取样包括歌曲。
8、根据权利要求1的方法,其中音频取样包括演唱声音。
9、根据权利要求1的方法,其中编码步骤进一步包括下列步骤:
将音频信号映射成多个数据段;
对控制信号进行编码,该控制信号包含在数据信号内;
将音频段打包成为音频序列的一个帧。
根据包含在控制信号内的指令将每一个数据段打包成为包含有相应音频段的音频序列的一个帧。
10、对具有同步数据的音频序列进行编码的程序,其中同步数据来自于数据信号,该程序包括:
提供一音频取样和一数据取样的计算机可读程序代码;
将音频取样转换成音频信号的计算机可读程序代码;
将数据取样转换成一数据信号的计算机可读程序代码,该数据信号包括多个数据段;以及
利用数据信号对音频信号进行编码以形成音频序列的计算机可读程序代码,音频序列包括多个帧,每个帧包括至少一个字段以接收数据信号的至少一个数据段。
11、对具有同步数据的音频序列进行编码的方法,包括步骤:
提供一音频取样和一数据取样;
将音频取样转换成音频信号;
将数据取样转换成一数据信号,该数据信号包括多个数据段;以及
利用多个指示信号对音频信号进行编码以形成音频序列,每一个指示信号定位数据信号的至少一个数据段。
12、根据权利要求11的方法,其中数据信号进一步包括一控制信号;并且进一步包括步骤:
根据包含在控制信号内的指令对音频序列进行编码。
13、根据权利要求12的方法,进一步包括输出音频序列的步骤。
14、根据权利要求11的方法,其中从由MPEG1/2层1/2,AC-3,WMA,AAC,EPAC,流音以及G-2格式所组成的这组格式中选择音频序列的格式。
15、根据权利要求11的方法,其中数据取样进一步包括文本数据。
16、根据权利要求11的方法,其中数据取样进一步包括视频数据。信号的一个数据段。
17、根据权利要求11的方法,其中音频取样包括一歌曲。
18、根据权利要求11的方法,其中音频取样包括演唱声音。
19、根据权利要求11的方法,其中编码步骤进一步包括下列步骤:
将音频信号映射成多个音频段;
对控制信号进行编码,控制信号包含在数据信号内;
将每个音频段打包成为到音频序列的一个帧。
将每个音频段装配到一个指示信号内,每个指示信号定位数据
20、对具有同步数据的音频序列进行编码的程序,包括:
提供一音频取样和一数据取样的计算机可读程序代码;
将音频取样转换成音频信号的计算机可读程序代码;
将数据取样转换成一数据信号的计算机可读程序代码,该数据信号包括多个数据段;以及
利用多个指示信号对音频信号进行编码以形成音频序列的计算机可读程序代码,每一个指示信号定位数据信号的至少一个数据段。
21、输出具有同步数据信号的音频信号的方法,包括步骤:
提供具有同步数据的音频序列,音频序列包括压缩的音频信号;
提供压缩的数据信号,压缩的数据信号与压缩的音频信号同步;
对压缩的数据信号解包;
将数据信号存储到缓冲器中;
从音频序列中对压缩的音频信号解包;以及
将音频信号和数据信号输出到输出设备。
22、根据权利要求21的方法,进一步包括从音频序列中对压缩数据信号解包的步骤。
23、根据权利要求21的方法,音频序列进一步包括多个指示信号,每个指示信号定位压缩的数据信号。
24、根据权利要求21的方法,其中音频序列是MP3格式。
25、根据权利要求21的方法,其中音频信号是从由歌曲和演唱声音的组中选取出来的,并且其中数据信号是从由文本和演唱声音的组中选取出来的。
26、根据权利要求21的方法,其中输出设备是由扩音器,立体声系统,卡拉OK系统以及视频系统所组成的组中选取出来的。
27、输出具有同步数据信号的音频信号的程序,包括:
提供具有同步数据的音频序列的计算机可读程序代码,音频序列包括压缩的音频信号;
提供压缩数据信号的计算机可读程序代码,压缩的数据信号与压缩的音频信号同步;
对压缩数据信号解包的计算机可读程序代码;
将数据信号存储到缓冲器中的计算机可读程序代码;
从音频序列中对压缩数据信号解包的计算机可读程序代码;以及
将音频信号和数据信号输出到输出设备的计算机可读程序代码。
28、根据权利要求27的程序,进一步包括从音频序列中对压缩数据信号解包的计算机可读程序代码。
29、根据权利要求27的方法,音频序列进一步包括多个指示信号,每个指示信号定位压缩的数据信号。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/507,084 | 2000-02-18 | ||
US09/507,084 US6442517B1 (en) | 2000-02-18 | 2000-02-18 | Methods and system for encoding an audio sequence with synchronized data and outputting the same |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1451153A true CN1451153A (zh) | 2003-10-22 |
Family
ID=24017185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN00819334A Pending CN1451153A (zh) | 2000-02-18 | 2000-11-15 | 对具有同步数据的音频序列进行编码并输出的方法和系统 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6442517B1 (zh) |
CN (1) | CN1451153A (zh) |
AU (1) | AU2001217654A1 (zh) |
WO (1) | WO2001061684A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104717544A (zh) * | 2013-12-16 | 2015-06-17 | 汤姆逊许可公司 | 用于音频内容的加速恢复的方法以及相关联的装置 |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060026048A1 (en) * | 1997-08-08 | 2006-02-02 | Kolawa Adam K | Method and apparatus for automated selection, organization, and recommendation of items based on user preference topography |
US20050038819A1 (en) * | 2000-04-21 | 2005-02-17 | Hicken Wendell T. | Music Recommendation system and method |
US7013301B2 (en) * | 2003-09-23 | 2006-03-14 | Predixis Corporation | Audio fingerprinting system and method |
US6766103B2 (en) * | 2000-02-19 | 2004-07-20 | Lg Electronics Inc. | Method for recording and reproducing representative audio data to/from a rewritable recording medium |
US6937814B1 (en) * | 2000-04-14 | 2005-08-30 | Realnetworks, Inc. | System and method for play while recording processing |
US20060217828A1 (en) * | 2002-10-23 | 2006-09-28 | Hicken Wendell T | Music searching system and method |
US20020173968A1 (en) * | 2001-05-17 | 2002-11-21 | Parry Travis J. | Encoded audio files having embedded printable lyrics |
US8001053B2 (en) * | 2001-05-31 | 2011-08-16 | Contentguard Holdings, Inc. | System and method for rights offering and granting using shared state variables |
US7239842B2 (en) * | 2002-05-22 | 2007-07-03 | Thomson Licensing | Talking E-book |
AU2003263732A1 (en) * | 2002-10-11 | 2004-05-04 | Matsushita Electric Industrial Co. Ltd. | A method and apparatus for delivering programme-associated data to generate relevant visual displays for audio contents |
US7539086B2 (en) * | 2002-10-23 | 2009-05-26 | J2 Global Communications, Inc. | System and method for the secure, real-time, high accuracy conversion of general-quality speech into text |
US20040083110A1 (en) * | 2002-10-23 | 2004-04-29 | Nokia Corporation | Packet loss recovery based on music signal classification and mixing |
US20040102860A1 (en) * | 2002-11-27 | 2004-05-27 | Invectec Appliances Corp. | Device of playing songs and displaying lyrics thereof and method therefor |
US20040249862A1 (en) * | 2003-04-17 | 2004-12-09 | Seung-Won Shin | Sync signal insertion/detection method and apparatus for synchronization between audio file and text |
US8230094B1 (en) * | 2003-04-29 | 2012-07-24 | Aol Inc. | Media file format, system, and method |
US20050044223A1 (en) * | 2003-06-24 | 2005-02-24 | Randy Meyerson | Method and apparatus for entitlement based dynamic sampling |
US7447317B2 (en) | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
KR100604831B1 (ko) * | 2004-02-17 | 2006-07-28 | 삼성전자주식회사 | 오디오에 부가 영상과 문자를 동기시켜 재생하는오디오/비디오 재생 장치 및 그 방법 |
US8407752B2 (en) * | 2004-03-18 | 2013-03-26 | Digimarc Corporation | Synchronizing broadcast content with corresponding network content |
KR100615626B1 (ko) * | 2004-05-22 | 2006-08-25 | (주)디지탈플로우 | 음원과 가사를 하나의 파일로 제공하는 멀티미디어 음악컨텐츠 서비스 방법 및 시스템 |
US20060212149A1 (en) * | 2004-08-13 | 2006-09-21 | Hicken Wendell T | Distributed system and method for intelligent data analysis |
US20060199161A1 (en) * | 2005-03-01 | 2006-09-07 | Huang Sung F | Method of creating multi-lingual lyrics slides video show for sing along |
KR20070116853A (ko) * | 2005-03-04 | 2007-12-11 | 뮤직아이피 코포레이션 | 플레이리스트를 작성하기 위한 스캔 셔플 |
US7613736B2 (en) * | 2005-05-23 | 2009-11-03 | Resonance Media Services, Inc. | Sharing music essence in a recommendation system |
WO2007037613A1 (en) * | 2005-09-27 | 2007-04-05 | Lg Electronics Inc. | Method and apparatus for encoding/decoding multi-channel audio signal |
US20070163428A1 (en) * | 2006-01-13 | 2007-07-19 | Salter Hal C | System and method for network communication of music data |
US20070186146A1 (en) * | 2006-02-07 | 2007-08-09 | Nokia Corporation | Time-scaling an audio signal |
KR20070080481A (ko) * | 2006-02-07 | 2007-08-10 | 삼성전자주식회사 | 노래 가사를 이용하여 하이라이트 구간을 검색하는 장치 및그 방법 |
KR100785070B1 (ko) * | 2006-07-11 | 2007-12-12 | 삼성전자주식회사 | 휴대 단말기에서 디지털 저작권 관리 콘텐츠 재생 방법 및장치 |
US9128946B2 (en) | 2007-12-31 | 2015-09-08 | Mastercard International Incorporated | Systems and methods for platform-independent data file transfers |
US8143508B2 (en) * | 2008-08-29 | 2012-03-27 | At&T Intellectual Property I, L.P. | System for providing lyrics with streaming music |
US8744239B2 (en) * | 2010-08-06 | 2014-06-03 | Apple Inc. | Teleprompter tool for voice-over tool |
US20120123572A1 (en) * | 2010-11-16 | 2012-05-17 | Mitch Junkins | System and method for adding lyrics to digital media |
US9823892B2 (en) * | 2011-08-26 | 2017-11-21 | Dts Llc | Audio adjustment system |
US9118867B2 (en) * | 2012-05-30 | 2015-08-25 | John M. McCary | Digital radio producing, broadcasting and receiving songs with lyrics |
WO2016040869A2 (en) * | 2014-09-12 | 2016-03-17 | Creighton Strategies, Ltd. | Facilitating online access to and participation in televised events |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4476559A (en) * | 1981-11-09 | 1984-10-09 | At&T Bell Laboratories | Simultaneous transmission of voice and data signals over a digital channel |
US4992886A (en) | 1988-12-20 | 1991-02-12 | Wnm Ventures, Inc. | Method and apparatus for encoding data within the subcode channel of a compact disc or laser disc |
US5408686A (en) | 1991-02-19 | 1995-04-18 | Mankovitz; Roy J. | Apparatus and methods for music and lyrics broadcasting |
USRE37131E1 (en) | 1991-02-19 | 2001-04-10 | Roy J. Mankovitz | Apparatus and methods for music and lyrics broadcasting |
US5281985A (en) | 1992-05-19 | 1994-01-25 | Michael Chan | Video viewing system for a vehicle |
US5465240A (en) | 1993-01-05 | 1995-11-07 | Mankovitz; Roy J. | Apparatus and methods for displaying text in conjunction with recorded audio programs |
US5621538A (en) | 1993-01-07 | 1997-04-15 | Sirius Publishing, Inc. | Method for synchronizing computerized audio output with visual output |
MA23381A1 (fr) | 1993-12-03 | 1995-07-01 | Scientific Atlanta | Architecture de recepteurs de donnees multi-services |
US5649234A (en) | 1994-07-07 | 1997-07-15 | Time Warner Interactive Group, Inc. | Method and apparatus for encoding graphical cues on a compact disc synchronized with the lyrics of a song to be played back |
US5677739A (en) * | 1995-03-02 | 1997-10-14 | National Captioning Institute | System and method for providing described television services |
US5650825A (en) * | 1995-03-31 | 1997-07-22 | Matsushita Electric Corporation Of America | Method and apparatus for sending private data instead of stuffing bits in an MPEG bit stream |
AUPN220795A0 (en) | 1995-04-06 | 1995-05-04 | Marvel Corporation Pty Ltd | Audio/visual marketing device |
US5902115A (en) | 1995-04-14 | 1999-05-11 | Kabushiki Kaisha Toshiba | Recording medium on which attribute information on the playback data is recorded together with the playback data and a system for appropriately reproducing the playback data using the attribute information |
US5778102A (en) * | 1995-05-17 | 1998-07-07 | The Regents Of The University Of California, Office Of Technology Transfer | Compression embedding |
FI98175C (fi) | 1995-06-12 | 1997-04-25 | Nokia Oy Ab | Multimediaobjektien välitys digitaalisessa tiedonsiirtojärjestelmässä |
US5648628A (en) | 1995-09-29 | 1997-07-15 | Ng; Tao Fei S. | Cartridge supported karaoke device |
JP2985750B2 (ja) | 1995-10-19 | 1999-12-06 | ヤマハ株式会社 | 通信カラオケ装置の情報ファイル管理方法および通信カラオケ装置 |
TW329515B (en) | 1995-10-24 | 1998-04-11 | Matsushita Electric Ind Co Ltd | Recording medium and reproduction apparatus |
JP3587916B2 (ja) | 1995-10-31 | 2004-11-10 | ブラザー工業株式会社 | 映像音声データ供給装置 |
US5777997A (en) | 1996-03-07 | 1998-07-07 | Hughes Electronics Corporation | Method and system for transmitting audio-associated text information in a multiplexed transmission stream |
US5778187A (en) | 1996-05-09 | 1998-07-07 | Netcast Communications Corp. | Multicasting method and apparatus |
JP3453248B2 (ja) | 1996-05-28 | 2003-10-06 | 株式会社第一興商 | 通信カラオケシステム、カラオケ再生端末 |
CA2214161C (en) | 1996-08-30 | 2001-05-29 | Daiichi Kosho, Co., Ltd. | Karaoke playback apparatus utilizing digital multi-channel broadcasting |
US5856973A (en) | 1996-09-10 | 1999-01-05 | Thompson; Kenneth M. | Data multiplexing in MPEG server to decoder systems |
US5732216A (en) | 1996-10-02 | 1998-03-24 | Internet Angles, Inc. | Audio message exchange system |
JP3198969B2 (ja) * | 1997-03-28 | 2001-08-13 | 日本電気株式会社 | デジタル音声無線伝送システム、デジタル音声無線送信装置およびデジタル音声無線受信再生装置 |
JP4013281B2 (ja) | 1997-04-18 | 2007-11-28 | ヤマハ株式会社 | カラオケデータ伝送方法、カラオケ装置およびカラオケデータ記録媒体 |
JP3799761B2 (ja) | 1997-08-11 | 2006-07-19 | ヤマハ株式会社 | 演奏装置、カラオケ装置および記録媒体 |
US5956439A (en) | 1997-09-22 | 1999-09-21 | Lucent Technologies Inc. | Optical switching apparatus for use in the construction mode testing of fibers in an optical cable |
US6169242B1 (en) | 1999-02-02 | 2001-01-02 | Microsoft Corporation | Track-based music performance architecture |
US6121536A (en) | 1999-04-29 | 2000-09-19 | International Business Machines Corporation | Method and apparatus for encoding text in a MIDI datastream |
-
2000
- 2000-02-18 US US09/507,084 patent/US6442517B1/en not_active Expired - Fee Related
- 2000-11-15 CN CN00819334A patent/CN1451153A/zh active Pending
- 2000-11-15 AU AU2001217654A patent/AU2001217654A1/en not_active Abandoned
- 2000-11-15 WO PCT/US2000/031338 patent/WO2001061684A1/en active Application Filing
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104717544A (zh) * | 2013-12-16 | 2015-06-17 | 汤姆逊许可公司 | 用于音频内容的加速恢复的方法以及相关联的装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2001061684A1 (en) | 2001-08-23 |
US6442517B1 (en) | 2002-08-27 |
AU2001217654A1 (en) | 2001-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1451153A (zh) | 对具有同步数据的音频序列进行编码并输出的方法和系统 | |
CA2233443C (en) | Karaoke system and contents storage medium therefor | |
KR100297206B1 (ko) | 자막 엠피 3 정보 구조 및 이를 재생하는 플레이어 | |
JP2009116362A (ja) | 記録媒体より再生されるデジタルデータを処理するための装置および方法 | |
US20060199161A1 (en) | Method of creating multi-lingual lyrics slides video show for sing along | |
CN1787101A (zh) | 一种多媒体编辑方法 | |
JP3620787B2 (ja) | 音声データの符号化方法 | |
KR100460229B1 (ko) | 오디오 데이터 파일에 그래픽 데이터를 삽입하는 방법 및삽입된 그래픽 데이터의 재생 방법 | |
KR100670443B1 (ko) | 음악/이미지 동조용 데이터 파일이 기록된 컴퓨터로 읽을수 있는 기록매체 및 이미지 데이터 샘플을 오디오 파일에삽입하는 방법 | |
US7015933B2 (en) | Graphic data file for displaying graphic data, methods for generating the same, computer-readable storage medium and apparatus for playing the same | |
CN1084514C (zh) | 用于视唱伴奏的伴奏数据发生装置以及视唱伴奏装置 | |
JP3573419B2 (ja) | 手話学習機能付きカラオケ装置 | |
Ludovico | An XML multi-layer framework for music information description | |
JPH08267963A (ja) | フローチャート作成用シートならびにオーサリングシステムおよびオーサリング方法 | |
JP2009217276A (ja) | 音声符号化方法、音声復号化方法及び音声信号伝送方法 | |
JP2009181137A (ja) | 音声符号化方法、音声復号化方法及び音声信号伝送方法 | |
JP2005241796A (ja) | 電子透かしの埋め込み方法および音響信号の再生装置 | |
CN1302026A (zh) | 可扩充功能的多媒体录放音装置 | |
JPH07236116A (ja) | 光ディスク再生装置及び光ディスク記録方法、並びにこれらに用いる光ディスク | |
De Poli | Standards for audio and music representation | |
Woodbury Jr | Masters of Science in Computer Science | |
JP2009217273A (ja) | 音声符号化方法、音声復号化方法及び音声信号伝送方法 | |
JP2009217275A (ja) | 音声符号化方法、音声復号化方法及び音声信号伝送方法 | |
JP2009217274A (ja) | 音声符号化方法、音声復号化方法及び音声信号伝送方法 | |
JP2009211079A (ja) | 音声符号化方法、音声復号化方法及び音声信号伝送方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |