CN102222077A - 一种语音频数据的存储方法和装置 - Google Patents

一种语音频数据的存储方法和装置 Download PDF

Info

Publication number
CN102222077A
CN102222077A CN2010101657332A CN201010165733A CN102222077A CN 102222077 A CN102222077 A CN 102222077A CN 2010101657332 A CN2010101657332 A CN 2010101657332A CN 201010165733 A CN201010165733 A CN 201010165733A CN 102222077 A CN102222077 A CN 102222077A
Authority
CN
China
Prior art keywords
information
vac
audio data
voice audio
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010101657332A
Other languages
English (en)
Inventor
孙健
李加周
阮亚平
林亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN2010101657332A priority Critical patent/CN102222077A/zh
Priority to JP2013504096A priority patent/JP2013528823A/ja
Priority to KR1020127029461A priority patent/KR101447606B1/ko
Priority to PCT/CN2010/078117 priority patent/WO2011127726A1/zh
Priority to US13/640,578 priority patent/US8868429B2/en
Priority to EP10849735.5A priority patent/EP2560105A4/en
Publication of CN102222077A publication Critical patent/CN102222077A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • G11B20/1217Formatting, e.g. arrangement of data block or words on the record carriers on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • G11B2020/1264Formatting, e.g. arrangement of data block or words on the record carriers wherein the formatting concerns a specific kind of data
    • G11B2020/1265Control data, system data or management information, i.e. data used to access or process user data

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种语音频数据的存储方法和装置,所述方法包括:在多用途语音频数据存储文件中记录所述多用途语音频数据存储文件的基本信息;将多用途语音频编解码器(VAC)帧数据顺序存储到所述多用途语音频数据存储文件中;在所述多用途语音频数据存储文件中记录所述多用途语音频数据存储文件的负载信息;在所述多用途语音频数据存储文件中记录其存储的VAC帧的索引信息。本发明能够实现多用途语音频数据方便的回放功能,并且可以高效获取文件信息,实现定位播放和分级播放。

Description

一种语音频数据的存储方法和装置
技术领域
本发明涉及多媒体通信和传输领域,尤其涉及一种语音频数据的存储方法和装置。
背景技术
在多媒体通信领域,语音频通信一直是居于主导地位的通信方式。由于通信双方终端设备的差距和通信链路实际状况的千差万别,已有的语音频编解码方式无法为所有的用户提供优异的语音频服务。
目前提出一种多用途语音频编解码器(Versatile Audio Codec,简称VAC)的方案。该方案应用控制方法和信号分类方法相结合的方式,可以实现根据用户设置、应用场景、客户端反馈以及音频数据等信息,灵活地按不同技术方案对语音频帧编码、传输、解码。另外,还可以包含多个编解码器,可以支持从窄带到全频带、可分级的音频编解码功能。
然而,在诸如通话录制,音视频录像等应用中,需要将语音频数据存储在物理介质上,以便随后的访问和查看。而且,为了使用户可以方便的获取文件信息,以及有效、快速的进行各种访问操作。
因此,迫切需要一种存储方法来合理地组织多用途语音频数据的存储结构和信息。
发明内容
本发明要解决的技术问题就是提出一种语音频数据的存储方法和装置,能够合理地组织多用途语音频数据的存储结构和信息。
为了解决上述技术问题,本发明提供一种语音频数据的存储方法,包括:
在多用途语音频数据存储文件中记录所述多用途语音频数据存储文件的基本信息;
将多用途语音频编解码器(VAC)帧数据顺序存储到所述多用途语音频数据存储文件中;
在所述多用途语音频数据存储文件中记录所述多用途语音频数据存储文件的负载信息;
在所述多用途语音频数据存储文件中记录其存储的VAC帧的索引信息。
进一步地,上述方法还可具有以下特点:
所述基本信息包括以下一种或多种信息:文件类型、类型版本、特征信息、厂家标识、创建时间;
所述特征信息包括以下信息中的一种或多种:
(1)配置信息;
(2)分级信息;
(3)选项信息;
(4)属性信息。
进一步地,上述方法还可具有以下特点:
所述负载信息包括以下一种或多种信息:文件总时长、存储的VAC总帧数、编码模块标识、VAC编码码流的平均比特率、存储的VAC帧中出现过的特征信息。
进一步地,上述方法还可具有以下特点:
在将VAC帧数据顺序存储的步骤中,记录存储的总VAC帧数、编码模块标识、VAC帧数据的总大小和出现过的特征信息;
在记录负载信息的步骤中,计算出文件总时长和VAC编码码流的平均比特率,将所述文件总时长、存储的VAC总帧数、编码模块标识、VAC编码码流的平均比特率和存储的VAC帧中出现过的特征信息记录到所述多用途语音频数据存储文件中。
进一步地,上述方法还可具有以下特点:
所述方法还包括:将所述多用途语音频数据存储文件中存储的所有VAC帧在逻辑上划分为一个或多个块;所述块由固定个数的VAC帧组成;
所述负载信息还包括:一个块中包含的VAC帧的个数;
所述索引信息包括:所述多用途语音频数据存储文件中所有块的块索引。
进一步地,上述方法还可具有以下特点:
所述块索引包括:当前块的块偏移信息。
进一步地,上述方法还可具有以下特点:
所述块索引还包括:当前块中所有VAC帧的特征信息。
进一步地,上述方法还可具有以下特点:
在将VAC帧数据顺序存储的步骤中,记录每个VAC帧的特征信息和每个块的偏移信息;
在记录负载信息的步骤中,将一个块中包含的VAC帧的个数记录到所述多用途语音频数据存储文件中;
在记录索引信息的步骤中,在每个块的块索引中顺序记录当前块的块偏移信息和当前块包含的所有的VAC帧的特征信息,并将存储的所有块的块索引记录到所述多用途语音频数据存储文件中。
为了解决上述技术问题,本发明提供一种语音频数据的存储装置,包括:基本信息记录模块、VAC帧数据存储模块、负载信息记录模块和索引信息记录模块;
所述基本信息记录模块用于在多用途语音频数据存储文件中记录所述多用途语音频数据存储文件的基本信息;
所述VAC帧数据存储模块用于将VAC帧数据顺序存储到所述多用途语音频数据存储文件中;
所述负载信息记录模块用于在所述多用途语音频数据存储文件中记录所述多用途语音频数据存储文件的负载信息;
所述索引信息记录模块用于在所述多用途语音频数据存储文件中记录其存储的VAC帧的索引信息。
进一步地,上述装置还可包括块划分模块,
所述块划分模块用于将所述多用途语音频数据存储文件中存储的所有VAC帧在逻辑上划分为一个或多个块;所述块由固定个数的VAC帧组成;
所述索引信息记录模块还用于在每个块的块索引中顺序记录当前块的块偏移信息和当前块包含的所有的VAC帧的特征信息,并将存储的所有块的块索引作为索引信息,记录到所述多用途语音频数据存储文件中。
本发明通过记录多用途语音频数据存储文件的基本信息,VAC帧数据,文件的负载信息,VAC帧的索引信息,实现多用途语音频数据方便的回放功能,并且可以高效获取文件信息,实现定位播放和分级播放。
附图说明
图1是本发明实施例的存储方法流程图;
图2是本发明存储文件的基本信息示意图;
图3是本发明存储文件的VAC帧数据示意图;
图4是本发明存储文件的负载信息示意图;
图5是本发明存储文件的VAC帧索引信息示意图。
具体实施方式
目前已有的AMR(Adaptive Multi-Rate,自适应多速率),AAC(AdvancedAudio Coding,先进语音频编解码),MP3(MPEG Audio Layer3,MPEG语音频层3)等音频编码数据的存储方法要么没有索引,无法实现定位回放;要么索引设计不太合理,无法对帧数据的特性很好的描述。特别是对于VAC这种分层多码率的码流,现有的存储方法必须遍历读取所有数据,经解析后才能选择目标数据,无法实现高效的码流选择和分级播放。
本发明可解决现有技术中存储多用途语音帧时无法实现分级播放的问题。
下面结合附图及具体实施例对本发明进行详细说明。
如图1所示,本发明实施例的语音频数据的存储方法,包括:
步骤101,在多用途语音频数据存储文件中记录所述多用途语音频数据存储文件的基本信息。
该基本信息提供了当前文件的总体描述信息,如文件类型,类型版本,特征信息(profile),厂家标识,文件创建时间等。
步骤102,将VAC帧数据顺序存储到所述多用途语音频数据存储文件中。
具体地,将获取到的VAC帧逐字节顺序存储到文件中。
其中,多用途语音频数据即指VAC帧数据。
步骤103,待所有的VAC帧数据存储结束后,在所述多用途语音频数据存储文件中记录所述多用途语音频数据存储文件的负载信息。
该负载信息提供了当前文件的补充描述,可包括如下信息中的一种或多种:文件总时长,文件中存储的VAC总帧数,VAC编码码流的平均比特率等统计信息。
此外,该负载信息还可包括:编码模块标识,文件中存储的VAC编码帧中出现过的特征信息(即profile列表)。
步骤104,在所述多用途语音频数据存储文件中记录其存储的VAC帧的索引信息。
为了在回放媒体文件时支持定位拖动,即支持方便快捷的随机访问文件指定时间点的VAC帧的功能,需要记录VAC帧的索引。
进一步地,为了提高索引效率并减少索引大小,可以将文件中顺序存储的所有VAC帧逻辑上划分为一个或多个块(block),并对这些块进行索引,即每个帧条目记录某个块的位置偏移信息。
此外,为了对分级多码率数据进行选择性读取和分级播放,可以在索引信息中记录各VAC帧的特征信息,这样在回放时,不必逐个访问VAC帧数据,而只需根据索引中的指引即可得到想要的目标数据。
进一步地,在索引内部记录各个块实际包含的VAC帧的特征信息(profile),以优化块内部VAC帧操作的效率,实现便捷的分级回放。
其中,块由固定个数的VAC帧组成,其数值在文件负载信息中定义,即在步骤103中,将一个块中包含的VAC帧的个数记录到所述多用途语音频数据存储文件中。该参数可在文件生成时自行配置。
在一个块的索引内部顺序记录该块包含的所有的VAC帧的特征信息。当用户欲选择某一特定属性的码流时,在索引处可以方便查找,实现分级回放功能。
参见图2~5,为一个多用途语音频数据存储文件中存储内容的实施例。
如图2所示,一个多用途语音频数据存储文件可以包括:文件的基本信息,VAC帧数据,文件的负载信息,VAC帧的索引信息。其中,基本信息可包括文件类型字段,类型版本字段,特征信息(profile)字段,厂家标识字段,创建时间字段和其他一些字段。其中,文件类型字段标识当前文件由多用途语音频数据存储而成。类型版本字段标识了当前文件类型的版本。特征信息字段标识了本文件中的所有多用途语音频数据的特征信息,可包括以下信息中的一种或多种:配置信息、分级信息、选项信息、属性信息。厂家标识字段用于标识当前文件的生成者。创建时间字段标识了当前文件的创建时间。
如图3所示,VAC帧数据部分由一个个VAC帧顺序排列而成。
如图4所示,负载信息可包括文件总时长字段,文件总帧数,一个块中包含的VAC帧的个数(即每块帧个数M),VAC编码码流的平均比特率,编码模块标识字段,文件中存储的VAC编码帧中出现过的特征信息(即特征列表)。文件总时长字段标识了整个文件回放时总的持续时间。文件总帧数字段标识了文件中存储的VAC帧总数。一个块中包含的VAC帧的个数字段标识了索引中的一个条目指向的块中VAC帧的个数。VAC编码码流的平均比特率标识了文件的平均比特率。编码模块标识字段标识了文件中存储的VAC编码帧中出现过的编码模块标识。文件中存储的VAC编码帧中出现过的特征列表字段标识了文件中所有VAC帧的特征信息,利用该信息,一个访问者可以根据自身的终端特性选择是否全部解析或部分解析文件。
如图5所示,文件索引信息包含一个个顺序排列的块索引信息。一个块索引信息包括块偏移量字段和该块内部所有VAC帧的特征信息字段。块索引字段用于在文件中按时间点定位和随机访问。块偏移量字段标识了定位到的块在文件中的位置偏移。一个块内部VAC帧的特征信息字段用于在一个块内部选择特定类型的帧数据。
综上,参考图1~图5,存储多用途语音频数据时,首先写入文件的基本信息,接着存储一个个的VAC帧数据。在此过程中,记录存储的总VAC帧数,记录存储VAC帧数据的总大小,记录出现过的特征信息和编码模块标识,记录每个VAC帧的特征信息和每个块的偏移信息。帧数据存储结束后,计算出文件总时长和VAC编码码流的平均比特率,记录在负载信息中,并写入文件。最后根据每VAC帧的特征信息和块的偏移信息生成索引信息,并写入文件。
其中,根据每VAC帧的特征信息和块的偏移信息生成索引信息,写入文件具体可以是:在每个块的块索引中顺序记录当前块的块偏移信息和当前块包含的所有的VAC帧的特征信息,并将存储的所有块的块索引记录到该文件中。
本发明实施例的语音频数据的存储装置,包括:基本信息记录模块、VAC帧数据存储模块、负载信息记录模块和索引信息记录模块;
所述基本信息记录模块用于在多用途语音频数据存储文件中记录所述多用途语音频数据存储文件的基本信息;
所述VAC帧数据存储模块用于将VAC帧数据顺序存储到所述多用途语音频数据存储文件中;
所述负载信息记录模块用于在所述多用途语音频数据存储文件中记录所述多用途语音频数据存储文件的负载信息;
所述索引信息记录模块用于在所述多用途语音频数据存储文件中记录其存储的VAC帧的索引信息。
进一步地,该装置还包括块划分模块,用于将所述多用途语音频数据存储文件中存储的所有VAC帧在逻辑上划分为一个或多个块;所述块由固定个数的VAC帧组成;
所述索引信息记录模块还用于在每个块的块索引中顺序记录当前块的块偏移信息和当前块包含的所有的VAC帧的特征信息,并将存储的所有块的块索引作为索引信息,记录到所述多用途语音频数据存储文件中。
所述负载信息记录模块还用于记录存储的总VAC帧数、VAC帧数据的总大小、出现过的特征信息,出现过的编码模块标识,计算出文件总时长和VAC编码码流的平均比特率,将所述文件总时长、存储的VAC总帧数、一个块中包含的VAC帧的个数、VAC编码码流的平均比特率、存储的VAC帧中出现过的特征信息记录到所述多用途语音频数据存储文件中。
下面通过一个应用示例来进一步说明本发明:
假定有一组多用途语音频码流,其VAC帧每10帧的特征信息(比如,该特征信息为分级信息)顺序增加1,即1-10帧的特征信息值为1,11-20帧的特征信息值为2,....90-100帧的特征信息值为10。将其存储为文件时,首先写入文件基本信息,文件类型即为”VACFF”,文件类型版本为1.0,特征信息为0xFF(即所存储的VAC帧特征信息值不完全相同),厂家标识为“ZTEMM”,创建时间为“20100322”。
其中,特征信息字段可用于指示本文件中所有多用途语音频数据的特征信息是否相同,比如,如上所述的当所存储的VAC帧特征信息不完全相同,可写入0xFF(或其它标识特征信息不同的值),如果所存储的VAC帧特征信息全部相同,则可将该相同的特征信息的值写入该字段。另外,当写文件基本信息时无法获知所存储的VAC帧特征信息是否相同时,也可以直接写入某个指定值,比如0xFF(或其它指定值),此时,0xFF即表示无法确定所存储的VAC帧特征信息是否完全相同。
接着顺序将VAC帧存入文件中,并记录各种信息。
VAC帧数据存储结束后,接着写入负载信息,总时长为20ms(每个VAC帧时长为20ms)*100=2000ms,总帧数为100帧,每块帧个数为50(1s数据为一个块),平均比特率为
Sum(sizeof(VACl)+sizeof(VAC2)+...+sizeof(VAC100))/2bps
sizeof(VACN)表示第N个VAC帧的bit数,Sum()表示将括号内的数相加。
接着写入编码模块标识,如果所有的帧都是同一个编码模块生成的,该字段记为1。
接着写入这组码流中出现过的特征信息值,1 2 3 4 5 6 7 8 9 10。
最后写入索引信息,如第一个块在文件中的偏移量为30,该块索引记录数据为30,1,1,1,1,1,1,1,1,1,1(第一个10帧的特征信息值),2,2,2,2,2,2,2,2,2,2(第二个10帧特征信息值),...5,5,5,5,5,5,5,5,5,5(第五个10帧的特征信息值)。
利用该块索引信息可以方便的实现文件中时间点的定位:如需定位到第0.5s的数据,因为第一个块的起始时间为0s,第二个块的起始时间为1s,则首先定位欲读取的数据位于第一个块,然后定位到第25个VAC帧。通过当前块的偏移位置和该块前24个VAC帧的长度之和,计算出第25个VAC帧的偏移位置。
利用该块索引信息还可以方便的实现数据的分级回放:如某个客户因某种原因只能播放分级为2的数据,则通过本索引信息,发现只有第一个块的10帧信息满足要求,则只需根据索引读取相应的数据即可。此时,不再需要在文件中遍历查找帧数据,大大提供了读取效率。
综上所述,本发明提供一种多用途语音频数据的存储方法和装置。按照本发明可以生成文件的基本信息,VAC帧数据,文件的负载信息和VAC帧的索引信息。使用该方法生成的文件结构简单,方便读取和访问,可以满足多用途语音频的多种应用。
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (10)

1.一种语音频数据的存储方法,包括:
在多用途语音频数据存储文件中记录所述多用途语音频数据存储文件的基本信息;
将多用途语音频编解码器(VAC)帧数据顺序存储到所述多用途语音频数据存储文件中;
在所述多用途语音频数据存储文件中记录所述多用途语音频数据存储文件的负载信息;
在所述多用途语音频数据存储文件中记录其存储的VAC帧的索引信息。
2.如权利要求1所述的方法,其特征在于,
所述基本信息包括以下一种或多种信息:文件类型、类型版本、特征信息、厂家标识、创建时间;
所述特征信息包括以下信息中的一种或多种:
(1)配置信息;
(2)分级信息;
(3)选项信息;
(4)属性信息。
3.如权利要求1或2所述的方法,其特征在于,
所述负载信息包括以下一种或多种信息:文件总时长、存储的VAC总帧数、编码模块标识、VAC编码码流的平均比特率、存储的VAC帧中出现过的特征信息。
4.如权利要求3所述的方法,其特征在于,
在将VAC帧数据顺序存储的步骤中,记录存储的总VAC帧数、编码模块标识、VAC帧数据的总大小和出现过的特征信息;
在记录负载信息的步骤中,计算出文件总时长和VAC编码码流的平均比特率,将所述文件总时长、存储的VAC总帧数、编码模块标识、VAC编码码流的平均比特率和存储的VAC帧中出现过的特征信息记录到所述多用途语音频数据存储文件中。
5.如权利要求3所述的方法,其特征在于,
所述方法还包括:将所述多用途语音频数据存储文件中存储的所有VAC帧在逻辑上划分为一个或多个块;所述块由固定个数的VAC帧组成;
所述负载信息还包括:一个块中包含的VAC帧的个数;
所述索引信息包括:所述多用途语音频数据存储文件中所有块的块索引。
6.如权利要求5所述的方法,其特征在于,所述块索引包括:当前块的块偏移信息。
7.如权利要求6所述的方法,其特征在于,
所述块索引还包括:当前块中所有VAC帧的特征信息。
8.如权利要求7所述的方法,其特征在于,
在将VAC帧数据顺序存储的步骤中,记录每个VAC帧的特征信息和每个块的偏移信息;
在记录负载信息的步骤中,将一个块中包含的VAC帧的个数记录到所述多用途语音频数据存储文件中;
在记录索引信息的步骤中,在每个块的块索引中顺序记录当前块的块偏移信息和当前块包含的所有的VAC帧的特征信息,并将存储的所有块的块索引记录到所述多用途语音频数据存储文件中。
9.一种语音频数据的存储装置,其特征在于,包括:基本信息记录模块、VAC帧数据存储模块、负载信息记录模块和索引信息记录模块;
所述基本信息记录模块用于在多用途语音频数据存储文件中记录所述多用途语音频数据存储文件的基本信息;
所述VAC帧数据存储模块用于将VAC帧数据顺序存储到所述多用途语音频数据存储文件中;
所述负载信息记录模块用于在所述多用途语音频数据存储文件中记录所述多用途语音频数据存储文件的负载信息;
所述索引信息记录模块用于在所述多用途语音频数据存储文件中记录其存储的VAC帧的索引信息。
10.如权利要求9所述的装置,其特征在于,还包括块划分模块,
所述块划分模块用于将所述多用途语音频数据存储文件中存储的所有VAC帧在逻辑上划分为一个或多个块;所述块由固定个数的VAC帧组成;
所述索引信息记录模块还用于在每个块的块索引中顺序记录当前块的块偏移信息和当前块包含的所有的VAC帧的特征信息,并将存储的所有块的块索引作为索引信息,记录到所述多用途语音频数据存储文件中。
CN2010101657332A 2010-04-14 2010-04-14 一种语音频数据的存储方法和装置 Pending CN102222077A (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN2010101657332A CN102222077A (zh) 2010-04-14 2010-04-14 一种语音频数据的存储方法和装置
JP2013504096A JP2013528823A (ja) 2010-04-14 2010-10-26 音声データの記憶方法及び装置
KR1020127029461A KR101447606B1 (ko) 2010-04-14 2010-10-26 오디오 데이터의 저장 방법 및 저장 장치
PCT/CN2010/078117 WO2011127726A1 (zh) 2010-04-14 2010-10-26 一种语音频数据的存储方法和装置
US13/640,578 US8868429B2 (en) 2010-04-14 2010-10-26 Method and device for storing audio data
EP10849735.5A EP2560105A4 (en) 2010-04-14 2010-10-26 METHOD AND DEVICE FOR STORING AUDIO DATA

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010101657332A CN102222077A (zh) 2010-04-14 2010-04-14 一种语音频数据的存储方法和装置

Publications (1)

Publication Number Publication Date
CN102222077A true CN102222077A (zh) 2011-10-19

Family

ID=44778632

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010101657332A Pending CN102222077A (zh) 2010-04-14 2010-04-14 一种语音频数据的存储方法和装置

Country Status (6)

Country Link
US (1) US8868429B2 (zh)
EP (1) EP2560105A4 (zh)
JP (1) JP2013528823A (zh)
KR (1) KR101447606B1 (zh)
CN (1) CN102222077A (zh)
WO (1) WO2011127726A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103794233A (zh) * 2014-01-23 2014-05-14 福建星网锐捷安防科技有限公司 一种视音频数据的存储方法及存储装置
CN110291819A (zh) * 2016-12-13 2019-09-27 伊瓦自动化公司 音频回放的无线协调
CN111353065A (zh) * 2018-12-20 2020-06-30 北京嘀嘀无限科技发展有限公司 语音档案存储方法、装置、设备以及计算机可读存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2629440B1 (en) * 2012-02-15 2016-02-10 Harman International Industries Ltd. Audio mixing console
US9946718B2 (en) 2015-07-27 2018-04-17 Sas Institute Inc. Distributed data set encryption and decryption
US9619148B2 (en) 2015-07-27 2017-04-11 Sas Institute Inc. Distributed data set storage and retrieval

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1101450A (zh) * 1993-02-26 1995-04-12 三星电子株式会社 音频信号记录格式和再生方法及采用该格式和方法的装置
CN101325681A (zh) * 2008-07-25 2008-12-17 北京声迅电子有限公司 用于录像机和视频服务器的avs编码文件格式的存储方法
CN101420577A (zh) * 2008-11-07 2009-04-29 武汉烽火网络有限责任公司 一种多媒体数据的存储方法及精确定位回放位置的方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000054561A (ko) * 2000-06-12 2000-09-05 박성환 비디오 인덱싱 방식을 이용한 네트워크 기반의 비디오검색 시스템 및 그 운영방법
JP4586429B2 (ja) * 2004-06-11 2010-11-24 ソニー株式会社 データ処理装置およびデータ処理方法、並びに、プログラムおよびプログラム記録媒体
JP2008529367A (ja) * 2005-01-25 2008-07-31 ネロ アーゲー Dvdビデオ形式のデータを作成する方法、dvdビデオ・データおよびdvdビデオ・データ構造を復元するための方法
US8321228B2 (en) * 2009-08-26 2012-11-27 Nokia Corporation Audio interface unit for supporting network services

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1101450A (zh) * 1993-02-26 1995-04-12 三星电子株式会社 音频信号记录格式和再生方法及采用该格式和方法的装置
CN101325681A (zh) * 2008-07-25 2008-12-17 北京声迅电子有限公司 用于录像机和视频服务器的avs编码文件格式的存储方法
CN101420577A (zh) * 2008-11-07 2009-04-29 武汉烽火网络有限责任公司 一种多媒体数据的存储方法及精确定位回放位置的方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103794233A (zh) * 2014-01-23 2014-05-14 福建星网锐捷安防科技有限公司 一种视音频数据的存储方法及存储装置
CN103794233B (zh) * 2014-01-23 2016-05-18 福建星网锐捷安防科技有限公司 一种视音频数据的存储方法及存储装置
CN110291819A (zh) * 2016-12-13 2019-09-27 伊瓦自动化公司 音频回放的无线协调
CN111353065A (zh) * 2018-12-20 2020-06-30 北京嘀嘀无限科技发展有限公司 语音档案存储方法、装置、设备以及计算机可读存储介质

Also Published As

Publication number Publication date
EP2560105A1 (en) 2013-02-20
JP2013528823A (ja) 2013-07-11
KR101447606B1 (ko) 2014-10-06
EP2560105A4 (en) 2013-11-06
US20140149123A1 (en) 2014-05-29
US8868429B2 (en) 2014-10-21
KR20130016333A (ko) 2013-02-14
WO2011127726A1 (zh) 2011-10-20

Similar Documents

Publication Publication Date Title
CN102222077A (zh) 一种语音频数据的存储方法和装置
CN109565621B (zh) 用于实现视频管理的方法、系统和计算机存储介质
CN110020009A (zh) 在线问答方法、装置及系统
CN103412826A (zh) 固态硬盘的垃圾回收方法及系统
CN102945679A (zh) 视频数据处理方法和视频数据读写设备
US20150220574A1 (en) Database method for b+ tree based on pram
JP2013528823A5 (zh)
CN109213977A (zh) 庭审笔录的生成系统
US11226993B2 (en) Method and apparatus for clustering data stream
CN101551820B (zh) 兴趣点属性的索引数据库的生成方法和装置
CN104834738A (zh) 录音文件存储方法及装置
CN102662570A (zh) 信息处理方法和装置
CN115578063A (zh) 基于知识图谱的审计报告生成方法及相关设备
US8706484B2 (en) Voice recognition dictionary generation apparatus and voice recognition dictionary generation method
CN107728948A (zh) 一种存储器性能优化方法及装置、计算机设备
CN102054027A (zh) 一种移动终端文件的存入及搜索方法、系统及移动终端
CN102682016B (zh) 一种支持mov/3gp/mp4文件的索引系统及方法
CN108228658B (zh) 一种自动生成配音文字的方法、装置以及电子设备
CN102013265A (zh) 一种解析歌词并使其与歌曲同步播放的装置及方法
US20100222905A1 (en) Electronic apparatus with an interactive audio file recording function and method thereof
KR101370503B1 (ko) 멀티미디어 데이터 저장시스템 및 그 저장방법과 그 저장방법으로 수행되는 프로그램이 기록된 컴퓨터 판독 가능 저장매체
CN110134817A (zh) 一种录音文件的存储方法、搜索方法及相关装置
US20220147524A1 (en) Method for automatically generating news events of a certain topic and electronic device applying the same
CN103186583B (zh) 一种基于移动终端的信息记录和检索方法及装置
CN101163298A (zh) 一种记忆用户使用习惯的方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20111019