CN1662959A - 压缩存储的音频的方法和系统 - Google Patents

压缩存储的音频的方法和系统 Download PDF

Info

Publication number
CN1662959A
CN1662959A CN038144379A CN03814437A CN1662959A CN 1662959 A CN1662959 A CN 1662959A CN 038144379 A CN038144379 A CN 038144379A CN 03814437 A CN03814437 A CN 03814437A CN 1662959 A CN1662959 A CN 1662959A
Authority
CN
China
Prior art keywords
voice frame
several
encoded
encoded voice
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN038144379A
Other languages
English (en)
Other versions
CN1333384C (zh
Inventor
R·C·小亨里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Mobile Communications AB
Original Assignee
Sony Ericsson Mobile Communications AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Ericsson Mobile Communications AB filed Critical Sony Ericsson Mobile Communications AB
Publication of CN1662959A publication Critical patent/CN1662959A/zh
Application granted granted Critical
Publication of CN1333384C publication Critical patent/CN1333384C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Abstract

提供存储用于本地播放的编码录音的方法、系统和计算机程序产品。提供待存储的、具有码元等级优先排列并包括多个第一优先级码元和多个第二优先级码元的录音。几个第二优先级码元被选择用于丢弃。存储该录音而不存储被选择的几个第二优先级码元。第一优先级码元可以是高优先级码元,第二优先级码元可以是具有比高优先级码元低的优先级的低优先级码元。码元可以是比特,录音可以是帧。

Description

压缩存储的音频的方法和系统
发明背景
本发明总体涉及通信领域,更具体地说,本发明涉及音频通信。
目前许多不同的技术被用来支持音频(如话音/语音之类)通信。这些技术从传统的公共交换电话网络(PSTN)到无线通信网络,甚至到支持信息包规格化语音通信的计算机网络。对诸如数字无线电话和支持话音通信的计算机网络之类的通信媒体,已知利用多种声音编码器/解码器(“声音编码器”或“声音编解码器”)提供模拟话音信号的数字化。典型的声音编码器使用基于帧的编码-解码算法,其中算法一般由管理通信媒体的协议规定。这样的算法可以针对诸如无线网络或噪声有线系统之类的(易受噪声影响的)有损耗媒体设计,可以包括比特和/或帧纠错和/或帧替换,以纠正话音帧传输中的错误。
用于已知声音编码器的算法的例子包括针对无线通信标准IS-136规定的那些算法,这些算法支持代数码激励的线性预测法(ACELP)、向量和激励的线性预测法(VSELP)和美国-1(US1)声音编码器。更多用于码分无线通信的例子包括CDMA2000规范所支持的那些,它们支持高通(Qualcomm)码激励的线性预测法(QCELP)和增强型可变速率CODEC(EVRC)声音编码器。与用于诸如全球移动通信系统(GSM)之类的其它无线通信协议、以及诸如基于网际协议的话音传输(VoIP)之类的基于计算机网络的话音通信应用的话音编码和解码方法有关的类似规范是已知的。更概括地说,预测基于传输媒体的错误、并提供协议以便在这样的错误发生时允许纠错的声音编码器是已知的。
在有些情况下,想要存储语音或其它录音,以使它们可以在以后播放。例如,无线电话可以为来自用户的话音备忘录、空中通话的一部分或全部,以及音频声音标识等的重新编码提供支持。在无线电话中,已知利用在一个起初为未压缩信号的音频信号中运行的独立压缩方案为上述待本地存储在无线电话中的语音的压缩提供支持,其中未压缩信号,例如,为一个从无线电话的传声器接收的信号。该独立压缩方案的例子在自适应差分脉冲编码调制法(ADPCM)、MU-LAW和运动图象专家组(MPEG)中有规定。
发明内容
本发明的实施例提供存储用于本地播放的编码录音的方法。提供具有码元等级优先排列并包括多个第一优先级码元和多个第二优先级码元的录音。几个第二优先级码元被选择用于丢弃。存储该录音而不存储被选择的几个第二优先级码元。第一优先级码元可以是高优先级码元,第二优先级码元可以是具有比高优先级码元低的优先级的低优先级码元。码元可以是比特,录音可以是帧。
在本发明的其它实施例中,提供多个具有码元等级优先排列并包括多个高优先级码元和多个具有比高优先级码元低的优先级的低优先级码元的编码录音。多个编码录音中的几个被选择用于丢弃,存储该多个编码录音而不存储多个编码录音中被选择的几个。
在本发明的其它实施例中,选择几个第二优先级码元用于丢弃的步骤包括:提供规定了录音中待丢弃的码元位置的选择掩码。存储该录音而不存储多个编码录音中由该选择掩码规定的几个较低的优先级码元。
在本发明的其它实施例中,存储录音被读出。与所删除的被选择的几个第二优先级码元相对应的(具有随机值或已知值的)替换码元被插入读出的存储录音中,以提供具有正确长度的重构录音。重构录音被解码,以提供音频输出信号。另外,与存储过程中所丢弃的多个编码录音中被选择的几个相对应的(可以是具有固定、已知值的)替换录音可以添加到读出的、编码录音中。音频输出录音可以是,例如,话音备忘录、声音标识或录音。可以选择待丢弃的第二优先级码元的数量,以提供根据存储录音而产生的音频输出信号所要求的质量。类似地,可以选择多个编码录音中待丢弃的几个的数量,以提供根据存储录音而产生的音频输出信号所要求的质量。
在本发明的其它实施例中,提供了存储编码话音帧的方法,该方法包括接收待存储的话音输入。该接收的话音输入被话音编码,以提供至少一个编码话音帧。编码话音帧具有多个第一灵敏度比特位置和多个第二灵敏度比特位置。几个第二灵敏度比特位置被选择用于丢弃。编码话音帧中与被选择的几个第二灵敏度比特位置相对应的比特被丢弃,以提供至少一个压缩编码话音帧,该至少一个压缩编码话音帧被存储。该存储的至少一个压缩编码话音帧被读出。在位置上与该至少一个编码话音帧中被丢弃的比特相对应的、具有随机值或已知值的替换比特被插入,以提供具有所要求的长度的重构话音帧。该重构话音帧被解码,以提供一个话音输出信号。存储和检索操作可以在移动终端进行。
在本发明的其它实施例中,提供了存储编码音频帧的方法。待存储的音频输入被接收。该接收的音频输入被话音编码,以提供多个编码音频帧。多个编码音频帧中被选择的几个被丢弃,以提供与待存储的音频输入有关的精简数量编码音频帧。该精简数量编码音频帧被存储。
在本发明的其它实施例中,提供了存储编码录音的系统。该系统包括存储器和声音编码器。声音编码器提供编码录音。该录音具有码元等级优先排列,并包括多个第一优先级码元和多个第二优先级码元。处理器选择几个第二优先级码元用于丢弃,并在存储器中存储该录音而不存储被选择的几个第二优先级码元。
在本发明的其它实施例中,提供了移动终端。移动终端包括存储器和声音编码器,其中声音编码器提供多个具有码元等级优先排列并包括多个第一优先级码元和多个第二优先级码元的编码话音帧。处理器选择几个第二优先级码元用于丢弃,并在存储器中存储话音帧而不存储被选择的几个第二优先级码元。该处理器还被进一步设置,以读出存储的话音帧,并在读出的话音帧中插入在位置上与被选择的几个第二优先级码元相对应的、具有随机值或已知值的替换码元,以提供具有所要求的长度的重构话音帧。该声音编码器还被进一步设置将该重构话音帧解码,以提供一个音频输出信号。
附图说明
图1为说明移动终端的原理框图,其中移动终端包括根据本发明的实施例的用于编码录音的压缩存储的系统;
图2为说明根据本发明的实施例存储压缩的编码录音的操作的流程图;
图3为说明根据本发明的实施例播放存储的压缩编码录音的操作的流程图。
具体实施例详细描述
现在,将在下文中参照示出了本发明的说明性实施例的附图,对本发明进行更充分的描述。但是,本发明可以用许多不同的形式体现,而不应该被解释为局限于这里提出的实施例;相反地,这些实施例被提供,为的是该公开将会全面和完整,并向该领域的普通技术人员充分传达本发明的范围。
如该领域的普通技术人员将会理解的,本发明可以体现为方法、系统或计算机程序产品。相应地,本发明可以采用完全硬件实施例的形式、完全软件实施例的形式或者结合软件方面与硬件方面的实施例的形式,所有这些在这里概括地被称为“电路”。另外,本发明可以采用存储在计算机可用存储媒体上的、具有包括在该媒体中的计算机可用程序代码工具的计算机程序产品的形式。可以利用任何合适的计算机可读媒体,包括硬盘,CD-ROM,光学存储设备,诸如那些支持因特网或企业内部互连网之类的传输媒体,或磁存储设备。
用于执行本发明的操作的计算机程序代码可以用诸如JAVA、Smalltalk或C++之类的面向对象的编程语言,或者用诸如C编程语言之类的通用过程式编程语言,或者用诸如汇编语言和/或微代码之类的低层代码编写。作为一个独立的软件包或者另一软件包的一部分,该程序代码可以完全在单个处理器中和/或在多个处理器之间执行。处理器可以合并到一个与支持话音(音频)通信的网络连接的计算机中,或者合并到一个诸如无线终端之类的音频通信设备中。所支持的音频通信可以通过局域网(LAN)、广域网(WAN)、无线通信媒体、有线通信媒体或其它这样的网络互连媒体,或者连接可以通过一个或多个外部计算机和/或数据处理系统(例如,利用因特网服务提供商通过因特网,或者通过分组交换网络或电路交换网络,如电话网络之类)形成。
下面将参照根据本发明的实施例的方法、装置(系统)和计算机程序产品的流程图图解和/或框图和/或流程图来描述本发明。需要理解的是,流程图图解和/或框图的每个块、以及流程图图解和/或框图中块的组合都可以通过计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生机器,以便经由计算机或其它可编程数据处理装置的处理器执行的指令创建实现流程图图解和/或框图和/或流程图的一个或多个块所规定的功能的工具。
这些计算机程序指令还可以存储在计算机可读存储器中,该存储器能控制计算机或其它可编程处理器以特定方式操作,以便存贮在计算机可读存储器中的指令产生一个产品,该产品包括实现流程图图解和/或框图和/或流程图的一个或多个块所规定的功能的指令装置。
计算机程序指令还可以装入计算机或其它可编程数据处理器中,以产生一系列将要在计算机或其它可编程处理器中执行的操作步骤,进而产生一个计算机执行进程,以便在计算机或其它可编程处理器中执行的指令提供实现流程图图解和/或框图和/或流程图的一个或多个块所规定的功能或动作的步骤。
现在将参照图1中无线终端的原理框图说明来描述本发明的实施例。图1示出了根据本发明的实施例的典型无线电话通信系统,该系统包括移动无线终端22和基站收发机24。移动终端22可以包括键盘/微型键盘26,显示器28,扬声器32,传声器34,收发机36和与处理器42通信的存储器38。收发机36一般包括分别通过天线48发射输出射频信号到基站收发机24的发射机电路44和从基站收发机24接收输入射频信号的接收机电路46。在移动终端22与基站收发机24之间传输的射频信号可以包括通信量和控制信号(例如,寻呼信号/呼入消息),它用于建立和保持与另一方或另一目的地的通信。
移动终端22的前述元件可以包含在许多常规移动终端中,并且它们的功能对该领域的普通技术人员来说一般是已知的。还应该理解的是,如这里所使用的,术语“移动终端”可以包括:具有或不具有多行显示的蜂窝式无线电话;可以将蜂窝式无线电话与数据处理功能、传真功能和数据通信功能组合在一起的个人通信系统(PCS)终端;可以包括无线电话、寻呼机、因特网接入/企业内部互连网接入、万维网浏览器、管理器、日历和/或全球定位系统(GPS)接收机的个人数字助理(PDA);以及传统的膝上型电脑和/或掌上型电脑接收机或其它包括无线电话收发机的装置。移动终端还可以被认为是“弥散(pervasive)计算技术”设备。
基站收发机24包括在蜂窝网络中定义了单个单元、并利用无线电链路协议与移动终端22以及单元中的其它移动终端通信的无线电收发机。尽管只示出了单个基站收发机24,但是,需要理解的是,许多基站收发机可以,例如,通过移动交换中心或其它设备进行连接,以定义一个无线通信网络。
根据示出的本发明的实施例,提供了将扬声器32和传声器34与处理器42接口的声音编码器33。在图1的无线终端中,来自用户的语音或其它音频信号通过传声器34一般被检测为模拟信号,然后通过一个或多个可以与声音编码器33合并的话音处理级,并被分别提供,以便为声音编码器33准备好一个输入信号。前置编码话音处理级可以包括音频电平调整、带通滤波和其后为附加高通滤波的模拟-数字转换(例如,13比特线性PCM格式或8比特MU-LAW格式)。
声音编码器33可以是多种不同的已知编码/解码器中的一个,并可以利用话音压缩算法(例如,ACELP或VSELP)将话音信号压缩为低速率数据比特流(例如,从64kbps到8kbps)和/或利用其它提供错误恢复机制的已知技术。可以通过声音编码器33或一个单独的信道编码器将另外的错误保护技术和/或纠错技术应用于数据流,例如,码元等级优先排列分配(至少第一和第二优先级码元,且其中一个为比另一个高的优先级)和诸如利用速率1/2卷积代码保护话音编码器数据流中更易受攻击的/重要比特之类的差分编码方法。对声音编码器帧的一些感知上最重要比特可以使用诸如循环冗余检查(CRC)之类的其它方法。
根据本发明的不同实施例,处理器42从声音编码器33接收编码录音,并利用编码录音的压缩存储将编码录音存储在存储器38中。因而,在本发明的不同实施例中,处理器42被设置、以选择几个与一个码元优先级有关的码元用于丢弃,并被设置、以在存储器38中存储相应的话音录音而不存储被选择的几个码元。处理器42还可以被设置,以从存储器38中读出存储的录音,解压缩读出的录音,并将它们提供给声音编码器33。声音编码器33可以依次将解压缩录音解码,以提供一个,例如,可以在扬声器32中播放的话音输出信号。
各种声音编码器33除了为需要通过通信媒体传输的数据量提供压缩外,还具有两种错误恢复机制。如上面所讨论的,第一种错误恢复机制可以应用于码元(或二进制码元的比特)级。对声音编码器33接收的比特,例如,根据比特对错误的灵敏度,分配(两个或多个等级的)优先级。最低灵敏比特能包含错误而大体上不影响语音(或其它音频信号)的感知质量。声音编码器33可以具有不同的优先级种类、不同的种类数量和关于每个种类的不同错误门限。但是,至少对用于无线网络的移动终端应用中的声音编码器来说,声音编码器33具有一定等级的比特级优先排列。
当一个具有太多错误的音频数据帧被接收以致整个帧被断定为不可用时,可以提供的第二种错误机制会发生。在这种情况下,声音编码器33可以提供一种帧替换功能。在这种情况下,接收的整个帧被丢弃,“噪声”或其它替换帧被插入,以填充与丢弃(或丢失)帧有关的时间周期。在典型的无线移动终端声音编码器中,帧时间可以为约20毫秒,可以包含约400到约600个比特。
尽管本发明可以包括在诸如移动终端22和/或基站收发机24之类的通信设备或系统中,但是本发明并不限于这些设备和/或系统。相反的,本发明可以具体表现为任何方法、发射机、通信设备、通信系统、或计算机程序产品中,在所述计算机程序产品中存储有其基本音频信号用一种或多种错误恢复机制编码的录音。可以根据本发明处理的典型录音包括话音备忘录、声音标识和/或录音。尽管针对本发明同无线移动终端的使用对本发明进行了说明,但是,要理解的是,本发明可用于任何无线通信系统,诸如蜂窝式基站或无线通信基础结构之类,或者可用于其它类型的系统,在该系统中声音编码器用来支持具有由该声音编码器提供的错误纠错机制的录音的传输。
图2和图3为根据本发明的实施例存储用于本地播放的音频信号录音的操作的流程图图解,操作可以通过移动终端22或其它音频处理设备执行。如下面将要描述的,本发明的不同实施例利用与声音编码器33有关的错误恢复机制,以减少各种类型的音频片段在诸如移动终端22之类的设备中需要存储的码元数量。例如,在结合一个存储的拨号号码来记录声音标识时,可以运行话音编码器33对该语音编码。在存储时,本发明的实施例可以跳过而不存储,例如,最低灵敏度(优先级)比特的50%和/或完全不存储被选择的几个(例如,每25个中选一个)帧。另外,要理解的是,本发明的实施例的变型包含在本发明中,诸如提供不同数量的低灵敏度比特和帧删除以适应存储器的存储要求、以及由此引起的播放语音的话音质量之类。因为话音编码器33具有错误恢复机制,所以本发明的不同实施例提供的压缩存储不需要附加成本就可以提供。换句话说,因为对本地播放来说,由话音编码器33提供的、以寻址错误敏感传输环境的错误恢复机制可以不是必需的,所以有关的本地存储录音可以在假定用于本地播放的存储器存储是大体上无错误环境的情况下,根据本发明的实施例压缩。
现在参照图2描述根据本发明的实施例存储编码录音的操作。操作从在块210接收诸如来自扬声器32的语音或话音输入之类的音频信号开始。然后,在块215,声音编码器33根据音频信号提供一个或多个录音。出自声音编码器33的录音具有码元(一般为比特)等级优先排列,并包括多个第一优先级码元和多个第二优先级码元。在不同的实施例中,第一优先级码元可以是高优先级码元,第二优先级码元可以是具有比高优先级码元低的优先级的低优先级码元。
在块220,一个或多个第二优先级码元被选择用于丢弃。例如,如与图2的块220邻近的示范性比特框图所示,可以提供一个选择掩码,规定录音中将被丢弃的码元(如图2所示的比特)位置。如图2所示,具有“1”值的掩码位置指定话音录音中被指定用于丢弃的相应原始比特,以产生如图2所示的精简比特数量压缩结果录音。
在本发明的特定实施例中,在块225,通过选择多个编码录音中的几个用于丢弃,可以在存储之前提供进一步压缩。如图2所示,在块225,对语音帧录音,每25个语音帧中有一个被选择用于丢弃。然后,在块230,存储一个或多个录音而不存储被选择的几个第二优先级码元、也不存储多个编码话音录音中被选择的几个。
在块230,可以选择待丢弃的第二优先级码元的数量,以在播放过程中提供根据存储录音而产生的音频输出信号所要求的质量。例如,在移动终端,声音标识在移动终端的本地播放质量可以通过被丢弃码元的数量来控制。类似地,在块225,可以选择多个编码录音中被选择用于丢弃的几个的数量,以提供根据存储录音而产生的音频输出信号所要求的质量。
通过例如与无线移动终端22结合的特定实施例,在块210接收的语音可以是话音备忘录、声音标识、或者是来自传声器34或从收发机36接收的输入话音信号的重新编码。在块215,将该话音输入编码,以提供至少一个具有多个第一灵敏度比特位置和第二灵敏度比特位置的编码话音帧。在块220,被选择的几个第二灵敏度比特位置被选择用于丢弃,且编码话音帧中与被选择的几个第二灵敏度比特位置相对应的比特被丢弃,以提供一个或多个压缩编码话音帧。然后,在块230将该压缩编码话音帧存储。例如,第二灵敏度比特可以是由选择掩码选择的用于丢弃的低灵敏度比特。类似地,如上面所讨论的,被选择的几个话音帧可以被丢弃。在另外的实施例中,可以仅通过丢弃被选择的比特或者仅通过丢弃被选择的几个编码录音,或者按照上面所描述的方法提供压缩,两种方法都可以用来在存储之前压缩录音。
现在将参照图3对与压缩存储录音的播放有关的操作进行进一步描述。如图3的实施例所示,操作从在块310读出存储录音开始,例如,对来自一个移动终端22用户的请求响应。在本发明删除几个录音而使在块310读出的存储编码话音录音被压缩的特定实施例中,将替换录音添加到读出的多个编码录音中,其中替换录音与存储之前在块225被删除的多个编码录音中的几个相对应。
在块320,与录音被存储之前所删除的被选择的几个第二优先级码元相对应的替换码元被插入读出的录音中。例如,邻近图3的块320示出的示范性操作的原理比特框图与参照图2的块220所描述的示范性压缩操作相对应。具体来说,在块320,相应的选择掩码用来指定比特位置,替换比特被插入该比特位置以填充录音,进而生成具有预定长度的新录音(或如图3所示的语音帧)。然后,在块325,重构录音被解码,以提供一个话音输出信号。例如,常规的声音编码器“解码”操作可以用于重构录音。然后,在块330可以播放语音。
图1至图3的流程图、程序框图和框图说明了用于提供流数据服务的系统、方法和计算机程序产品的可能装置的结构、功能和操作。在这点上,流程图或框图中的每个块可以代表一个模块、一个片段或代码的一部分,包括一个或多个实现特定逻辑动作的可执行指令。还应该注意到,在一些替换实施方案中,块中提到的动作可以不按照如图所示的顺序发生。例如,两个连续示出的块实际上可以大体上并发执行,或者,有时这些块可以根据有关的功能按照相反的顺序执行。
在附图和规范中,公开了本发明的典型说明性实施例,另外,尽管使用了一些特定的术语,但是它们仅用于通用和描述意义而并非用于限制目的,本发明的范围将在下面的权利要求中提出。

Claims (40)

1.一种存储用于本地播放的编码录音的方法,包括:
提供录音,该录音具有码元等级优先排列,并包括多个第一优先级码元和多个第二优先级码元;
选择几个第二优先级码元用于丢弃;和
存储该录音而不存储被选择的几个第二优先级码元。
2.根据权利要求1所述的方法,其特征在于,第一优先级码元包括高优先级码元,第二优先级码元包括具有比高优先级码元低的优先级的低优先级码元。
3.根据权利要求2所述的方法,其特征在于,提供录音包括提供多个具有码元等级优先排列、并包括多个高优先级码元和多个具有比高优先级码元低的优先级的低优先级码元的编码录音,该方法还包括选择多个编码录音中的几个用于丢弃,以及,其中存储录音的步骤还包括存储多个编码录音而不存储多个编码录音中被选择的几个。
4.根据权利要求3所述的方法,其特征在于,选择几个第二优先级码元用于丢弃的步骤包括提供规定了录音中待丢弃的码元位置的选择掩码,以及,其中存储录音而不存储被选择的几个第二优先级码元的步骤包括存储录音而不存储多个编码录音中由选择掩码规定的几个较低的优先级码元。
5.根据权利要求4所述的方法,其特征在于,码元包括比特,录音包括帧。
6.根据权利要求2所述的方法,其特征在于,选择几个第二优先级码元用于丢弃的步骤包括提供规定了录音中待丢弃的码元位置的选择掩码,以及,其中存储录音而不存储被选择的几个第二优先级码元的步骤包括存储录音而不存储录音中由该选择掩码规定的几个较低的优先级码元。
7.根据权利要求6所述的方法,其特征在于,码元包括比特,录音包括帧。
8.根据权利要求1所述的方法,其特征在于,还包括:
读出存储录音;
将与被选择的几个第二优先级码元相对应的替换码元插入读出的存储录音,以提供一个重构录音;和
将该重构录音解码,以提供一个音频输出信号。
9.根据权利要求3所述的方法,其特征在于,还包括:
读出存储的多个编码录音;
将与多个编码录音中被选择的几个相对应的替换录音添加到读出的多个编码录音;
将与被选择的几个第二优先级码元相对应的替换码元插入所读出的存储的多个录音;以及,然后
将包括所添加的替换录音和所插入的替换码元的多个编码录音解码,以提供一个音频输出信号。
10.根据权利要求9所述的方法,其特征在于,音频输出录音包括话音备忘录、声音标识和录音中的至少一个。
11.根据权利要求1所述的方法,其特征在于,还包括:选择许多待丢弃的几个第二优先级码元,以提供根据存储录音而产生的音频输出信号所要求的质量。
12.根据权利要求3所述的方法,其特征在于,还包括:选择许多多个编码录音中待丢弃的几个,以提供根据存储录音而产生的音频输出信号所要求的质量。
13.一种存储和检索编码话音帧的方法,包括:
接收待存储的话音输入;
将该接收的话音输入进行话音编码,以提供至少一个编码话音帧,该至少一个编码话音帧具有多个第一灵敏度比特位置和多个第二灵敏度比特位置;
选择几个第二灵敏度比特位置用于丢弃;
丢弃该至少一个编码话音帧中与被选择的几个第二灵敏度比特位置相对应的比特,以提供至少一个压缩编码话音帧;
存储该至少一个压缩编码话音帧;
读出该存储的至少一个压缩编码话音帧;
插入与该至少一个编码话音帧中被丢弃的比特相对应的替换比特,以提供一个重构话音帧;和
将该重构话音帧解码,以提供一个话音输出信号。
14.根据权利要求13所述的方法,其特征在于,话音输入包括话音备忘录、声音标识和录音中的至少一个。
15.根据权利要求13所述的方法,其特征在于,第二灵敏度比第一灵敏度低。
16.根据权利要求13所述的方法,其特征在于,操作在移动终端执行。
17.根据权利要求13所述的方法,其特征在于,选择几个第二灵敏度比特位置用于丢弃的步骤包括提供规定了至少一个编码话音帧中待丢弃的比特位置的选择掩码,以及,其中丢弃该至少一个编码话音帧中与被选择的几个第二灵敏度比特位置相对应的比特的步骤包括:丢弃该至少一个编码话音帧中由该选择掩码规定的比特,以提供至少一个压缩编码话音帧。
18.根据权利要求13所述的方法,其特征在于,
至少一个编码话音帧包括多个编码话音帧;
其中该方法还包括丢弃多个编码话音帧中被选择的几个,以提供与待存储的话音输入有关的精简数量编码话音帧;
其中丢弃至少一个编码话音帧中与被选择的几个第二灵敏度比特位置相对应的比特以提供至少一个压缩编码话音帧的步骤包括:丢弃精简数量编码话音帧中与被选择的几个第二灵敏度比特位置相对应的比特,以提供多个压缩编码话音帧;和
其中存储至少一个压缩编码话音帧包括存储多个压缩编码话音帧。
19.根据权利要求18所述的方法,其特征在于,读出存储的至少一个压缩编码话音帧的步骤包括读出存储的多个压缩编码话音帧,以及,其中该方法还包括添加与所丢弃的多个编码话音帧中的被选择的几个相对应的替换话音帧到读出的多个压缩编码话音帧,其中插入替换比特包括将与精简数量编码话音帧中被丢弃的比特相对应的替换比特插入所读出的存储的多个话音录音,和,其中将重构话音帧解码的步骤包括:将包括所添加的替换话音帧和所插入的替换比特的多个压缩编码话音帧解码,以提供一个话音输出信号。
20.一种存储编码音频帧的方法,包括:
接收待存储的音频输入;
将该接收的音频输入进行话音编码,以提供多个编码音频帧;
丢弃多个编码音频帧中被选择的几个,以提供与待存储的音频输入有关的精简数量编码音频帧;
存储该精简数量编码音频帧。
21.根据权利要求20所述的方法,其特征在于,还包括:
读出存储的精简数量编码音频帧;
添加与所丢弃的多个编码音频帧中被选择的几个相对应的替换音频帧到读出的精简数量编码音频帧,以提供一个补充的多个编码音频帧;以及,然后
将该补充的多个编码音频帧解码,以提供一个音频输出信号。
22.一种存储编码录音的系统,包括:
存储器;
提供编码录音的声音编码器,该录音具有码元等级优先排列,并包括多个第一优先级码元和多个第二优先级码元;和
处理器,该处理器选择几个第二优先级码元用于丢弃,并在存储器中存储该录音而不存储被选择的几个第二优先级码元。
23.根据权利要求22所述的系统,其特征在于,声音编码器提供具有码元等级优先排列、并包括多个高优先级码元和多个具有比高优先级码元低的优先级的低优先级码元的多个编码录音,其中处理器还被设置,以选择多个编码录音中的几个用于丢弃,并存储多个编码录音而不存储多个编码录音中被选择的几个。
24.根据权利要求23所述的系统,其特征在于,还包括规定了录音中待丢弃的码元位置的选择掩码,以及,其中处理器还被设置,以存储多个编码录音而不存储多个编码录音中由该选择掩码规定的几个较低的优先级码元。
25.根据权利要求24所述的系统,其特征在于,码元包括比特,录音包括帧。
26.根据权利要求22所述的系统,其特征在于,处理器还被设置,读出存储录音,并将与被选择的几个第二优先级码元相对应的替换码元插入读出的存储录音,以提供一个重构录音,以及,其中声音编码器还被设置将该重构录音解码,以提供一个音频输出信号。
27.根据权利要求23所述的系统,其特征在于,处理器还被设置,以读出存储的多个编码录音,添加与多个编码录音中被选择的几个相对应的替换录音到读出的多个编码录音,并将与被选择的几个第二优先级码元相对应的替换码元插入所读出的存储的多个录音,以及,其中声音编码器还被设置,将包括所添加的替换录音和所插入的替换码元的多个编码录音解码,以提供一个音频输出信号。
28.根据权利要求27所述的系统,其特征在于,音频输出录音包括话音备忘录、声音标识和录音中的至少一个。
29.一种存储用于本地播放的编码录音的系统,包括:
提供录音的装置,该录音具有码元等级优先排列,并包括多个第一优先级码元和多个第二优先级码元;
选择几个第二优先级码元用于丢弃的装置;和
存储录音而不存储被选择的几个第二优先级码元的装置。
30.一种存储和检索编码话音帧的系统,包括:
接收待存储的话音输入的装置;
将接收的话音输入进行话音编码、以提供至少一个编码话音帧的装置,该至少一个编码话音帧具有多个第一灵敏度比特位置和多个第二灵敏度比特位置;
选择几个第二灵敏度比特位置用于丢弃的装置;
丢弃该至少一个编码话音帧中与被选择的几个第二灵敏度比特位置相对应的比特、以提供至少一个压缩编码话音帧的装置;
存储该至少一个压缩编码话音帧的装置;
读出该存储的至少一个压缩编码话音帧的装置;
将与该至少一个编码话音帧中被丢弃的比特相对应的替换比特插入、以提供一个重构话音帧的装置;和
将该重构话音帧解码、以提供一个话音输出信号的装置。
31.根据权利要求30所述的系统,其特征在于,选择几个第二灵敏度比特位置用于丢弃的装置包括规定了至少一个编码话音帧中待丢弃的比特位置的选择掩码,以及,其中丢弃至少一个编码话音帧中与被选择的几个第二灵敏度比特位置相对应的比特的装置包括丢弃该至少一个编码话音帧中由该选择掩码规定的比特、以提供至少一个压缩编码话音帧的装置。
32.根据权利要求30所述的系统,其特征在于,进行话音编码的装置包括将接收的话音输入进行话音编码、以提供多个编码话音帧的装置,该系统还包括:
丢弃多个编码话音帧中被选择的几个、以提供与待存储的话音输入有关的精简数量编码话音帧的装置;
其中丢弃至少一个编码话音帧中与被选择的几个第二灵敏度比特位置相对应的比特、以提供至少一个压缩编码话音帧的装置包括丢弃精简数量编码话音帧中与被选择的几个第二灵敏度比特位置相对应的比特、以提供多个压缩编码话音帧的装置;和
其中存储至少一个压缩编码话音帧的装置包括存储多个压缩编码话音帧的装置。
33.一种存储编码音频帧的系统,包括:
接收待存储的音频输入的装置;
将该接收的音频输入进行话音编码、以提供多个编码音频帧的装置;
丢弃多个编码音频帧中被选择的几个、以提供与待存储的音频输入有关的精简数量编码音频帧的装置;和
存储该精简数量编码音频帧的装置。
34.一种存储用于本地播放的编码录音的计算机程序产品,该计算机程序产品包括:
计算机可读存储媒体,具有包括在所述媒体中的计算机可读程序代码,所述计算机可读程序代码包括:
提供录音的计算机可读程序代码,该录音具有码元等级优先排列,并包括多个第一优先级码元和多个第二优先级码元;
选择几个第二优先级码元用于丢弃的计算机可读程序代码;和
存储该录音而不存储被选择的几个第二优先级码元的计算机可读程序代码。
35.一种存储和检索编码话音帧的计算机程序产品,该计算机程序产品包括:
计算机可读存储媒体,具有包括在所述媒体中的计算机可读程序代码,所述计算机可读程序代码包括:
接收待存储的话音输入的计算机可读程序代码;
将该接收的话音输入进行话音编码、以提供至少一个编码话音帧的计算机可读程序代码,该至少一个编码话音帧具有多个第一灵敏度比特位置和多个第二灵敏度比特位置;
选择几个第二灵敏度比特位置用于丢弃的计算机可读程序代码;
丢弃该至少一个编码话音帧中与被选择的几个第二灵敏度比特位置相对应的比特、以提供至少一个压缩编码话音帧的计算机可读程序代码;
存储该至少一个压缩编码话音帧的计算机可读程序代码;
读出该存储的至少一个压缩编码话音帧的计算机可读程序代码;
插入与该至少一个编码话音帧中被丢弃的比特相对应的替换比特、以提供一个重构话音帧的计算机可读程序代码;和
将该重构话音帧解码、以提供一个话音输出信号的计算机可读程序代码。
36.根据权利要求35所述的计算机程序产品,其特征在于,选择几个第二灵敏度比特位置用于丢弃的计算机可读程序代码包括规定了至少一个编码话音帧中待丢弃的比特位置的选择掩码,以及,其中丢弃至少一个编码话音帧中与被选择的几个第二灵敏度比特位置相对应的比特的计算机可读程序代码包括丢弃该至少一个编码话音帧中由该选择掩码规定的比特、以提供至少一个压缩编码话音帧的计算机可读程序代码。
37.根据权利要求35所述的计算机程序产品,其特征在于,进行话音编码的计算机可读程序代码包括将接收的话音输入进行话音编码、以提供多个编码话音帧的计算机可读程序代码,该计算机程序产品还包括:
丢弃多个编码话音帧中被选择的几个、以提供与待存储的话音输入有关的精简数量编码话音帧的计算机可读程序代码;
其中丢弃至少一个编码话音帧中与被选择的几个第二灵敏度比特位置相对应的比特、以提供至少一个压缩编码话音帧的计算机可读程序代码包括丢弃精简数量编码话音帧中与被选择的几个第二灵敏度比特位置相对应的比特、以提供多个压缩编码话音帧的计算机可读程序代码;和
其中存储至少一个压缩编码话音帧的计算机可读程序代码包括存储多个压缩编码话音帧的计算机可读程序代码。
38.一种存储编码话音帧的计算机程序产品,该计算机程序产品包括:
计算机可读存储媒体,具有包括在所述媒体中的计算机可读程序代码,所述计算机可读程序代码包括:
接收待存储的话音输入的计算机可读程序代码;
将该接收的话音输入进行话音编码、以提供多个编码话音帧的计算机可读程序代码;
丢弃多个编码话音帧中被选择的几个、以提供与待存储的话音输入有关的精简数量编码话音帧的计算机可读程序代码;和
存储该精简数量编码话音帧的计算机可读程序代码。
39.一种移动终端,包括:
存储器;
提供多个具有码元等级优先排列、并包括多个第一优先级码元和多个第二优先级码元的编码话音帧的声音编码器;
处理器,该处理器选择几个第二优先级码元用于丢弃,在存储器中存储话音帧而不存储被选择的几个第二优先级码元,读出存储的话音帧,并将与被选择的几个第二优先级码元相对应的替换码元插入读出的存储话音帧,以提供重构话音帧;和
其中声音编码器还被设置将该重构话音帧解码,以提供一个音频输出信号。
40.根据权利要求39所述的移动终端,其特征在于,处理器还被设置,以选择多个编码话音帧中的几个用于丢弃,并存储该多个编码话音帧而不存储多个编码话音帧中被选择的几个。
CNB038144379A 2002-06-19 2003-05-21 压缩存储的音频的方法和系统 Expired - Fee Related CN1333384C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/175,311 US20030236674A1 (en) 2002-06-19 2002-06-19 Methods and systems for compression of stored audio
US10/175,311 2002-06-19

Publications (2)

Publication Number Publication Date
CN1662959A true CN1662959A (zh) 2005-08-31
CN1333384C CN1333384C (zh) 2007-08-22

Family

ID=29733833

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB038144379A Expired - Fee Related CN1333384C (zh) 2002-06-19 2003-05-21 压缩存储的音频的方法和系统

Country Status (7)

Country Link
US (1) US20030236674A1 (zh)
EP (1) EP1516319A2 (zh)
JP (1) JP2005534955A (zh)
CN (1) CN1333384C (zh)
AU (1) AU2003237202A1 (zh)
BR (1) BR0311933A (zh)
WO (1) WO2004001721A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101394634A (zh) * 2008-09-24 2009-03-25 宇龙计算机通信科技(深圳)有限公司 一种处理通话录音的方法及移动终端

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10230809B4 (de) * 2002-07-08 2008-09-11 T-Mobile Deutschland Gmbh Verfahren zur Übertragung von Audiosignalen nach dem Verfahren der priorisierenden Pixelübertragung
US7211721B2 (en) * 2004-10-13 2007-05-01 Motorola, Inc. System and methods for memory-constrained sound synthesis using harmonic coding
US20060158357A1 (en) * 2005-01-19 2006-07-20 Visteon Global Technologies, Inc. Text compression method for multi-level display
US9451200B2 (en) 2005-06-02 2016-09-20 Invention Science Fund I, Llc Storage access technique for captured data
US8253821B2 (en) 2005-10-31 2012-08-28 The Invention Science Fund I, Llc Degradation/preservation management of captured data
US9967424B2 (en) 2005-06-02 2018-05-08 Invention Science Fund I, Llc Data storage usage protocol
US8964054B2 (en) 2006-08-18 2015-02-24 The Invention Science Fund I, Llc Capturing selected image objects
US9942511B2 (en) 2005-10-31 2018-04-10 Invention Science Fund I, Llc Preservation/degradation of video/audio aspects of a data stream
US8233042B2 (en) 2005-10-31 2012-07-31 The Invention Science Fund I, Llc Preservation and/or degradation of a video/audio data stream
US9167195B2 (en) 2005-10-31 2015-10-20 Invention Science Fund I, Llc Preservation/degradation of video/audio aspects of a data stream
US9621749B2 (en) 2005-06-02 2017-04-11 Invention Science Fund I, Llc Capturing selected image objects
US20070222865A1 (en) 2006-03-15 2007-09-27 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Enhanced video/still image correlation
US10003762B2 (en) 2005-04-26 2018-06-19 Invention Science Fund I, Llc Shared image devices
US9093121B2 (en) 2006-02-28 2015-07-28 The Invention Science Fund I, Llc Data management of an audio data stream
US8681225B2 (en) 2005-06-02 2014-03-25 Royce A. Levien Storage access technique for captured data
US7782365B2 (en) 2005-06-02 2010-08-24 Searete Llc Enhanced video/still image correlation
US8072501B2 (en) 2005-10-31 2011-12-06 The Invention Science Fund I, Llc Preservation and/or degradation of a video/audio data stream
US20070120980A1 (en) 2005-10-31 2007-05-31 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Preservation/degradation of video/audio aspects of a data stream
WO2008143871A1 (en) * 2007-05-15 2008-11-27 Radioframe Networks, Inc. Transporting gsm packets over a discontinuous ip based network
WO2009067322A1 (en) * 2007-11-19 2009-05-28 General Instrument Corporation Method and apparatus for encrypting and decrypting encoded audio information
JP5006772B2 (ja) * 2007-12-04 2012-08-22 日本電信電話株式会社 符号化方法、この方法を用いた装置、プログラム、記録媒体
JP5006774B2 (ja) * 2007-12-04 2012-08-22 日本電信電話株式会社 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体
JP5006773B2 (ja) * 2007-12-04 2012-08-22 日本電信電話株式会社 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体
CN111554312A (zh) * 2020-05-15 2020-08-18 西安万像电子科技有限公司 控制音频编码类型的方法、装置和系统

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL9000338A (nl) * 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
US5881104A (en) * 1996-03-25 1999-03-09 Sony Corporation Voice messaging system having user-selectable data compression modes
US5924064A (en) * 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns
IL122714A (en) * 1997-04-02 2011-06-30 Samsung Electronics Co Ltd Digital data coding/decoding method and apparatus
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US20010056353A1 (en) * 1997-05-02 2001-12-27 Gerald Laws Fine-grained synchronization of a decompressed audio stream by skipping or repeating a variable number of samples from a frame
JP3869127B2 (ja) * 1998-08-28 2007-01-17 株式会社日立コミュニケーションテクノロジー プロトコル処理方法及びプロトコル処理装置
US6185525B1 (en) * 1998-10-13 2001-02-06 Motorola Method and apparatus for digital signal compression without decoding
JP3522137B2 (ja) * 1998-12-18 2004-04-26 富士通株式会社 可変レート符号化・復号装置
US6366888B1 (en) * 1999-03-29 2002-04-02 Lucent Technologies Inc. Technique for multi-rate coding of a signal containing information
KR100518178B1 (ko) * 2000-06-09 2005-09-29 (주)로보티즈 멀티미디어 장치를 통한 데이터 다운로드 방법
US6807528B1 (en) * 2001-05-08 2004-10-19 Dolby Laboratories Licensing Corporation Adding data to a compressed data frame

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101394634A (zh) * 2008-09-24 2009-03-25 宇龙计算机通信科技(深圳)有限公司 一种处理通话录音的方法及移动终端

Also Published As

Publication number Publication date
AU2003237202A8 (en) 2004-01-06
EP1516319A2 (en) 2005-03-23
BR0311933A (pt) 2005-03-29
AU2003237202A1 (en) 2004-01-06
JP2005534955A (ja) 2005-11-17
CN1333384C (zh) 2007-08-22
US20030236674A1 (en) 2003-12-25
WO2004001721A2 (en) 2003-12-31
WO2004001721A3 (en) 2004-08-12

Similar Documents

Publication Publication Date Title
CN1333384C (zh) 压缩存储的音频的方法和系统
KR100563293B1 (ko) 음성 복호화에서 음성 프레임 오류 은폐를 위한 방법 및시스템
CN106664161B (zh) 基于冗余的包传输错误恢复的系统和方法
JP4485067B2 (ja) ソース符号化ディジタル信号の送信方法
KR100908114B1 (ko) 스케일러블 무손실 오디오 부호화/복호화 장치 및 그 방법
US20080228472A1 (en) Audio Data Packet Format and Decoding Method thereof and Method for Correcting Mobile Communication Terminal Codec Setup Error and Mobile Communication Terminal Performance Same
EP1281172A2 (en) Method and apparatus for compression of speech encoded parameters
KR20060107120A (ko) 이동통신 단말기의 음성코덱 전환 방법
JP2001503233A (ja) 可変レートデータをデコードする方法及び装置
AU713608B2 (en) Mobile radio telephone capable of recording/reproducing voice signal and method for controlling the same
US10607624B2 (en) Signal codec device and method in communication system
WO2008063735A2 (en) Payload header compression in an rtp session
US20080140392A1 (en) Codec mode decoding method and apparatus for adaptive multi-rate system
US20110026581A1 (en) Scalable Coding with Partial Eror Protection
JP2000165349A (ja) 送信機およびデジタル信号を受信機に送信するための方法
FI112834B (fi) Menetelmä ja järjestely äänen toistamista varten poistojen aikana
JPH09506187A (ja) Adpcm音声コーダのための適応誤差制御
KR100462024B1 (ko) 부가 음성 데이터를 이용한 패킷 손실 복구 방법 및 이를이용한 송수신기
JP3254126B2 (ja) 可変レート符号化方式
CN100578616C (zh) 代码转换方法和设备
US20050091047A1 (en) Method and apparatus for network communication
JP2002533013A (ja) フレーム内に構造化された情報の伝送符号化乃至復号化用の方法及び装置
KR101563555B1 (ko) 디지털 오디오 바이너리 프레임 내의 바이너리 에러들의 프로세싱
KR19990045553A (ko) 전화장치 및 음성 기록방법
KR20050027272A (ko) 스피치 프레임들의 에러 경감을 위한 스피치 통신 유닛 및방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070822

Termination date: 20160521