CN103366781B - 音频数据解码方法及装置 - Google Patents
音频数据解码方法及装置 Download PDFInfo
- Publication number
- CN103366781B CN103366781B CN201310110159.4A CN201310110159A CN103366781B CN 103366781 B CN103366781 B CN 103366781B CN 201310110159 A CN201310110159 A CN 201310110159A CN 103366781 B CN103366781 B CN 103366781B
- Authority
- CN
- China
- Prior art keywords
- frame
- audio
- audio frame
- mistake
- field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 230000005236 sound signal Effects 0.000 claims abstract description 19
- 230000005540 biological transmission Effects 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
Abstract
在接收音频信号来进行解码时,会检查发送的数据与接收的数据之间是否存在错误,根据检查结果丢弃发生错误的音频帧,并对剩余的音频帧进行解码。如上所述,因丢弃了具有错误的音频帧,因此会发生音频帧的丢失,并且因为音频帧的丢失导致音频输出时发生强噪音。本发明涉及防止这种噪音发生的音频信号解码方法及装置,储存正常状态的音频帧的数据字段后,复制到具有错误的音频帧上,从而使所述具有错误的音频帧也被识别为正常的音频帧。由此,防止音频帧丢失并对所有音频帧进行解码,从而使用户收听不发生噪音的音频来提高用户满意度的解码技术。
Description
技术领域
本发明的背景技术作为在音频数据的传输过程中,接收编码传输的音频信号后对音频信号进行解码来输出音频的技术,具体地说是涉及对接收的音频信号进行解码来输出为音频的过程中,用于防止因音频帧的丢失而发生噪音的解码方法及装置。
背景技术
使用作为多媒体文件格式之一的MP2(MPEG-1 LayerII及MPEG-2LayerII)的音频规格的音频信号的帧的结构,构成为如图1所示。并且各个音频帧中包括有头数据字段与SCF数据字段。
在此对其进行详细说明时,图1作为表示使用MP2音频规格的音频帧的结构,其音频帧大体是由头部分与有效载荷部分构成。音频帧的头部分100是对该音频帧的基本信息进行储存的字段,头字段旁会存在CRC值110,有效载荷部分中会储存有要传输的音频数据。另一方面,音频帧中还包括用于储存用户位置信息等的SCF数据字段120与SCF CRC字段130。
接收器接收音频信号来进行解码的过程中,会通过对音频帧进行有效性检查来判断发送的数据与接收的数据之间是否发生了错误,所述检查是利用字段中包括的信息而构成。
另一方面,因电波的强度变弱或其他理由导致音频帧损坏而导致所述错误检查结果判断为,接收的音频帧发生错误时,会丢弃该音频帧并且仅对剩余的音频帧进行解码来输出音频。
因此,根据以往音频信号的解码方法,检查接收的音频帧的错误来进行解码时,音频帧会发生丢失,并且因这种音频帧的丢失导致音频帧的连续性被破坏,并且在音频输出时因音频帧的连续性被破坏而导致发生噪音,从而导致存在有当用户收听音频时感到不适的问题。
图2作为表示上述以往的对接收的音频信号进行解码的方法的图,在对接收的音频帧的有效性进行检查的结果中,存在错误的音频帧(invalidaudio frame,无效音频帧200)时,丢弃了该音频帧并仅仅对剩余的音频帧执行了解码。这种音频帧的丢失导致了解码后输出的音频中发生了噪音。
发明内容
(要解决的技术问题)
本发明的目的在于提供解码方法及装置,即使在音频信号发生错误或丢失的情况下也可以稳定地再生音频信号。
(解决问题的手段)
为了解决如上所述的问题,本发明会在储存正常状态的音频帧的数据字段后,发生具有错误的音频帧时会复制所述正常状态的音频帧的数据字段。由此将所述具有错误的音频帧识别为正常,从而不丢弃该音频帧并进行解码,从而防止发生由音频帧的间断导致的噪音。
另一方面,具有错误的音频帧的情况,通常数据部分也会损坏,因此为了防止噪音发生,在不丢弃具有错误的音频帧并进行解码时,数据部分损坏的音频帧也会被解码并输出为音频。此时,输出的音频因为不正常,因此在损坏的音频帧连续存在时会发生收听此的用户感觉到很大的不适的问题。因此,为了解决这种问题,会测量损坏的音频帧的连续程度,并在超过临界值时,通过调节音频的输出来减轻用户所感到的不适。
(发明的效果)
本发明,通过最小化音频输出中发生的噪音来减轻用户对音频输出的不适感,并且在提高接收性能的同时,在弱电界中也可以稳定地再生音频,从而可以提高用户的满意度。
附图说明
图1是表示在MP2音频规格中的音频帧的结构的图。
图2是为了说明以往技术的解码过程中,对接收的音频帧的有效性进行检查后,发现错误的音频帧时的措施的图。
图3是表示根据本发明的一实施例的音频数据的解码方法的整体流程图。
图4是为了说明根据本发明的一实施例中,检查音频帧的有效性后,发现错误的音频帧时的措施的图。
图5是图示本发明中,当错误的音频帧连续时的调节音频输出的实施例的图。
图6是表示应用根据本发明的一实施例的解码方法的解码装置的框图。
具体实施方式
通过参照附图与以下详述的实施例,本发明的优点、特征以及实现他们的方法会更加明确。但本发明不限于以下所公开的实施例,而是可以由多种不同的形态来实现。本发明的实施例只是为了完整地公开本发明,并为了让本发明所属技术领域的普通技术人员容易理解发明范畴而提供的,本发明是以权利要求书的记载为准。一方面,本说明书中使用的技术用语是用于说明实施例,并非用来限定本发明。在说明书中提及的单数形式,在没有特别限定的情况下,则包括复数形式。说明书中使用的“包括(comprises)”或“包括的(comprising)”不排除为,在提及到的元件、步骤、动作和/或是组件以外,存在或添加其以外的一个以上的的其他元件、步骤、动作和/或是组件。
本发明为,即使在接收的音频帧中发生错误,也可以防止音频帧的丢失,从而防止发生噪音的发明。作为防止音频帧丢失的方法,是将正常状态的音频帧的信息复制到发生错误的音频帧上,从而识别为正常状态的音频帧来防止丢弃音频帧。因此,本发明的核心为,储存接收的音频信号中储存正常状态的音频帧的信息,之后将所述正常状态的音频帧的信息复制到发生错误的音频帧上,从而不丢弃发生错误的音频帧来进行解码。
特别是,使用MP2(MPEG-1 LayerII及MPEG-2 LayerII)的音频规格时,所有音频帧会包括头字段与SCF字段,因此,错误的确认是利用头字段与SCF字段的CRC值而构成,从而储存正常状态的音频帧的头字段与SCF字段后,当发现具有错误的音频帧时,复制储存的正常状态的音频帧的头字段与SCF字段的信息来对所有音频帧进行解码。
但是,具有错误的音频帧的情况,有效载荷部分的数据通常也是损坏的,因此即使对此进行解码也无法输出用户所能听到的正确的音频,因此在所述具有错误的音频帧连续时,用户在收听音频时会感到不适。为了减轻这种不适感,在损坏的音频帧连续时,通过阶段性地减少音频的输出来减轻用户的敏感度。
另一方面,相比MP2规格,压缩率更高的MP3(MPEG audio layer-3)的情况下,因为具有与MP2的格式类似的结构,因此在需要对具有MP3的规格的音频信号的解码的情况下,也可以应用根据本发明的一实施例的音频解码方法。
图3是表示本发明的整体流程图。
为了解码音频信号,会接收音频信号(S300),通过错误检查来在接收的音频信号中确认正常状态的音频帧,并将所述正常状态的音频帧的头信息与SCF信息储存于图6中所示的储存部620中(S310)。之后,确认对于接收的所有音频帧的头CRC与SCF CRC(S320),来检查音频帧是否存在错误(S330),根据检查结果存在具有错误而无效的音频帧时,将现有的已储存的所述正常状态的音频帧的头信息与SCF信息复制到所述具有错误而无效的音频帧上(S340)。随着正常状态的音频帧的信息复制到具有错误而无效的音频帧上,所有音频帧会识别为正常,因此会对所有帧进行解码过程(S350)。
另一方面,当具有错误而无效的音频帧过度存在时,即使识别为正常音频帧而进行解码并输出的音频也会不正常,因此在用回收听音频时会发生不适。为了解决这种不适,会测量错误的发生频率(S360),当错误的发生频率超过临界值时,调节音频输出(S370)来减少用户在收听解码并输出的音频时所感到的不适。
图4a、4b及4c是表示根据本发明的一实施例的解码接收的音频信号的方法。
图4a是表示存在有不连续的一个无效的音频帧时的解码方法,在存在具有错误的音频帧400时,将已储存的正常状态的音频帧的头信息410复制到具有错误的音频帧的头信息420上,从而使具有错误的音频帧是识别为看似有效,由此来构成对所有音频帧的解码。因此,可以防止音频帧的丢弃,从而防止因音频帧的间断导致发生的噪音。
图4b是表示在连续的两个音频帧发生错误时的解码方法。在具有错误的音频帧连续发生时,在第一个具有错误的音频帧以前的最初表现为正常状态的音频帧的头信息430复制到发生错误的音频帧的头信息440上。从而,发生错误的音频帧会被识别为有效的音频帧而进行解码,并且在发生错误的音频帧连续发生两个时不会减少音频输出。
图4c是表示连续N个的音频帧发生错误或规定区间中发生已设定的临界值以上的错误时的解码方法。此时,如图4b的情况相同,在第一个具有错误的音频帧以前的最初表现为正常状态的音频帧的头信息450复制到发生错误的音频帧的头信息460上,来使其识别为正常音频帧后,对所有音频帧进行解码。
但是,如上述的情况下,具有错误的音频帧因音频的数据部分也是损坏,因此即使解码并输出为音频也无法输出为正确的音频。因此,具有错误的音频帧过度存在时,收听解码输出的音频的用户会感到不适,因此需要测量错误的发生频率,当规定区间中发生错误的帧的个数N超过临界值时,为了满足用户的敏感度,会对音频输出进行阶段性地减少,图5中将对其进行说明。
图5是表示当发生错误的音频帧超过临界值而过度发生时,为了防止收听解码输出损坏数据部分的音频的用户感到不适,而调节音频输出的方法。将正常的音频帧被解码时的音频输出称之为电流增益(Current Gain)500时,最初连续的N个音频帧无效时,将音频输出减少相当于△J510,当第二次连续的N个音频帧无效时,将音频输出减少相当于△K520。
如上所述,具有错误而无效的音频帧的连续的数超过临界值时,阶段性地减少音频输出,从而减轻用户在收听解码输出损坏的音频数据的音频时所感到的不适。
上述说明中,规定区间及临界值可以通过,例如,通过实验来测量常人收听时感到不适的水准来进行设定;△J、△K亦可以通过实验来测量来进行调节,从而使常人收听时不会感到不适的水准来进行设定。
图6是表示应用所述解码方法的解码装置的框图。
解码装置包括:接收部600、控制部610、储存部620、输出部630,接收部600接收发送过来的音频信号;储存部620储存接收的音频信号中的正常状态的音频帧的数据字段;控制部610起到确认音频帧是否存在错误,并将所述正常状态的音频帧的数据字段复制到具有错误的音频帧上的功能;输出部630起到输出解码的音频的作用。
所述解码装置还可以包括调节部640,所述调节部640在具有错误的音频帧超过临界值而过度发生时,起到调节音频的输出的功能。
以上参照附图中对本发明的结构进行了详细地说明。但这仅仅为例示性,并不是用于限定本发明,本发明的范围应当由所记载的技术范围来进行确定。
Claims (6)
1.一种音频数据解码方法,涉及接收器的音频数据解码,其特征在于,包括:
储存正常状态的帧的数据字段的步骤;
确认后续帧的错误的步骤;
将所述正常状态的帧的数据字段复制到具有错误的帧上的步骤;及
将所述具有错误的帧与正常接收的帧一同进行解码的步骤;
所述帧的数据字段为,头字段与SCF字段。
2.根据权利要求1所述的音频数据解码方法,其特征在于,
所述储存正常状态的帧的数据字段的步骤,包括:
对接收的帧执行错误检查的步骤;及
根据检查结果,储存最初确认为正常的帧的数据字段的步骤。
3.根据权利要求1所述的音频数据解码方法,其特征在于,还包括:
测量错误发生频率的步骤;及
所述发生频率大于临界值时,调节音频输出的步骤。
4.根据权利要求3所述的音频数据解码方法,其特征在于,
所述调节音频输出的步骤为,根据错误发生频率来减少音频输出。
5.一种音频数据解码装置,其特征在于,包括:
接收部,接收音频信号;
储存部,储存正常状态的帧的数据字段;及
控制部,确认帧的错误,并将所述正常状态的帧的数据字段复制到具有错误的帧上;
所述帧的数据字段为,头字段与SCF字段。
6.根据权利要求5所述的音频数据解码装置,其特征在于,还包括:
调节部,根据错误的发生频率来调节音频的输出。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2012-0036172 | 2012-04-06 | ||
KR1020120036172A KR20130113742A (ko) | 2012-04-06 | 2012-04-06 | 오디오 데이터 디코딩 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103366781A CN103366781A (zh) | 2013-10-23 |
CN103366781B true CN103366781B (zh) | 2016-08-17 |
Family
ID=49367963
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310110159.4A Active CN103366781B (zh) | 2012-04-06 | 2013-04-01 | 音频数据解码方法及装置 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR20130113742A (zh) |
CN (1) | CN103366781B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0664536A1 (en) * | 1994-01-24 | 1995-07-26 | Nokia Mobile Phones Ltd. | Speech code processing |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7031926B2 (en) * | 2000-10-23 | 2006-04-18 | Nokia Corporation | Spectral parameter substitution for the frame error concealment in a speech decoder |
-
2012
- 2012-04-06 KR KR1020120036172A patent/KR20130113742A/ko not_active Application Discontinuation
-
2013
- 2013-04-01 CN CN201310110159.4A patent/CN103366781B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0664536A1 (en) * | 1994-01-24 | 1995-07-26 | Nokia Mobile Phones Ltd. | Speech code processing |
Also Published As
Publication number | Publication date |
---|---|
KR20130113742A (ko) | 2013-10-16 |
CN103366781A (zh) | 2013-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102358742B1 (ko) | 프로그램 정보 또는 서브스트림 구조 메타데이터를 갖는 오디오 인코더 및 디코더 | |
JP3943127B2 (ja) | Tdma無線システムにおけるソフト誤り補正 | |
US8578247B2 (en) | Bit error management methods for wireless audio communication channels | |
US8327211B2 (en) | Voice activity detection (VAD) dependent retransmission scheme for wireless communication systems | |
TW201207839A (en) | Concealing lost packets in a Sub-Band Coding decoder | |
CN102273094A (zh) | 接收数字音频数据的方法 | |
JPS6113820A (ja) | 誤り訂正符号の復号装置 | |
JP3636383B2 (ja) | 音声信号通信装置および伝送方法並びに受信機 | |
JP3676815B2 (ja) | テレコミュニケーションシステムにおけるスピーチコード化パラメータの処理方法 | |
WO2020135609A1 (zh) | 音频数据恢复方法、装置及蓝牙设备 | |
CN103366781B (zh) | 音频数据解码方法及装置 | |
TW200826541A (en) | Method and system for redundancy-based decoding of voice content in a wireless LAN system | |
JP5031963B2 (ja) | ディジタルオーディオデータ復号化方法 | |
US8533551B2 (en) | Audio error detection and processing | |
JP2004518350A (ja) | データストリームのロスレス伝送を保護する方法及び装置 | |
Wang | A Beat-Pattern based Error Concealment Scheme for Music Delivery with Burst Packet Loss. | |
US20140257800A1 (en) | Error concealment for speech decoder | |
JP4813747B2 (ja) | ディジタルオーディオデータの伝送エラーのエラーコンシールメント方法 | |
CN113707160A (zh) | 一种回声延迟确定方法、装置、设备及存储介质 | |
JP3957211B2 (ja) | 2重化音声信号の障害検出装置 | |
JP3187953B2 (ja) | 無線通信装置 | |
KR20100100224A (ko) | 디코딩 장치 및 디코딩 방법 | |
WO2023024507A1 (zh) | 音频处理方法、装置、终端及计算机可读存储介质 | |
JP4668542B2 (ja) | 状況通知装置、電子機器および状況通知方法 | |
US20150039979A1 (en) | Method and apparatus for concealing error in communication system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |