JP6264673B2 - ロストフレームを処理するための方法および復号器 - Google Patents

ロストフレームを処理するための方法および復号器 Download PDF

Info

Publication number
JP6264673B2
JP6264673B2 JP2016526411A JP2016526411A JP6264673B2 JP 6264673 B2 JP6264673 B2 JP 6264673B2 JP 2016526411 A JP2016526411 A JP 2016526411A JP 2016526411 A JP2016526411 A JP 2016526411A JP 6264673 B2 JP6264673 B2 JP 6264673B2
Authority
JP
Japan
Prior art keywords
frame
current lost
lost frame
current
high frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016526411A
Other languages
English (en)
Other versions
JP2016529542A (ja
Inventor
▲賓▼ 王
▲賓▼ 王
磊 苗
磊 苗
▲澤▼新 ▲劉▼
▲澤▼新 ▲劉▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=52320649&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP6264673(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2016529542A publication Critical patent/JP2016529542A/ja
Application granted granted Critical
Publication of JP6264673B2 publication Critical patent/JP6264673B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • G10L2025/937Signal energy in various frequency bands

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Description

本出願は、2013年7月16日に中国専利局に出願した、「METHOD FOR PROCESSING LOST FRAME, AND DECODER」と題する、中国特許出願第201310297740.1に対する優先権を主張するものであり、その全体が参照により本明細書に組み込まれている。
本発明は、通信の分野に関し、具体的には、ロストフレームを処理するための方法、および復号器に関する。
絶え間ない技術の進歩に伴い、ユーザは、通話品質についてますます高い要求を有するようになっている。音声帯域幅を増大させることが、通話品質を改善する主な方法である。追加帯域幅に関する情報が従来の符号化様式において符号化されている場合には、ビットレートは著しく増大する。この場合、現在のネットワーク帯域幅の制約により伝送の目的を達成することはできない。したがって、帯域幅拡張技術が、帯域幅を増大するために多くの場合は使用される。
帯域幅拡張技術を使用して高周波数帯域信号を符号化した後に、符号器側は、復号器側に符号化した信号を送信する。復号器側はまた、帯域幅拡張技術を使用して高周波数帯域信号をリカバリする。信号伝送中には、ネットワーク輻輳または障害または他の理由により、フレームロスが生じる可能性がある。パケットロスレートは信号品質に影響を与える大きな要因なので、フレームロスの状況において可能な限り正確にロストフレームをリカバリするために、フレームロス処理技術が提案されている。本技術においては、復号器側は、ロストフレームの合成高周波数帯域信号として前回のフレームの合成高周波数帯域信号を使用し、その後、最終的な高周波数帯域信号を取得するために、現在のロストフレームのサブフレームゲインおよび全体的なゲインを使用して合成高周波数帯域信号を調整し得る。しかしながら、本技術においては、現在のロストフレームのサブフレームゲインは固定値であり、固定勾配で前回のフレームの全体的なゲインを乗算することによって現在のロストフレームの全体的なゲインを取得しており、このことが、フレームロス前後の復元高周波数帯域信号の不連続な遷移、および復元高周波数帯域信号における重度のノイズの発生を引き起こす。
本発明の実施形態は、高周波数帯域信号の品質を改善することができる、ロストフレームを処理するための方法、および復号器を提供している。
第1の態様によれば、ロストフレームを処理するための方法を提供しており、方法は、現在のロストフレームの合成高周波数帯域信号を決定するステップと、現在のロストフレームに対応するリカバリ情報を決定するステップであって、リカバリ情報は、フレームロス前の符号化モード、フレームロス前に受信した最終フレームのフレームクラス、および連続してロストしたフレームの数であって、連続してロストしたフレームの数が現在のロストフレームまでに連続してロストしたフレームの数である、連続してロストしたフレームの数のうちの少なくとも1つを含む、ステップと、リカバリ情報に従って現在のロストフレームの全体的なゲイン勾配を決定するステップと、全体的なゲイン勾配および現在のロストフレームの前回のM個のフレームのうちの各フレームの全体的なゲインに従って現在のロストフレームの全体的なゲインを決定するステップであって、Mは正の整数である、ステップと、現在のロストフレームの高周波数帯域信号を取得するために、現在のロストフレームの全体的なゲインおよび現在のロストフレームのサブフレームゲインに従って現在のロストフレームの合成高周波数帯域信号を調整するステップとを含む。
第1の態様に準拠している、第1の可能な実施形態においては、リカバリ情報に従って現在のロストフレームの全体的なゲイン勾配を決定するステップは、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であり、連続してロストしたフレームの数が3以下であると決定される状況においては、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であり、連続してロストしたフレームの数が3以下であると決定される状況においては、全体的なゲイン勾配は1であると決定するステップを含む。
第1の態様に準拠している、第2の可能な実施形態においては、リカバリ情報に従って現在のロストフレームの全体的なゲイン勾配を決定するステップは、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であるかどうか、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であるかどうかを決定し得ない状況においては、フレームロス前に受信した最終フレームが無声フレームまたは有声フレームであり、連続してロストしたフレームの数が3以下であると決定されると、全体的なゲイン勾配を決定し、全体的なゲイン勾配を事前に設定した第1の閾値以下かつ0より大きくなるようにするステップを含む。
第1の態様に準拠している、第3の可能な実施形態においては、リカバリ情報に従って現在のロストフレームの全体的なゲイン勾配を決定するステップは、フレームロス前に受信した最終フレームが有声フレームの開始フレームであると決定される状況においては、またはフレームロス前に受信した最終フレームがオーディオフレームまたは無音フレームであると決定される状況においては、全体的なゲイン勾配を決定し、全体的なゲイン勾配を事前に設定した第1の閾値より大きくなるようにするステップを含む。
第1の態様に準拠している、第4の可能な実施形態においては、リカバリ情報に従って現在のロストフレームの全体的なゲイン勾配を決定するステップは、フレームロス前に受信した最終フレームが無声フレームの開始フレームであると決定される状況においては、全体的なゲイン勾配を決定し、全体的なゲイン勾配を事前に設定した第1の閾値以下かつ0より大きくなるようにするステップを含む。
第1の態様または第1の態様の第1の可能な実施形態から第4の可能な実施形態のうちのいずれかの実施形態に準拠している、第5の可能な実施形態においては、現在のロストフレームのサブフレームゲインを決定するステップは、リカバリ情報に従って現在のロストフレームのサブフレームゲイン勾配を決定するステップと、サブフレームゲイン勾配および現在のロストフレームの前回のN個のフレームのうちの各フレームのサブフレームゲインに従って現在のロストフレームのサブフレームゲインを決定するステップであって、Nは正の整数である、ステップとを含む。
第1の態様の第5の可能な実施形態に準拠している、第6の可能な実施形態においては、リカバリ情報に従って現在のロストフレームのサブフレームゲイン勾配を決定するステップは、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であるかどうか、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であるかどうかを決定し得ない状況においては、フレームロス前に受信した最終フレームが無声フレームであり、連続してロストしたフレームの数が3以下であると決定されると、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を事前に設定した第2の閾値以下かつ0より大きくなるようにするステップを含む。
第1の態様の第5の可能な実施形態に準拠している、第7の可能な実施形態においては、リカバリ情報に従って現在のロストフレームのサブフレームゲイン勾配を決定するステップは、フレームロス前に受信した最終フレームが有声フレームの開始フレームであると決定される状況においては、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を事前に設定した第2の閾値より大きくなるようにするステップを含む。
第2の態様によれば、ロストフレームを処理するための方法を提供しており、方法は、現在のロストフレームの合成高周波数帯域信号を決定するステップと、現在のロストフレームに対応するリカバリ情報を決定するステップであって、リカバリ情報は、フレームロス前の符号化モード、フレームロス前に受信した最終フレームのフレームクラス、および連続してロストしたフレームの数であって、連続してロストしたフレームの数が現在のロストフレームまでに連続してロストしたフレームの数である、連続してロストしたフレームの数のうちの少なくとも1つを含む、ステップと、リカバリ情報に従って現在のロストフレームのサブフレームゲイン勾配を決定するステップと、サブフレームゲイン勾配および現在のロストフレームの前回のN個のフレームのうちの各フレームのサブフレームゲインに従って現在のロストフレームのサブフレームゲインを決定するステップであって、Nは正の整数である、ステップと、現在のロストフレームの全体的なゲインを決定するステップと、現在のロストフレームの高周波数帯域信号を取得するために、現在のロストフレームのサブフレームゲインおよび現在のロストフレームの全体的なゲインに従って現在のロストフレームの合成高周波数帯域信号を調整するステップとを含む。
第2の態様に準拠している、第1の可能な実施形態においては、リカバリ情報に従って現在のロストフレームのサブフレームゲイン勾配を決定するステップは、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であるかどうか、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であるかどうかを決定し得ない状況においては、フレームロス前に受信した最終フレームが無声フレームであり、連続してロストしたフレームの数が3以下であると決定されると、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を事前に設定した第2の閾値以下かつ0より大きくなるようにするステップを含む。
第2の態様に準拠している、第2の可能な実施形態においては、リカバリ情報に従って現在のロストフレームのサブフレームゲイン勾配を決定するステップは、フレームロス前に受信した最終フレームが有声フレームの開始フレームであると決定される状況においては、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を事前に設定した第2の閾値より大きくなるようにするステップを含む。
第3の態様によれば、復号器を提供しており、復号器は、現在のロストフレームの合成高周波数帯域信号を決定するように構成される、第1の決定ユニットと、現在のロストフレームに対応するリカバリ情報を決定するように構成される、第2の決定ユニットであって、リカバリ情報は、フレームロス前の符号化モード、フレームロス前に受信した最終フレームのフレームクラス、および連続してロストしたフレームの数であって、連続してロストしたフレームの数が現在のロストフレームまでに連続してロストしたフレームの数である、連続してロストしたフレームの数のうちの少なくとも1つを含む、第2の決定ユニットと、リカバリ情報に従って現在のロストフレームの全体的なゲイン勾配を決定するように構成される、第3の決定ユニットと、全体的なゲイン勾配および現在のロストフレームの前回のM個のフレームのうちの各フレームの全体的なゲインに従って現在のロストフレームの全体的なゲインを決定するように構成される、第4の決定ユニットであって、Mは正の整数である、第4の決定ユニット、現在のロストフレームの高周波数帯域信号を取得するために、現在のロストフレームの全体的なゲインおよび現在のロストフレームのサブフレームゲインに従って現在のロストフレームの合成高周波数帯域信号を調整するように構成される、調整ユニットとを備える。
第3の態様に準拠している、第1の可能な実施形態においては、第2の決定ユニットは、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であり、連続してロストしたフレームの数が3以下であると決定される状況においては、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であり、連続してロストしたフレームの数が3以下であると決定される状況においては、全体的なゲイン勾配は1であると決定するように特に構成される。
第3の態様に準拠している、第2の可能な実施形態においては、第2の決定ユニットは、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であるかどうか、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であるかどうかを決定し得ない状況においては、フレームロス前に受信した最終フレームが無声フレームまたは有声フレームであり、連続してロストしたフレームの数が3以下であると決定されると、全体的なゲイン勾配を決定し、全体的なゲイン勾配を事前に設定した第1の閾値以下かつ0より大きくなるようにするように特に構成される。
第3の態様に準拠している、第3の可能な実施形態においては、第2の決定ユニットは、フレームロス前に受信した最終フレームが有声フレームの開始フレームであると決定される状況においては、またはフレームロス前に受信した最終フレームがオーディオフレームまたは無音フレームであると決定される状況においては、全体的なゲイン勾配を決定し、全体的なゲイン勾配を事前に設定した第1の閾値より大きくなるようにするように特に構成される。
第3の態様に準拠している、第4の可能な実施形態においては、第2の決定ユニットは、フレームロス前に受信した最終フレームが無声フレームの開始フレームであると決定される状況においては、全体的なゲイン勾配を決定し、全体的なゲイン勾配を事前に設定した第1の閾値以下かつ0より大きくなるようにするように特に構成される。
第3の態様または第3の態様の第1の可能な実施形態から第4の可能な実施形態のうちのいずれかの実施形態に準拠している、第5の可能な実施形態においては、復号器は、リカバリ情報に従って現在のロストフレームのサブフレームゲイン勾配を決定し、サブフレームゲイン勾配および現在のロストフレームの前回のN個のフレームのうちの各フレームのサブフレームゲインに従って現在のロストフレームのサブフレームゲインを決定するように構成される、第5の決定ユニットであって、Nは正の整数である、第5の決定ユニットをさらに備える。
第3の態様の第5の可能な実施形態に準拠している、第6の可能な実施形態においては、第5の決定ユニットは、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であるかどうか、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であるかどうかを決定し得ない状況においては、フレームロス前に受信した最終フレームが無声フレームであり、連続してロストしたフレームの数が3以下であると決定されると、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を事前に設定した第2の閾値以下かつ0より大きくなるようにするように特に構成される。
第3の態様の第5の可能な実施形態に準拠している、第7の可能な実施形態においては、第5の決定ユニットは、フレームロス前に受信した最終フレームが無声フレームの開始フレームであると決定される状況においては、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を事前に設定した第2の閾値より大きくなるようにするように特に構成される。
第4の態様によれば、復号器を提供しており、復号器は、現在のロストフレームの合成高周波数帯域信号を決定するように構成される、第1の決定ユニットと、現在のロストフレームに対応するリカバリ情報を決定するように構成される、第2の決定ユニットであって、リカバリ情報は、フレームロス前の符号化モード、フレームロス前に受信した最終フレームのフレームクラス、および連続してロストしたフレームの数であって、連続してロストしたフレームの数が現在のロストフレームまでに連続してロストしたフレームの数である、連続してロストしたフレームの数のうちの少なくとも1つを含む、第2の決定ユニットと、リカバリ情報に従って現在のロストフレームのサブフレームゲイン勾配を決定するように構成される、第3の決定ユニットと、サブフレームゲイン勾配および現在のロストフレームの前回のN個のフレームのうちの各フレームのサブフレームゲインに従って現在のロストフレームのサブフレームゲインを決定するように構成される、第4の決定ユニットであって、Nは正の整数である、第4の決定ユニット、現在のロストフレームの高周波数帯域信号を取得するために、現在のロストフレームのサブフレームゲインおよび現在のロストフレームの全体的なゲインに従って現在のロストフレームの合成高周波数帯域信号を調整するように構成される、調整ユニットとを備える。
第4の態様に準拠している、第1の可能な実施形態においては、第2の決定ユニットは、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であるかどうか、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であるかどうかを決定し得ない状況においては、フレームロス前に受信した最終フレームが無声フレームであり、連続してロストしたフレームの数が3以下であると決定されると、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を第2の閾値以下かつ0より大きくなるようにするように特に構成される。
第4の態様に準拠している、第2の可能な実施形態においては、第2の決定ユニットは、フレームロス前に受信した最終フレームが有声フレームの開始フレームであると決定される状況においては、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を第2の閾値より大きくなるようにするように特に構成される。
本発明の実施形態においては、現在のロストフレームの全体的なゲイン勾配を、リカバリ情報に従って決定し、現在のロストフレームの全体的なゲインを、全体的なゲイン勾配および現在のロストフレームの前回のM個のフレームのうちの各フレームの全体的なゲインに従って決定し、現在のロストフレームの合成高周波数帯域信号を、現在のロストフレームの全体的なゲインおよび現在のロストフレームのサブフレームゲインに従って調整する、その結果、現在のロストフレームの高周波数帯域信号の遷移は自然かつ滑らかになり得るし、高周波数帯域信号中のノイズを減衰し得る、それによって、高周波数帯域信号の品質を改善している。
本発明の実施形態における技術的解決手法をより明確に記載するために、本発明の実施形態を記載するために必要とされる添付の図面を以下に簡単に紹介する。以下の記載における添付の図面が本発明の一部の実施形態を示しているにすぎず、当業者が創造的努力なしにこれらの添付の図面から他の図面をさらに導出し得ることは明らかであろう。
本発明の実施形態による、ロストフレームを処理するための方法の概略フローチャートである。 本発明の別の実施形態による、ロストフレームを処理するための方法の概略フローチャートである。 本発明の実施形態による、ロストフレームを処理するための方法のプロセスの概略フローチャートである。 本発明の実施形態による、復号器の概略ブロック図である。 本発明の別の実施形態による、復号器の概略ブロック図である。 本発明の実施形態による、復号器の概略ブロック図である。 本発明の別の実施形態による、復号器の概略ブロック図である。
本発明の実施形態における添付の図面を参照して、本発明の実施形態における技術的解決手法を以下に明確かつ完全に記載する。記載した実施形態が本発明の実施形態のすべてではなく一部であることは明らかであろう。創造的努力なしに本発明の実施形態に基づいて当業者によって得られる他の実施形態のすべては、本発明の保護範囲に含まれるものとする。
符号化技術および復号技術は、様々な電子デバイス、例えば、携帯電話、無線装置、携帯情報端末(Personal Data Assistant、PDA)、ハンドヘルドまたはポータブルコンピュータ、全地球測位システム(Global Positioning System、GPS)受信機/ナビゲータ、カメラ、オーディオ/ビデオプレーヤ、ビデオカメラ、ビデオレコーダ、および監視装置に、幅広く応用されている。
音声帯域幅を増大させるために、帯域幅拡張技術が多くの場合は使用される。特に、符号器側は、コアレイヤ符号器を使用して低周波数帯域情報を符号化し、高周波数帯域信号について線形予測符号化(Linear Predictive Coding、LPC)分析を行って、高周波数帯域LPC係数を取得し得る。その後、ピッチ周期、代数コードブック、およびコアレイヤ符号器によって取得されゲインなどのパラメータに従って、高周波数帯域励起信号を取得する。LPCパラメータを使用して取得されるLPC合成フィルタによって高周波数帯域励起信号を処理した後に、合成高周波数帯域信号を取得する。元の高周波数帯域信号を合成高周波数帯域信号と比較することによって、サブフレームゲインおよび全体的なゲインを取得する。前述のLPC係数をLSFパラメータに変換して、LSFパラメータ、サブフレームゲイン、および全体的なゲインを量子化および符号化する。最後に、符号化によって得られたビットストリームを復号器側に送信する。
符号化したビットストリームを受信した後に、復号器側は、ビットストリームに関する情報をまず解析して、なんらかのフレームをロストしているかどうかを決定し得る。フレームロスが発生していない場合には、ビットストリームを通常通り復号し得るし、また、フレームロスが発生している場合には、復号器側はロストフレームを処理し得る。復号器側によるロストフレームを処理するための方法を、本発明の実施形態を参照して以下に詳細に記載する。
図1は、ロストフレームを処理するための方法の概略フローチャートである。図1における方法は、復号器側によって実行される。
110: 現在のロストフレームの合成高周波数帯域信号を決定する。
例えば、復号器側は、現在のロストフレームの前回のフレームのパラメータに従って現在のロストフレームの合成高周波数帯域励起信号を決定してもよい。特に、復号器側は、現在のフレームのLPCパラメータとして現在のロストフレームの前回のフレームのLPCパラメータを使用してもよいし、ピッチ周期、代数コードブック、および前回のフレームのコアレイヤ復号器によって取得されるゲインなどのパラメータを使用して高周波数帯域励起信号を取得してもよい。復号器側は、現在のロストフレームの高周波数帯域励起信号としてその高周波数帯域励起信号を使用し、その後、LPCパラメータを使用して生成されるLPC合成フィルタを使用して高周波数帯域励起信号を処理して、現在のロストフレームの合成高周波数帯域信号を取得してもよい。
120: 現在のロストフレームに対応するリカバリ情報を決定する、ここで、リカバリ情報は、フレームロス前の符号化モード、フレームロス前に受信した最終フレームのフレームクラス、および連続してロストしたフレームの数であって、連続してロストしたフレームの数が現在のロストフレームまでに連続してロストしたフレームの数である、連続してロストしたフレームの数のうちの少なくとも1つを含む。
現在のロストフレームは、現時点において復号器側によって処理される必要のあるロストフレームを指し得る。
フレームロス前の符号化モードは、現在のフレームロスイベントの発生前の符号化モードを指し得る。一般的に、より望ましい符号化性能を達成するために、符号器側は、信号を符号化する前に信号を分類して、適切な符号化モードを選択し得る。現在、符号化モードは、無音フレーム符号化モード(INACTIVEモード)、無声フレーム符号化モード(UNVOICEDモード)、有声フレーム符号化モード(VOICEDモード)、一般フレーム符号化モード(GENERICモード)、遷移フレーム符号化モード(TRANSITIONモード)、およびオーディオフレーム符号化モード(AUDIOモード)を含み得る。
フレームロス前に受信した最終フレームのフレームクラスは、現在のフレームロスイベントの発生前に復号器側によって受信した最終フレームのフレームクラスを指し得る。例えば、符号器側が復号器側に4つのフレームを送信し、復号器側が第3のフレームおよび第4のフレームをロストしている一方で第1のフレームおよび第2のフレームを正確に受信していると仮定すると、フレームロス前に受信した最終フレームは、第2のフレームを指し得る。一般的に、フレームのフレームクラスは、(1)無声、無音、ノイズ、および有声終端の特徴のうちのいずれか1つを有するフレーム(UNVOICED_CLASフレーム)、(2)有声音が始端ではあるがまだ比較的弱い、無声音から有声音への遷移のフレーム(UNVOICED_TRANSITIONフレーム)、(3)有声音の特徴がすでに非常に弱くなっている、有声音後の遷移のフレーム(VOICED_TRANSITIONフレーム)、(4)本フレームの前回のフレームが有声フレームまたは有声開始フレームである、有声音の特徴を有するフレーム(VOICED_CLASフレーム)、(5)明らかな有声音を有する開始フレーム(ONSETフレーム)、(6)混合高調波およびノイズを有する開始フレーム(SIN_ONSETフレーム)、(7)不活性な特徴を有するフレーム(INACTIVE_CLASフレーム)を含み得る。
連続してロストしたフレームの数は、現在のフレームロスイベントにおける現在のロストフレームまでに連続してロストしたフレームの数を指し得る。要するに、連続してロストしたフレームの数は、連続してロストしたフレーム内での現在のロストフレームの序列を示し得る。例えば、符号器側が5つのフレームを復号器側に送信し、復号器側は第1のフレームおよび第2のフレームを正確に受信し、第3のフレームから第5のフレームをすべてロストしているとする。現在のロストフレームが第4のフレームである場合には、連続してロストしたフレームの数は2であり、また、現在のロストフレームが第5のフレームである場合には、連続してロストしたフレームの数は3である。
130: リカバリ情報に従って現在のロストフレームの全体的なゲイン勾配を決定する。
140: 全体的なゲイン勾配および現在のロストフレームの前回のM個のフレームのうちの各フレームの全体的なゲインに従って現在のロストフレームの全体的なゲインを決定する、ここで、Mは正の整数である。
例えば、復号器側は、前回のM個のフレームの全体的なゲインを重み付けし、その後、重み付けした全体的なゲインおよび全体的なゲイン勾配に従って現在のロストフレームの全体的なゲインを決定してもよい。
特に、現在のロストフレームの全体的なゲインFramGainを、式(1)を使用して表してもよい。
FramGain=f(α, FramGain(-m)) (1)
ここで、FramGain(-m)は、前回のM個のフレームのうちの第mのフレームの全体的なゲインを表し得るし、αは、現在のロストフレームの全体的なゲイン勾配を表し得る。
例えば、復号器側は、以下の式(2)に従って現在のロストフレームの全体的なゲインFramGainを決定してもよい。
Figure 0006264673
ここで、
Figure 0006264673
、wmは、前回のM個のフレームのうちの第mのフレームに対応する重み値を表し得るし、FramGain(-m)は、第mのフレームの全体的なゲインを表し得るし、αは、現在のロストフレームの全体的なゲイン勾配を表し得る。
前述の式(2)の例示は、当業者が本発明の本実施形態をより理解できるように支援することを目的としているだけであり、本発明の本実施形態の範囲を限定することを意図したものではないことを理解されたい。当業者は、式(1)に基づいた様々な均等な修正または変更をして、式(1)の様々な特定の表現形式を決定してもよい、ここで、このような修正または変更もまた、本発明の範囲に含まれる。
一般的に、ステップ130のプロセスを簡潔にするために、復号器側は、現在のロストフレームの前回のフレームの全体的なゲインおよび全体的なゲイン勾配に従って現在のロストフレームの全体的なゲインを決定し得る。
150: 現在のロストフレームの高周波数帯域信号を取得するために、現在のロストフレームの全体的なゲインおよび現在のロストフレームのサブフレームゲインに従って現在のロストフレームの合成高周波数帯域信号を調整する。
例えば、復号器側は、現在のロストフレームのサブフレームゲインに固定値を設定してもよいし、または復号器側は、以下に記載したような様式にて現在のロストフレームのサブフレームゲインを決定してもよい。その後、復号器側は、現在のロストフレームの全体的なゲインおよび現在のロストフレームのサブフレームゲインに従って現在のロストフレームの合成高周波数帯域信号を調整し得る、それによって、最終的な高周波数帯域信号を取得している。
従来技術では、現在のロストフレームの全体的なゲイン勾配は、固定値であり、復号器側は、前回のフレームの全体的なゲインおよび固定の全体的なゲイン勾配に従って現在のロストフレームの全体的なゲインを取得する。このような方法を使用して取得した現在のロストフレームの全体的なゲインに従って合成高周波数帯域信号を調整することは、フレームロス前後の最終的な高周波数帯域信号の不連続な遷移、および重度のノイズの発生を引き起こし得る。しかしながら、本発明の本実施形態においては、復号器側は、全体的なゲイン勾配に固定値を単に設定する代わりに、リカバリ情報に従って全体的なゲイン勾配を決定し得る。リカバリ情報は、フレームロスイベントの関連特性を記載している、そのため、リカバリ情報に従って決定された全体的なゲイン勾配は、より正確になる、その結果、現在のロストフレームの全体的なゲインもまた、より正確になる。したがって、復号器側は、全体的なゲインに従って合成高周波信号を調整する、その結果、復元高周波数帯域信号の遷移は自然かつ滑らかになり得るし、復元高周波数帯域信号中のノイズを減衰し得る、それによって、復元高周波数帯域信号の品質を改善している。
本発明の本実施形態においては、現在のロストフレームの全体的なゲイン勾配を、リカバリ情報に従って決定し、現在のロストフレームの全体的なゲインを、全体的なゲイン勾配および現在のロストフレームの前回のM個のフレームのうちの各フレームの全体的なゲインに従って決定し、現在のロストフレームの合成高周波数帯域信号を、現在のロストフレームの全体的なゲインおよび現在のロストフレームのサブフレームゲインに従って調整する、その結果、現在のロストフレームの高周波数帯域信号の遷移は自然かつ滑らかになり得るし、高周波数帯域信号中のノイズを減衰し得る、それによって、高周波数帯域信号の品質を改善している。
必要に応じて、ステップ120において、前述の全体的なゲイン勾配αを、式(3)を使用して表してもよい。
α=1.0-delta*scale (3)
ここで、deltaは、αの調整勾配を表し得るし、deltaの値は、0.5から1までの範囲にあってもよい。
scaleは、現在のロストフレームが現在の状態において前回のフレームと類似しているかの度合いを決定する、αの同調振幅を表し得るし、0から1までの範囲にあってもよい、ここで、より小さな値は、現在のロストフレームのエネルギーが前回のフレームのものと近いことを示し得るし、より大きな値は、現在のロストフレームのエネルギーが前回のフレームのものよりかなり弱くなっていることを示し得る。
必要に応じて、実施形態として、ステップ120において、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であると復号器側が決定し、連続してロストしたフレームの数が3以下である状況においては、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であり、連続してロストしたフレームの数が3以下であると決定される状況においては、復号器側は、全体的なゲイン勾配は1であると決定してもよい。
特に、現在のロストフレームの符号化モードがレームロス前に受信した最終フレームの符号化モードと同一であると復号器側が決定し、連続してロストしたフレームの数が3以下である状況においては、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であると復号器側が決定し、連続してロストしたフレームの数が3以下である状況においては、現在のロストフレームの全体的なゲインは、前回のフレームの全体的なゲインと同一となり得る、そのため、αは1であると決定してもよい。例えば、式(3)に関して、deltaの値は、0.6となり得るし、scaleの値は、0となり得る。
必要に応じて、別の実施形態として、ステップ120において、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であるかどうか、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であるかどうかを決定し得ない状況においては、フレームロス前に受信した最終フレームが無声フレームまたは有声フレームであり、連続してロストしたフレームの数が3以下であると決定されると、復号器側は、全体的なゲイン勾配を決定し、全体的なゲイン勾配を事前に設定した第1の閾値以下かつ0より大きくなるようにしてもよい。
特に、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であるかどうか、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であるかどうかを決定し得ない状況においては、フレームロス前に受信した最終フレームが無声フレームまたは有声フレームであり、連続してロストしたフレームの数が3以下であると決定されると、復号器側は、αが比較的小さな値であると決定し得る、すなわち、αは、事前に設定した第1の閾値未満となり得る。例えば、第1の閾値は、0.5となり得る。例えば、式(3)に関して、deltaの値は、0.65となり得るし、scaleの値は、0.8となり得る。
前述の実施形態においては、復号器側は、フレームロス前に受信した最終フレームの符号化モードが現在のロストフレームの符号化モードと同一であるかどうかを決定し得るし、またはフレームロス前に受信した最終フレームのフレームクラスおよび/または連続してロストしたフレームの数に従ってフレームロス前に受信した最終フレームのフレームクラスが現在のロストフレームのフレームクラスと同一であるかどうかを決定し得る。例えば、連続してロストしたフレームの数が3以下である場合には、復号器側は、最終受信フレームの符号化モードが現在のロストフレームの符号化モードと同一であると決定し得るし、また、連続してロストしたフレームの数が3より大きい場合には、復号器側は、最終受信フレームの符号化モードが現在のロストフレームの符号化モードと同一であると決定し得ない。別の例では、最終受信フレームが有声フレームの開始フレームまたは無声フレームの開始フレームであり、連続してロストしたフレームの数が3以下である場合には、復号器側は、現在のロストフレームのフレームクラスが最終受信フレームのフレームクラスと同一であると決定し得るし、また、連続してロストしたフレームの数が3より大きい場合には、復号器側は、フレームロス前に受信した最終フレームの符号化モードが現在のロストフレームの符号化モードと同一であるかどうか、または最終受信フレームのフレームクラスが現在のロストフレームのフレームクラスと同一であるかどうかを決定し得ない。
必要に応じて、別の実施形態として、フレームロス前に受信した最終フレームが有声フレームの開始フレームであると決定される状況においては、またはフレームロス前に受信した最終フレームがオーディオフレームまたは無音フレームであると決定される状況においては、復号器側は、全体的なゲイン勾配を決定し、全体的なゲイン勾配を事前に設定した第1の閾値より大きくなるようにしてもよい。
特に、フレームロス前に受信した最終フレームが有声フレームの開始フレームであると復号器側が決定する場合には、現在のロストフレームがおそらく有声フレームであると決定され得るし、それゆえ、αが比較的大きな値であると決定され得る、すなわち、αは、事前に設定した第1の閾値より大きくなり得る。例えば、式(3)に関して、deltaの値は、0.5となり得るし、scaleの値は、0.4となり得る。
フレームロス前に受信した最終フレームがオーディオフレームまたは無音フレームであると復号器側が決定する場合には、αが比較的大きな値であるとも決定され得る、すなわち、αは、事前に設定した第1の閾値より大きくなり得る。例えば、式(3)に関して、deltaの値は、0.5となり得るし、scaleの値は、0.4となり得る。
必要に応じて、別の実施形態として、フレームロス前に受信した最終フレームが無声フレームの開始フレームであると決定される状況においては、復号器側は、全体的なゲイン勾配を決定し、全体的なゲイン勾配を事前に設定した第1の閾値以下かつ0より大きくなるようにしてもよい。
フレームロス前に受信した最終フレームが無声フレームの開始フレームである場合には、現在のロストフレームは、無声フレームであり得る、それゆえ、復号器側は、αが比較的小さな値であると決定し得る、すなわち、αは、事前に設定した第1の閾値未満となり得る。例えば、式(3)に関して、deltaの値は、0.8となり得るし、scaleの値は、0.65となり得る。
さらに、前述のリカバリ情報によって示される状況に加えて、別の状況においては、復号器側は、αが比較的小さな値であると決定し得る、すなわち、αは、事前に設定した第1の閾値未満となり得る。例えば、式(3)に関して、deltaの値は、0.8となり得るし、scaleの値は、0.75となり得る。
必要に応じて、別の実施形態として、前述の第1の閾値の値の範囲は、次のように、0<第1の閾値<1であってもよい。
必要に応じて、別の実施形態として、復号器側は、リカバリ情報に従って現在のロストフレームのサブフレームゲイン勾配を決定し、サブフレームゲイン勾配および現在のロストフレームの前回のN個のフレームのうちの各フレームのサブフレームゲインに従って現在のロストフレームのサブフレームゲインを決定してもよい、ここで、Nは正の整数である。
復号器側が前述のリカバリ情報に従って現在のロストフレームの全体的なゲイン勾配を決定し得ることに加えて、復号器側はまた、前述のリカバリ情報に従って現在のロストフレームのサブフレームゲイン勾配を決定してもよい。例えば、復号器側は、前回のN個のフレームのサブフレームゲインを重み付けし、その後、重み付けしたサブフレームゲインおよびサブフレームゲイン勾配に従って現在のロストフレームのサブフレームゲインを決定してもよい。
特に、現在のロストフレームのサブフレームゲインSubGainを、式(4)を使用して表してもよい。
SubGain=f(β, SubGain(-n)) (4)
ここで、SubGain(-n)は、前回のN個のフレームのうちの第nのフレームのサブフレームゲインを表し得るし、βは、現在のロストフレームのサブフレームゲイン勾配を表し得る。
例えば、復号器側は、式(5)に従って現在のロストフレームのサブフレームゲインSubGainを決定してもよい。
Figure 0006264673
Figure 0006264673
、wmは、前回のN個のフレームのうちの第nのフレームに対応する重み値を表し得るし、SubGain(-n)は、第nのフレームのサブフレームゲインを表し得るし、βは、現在のロストフレームのサブフレームゲイン勾配を表し得る、ここで、一般的に、βは、1および2からの範囲にあってもよい。
前述の式(5)の例示は、当業者が本発明の本実施形態をより理解できるように支援することを目的としているだけであり、本発明の本実施形態の範囲を限定することを意図したものではないことを理解されたい。当業者は、式(4)に基づいた様々な均等な修正または変更をして、式(4)の様々な特定の表現形式を決定してもよい、ここで、このような修正または変更もまた、本発明の範囲に含まれる。
プロセスを簡潔にするために、復号器側は、現在のロストフレームの前回のフレームのサブフレームゲイン、およびサブフレームゲイン勾配に従って現在のロストフレームのサブフレームゲインを決定してもよい。
本実施形態においては、現在のロストフレームのサブフレームゲインに固定値を単に設定する代わりに、サブフレームゲイン勾配をリカバリ情報に従って決定した後に現在のロストフレームのサブフレームゲインを決定する、そのため、合成高周波数帯域信号を、現在のロストフレームのサブフレームゲインおよび現在のロストフレームの全体的なゲインに従って決定する、その結果、現在のロストフレームの高周波数帯域信号の遷移は自然かつ滑らかになり得るし、高周波数帯域信号中のノイズを減衰し得る、それによって、高周波数帯域信号の品質を改善していることを理解できよう。
必要に応じて、別の実施形態として、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であるかどうか、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であるかどうかを決定し得ない状況においては、フレームロス前に受信した最終フレームが無声フレームであり、連続してロストしたフレームの数が3以下であると決定されると、復号器側は、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を事前に設定した第2の閾値以下かつ0より大きくなるようにしてもよい。
例えば、第2の閾値は、1.5となり得るし、βは、1.25となり得る。
必要に応じて、別の実施形態として、フレームロス前に受信した最終フレームが有声フレームの開始フレームであると決定される状況においては、復号器側は、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を事前に設定した第2の閾値より大きくなるようにしてもよい。
フレームロス前に受信した最終フレームが有声フレームの開始フレームである場合には、現在のロストフレームは、おそらく有声フレームであり、復号器側は、βが比較的大きな値であると決定し得る、例えば、βは2.0となり得る。
さらに、βに関して、前述のリカバリ情報によって示される2つの状況に加えて、別の状況においては、βは1であってもよい。
必要に応じて、別の実施形態として、前述の第2の閾値の値の範囲は、次のように、1<第2の閾値<2となる。
図2は、本発明の別の実施形態による、ロストフレームを処理するための方法の概略フローチャートである。図2における方法は、復号器側によって実行される。
210: 現在のロストフレームの合成高周波数帯域信号を決定する。
復号器側は、従来技術に従って現在のロストフレームの合成高周波数帯域信号を決定してもよい。例えば、復号器側は、現在のロストフレームの前回のフレームのパラメータに従って現在のロストフレームの合成高周波数帯域励起信号を決定してもよい。特に、復号器側は、現在のフレームのLPCパラメータとして現在のロストフレームの前回のフレームのLPCパラメータを使用してもよいし、ピッチ周期、代数コードブック、および前回のフレームのコアレイヤ復号器によって取得されるゲインなどのパラメータを使用して高周波数帯域励起信号を取得してもよい。復号器側は、現在のロストフレームの高周波数帯域励起信号としてその高周波数帯域励起信号を使用し、その後、LPCパラメータを使用して生成されるLPC合成フィルタを使用して高周波数帯域励起信号を処理して、現在のロストフレームの合成高周波数帯域信号を取得してもよい。
220: 現在のロストフレームに対応するリカバリ情報を決定する、ここで、リカバリ情報は、フレームロス前の符号化モード、フレームロス前に受信した最終フレームのフレームクラス、および連続してロストしたフレームの数であって、連続してロストしたフレームの数が現在のロストフレームまでに連続してロストしたフレームの数である、連続してロストしたフレームの数のうちの少なくとも1つを含む。
リカバリ情報の詳細な説明については、図1の実施形態における説明を参照し、その詳細を本明細書では再び記載しない。
230: リカバリ情報に従って現在のロストフレームのサブフレームゲイン勾配を決定する。
240: サブフレームゲイン勾配および現在のロストフレームの前回のN個のフレームのうちの各フレームのサブフレームゲインに従って現在のロストフレームのサブフレームゲインを決定する、ここで、Nは正の整数である。
例えば、復号器側は、前回のN個のフレームのサブフレームゲインを重み付けし、その後、重み付けしたサブフレームゲインおよびサブフレームゲイン勾配に従って現在のロストフレームのサブフレームゲインを決定してもよい。
特に、現在のロストフレームのサブフレームゲインSubGainを、式(4)を使用して表してもよい。
例えば、復号器側は、式(5)に従って現在のロストフレームのサブフレームゲインSubGainを決定してもよい。
前述の式(5)の例示は、当業者が本発明の本実施形態をより理解できるように支援することを目的としているだけであり、本発明の本実施形態の範囲を限定することを意図したものではないことを理解されたい。当業者は、式(4)に基づいた様々な均等な修正または変更をして、式(4)の様々な特定の表現形式を決定してもよい、ここで、このような修正または変更もまた、本発明の範囲に含まれる。
プロセスを簡潔にするために、復号器側は、現在のロストフレームの前回のフレームのサブフレームゲイン、およびサブフレームゲイン勾配に従って現在のロストフレームのサブフレームゲインを決定してもよい。
250: 現在のロストフレームの高周波数帯域信号を取得するために、現在のロストフレームのサブフレームゲインおよび現在のロストフレームの全体的なゲインに従って現在のロストフレームの合成高周波数帯域信号を調整する。
例えば、復号器側は、従来技術に従って固定の全体的なゲイン勾配を設定し、その後、固定の全体的なゲイン勾配および前回のフレームの全体的なゲインに従って現在のロストフレームの全体的なゲインを決定してもよい。
従来技術では、復号器側は、現在のロストフレームのサブフレームゲインに固定値を設定し、固定値および現在のロストフレームの全体的なゲインに従って現在のロストフレームの合成高周波数帯域信号を調整する、このことは、フレームロス前後の最終的な高周波数帯域信号の不連続な遷移、および重度のノイズの発生を引き起こす。しかしながら、本発明の本実施形態においては、復号器側は、現在のロストフレームのサブフレームゲインに固定値を単に設定する代わりに、リカバリ情報に従ってサブフレームゲイン勾配を決定し、その後、サブフレームゲイン勾配に従って現在のロストフレームのサブフレームゲインを決定し得る。リカバリ情報は、フレームロスイベントの関連特性を記載している、そのため、現在のロストフレームのサブフレームゲインは、より正確になる。したがって、復号器側は、サブフレームゲインに従って合成高周波信号を調整する、その結果、復元高周波数帯域信号の遷移は自然かつ滑らかになり得るし、復元高周波数帯域信号中のノイズを減衰し得る、それによって、復元高周波数帯域信号の品質を改善している。
本実施形態においては、現在のロストフレームのサブフレームゲイン勾配を、リカバリ情報に従って決定し、現在のロストフレームのサブフレームゲインを、サブフレームゲイン勾配および現在のロストフレームの前回のN個のフレームのうちの各フレームのサブフレームゲインに従って決定し、現在のロストフレームの合成高周波数帯域信号を、現在のロストフレームのサブフレームゲインおよび現在のロストフレームの全体的なゲインに従って決定する、その結果、現在のロストフレームの高周波数帯域信号の遷移は自然かつ滑らかになり得るし、高周波数帯域信号中のノイズを減衰し得る、それによって、高周波数帯域信号の品質を改善している。
必要に応じて、別の実施形態として、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であるかどうか、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であるかどうかを決定し得ない状況においては、フレームロス前に受信した最終フレームが無声フレームであり、連続してロストしたフレームの数が3以下であると決定されると、復号器側は、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を事前に設定した第2の閾値以下かつ0より大きくなるようにしてもよい。
例えば、第2の閾値は、1.5となり得るし、βは、1.25となり得る。
必要に応じて、別の実施形態として、フレームロス前に受信した最終フレームが有声フレームの開始フレームであると決定される状況においては、復号器側は、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を事前に設定した第2の閾値より大きくなるようにしてもよい。
フレームロス前に受信した最終フレームが有声フレームの開始フレームである場合には、現在のロストフレームは、おそらく有声フレームであり、復号器側は、βが比較的大きな値であると決定し得る、例えば、βは2.0となり得る。
さらに、βに関して、前述のリカバリ情報によって示される2つの状況に加えて、別の状況においては、βは1であってもよい。
必要に応じて、別の実施形態として、前述の第2の閾値の値の範囲は、次のように、1<第2の閾値<2であってもよい。
復号器側は、本発明の本実施形態に従って現在のロストフレームの全体的なゲインを決定し、従来技術に従って現在のロストフレームのサブフレームゲインを決定してもよく、または復号器側は、本発明の本実施形態に従って現在のロストフレームのサブフレームゲインを決定し、従来技術に従って現在のロストフレームの全体的なゲインを決定してもよく、または復号器側は、本発明の本実施形態に従って現在のロストフレームのサブフレームゲインおよび現在のロストフレームの全体的なゲインを決定してもよいことを、前述したことから理解できよう。前述の方法のすべては、現在のロストフレームの高周波数帯域信号の遷移を自然かつ滑らかにすることを可能にし、高周波数帯域信号中のノイズを減衰させ得る、それによって、高周波数帯域信号の品質を改善している。
図3は、本発明の実施形態による、ロストフレームを処理するための方法のプロセスの概略フローチャートである。
301: 受信したビットストリーム中のフレームロスフラグを解析する。
本プロセスは、従来技術に従って実行されてもよい。
302: フレームロスフラグに従って現在のフレームをロストしているかどうかを決定する。
現在のフレームをロストしていないことをフレームロスフラグが示している場合には、ステップ303を実行する。
現在のフレームをロストしていることをフレームロスフラグが示している場合には、ステップ304から306を実行する。
303: 現在のフレームをロストしていないことをフレームロスフラグが示している場合には、ビットストリームを復号し、現在のフレームをリカバリする。
現在のフレームをロストしていることをフレームロスフラグが示している場合には、ステップ304から306を同時に実行してもよいし、またはステップ304から306を特定の順序で実行し、本発明の本実施形態において限定されない。
304: 現在のロストフレームの合成高周波数帯域信号を決定する。
例えば、復号器側は、現在のロストフレームの前回のフレームのパラメータに従って現在のロストフレームの合成高周波数帯域励起信号を決定してもよい。特に、復号器側は、現在のフレームのLPCパラメータとして現在のロストフレームの前回のフレームのLPCパラメータを使用してもよいし、ピッチ周期、代数コードブック、および前回のフレームのコアレイヤ復号器によって取得されるゲインなどのパラメータを使用して高周波数帯域励起信号を取得してもよい。復号器側は、現在のロストフレームの高周波数帯域励起信号としてその高周波数帯域励起信号を使用し、その後、LPCパラメータを使用して生成されるLPC合成フィルタを使用して高周波数帯域励起信号を処理して、現在のロストフレームの合成高周波数帯域信号を取得してもよい。
305: 現在のロストフレームの全体的なゲインを決定する。
必要に応じて、復号器側は、現在のロストフレームのリカバリ情報に従って現在のロストフレームの全体的なゲイン勾配を決定することであって、リカバリ情報は、フレームロス前の符号化モード、フレームロス前に受信した最終フレームのフレームクラス、および連続してロストしたフレームの数のうちの少なくとも1つを含んでいてもよい、決定をし、次に、現在のロストフレームの全体的なゲイン勾配および前回のM個のフレームのうちの各フレームの全体的なゲインに従って現在のロストフレームの全体的なゲインを決定してもよい。
例えば、必要に応じて、復号器側は、従来技術に従って現在のロストフレームの全体的なゲインをさらに決定してもよい。例えば、現在のロストフレームの全体的なゲインを、固定の全体的なゲイン勾配で前回のフレームの全体的なゲインを乗算することによって取得してもよい。
306: 現在のロストフレームのサブフレームゲインを決定する。
必要に応じて、復号器側はまた、現在のロストフレームのリカバリ情報に従って現在のロストフレームのサブフレームゲイン勾配を決定し、その後、現在のロストフレームの全体的なゲイン勾配および前回のN個のフレームのうちの各フレームのサブフレームゲインに従って現在のロストフレームのサブフレームゲインを決定してもよい。
必要に応じて、復号器側は、従来技術に従って現在のロストフレームのサブフレームゲインを決定してもよい、例えば、現在のロストフレームのサブフレームゲインに固定値を設定してもよい。
現在のロストフレームに対応する復元高周波数帯域信号の品質を改善するために、現在のロストフレームの全体的なゲインを従来技術に従ってステップ305において決定する場合には、ステップ306において、現在のロストフレームのサブフレームゲインを図2の実施形態における方法に従って決定する必要があることを理解されたい。現在のロストフレームの全体的なゲインを図1の実施形態における方法を使用してステップ305において決定する場合には、ステップ306において、現在のロストフレームのサブフレームゲインを、図2実施形態における方法を使用して決定してもよいし、または現在のロストフレームのサブフレームゲインを、従来技術に従って決定してもよい。
307: 現在のロストフレームの高周波数帯域信号を取得するために、ステップ305において取得した現在のロストフレームの全体的なゲインおよびステップ306において取得した現在のロストフレームのサブフレームゲインに従って、ステップ304において取得した合成高周波数帯域信号を調整する。
本発明の本実施形態においては、現在のロストフレームの全体的なゲイン勾配をリカバリ情報に従って決定、または現在のロストフレームのサブフレームゲイン勾配をリカバリ情報に従って決定して、現在のロストフレームの全体的なゲインおよび現在のロストフレームのサブフレームゲインを取得し、現在のロストフレームの合成高周波数帯域信号を、現在のロストフレームの全体的なゲインおよび現在のロストフレームのサブフレームゲインに従って調整する、その結果、現在のロストフレームの高周波数帯域信号の遷移は自然かつ滑らかになり得るし、高周波数帯域信号中のノイズを減衰し得る、それによって、高周波数帯域信号の品質を改善している。
図4は、本発明の実施形態による、復号器の概略ブロック図である。図4におけるデバイス400の例示は、復号器である。デバイス400は、第1の決定ユニット410、第2の決定ユニット420、第3の決定ユニット430、第4の決定ユニット440、および調整ユニット450を備える。
第1の決定ユニット410は、現在のロストフレームの合成高周波数帯域信号を決定する。第2の決定ユニット420は、現在のロストフレームに対応するリカバリ情報を決定する、ここで、リカバリ情報は、フレームロス前の符号化モード、フレームロス前に受信した最終フレームのフレームクラス、および連続してロストしたフレームの数であって、連続してロストしたフレームの数が現在のロストフレームまでに連続してロストしたフレームの数である、連続してロストしたフレームの数のうちの少なくとも1つを含む。第3の決定ユニット430は、リカバリ情報に従って現在のロストフレームの全体的なゲイン勾配を決定する。第4の決定ユニット440は、全体的なゲイン勾配および現在のロストフレームの前回のM個のフレームのうちの各フレームの全体的なゲインに従って現在のロストフレームの全体的なゲインを決定する、ここで、Mは正の整数である。現在のロストフレームのサブフレームゲインを決定する。調整ユニット450は、現在のロストフレームの高周波数帯域信号を取得するために、現在のロストフレームの全体的なゲインおよび現在のロストフレームのサブフレームゲインに従って現在のロストフレームの合成高周波数帯域信号を調整する。
本発明の本実施形態においては、現在のロストフレームの全体的なゲイン勾配を、リカバリ情報に従って決定し、現在のロストフレームの全体的なゲインを、全体的なゲイン勾配および現在のロストフレームの前回のM個のフレームのうちの各フレームの全体的なゲインに従って決定し、現在のロストフレームの合成高周波数帯域信号を、現在のロストフレームの全体的なゲインおよび現在のロストフレームのサブフレームゲインに従って調整する、その結果、現在のロストフレームの高周波数帯域信号の遷移は自然かつ滑らかになり得るし、高周波数帯域信号中のノイズを減衰し得る、それによって、高周波数帯域信号の品質を改善している。
必要に応じて、実施形態として、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であり、連続してロストしたフレームの数が3以下であると決定される状況においては、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であり、連続してロストしたフレームの数が3以下であると決定される状況においては、第3の決定ユニット430は、全体的なゲイン勾配は1であると決定してもよい。
必要に応じて、別の実施形態として、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であるかどうか、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であるかどうかを決定し得ない状況においては、フレームロス前に受信した最終フレームが無声フレームまたは有声フレームであり、連続してロストしたフレームの数が3以下であると決定されると、第3の決定ユニット430は、全体的なゲイン勾配を決定し、全体的なゲイン勾配を事前に設定した第1の閾値以下かつ0より大きくなるようにしてもよい。
必要に応じて、別の実施形態として、フレームロス前に受信した最終フレームが有声フレームの開始フレームであると決定される状況においては、またはフレームロス前に受信した最終フレームがオーディオフレームまたは無音フレームであると決定される状況においては、第3の決定ユニット430は、全体的なゲイン勾配を決定し、全体的なゲイン勾配を事前に設定した第1の閾値より大きくなるようにしてもよい。
必要に応じて、別の実施形態として、フレームロス前に受信した最終フレームが無声フレームの開始フレームであると決定される状況においては、第3の決定ユニット430は、全体的なゲイン勾配を決定し、全体的なゲイン勾配を事前に設定した第1の閾値以下かつ0より大きくなるようにしてもよい。
必要に応じて、別の実施形態として、第5の決定ユニット460をさらに含む。第5の決定ユニット460は、リカバリ情報に従って現在のロストフレームのサブフレームゲイン勾配を決定してもよい。第5の決定ユニット460は、サブフレームゲイン勾配および現在のロストフレームの前回のN個のフレームのうちの各フレームのサブフレームゲインに従って現在のロストフレームのサブフレームゲインを決定してもよい、ここで、Nは正の整数である。
必要に応じて、別の実施形態として、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であるかどうか、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であるかどうかを決定し得ない状況においては、フレームロス前に受信した最終フレームが無声フレームであり、連続してロストしたフレームの数が3以下であると決定されると、第5の決定ユニット460は、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を事前に設定した第2の閾値以下となるようにしてもよい。
必要に応じて、別の実施形態として、フレームロス前に受信した最終フレームが有声フレームの開始フレームであると決定される状況においては、第5の決定ユニット460は、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を事前に設定した第2の閾値より大きくなるようにしてもよい。
デバイス400の他の機能および処理については、図1および図3における方法の実施形態のプロセスを参照し、繰り返しを避けるためにその詳細を本明細書では再び記載しない。
図5は、本発明の別の実施形態による、復号器の概略ブロック図である。図5におけるデバイス500の例示は、復号器である。図5におけるデバイス500は、第1の決定ユニット510、第2の決定ユニット520、第3の決定ユニット530、第4の決定ユニット540、および調整ユニット550を備える。
第1の決定ユニット510は、現在のロストフレームの合成高周波数帯域信号を決定する。第2の決定ユニット520は、現在のロストフレームに対応するリカバリ情報を決定する、ここで、リカバリ情報は、フレームロス前の符号化モード、フレームロス前に受信した最終フレームのフレームクラス、および連続してロストしたフレームの数であって、連続してロストしたフレームの数が現在のロストフレームまでに連続してロストしたフレームの数である、連続してロストしたフレームの数のうちの少なくとも1つを含む。第3の決定ユニット530は、リカバリ情報に従って現在のロストフレームのサブフレームゲイン勾配を決定する。第4の決定ユニット540は、サブフレームゲイン勾配および現在のロストフレームの前回のN個のフレームのうちの各フレームのサブフレームゲインに従って現在のロストフレームのサブフレームゲインを決定する、ここで、Nは正の整数である。調整ユニット550は、現在のロストフレームの高周波数帯域信号を取得するために、現在のロストフレームのサブフレームゲインおよび現在のロストフレームの全体的なゲインに従って現在のロストフレームの合成高周波数帯域信号を調整する。
本実施形態においては、現在のロストフレームのサブフレームゲイン勾配を、リカバリ情報に従って決定し、現在のロストフレームのサブフレームゲインを、サブフレームゲイン勾配および現在のロストフレームの前回のN個のフレームのうちの各フレームのサブフレームゲインに従って決定し、現在のロストフレームの合成高周波数帯域信号を、現在のロストフレームのサブフレームゲインおよび現在のロストフレームの全体的なゲインに従って決定する、その結果、現在のロストフレームの高周波数帯域信号の遷移は自然かつ滑らかになり得るし、高周波数帯域信号中のノイズを減衰し得る、それによって、高周波数帯域信号の品質を改善している。
必要に応じて、実施形態として、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であるかどうか、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であるかどうかを決定し得ない状況においては、フレームロス前に受信した最終フレームが無声フレームであり、連続してロストしたフレームの数が3以下であると決定されると、第3の決定ユニット530は、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を事前に設定した第2の閾値以下となるようにしてもよい。
必要に応じて、別の実施形態として、フレームロス前に受信した最終フレームが有声フレームの開始フレームであると決定される状況においては、第3の決定ユニット530は、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を事前に設定した第2の閾値より大きくなるようにしてもよい。
デバイス500の他の機能および処理については、図2および図3における方法の実施形態のプロセスを参照し、繰り返しを避けるためにその詳細を本明細書では再び記載しない。
図6は、本発明の実施形態による、復号器の概略ブロック図である。図6におけるデバイス600の例示は、復号器である。デバイス600は、メモリ610およびプロセッサ620を備える。
メモリ610は、ランダムアクセスメモリ、フラッシュメモリ、リードオンリーメモリ、プログラマブルリードオンリーメモリ、不揮発性メモリ、レジスタなどを含み得る。プロセッサ620は、中央処理ユニット(Central Processing Unit、CPU)であり得る。
メモリ610は、メモリ610に記憶した実行ファイル命令を記憶するように構成される。プロセッサ620は、実行ファイル命令を実行し得るし、現在のロストフレームの合成高周波数帯域信号を決定し、現在のロストフレームに対応するリカバリ情報を決定することであって、リカバリ情報は、フレームロス前の符号化モード、フレームロス前に受信した最終フレームのフレームクラス、および連続してロストしたフレームの数であって、連続してロストしたフレームの数が現在のロストフレームまでに連続してロストしたフレームの数である、連続してロストしたフレームの数のうちの少なくとも1つを含む、決定をし、リカバリ情報に従って現在のロストフレームの全体的なゲイン勾配を決定し、全体的なゲイン勾配および現在のロストフレームの前回のM個のフレームのうちの各フレームの全体的なゲインに従って現在のロストフレームの全体的なゲインを決定することであって、Mは正の整数である、決定をし、現在のロストフレームの高周波数帯域信号を取得するために、現在のロストフレームの全体的なゲインおよび現在のロストフレームのサブフレームゲインに従って現在のロストフレームの合成高周波数帯域信号を調整するように構成される。
本発明の本実施形態においては、現在のロストフレームの全体的なゲイン勾配を、リカバリ情報に従って決定し、現在のロストフレームの全体的なゲインを、全体的なゲイン勾配および現在のロストフレームの前回のM個のフレームのうちの各フレームの全体的なゲインに従って決定し、現在のロストフレームの合成高周波数帯域信号を、現在のロストフレームの全体的なゲインおよび現在のロストフレームのサブフレームゲインに従って調整する、その結果、現在のロストフレームの高周波数帯域信号の遷移は自然かつ滑らかになり得るし、高周波数帯域信号中のノイズを減衰し得る、それによって、高周波数帯域信号の品質を改善している。
必要に応じて、実施形態として、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であり、連続してロストしたフレームの数が3以下であると決定される状況においては、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であり、連続してロストしたフレームの数が3以下であると決定される状況においては、プロセッサ620は、全体的なゲイン勾配は1であると決定してもよい。
必要に応じて、別の実施形態として、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であるかどうか、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であるかどうかを決定し得ない状況においては、フレームロス前に受信した最終フレームが無声フレームまたは有声フレームであり、連続してロストしたフレームの数が3以下であると決定されると、プロセッサ620は、全体的なゲイン勾配を決定し、全体的なゲイン勾配を事前に設定した第1の閾値以下かつ0より大きくなるようにしてもよい。
必要に応じて、別の実施形態として、フレームロス前に受信した最終フレームが有声フレームの開始フレームであると決定される状況においては、またはフレームロス前に受信した最終フレームがオーディオフレームまたは無音フレームであると決定される状況においては、プロセッサ620は、全体的なゲイン勾配を決定し、全体的なゲイン勾配を事前に設定した第1の閾値より大きくなるようにしてもよい。
必要に応じて、別の実施形態として、フレームロス前に受信した最終フレームが有声フレームの開始フレームであると決定される状況においては、プロセッサ620は、全体的なゲイン勾配を決定し、全体的なゲイン勾配を事前に設定した第1の閾値以下かつ0より大きくなるようにしてもよい。
必要に応じて、別の実施形態として、プロセッサ620は、リカバリ情報に従って現在のロストフレームのサブフレームゲイン勾配を決定し、サブフレームゲイン勾配および現在のロストフレームの前回のN個のフレームのうちの各フレームのサブフレームゲインに従って現在のロストフレームのサブフレームゲインを決定してもよい、ここで、Nは正の整数である。
必要に応じて、別の実施形態として、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であるかどうか、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であるかどうかを決定し得ない状況においては、フレームロス前に受信した最終フレームが無声フレームであり、連続してロストしたフレームの数が3以下であると決定されると、プロセッサ620は、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を事前に設定した第2の閾値以下かつ0より大きくなるようにしてもよい。
必要に応じて、別の実施形態として、フレームロス前に受信した最終フレームが有声フレームの開始フレームであると決定される状況においては、プロセッサ620は、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を事前に設定した第2の閾値より大きくなるようにしてもよい。
デバイス600の他の機能および処理については、図1および図3における方法の実施形態のプロセスを参照し、繰り返しを避けるためにその詳細を本明細書では再び記載しない。
図7は、本発明の別の実施形態による、復号器の概略ブロック図である。図7におけるデバイス700の例示は、復号器である。図7におけるデバイス700は、メモリ710およびプロセッサ720を備える。
メモリ710は、ランダムアクセスメモリ、フラッシュメモリ、リードオンリーメモリ、プログラマブルリードオンリーメモリ、不揮発性メモリ、レジスタなどを含み得る。プロセッサ720は、中央処理ユニット(Central Processing Unit、CPU)であり得る。
メモリ710は、実行ファイル命令を記憶するように構成される。プロセッサ720は、メモリ710に記憶した実行ファイル命令を実行し得るし、現在のロストフレームの合成高周波数帯域信号を決定し、現在のロストフレームに対応するリカバリ情報を決定することであって、リカバリ情報は、フレームロス前の符号化モード、フレームロス前に受信した最終フレームのフレームクラス、および連続してロストしたフレームの数であって、連続してロストしたフレームの数が現在のロストフレームまでに連続してロストしたフレームの数である、連続してロストしたフレームの数のうちの少なくとも1つを含む、決定をし、リカバリ情報に従って現在のロストフレームのサブフレームゲイン勾配を決定し、サブフレームゲイン勾配および現在のロストフレームの前回のN個のフレームのうちの各フレームのサブフレームゲインに従って現在のロストフレームのサブフレームゲインを決定することであって、Nは正の整数である、決定をし、現在のロストフレームの高周波数帯域信号を取得するために、現在のロストフレームのサブフレームゲインおよび現在のロストフレームの全体的なゲインに従って現在のロストフレームの合成高周波数帯域信号を調整するように構成される。
本実施形態においては、現在のロストフレームのサブフレームゲイン勾配を、リカバリ情報に従って決定し、現在のロストフレームのサブフレームゲインを、サブフレームゲイン勾配および現在のロストフレームの前回のN個のフレームのうちの各フレームのサブフレームゲインに従って決定し、現在のロストフレームの合成高周波数帯域信号を、現在のロストフレームのサブフレームゲインおよび現在のロストフレームの全体的なゲインに従って決定する、その結果、現在のロストフレームの高周波数帯域信号の遷移は自然かつ滑らかになり得るし、高周波数帯域信号中のノイズを減衰し得る、それによって、高周波数帯域信号の品質を改善している。
必要に応じて、実施形態として、現在のロストフレームの符号化モードがフレームロス前に受信した最終フレームの符号化モードと同一であるかどうか、または現在のロストフレームのフレームクラスがフレームロス前に受信した最終フレームのフレームクラスと同一であるかどうかを決定し得ない状況においては、フレームロス前に受信した最終フレームが無声フレームであり、連続してロストしたフレームの数が3以下であると決定されると、プロセッサ720は、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を事前に設定した第2の閾値以下かつ0より大きくなるようにしてもよい。
必要に応じて、別の実施形態として、フレームロス前に受信した最終フレームが有声フレームの開始フレームであると決定される状況においては、プロセッサ720は、サブフレームゲイン勾配を決定し、サブフレームゲイン勾配を事前に設定した第2の閾値より大きくなるようにしてもよい。
デバイス700の他の機能および処理については、図2および図3における方法の実施形態のプロセスを参照し、繰り返しを避けるためにその詳細を本明細書では再び記載しない。
本明細書に開示した実施形態に記載の例示の組合せにおいて、ユニットおよびアルゴリズムのステップが電子機器またはコンピュータソフトウェアおよび電子機器の組合せによって実装されてもよいことを、当業者は承知していよう。その機能をハードウェアによって行うかソフトウェアによって行うかは、技術的解決手法の特定の適用および設計上の制約条件に依存する。当業者が特定の適用の各々について記載した機能を実施するために異なる方法を用いてもよく、そのような実施形態が本発明の範囲を逸脱していると見なすべきではない。
簡便かつ簡潔な記載のために、前述のシステム、装置、およびユニットの詳細な動作プロセスについては、前述の方法の実施形態における対応するプロセスを参照し、その詳細を本明細書では再び記載していないことを、当業者は明確に理解されよう。
本出願にて提供したいくつかの実施形態においては、開示したシステム、装置、および方法が他の様式で実施され得ることを理解されたい。例えば、記載した装置の実施形態は、例示的なものにすぎない。例えば、ユニット分割は、論理機能分割にすぎず、実際の実施形態においては他の分割であってもよい。例えば、複数のユニットまたはコンポーネントを組み合わせても別のシステムと統合してもよいし、またはいくつかの特徴を無視しても行わなくてもよい。さらに、図示または記載した相互接続または直接接続または通信接続は、いくつかのインターフェースによって実施されてもよい。装置とユニットとの間の間接接続または通信接続は、電子的に、機械的に、または他の形式で実施されてもよい。
別個の部分として記載したユニットは、物理的に別個のものであってもなくてもよいし、ユニットとして記載した部分は、物理ユニットであってもなくてもよいし、一ヶ所に位置していてもよいし、または複数のネットワークユニットに分散されていてもよい。実施形態の解決手法の目的を達するために、一部またはすべてのユニットを実際の必要性に応じて選択してもよい。
さらに、本発明の実施形態における機能ユニットを1つの処理ユニットに統合してもよいし、ユニットの各々が物理的に単独で存在してもよいし、または2つ以上のユニットは1つのユニットに統合される。
機能をソフトウェア機能ユニットの形式で実装して独立した製品として販売または使用する場合には、機能をコンピュータ可読記憶媒体に記憶してもよい。そのような理解に基づいて、基本的に、本発明の技術的解決手法、または従来技術に貢献する部分、またはいくつかの技術的解決手法は、ソフトウェア製品の形式で実装されてもよい。コンピュータソフトウェア製品は、記憶媒体に記憶され、(パーソナルコンピュータ、サーバ、またはネットワークデバイスであり得る)コンピュータデバイスに本発明の実施形態に記載の方法のステップのすべてまたは一部を行うように命令するためのいくつかの命令を含む。前述の記憶媒体は、USBフラッシュドライブ、リムーバブルハードディスク、リードオンリーメモリ(ROM、Read-Only Memory)、ランダムアクセスメモリ(RAM、Random Access Memory)、磁気ディスク、または光ディスクなどの、プログラムコードを記憶し得る任意の媒体を含む。
前述の記載は、本発明の特定の実施形態にすぎず、本発明の保護範囲を限定することを意図していない。本発明に開示の技術的範囲において当業者が容易に想到する任意の変形または置換は、本発明の保護範囲に含まれるものとする。したがって、本発明の保護範囲は、特許請求の範囲の保護範囲に従うものとする。
410 第1の決定ユニット
420 第2の決定ユニット
430 第3の決定ユニット
440 第4の決定ユニット
450 調整ユニット
460 第5の決定ユニット
510 第1の決定ユニット
520 第2の決定ユニット
530 第3の決定ユニット
540 第4の決定ユニット
550 調整ユニット
610 メモリ
620 プロセッサ
710 メモリ
720 プロセッサ

Claims (13)

  1. 音声信号に対応するロストフレームを処理するための方法であって、
    現在のロストフレームの前回のフレームのパラメータに基づいて前記現在のロストフレームの合成高周波数帯域信号を決定するステップと、
    前記現在のロストフレームに対応するリカバリ情報を決定するステップであって、前記リカバリ情報は、フレームロス前の符号化モードおよび前記フレームロス前に受信した最終フレームのフレームクラスのうちの少なくとも1つを含む、ステップと、
    前記リカバリ情報に基づいて決定される、前記現在のロストフレームが現在の状態において前記前回のフレームと類似しているかの度合いに従って前記現在のロストフレームのグローバルゲイン勾配を決定するステップと、
    前記グローバルゲイン勾配および前記現在のロストフレームの前回のM個のフレームのうちの各フレームのグローバルゲインに従って前記現在のロストフレームのグローバルゲインを決定するステップであって、Mは正の整数である、ステップと、
    前記現在のロストフレームの高周波数帯域信号を取得するために、前記現在のロストフレームの前記グローバルゲインおよび前記現在のロストフレームのサブフレームゲインに従って前記現在のロストフレームの前記合成高周波数帯域信号を調整するステップとを含む、方法。
  2. 前記リカバリ情報に基づいて決定される前記度合いに従って前記現在のロストフレームのサブフレームゲイン勾配を決定するステップと、前記サブフレームゲイン勾配および前記現在のロストフレームの前回のN個のフレームのうちの各フレームのサブフレームゲインに従って前記現在のロストフレームの前記サブフレームゲインを決定するステップであって、Nは正の整数である、ステップをさらに含む、請求項1に記載の方法。
  3. 前記リカバリ情報に基づいて決定される前記度合いに従って前記現在のロストフレームのサブフレームゲイン勾配を決定するステップは、
    前記フレームロス前に受信した前記最終フレームが有声フレームの開始フレームであると決定される状況においては、前記サブフレームゲイン勾配を決定し、前記サブフレームゲイン勾配を事前に設定した第2の閾値より大きくなるようにするステップを含む、請求項2に記載の方法。
  4. 音声信号に対応するロストフレームを処理するための方法であって、
    現在のロストフレームの前回のフレームのパラメータに基づいて前記現在のロストフレームの合成高周波数帯域信号を決定するステップと、
    前記現在のロストフレームに対応するリカバリ情報を決定するステップであって、前記リカバリ情報は、フレームロス前の符号化モードおよび前記フレームロス前に受信した最終フレームのフレームクラスのうちの少なくとも1つを含む、ステップと、
    前記リカバリ情報に基づいて決定される、前記現在のロストフレームが現在の状態において前記前回のフレームと類似しているかの度合いに従って前記現在のロストフレームのサブフレームゲイン勾配を決定するステップと、
    前記サブフレームゲイン勾配および前記現在のロストフレームの前回のN個のフレームのうちの各フレームのサブフレームゲインに従って前記現在のロストフレームのサブフレームゲインを決定するステップであって、Nは正の整数である、ステップと、
    前記現在のロストフレームのグローバルゲインを決定するステップと、
    前記現在のロストフレームの高周波数帯域信号を取得するために、前記現在のロストフレームの前記サブフレームゲインおよび前記現在のロストフレームの前記グローバルゲインに従って前記現在のロストフレームの前記合成高周波数帯域信号を調整するステップとを含む、方法。
  5. 前記リカバリ情報に基づいて決定される、前記現在のロストフレームが現在の状態において前記前回のフレームと類似しているかの度合いに従って前記現在のロストフレームのサブフレームゲイン勾配を決定するステップは、
    前記フレームロス前に受信した前記最終フレームが有声フレームの開始フレームであると決定される状況においては、前記サブフレームゲイン勾配を決定し、前記サブフレームゲイン勾配を事前に設定した第2の閾値より大きくなるようにするステップを含む、請求項4に記載の方法。
  6. 音声信号の復号器であって、
    現在のロストフレームの前回のフレームのパラメータに基づいて前記現在のロストフレームの合成高周波数帯域信号を決定するように構成される、第1の決定ユニットと、
    前記現在のロストフレームに対応するリカバリ情報を決定するように構成される、第2の決定ユニットであって、前記リカバリ情報は、フレームロス前の符号化モードおよび前記フレームロス前に受信した最終フレームのフレームクラスのうちの少なくとも1つを含む、第2の決定ユニットと、
    前記リカバリ情報に基づいて決定される、前記現在のロストフレームが現在の状態において前記前回のフレームと類似しているかの度合いに従って前記現在のロストフレームのグローバルゲイン勾配を決定するように構成される、第3の決定ユニットと、
    前記グローバルゲイン勾配および前記現在のロストフレームの前回のM個のフレームのうちの各フレームのグローバルゲインに従って前記現在のロストフレームのグローバルゲインを決定するように構成される、第4の決定ユニットであって、Mは正の整数である、第4の決定ユニットと、
    前記現在のロストフレームの高周波数帯域信号を取得するために、前記現在のロストフレームの前記グローバルゲインおよび前記現在のロストフレームのサブフレームゲインに従って前記現在のロストフレームの前記合成高周波数帯域信号を調整するように構成される、調整ユニットとを備える、復号器。
  7. 前記第2の決定ユニットは、前記フレームロス前に受信した前記最終フレームが有声フレームの開始フレームであると決定される状況においては、または前記フレームロス前に受信した前記最終フレームがオーディオフレームまたは無音フレームであると決定される状況においては、前記グローバルゲイン勾配を決定し、前記グローバルゲイン勾配を事前に設定した第1の閾値より大きくなるようにするように特に構成される、請求項6に記載の復号器。
  8. 前記第2の決定ユニットは、前記フレームロス前に受信した前記最終フレームが無声フレームの開始フレームであると決定される状況においては、前記グローバルゲイン勾配を決定し、前記グローバルゲイン勾配を事前に設定した第1の閾値以下かつ0より大きくなるようにするように特に構成される、請求項6に記載の復号器。
  9. 前記リカバリ情報に基づいて決定される前記度合いに従って前記現在のロストフレームのサブフレームゲイン勾配を決定し、前記サブフレームゲイン勾配および前記現在のロストフレームの前回のN個のフレームのうちの各フレームのサブフレームゲインに従って前記現在のロストフレームの前記サブフレームゲインを決定するように構成される、第5の決定ユニットであって、Nは正の整数である、第5の決定ユニットをさらに備える、請求項6から8のいずれか一項に記載の復号器。
  10. 前記第5の決定ユニットは、前記フレームロス前に受信した前記最終フレームが無声フレームの開始フレームであると決定される状況においては、前記サブフレームゲイン勾配を決定し、前記サブフレームゲイン勾配を事前に設定した第2の閾値より大きくなるようにするように特に構成される、請求項9に記載の復号器。
  11. 音声信号の復号器であって、
    現在のロストフレームの前回のフレームのパラメータに基づいて前記現在のロストフレームの合成高周波数帯域信号を決定するように構成される、第1の決定ユニットと、
    前記現在のロストフレームに対応するリカバリ情報を決定するように構成される、第2の決定ユニットであって、前記リカバリ情報は、フレームロス前の符号化モードおよび前記フレームロス前に受信した最終フレームのフレームクラスのうちの少なくとも1つを含む、第2の決定ユニットと、
    前記リカバリ情報に基づいて決定される、前記現在のロストフレームが現在の状態において前記前回のフレームと類似しているかの度合いに従って前記現在のロストフレームのサブフレームゲイン勾配を決定するように構成される、第3の決定ユニットと、
    前記サブフレームゲイン勾配および前記現在のロストフレームの前回のN個のフレームのうちの各フレームのサブフレームゲインに従って前記現在のロストフレームのサブフレームゲインを決定するように構成される、第4の決定ユニットであって、Nは正の整数である、第4の決定ユニットと、
    前記現在のロストフレームの高周波数帯域信号を取得するために、前記現在のロストフレームの前記サブフレームゲインおよび前記現在のロストフレームのグローバルゲインに従って前記現在のロストフレームの前記合成高周波数帯域信号を調整するように構成される、調整ユニットとを備える、復号器。
  12. プログラムが記録されたコンピュータ可読記憶媒体であって、前記プログラムは、コンピュータに請求項1から3のいずれか一項に記載の方法を実行させる、コンピュータ可読記憶媒体。
  13. プログラムが記録されたコンピュータ可読記憶媒体であって、前記プログラムは、コンピュータに請求項4または5に記載の方法を実行させる、コンピュータ可読記憶媒体。
JP2016526411A 2013-07-16 2014-01-07 ロストフレームを処理するための方法および復号器 Active JP6264673B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201310297740.1 2013-07-16
CN201310297740.1A CN104301064B (zh) 2013-07-16 2013-07-16 处理丢失帧的方法和解码器
PCT/CN2014/070199 WO2015007076A1 (zh) 2013-07-16 2014-01-07 处理丢失帧的方法和解码器

Publications (2)

Publication Number Publication Date
JP2016529542A JP2016529542A (ja) 2016-09-23
JP6264673B2 true JP6264673B2 (ja) 2018-01-24

Family

ID=52320649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016526411A Active JP6264673B2 (ja) 2013-07-16 2014-01-07 ロストフレームを処理するための方法および復号器

Country Status (8)

Country Link
US (2) US10068578B2 (ja)
EP (3) EP4350694A2 (ja)
JP (1) JP6264673B2 (ja)
KR (1) KR101807683B1 (ja)
CN (2) CN108364657B (ja)
DE (1) DE202014011512U1 (ja)
ES (1) ES2738885T3 (ja)
WO (1) WO2015007076A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108364657B (zh) * 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
US10998922B2 (en) * 2017-07-28 2021-05-04 Mitsubishi Electric Research Laboratories, Inc. Turbo product polar coding with hard decision cleaning

Family Cites Families (97)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5450449A (en) 1994-03-14 1995-09-12 At&T Ipm Corp. Linear prediction coefficient generation during frame erasure or packet loss
US5699485A (en) 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
JP3616432B2 (ja) 1995-07-27 2005-02-02 日本電気株式会社 音声符号化装置
JP3308783B2 (ja) * 1995-11-10 2002-07-29 日本電気株式会社 音声復号化装置
US5819217A (en) 1995-12-21 1998-10-06 Nynex Science & Technology, Inc. Method and system for differentiating between speech and noise
FR2765715B1 (fr) 1997-07-04 1999-09-17 Sextant Avionique Procede de recherche d'un modele de bruit dans des signaux sonores bruites
FR2774827B1 (fr) 1998-02-06 2000-04-14 France Telecom Procede de decodage d'un flux binaire representatif d'un signal audio
US6260010B1 (en) 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
WO2000060579A1 (en) 1999-04-05 2000-10-12 Hughes Electronics Corporation A frequency domain interpolative speech codec system
JP2000305599A (ja) 1999-04-22 2000-11-02 Sony Corp 音声合成装置及び方法、電話装置並びにプログラム提供媒体
US6604070B1 (en) 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6574593B1 (en) 1999-09-22 2003-06-03 Conexant Systems, Inc. Codebook tables for encoding and decoding
US6636829B1 (en) 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
CN1327409C (zh) 2001-01-19 2007-07-18 皇家菲利浦电子有限公司 提供信号重建的宽带音频信号发送机、接收机、系统和方法
SE521693C3 (sv) 2001-03-30 2004-02-04 Ericsson Telefon Ab L M En metod och anordning för brusundertryckning
CN1235192C (zh) 2001-06-28 2006-01-04 皇家菲利浦电子有限公司 传输系统以及用于接收窄带音频信号的接收机和方法
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US7457757B1 (en) 2002-05-30 2008-11-25 Plantronics, Inc. Intelligibility control for speech communications systems
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
WO2003107591A1 (en) 2002-06-14 2003-12-24 Nokia Corporation Enhanced error concealment for spatial audio
DE60303689T2 (de) 2002-09-19 2006-10-19 Matsushita Electric Industrial Co., Ltd., Kadoma Audiodecodierungsvorrichtung und -verfahren
US20040064308A1 (en) 2002-09-30 2004-04-01 Intel Corporation Method and apparatus for speech packet loss recovery
US7330812B2 (en) 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
KR100501930B1 (ko) 2002-11-29 2005-07-18 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
US6985856B2 (en) * 2002-12-31 2006-01-10 Nokia Corporation Method and device for compressed-domain packet loss concealment
WO2004090870A1 (ja) 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US20050004793A1 (en) 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
WO2006009074A1 (ja) * 2004-07-20 2006-01-26 Matsushita Electric Industrial Co., Ltd. 音声復号化装置および補償フレーム生成方法
CN101048649A (zh) 2004-11-05 2007-10-03 松下电器产业株式会社 可扩展解码装置及可扩展编码装置
CN101138174B (zh) 2005-03-14 2013-04-24 松下电器产业株式会社 可扩展解码装置和可扩展解码方法
CN101199004B (zh) 2005-04-22 2011-11-09 高通股份有限公司 用于增益因数平滑的系统、方法及设备
US20060262851A1 (en) 2005-05-19 2006-11-23 Celtro Ltd. Method and system for efficient transmission of communication traffic
EP1727131A2 (en) 2005-05-26 2006-11-29 Yamaha Hatsudoki Kabushiki Kaisha Noise cancellation helmet, motor vehicle system including the noise cancellation helmet and method of canceling noise in helmet
US7831421B2 (en) 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
WO2007000988A1 (ja) 2005-06-29 2007-01-04 Matsushita Electric Industrial Co., Ltd. スケーラブル復号装置および消失データ補間方法
US7734462B2 (en) 2005-09-02 2010-06-08 Nortel Networks Limited Method and apparatus for extending the bandwidth of a speech signal
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
CN100571314C (zh) 2006-04-18 2009-12-16 华为技术有限公司 对丢失的语音业务数据帧进行补偿的方法
CN1983909B (zh) * 2006-06-08 2010-07-28 华为技术有限公司 一种丢帧隐藏装置和方法
CN101496099B (zh) 2006-07-31 2012-07-18 高通股份有限公司 用于对有效帧进行宽带编码和解码的系统、方法和设备
US8532984B2 (en) 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US8015000B2 (en) 2006-08-03 2011-09-06 Broadcom Corporation Classification-based frame loss concealment for audio signals
US8374857B2 (en) * 2006-08-08 2013-02-12 Stmicroelectronics Asia Pacific Pte, Ltd. Estimating rate controlling parameters in perceptual audio encoders
KR101046982B1 (ko) * 2006-08-15 2011-07-07 브로드콤 코포레이션 전대역 오디오 파형의 외삽법에 기초한 부분대역 예측코딩에 대한 패킷 손실 은닉 기법
CN101375330B (zh) * 2006-08-15 2012-02-08 美国博通公司 丢包后解码音频信号的时间扭曲的方法
JP5224666B2 (ja) 2006-09-08 2013-07-03 株式会社東芝 オーディオ符号化装置
JP4827675B2 (ja) 2006-09-25 2011-11-30 三洋電機株式会社 低周波帯域音声復元装置、音声信号処理装置および録音機器
CN101155140A (zh) 2006-10-01 2008-04-02 华为技术有限公司 音频流错误隐藏的方法、装置和系统
WO2008049221A1 (en) 2006-10-24 2008-05-02 Voiceage Corporation Method and device for coding transition frames in speech signals
CN101286319B (zh) * 2006-12-26 2013-05-01 华为技术有限公司 改进语音丢包修补质量的语音编码方法
US8010351B2 (en) 2006-12-26 2011-08-30 Yang Gao Speech coding system to improve packet loss concealment
US20080208575A1 (en) 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
CN101321033B (zh) 2007-06-10 2011-08-10 华为技术有限公司 帧补偿方法及系统
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
CN101325537B (zh) 2007-06-15 2012-04-04 华为技术有限公司 一种丢帧隐藏的方法和设备
ES2533358T3 (es) 2007-06-22 2015-04-09 Voiceage Corporation Procedimiento y dispositivo para estimar la tonalidad de una señal de sonido
US8185388B2 (en) 2007-07-30 2012-05-22 Huawei Technologies Co., Ltd. Apparatus for improving packet loss, frame erasure, or jitter concealment
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
CN101335003B (zh) 2007-09-28 2010-07-07 华为技术有限公司 噪声生成装置、及方法
CN101207665B (zh) * 2007-11-05 2010-12-08 华为技术有限公司 一种衰减因子的获取方法
KR101235830B1 (ko) 2007-12-06 2013-02-21 한국전자통신연구원 음성코덱의 품질향상장치 및 그 방법
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
KR100998396B1 (ko) * 2008-03-20 2010-12-03 광주과학기술원 프레임 손실 은닉 방법, 프레임 손실 은닉 장치 및 음성송수신 장치
FR2929466A1 (fr) 2008-03-28 2009-10-02 France Telecom Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique
CN101588341B (zh) * 2008-05-22 2012-07-04 华为技术有限公司 一种丢帧隐藏的方法及装置
ES2741963T3 (es) 2008-07-11 2020-02-12 Fraunhofer Ges Forschung Codificadores de señal de audio, métodos para codificar una señal de audio y programas informáticos
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
US8718804B2 (en) 2009-05-05 2014-05-06 Huawei Technologies Co., Ltd. System and method for correcting for lost data in a digital audio signal
US8660851B2 (en) 2009-05-26 2014-02-25 Panasonic Corporation Stereo signal decoding device and stereo signal decoding method
US8428938B2 (en) 2009-06-04 2013-04-23 Qualcomm Incorporated Systems and methods for reconstructing an erased speech frame
CN101958119B (zh) 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
GB0919673D0 (en) 2009-11-10 2009-12-23 Skype Ltd Gain control for an audio signal
US9998081B2 (en) 2010-05-12 2018-06-12 Nokia Technologies Oy Method and apparatus for processing an audio signal based on an estimated loudness
US8990094B2 (en) * 2010-09-13 2015-03-24 Qualcomm Incorporated Coding and decoding a transient frame
US8744091B2 (en) 2010-11-12 2014-06-03 Apple Inc. Intelligibility control using ambient noise detection
ES2727748T3 (es) 2010-11-22 2019-10-18 Ntt Docomo Inc Dispositivo y método de codificación de audio
CN102014286B (zh) * 2010-12-21 2012-10-31 广东威创视讯科技股份有限公司 一种视频编解码方法及装置
TWI484479B (zh) 2011-02-14 2015-05-11 Fraunhofer Ges Forschung 用於低延遲聯合語音及音訊編碼中之錯誤隱藏之裝置和方法
AU2012218778B2 (en) 2011-02-15 2016-10-20 Voiceage Evs Llc Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a celp codec
US10121481B2 (en) 2011-03-04 2018-11-06 Telefonaktiebolaget Lm Ericsson (Publ) Post-quantization gain correction in audio coding
CN102915737B (zh) * 2011-07-31 2018-01-19 中兴通讯股份有限公司 一种浊音起始帧后丢帧的补偿方法和装置
WO2013060223A1 (zh) 2011-10-24 2013-05-02 中兴通讯股份有限公司 语音频信号的丢帧补偿方法和装置
WO2013096875A2 (en) 2011-12-21 2013-06-27 Huawei Technologies Co., Ltd. Adaptively encoding pitch lag for voiced speech
CN105469805B (zh) 2012-03-01 2018-01-12 华为技术有限公司 一种语音频信号处理方法和装置
CN103325373A (zh) 2012-03-23 2013-09-25 杜比实验室特许公司 用于传送和接收音频信号的方法和设备
CN102833037B (zh) 2012-07-18 2015-04-29 华为技术有限公司 一种语音数据丢包的补偿方法及装置
JP6139685B2 (ja) 2012-09-13 2017-05-31 エルジー エレクトロニクス インコーポレイティド 損失フレーム復元方法及びオーディオ復号化方法とそれを利用する装置
EP2903004A4 (en) 2012-09-24 2016-11-16 Samsung Electronics Co Ltd METHOD AND APPARATUS FOR HAMPERING FRAME ERRORS, AND METHOD AND APPARATUS FOR DECODING AUDIO DATA
US9123328B2 (en) 2012-09-26 2015-09-01 Google Technology Holdings LLC Apparatus and method for audio frame loss recovery
CN103854649B (zh) 2012-11-29 2018-08-28 中兴通讯股份有限公司 一种变换域的丢帧补偿方法及装置
EP2757558A1 (en) 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
US9711156B2 (en) 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
US9208775B2 (en) 2013-02-21 2015-12-08 Qualcomm Incorporated Systems and methods for determining pitch pulse period signal boundaries
CN108364657B (zh) * 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
US9524720B2 (en) 2013-12-15 2016-12-20 Qualcomm Incorporated Systems and methods of blind bandwidth extension
JP6318621B2 (ja) 2014-01-06 2018-05-09 株式会社デンソー 音声処理装置、音声処理システム、音声処理方法、音声処理プログラム
US9697843B2 (en) 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation

Also Published As

Publication number Publication date
WO2015007076A1 (zh) 2015-01-22
EP2988445A4 (en) 2016-05-11
EP3595211B1 (en) 2024-02-21
EP2988445B1 (en) 2019-06-05
US20160118054A1 (en) 2016-04-28
US10614817B2 (en) 2020-04-07
CN108364657A (zh) 2018-08-03
US10068578B2 (en) 2018-09-04
KR20160005069A (ko) 2016-01-13
JP2016529542A (ja) 2016-09-23
DE202014011512U1 (de) 2021-09-06
EP2988445A1 (en) 2016-02-24
ES2738885T3 (es) 2020-01-27
US20180330738A1 (en) 2018-11-15
KR101807683B1 (ko) 2017-12-11
CN104301064B (zh) 2018-05-04
CN108364657B (zh) 2020-10-30
EP4350694A2 (en) 2024-04-10
EP3595211A1 (en) 2020-01-15
CN104301064A (zh) 2015-01-21

Similar Documents

Publication Publication Date Title
JP6558745B2 (ja) 符号化/復号化方法および符号化/復号化デバイス
JP6364518B2 (ja) オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置
JP6574820B2 (ja) 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス
JP6202545B2 (ja) 帯域幅拡張周波数帯域信号を予測する方法、および復号デバイス
KR101966782B1 (ko) 가중 윈도우들을 코딩/디코딩하는 지연최적화 오버랩 변환
JP6616470B2 (ja) 符号化方法、復号化方法、符号化装置及び復号化装置
RU2702265C1 (ru) Способ и устройство обработки сигналов
JP2014507681A (ja) 帯域幅を拡張する方法および装置
JP6584431B2 (ja) 音声情報を用いる改善されたフレーム消失補正
CN106256001B (zh) 信号分类方法和装置以及使用其的音频编码方法和装置
JP6439804B2 (ja) 損失フレームを処理するための方法および装置
JP6264673B2 (ja) ロストフレームを処理するための方法および復号器
US20190348055A1 (en) Audio paramenter quantization

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171030

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171207

R150 Certificate of patent or registration of utility model

Ref document number: 6264673

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250