JP3487250B2 - 符号化音声信号形式変換装置 - Google Patents

符号化音声信号形式変換装置

Info

Publication number
JP3487250B2
JP3487250B2 JP2000052037A JP2000052037A JP3487250B2 JP 3487250 B2 JP3487250 B2 JP 3487250B2 JP 2000052037 A JP2000052037 A JP 2000052037A JP 2000052037 A JP2000052037 A JP 2000052037A JP 3487250 B2 JP3487250 B2 JP 3487250B2
Authority
JP
Japan
Prior art keywords
signal
quantization
mapping
decoding
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000052037A
Other languages
English (en)
Other versions
JP2001242891A (ja
Inventor
雄一郎 高見沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2000052037A priority Critical patent/JP3487250B2/ja
Priority to CA002338266A priority patent/CA2338266C/en
Priority to US09/793,463 priority patent/US7099823B2/en
Priority to DE60116809T priority patent/DE60116809T2/de
Priority to EP01104896A priority patent/EP1136986B1/en
Publication of JP2001242891A publication Critical patent/JP2001242891A/ja
Application granted granted Critical
Publication of JP3487250B2 publication Critical patent/JP3487250B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、符号化音声信号
形式変換装置に係り、詳しくは、圧縮等により符号化さ
れた音声信号の信号形式の変換を、2つの異なる音声符
号化復号方式間で行う符号化音声信号形式変換装置に関
する。
【0002】
【従来の技術】最近の通信技術の進歩に伴って、音声信
号を圧縮等により符号化して扱うことが一般的に行われ
てるが、これには圧縮等により符号化された音声信号の
信号形式を変換する符号化音声信号形式変換装置が必要
になる。このような符号化音声信号形式変換装置を用い
て符号化音声信号の形式変換を行う場合には、低演算量
で信号形式変換を行うことが望まれている。また、この
種の信号形式変換技術は、音声信号に限らずに画像信号
を対象にしても行われている。
【0003】上述のように低演算量で信号形式変換を行
うようにした符号化信号形式変換装置の一例として、画
像信号を対象とした符号化信号形式変換装置が、例えば
特開平10−336672号公報に開示されている。同
符号化信号形式変換装置は、図6のブロック図に示すよ
うに、復号部51と、動きベクトルメモリ52と、解像
度変換部53と、動き補償部55及び符号化処理部56
を含む符号化部54とから構成されている。
【0004】上述の構成において、入力端子61から入
力された例えばMPEG(Motion Picture Expert Grou
p)2ビデオから成る符号化された動画像(画像信号)
は、復号部51により元の動画像に復号されると共に、
符号化された際のそれぞれの符号化データに含まれる動
きベクトルが動きベクトルメモリ52に蓄積される。一
方、復号された動画像は解像度変換部53に入力され
て、解像度変換部53により再符号化する方式で扱える
画像サイズに変換された後、符号化部54に入力され
る。そして、符号化部54では、動き補償部55により
動きベクトルメモリ52から動きベクトルを検出した
後、符号化処理部56によりその動きベクトルに基づい
て動画像を再符号化処理して、出力端子62から外部の
通信装置等に出力する。
【0005】ところで、特開平10−336672号公
報に示されている符号化信号形式変換装置は、動画像か
ら成る画像信号を対象としているので、動きベクトル情
報を持たない音声信号に対しては適用できないという欠
点がある。それゆえ、従来から、低演算量で音声信号形
式変換を行うことができる符号化音声信号形式変換装置
の実現が望まれている。
【0006】従来において符号化音声信号形式変換装置
を実現する場合には、一般に、復号装置と符号化装置と
を直列に接続することによりなされている。例えば、第
1の符号化・復号方式(音声符号化復号方式)に準拠し
た符号化装置で圧縮されている符号化音声信号を、第2
の符号化・復号方式(音声符号化復号方式)に準拠した
復号装置で復号できるように形式変換する場合、まず、
形式変換前の符号化音声信号を第1の符号化・復号方式
に準拠した復号装置で復号して音声信号を得る。次に、
この音声信号を第2の符号化・復号方式に準拠した符号
化装置で符号化し、第2の符号化・復号方式に準拠した
復号装置で復号できるような符号化音声信号を得る。こ
のとき、符号化音声信号形式変換装置を構成する上述の
復号装置と符号化装置は一般に、既存のものを用いて構
成される。
【0007】例えば、上述の第1の符号化・復号方式と
しては、エムペグオーディオ(MPEGAudio)方式、エム
ペグ2エイエイシー(MPEG-2AAC)方式、又はドルビー
エーシー3(Dolby AC-3)方式のいずれかにより構成す
る。また、第2の符号化・復号方式としても、MPEG
Audio方式、MPEG−2AAC方式、又はDo
lby AC−3方式のいずれか(但し、第1の符号化
・復号方式とは構成内容が異なる)により構成する。
【0008】なお、MPEG Audio方式について
は、例えば「1993年、アイ・エス・オー/アイ・イ
ー・シー/11172−3、コーディング・オブ・ムー
ビング・ピクチャーズ・アンド・アソシエイティド・オ
ーディオ・フォー・ディジタル・ストレージ・メディア
・アット・アップ・トゥ・アバウト・1.5メガビット
パーセコンド(ISO/IEC/11172-3、Coding of Moving
Pictures and Associated Audio for Digital Storage
Media at up to about 1.5Mb/s)」(以下、文献1と称
する)に詳細に述べられている。また、MPEG−2A
AC方式については、例えば「1993年、アイ・エス
・オー/アイ・イー・シー/13818−7、ジェネリ
ック・コーディング・オブ・ムービング・ピクチャーズ
・アンド・アソシエイティド・オーディオ・インフォメ
ーション(ISO/IEC/13818-7、Generic Coding of Mov
ing Pictures andAssociated Audio Information)」
(以下、文献2と称する)に詳細に述べられている。ま
た、Dolby AC−3方式については、例えば「1
995年、アドバンスド・テレビジョン・システムズ・
コミッティ・エー/52、ディジタル・オーディオ・コ
ンプレッション・スタンダード(AC−3)(Advanced
TelevisionSystems Committee A/52、Digital Audio C
ompression Standard(AC-3)」(以下、文献3と称する)
に詳細に述べられている。
【0009】以下、図5のブロック図を参照して、従来
の符号化音声信号形式変換装置の構成について説明す
る。同符号化音声信号形式変換装置は、図5に示すよう
に、第1の符号化・復号方式に準拠した第1の復号装置
310と、第2の符号化・復号方式に準拠した第2の符
号化装置320とが直列に接続されて構成されている。
ここで、予め第1の符号化・復号方式で符号化された音
声信号は、第1の復号装置310により復号されて音声
信号とされた後、第2の符号化装置320により符号化
されて、第2の符号化・復号方式により準拠した復号装
置で復号できる符号化音声信号とされる。
【0010】上述の第1の復号装置310は、写像信号
生成部311、逆写像変換部312及び量子化精度情報
復号部313を含んでいる。このような第1の復号装置
310の構成は、前述したMPEG Audio方式、
MPEG−2AAC方式、又はDolby AC−3方
式で共通である。但し、各部311、312、313の
構成内容は各方式で異なり、各方式の詳細は前述の文献
1〜3に述べられている。
【0011】上述の第2の符号化装置320は、写像変
換部321、写像信号符号化部322及び量子化精度計
算部323を含んでいる。このような第2の符号化装置
320の構成は、第1の復号装置310のそれと同様
に、前述したMPEG Audio方式、MPEG−2
AAC方式、又はDolby AC−3方式で共通であ
る。但し、各部321、322、323の構成内容は各
方式で異なり、各方式の詳細は前述の文献1〜3に述べ
られている。
【0012】次に、図5を参照して、同符号化音声信号
形式変換装置の動作について説明する。入力端子300
から入力された予め第1の符号化・復号方式で符号化さ
れていて形式変換すべき符号化音声信号は、第1の復号
装置310の写像信号生成部311及び量子化精度情報
復号部313に入力される。量子化精度情報復号部31
3では、符号化音声信号の一部を復号して、音声信号の
各周波数成分がどの程度詳細に量子化されているかを表
す量子化精度情報を得る。写像信号生成部311では、
まず符号化音声信号の一部を復号して、写像信号の量子
化値を得る。そして、写像信号生成部311は、得られ
た写像信号の量子化値を量子化精度情報復号部313が
出力した量子化精度情報が指定する量子化精度で逆量子
化して、第1の写像信号を得る。
【0013】逆写像変換部312では、写像信号生成部
311が出力した第1の写像信号に対して逆写像変換を
施して、第1の音声信号を得る。前述の文献1ではサブ
バンド合成フィルタ処理が、また文献2、3では逆変形
離散コサイン変換処理が、その逆写像変換に相当する。
【0014】第1の復号装置310の逆写像変換部31
2から出力された第1の音声信号は、第2の符号化装置
320の写像変換部321及び量子化精度計算部323
に入力される。写像変換部321では、その音声信号に
対して写像変換を施して、第2の写像信号を得る。前述
の文献1ではサブバンド分析フィルタ処理が、また文献
2、3では変形離散コサイン変換処理が、その写像変換
に相当する。この写像信号は、入力された音声信号の周
波数成分を表している。
【0015】量子化精度計算部323では、入力された
音声信号を分析して、その音声信号の各周波数成分を表
す写像信号を、どの程度詳細に量子化するかを決定す
る。すなわち、人間の耳に知覚され易い周波数成分につ
いては量子化精度を高くし、知覚され難い周波数成分に
ついては量子化精度を低くする。人間の耳に知覚され易
いか否かは、入力された音声信号を耳の知覚モデルを模
した方法で分析して決定される。この分析方法について
は、前述の文献1、2に詳細に述べられているので、そ
の説明は省略する。この耳の知覚モデルを模して行う分
析は、心理聴覚分析と呼ばれているが、処理が非常に複
雑であり、一般に非常に多くの演算量を必要とする。
【0016】写像信号符号化部322では、まず写像変
換部321が出力した写像信号を、量子化精度計算部3
23が出力した量子化精度で量子化して量子化値を得
る。次に、写像信号符号化部322は、得られた量子化
値を符号列に変換して符号化音声信号を得る。そして、
このようにして形式変換が行われた符号化音声信号は出
力端子301から出力される。
【0017】
【発明が解決しようとする課題】しかしながら、上述し
たような従来の符号化音声信号形式変換装置では、大き
な演算量を必要とする構成要素を含むため、低演算量で
音声信号形式変換を行うのが困難である、という問題が
ある。すなわち、従来の符号化音声信号形式変換装置
は、図5に示したように、第1の符号化・復号方式に準
拠した第1の復号装置310と第2の符号化・復号方式
に準拠した第2の符号化装置320とを直列に接続して
構成されるが、第2の符号化装置320に大きな演算量
を必要とする量子化精度計算部323を含んでいる。
【0018】量子化精度計算部323は、前述したよう
に心理聴覚分析に基づいて、入力された音声信号の各周
波数成分を表す写像信号をどの程度詳細に量子化するか
の量子化精度を決定するが、処理が非常に複雑なので、
非常に多くの演算量を必要とするため、音声信号形式変
換を行う演算量が大きくなるのが避けられなかった。
【0019】この発明は、上述の事情に鑑みてなされた
もので、符号化された音声信号の信号形式の変換を低演
算量で実現することができるようにした符号化音声信号
形式変換装置を提供することを目的としている。
【0020】
【0021】
【課題を解決するための手段】上記課題を解決するため
に、請求項1記載の発明は、2つの異なる音声符号化復
号方式間で符号化音声信号の形式変換を行う符号化音声
信号形式変換装置に係り、形式変換前の上記符号化音声
信号を復号して第1の音声信号を生成する第1の音声符
号化復号方式に準拠した第1の復号装置と、上記第1の
音声信号を符号化して形式変換後の符号化音声信号を生
成する第2の音声符号化復号方式に準拠した第2の符号
化装置とから構成され、上記第1の復号装置が、上記形
式変換前の符号化音声信号に符号化されている第1の量
子化精度情報を復号する量子化精度情報復号部と、上記
形式変換前の符号化音声信号に符号化されている量子化
値を上記第1の量子化精度情報に従って復号及び逆量子
化して第1の写像信号を生成する写像信号生成部と、上
記第1の写像信号に対して逆写像変換を施して上記第1
の音声信号を生成する逆写像変換部とから構成され、上
記第2の符号化装置が、上記第1の音声信号に写像変換
を施して第2の写像信号を生成する写像変換部と、第2
の量子化精度情報を決定する量子化精度情報変換部と、
上記第2の量子化精度情報で上記第2の写像信号を量子
化及び符号化して上記形式変換後の符号化音声信号を生
成する写像信号符号化部とから構成され、上記量子化精
度情報復号部が上記第1の量子化精度情報を上記量子化
精度情報変換部へ出力し、該量子化精度情報変換部にお
いて、上記第2の量子化精度情報が上記第1の量子化精
度情報を上記第2の量子化精度情報に必要とされる時間
区間又は周波数解像度の少なくとも一方となるよう変換
を施して決定されることを特徴としている。
【0022】請求項2記載の発明は、2つの異なる音声
符号化復号方式間で符号化音声信号の形式変換を行う符
号化音声信号形式変換装置に係り、形式変換前の上記符
号化音声信号を復号して第1の音声信号を生成する第1
の音声符号化復号方式に準拠した第1の復号装置と、上
記第1の音声信号を符号化して形式変換後の符号化音声
信号を生成する第2の音声符号化復号方式に準拠した第
2の符号化装置とから構成され、上記2つの異なる音声
符号化復号方式が同一の写像変換手法及び逆写像変換手
法を用いる場合に、上記第1の復号装置が、上記形式変
換前の符号化音声信号に符号化されている第1の量子化
精度情報を復号する量子化精度情報復号部と、上記形式
変換前の符号化音声信号に符号化されている量子化値を
上記第1の量子化精度情報に従って復号及び逆量子化し
て第1の写像信号を生成する写像信号生成部とから構成
され、上記第2の符号化装置が、上記第1の量子化精度
情報とは内容を異にする第2の量子化精度情報を決定す
る量子化精度情報変換部と、上記第2の量子化精度情報
で上記第1の写像信号を量子化及び符号化して上記形式
変換後の符号化音声信号を生成する写像信号符号化部と
から構成され、上記量子化精度情報復号部が上記第1の
量子化精度情報を上記量子化精度情報変換部へ出力し、
該量子化精度情報変換部において、上記第2の量子化精
度情報が上記第1の量子化精度情報を上記第2の量子化
精度情報に必要とされる時間区間又は周波数解像度の少
なくとも一方となるよう変換を施して決定されることを
特徴としている。
【0023】 請求項3記載の発明は、請求項1又は2
に記載の符号化音声信号形式変換装置に係り、上記量子
化精度情報変換部が、上記量子化精度情報復号部が出力
する上記第1の量子化精度情報の中で、第1の時間区間
及び該第1の時間区間の第1の周波数帯域と重なりを持
つ量子化精度情報を抽出し、該抽出する量子化精度情報
が最高精度の量子化精度となるような上記第2の量子化
精度情報を出力することを特徴としている。
【0024】請求項4記載の発明は、請求項1又は3記
載の符号化音声信号形式変換装置に係り、上記逆写像変
換部が、サブバンド合成フィルタ処理又は逆変形離散コ
サイン変換処理を利用して逆写像変換を施すことを特徴
としている。
【0025】請求項5記載の発明は、請求項1、3又は
4記載の符号化音声信号形式変換装置に係り、上記写像
変換部が、サブバンド分析フィルタ処理又は変形離散コ
サイン変換処理を利用して写像変換を施すことを特徴と
している。
【0026】請求項6記載の発明は、請求項1乃至5の
いずれか1に記載の符号化音声信号形式変換装置に係
り、上記第1の音声符号化復号方式が、MPEG Au
dio方式、MPEG−2AAC方式、又はDolby
AC−3方式から構成されることを特徴としている。
【0027】請求項7記載の発明は、請求項1乃至6の
いずれか1に記載の符号化音声信号形式変換装置に係
り、上記第2の音声符号化復号方式が、上記第1の音声
符号化復号方式とは構成内容が異なる、MPEG Au
dio方式、MPEG−2AAC方式、又はDolby
AC−3方式から構成されることを特徴としている。
【0028】
【発明の実施の形態】以下、図面を参照して、この発明
の実施の形態について説明する。説明は、実施例を用い
て具体的に行う。 ◇第1実施例 図1は、この発明の第1実施例である符号化音声信号形
式変換装置の構成を示すブロック図、図2及び図3は同
符号化音声信号形式変換装置の動作を示すフローチャー
トである。この例の符号化音声信号形式変換装置は、図
1に示すように、第1の符号化・復号方式に準拠した第
1の復号装置110と、第2の符号化・復号方式に準拠
した第2の符号化装置120とが直列に接続されて構成
されている。ここで、予め第1の符号化・復号方式で符
号化された音声信号は、第1の復号装置110により復
号されて音声信号とされた後、第2の符号化装置120
により符号化されて、第2の符号化・復号方式により準
拠した復号装置で復号できる符号化音声信号とされる。
【0029】上述の第1の復号装置110は、写像信号
生成部111、逆写像変換部112及び量子化精度情報
復号部113を含んでいる。このような第1の復号装置
110の構成は、前述したMPEG Audio方式、
MPEG−2AAC方式、又はDolby AC−3方
式で共通である。但し、各部111、112、113の
構成内容は各方式で異なり、各方式の詳細は前述の文献
1〜3に述べられている。
【0030】上述の第2の符号化装置120は、写像変
換部121、写像信号符号化部122及び量子化精度情
報変換部123を含んでいる。この量子化精度情報変換
部123には、後述するように第1の復号装置110の
量子化精度情報復号部113から第1の量子化精度情報
が入力されるようになっている。この例では、従来の量
子化精度計算部323に代えて量子化精度情報変換部1
23を用いて、この量子化精度情報変換部123に第1
の復号装置110の量子化精度情報復号部113の出力
を入力するようにした構成が特徴になっている。このよ
うな第2の符号化装置120の構成は、第1の復号装置
110のそれと同様に、前述したMPEG Audio
方式、MPEG−2AAC方式、又はDolby AC
−3方式で共通である。但し、各部121、122、1
23の構成内容は各方式で異なり、各方式の詳細は前述
の文献1〜3に述べられている。
【0031】次に、図2及び図3のフローチャートをも
参照して、同符号化音声信号形式変換装置の動作につい
て説明する。入力端子100から入力された予め第1の
符号化・復号方式で符号化されていて形式変換すべき符
号化音声信号は、第1の復号装置110の写像信号生成
部111及び量子化精度情報復号部113に入力される
(ステップS11)。量子化精度情報復号部113で
は、符号化音声信号の一部を復号して、音声信号の各周
波数成分がどの程度詳細に量子化されているかを表す第
1の量子化精度情報を得る(ステップS12)。この第
1の量子化精度情報は写像信号生成部111及び第2の
符号化装置120の量子化精度情報変換部123へ出力
される。
【0032】写像信号生成部111では、まず符号化音
声信号の一部を復号して、写像信号の量子化値を得る。
そして、得られた写像信号の量子化値を量子化精度情報
復号部113が出力した第1の量子化精度情報が指定す
る量子化精度で逆量子化して、第1の写像信号を得る
(ステップS13)。逆写像変換部112では、写像信
号生成部111が出力した第1の写像信号に対して逆写
像変換を施して、第1の音声信号を得る(ステップS1
4)。前述の文献1ではサブバンド合成フィルタ処理
が、また文献2、3では逆変形離散コサイン変換処理
が、その逆写像変換に相当する。
【0033】第1の復号装置110の逆写像変換部11
2から出力された第1の音声信号は、第2の符号化装置
120の写像変換部121に入力される。写像変換部1
21では、その第1の音声信号に対して写像変換を施し
て、第2の写像信号を得る(ステップS15)。前述の
文献1ではサブバンド分析フィルタ処理が、また文献
2、3では変形離散コサイン変換処理が、その写像変換
に相当する。この写像信号は、入力された音声信号の周
波数成分を表している。
【0034】量子化精度情報変換部123では、第1の
復号装置110の量子化精度情報復号部113が出力し
た第1の量子化精度情報を、第2の符号化装置120の
写像信号符号化部122で利用できるように形式を変換
して第2の量子化精度情報を決定する(ステップS1
6)。この形式の変換方法については後述する。形式変
換によって得られた第2の量子化精度情報は写像信号符
号化部122へ出力される。
【0035】写像信号符号化部122では、まず写像変
換部121が出力した第2の写像信号を、量子化精度情
報変換部123が出力した第2の量子化精度情報が指定
する量子化精度で量子化して量子化値を得る。次に、得
られた量子化値を符号列に変換して符号化音声信号を得
る(ステップS17)。そして、このようにして形式変
換が行われた符号化音声信号は出力端子101から出力
される。
【0036】次に、量子化精度情報変換部123の動作
についてさらに詳細に説明する。この量子化精度情報変
換部123では、前述したように、第1の復号装置11
0の量子化精度情報復号部113が出力する第1の量子
化精度情報を、第2の符号化装置120の写像信号符号
化部122で利用できるように、周波数解像度又は時間
区間の変換、あるいは両者の変換を行う。
【0037】まず、周波数解像度の変換について説明す
る。例えば、第1の復号装置110の量子化精度情報復
号部113が音声信号のスペクトラムを512分割した
各分割帯域における量子化精度を出力し、第2の符号化
装置120の写像信号符号化部122が1024個の分
割帯域における量子化精度を必要としたとする。この例
のように、量子化精度情報復号部113と写像信号符号
化部122とで、分割帯域の個数が異なる場合に、周波
数解像度の変換が必要になる。
【0038】この場合、量子化精度情報変換部123が
出力するn番目(nは自然数)の分割帯域に対する量子
化精度は、この分割帯域と少しでも周波数が重なりを持
つ量子化精度情報復号部113における1つ以上の分割
帯域に対する量子化精度に対して演算を施して求められ
る。この演算には、例えば最も量子化精度が高いものを
演算結果とするような演算、あるいは平均値演算を利用
することができる。
【0039】次に、時間区間の変換について説明する。
この場合は、量子化精度は、音声信号を符号化・復号方
式毎に異なる長さの時間区間に区切って分析が行われて
計算される。ここで、第2の符号化装置120が必要と
する分析区間が、第1の復号装置110が出力する量子
化精度の計算に用いた分析区間と一致しない場合に時間
区間の変換が必要となる。
【0040】この場合、量子化精度情報変換部123が
出力するある時間区間におけるn番目の分割帯域に対す
る量子化精度は、この時間区間に対して少しでも時間区
間が重なりを持つ量子化精度情報復号部113における
1つ以上の時間区間のn番目の分割帯域に対する量子化
精度に対して演算を施して求められる。この演算には、
例えば最も量子化精度が高いものを演算結果とするよう
な演算、あるいは平均値演算を利用することができる。
【0041】また、周波数解像度及び時間区間の両者の
変換が必要になる場合もある。この場合、量子化精度情
報変換部123が出力する時間区間におけるn番目の分
割帯域に対する量子化精度は、この時間区間及び分割帯
域の両方に対して少しでも時間区間及び帯域が重なりを
持つ量子化精度情報復号部113における1つ以上の時
間区間及び1つ以上の分割帯域に対する量子化精度に対
して演算を施して求められる。この演算には、例えば最
も量子化精度が高いものを演算結果とするような演算、
あるいは平均値演算を利用することができる。
【0042】上述したように、この例では符号化音声信
号形式変換装置を構成する第2の符号化装置120に、
従来の量子化精度計算部323に代えて量子化精度情報
変換部123を用いて、この量子化精度情報変換部12
3に第1の復号装置110の量子化精度情報復号部11
3の第1の量子化精度情報を入力して、第2の写像信号
を写像信号符号化部122で量子化して量子化値を得て
符号化音声信号を生成する場合に、写像信号符号化部1
22で利用できるようにその第1の量子化精度情報の形
式を変換して第2の量子化精度情報を決定するように構
成したので、従来よりも少ない演算量で第2の量子化精
度情報を得ることができる。これは、量子化精度情報変
換部123では、従来のように処理が非常に複雑となる
原因になっている心理聴覚分析を用いることなく、通常
知られている演算方法を用いることができるためであ
る。
【0043】このように、この例の符号化音声信号形式
変換装置の構成によれば、第2の符号化装置120に、
量子化精度情報変換部123を用いて、この量子化精度
情報変換部123に第1の復号装置110の量子化精度
情報復号部113の第1の量子化精度情報を入力して、
第2の写像信号を写像信号符号化部122で量子化して
符号化音声信号を生成する場合に、写像信号符号化部1
22で利用できるように第1の量子化精度情報の形式を
変換して第2の量子化精度情報を決定するように構成し
たので、少ない演算量で第2の量子化精度情報を得るこ
とができる。したがって、符号化された音声信号の信号
形式の変換を低演算量で実現することができる。
【0044】◇第2実施例 図4は、この発明の第2実施例である符号化音声信号形
式変換装置の構成を示すブロック図である。この発明の
第2実施例である符号化音声信号形式変換装置が、上述
した第1実施例の構成と大きく異なるところは、逆写像
変換部及び写像変換部を省略するようにした点である。
符号化音声信号形式変換装置を構成する復号装置及び符
号化装置において、音声符号化復号方式が同一の写像変
換手法及び逆写像変換手法を用いる場合には、すなわ
ち、符号化音声信号の形式変換前の符号化・復号方式
と、形式変換後の符号化・復号方式とが同一の写像変換
手法及び逆写像変換手法を用いる場合には、第1実施例
における第1の復号装置110の逆写像変換部112及
び第2の符号化装置120の写像変換部121を省略す
ることができる。
【0045】この例の符号化音声信号形式変換装置は、
図4に示すように、第1の復号装置210及び第2の符
号化装置220は、同一の音声符号化復号方式に準拠し
て構成されている。すなわち、第1の復号装置210
は、写像信号生成部211及び量子化精度情報復号部2
13のみ含んでいて、逆写像変換部は省略されている。
また、第2の符号化装置220は、写像信号符号化部2
22及び量子化精度情報変換部223のみを含んでい
て、写像変換部は省略されている。形式変換前の符号化
音声信号は入力端子200から入力され、形式変換後の
符号化音声信号は出力端子201から出力される。
【0046】ここで、上述した同一の音声符号化復号方
式としては、前述した文献1に述べられているエムペグ
オーディオレイヤ1(MPEG Audio Layer1)方式、エム
ペグオーディオレイヤ2(MPEG Audio Layer2)方式、
又はエムペグオーディオレイヤ3(MPEG Audio Layer3)
方式のいずれかにより構成する。これらの各方式では、
同一の写像変換手法及び逆写像変換手法を用いている。
【0047】上述したように同一の音声符号化復号方式
に準拠して第1の復号装置210及び第2の符号化装置
220を構成することにより、写像信号生成部211の
出力信号と写像信号符号化部222の入力信号は等価と
なるので、逆写像変換部及び写像変換部は不要となる。
したがって、符号化音声信号形式変換装置の逆写像変換
処理及び写像変換処理を省略できるので、必要演算量を
さらに低減することができるようになる。なお、この例
の符号化音声信号形式変換装置の動作は、逆写像変換部
及び写像変換部を除いて第1実施例と略同様なので、そ
の説明を省略する。
【0048】このように、この例の構成によっても、第
1実施例において述べたのと略同様の効果を得ることが
できる。加えて、この例の構成によれば、逆写像変換部
及び写像変換部を省略したので、符号化音声信号形式変
換装置の構成を簡単にできるだけでなく、演算量をさら
に低減することができる。
【0049】以上、この発明の実施例を図面により詳述
してきたが、具体的な構成はこの実施例に限られるもの
ではなく、この発明の要旨を逸脱しない範囲の設計の変
更などがあってもこの発明に含まれる。例えば、第1の
符号化・復号方式(音声符号化復号方式)及び第2の符
号化・復号方式(音声符号化復号方式)を、MPEGA
udio方式、MPEG−2AAC方式、又はDolb
y AC−3方式により構成する例で説明したが、第1
及び第2実施例に示した第1の復号装置及び第2の符号
化装置と略同じ構成になっていれば、他の符号化・復号
方式によって構成することもできる。
【0050】
【発明の効果】以上説明したように、この発明の符号化
音声信号形式変換装置によれば、復号装置と符号化装置
とを直列に接続して、符号化装置に量子化精度情報変換
部を用いて、この量子化精度情報変換部に復号装置の量
子化精度情報復号部の第1の量子化精度情報を入力し
て、写像信号を写像信号符号化部で量子化して符号化音
声信号を生成する場合に、写像信号符号化部で利用でき
るように第1の量子化精度情報の形式を変換して第2の
量子化精度情報を決定するように構成したので、少ない
演算量で第2の量子化精度情報を得ることができる。ま
た、この発明の符号化音声信号形式変換装置によれば、
復号装置及び符号化装置で音声符号化復号方式が同一の
写像変換手法及び逆写像変換手法を用いる場合には、逆
写像変換処理及び写像変換処理を省略できるので、必要
演算量をさらに低減することができる。したがって、符
号化された音声信号の信号形式の変換を低演算量で実現
することができる。
【図面の簡単な説明】
【図1】この発明の第1実施例である符号化音声信号形
式変換装置の構成を示すブロック図である。
【図2】同符号化音声信号形式変換装置の動作を示すフ
ローチャートである。
【図3】同符号化音声信号形式変換装置の動作を示すフ
ローチャートである。
【図4】この発明の第2実施例である符号化音声信号形
式変換装置の構成を示すブロック図である。
【図5】従来の符号化音声信号形式変換装置の構成を示
すブロック図である。
【図6】従来の符号化音声信号形式変換装置の構成を示
すブロック図である。
【符号の説明】
100、200 入力端子 101、201 出力端子 110、210 第1の復号装置 120、220 第2の符号化装置 111、212 写像信号生成部 112 逆写像変換部 113、213 量子化精度情報復号部 121 写像変換部 122、222 写像信号符号化部 223 量子化精度情報変換部

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 2つの異なる音声符号化復号方式間で符
    号化音声信号の形式変換を行う符号化音声信号形式変換
    装置であって、 形式変換前の前記符号化音声信号を復号して第1の音声
    信号を生成する第1の音声符号化復号方式に準拠した第
    1の復号装置と、前記第1の音声信号を符号化して形式
    変換後の符号化音声信号を生成する第2の音声符号化復
    号方式に準拠した第2の符号化装置とから構成され、 前記第1の復号装置が、前記形式変換前の符号化音声信
    号に符号化されている第1の量子化精度情報を復号する
    量子化精度情報復号部と、前記形式変換前の符号化音声
    信号に符号化されている量子化値を前記第1の量子化精
    度情報に従って復号及び逆量子化して第1の写像信号を
    生成する写像信号生成部と、前記第1の写像信号に対し
    て逆写像変換を施して前記第1の音声信号を生成する逆
    写像変換部とから構成され、 前記第2の符号化装置が、前記第1の音声信号に写像変
    換を施して第2の写像信号を生成する写像変換部と、第
    2の量子化精度情報を決定する量子化精度情報変換部
    と、前記第2の量子化精度情報で前記第2の写像信号を
    量子化及び符号化して前記形式変換後の符号化音声信号
    を生成する写像信号符号化部とから構成され、 前記量子化精度情報復号部が前記第1の量子化精度情報
    を前記量子化精度情報変換部へ出力し、該量子化精度情
    報変換部において、前記第2の量子化精度情報が前記第
    1の量子化精度情報を前記第2の量子化精度情報に必要
    とされる時間区間又は周波数解像度の少なくとも一方と
    なるよう変換を施して決定されることを特徴とする符号
    化音声信号形式変換装置。
  2. 【請求項2】 2つの異なる音声符号化復号方式間で符
    号化音声信号の形式変換を行う符号化音声信号形式変換
    装置であって、 形式変換前の前記符号化音声信号を復号して第1の音声
    信号を生成する第1の音声符号化復号方式に準拠した第
    1の復号装置と、前記第1の音声信号を符号化して形式
    変換後の符号化音声信号を生成する第2の音声符号化復
    号方式に準拠した第2の符号化装置とから構成され、 前記2つの異なる音声符号化復号方式が同一の写像変換
    手法及び逆写像変換手法を用いる場合に、前記第1の復
    号装置が、前記形式変換前の符号化音声信号に符号化さ
    れている第1の量子化精度情報を復号する量子化精度情
    報復号部と、前記形式変換前の符号化音声信号に符号化
    されている量子化値を前記第1の量子化精度情報に従っ
    て復号及び逆量子化して第1の写像信号を生成する写像
    信号生成部とから構成され、 前記第2の符号化装置が、前記第1の量子化精度情報と
    は内容を異にする第2の量子化精度情報を決定する量子
    化精度情報変換部と、前記第2の量子化精度情報で前記
    第1の写像信号を量子化及び符号化して前記形式変換後
    の符号化音声信号を生成する写像信号符号化部とから構
    成され、前記量子化精度情報復号部が前記第1の量子化
    精度情報を前記量子化精度情報変換部へ出力し、該量子
    化精度情報変換部において、前記第2の量子化精度情報
    が前記第1の量子化精度情報を前記第2の量子化精度情
    報に必要とされる時間区間又は周波数解像度の少なくと
    も一方となるよう変換を施して決定されることを特徴と
    する符号化音声信号形式変換装置。
  3. 【請求項3】 前記量子化精度情報変換部が、前記量子
    化精度情報復号部が出力する前記第1の量子化精度情報
    の中で、第1の時間区間及び該第1の時間区間の第1の
    周波数帯域と重なりを持つ量子化精度情報を抽出し、該
    抽出する量子化精度情報が最高精度の量子化精度となる
    ような前記第2の量子化精度情報を出力することを特徴
    とする請求項1又は2に記載の符号化音声信号形式変換
    装置。
  4. 【請求項4】 前記逆写像変換部が、サブバンド合成フ
    ィルタ処理又は逆変形離散コサイン変換処理を利用して
    逆写像変換を施すことを特徴とする請求項1又は3記載
    の符号化音声信号形式変換装置。
  5. 【請求項5】 前記写像変換部が、サブバンド分析フィ
    ルタ処理又は変形離散コサイン変換処理を利用して写像
    変換を施すことを特徴とする請求項1、3又は4記載の
    符号化音声信号形式変換装置。
  6. 【請求項6】 前記第1の音声符号化復号方式が、MP
    EG Audio方式、MPEG−2AAC方式、又は
    Dolby AC−3方式から構成されることを特徴と
    する請求項1乃至5のいずれか1に記載の符号化音声信
    号形式変換装置。
  7. 【請求項7】 前記第2の音声符号化復号方式が、前記
    第1の音声符号化復号方式とは構成内容が異なる、MP
    EG Audio方式、MPEG−2AAC方式、又は
    Dolby AC−3方式から構成されることを特徴と
    する請求項1乃至6のいずれか1に記載の符号化音声信
    号形式変換装置。
JP2000052037A 2000-02-28 2000-02-28 符号化音声信号形式変換装置 Expired - Fee Related JP3487250B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2000052037A JP3487250B2 (ja) 2000-02-28 2000-02-28 符号化音声信号形式変換装置
CA002338266A CA2338266C (en) 2000-02-28 2001-02-27 Coded voice signal format converting apparatus
US09/793,463 US7099823B2 (en) 2000-02-28 2001-02-27 Coded voice signal format converting apparatus
DE60116809T DE60116809T2 (de) 2000-02-28 2001-02-28 Vorrichtung zum Transkodieren eines Audiodatenstroms
EP01104896A EP1136986B1 (en) 2000-02-28 2001-02-28 Audio datastream transcoding apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000052037A JP3487250B2 (ja) 2000-02-28 2000-02-28 符号化音声信号形式変換装置

Publications (2)

Publication Number Publication Date
JP2001242891A JP2001242891A (ja) 2001-09-07
JP3487250B2 true JP3487250B2 (ja) 2004-01-13

Family

ID=18573613

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000052037A Expired - Fee Related JP3487250B2 (ja) 2000-02-28 2000-02-28 符号化音声信号形式変換装置

Country Status (5)

Country Link
US (1) US7099823B2 (ja)
EP (1) EP1136986B1 (ja)
JP (1) JP3487250B2 (ja)
CA (1) CA2338266C (ja)
DE (1) DE60116809T2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
JP4263412B2 (ja) * 2002-01-29 2009-05-13 富士通株式会社 音声符号変換方法
KR20050049518A (ko) * 2002-10-03 2005-05-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 미디어 신호 엔코딩 및 디코딩
CN100578616C (zh) * 2003-04-08 2010-01-06 日本电气株式会社 代码转换方法和设备
US7983835B2 (en) 2004-11-03 2011-07-19 Lagassey Paul J Modular intelligent transportation system
JP4661074B2 (ja) * 2004-04-07 2011-03-30 ソニー株式会社 情報処理システム、情報処理方法、並びにロボット装置
US7688888B2 (en) * 2005-04-22 2010-03-30 Zenith Electronics Llc CIR estimating decision feedback equalizer with phase tracker
JP4721355B2 (ja) * 2006-07-18 2011-07-13 Kddi株式会社 符号化データの符号化則変換方法および装置
CN104281609B (zh) * 2013-07-08 2020-03-17 腾讯科技(深圳)有限公司 语音输入指令匹配规则的配置方法及装置
CN104347082B (zh) * 2013-07-24 2017-10-24 富士通株式会社 弦波帧检测方法和设备以及音频编码方法和设备
TWI777464B (zh) 2019-10-08 2022-09-11 創未來科技股份有限公司 訊號轉換裝置與訊號轉換方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3123286B2 (ja) 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
KR100352351B1 (ko) * 1994-02-05 2003-01-06 소니 가부시끼 가이샤 정보부호화방법및장치와정보복호화방법및장치
US5541852A (en) * 1994-04-14 1996-07-30 Motorola, Inc. Device, method and system for variable bit-rate packet video communications
US6141446A (en) * 1994-09-21 2000-10-31 Ricoh Company, Ltd. Compression and decompression system with reversible wavelets and lossy reconstruction
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
JP3283200B2 (ja) 1996-12-19 2002-05-20 ケイディーディーアイ株式会社 符号化音声データの符号化レート変換方法および装置
GB2321577B (en) 1997-01-27 2001-08-01 British Broadcasting Corp Audio compression
JPH10336672A (ja) 1997-05-30 1998-12-18 Oki Electric Ind Co Ltd 符号化方式変換装置およびその動きベクトル検出方法
US6415251B1 (en) * 1997-07-11 2002-07-02 Sony Corporation Subband coder or decoder band-limiting the overlap region between a processed subband and an adjacent non-processed one
JPH11112985A (ja) * 1997-09-29 1999-04-23 Sony Corp 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、および、伝送媒体
JP4242516B2 (ja) * 1999-07-26 2009-03-25 パナソニック株式会社 サブバンド符号化方式
GB0003954D0 (en) 2000-02-18 2000-04-12 Radioscape Ltd Method of and apparatus for converting a signal between data compression formats

Also Published As

Publication number Publication date
CA2338266A1 (en) 2001-08-28
US7099823B2 (en) 2006-08-29
EP1136986B1 (en) 2006-01-25
DE60116809D1 (de) 2006-04-13
CA2338266C (en) 2006-10-17
EP1136986A2 (en) 2001-09-26
JP2001242891A (ja) 2001-09-07
EP1136986A3 (en) 2002-11-13
US20010018651A1 (en) 2001-08-30
DE60116809T2 (de) 2006-09-14

Similar Documents

Publication Publication Date Title
US11355129B2 (en) Energy lossless-encoding method and apparatus, audio encoding method and apparatus, energy lossless-decoding method and apparatus, and audio decoding method and apparatus
US8010348B2 (en) Adaptive encoding and decoding with forward linear prediction
US7835907B2 (en) Method and apparatus for low bit rate encoding and decoding
KR101346358B1 (ko) 대역폭 확장 기법을 이용한 오디오 신호의 부호화/복호화방법 및 장치
JPH10282999A (ja) オーディオ信号を符号化する方法及び装置、並びに符号化されたオーディオ信号を復号する方法及び装置
US20080140393A1 (en) Speech coding apparatus and method
JP2000101436A (ja) オーディオ信号の符号化及び復号方法及び装置
KR100945219B1 (ko) 인코딩된 신호의 처리
KR100755471B1 (ko) 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법
WO2007011157A1 (en) Virtual source location information based channel level difference quantization and dequantization method
JP3487250B2 (ja) 符号化音声信号形式変換装置
JP2003015694A (ja) ビットレート変換装置およびビットレート変換方法
JP3092653B2 (ja) 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置
JP2004246038A (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
KR100928966B1 (ko) 저비트율 부호화/복호화방법 및 장치
US20170206905A1 (en) Method, medium and apparatus for encoding and/or decoding signal based on a psychoacoustic model
KR101449432B1 (ko) 신호 부호화 및 복호화 방법 및 장치
KR20080092823A (ko) 부호화/복호화 장치 및 방법
KR100940532B1 (ko) 저비트율 복호화방법 및 장치
KR20020029244A (ko) 엠피 쓰리 인코더/디코더
Robinson et al. Audio Decoding on the C54X
JPH04131900A (ja) 音声符号化・復号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071031

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081031

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091031

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091031

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101031

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121031

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131031

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees