JPH10228298A - 音声信号符号化方法 - Google Patents

音声信号符号化方法

Info

Publication number
JPH10228298A
JPH10228298A JP9028696A JP2869697A JPH10228298A JP H10228298 A JPH10228298 A JP H10228298A JP 9028696 A JP9028696 A JP 9028696A JP 2869697 A JP2869697 A JP 2869697A JP H10228298 A JPH10228298 A JP H10228298A
Authority
JP
Japan
Prior art keywords
spectrum
level
selection
peak
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9028696A
Other languages
English (en)
Other versions
JP3930596B2 (ja
Inventor
Naoki Murayama
直樹 村山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taito Corp
Original Assignee
Taito Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taito Corp filed Critical Taito Corp
Priority to JP02869697A priority Critical patent/JP3930596B2/ja
Publication of JPH10228298A publication Critical patent/JPH10228298A/ja
Application granted granted Critical
Publication of JP3930596B2 publication Critical patent/JP3930596B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】音声信号を高度に圧縮して符号化し、しかも音
声信号を復号して再生した場合の音質低下を抑えること
のできる音声信号符号化方法を提供する。 【解決手段】 フレーム化直交変換部で、デジタル変換
された音声信号データを所定の大きさのフレームでフレ
ーム化した後に直交変換してスペクトル化し、レベル計
算部で、前記スペクトル化した音声信号データのスペク
トルの総和の全体レベルを求めるとともに、前記スペク
トルを所定の数で分割したサブバンドのスペクトルの総
和の部分レベルを求め、スペクトル選択部にて前記スペ
クトルの全体の中から選択前の前記全体レベルと選択後
の全体レベルが所定の比率以上になるように選択を行
い、レベル補償部にて選択前の前記部分レベルと選択後
の部分レベルが等しくなるように調整を行い、前記スペ
クトル符号化部にて選択後のスペクトルを可逆符号化す
る構成とした。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号を高度に
圧縮して符号化を行う音声信号符号化方法に関する。
【0002】
【従来の技術】音声信号を符号化するため、従来におい
ては特開昭63−148716号公報に示すようなAD
PCM方式が広く用いられている。この方式は、入力信
号の値から次の入力信号の値を予測して、その予測値と
実際の入力信号との差をとり、この差の振幅の大きさに
応じたステップサイズで量子化して符号化するものであ
り、量子化のステップアップサイズを可変することがで
きることを特徴としている。
【0003】
【発明が解決しようとする課題】しかしながら、上記し
た従来のADPCM方式においては、音声信号を符号化
する場合に、符号化した音声信号を復号化/再生する場
合に音質を確保する上で重要度の高いスペクトルも重要
度の低いスペクトルも一律に符号化されるので、符号化
圧縮率を高くすることができず、例えば通信カラオケ等
に使用した場合等は、通信データの中に占める音声信号
の占有率が大きく、他の必要なデータを入れることがで
きなかったり、或いは、この方式で録音/再生を行うた
めには大容量のメモリを必要とし、また、それを録音す
る記憶媒体の大きさが限られるので、必要な情報の量を
記憶できなくなるという問題があった。
【0004】本発明は、上記した従来の問題点を解決す
べく創案されたもので、音声信号を高度に圧縮して符号
化し、しかも音声信号を復号して再生した場合の音質低
下を抑えることのできる音声信号符号化方法を提供する
ものである。
【0005】
【課題を解決するための手段】上記課題を解決するた
め、本発明は、フレーム化直交変換部と、レベル計算部
と、スペクトル選択部と、レベル補償部と、スペクトル
符号化部と、を備えて音声信号を符号化する音声信号符
号化方法において、前記フレーム化直交変換部で、デジ
タル変換された音声信号データを所定の大きさのフレー
ムでフレーム化した後に直交変換してスペクトル化し、
前記レベル計算部で、前記スペクトル化した音声信号デ
ータのスペクトルの総和の全体レベルを求めるととも
に、前記スペクトルを所定の数で分割したサブバンドの
スペクトルの総和の部分レベルを求め、前記スペクトル
選択部にて前記スペクトルの全体の中から選択前の前記
全体レベルと選択後の全体レベルが所定の比率以上にな
るように選択を行い、前記レベル補償部にて選択前の前
記部分レベルと選択後の部分レベルが等しくなるように
調整を行い、前記スペクトル符号化部にて選択後のスペ
クトルを可逆符号化する構成としたものである。
【0006】また、前記スペクトル選択部におけるスペ
クトルの選択方法は、第1のステップで、前記スペクト
ルの全体から所定の距離幅中で最大のスペクトルを選択
する第1ピークの選択処理を行い、第2のステップで、
前記スペクトルの全体から前記第1ピークの選択処理と
は異なる所定の距離幅中で第2ピーク以降のピークを順
次選択し、第3のステップで、前記第1のステップおよ
び第2のステップで選択した前記第1ピークおよび第2
ピーク以降のピークの総和を求め、第4のステップで、
前記第3のステップ求めた第1ピークおよび第2ピーク
以降のピークの総和が前記スペクトルの総和に対して所
定の割合以上か否かを判断し、第5のステップで、前記
所定の割合以下の場合は前記スペクトルの全体から距離
幅を縮小して再度第1ピークおよび第2ピーク以降のピ
ークの選択を行う構成としたものである。
【0007】
【発明の実施の形態】以下、本発明の実施の形態を図1
乃至図4に基づいて説明する。図1は、本発明の音声信
号符号化方法を行うための符号化装置のブロック図、図
2は、図1の符号化装置で行われる音声信号符号化方法
の構成図、図3は、図2のスペクトル選択部の処理手順
を示すフローチャート、図4は、図2のスペクトル選択
部で行われるピークの選択を示す説明図である。
【0008】本発明の音声信号符号化方法は、図1に示
すような符号化装置1で音声信号が符号化されるもので
ある。この符号化装置1は、外部のマイクロホン2等で
音声をアナログ信号に変換した入力信号を受け、アナロ
グ信号をデジタル信号に変換するA/Dコンバータ3
と、このデジタル変換した信号を圧縮符号化する符号処
理部4、とにより構成されている。また、符号処理部4
は、公知のマイクロコンピュータにより構成されてお
り、内部はI/O装置4a、CPU4b、ROM4c、
RAM4d等からなり、予めROM4c内に格納されて
いるプログラムに従って効率よく符号化されるものであ
る。
【0009】この符号処理部4の機能構成を図2に示
す。図2において、符号処理部4は、フレーム化直交変
換部5、レベル計算部6、スペクトル選択部7、レベル
補償部8、およびスペクトル符号化部9の各機能ブロッ
クから構成されている。この、符号処理部4の動作機能
を図2に基づいて説明する。まず、図2において、前記
A/Dコンバータ3(図1参照)によりPCM変換によ
りデジタル信号に変換されて符号処理部4に入力された
音声信号データは、フレーム化直交変換部5で、例え
ば、1フレームのデータ数が1024個というように、
適切な個数にまとめてフレーム化され、このフレームの
全てに対して直交変換を行って音声信号のデータがスペ
クトル化される。
【0010】次いで、レベル計算部6では、スペクトル
化した音声信号のデータの全てについて、大きさ(絶対
値)の総和を計算し、その値をスペクトルの全体レベル
とする。また、これらのスペクトルを、例えば256個
ずつといった周波数のサブバンドに分割し、この分割し
たサブバンドの各々ついて、スペクトルの大きさの絶対
値の総和を計算してスペクトルの部分レベルとする。次
いで、スペクトル選択部7において、スペクトル全体の
中から再生時の音質を保つ上で重要度の高いスペクトル
の選択を行う。但し、この選択の際には、選択後のスペ
クトルの総和である選択後の全体レベルが、前記レベル
計算部6にて計算しておいた選択前の全体レベルに対し
て例えば50%以上となるようにスペクトルの選択を行
う。
【0011】このスペクトル選択部7におけるスペクト
ルの選択手順を、図3乃至図4に基づいて説明する。ま
ず、図3におけるステップS1で、第1ピーク選択処理
を行う。この第1ピーク選択処理はスペクトルの全体に
ついて、図4(a)に示すように、任意のスペクトルか
ら一定の距離内にそのスペクトルの大きさ(絶対値)以
上の大きさを持つ別のスペクトルが存在するかどうかを
調べ、そのようなスペクトルが存在しなければ、そのス
ペクトルを第1ピークの一つとして選択する。この第1
ピーク選択処理の結果として、図4(b)に示すよう
な、ピーク間の一定距離(以下第1ピーク間距離とい
う)以上の間隔をおいた飛び飛びのスペクトルだけが選
択される。
【0012】次いで、ステップS2において第n(nは
整数)ピーク選択処理を行う。この第nピーク選択処理
は、図4(b)に示すように、ステップS1で選択され
た各々の第1ピークから、第1ピーク間距離とは異なる
一定距離内で最大の大きさ(絶対値)を選択すると、図
4(c)に示すような2番目の大きさのスペクトル、即
ち第2ピークとして選択される。さらに、第2ピークの
選択が終了すれば、同様にして、3番目に大きい第3ピ
ークの選択を行い、以下順次第4ピーク、・・・第nピ
ークの選択を行う。次いで、ステップS3で選択後のレ
ベル計算を行う。この選択後のレベル計算は、ステップ
S1、ステップS2で選択された全てのスペクトル、即
ち第1ピーク、第2ピーク、第3ピーク、・・・第nピ
ークの大きさの総和を計算し、選択後の全体レベルとす
る。
【0013】次いで、ステップS4にて、ステップS3
で計算された選択後の全体レベルが、予め計算されてい
た選択前の全体レベルに対して50%以上であるか、ど
うかを判断する。このステップS4の判断結果、50%
以上であれば処理完了となり、次のステップであるレベ
ル補償部8(図2参照)へ進む。もし50%以下であれ
ば、ステップS5に進む。このステップS5ではステッ
プS1に戻って再度第1ピーク選択処理からやり直す場
合に、前記第1ピーク間距離より少し短縮して選択処理
を行うようにするため、ピーク間距離の縮小を行うもの
である。その結果、選択されるスペクトルの数は増え、
ある段階で50%以上の条件を満足するようになるの
で、その段階で処理が終了し、次のステップであるレベ
ル補償部8(図2参照)へ進み、スペクトル選択を完了
する。
【0014】スペクトル選択が完了すると、レベル補償
部8(図2参照)では、選択後のスペクトルから各サブ
バンドの部分レベルを計算し、サブバンド内の前スペク
トルに対して、次式で計算された補償値αをかけてや
り、選択後の部分レベルが選択前の部分レベルと等しく
なるように調整を行うものである。但し、αは、 α=(選択前の部分レベル)/(選択後の部分レベル) の式で与えられるものである。レベル補償部8で大きさ
を調整されたスペクトルは、スペクトル符号化部9にお
いて、カラオケ等の通信用データに組み込んだり、記録
用データに組み込みをするため可逆的に符号化され、復
号化器に向けて出力される。
【0015】上述した実施の形態によれば、スペクトル
選択部7において、直交変換で得られたスペクトルの中
で、再生時の音質を保ために重要度の高いスペクトルの
み選択して符号化するため、少ない情報量で音声信号の
符号化が可能となる。また、本発明の実施の形態におい
ては、フレーム化直交変換部5において1フレームの大
きさをデータ数1024個にしたが、この数に限定され
ないことは勿論である。さらに、スペクトル選択部7に
おける選択前と選択後の全体レベルの割合を50%以上
としたが、本発明はこれに限定されるものではなく、圧
縮度を上げる場合にはこの割合を下げ、再生した時の忠
実度を上げる場合にはこの割合を上げることで調整がで
きるので、適切な選択度を選ぶことができる。
【0016】
【発明の効果】以上に述べたごとく本発明は、フレーム
化直交変換部で、デジタル変換された音声信号データを
所定の大きさのフレームでフレーム化した後に直交変換
してスペクトル化し、レベル計算部で、前記スペクトル
化した音声信号データのスペクトルの総和の全体レベル
を求めるとともに、前記スペクトルを所定の数で分割し
たサブバンドのスペクトルの総和の部分レベルを求め、
スペクトル選択部にて前記スペクトルの全体の中から選
択前の前記全体レベルと選択後の全体レベルが所定の比
率以上になるように選択を行い、レベル補償部にて選択
前の前記部分レベルと選択後の部分レベルが等しくなる
ように調整を行い、スペクトル符号化部にて選択後のス
ペクトルの可逆符号化することにより、音声信号を高度
に圧縮して符号化することができるので、少ない情報量
で音声信号を符号化することが可能になり、音声の情報
を蓄積する場合には蓄積スペースが少なくてすみ、ま
た、音声の情報を通信する場合には通信時間を短縮でき
るという効果を奏する。また、音声信号を復号して再生
した場合の音質低下を抑えることのできるという効果を
奏するものである。
【図面の簡単な説明】
【図1】本発明の音声信号符号化方法を行うための符号
化装置のブロック図である。
【図2】図1の符号化装置で行われる音声信号符号化方
法の構成図である。
【図3】図2のスペクトル選択部の処理手順を示すフロ
ーチャートである。
【図4】図2のスペクトル選択部で行われるピーク選択
を示す説明図である。
【符号の説明】
1 符号化装置 2 マイクロホン 3 A/Dコンバータ 4 符号処理部 4a I/O装置 4b CPU 4c ROM 4d RAM 5 フレーム化直交変換部 6 レベル計算部 7 スペクトル選択部 8 レベル補償部 9 スペクトル符号化部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 フレーム化直交変換部と、レベル計算部
    と、スペクトル選択部と、レベル補償部と、スペクトル
    符号化部と、を備えて音声信号を符号化する音声信号符
    号化方法において、 前記フレーム化直交変換部で、デジタル変換された音声
    信号データを所定の大きさのフレームでフレーム化した
    後に直交変換してスペクトル化し、 前記レベル計算部で、前記スペクトル化した音声信号デ
    ータのスペクトルの総和の全体レベルを求めるととも
    に、前記スペクトルを所定の数で分割したサブバンドの
    スペクトルの総和の部分レベルを求め、 前記スペクトル選択部にて前記スペクトルの全体の中か
    ら選択前の前記全体レベルと選択後の全体レベルが所定
    の比率以上になるように選択を行い、 前記レベル補償部にて選択前の前記部分レベルと選択後
    の部分レベルが等しくなるように調整を行い、 前記スペクトル符号化部にて選択後のスペクトルを可逆
    符号化することを特徴とする音声信号符号化方法。
  2. 【請求項2】前記スペクトル選択部におけるスペクトル
    の選択方法は、 第1のステップで、前記スペクトルの全体から所定の距
    離幅中で最大のスペクトルを選択する第1ピークの選択
    処理を行い、 第2のステップで、前記スペクトルの全体から前記第1
    ピークの選択処理とは異なる所定の距離幅中で第2ピー
    ク以降のピークを順次選択し、 第3のステップで、前記第1のステップおよび第2のス
    テップで選択した前記第1ピークおよび第2ピーク以降
    のピークの総和を求め、 第4のステップで、前記第3のステップで求めた第1ピ
    ークおよび第2ピーク以降のピークの総和が前記スペク
    トルの総和に対して所定の割合以上か否かを判断し、 第5のステップで、前記所定の割合以下の場合は前記ス
    ペクトルの全体を距離幅を縮小して再度第1ピークおよ
    び第2ピーク以降のピークの選択を行うことを特徴とす
    る請求項1記載の音声信号符号化方法。
JP02869697A 1997-02-13 1997-02-13 音声信号符号化方法 Expired - Lifetime JP3930596B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02869697A JP3930596B2 (ja) 1997-02-13 1997-02-13 音声信号符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02869697A JP3930596B2 (ja) 1997-02-13 1997-02-13 音声信号符号化方法

Publications (2)

Publication Number Publication Date
JPH10228298A true JPH10228298A (ja) 1998-08-25
JP3930596B2 JP3930596B2 (ja) 2007-06-13

Family

ID=12255650

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02869697A Expired - Lifetime JP3930596B2 (ja) 1997-02-13 1997-02-13 音声信号符号化方法

Country Status (1)

Country Link
JP (1) JP3930596B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007088853A1 (ja) * 2006-01-31 2007-08-09 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007088853A1 (ja) * 2006-01-31 2007-08-09 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法
JPWO2007088853A1 (ja) * 2006-01-31 2009-06-25 パナソニック株式会社 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法

Also Published As

Publication number Publication date
JP3930596B2 (ja) 2007-06-13

Similar Documents

Publication Publication Date Title
JP5048697B2 (ja) 符号化装置、復号化装置、符号化方法、復号化方法、プログラムおよび記録媒体
JP3926726B2 (ja) 符号化装置および復号化装置
KR100840439B1 (ko) 음성부호화장치 및 음성복호장치
US7986797B2 (en) Signal processing system, signal processing apparatus and method, recording medium, and program
KR100882771B1 (ko) 부호화 음향 신호를 지각적으로 개선 강화시키는 방법 및장치
US20080077413A1 (en) Audio coding device with two-stage quantization mechanism
JPH08190764A (ja) ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
JPH10282999A (ja) オーディオ信号を符号化する方法及び装置、並びに符号化されたオーディオ信号を復号する方法及び装置
JPH08237132A (ja) 信号符号化方法及び装置、信号復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
KR101143792B1 (ko) 신호 부호화 장치 및 방법, 및 신호 복호 장치 및 방법
US7835915B2 (en) Scalable stereo audio coding/decoding method and apparatus
US20020169601A1 (en) Encoding device, decoding device, and broadcast system
JP2001102930A (ja) 量子化誤差補正方法及び装置並びにオーディオ情報復号方法及び装置
US20010050959A1 (en) Encoder and communication device
US20020173969A1 (en) Method for decompressing a compressed audio signal
JP4308229B2 (ja) 符号化装置および復号化装置
JP3344944B2 (ja) オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
JP3336619B2 (ja) 信号処理装置
JP3930596B2 (ja) 音声信号符号化方法
JPH08307281A (ja) 非線形量子化方法及び非線形逆量子化方法
JPH0537395A (ja) 帯域分割符号化方法
JP3454394B2 (ja) 音声の準可逆符号化装置
JP4721355B2 (ja) 符号化データの符号化則変換方法および装置
JP3134363B2 (ja) 量子化方法
JP2001148632A (ja) 符号化装置、符号化方法、及びその記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051101

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20060610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070228

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070309

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100316

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100316

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110316

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120316

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120316

Year of fee payment: 5

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120316

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130316

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130316

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140316

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140316

Year of fee payment: 7

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140316

Year of fee payment: 7

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term