JPH0955665A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH0955665A
JPH0955665A JP7207155A JP20715595A JPH0955665A JP H0955665 A JPH0955665 A JP H0955665A JP 7207155 A JP7207155 A JP 7207155A JP 20715595 A JP20715595 A JP 20715595A JP H0955665 A JPH0955665 A JP H0955665A
Authority
JP
Japan
Prior art keywords
voiced
input signal
transmission rate
encoding
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7207155A
Other languages
English (en)
Inventor
Michiko Noguchi
美智子 野口
Yuji Okuda
裕二 奥田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7207155A priority Critical patent/JPH0955665A/ja
Publication of JPH0955665A publication Critical patent/JPH0955665A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 有音区間または有声区間のクラス分けを効果
的に行ない、これにより符号化品質を高く保持した上で
平均伝送レートのより一層の低下を図る。 【解決手段】 パラメータ抽出部(C)13において、
入力信号の有音区間からフレームごとのパワー値を求め
てその複数フレーム分のパワー値を基に予測平均パワー
値を求めるとともに、上記入力信号の有音区間からピッ
チ周期を求めている。そして、クラス分け部(C)23
において、これらの予測平均パワー値およびピッチ周期
をそれぞれしきい値と比較することにより最適な有声用
コーデック43,44を判定し、この判定結果に応じて
切替スイッチ33を切替制御して、入力信号を切替情報
とともに最適な有声用コーデック43,44に供給して
音声符号化を行なうようにしたものである。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、例えばデジタル
移動通信装置に設けられる音声符号化装置に係わり、特
に入力信号の音声区間をクラス分けして伝送レートの異
なる複数の音声コーデックに振り分ける機能を備えた装
置に関する。
【0002】
【従来の技術】デジタル移動通信システムでは、CDM
A(code division multiple access)方式が標準化さ
れたことに伴い、可変レート音声コーデックの利用が可
能になった。可変レート音声コーデックは、伝送レート
の異なる複数のコーデックを用いて符号化するため、長
時間の平均レートを下げつつ一定の音質を維持する工夫
が可能である。品質のよい可変レートコーデックとする
ためには、各コーデックの性質にあった適切な音声クラ
ス分けを行なう必要がある。
【0003】音声を無音区間と有音区間とにクラス分け
した場合、一般に有音区間の割合が大きいため、無音区
間に低いレートを割り当てただけでは平均レートを低く
することは難しい。また、無音区間、無声区間、有声区
間の各区間にクラス分けした場合も、無音区間および無
声区間に低いレートを割り当てただけでは平均レートを
低くすることは難しい。このため、平均レートを低くす
るには、有音区間または有声区間用にレートの違う複数
のコーデックを用意する必要がある。
【0004】この種の従来の技術としては、母音区間を
定常的区間と過渡的区間に分けて各々に適したコーデッ
クを用意している例がある。これは、大室、間野、守
谷、“PSI−CELP音声符号化の可変ビットレート
化に関する検討、”信学技報、SP93−139(19
94−02),1994.などに述べられている。これ
らは、いずれも入力音声の特性に応じてアルゴリズムの
違う複数のコーデックを用いて符号化するものである。
【0005】しかし、CDMA方式では伝送容量上の制
約からフルレートが使えず、ハーフレートに制限される
場合がある。このため、通常時にはフルレートのコーデ
ックを用いて処理している音声をハーフレートのコーデ
ックで符号化する場合でも、基本的に同じアルゴリズム
を用いて符号化できる方式の方が音声の特性にあった符
号化が可能となり、品質を維持し易い。また、フルレー
ト時にはアルゴリズムの違う複数のコーデックを用い、
ハーフレートに制限された場合のみフルレートのコーデ
ックに代わってアルゴリズムが基本的に同じハーフレー
トコーデックで符号化する例もある。しかし、コーデッ
クの構成を簡単にするには、有声あるいは有音区間に、
アルゴリズムが基本的に同じでありレートの異なるコー
デックを用意する方式が必要である。このような方式は
ハーフレートに制限されない場合においても平均レート
を低くすることができる。
【0006】有音区間または有声区間を、レートが異な
りアルゴリズムがほぼ同じであるような複数のコーデッ
クで符号化する場合には、入力音声の特徴の中で参照す
べきものを見つけ、それに応じて高いレートあるいは低
いレートのコーデックで符号化する必要がある。しか
し、どのようなクラス分けが効果的であるかについて
は、まだ十分な検討が行なわれていないのが現状であ
る。
【0007】
【発明が解決しようとする課題】この様に従来では、有
音区間または有声区間をどのようにクラス分けするのが
効果的であるかの検討がまだ十分になされておらず、有
効な提案が待望されていた。
【0008】この発明は上記事情に着目してなされたも
ので、その目的とするところは、有音区間または有声区
間のクラス分けを効果的に行ない、これにより符号化品
質を高く保持した上で平均伝送レートのより一層の低下
を図り得る音声符号化装置を提供することにある。
【0009】
【課題を解決するための手段】上記目的を達成するため
にこの発明の音声符号化装置は、1フレーム内のサブフ
レーム数および伝送レートが互いに異なる複数の有声用
符号化手段を設けるとともに、これらの有声用符号化手
段に対する入力信号の供給路に供給経路切替手段を設
け、かつ特徴パラメータ抽出手段と、上記供給経路切替
手段を切替制御する切替制御手段とを設けている。そし
て、上記特徴パラメータ抽出手段により、入力信号中の
音声に対応する信号から少なくとも1種類の特徴パラメ
ータを抽出し、この抽出された特徴パラメータに基づい
て、上記切替制御手段により上記供給経路切替手段を切
替制御して、上記入力信号中の音声に対応する信号を対
応する最適な有声用符号化手段に供給せしめるようにし
たものである。
【0010】すなわち、この発明は、無音・背景雑音以
外の属性の音声をサブフレーム数および伝送レートが異
なる複数のコーデックを選択的に使用して符号化する場
合に、入力信号の有音区間または有声区間の信号から例
えばピッチ周期、パワー値、一次相関係数、ピッチゲイ
ンおよびピッチ周期の変化の絶対値などの特徴パラメー
タを選択的に抽出し、この抽出した特徴パラメータをし
きい値で判定することにより有音区間または有声区間の
信号のクラス分けを行なって、その結果を基に音声信号
を供給すべきコーデックを切り替えるようにしたことを
特徴としている。
【0011】このような構成であれば、次のような作用
効果が奏せられる。すなわち、平均レートと信号対雑音
比(SNR)との関係は、クラス分けの方式が基本的に
同じであれば、通常平均レートの増加に従ってSNRは
ほぼ線形に増加する。この発明のように有音区間または
有声区間の信号の特徴パラメータに基づいてクラス分け
を行なうと、レートの異なる複数のコーデックを規則的
に順番に切り替えた場合に比べてSNRが向上する。
【0012】また、パワー値に対するしきい値を過去の
パワー値から導出した可変しきい値とする場合およびピ
ッチ周期を用いた場合では、パワー値のしきい値を任意
の定数に設定し、この固定しきい値に対するパワー値の
評価式を用いて切り替える場合に比べて、入力音声のレ
ベル変動に対して平均レートおよびSNRが安定するほ
か、パワー値に対して前記可変しきい値を用いた場合
や、パワー値とピッチ周期とをともに用いた場合、パワ
ー値以外のパラメータもともに用いた場合では、SNR
もより高くなる。
【0013】
【発明の実施の形態】
(第1の実施の形態)この実施の形態は、入力信号から
パワー値およびピッチ周期を求め、これらのパラメータ
を用いて、無音・有音判定および無声・有声判定によっ
て有声と判定された信号を、伝送レートおよび1フレー
ムのサブフレーム数が異なる2個の有声用コーデックの
どちらかを用いて符号化するかを判定し、決定した有声
用コーデックで上記有音信号を符号化するよう切替スイ
ッチを切り替えるようにしたものである。
【0014】図1は、その構成を示す回路ブロック図で
ある。この実施の形態の音声符号化装置は、クラス分け
ユニット1aと、コーデックユニット4aと、このコー
デックユニット4aに対する入力信号の供給路に設けら
れた3個の切替スイッチ31,32,33とを備えてい
る。
【0015】コーデックユニット4aは、無音・背景雑
音用コーデック41と、無声用コーデック42と、2個
の有声用コーデック43,44とを備えている。このう
ち2個の有声用コーデック43,44は、伝送レートお
よび1フレーム中のサブフレーム数がそれぞれ異なるよ
うに構成されたもので、有声用コーデック43の伝送レ
ートよりも有声用コーデック44の伝送レートのほうが
高く設定され、また有声用コーデック43のサブフレー
ム数よりも有声用コーデック44のサブフレーム数のほ
うが多く設定されている。
【0016】クラス分けユニット1aは、3個のパラメ
ータ抽出部11,12,13と、これらのパラメータ抽
出部11,12,13に対応して設けられた3個のクラ
ス分け部21,22,23とを有しており、このうちパ
ラメータ抽出部13とクラス分け部23とにより有声用
クラス分けユニット2aが構成される。
【0017】パラメータ抽出部(A)11は、図示しな
い受信部から伝達された入力信号から無音・背景雑音区
間と有音区間とを識別するためのパラメータを抽出し、
このパラメータをクラス分け部(A)21に供給する。
クラス分け部(A)21は供給されたパラメータを基に
無音・背景雑音区間と有音区間とを識別し、この識別結
果に応じて切替スイッチ31を切り替えるとともに、切
替情報を入力信号とともにコーデックへ伝達する。
【0018】パラメータ抽出部(B)12は、図示しな
い受信部から伝達された入力信号から有声と有音とを識
別するためのパラメータを抽出し、このパラメータをク
ラス分け部(B)22に供給する。クラス分け部(B)
22は、供給されたパラメータを基に有声と有音とを識
別し、その識別結果に応じて切替スイッチ32を切り替
えるとともに、切替情報を入力信号とともにコーデック
へ伝達する。
【0019】パラメータ抽出部(C)13は、図示しな
い受信部から伝達された入力信号から高伝送レートを必
要とする音声と低伝送レートも十分な音声とを識別する
ためのパラメータを抽出し、このパラメータをクラス分
け部(C)23に伝達する。クラス分け部(C)23は
伝達されたパラメータを基に入力信号フレームが高伝送
レートを必要とする音声であるか低伝送レートでも十分
な音声であるかを判定し、この判定結果に応じて切替ス
イッチ33を切り替えるとともに、切替情報を入力信号
とともにコーデックへ伝達する。
【0020】切替スイッチ31は、入力信号の伝達方向
を無音・背景雑音用コーデック41とそれ以外のコーデ
ック42,43,44との間で切り替える。切替スイッ
チ32は、切替スイッチ31からの入力信号の伝達方向
を、無声用コーデック42と有声用コーデック43,4
4との間で切り替える。切替スイッチ33は、切替スイ
ッチ32からの入力信号の伝達方向を、有声用コーデッ
ク(I)43と有声用コーデック(I)44との間で切
り替える。
【0021】上記パラメータ抽出部(C)13およびク
ラス分け部(C)23の機能についてさらに詳しく説明
する。パラメータ抽出部(C)13は、高伝送レートが
必要な音声と低伝送レートでも十分な音声とを識別する
ためのパラメータとして、入力信号の各フレームごとに
パワー値およびピッチ周期を求める。クラス分け部
(C)23は、(bn+1)フレーム〜(bn+b)フレームま
での各フレームのパワー値からb個のフレームの平均パ
ワー値Pn を求め、さらにこの様なbフレームにおける
平均パワー値を別のm個のbフレームにおいてそれぞれ
Pn-1 〜Pn-m として求める。そして、予測係数A1 〜
Am でn番目のb個のフレームの平均パワー値Pn を線
形予測し、線形予測によって得られた予測平均パワー値
をpn とし、定数(C)倍した値CPn をしきい値とす
る。しきい値はbフレームごとに求める。
【0022】クラス分け部23は、ピッチ周期τに対し
しきい値τ0 を有し、i番目のフレームのパワー値Pi
がしきい値CPn 以上でかつピッチ周期τがしきい値τ
0 より大きい場合に高伝送レートの有声用コーデック4
4を選択して入力信号を伝達し、それ以外の場合には低
伝送レートの有声用コーデック43を選択して入力信号
を伝達するように、切替スイッチ33を切替制御する。
【0023】上記のパラメータを求めるための式を以下
に示す。いまi番目のフレーム内のj番目のサンプルの
入力信号をxj (i) とし、1フレーム内のサンプル数は
N0 としたとする。そうすると、パワー値Pi 、平均パ
ワー値Pn および予測平均パワー値Pn ^はそれぞれ次
のように算出される。
【0024】
【数1】
【0025】以上のようにこの実施の形態では、パラメ
ータ抽出部(C)13において、入力信号の有音区間か
らフレームごとのパワー値を求めてその複数フレーム分
のパワー値を基に予測平均パワー値を求めるとともに、
上記入力信号の有音区間からピッチ周期を求めている。
そして、クラス分け部(C)23において、これらの予
測平均パワー値およびピッチ周期をそれぞれしきい値と
比較することにより最適な有声用コーデック43,44
を判定し、この判定結果に応じて切替スイッチ33を切
替制御して、入力信号を切替情報とともに最適な有声用
コーデック43,44に供給して音声符号化を行なうよ
うにしている。
【0026】したがって、有音区間の音声信号の特徴に
応じて、高伝送レートの有声用コーデック44と低伝送
レートの有声用コーデックとを適切に選択して符号化を
行なうことができ、これにより音声信号の品質を高く保
持した上で平均伝送レートをさらに低下させることがで
きる。
【0027】なお、しきい値τ0 やしきい値CPn の係
数C、予測係数Ai は、要求される平均伝送レートに応
じて決定すればよく、これらを任意に変えることによっ
て平均伝送レートを調節することができる。
【0028】なお、以上述べた実施の形態は次のような
各種変形が可能である。すなわち、上記実施の形態では
無音・背景雑音と有音を切り替えるために用いるパラメ
ータと、有音と有声を切り替えるためのパラメータと、
有声用コーデック43,44を切り替えるためのパラメ
ータとを、独立したパラメータ抽出部(A)11、パラ
メータ抽出部(B)12、パラメータ抽出部(C)13
で求めたが、どれか一つのパラメータ抽出部で求めたパ
ラメータを別のクラス分け部で共通に使用することも可
能である。また、これらパラメータ抽出部を共通化する
ことも可能である。
【0029】また、前記実施の形態ではbフレームごと
に平均パワー値Pn-1 〜Pn-m をそれぞれ求め、これら
の平均パワー値Pn-1 〜Pn-m を基に線形予測によって
予測平均パワー値Pn ^を求めたが、平均パワー値Pn-
1 と予測係数A1 とを用いた非線形和を予測平均パワー
値Pn ^の代わりとすることもできる。
【0030】さらに、前記実施の形態ではパワー値とピ
ッチ周期を両方を用いてクラス分けを行なったが、パワ
ー値のみを用いてクラス分けを行なってもよい。さら
に、前記実施の形態ではしきい値としてCPn ^をその
ままの値で用いたが、代わりに1つまたは複数の候補値
を用意しておき、これらの候補値の中からしきい値を選
択することもできる。
【0031】また、前記実施の形態においてはパラメー
タを1フレームに1個だけ求めたが、サブフレームごと
に1個求め、複数のサブフレームで求めた各パラメータ
を組み合わせて条件を満たすかどうかを判定することに
よりクラス分けを行なってもよい。例えば、1種類のパ
ラメータについて得られた、1フレーム中の複数のパラ
メータ値のうちのすべてまたはどれか1つがしきい値に
対して大きい場合に、高い伝送レートの有声用コーデッ
クを選択するように判定を行なってもよいし、1フレー
ムに得られた複数のパラメータ値を平均した値をパラメ
ータ値として判定を行なってもよい。
【0032】また、前記実施の形態においてしきい値の
候補値を用意する代わりに、CPn^の有効数字を制限
することによりしきい値を量子化することもできる。 (第2の実施の形態)この実施の形態は、前記第1の実
施の形態がコーデックとして無音・背景雑音用コーデッ
ク41、無声用コーデック42および2個の有声用コー
デック(I)43,44を備えているのに対し、コーデ
ックとして無音・背景雑音用コーデックおよび2個の有
音用コーデックのみを備え、入力信号から抽出した特徴
パラメータによりこれらのコーデックを切り替えて使用
するようにしたものである。
【0033】図2は、この実施の形態に係わる音声符号
化装置の構成を示す回路ブロック図である。なお、同図
において前記図1と同一部分には同一符号を付して詳し
い説明は省略する。
【0034】コーデックユニット4bには、無音・背景
雑音用コーデック41および2個の有音用コーデック
(J)45,46が備えられている。このうち有音用コ
ーデック(J)45,46は、どちらも有音という属性
の音声から得られた信号を符号化するコーデックであ
り、有音用コーデック(J)45は有音用コーデック
(J)46よりも高い伝送レートで符号化を行なうよう
に構成され、かつ1フレーム中のサブフレーム数が多く
構成されている。
【0035】一方、クラス分けユニット1bは、2個の
パラメータ抽出部11,13′と、これらのパラメータ
抽出部11,13′に対応して設けられた2個のクラス
分け部21,23′とを有しており、パラメータ抽出部
11とクラス分け部21とにより無音と有音とを分ける
ためのクラス分けユニットが構成され、またパラメータ
抽出部13′とクラス分け部23′とにより有音用クラ
ス分けユニット2bが構成される。
【0036】このうちパラメータ抽出部(C)13′
は、図示しない受信部から伝達された入力信号から高伝
送レートを必要とする音と低伝送レートも十分な音とを
識別するためのパラメータを抽出し、このパラメータを
クラス分け部(C)23′に伝達する。クラス分け部
(C)23′は伝達されたパラメータを基に入力信号フ
レームが高伝送レートを必要とする音であるか低伝送レ
ートでも十分な音であるかを判定し、この判定結果に応
じて切替スイッチ33を切り替えるとともに、切替情報
を入力信号とともにコーデックへ伝達する。
【0037】このとき、上記パラメータ抽出部(C)1
3′で抽出されるパラメータは、前記パラメータ抽出部
(C)13と同様にパワー値およびピッチ周期である
が、クラス分け部(C)23′ではこれらのパラメータ
を前記クラス分け部(C)23で用いたしきい値とは異
なる値のしきい値を用いてクラス分けの判定が行なわれ
る。すなわち、前記クラス分け部(C)23は音声を判
定したのに対し、この実施の形態のクラス分け部(C)
23′は音の判定を行なう。
【0038】このような構成であるから、入力信号が有
音フレームである場合に、有音用クラス分けユニット2
bにおいてその音のピッチ周期およびパワー値に応じて
クラス分けが行なわれる。そして、その判定結果に応じ
て切替スイッチ33が切り替わり、これにより上記入力
信号の有音フレームは2個の有音用コーデック(J)4
5,46のうちの一方に供給され符号化される。
【0039】このため、入力信号の有音フレームはその
性質に応じてクラス分けされて、適当な伝送レートのコ
ーデックにより符号化されて伝送されることになる。し
たがって、有音フレームの符号化品質を保持した上で平
均伝送レートを低下させることができる。
【0040】(第3の実施の形態)この実施の形態は、
コーデックとして無音・背景雑音用コーデックおよび無
声用コーデックに加えて、3個の有声用コーデックを備
え、入力信号が有声フレームである場合に、その属性を
判定して第1の属性である場合には上記3個の有声用コ
ーデックのうちの1つを選択し、第2の属性である場合
にはその性質に応じて他の2個の有声用コーデックのい
ずれかを選択して使用するようにしたものである。
【0041】図3は、この実施の形態に係わる音声符号
化装置の構成を示す回路ブロック図である。なお、同図
において前記図1と同一部分には同一符号を付して詳し
い説明は省略する。
【0042】コーデックユニット4cには、無音・背景
雑音用コーデック41および無音用コーデック42に加
えて、有声用コーデック(G)47および有声用コーデ
ック(H)48,49が備えられている。有声用コーデ
ック(G)47と有声用コーデック(H)48,49と
は、異なる属性の有声信号を符号化するためのもので、
このうちの有声用コーデック(H)49は有声用コーデ
ック(H)48に比べて高い伝送レートで符号化を行な
うように構成され、かつ1フレーム中のサブフレーム数
が多く設定されている。
【0043】一方、クラス分けユニット1cは、4個の
パラメータ抽出部11,12,14,15と、これらの
パラメータ抽出部11,12,14,15に対応して設
けられた4個のクラス分け部21,22,24,25と
を有している。
【0044】パラメータ抽出部(D)14は、図示しな
い受信部から伝達された入力信号から有声信号の属性を
判定するためのパラメータを抽出し、このパラメータを
クラス分け部(D)24に伝達する。クラス分け部
(D)24は伝達されたパラメータを基に入力信号の有
声フレームの属性を判定し、この判定結果に応じて切替
スイッチ34を切り替えるとともに、切替情報を入力信
号とともにコーデックへ伝達する。
【0045】パラメータ抽出部(E)15は、図示しな
い受信部から伝達された第2の属性の入力有声信号から
高伝送レートを必要とする音声と低伝送レートも十分な
音声とを識別するためのパラメータを抽出し、このパラ
メータをクラス分け部(E)25に伝達する。クラス分
け部(E)25は伝達されたパラメータを基に入力信号
フレームが高伝送レートを必要とする音声であるか低伝
送レートでも十分な音声であるかを判定し、この判定結
果に応じて切替スイッチ35を切り替えるとともに、切
替情報を入力信号とともにコーデックへ伝達する。
【0046】この様な構成であるから、入力信号が有声
フレームであった場合には、まずパラメータ抽出部
(D)14およびクラス分け部(D)24によりその属
性が判定され、この属性に応じて有声用コーデック
(G)47と有声用コーデック(H)48,49との間
が切り替えられる。そして、有声用コーデック(H)4
8,49が選択された場合には、パラメータ抽出部
(E)15およびクラス分け部(E)25において有声
フレームの性質がさらに判定されて、高伝送レートが必
要な場合には有声用コーデック(H)49が選択され、
一方低伝送レートでも十分な場合には有声用コーデック
(H)48が選択される。
【0047】したがってこの実施の形態によれば、有声
フレームの性質ばかりでなく属性によってもそれに適し
たコーデックが切り替えられることになり、これによっ
てより一層平均的な伝送レートを下げることができる。
【0048】(第4の実施の形態)この実施の形態は、
第1の属性の有声フレームを符号化するためのコーデッ
クを2個設けるとともに、第2の属性の有声フレームを
符号化するためのコーデックを1個設け、入力信号が有
声フレームである場合に、その属性を判定して第2の属
性である場合には上記第2の属性用の有声用コーデック
を選択し、第1の属性である場合にはその性質に応じて
上記第1の属性用の2個の有声用コーデックのいずれか
を選択して使用するようにしたものである。
【0049】図4は、この実施の形態に係わる音声符号
化装置の構成を示す回路ブロック図である。なお、同図
において前記図1および図3と同一部分には同一符号を
付して詳しい説明は省略する。
【0050】コーデックユニット4dには、無音・背景
雑音用コーデック41および無音用コーデック42に加
えて、有声用コーデック(G)47,50および有声用
コーデック(H)48が備えられている。有声用コーデ
ック(G)47,50と有声用コーデック(H)48と
は、異なる属性の有声信号を符号化するためのもので、
このうちの有声用コーデック(G)50は有声用コーデ
ック(G)47に比べて高い伝送レートで符号化を行な
うように構成され、かつ1フレーム中のサブフレーム数
が多く設定されている。
【0051】一方、クラス分けユニット1dは、4個の
パラメータ抽出部11,12,14,16と、これらの
パラメータ抽出部11,12,14,16に対応して設
けられた4個のクラス分け部21,22,24,26と
を有している。
【0052】パラメータ抽出部(D)14は、図示しな
い受信部から伝達された入力信号から有声信号の属性を
判定するためのパラメータを抽出し、このパラメータを
クラス分け部(D)24に伝達する。クラス分け部
(D)24は伝達されたパラメータを基に入力信号の有
声フレームの属性を判定し、この判定結果に応じて切替
スイッチ34を切り替えるとともに、切替情報を入力信
号とともにコーデックへ伝達する。
【0053】パラメータ抽出部(F)16は、図示しな
い受信部から伝達された第1の属性の入力有声信号から
高伝送レートを必要とする音声と低伝送レートも十分な
音声とを識別するためのパラメータを抽出し、このパラ
メータをクラス分け部(F)26に伝達する。クラス分
け部(F)26は伝達されたパラメータを基に入力信号
フレームが高伝送レートを必要とする音声であるか低伝
送レートでも十分な音声であるかを判定し、この判定結
果に応じて切替スイッチ36を切り替えるとともに、切
替情報を入力信号とともにコーデックへ伝達する。
【0054】この様な構成であるから、入力信号が有声
フレームであった場合には、まずパラメータ抽出部
(D)14およびクラス分け部(D)24によりその属
性が判定され、この属性に応じて有声用コーデック
(G)47,50と有声用コーデック(H)48との間
が切り替えられる。そして、有声用コーデック(G)4
7,50が選択された場合には、パラメータ抽出部
(F)16およびクラス分け部(F)26において有声
フレームの性質がさらに判定されて、高伝送レートが必
要な場合には有声用コーデック(G)50が選択され、
一方低伝送レートでも十分な場合には有声用コーデック
(G)47が選択される。
【0055】したがってこの実施の形態によっても、有
声フレームの性質ばかりでなく属性により最も適したコ
ーデックが切り替えられることになり、これによってよ
り一層平均的な伝送レートを下げることができる。
【0056】(第5の実施の形態)この実施の形態は、
コーデックとして無音・背景雑音用コーデックおよび無
声用コーデックに加えて、第1の属性用の2個の有声用
コーデックと、第2の属性用の2個の有声用コーデック
とを備え、入力信号が有声フレームである場合にその属
性を判定して、第1の属性である場合にはその性質に応
じて上記第1の属性用の2個の有声用コーデックのうち
のいずれかを選択して使用し、第2の属性である場合に
はその性質に応じて上記第2の属性用の2個の有声用コ
ーデックのいずれかを選択して使用するようにしたもの
である。
【0057】図5は、この実施の形態に係わる音声符号
化装置の構成を示す回路ブロック図である。なお、同図
において前記図1、図3および図4と同一部分には同一
符号を付して詳しい説明は省略する。
【0058】コーデックユニット4eには、無音・背景
雑音用コーデック41および無音用コーデック42に加
えて、第1の属性用の2個の有声用コーデック(G)4
7,50と、第2の属性用の2個の有声用コーデック
(H)48,49とが備えられている。有声用コーデッ
ク(G)47,50と有声用コーデック(H)48,4
9とは、互いに異なる属性の有声信号を符号化するため
のもので、このうち有声用コーデック(G)50、有声
用コーデック(H)49は、それぞれ有声用コーデック
(G)47、有声用コーデック(H)48に比べて高い
伝送レートで符号化を行なうように構成され、かつ1フ
レーム中のサブフレーム数が多く設定されている。
【0059】一方、クラス分けユニット1eは、5個の
パラメータ抽出部11,12,14,15,16と、こ
れらのパラメータ抽出部11,12,14,15,16
に対応して設けられた5個のクラス分け部21,22,
24,25,26とを有している。
【0060】パラメータ抽出部(D)14は、図示しな
い受信部から伝達された入力信号から有声信号の属性を
判定するためのパラメータを抽出し、このパラメータを
クラス分け部(D)24に伝達する。クラス分け部
(D)24は伝達されたパラメータを基に入力信号の有
声フレームの属性を判定し、この判定結果に応じて切替
スイッチ34を切り替えるとともに、切替情報を入力信
号とともにコーデックへ伝達する。
【0061】パラメータ抽出部(E)15は、図示しな
い受信部から伝達された第2の属性の入力有声信号から
高伝送レートを必要とする音声と低伝送レートも十分な
音声とを識別するためのパラメータを抽出し、このパラ
メータをクラス分け部(E)25に伝達する。クラス分
け部(E)25は伝達されたパラメータを基に入力信号
フレームが高伝送レートを必要とする音声であるか低伝
送レートでも十分な音声であるかを判定し、この判定結
果に応じて切替スイッチ35を切り替えるとともに、切
替情報を入力信号とともにコーデックへ伝達する。
【0062】パラメータ抽出部(F)16は、図示しな
い受信部から伝達された第1の属性の入力有声信号から
高伝送レートを必要とする音声と低伝送レートも十分な
音声とを識別するためのパラメータを抽出し、このパラ
メータをクラス分け部(F)26に伝達する。クラス分
け部(F)26は伝達されたパラメータを基に入力信号
フレームが高伝送レートを必要とする音声であるか低伝
送レートでも十分な音声であるかを判定し、この判定結
果に応じて切替スイッチ36を切り替えるとともに、切
替情報を入力信号とともにコーデックへ伝達する。
【0063】この様な構成であるから、入力信号が有声
フレームであった場合には、まずパラメータ抽出部
(D)14およびクラス分け部(D)24によりその属
性が判定され、第1の属性であれば有声用コーデック
(G)47,50が切替スイッチ34により切り替えら
れて選択され、第2の属性であれば有声用コーデック
(H)48,49が切替スイッチ34により切り替えら
れて選択される。
【0064】そして、有声用コーデック(G)47,5
0が選択された場合には、パラメータ抽出部(F)16
およびクラス分け部(F)26において有声フレームの
性質がさらに判定されて、高伝送レートが必要な場合に
は有声用コーデック(G)50が選択され、一方低伝送
レートでも十分な場合には有声用コーデック(G)47
が選択される。
【0065】また、有声用コーデック(H)48,49
が選択された場合には、パラメータ抽出部(E)15お
よびクラス分け部(E)25において有声フレームの性
質がさらに判定されて、高伝送レートが必要な場合には
有声用コーデック(H)49が選択され、一方低伝送レ
ートでも十分な場合には有声用コーデック(H)48が
選択される。
【0066】したがってこの実施の形態によれば、有声
フレームの属性と、その各々の属性における有声信号の
性質とに応じて、最も適したコーデックが切り替え選択
されて使用されることになる。すなわち、さらに細かな
クラス分けが行なわれることになり、これにより平均的
な伝送レートをさらに下げることが可能となる。
【0067】なお、以上の各実施の形態は次のような各
種変形が可能である。すなわち、上記第5の実施の形態
において、2種類の有声用コーデック(G),(H)に
対し、それぞれ伝送レートの異なる2個のコーデックを
用意したが、有声用コーデックとして3種類以上のコー
デックを用意し、これらのコーデックのそれぞれについ
て伝送レートの異なる2個以上のコーデックを用意し
て、これらを選択的に使用するようにしてもよい。
【0068】また、前記第5の実施の形態において、パ
ラメータ抽出部11,12,14,15,16およびク
ラス分け部21,22,24,25,26は、それぞれ
一部または全部を1個または小数個のパラメータ抽出部
およびクラス分け部に統合することもできる。また、入
力信号の伝達路を切り替る切替スイッチについても、そ
の一部または全部を1個の切替スイッチにより構成し、
上記統合したクラス分け部によって制御するように構成
してもよい。
【0069】さらに、前記第3、第4および第5の各実
施の形態において、無声用コーデック、有声用コーデッ
ク(G),(H)の代わりに、有音用コーデック(J)
を用いてもよい。
【0070】(第6の実施の形態)以上述べた第1乃至
第5の各実施の形態では、各パラメータ抽出部において
入力信号の特徴パラメータとしてピッチ周期およびパワ
ー値を抽出し、これらのパラメータをもとにクラス分け
を行なう場合について述べたが、その他のパラメータを
抽出してクラス分けを行なってもよい。
【0071】以下、その一例を図1の構成を用いて説明
する。パラメータ抽出部(C)13は、入力信号からパ
ラメータとして、一次の自己相関k、ピッチゲインgお
よびピッチ周期τの変化の絶対値dをそれぞれ抽出す
る。これらのパラメータをもとにクラス分け部(C)2
3は、無音/有音判定および無声/有声判定によって有
声と判定された信号を有声用コーデック(I)43,4
4のどちらを用いて符号化するかを判定し、決定したコ
ーデックで信号を符号化するよう切替スイッチ33を切
り替える。
【0072】なお、第1の実施の形態で述べたように有
声用コーデック(I)44は、有声用コーデック(I)
43よりも高い伝送レートで符号化し、また1フレーム
中のサブフレーム数がより多く設定されている。
【0073】上記パラメータ抽出部(C)13における
パラメータの抽出、およびクラス分け部(C)23にお
けるクラス分け判定は、それぞれ次のように行なわれ
る。すなわち、いま仮にi番目のフレームに対する一次
の自己相関をki 、ピッチゲインをgi 、iフレームと
(i−1)フレームとのピッチ周期τの差の絶対値、つ
まりピッチの変化の絶対値をdi とする。そして、フレ
ームのサンプル数をN0 とし、i番目のフレーム内のj
番目のサンプルの入力信号xj (i) が入力されたとする
と、上記一次の自己相関ki 、ピッチゲインgi 、ピッ
チ周期τの変化の絶対値di は、それぞれ次の計算式に
より求められる。
【0074】
【数2】
【0075】この実施の形態によっても、先に述べた第
1の実施の形態と同様に、入力有声信号を高伝送レート
が必要な信号と低伝送レートでも十分な信号とにクラス
分けし、これにより伝送レートの異なる2個の有声用コ
ーデック(I)43,44を選択的に使い別けて符号化
を行なうことができる。
【0076】なお、上記クラス分け判定において使用す
る各しきい値は、要求される平均伝送レートに応じて決
定すればよく、これらを任意に変えることによって平均
伝送レートを調節することができる。
【0077】なお、上記第6の実施の形態は次のような
種々変形が可能である。すなわち、ピッチゲインを求め
るときに使うxj (i) は、入力信号をLPC分析から求
まる予測残差信号としてもよい。
【0078】また、前記一次の自己相関ki およびピッ
チゲインgi の分析区間は、1フレームに限ることはな
く、それよりも広い区間または狭い区間としたり、さら
にはフレームと共通部分をもった区間とすることもでき
る。
【0079】また、前記一次の自己相関ki およびピッ
チゲインgi は、1フレームに1回分析を行なって算出
する以外に、サブフレームに1回あるいはフレーム内を
Niサンプル×Ns 区間にわけてこの区間毎に計算を行
なって求めるようにしてもよい。
【0080】さらに、コーデックユニットに設けるコー
デックの種類や数、パラメータ抽出部、クラス分け部お
よび切替スイッチの構成は、前記第1乃至第5の各実施
の形態の場合と同様に変更することが可能である。
【0081】また、パラメータ抽出部が入力信号から得
たパラメータをさらに計算して、別パラメータを求める
とき、その働きをクラス分け部ではなくパラメータ抽出
部に持たせることもできる。
【0082】さらに、前記各実施の形態では、コーデッ
クユニットにおいて伝送レートが異なりかつ1フレーム
中のサブフレーム数の異なる有声用コーデックまたは有
音用コーデックを設けたが、1フレームのサブフレーム
数は同一で伝送レートのみが異なる有声用コーデックま
たは有音用コーデックを設けるようにしてもよい。
【0083】
【発明の効果】以上詳述したように本発明の音声符号化
装置では、無音・背景雑音以外の属性の音声をサブフレ
ーム数および伝送レートが異なる複数のコーデックを選
択的に使用して符号化する場合に、入力信号の有音区間
または有声区間の信号から例えばピッチ周期、パワー
値、一次相関係数、ピッチゲインおよびピッチ周期の変
化の絶対値などの特徴パラメータを選択的に抽出し、こ
の抽出した特徴パラメータをしきい値で判定することに
より有音区間または有声区間の信号のクラス分けを行な
って、その結果を基に音声信号を供給すべきコーデック
を切り替えるようにしている。
【0084】したがって本発明によれば、有音区間また
は有声区間のクラス分けを効果的に行なうことができ、
これにより符号化品質を高く保持した上で平均伝送レー
トのより一層の低下を図ることができる音声符号化装置
を提供することができる。
【0085】すなわち、本発明によれば、予測平均パワ
ー値を用いた可変しきい値およびピッチ周期等によりク
ラス分けを行なうようにしたことによって、音声波形の
特徴を考えずに有声区間と判断された場合には単純に各
フレーム毎に有声用コーデックを規則的に切り換える従
来の方式に比べて、平均レートを低く抑えつつ信号対雑
音比(SNR)を高めることができ、これにより入力音
声のレベルの違いに対しても安定なクラス分けを行なう
ことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係わる音声符号化
装置の構成を示す回路ブロック図。
【図2】本発明の第2の実施の形態に係わる音声符号化
装置の構成を示す回路ブロック図。
【図3】本発明の第3の実施の形態に係わる音声符号化
装置の構成を示す回路ブロック図。
【図4】本発明の第5の実施の形態に係わる音声符号化
装置の構成を示す回路ブロック図。
【図5】本発明の第5の実施の形態に係わる音声符号化
装置の構成を示す回路ブロック図。
【符号の説明】
1a,1b,1c,1d,1e…クラス分けユニット 2a…有声用クラス分けユニット 2b…有音用クラス分けユニット 11,12,13,14,15,16…パラメータ抽出
部 21,22,23,24,25,26…クラス分け部 31,32,33,34,35,36…切替スイッチ 4a,4b,4c,4d,4e…コーデックユニット 41…無音・背景雑音用コーデック 42…無声用コーデック 43,44,47,48,49,50…有音用コーデッ
ク 45,46…有音用コーデック

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 入力信号中の音声に対応する信号から少
    なくとも1種類の特徴パラメータを抽出するための特徴
    パラメータ抽出手段と、 1フレーム内のサブフレーム数および伝送レートが互い
    に異なり、前記音声に対応する信号を符号化するための
    複数の有声用符号化手段と、 前記複数の有声用符号化手段に対する前記入力信号の供
    給路に配置された供給経路切替手段と、 前記特徴パラメータ抽出手段により抽出された特徴パラ
    メータに基づき前記供給経路切替手段を切替制御して、
    前記入力信号中の音声に対応する信号を対応する前記有
    声用符号化手段に供給せしめる切替制御手段とを具備し
    たことを特徴とする音声符号化装置。
  2. 【請求項2】 特徴パラメータ抽出手段は、入力信号中
    の音声に対応する信号から少なくともピッチ周期を抽出
    し、かつ切替制御手段は、前記ピッチ周期に基づき供給
    経路切替手段を切替制御して前記入力信号中の音声に対
    応する信号を対応する複数の有声用符号化手段に供給せ
    しめることを特徴とする請求項1記載の音声符号化装
    置。
  3. 【請求項3】 特徴パラメータ抽出手段は、入力信号中
    の音声に対応する信号から少なくともパワー値を抽出
    し、かつ切替制御手段は、前記パワー値に基づき供給経
    路切替手段を切替制御して前記入力信号中の音声に対応
    する信号を対応する複数の有声用符号化手段に供給せし
    めることを特徴とする請求項1記載の音声符号化装置。
  4. 【請求項4】 特徴パラメータ抽出手段は、入力信号中
    の音声に対応する信号から少なくともパワー値およびピ
    ッチ周期を抽出し、かつ切替制御手段は、前記パワー値
    およびピッチ周期の両方に基づき供給経路切替手段を切
    替制御して前記入力信号中の音声に対応する信号を対応
    する複数の有声用符号化手段に供給せしめることを特徴
    とする請求項1記載の音声符号化装置。
  5. 【請求項5】 複数の有声用符号化手段は、所定のサブ
    フレーム数および伝送レートを有する第1の有声用符号
    化手段と、この第1の有声用符号化手段よりもサブフレ
    ーム数が少なくかつ伝送レートが低い第2の有声用符号
    化手段を備え、 前記切替制御手段は、ピッチ周期が所定のしきい値より
    大きい場合に入力信号を前記第1の有声用符号化手段に
    供給させ、ピッチ周期がしきい値以下の場合に入力信号
    を前記第2の有声用符号化手段に供給せしめることを特
    徴とする請求項2記載の音声符号化装置。
  6. 【請求項6】 複数の有声用符号化手段は、所定のサブ
    フレーム数および伝送レートを有する第1の有声用符号
    化手段と、この第1の有声用符号化手段よりもサブフレ
    ーム数が少なくかつ伝送レートが低い第2の有声用符号
    化手段を備え、 前記切替制御手段は、パワー値が所定のしきい値より大
    きい場合に入力信号を前記第1の有声用符号化手段に供
    給させ、ピッチ周期がしきい値以下の場合に入力信号を
    前記第2の有声用符号化手段に供給せしめることを特徴
    とする請求項3記載の音声符号化装置。
  7. 【請求項7】 複数の有声用符号化手段は、所定のサブ
    フレーム数および伝送レートを有する第1の有声用符号
    化手段と、この第1の有声用符号化手段よりもサブフレ
    ーム数が少なくかつ伝送レートが低い第2の有声用符号
    化手段を備え、 前記切替制御手段は、ピッチ周期が所定のしきい値より
    大きくかつパワー値が所定のしきい値より大きい場合に
    入力信号を前記第1の有声用符号化手段に供給させ、そ
    れ以外の場合に入力信号を前記第2の有声用符号化手段
    に供給せしめることを特徴とする請求項4記載の音声符
    号化装置。
  8. 【請求項8】 特徴パラメータ抽出手段は、入力信号中
    の音声に対応する信号から、近接するサンプル間の相関
    を表わすパラメータ、ピッチ性の強さを表わすパラメー
    タ、およびピッチ周期の変化の度合いを表わすパラメー
    タを抽出し、かつ切替制御手段は、前記特徴パラメータ
    抽出手段により抽出された各パラメータのうちの少なく
    とも一つに基づき供給経路切替手段を切替制御して前記
    入力信号中の音声に対応する信号を対応する複数の有声
    用符号化手段に供給せしめることを特徴とする請求項1
    記載の音声符号化装置。
  9. 【請求項9】 複数の有声用符号化手段は、所定のサブ
    フレーム数および伝送レートを有する第1の有声用符号
    化手段と、この第1の有声用符号化手段よりもサブフレ
    ーム数が少なくかつ伝送レートが低い第2の有声用符号
    化手段を備え、 前記切替制御手段は、近接するサンプル間の相関を表わ
    すパラメータが所定のしきい値より大きい場合に入力信
    号を前記第1の有声用符号化手段に供給させ、前記近接
    するサンプル間の相関を表わすパラメータがしきい値以
    下の場合に入力信号を前記第2の有声用符号化手段に供
    給せしめることを特徴とする請求項8記載の音声符号化
    装置。
  10. 【請求項10】 複数の有声用符号化手段は、所定のサ
    ブフレーム数および伝送レートを有する第1の有声用符
    号化手段と、この第1の有声用符号化手段よりもサブフ
    レーム数が少なくかつ伝送レートが低い第2の有声用符
    号化手段を備え、 前記切替制御手段は、ピッチの強さを表わすパラメータ
    が所定のしきい値より大きい場合には、前記近接するサ
    ンプル間の相関を表わすパラメータの値によらず入力信
    号を前記第1の有声用符号化手段に供給せしめることを
    特徴とする請求項8または9記載の音声符号化装置。
  11. 【請求項11】 複数の有声用符号化手段は、所定のサ
    ブフレーム数および伝送レートを有する第1の有声用符
    号化手段と、この第1の有声用符号化手段よりもサブフ
    レーム数が少なくかつ伝送レートが低い第2の有声用符
    号化手段を備え、 前記切替制御手段は、ピッチ周期の変化の度合いを表わ
    すパラメータが所定のしきい値より大きい場合には、前
    記近接するサンプル間の相関を表わすパラメータの値お
    よび前記ピッチの強さを表わすパラメータの値によらず
    入力信号を前記第1の有声用符号化手段に供給せしめる
    ことを特徴とする請求項8乃至10のいずれかに記載の
    音声符号化装置。
  12. 【請求項12】 入力信号中の音声に対応する信号から
    少なくとも1種類の特徴パラメータを抽出するための特
    徴パラメータ抽出手段と、 互いに異なる伝送レートを有し、前記入力信号中の音声
    に対応する信号を符号化するための複数の有声用符号化
    手段と、 前記複数の有声用符号化手段に対する前記入力信号の供
    給路に配置された供給経路切替手段と、 前記特徴パラメータ抽出手段により抽出された特徴パラ
    メータに基づき前記供給経路切替手段を切替制御して、
    前記入力信号中の音声に対応する信号を対応する前記有
    声用符号化手段に供給せしめる切替制御手段とを具備し
    たことを特徴とする音声符号化装置。
  13. 【請求項13】 特徴パラメータ抽出手段は、入力信号
    中の音声に対応する信号から少なくともパワー値を抽出
    し、かつ切替制御手段は、前記パワー値に基づき供給経
    路切替手段を切替制御して前記音声に対応する信号を対
    応する複数の有声用符号化手段に供給せしめることを特
    徴とする請求項12記載の音声符号化装置。
  14. 【請求項14】 複数の有声用符号化手段は、所定の伝
    送レートを有する第1の有声用符号化手段と、この第1
    の有声用符号化手段よりも伝送レートの低い第2の有声
    用符号化手段を備え、 前記切替制御手段は、特徴パラメータ抽出手段により抽
    出されたパワー値が所定のしきい値より大きい場合に入
    力信号を前記第1の有声用符号化手段に供給させ、パワ
    ー値がしきい値以下の場合に入力信号を前記第2の有声
    用符号化手段に供給せしめることを特徴とする請求項1
    3記載の音声符号化装置。
  15. 【請求項15】 複数の有声用符号化手段は、所定の伝
    送レートを有する第1の有声用符号化手段と、この第1
    の有声用符号化手段よりも伝送レートの低い第2の有声
    用符号化手段を備え、 前記切替制御手段は、特徴パラメータ抽出手段により抽
    出されたピッチ周期が所定のしきい値より大きい場合に
    入力信号を前記第1の有声用符号化手段に供給させ、ピ
    ッチ周期がしきい値以下の場合に入力信号を前記第2の
    有声用符号化手段に供給せしめることを特徴とする請求
    項12記載の音声符号化装置。
  16. 【請求項16】 特徴パラメータ抽出手段は、入力信号
    のフレームを所定数の区間にわけ、これらの区間毎に少
    なくとも一つの特徴パラメータを抽出することを特徴と
    する請求項1、2、3、4、8、12または13記載の
    音声符号化装置。
  17. 【請求項17】 特徴パラメータ抽出手段は、過去の入
    力信号のパワー値から現在の入力信号の平均的パワー値
    を予測する手段を有し、切替制御手段は前記予測された
    平均的パワー値を基にパワー値のしきい値を可変設定す
    ることを特徴とする請求項6、7、13または14記載
    の音声符号化装置。
  18. 【請求項18】 切替制御手段は、過去の入力信号のパ
    ワー値から予測した複数の平均的パワー値を基に現在の
    入力信号の平均的パワー値を線形予測によって求めるこ
    とを特徴とする請求項17記載の音声符号化装置。
JP7207155A 1995-08-14 1995-08-14 音声符号化装置 Pending JPH0955665A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7207155A JPH0955665A (ja) 1995-08-14 1995-08-14 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7207155A JPH0955665A (ja) 1995-08-14 1995-08-14 音声符号化装置

Publications (1)

Publication Number Publication Date
JPH0955665A true JPH0955665A (ja) 1997-02-25

Family

ID=16535144

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7207155A Pending JPH0955665A (ja) 1995-08-14 1995-08-14 音声符号化装置

Country Status (1)

Country Link
JP (1) JPH0955665A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002533772A (ja) * 1998-12-21 2002-10-08 クゥアルコム・インコーポレイテッド 可変レートスピーチコーディング
KR100651731B1 (ko) * 2003-12-26 2006-12-01 한국전자통신연구원 가변 프레임 음성 부호화/복호화 장치 및 그 방법
WO2019244298A1 (ja) * 2018-06-21 2019-12-26 日本電気株式会社 属性識別装置、属性識別方法、およびプログラム記録媒体

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002533772A (ja) * 1998-12-21 2002-10-08 クゥアルコム・インコーポレイテッド 可変レートスピーチコーディング
JP4927257B2 (ja) * 1998-12-21 2012-05-09 クゥアルコム・インコーポレイテッド 可変レートスピーチ符号化
JP2013178545A (ja) * 1998-12-21 2013-09-09 Qualcomm Inc 可変レートスピーチ符号化
KR100651731B1 (ko) * 2003-12-26 2006-12-01 한국전자통신연구원 가변 프레임 음성 부호화/복호화 장치 및 그 방법
WO2019244298A1 (ja) * 2018-06-21 2019-12-26 日本電気株式会社 属性識別装置、属性識別方法、およびプログラム記録媒体
JPWO2019244298A1 (ja) * 2018-06-21 2021-07-08 日本電気株式会社 属性識別装置、属性識別方法、およびプログラム

Similar Documents

Publication Publication Date Title
CN108900725B (zh) 一种声纹识别方法、装置、终端设备及存储介质
Beritelli et al. A robust voice activity detector for wireless communications using soft computing
KR101116363B1 (ko) 음성신호 분류방법 및 장치, 및 이를 이용한 음성신호부호화방법 및 장치
KR100883656B1 (ko) 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치
CN1703737B (zh) 在自适应多速率宽带(amr-wb)和多模式可变比特率宽带(vmr-wb)编解码器之间互操作的方法
US7472059B2 (en) Method and apparatus for robust speech classification
FI119085B (fi) Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa
KR100964402B1 (ko) 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치
CN102089803B (zh) 用以将信号的不同段分类的方法与鉴别器
FI118834B (fi) Audiosignaalien luokittelu
RU2146394C1 (ru) Способ и устройство вокодирования переменной скорости при пониженной скорости кодирования
CN1335980A (zh) 借助于映射矩阵的宽频带语音合成
EP1214705B1 (en) Method and apparatus for maintaining a target bit rate in a speech coder
KR20070001276A (ko) 신호 인코딩
KR20080083719A (ko) 오디오 신호를 부호화하기 위한 부호화 모델들의 선택
JP2000267699A (ja) 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置
Eriksson et al. Exploiting interframe correlation in spectral quantization: a study of different memory VQ schemes
KR100546758B1 (ko) 음성의 상호부호화시 전송률 결정 장치 및 방법
JP3297156B2 (ja) 音声判別装置
KR101862982B1 (ko) LPC-10e 보코더에서 DNN을 이용한 유무성음 판별 방법
JPH0955665A (ja) 音声符号化装置
JP3353852B2 (ja) 音声の符号化方法
Zhang et al. A CELP variable rate speech codec with low average rate
Enqing et al. Low bit and variable rate speech coding using local cosine transform
Beritelli et al. Adaptive V/UV speech detection based on acoustic noise estimation and classification