JPH02238498A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH02238498A
JPH02238498A JP5992389A JP5992389A JPH02238498A JP H02238498 A JPH02238498 A JP H02238498A JP 5992389 A JP5992389 A JP 5992389A JP 5992389 A JP5992389 A JP 5992389A JP H02238498 A JPH02238498 A JP H02238498A
Authority
JP
Japan
Prior art keywords
order
quantization
storage means
speech
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5992389A
Other languages
English (en)
Other versions
JPH0772838B2 (ja
Inventor
Masahiro Hamada
正宏 浜田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP1059923A priority Critical patent/JPH0772838B2/ja
Publication of JPH02238498A publication Critical patent/JPH02238498A/ja
Publication of JPH0772838B2 publication Critical patent/JPH0772838B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は登録型離散音声認識装置に関するものである。
従来の技術 近年、音声認識装置は産業用分野のみならず民生用分野
においても徐々に利用されるようになってきた。
以下図面を参照しながら、従来の登録型離散音声認識装
置について説明する。
第2図は従来の登録型離散音声認識装置の一構成例を示
すものである。第2図において10は分析手段であり、
音声が入力される。分析手段10の出力は切り替え手段
20に入力されている。切り替え手段20の第1の出力
は第1の記憶手段30に入力され、第2の出力は第2の
記憶手段40に入力されている。また50は照合手段で
あり、第1の記憶千段30の出力と第2の記憶手段40
の出力とが入力されている。照合手段50からは認識結
果が出力される。
以上のように構成された登録型離散音声認識装置に関し
、以下にその動作について説明する。
音声登録時には切り替え手段20で分析手段10と第1
の記憶手段30とを接続し、登録音声を一定周期毎に分
析して得られた複数次数のケプストラム係数のパターン
を第1の記憶手段30に記憶する。
一方音声認識時には切り替え手段20で分析手段1と第
2の記憶手段40とを接続し、認識音声を一定周期毎に
分析して得られた複数次数のケプストラム係数のパター
ンを第2の記憶手段40に記憶し、さらに第2の記憶手
段40の内容を照合手段50に入力する。また既に登録
された音声のパターンを第1の記憶手段30から1単語
づつ照合手段50に入力する。
そして照合手段50で認識音声と登録音声のそれぞれと
の間の距離を算出する。算出に当たっては、ケプストラ
ム係数の特質を十分に生かし、あるいは耐騒音性を向上
させる目的で次式に示す重み付けケブストラム距離を用
い、この距離に基づいてダイナミックプログラミング手
法で認識音声と登録音声との非線形時間伸縮を行う。
d+1  =   Σ ’w h ( a +b− b
 +k) 2ここで k :次数 ash: 入力音声の第i分析周期部のケプストラム係
数 bak: 登録音声の第j分析周期部のケプストラム係
数 Wk:重み係数 dB:  ashとbJkとの間の重み付けケプストラ
ム距離 この結果、最も小さな距離を与えた登録音声を以て認識
結果とみなして出力する。
また上式における重みの一例について、すでに東倉氏 
 フ゛口七イーテ゛インク゛ス オフ゜ 号′ インタ
ーナショナル コンフェレンス オン アコースティフ
クス、 スヒ”−チ アント゛ シク゜ナル フ゜Ot
シンゲ、(Proceedings  of  the
  International  Conferen
−ce  on  Acoustics,  Spee
ch  and  S1gnal  Processt
一ng,pp.761−784.198[i)  や、
  ヒ゛一・ハンソン (B.  ■anson)氏、
   フ゜口tイーテ゜インク゜ス オフ゜ 号゜ イ
ンターナショナル コンフェレンスオン アコースティ
フクス、 スヒ゜−チ 7ント゛ シク゜ナル フ′口
tシンク゜ ( Pr−oceedlngs  of 
 the  International  Conf
erence  onAcoustics,  Spe
ech  and  Slgnal  PrOeeSS
Ingll)p.757〜7GO,198G)  から
提案がなされている。東倉氏の重み付けは各ケプストラ
ム係数の分布の分散の逆数(wi= 1 / a *2
)であり、B.■anson氏の重み付けは係数そのも
のを自乗した値(wb=k2)である。環境騒音として
典型的な低周波数に偏りを持つ騒音が重畳することによ
って入力音声のスペクトル概形の傾きが変化した場合に
は、このような重み付けを行った距離が従来より優れた
認識結果をもたらすことが示されている。
発明が解決しようとする課題 しかしながら上記のような構成では、音声を記憶すべき
第1の記憶手段30と第2の記憶手段40とに大容量の
記憶手段を必要とするばかりか、照合手段50において
重み付けを乗じるために余分な計算量が必要となるとい
う問題点を有していた。
本発明は、上記課題に鑑み、ケプストラム係数の特質を
十分に生かす、あるいは耐騒音性を向上させるという二
つの特徴の一方あるいは両方を実現しつつ、さらに、大
容量の記憶手段を必要とせず、重み付けを乗じるための
余分な計算量も必要としない、という特徴を実現するこ
とによって、高い音声認識性能を達成できる登録型離散
音声認識装置を提供する事を目的とする。
課題を解決するための手段 本発明の特許請求の範囲第1項記載の音声認識装置は、
入力音声を一定周期毎にケプストラム分析し、前記一定
周期毎に複数次数のケプストラム係数を出力する分析手
段と、前記分析手段から得られた複数次数のケプストラ
ム係数を次数毎に異なった量子化幅で量子化して次数毎
に少数のビット数で表現された複数次数の符号語を得る
量子化手段と、複数の登録音声に関して前記量子化手段
から得られる前記複数次数の符号語を前記一定周期毎に
記憶する第1の記憶手段と、認識音声に関して前記景子
化手段から得られる前記複数次数の符号語を前記一定周
期毎に記憶する第2の記憶手段と、前記第2の記憶手段
の内容と前記第1の記憶手段の内容とを入力し、前記認
識音声と前記複数の登録音声のそれぞれとの間の距離を
算出する照合手段とから構成されている。
本発明の特許請求の範囲第2項記載の音声認識装置は、
請求項1記載の音声認識装置において、量子化手段が、
得られた複数次数のケプストラム係数のうち低次のもの
は粗い幅で量子化し、高次のものは細かい幅で量子化し
て次数毎に少数のビット数で表現された複数次数の符号
語を得ることを特徴としている。
本発明の特許請求の籟囲第3項記載の音声認識装置は、
請求項1記載の音声認識装置において、■子化手段が、
ケプストラム係数の統計的分布のおおよその上●下限値
を含み込むよう次数毎に予め定められた2種の数値を用
い、この2種の数値の範囲で各次数のケプストラム係数
を少ビット数で量子化して複数次数の符号語を得ること
を特徴としている。
本発明の特許請求の範囲第4項記載の音声認識装置は、
請求項3記載の音声認識装置において、照合手段が、認
識音声と複数の登録音声のそれぞれとの距離の算出に当
たって、前記複数次数の符号語に基づいたチェビシェフ
距離を用いることを特徴としている。
作用 (1)特許請求の範囲第1項記載の発明では前記の構成
によって、量子化手段において複数次数のケプストラム
係数を次数毎に異なった量子化幅で量子化することによ
り従来の重み付けと等価な効果が得られ、これにより次
数毎に異なった音響的性質を持つケプストラム係数の特
質を十分に生かすことができると共に、重み付けを乗じ
るための余分な計算量も必要とt7ない。また少数のビ
ット数で表現された複数次数の符号語を得ることにより
、大容量の記憶手段を必要としない。
(2)特許請求.の範囲第2項記載の発明では前記の構
成によって、量子化手段において得られた複数次数のケ
プストラム係数のうち低次のものは粗い幅で量子化し、
高次のものは細かい幅で量子化して次数毎に少数のビッ
ト数で表現された複数次数の符号語を得ることにより、
環境騒音として典型的な低周波数に偏りを持つ騒音が重
畳することによって入力音声のスペクトル概形の傾きが
変化した場合にも認識性能が大きく劣化することがない
。それ以外の作用は、作用第1項記載の内容と同一であ
る。
(3)特許請求の範囲第3項記載の発明では前記の構成
によって、量子化手段においてケプストラム係数の統計
的分布のおおよその上番下限値を含み込むよう次数毎に
予め定められた2種の数値を用い、この2種の数値の範
囲で各次数のケプストラム係数を少ビット数で量子化し
て複数次数の符号語を得ることにより、分布範囲がそれ
ぞれ異なる各次数のケブストラム係数に関し、■子化に
よる係数のオーバーフローやアンダーフローを生じに《
い量子化法実現が可能となる。
それ以外の作用は、作用第2項記載の内容と同一である
(4)特許請求の範囲第4項記載の発明では前記の構成
によって、照合手段において認識音声と複数の登録音声
の各々との距離の算出に当たって、チェビシェフ距離を
用いることにより乗除算等の複雑な計算を必要とせず、
距離の算出が容易に実現できる。
それ以外の作用は、作用3項記載の内容と同一である。
実施例 以下に、本発明の実施例について図面を参照しながら説
明する。
(1)第1図は本特許請求の範囲第1項記載の発明にな
る一実施例における登録型離散音声認識装置の構成を示
すブロック図である。
この装置は次数毎に異なった音響的性質を持つケプスト
ラム係数の特質を十分に生かし、大容量の音声記憶手段
を必要とせず、重み付けを乗じるための余分な計算量も
必要としないという高い音声認識性能を達成することを
目的としている。
1は分析手段であり、音声が入力される。分析手段1の
出力は量子化手段6に入力され、量子化手段6の出力は
切り替え手段2に入力されている。
切り替え手段2の第1の出力は第1の記憶手段3に入力
され、第2の出力は第2の記憶手段4に入力されている
。また5は照合手段であり、第1の記憶手段3の出力と
第2の記憶手段4の出力とが入力されている。照合手段
5からは認識結果が出力される。
以上のように構成された登録型離散音声認!a装置に関
し、以下にその動作について説明する。
音声登録時には切り替え手段2で量子化手段6と第1の
記憶手段3とを接続し、登録音声を一定周期毎に分析し
て得られた複数次数のケプストラム係数の符号語のパタ
ーンを第1の記憶手段3に記憶する。一方音声認識時に
は切り替え手段2で量子化手段6と第2の記憶手段4と
を接続し、認識音声を一定周期毎に分析して得られた複
数次数のケプストラム係数の符号語のパターンを第2の
記憶手段4に記憶し、第2の記憶手段4の内容を照合手
段5に入力し、さらに既に登録された音声のパターンを
第1の記憶手段3から1単語づつ照合手段5に入力し、
照合手段5で認識音声と登録音声のそれぞれとの間の距
離を算出する。この結果、最も小さな距離を与えた登録
音声を以て認識結果とみなして出力する。
ところで量子化手段6は複数次数のケプストラム係数を
次数毎に異なった量子化幅で量子化することにより、等
価的に次数毎に異なった重みを各ケブストラム係数に与
えることになる。ここでいう「次数毎に異なった量子化
幅で量子化する」とは、一定ビット数の固定小数点表現
データのMSB側から、元のデータ長より短くかつ次数
毎に異なったビット数のビット列を取り出し整数表現の
データとして読み代えること(量子化法Aと呼ぶ)でも
よく、また一定ビット数の固定小数点表現データに予め
次数毎に適当な数値を乗じた後に、MSB側から一定ビ
ット数のビット列を取り出し整数表現のデータとして読
み代えること(量子化法Bと呼ぶ)でもよい。
一方ケブストラム係数はその本来の定義から明らかなよ
うに、低次の係数がスペクトル概形の傾きあるいは大局
的なうねりを表し、高次の係数がスペクトルの詳細形状
を表している。
従って次数毎に異なった量子化幅で量子化するコトハ、
スペクトル概形の傾きあるいは大局的なうねりとスペク
トルの詳細形状とを異なった重みで表現することと等価
である。
本実施例においては、このようにして得られた符号語か
ら成る音声パターンが照合手段5における距離算出に用
いられるため、認識結果にも上記の異なった重みが加味
され、次数毎に異なった音響的性質を持つケプストラム
係数の特質を十分に生かすことができる。
また各符号語は少数のビット数で表現されて第1の記憶
手段3と第2の記憶手段4とに記憶されるため、大容量
の記憶手段を必要としないという効果を得ることができ
る。
さらに距離計算の際に、従来例に見られたような重み付
け係数の乗算が不用であるため、計算時間の短縮あるい
は計算装置規模の縮小が可能となる。
(2)次に、本特許請求の範囲第2項記載の発明になる
一実施例における離散音声認識装置について説明する。
この発明の構成は、前記実施例第1項記載の構成とほぼ
同様であるので、全体の構成は改めて述べることはしな
い。またこの発明は、前記実施例第1項記載の目的と付
加騒音への耐性実現の目的との二つの目的を有する。
以下その動作及び効果について、第1項記載の内容と異
なる量子化手段の部分のみに関して説明する。実施例第
1項に記載した効果は本実施例においても同様に得られ
るので、改めて述べることはしない。
この場合の量子化手段6′は、得られた複数次数のケブ
ストラム係数のうち低次のものは粗い幅で量子化し、高
次のものは細かい幅で量子化して次数毎に少数のビット
数で表現された複数次数の符号語を得る。この結果、照
合手段5で得られる距離及び認識結果にも量子化幅に起
因する重みが加味される。即ち、スペクトル概形の傾き
あるいは大局的なうねりを示す係数は粗い量子化を受け
てその影響度は経減され、スペクトルの詳細形状を示す
係数は細かい量子化を受けてその影響度は増大される。
ところで平均的自動車交通騒音あるいはファンノイズ等
の一般的環境騒音は、広帯域でありつつもスペクトルに
偏りを持ち、ピンクノイズやホスノイズで近似すること
ができる。これらの騒音(今後偏帯域騒音と呼ぶ)が統
計的加法性を保ちつつ音声に付加された場合には、スペ
クトル概形の傾きあるいは大局的なうねりが変化し、こ
れに起因する距離の増大が誤認識を引き起こす要因とな
っている。従って音声認識装置の偏帯域騒音付加に対す
る耐性実現を図るには、これらのスペクトル変化の影響
を受け難い距離を用いることが望ましい。本実施例にお
いては、量子化手段6における低次数ケプストラム係数
への重みの軽減動作が、偏帯域騒音付加に対する耐性を
実現している。
なお粗い量子化とは、前記方法Aにおいて短いビット列
を取り出すことあるいは前記方法Bにおいて小さな数値
を乗じることを指し、細かい量子化とは、前記方法Aに
おいて長いビット列を取り出すことあるいは前記方法B
において大きな数値を乗じることを指す。
(3)本特許請求の範囲第3項記載の発明になる一実施
例における離散音声認識装置について説明する。
この発明の構成は、前記実施例第1項記載の構成とほぼ
同様であるので、その全体構成は改めて述べることはし
ない。またこの発明は、前記実施例第1項記載の目的と
、偏帯域騒音付加への耐性実現の目的と、係数のオーバ
ーフローやアンダーフローを生じにくい量子化法実現の
目的との三つの目的を有する。
以下その動作及び効果について、第1項記載の内容と異
なる量子化手段の部分のみに関して説明する。
量子化手段61は、ケブストラム係数の統計的分布のお
およその上●下限値を含み込むよう次数毎に予め定めら
れた2種の数値を用い、この2種の数値の範囲で各次数
のケプストラム係数を少ビット数で量子化して複数次数
の符号語を得る。この結果、分布範囲がそれぞれ異なる
各次数のケプストラム係数に関し、量子化による係数の
オーバーフローやアンダーフローを生じにくい量子化法
実現が可能となる。
照合手段5で得られる距離及び認識結果にも前記2種の
数値の範囲に起因する重みが加味される。
即ち、2種の数値の隔たりの大きな次数のケプストラム
係数は粗い量子化を受けてその影響度は軽減ざれ、隔た
りの小さな次数の係数は細かい量子化を受けてその影響
度は増大される。一般の音声では低次の係数ほどその分
布範囲が広いため、低次の係数ほど認識結果に与える影
響が軽減される。
この事実により、実施例第2項で述べたのと同様の理由
により、量子化手段6″における量子化動作が偏帯域騒
音付加に対する耐性を実現している。
(4)本特許請求の範囲第4項記載の発明になる一実施
例における離散音声認識装置について説明する。
この発明の構成は、前記実施例第3項記載の構成とほぼ
同様であるので、その全体の構成は改めて述べることは
しない。またこの発明は、前記実施例第3項記載の目的
と、距離の計算量削減の目的との二つの目的を有する。
以下その動作及び効果について、第3項記載の内容と異
なる照合手段の部分のみに関して説明する。
照合手段5′は、認識音声と複数の登録音声のそれぞれ
との距離の算出に当たって、特許請求の範囲第3項記載
の複数次数の符号語に基づいたチェビシェフ距離を用い
る。チェビシェフ距離は実施例第3項記載の量子化が加
味された符号語を用いて次式で求められ、乗除算等の複
雑な計算を必要としないので算出が容易である。
e =,’7,,  IC+k−dl1 ここで k :次数 C+h: 次数毎の量子化を施した、入力音声の第i分
析周期部のケプストラム係数 dIv: 次数毎の量子化を施した、登録音声の第j分
析周期部のケプストラム係数 e,,:  C+kと(IBとの間のチェビシェフ距離
発明の効果 以上のように本発明は、入力音声を一定周期毎にケプス
トラム分析し、前記一定周期毎に複数次数のケブストラ
ム係数を出力する分析手段と、前記分析手段から得られ
た複数次数のケプストラム係数を次数毎に異なったm子
化幅で量子化して次数毎に少数のビット数で表現された
複数次数の符号語を得る量子化手段と、複数の登録音声
に関して前記量子化手段から得られる前記複数次数の符
号語を前記一定周期毎に記憶する第1の記憶手段と、認
識音声に関して前記量子化手段から得られる前記複数次
数の符号語を前記一定周期毎に記憶する第2の記憶手段
と、前記第2の記憶手段の内容と前記第1の記憶手段の
内容とを入力し、前記認識音声と前記複数の登録音声の
それぞれとの間の距離を算出する照合手段とを設けてい
るので、ケプストラム係数の特質を十分に生かしつつ、
大容量の記憶手段を必要とせず、重み付けを乗じるため
の余分な計算量も必要としない、という特徴を実現する
ことができ、高い音声認識性能を達成できる登録型離散
音声認識装置を提供することができる。
また同様の構成において、量子化手段あるいは照合手段
に前述した実施例中の動作を行なわせることにより、耐
騒音性を向上させ、係数のオーバーフローやアンダーフ
ローが生じに<<シ、距離の計算量を削減できる、とい
う特徴の一部あるいは全部を上述した特徴と併せて実現
することができ、さらに高い音声認識性能を達成できる
登録型離散音声認識装置を提供することができる。
【図面の簡単な説明】
第1図は本発明にかかる一実施例における登録型離散音
声認識装置を示すブロック図、第2図は従来の技術に基
づく登録型離散音声認識装置の構成を示すブロック図で
ある。 1●φ●分析手段、2Φ●●切り替え手段、3●φ●第
1の記憶手段、4●●●第2の記憶手段、5、5′●●
●照合手段、6、6′、6”’4 8 4量子化手段、
10●φ●分析手段、20●●●切り替え手段、30●
φ●第1の記憶手段、40●●●第2の記憶手段、50
●●●照合手段。

Claims (4)

    【特許請求の範囲】
  1. (1)入力音声を一定周期毎にケプストラム分析し、前
    記一定周期毎に複数次数のケプストラム係数を出力する
    分析手段と、前記分析手段から得られた複数次数のケプ
    ストラム係数を次数毎に相異なった量子化幅で量子化し
    、次数毎に少数のビット数で表現された複数次数の符号
    語を得る量子化手段と、複数の登録音声に関して前記量
    子化手段から得られる前記複数次数の符号語を前記一定
    周期毎に記憶する第1の記憶手段と、認識音声に関して
    前記量子化手段から得られる前記複数次数の符号語を前
    記一定周期毎に記憶する第2の記憶手段と、前記第2の
    記憶手段の内容と前記第1の記憶手段の内容とを入力し
    、前記認識音声と前記複数の登録音声のそれぞれとの間
    の距離を算出する照合手段とを有することを特徴とする
    音声認識装置。
  2. (2)量子化手段は、得られた複数次数のケプストラム
    係数のうち低次のものは粗い幅で量子化し、高次のもの
    は細かい幅で量子化して、次数毎に少数のビット数で表
    現された複数次数の符号語を得ることを特徴とする請求
    項1記載の音声認識装置。
  3. (3)量子化手段は、ケプストラム係数の統計的分布の
    おおよその上・下限値を含み込むよう次数毎に予め定め
    られた2種の数値を用い、この2種の数値の範囲で各次
    数のケプストラム係数を少ビット数で量子化して複数次
    数の符号語を得ることを特徴とする請求項1記載の音声
    認識装置。
  4. (4)照合手段は、認識音声と複数の登録音声のそれぞ
    れとの距離の算出に当たって、前記複数次数の符号語に
    基づいたチェビシェフ距離を用いることを特徴とする請
    求項3記載の音声認識装置。
JP1059923A 1989-03-13 1989-03-13 音声認識装置 Expired - Fee Related JPH0772838B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1059923A JPH0772838B2 (ja) 1989-03-13 1989-03-13 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1059923A JPH0772838B2 (ja) 1989-03-13 1989-03-13 音声認識装置

Publications (2)

Publication Number Publication Date
JPH02238498A true JPH02238498A (ja) 1990-09-20
JPH0772838B2 JPH0772838B2 (ja) 1995-08-02

Family

ID=13127137

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1059923A Expired - Fee Related JPH0772838B2 (ja) 1989-03-13 1989-03-13 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0772838B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04296799A (ja) * 1991-03-27 1992-10-21 Matsushita Electric Ind Co Ltd 音声認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04296799A (ja) * 1991-03-27 1992-10-21 Matsushita Electric Ind Co Ltd 音声認識装置

Also Published As

Publication number Publication date
JPH0772838B2 (ja) 1995-08-02

Similar Documents

Publication Publication Date Title
Juang et al. Distortion performance of vector quantization for LPC voice coding
US6871106B1 (en) Audio signal coding apparatus, audio signal decoding apparatus, and audio signal coding and decoding apparatus
US7613605B2 (en) Audio signal encoding apparatus and method
CN101057275B (zh) 矢量变换装置以及矢量变换方法
JP2001356791A (ja) 変換行列を用いた自動音声認識の雑音適応化方法
CN101656076B (zh) 音频编码装置、音频编码方法以及通信终端和基站装置
US6593872B2 (en) Signal processing apparatus and method, signal coding apparatus and method, and signal decoding apparatus and method
Yuan et al. Binary quantization of feature vectors for robust text-independent speaker identification
CA2147394C (en) Quantization of input vectors with and without rearrangement of vector elements of a candidate vector
KR20070085788A (ko) 신호 속성들을 사용한 효율적인 오디오 코딩
Choi et al. Speech recognition using quantized LSP parameters and their transformations in digital communication
JPH02238498A (ja) 音声認識装置
JPH09190199A (ja) 音声パラメータのベクトル量子化を実行する方法および装置
JPH09230898A (ja) 音響信号変換符号化方法及び復号化方法
JPH06118998A (ja) ベクトル量子化装置
JP2973805B2 (ja) 標準パターン作成装置
Li et al. Model Compression for DNN-based Speaker Verification Using Weight Quantization
Chen et al. An associatively classified partitioned vector quantizer
Fonollosa et al. Adaptive multistage vector quantization
Merazka et al. Robust split vector quantization of LSP parameters at low bit rates
Yu et al. A multi-stage levinson-durbin algorithm
Mohammadi et al. Application of sorted codebook vector quantization to spectral coding of speech
Nakatoh et al. Low bit rate coding for speech and audio using mel linear predictive coding (MLPC) analysis
Mikhael et al. Speaker recognition employing waveform based signal representation in nonorthogonal multiple transform domains
JPS5999500A (ja) 音声認識方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees