JPH02123399A - 連続単語音声認識方法 - Google Patents

連続単語音声認識方法

Info

Publication number
JPH02123399A
JPH02123399A JP63276732A JP27673288A JPH02123399A JP H02123399 A JPH02123399 A JP H02123399A JP 63276732 A JP63276732 A JP 63276732A JP 27673288 A JP27673288 A JP 27673288A JP H02123399 A JPH02123399 A JP H02123399A
Authority
JP
Japan
Prior art keywords
candidate
termination
matching
processing
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63276732A
Other languages
English (en)
Inventor
Takashi Yoshihara
隆史 吉原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63276732A priority Critical patent/JPH02123399A/ja
Publication of JPH02123399A publication Critical patent/JPH02123399A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔目次〕 (既要 産業上の利用分野 従来の技術(第4図乃至第6図) 発明が解決しようとする課題(第7図)課題を解決する
ための手段(第1図) 作用 実施例 (a)一実施例の説明(第2図、第3図)(b)他の実
施例の説明 発明の効果 〔概要〕 連続的に発声された入力音声を音声認識辞書の登録パタ
ーンと比較照合して単語認識する連続単語音声認識方法
に関し、 単語の挿入及び欠落を防止し、認識率を向上することを
目的とし、 連続的に発声された入力音声の周波数分布から入力パタ
ーンの音声パラメータを作成する音声分析ステ、プと、
音声認識辞書の登録パターンと該入力パターンとをDP
照合して、終端候補を選択する終端候補選択ステップと
、該終端候補として選択された終端位置から選択された
登録パターンと入力パターンを始端方向に逆時間DP照
合して、部分パターンを求める始終端候補選択ステップ
と、該選択された部分パターンを文レベルDP照合によ
り連結処理する始終端候補連結ステップとを有する連続
単語音声認識方法において、該終端候補選択ステップで
用いた始端位置を保持しておき、該始終端候補選択ステ
ップにおいて、該始端位置と該終端位置の対角線に平行
な照合窓範囲を設定し、該照合窓範囲において逆時間D
P照合処理する。
〔産業上の利用分野〕
本発明は、連続的に発声された入力音声を音声認識辞書
の登録パターンと比較照合して単語認識する連続単語音
声認識方法に関する。
近年の音声認識技術の発展に伴い、音声認識の対象も離
散単語から連続単語に移りつつある。
連続単語音声認識においては、単語を連続して発声し、
音声登録辞書内の独立した単語登録パターンと比較、照
合して連続発声された単語を認識する。
このように連続単語音声認識では、単語間の境界が不明
で且つ発声によって変化するため、単語の始終端を良好
に認識できる技術が求められている。
〔従来の技術〕
第4図、第5図、第6図は従来技術の説明図である。
連続単語音声認識処理は、第4図に示すステップで実行
される。
■ 入力音声を帯域通過フィルタ群で音声サンプリング
し、周波数分割し、音口分析部で、音声パラメータの計
算を行う音声分析ステップを実行する。
■ 次に第5図(A)に示すように、入力パターンへと
登録パターンB (n)とのD P (Dynamic
Programming)照合を行う。
照合終了後に、入力側の各フレームを終端とする最適な
マツチングルートを通ったDP距離DC(m、n)が計
算される。
但し、mは入力パターンのフレーム位置、nは登録語を
さす。
このDP距離DC(m、n)を、登録パターン長の2倍
で割って、時間正規化した距離DR(m、n)を求め、
闇値により削除する。
これによって、終端候補(終端フレーム位置、単語)が
限定される。
■ 次に、第5図(B)に示すように、終端候補選択ス
テップで選択された終端位置からjx択された登録パタ
ーンと始端方向にDP照合(これを逆時間DP照合とい
う)を行う。
照合終了後に、入力側の各フレームを始端とするDP距
離D I 、(m、1.n)が計算される。
但し、mは部分パターンの終端、lは始端、nは登録語
である。
このDP距離D I  (m、E、n)を、登録パター
ン長と部分パターン長の和で時間正規化した距離DIR
(m、l、n)を求める。
これによって部分パターンm〜lが求められる。
■ 上述の始終端候補ステップで求めた部分パターンを
用い、文レベルのDP照合により最適な単語の結合を、
第6図のように求める。これを始終端候補連結ステップ
という。
■ 最後に、連結処理の結果に基づいて候補決定処理を
行う。
これらについては、例えば日本音客学会昭和54年秋季
研究発表会講演論文集、2−2−18(1979)r逆
DPマツチング法による連続単語音声認識」等で周知で
ある。
〔発明が解決しようとする課題〕
第7図は従来技術の課題説明図である。
従来の連続単語音声認識方法では、連続的に発声された
入力音声の単語間の境界としての単語終端候補を選択し
、始終端候補の選択処理において、その終端候補の始端
フレームとして、その候補の語長の1/3〜3倍のフレ
ーム位置を全て第7図のように対象としていた。
しかしながら、この従来技術では、終端候補の語長と、
連続的に発声入力された入力音声中の酢語の語長の差が
大きい場合、認識結果として単語の挿入及び欠落が起き
易いという問題があった。
例えば、第7図の場合、■が終端候補を選択した際の本
来の経路だとすると、従来は■、■の経路を許している
ために、誤認識する場合があった。
従って、本発明は、単語の挿入及び欠落を防止し、認識
率を向上せしめることのできる連続単語音声認識方法を
提供することを目的とする。
〔課題を解決するための手段〕
第1図は本発明の原理図である。
本発明は、第1図に示すように、連続的に発声された入
力音声の周波数分布から入力パターンの音声パラメータ
を作成する音声分析ステップと、音声認識辞書の登録パ
ターンと該入力パターンとをDP照合して、終端候補を
選択する終端候補選択ステップと、該終端候補として選
択された終端位置から選択された登録パターンと入力パ
ターンを始端方向に逆時間DP照合して、部分パターン
を求める始終端候補選択ステ・7プと、該選択された部
分パターンを文レベルDP照合により連結処理する始終
端候補連結ステップとを有する連続単語音声認識方法に
おいて、該終端候補選択ステップで用いた始端位置を保
持しておき、該始終端候補選択ステップにおいて、該始
端位置と、該終端位置の対角線に平行な照合窓範囲を設
定し、該照合窓範囲において逆時間DP照合処理するも
のである。
〔作用〕
本発明は、始端位置を保持しておくので、連続DPによ
り選択された終端との対角線に平行な一定幅の照合窓を
設定できる。
従って、逆時間DPにおいて、第7図の■、■のような
極端な経路がとられないよう制御することができる。
又、選択された終端候補の本来の始端の前後フレームを
始端対象フレームとするため、単語の挿入及び欠落の原
因となる極端な経路はとれな(なり、認識率を向上しう
る。
更に、照合窓が対角線に平行なため、最短距離である対
角線を中心に適切な幅の照合範囲を設定できる。
〔実施例〕
(a)一実施例の説明 第2図は本発明の一実施例構成図である。
図中、1はマイクロフォンであり、発声した音声を人力
するもの、2は帯域通過フィルタ群であり、10ms毎
にマイクロフォン1の音声をサンプリングするもの、3
はスピーカであり、音声出力のためのもの、4は音声蓄
積/再生装置(C0DEC)であり、音声を蓄積し、ス
ピーカ3で再生するものである。
5はマイクロプロセッサ(MPU)であり、音声認識の
全体処理を行うもの、6はROM (リート・オンリー
・メモリ)であり、制御プログラム及び音声認識辞書が
格納されているもの、7はRAM(ランダム・アクセス
・メモリ)であり、MPU5が処理のために用いるもの
である。
8はDP距離演算プロセッサであり、DP距離を演算す
るもの、9は通信インターフェイスであり、ホストと通
信するものである。
第3図は本発明の一実施例処理フロー図である。
■ マイクロフォン1から入力された音声は、帯域通過
フィルタ群2により、人力音声を100H2〜5KH2
の範囲で16分割し、10ms(1フレーム)毎にサン
プリングする。
MPU5は、帯域通過フィルタ群2の出力値から雑音等
の影響を取り除き、音声パラメータを作成する。
■ MPU5の制御の元に、DP距離演算プロセッサ8
は、入力音声パラメータと音声認識辞書の登録パラメー
タとで連続DP処理を行うことによって、単語間境界と
しての終端候補を選択する。
又、そのDP経路をさかのぼることで始端フレームを求
め、RAM7に保持しておく。
尚、連続DPの一解法としては、次のような漸化式とな
る。
初期条件g(CI) = d (CI)漸化式 g(i
、j)=min (d(i、j)+g(i、j−1)、
2d(i、j)+g(i−1,j−1)、d(i、D 
+g(i−1,j))但し、d (i、j)は、入力音
声パラメータのiフレーム目と辞書パラメータのjフレ
ーム目のベクトル間距離である。
■−I  MPU5は、求まった終端フレームとRAM
7の始端フレームから、当該始終端間の対角線に平行し
て、照合窓幅Xフレーム(通常、辞書パラメータフレー
ム数の1/4フレ一ム程度)の照合窓範囲を設定する。
■−2DP距離演算プロセッサ8は、入力音声パラメー
タと音声認識辞書の候補とされた語のパラメータとで、
前述の照合窓の範囲内において、終端側から始端方向に
逆時間DP処理を行う。
即ち、演算プロセッサ8は、MPU5から照合窓の傾斜
角が渡され、市街地化距離を演算する際に照合窓の範囲
外を無限下の距離とするものである。
逆時間DPの一解法としては、次のような漸化式%式%
(1) 漸化式 g(i、j)=min (d(i、D+g(i
、j+1)、2d(i、j)+g(i+1.j+1) 
、d(i、D + g(i+L j) )但し、d(1
、J)は、入力音声パラメータの終端フレーム目(1)
と、辞書パラメータの終端フレーム目(J)のベクトル
間距離である。
■ 逆時間DP処理により求められた各始終端間パター
ンを用いて、文レベルDP処理を行い、最適な単語の連
結を行う。
■ MPU5は、連続単語の桁数により正規化距離を算
出し、認識候補を決定する。
このようにして、連続DP処理における始端フレームを
保持しておき、終端候補としての終端フレームとの間で
照合窓を設定し、照合窓の範囲内で逆時間DP処理を行
う。
(d)他の実施例の説明 上述の実施例では、第2図の構成のものについて説明し
たが、他のものであってもよい。
以上本発明を実施例により説明したが、本発明は本発明
の主旨に従い種々の変形が可能であり、本発明からこれ
らを排除するものではない。
〔発明の効果〕
以上説明した様に、本発明によれば、連続DP処理時に
おける始端フレーム位置を用いて、逆時間DP処理時の
照合窓を設定し、その照合窓範囲で逆時間DP処理する
ので、始端フレーム範囲が限定でき、認識結果における
単語の挿入及び欠落を防ぐことが出来るという効果を奏
する。
又、DP照合の演算範囲が狭められるので、認、識速度
の向上にも寄与するという効果も奏する。
【図面の簡単な説明】
第1図は本発明の原理図、 第2図は本発明の一実施例構成図、 第3図は本発明の一実施例処理フロー図、第4図乃至第
6図は従来技術の説明図、第7図は従来技術の課題説明
図である。 図中、1−マイクロフォン、 2・・−帯域通過フィルタ群、 5−マイクロプロセッサ、 8−D P距離演算プロセッサ。 特許出願人   富士通株式会社 代理人弁理士  山 谷 晧 榮 ′2 l −奥施jlI処理フロー2 従層(」(【 −1゛の説日月ログ 第4図 (A) ダ弗問え F内倭1 入 力 パダーン 従来波向の説明語 第5図

Claims (1)

    【特許請求の範囲】
  1. (1)連続的に発声された入力音声の周波数分布から入
    力パターンの音声パラメータを作成する音声分析ステッ
    プと、 音声認識辞書の登録パターンと該入力パターンとをDP
    照合して、終端候補を選択する終端候補選択ステップと
    、 該終端候補として選択された終端位置から選択された登
    録パターンと入力パターンを始端方向に逆時間DP照合
    して、部分パターンを求める始終端候補選択ステップと
    、 該選択された部分パターンを文レベルDP照合により連
    結処理する始終端候補連結ステップとを有する連続単語
    音声認識方法において、 該終端候補選択ステップで用いた始端位置を保持してお
    き、 該始終端候補選択ステップにおいて、該始端位置と該終
    端位置の対角線に平行な照合窓範囲を設定し、該照合窓
    範囲において逆時間DP照合処理することを 特徴とする連続単語音声認識方法。
JP63276732A 1988-11-01 1988-11-01 連続単語音声認識方法 Pending JPH02123399A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63276732A JPH02123399A (ja) 1988-11-01 1988-11-01 連続単語音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63276732A JPH02123399A (ja) 1988-11-01 1988-11-01 連続単語音声認識方法

Publications (1)

Publication Number Publication Date
JPH02123399A true JPH02123399A (ja) 1990-05-10

Family

ID=17573571

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63276732A Pending JPH02123399A (ja) 1988-11-01 1988-11-01 連続単語音声認識方法

Country Status (1)

Country Link
JP (1) JPH02123399A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240008B2 (en) 2001-10-03 2007-07-03 Denso Corporation Speech recognition system, program and navigation system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240008B2 (en) 2001-10-03 2007-07-03 Denso Corporation Speech recognition system, program and navigation system

Similar Documents

Publication Publication Date Title
JPH02123399A (ja) 連続単語音声認識方法
JPH02210500A (ja) 標準パターン登録方式
JPH01321499A (ja) 音声認識装置
JPH0336436B2 (ja)
JPH06301399A (ja) 音声認識装置
JPH0469959B2 (ja)
JPH0632008B2 (ja) 音声認識装置
JPH0465399B2 (ja)
JPH04152397A (ja) 音声認識装置
JPS6147994A (ja) 音声認識方式
JPH0632010B2 (ja) 音声認識装置
JPH0632009B2 (ja) 音声認識装置
JPH0654439B2 (ja) 音声認識装置
JPH03155599A (ja) 音声認識装置
JPS61275799A (ja) 音声認識装置
JPS58116595A (ja) 単語音声認識装置
JPS61267098A (ja) 音声認識装置
JPH05224693A (ja) 音声認識装置
JPH08320698A (ja) 音声認識装置
JPS62266600A (ja) 単語音声認識装置
JPS6287993A (ja) 音声認識装置
JPH02195399A (ja) 男女声の識別方式
JPH11352982A (ja) 音声認識システムにおける単語学習および認識方法
JPH02216198A (ja) 音声認識回路
JPS61208097A (ja) 音声認識装置