JPH0689100A - 連続音声認識方法 - Google Patents

連続音声認識方法

Info

Publication number
JPH0689100A
JPH0689100A JP24019792A JP24019792A JPH0689100A JP H0689100 A JPH0689100 A JP H0689100A JP 24019792 A JP24019792 A JP 24019792A JP 24019792 A JP24019792 A JP 24019792A JP H0689100 A JPH0689100 A JP H0689100A
Authority
JP
Japan
Prior art keywords
likelihood
speech recognition
recognition method
continuous speech
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP24019792A
Other languages
English (en)
Inventor
Yasuhiro Minami
泰浩 南
Kiyohiro Kano
清宏 鹿野
Tomokazu Yamada
智一 山田
Tatsuo Matsuoka
達雄 松岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP24019792A priority Critical patent/JPH0689100A/ja
Publication of JPH0689100A publication Critical patent/JPH0689100A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 余分な音韻系列の候補を削減することにより
その分多くの候補の探索をする連続音声認識方法を提供
する。 【構成】 音声を特徴パラメータ時系列に変換し、予め
登録してある文法を使用して標準パターンと特徴パラメ
ータ時系列との間の照合を行い、類似の尤度の高い候補
を認識結果とする連続音声認識方法において、音韻系列
の尤度決定に際して前からの尤度と共に後からの尤度を
使用し、ここで後からの尤度に1より小なる値を掛け、
また音韻或は音節の照合を行う際に適切な照合区間を検
出して音韻或は音節の照合を行い、更に照合区間の設定
における積和の計算にテーブルを使用する連続音声認識
方法。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、標準パタ−ン例えば
隠れマルコフモデルの標準パタ−ンと文法とを使用する
連続音声認識方法に関する。
【0002】
【従来の技術】音声を特徴パラメータ時系列に変換し、
予め登録してある文法を使用して標準パターンと特徴パ
ラメータ時系列との間の照合を行い、類似の尤度の高い
候補を認識結果とする連続音声認識方法は、音韻照合を
行う区間が長いために莫大な計算量を必要とする。ま
た、音韻系列の尤度を計算するには、従来、音韻系列の
時刻までの前向きの尤度だけを利用していた。
【0003】
【発明が解決しようとする課題】この様にすると、尤度
の値は使用している音声の長さに依存することになる。
尤度の値が使用している音声の長さに依存することとな
ると、何れの音韻系列の候補の尤度の値が大きいかとい
うことを比較することはできなくなる。連続音声認識に
おいては、尤度の値の大きい候補のみについて調査して
行くのであるが、前向きの尤度だけを利用する従来の方
法によっては尤度の値の小さいものを候補として残して
この無駄な候補をも調査の対象とすることとなり、正確
な認識が不可能となる。この従来の連続音声認識方法は
認識の途中において適切に候補を絞り込むことができ
ず、音声認識を行う際に可能性のある尤度の高い音韻系
列候補を充分に調査することができないので、結局、認
識性能が劣化するうらみがあるものと言うことができ
る。
【0004】この様な不都合を無くするために、音声全
体を使用して音韻系列の候補の尤度を決定することが必
要となる。これを実施するためには、音声の後からの照
合を行ない後向きの尤度を計算して、これを音韻系列ま
での時刻において前向き尤度と足し合わせることにより
音声全体を使用して音韻系列の候補の尤度を計算したこ
とにする。この発明は、この如くして上述の不都合を解
消する連続音声認識方法を提供するものである。
【0005】
【課題を解決するための手段】音声を特徴パラメータ時
系列に変換し、予め登録してある文法を使用して標準パ
ターンと特徴パラメータ時系列との間の照合を行い、類
似の尤度の高い候補を認識結果とする連続音声認識方法
において、音韻系列の尤度決定に際して前からの尤度と
共に後からの尤度を使用する連続音声認識方法を構成
し、また、後からの尤度に1より小なる値を掛ける連続
音声認識方法も構成した。更に、上述の連続音声認識方
法において、音韻或は音節の照合を行う際に適切な照合
区間を検出して音韻或は音節の照合を行う連続音声認識
方法を構成し、ここで、照合区間の設定における積和の
計算にテーブルを使用する連続音声認識方法も構成し
た。
【0006】
【実施例】この発明の実施例を図1を参照して説明す
る。入力端子1から入力される入力音声は特徴抽出部2
においてディジタル信号に変換された後に特徴パラメー
タ例えばLPCケプストラム係数に変換される。一方、
学習用の音声データベース6に基づいて、特徴パラメー
タと同一形式で音韻毎に隠れマルコフモデルの標準パタ
ーン7を予め作成しておく。
【0007】前向き照合部3は特徴パラメータと隠れマ
ルコフモデルの標準パターン7と後で説明される音韻系
列予測部10により得られた音韻系列の候補とを使用し
て音韻系列の候補の前向きの尤度aを計算する。後向き
照合部4は特徴パラメータに変換された音声と隠れマル
コフモデルの標準パターン7とを使用して音声の最後か
ら認識を行い、後向き尤度bのテーブルを作成する。こ
のテーブルには各時刻までの後向き尤度bが代入され
る。この際音声の後からの音韻系列の長さはわからない
ので音韻系列の長さ毎にテーブルを用意する。
【0008】音韻系列予測部10においては今までに解
析された候補の尤度と文法テーブルとを使用して次にど
の音韻がくるかを予測し、音韻系列の候補を求める。こ
こで文法テーブルには、文法規則全体を記述したメイン
の文法テーブル8と、メインの文法テーブル8に記述さ
れている文法規則より詳細な規則部分を記述したサブの
文法テーブル9および9’の2種類がある。
【0009】5は尤度計算部であり、上述の前向きの尤
度aと後向きの尤度bとから候補について全体の尤度を
計算する。これらの音韻系列の候補は図3に示される候
補テーブルによって管理される。図3に示される候補テ
ーブルは尤度、音韻系列スタック、文法スタック、各時
刻までの前向き尤度テーブル、音韻照合の開始時間より
成る。尤度にはこの候補の尤度が記述される。音韻系列
スタックには今までに解析された音韻系列が記述されて
いる。文法スタックにはこれからどの様な文法規則が適
応されるかを示す情報が記述されている。各時刻までの
前向き尤度テーブルには音韻系列の各時刻までの前向き
尤度が保存される。照合開始時間には次の音韻の照合を
行う開始時刻が書き込まれる。この照合開始時間は予測
された音韻が最も出現しそうな場所を示している。照合
はこの照合開始時間T1からT2まで行われ、前向き尤度テ
ーブルに書き込まれる。
【0010】上述の如くして求められた前向き尤度aと
後向き尤度bとから音韻系列の候補の尤度を計算するこ
とができる。尤度計算部5により後向き尤度bと前向き
尤度aとに基づいて尤度計算を実施するのであるが、こ
の様子は図4に示される通りである。 T:入力音声の長さ 前向き尤度:aT1,aT1+2,aT1+3,aT1+4,・・・ aT2 後向き尤度:b1 ,b2 ,b3 ,b4 ,・・・ bT ここで、Δt は尤度の計算をするウィンドウ幅を示す。
【0011】これを、全ての長さの音韻系列の後向き尤
度を使用して尤度を求め、最大のものを候補の尤度とす
る。ここで、求められた最大値の場合のtを使用して次
の音韻を照合する照合開始時間とする。このtを決定す
る際、後向き尤度に1より小なる値を掛けることによ
り、このtを次の音韻が最も存在しそうな時刻を示す様
にする。このtを音韻照合開始時間に書き込む。しか
し、この計算には多くの時間を必要とするので、以下に
おいて説明するテーブルを使用して高速処理をする。lo
g(exp(x)+exp(y)),log(exp(x)-exp(y)) の計算を予めテ
ーブルにしておく。
【0012】 ( aT1+ Δt+1+bT1+ Δt+1 ) と(aT1 + bT1) からテーブルを利用して計算する。
【0013】3) t T1+2から T2-Δt まで、2)
の計算手法を使用して順次 4) 求められた尤度の最大値をとる。
【0014】 とができる。ここにおいては、一般にトレリス計算とい
うアルゴリズムにより尤度を計算しているが、ビタービ
アルゴリズムに依っても同様の計算を容易に実行するこ
とができる。認識過程においては、音韻系列の候補を順
次に生成し、上述の様なテーブルを使用して尤度の高い
候補を残し、最終的に文として認められた候補の内から
最大のものを認識結果とする。
【0015】
【発明の効果】以上の通りであって、この発明の連続音
声認識方法は、前からの尤度と共に後からの尤度をも使
用し音韻系列の尤度を決定して有効な候補のみを残し、
前向き尤度を求めるに必要な音声照合の際に照合のため
の区間を最も音韻の存在しそうな区間に短く決定するこ
とにより無駄な照合を行なわずに済む。また、音韻系列
の尤度決定に際して後からの尤度に1より小なる値を掛
けることにより音韻或は音節の照合区間を適切に求める
ことができる。更に、音韻系列の尤度を計算するに際し
て予めテーブルを作成することにより計算時間を減少す
ることができる。
【0016】結局、余分な音韻系列の候補を削減するこ
とによりその分多くの候補の探索をすることが可能とな
り、それだけ認識性能を向上することができ、従って、
特に大語彙の連続音声認識を行う際に大きな効果を発揮
する。
【図面の簡単な説明】
【図1】この発明の実施例を説明する図。
【図2】後向き尤度テーブルを示す図。
【図3】候補テーブルを示す図。
【図4】尤度計算を説明する図。
【符号の説明】
1 入力端子 2 特徴抽出部 3 前向き照合部 4 後向き照合部 5 尤度計算部 6 学習用の音声データベース 7 隠れマルコフモデルの標準パターン 8 メインの文法テーブル 9 サブの文法テーブル 10 音韻系列予測部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 松岡 達雄 東京都千代田区内幸町1丁目1番6号 日 本電信電話株式会社内

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 音声を特徴パラメータ時系列に変換し、
    予め登録してある文法を使用して標準パターンと特徴パ
    ラメータ時系列との間の照合を行い、類似の尤度の高い
    候補を認識結果とする連続音声認識方法において、音韻
    系列の尤度決定に際して前からの尤度と共に後からの尤
    度を使用することを特徴とする連続音声認識方法。
  2. 【請求項2】 請求項1に記載される連続音声認識方法
    において、後からの尤度に1より小なる値を掛けること
    を特徴とする連続音声認識方法。
  3. 【請求項3】 請求項1または2に記載される連続音声
    認識方法において、音韻或は音節の照合を行う際に適切
    な照合区間を検出して音韻或は音節の照合を行うことを
    特徴とする連続音声認識方法。
  4. 【請求項4】 請求項3に記載される連続音声認識方法
    において、照合区間の設定における積和の計算にテーブ
    ルを使用することを特徴とする連続音声認識方法。
JP24019792A 1992-09-09 1992-09-09 連続音声認識方法 Pending JPH0689100A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24019792A JPH0689100A (ja) 1992-09-09 1992-09-09 連続音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24019792A JPH0689100A (ja) 1992-09-09 1992-09-09 連続音声認識方法

Publications (1)

Publication Number Publication Date
JPH0689100A true JPH0689100A (ja) 1994-03-29

Family

ID=17055909

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24019792A Pending JPH0689100A (ja) 1992-09-09 1992-09-09 連続音声認識方法

Country Status (1)

Country Link
JP (1) JPH0689100A (ja)

Similar Documents

Publication Publication Date Title
US20110077943A1 (en) System for generating language model, method of generating language model, and program for language model generation
JP2000029495A (ja) ニュ―ラルネットワ―クとマルコフモデル認識技術を用いた音声認識の方法及び装置
JPH0372998B2 (ja)
JP2000214883A (ja) 音声認識装置
KR101014086B1 (ko) 음성 처리 장치 및 방법, 및 기록 매체
US20040186819A1 (en) Telephone directory information retrieval system and method
KR20070060581A (ko) 화자적응 방법 및 장치
JP2023539948A (ja) ロングコンテキストエンドツーエンド音声認識システム
KR101122591B1 (ko) 핵심어 인식에 의한 음성 인식 장치 및 방법
JPH1185188A (ja) 音声認識方法及びそのプログラム記録媒体
JP3444108B2 (ja) 音声認識装置
JPH11184491A (ja) 音声認識装置
JP3633254B2 (ja) 音声認識システムおよびそのプログラムを記録した記録媒体
JPH06266386A (ja) ワードスポッティング方法
JPH0689100A (ja) 連続音声認識方法
JP3868798B2 (ja) 音声認識装置
EP1488410B1 (en) Distortion measure determination in speech recognition
JP3368989B2 (ja) 音声認識方法
JP4297349B2 (ja) 音声認識システム
JPH0772899A (ja) 音声認識装置
JPH09114482A (ja) 音声認識のための話者適応化方法
JP2731133B2 (ja) 連続音声認識装置
JP2003263187A (ja) 言語モデル学習方法、その装置、そのプログラムおよびそのプログラムの記録媒体ならびに言語モデル学習を用いた音声認識方法、その装置、そのプログラムおよびそのプログラムの記録媒体
JP3428834B2 (ja) 音声認識方法及び装置
JPH04291399A (ja) 音声認識方法