JP3039453B2

JP3039453B2 - 音声認識装置

Info

Publication number: JP3039453B2
Application number: JP9165205A
Authority: JP
Inventors: 靖子加藤; 和永吉田
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1997-06-06
Filing date: 1997-06-06
Publication date: 2000-05-08
Anticipated expiration: 2017-06-06
Also published as: JPH10340096A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音声認識装置に関
し、特に任意の単語または文の認識が可能な音声認識装
置に関する。

【０００２】

【従来の技術】音声認識技術を様々な分野に応用する場
合、認識対象を限定せず、任意の単語や文が入力可能で
あることが理想的である。これを実現する方法として、
従来、文節単位に発声された音声を認識対象とする単音
節認識方式や、あるいは、任意の音節が任意の数だけ連
続して発声された音声を認識対象とする連続音節認識方
式などがあった。

【０００３】単音節認識方式の１つとして、文献（古井
貞煕著、「ディジタル音声処理」、８．７章、第１７０
頁から１７２頁、東海大学出版会出版）（以下「文献
１」という）に示されている方法がある。

【０００４】この方法は、まず、入力された音声をＬＰ
Ｃ（ＬｉｎｅａｒＰｒｅｄｉｃｔｉｖｅＣｏｄｉｎ
ｇ）分析してその特徴であるＬＰＣケプストラムを抽出
し、音声区間を検出する。検出した音声から子音部と母
音部を分離し、語頭の過渡部についてシフトマッチング
を行い、それに音節全体の大局的スペクトルパターン特
徴を組合せて認識を行い、これらの結果を組み合わせて
判定するものである。

【０００５】連続音節認識方式の１つとして、たとえ
ば、アイキャスプ８３、７．９、第３２０頁から３２３
頁（ＩＣＡＳＳＰ８３７．９ｐｐ．３２０〜３２
３）に「セグメンテーションフリーシラブルレコグ
ニションインコンティニュアスリースポークン
ジャパニーズ（ＳＥＧＭＥＮＴＡＴＩＯＮ−ＦＲＥＥ
ＳＹＬＬＡＢＬＥＲＥＣＯＧＮＩＴＩＯＮＩＮＣ
ＯＮＴＩＮＵＯＵＳＬＹＳＰＯＫＥＮＪＡＰＡＮＥＳ
Ｅ）」と題して掲載されている論文（以下「文献２」と
いう）に示される、音節間の変化の情報を含む子音・母
音連鎖音声パターン（「ＣＶパターン」という）と、母
音・子音・母音連鎖音声パターン（「ＶＣＶパターン」
という）を結合した標準パターンを用いて認識する方法
がある。

【０００６】これは、入力音声を特徴ベクトルに変換
し、母音部候補を抽出して各候補の母音名、区間を求め
たあと、ＣＶパターン、ＶＣＶパターンレベルのマッチ
ングをＤＰを用いて行い、その結果から入力全体に対す
る最適なＣＶパターン、ＶＣＶパターンの系列を認識結
果として求める方法である。

【０００７】

【発明が解決しようとする課題】しかしながら、上記し
た単音節認識方式では、単音節が単独で発声されるので
調音結合の影響が少ないため、母音部は比較的安定して
認識できるが、子音部は継続時間が短いので情報量が少
なく、類似しているものが多いため誤りやすい、という
問題点を有している。

【０００８】一方、連続音節認識方式では、語中の破裂
音の認識で破裂前の閉鎖部の有無についての情報が使え
るなど、子音部の認識性能は単音節認識に比べて良いこ
とが期待できる。しかし、連続する音節の数や種類に制
限がないために、音節の挿入や脱落が生じやすく、音節
数の誤りが生じる可能性がある。

【０００９】また、連続して発声した音声を対象とする
ので、調音結合の影響により母音の認識誤りも生じやす
い。

【００１０】したがって、本発明は、上記問題点に鑑み
てなされたものであって、その目的は、任意に発声され
た単語や文を高精度で認識する音声認識装置を提供する
ことにある。

【００１１】

【課題を解決するための手段】上記目的を達成するため
に、本発明は、認識単位に区切って発声された音声に対
して認識単位毎の認識処理を行う単位音声認識処理部
と、前記認識単位に区切って発声された音声に関連して
連続に発声された音声に対し、前記認識単位毎の認識結
果を用いて連続認識処理を行う連続音声認識処理部と、
を有している。より詳細には、音声入力部と、単音節認
識単位に区切って発声された音声に対して単音節認識単
位毎の認識処理を行う単音節認識処理部と、前記単音節
認識単位に区切って発声された音声に関連して連続に発
声された音声に対して、前記単音節認識単位毎の認識結
果を用いて連続認識処理を行う連続音節認識処理部と、
前記音声入力部の出力を前記単音節認識処理部または前
記連続音節認識処理部の入力に切替える切替部と、を備
え、はじめに前記切替部が前記単音節認識処理部を選択
しておき、音節に区切って発声された音声を前記単音節
認識処理部で認識し、次に前記切替部で連続音節認識処
理部を選択して、連続して発声された音声に対して、前
記単音節認識処理部で得られた情報を用いて前記連続音
節認識処理部で認識を行い、得られた認識結果を出力す
る、音声認識装置であって、前記単音節認識処理部にお
いて、認識した結果を記憶部に記憶し、同時に音節数計
数部で音節数をカウントし、連続して発声された音声に
対して、前記単音節認識処理部で得られた音節数、もし
くは認識結果及び音節数に基づいて、前記連続音節認識
処理部で認識を行う。

【００１２】

【作用】本発明の作用について説明すると、本発明で
は、単語を入力する際に、入力したい単語をまず音節に
区切って発声し、その後に同じ単語を区切らずに連続し
て発声する。この音節に区切って発声された各音声は、
単音節認識処理部により認識される。このときに得られ
た認識結果を用いて、次に、区切らずに連続して発声さ
れた音声を連続音節認識方式により認識し、その結果を
入力したい単語の認識結果とする。

【００１３】単音節認識結果のうち、音節数や母音部の
認識結果の精度は高いことが期待されるので、これらの
情報を連続音節認識に利用することにより、連続音節認
識の性能向上を図る。これにより、単音節認識だけでは
認識精度の低い子音の認識に対して、連続音節認識の結
果を用いることができるので、認識性能の向上が図れ
る。

【００１４】また単音節認識結果のうち上位候補あるい
は類似性が高い音節のみを連続音節認識の対象とするこ
とにより、連続音節認識での処理量を削減する。

【００１５】以上、認識単位として音節を用いて説明し
たが、これ以外にもたとえば、アルファベットを用いる
場合でも同様の効果が期待できる。以下、音節を認識単
位とした場合についてのみ説明する。

【００１６】

【発明の実施の形態】次に本発明の実施の形態について
図面を参照して説明する。

【００１７】［実施の形態１］図１は、本発明の第１の
実施の形態の構成を示すブロック図である。

【００１８】図１を参照すると、本発明の第１の実施の
形態は、（ａ）話者の発声した音声を入力する音声入力
部１と、（ｂ）単音節認識処理と連続音節認識処理の切
り替えを行う認識処理切り替え部２と、（ｃ）単音節認
識処理を行う第１単音節認識処理部３と、（ｄ）第１単
音節認識処理部３で得られた認識結果を保持する認識結
果記憶部４と、（ｅ）第１単音節認識処理部３で処理を
行った音節数を計測する音節数計測部５と、（ｆ）連続
音節認識処理を行う第１連続音節認識処理部６と、を含
む。

【００１９】認識処理切り替え部２は、スイッチを１１
側に接続することにより音声入力部１と第１単音節認識
処理部３とを接続し、スイッチを１２側に接続すること
により音声入力部１と第１連続音節認識処理部６とを接
続する。

【００２０】第１単音節認識処理部３は、音節に区切っ
て発声された各音声に対して、認識処理を行い、単音節
の母音名を出力する。

【００２１】認識結果記憶部４には、認識結果として単
音節の母音名が保持される。

【００２２】音節数計数部５では、第１単音節認識処理
部３から出力された認識結果の音節数をカウントする。

【００２３】第１連続音節認識部６は、入力された音節
数および母音名の系列を用いて音節に区切らずに連続し
て発声された音声に対して認識処理を行う。

【００２４】図２は、本発明の第１の実施の形態の処理
手順を説明するための流れ図である。本発明の第１の実
施の形態の動作について図１および図２を用いて説明す
る。

【００２５】まず、認識処理切り替え部２のスイッチを
１１側に接続し、音声入力部１と第１単音節認識処理部
３とを接続する（ステップ１）。

【００２６】音声入力部１は、マイクロフォン、フィル
タ、Ａ／Ｄコンバータなどから構成されており、発声さ
れた音声を入力し、第１単音節認識処理部３に出力する
（ステップ２）。

【００２７】第１単音節認識処理部３は、入力された音
声に対して、上記文献１に示されている方法を用いて、
単音節認識処理を行い（ステップ３）、単音節の母音名
を出力する。

【００２８】第１単音節認識処理部３で求められた単音
節の母音名Ａ（ｎ）（ｎ＝１、…、Ｎ）（Ｎは入力され
る音節の数）が、認識結果として認識結果記憶部４に格
納される（ステップ４）。同時に、音節数計数部５で、
音節数Ｎがカウントされる（ステップ５）。

【００２９】前記ステップ２からステップ５の処理は、
１単語分の音節の入力が終了するまで実行され（ステッ
プ６）、１単語分の音節の入力が終了したら、ステップ
７へ進む。

【００３０】次に、認識処理切り替え部２のスイッチを
１２側に接続し、音声入力部１と第１連続音節認識処理
部６とを接続する（ステップ７）。

【００３１】音声入力部１は、発声された音声を入力
し、第１連続音節認識処理部６に出力する（ステップ
８）。

【００３２】第１連続音節認識処理部６では、上記文献
２に示されているような、ＣＶパターン、ＶＣＶパター
ンを結合した標準パターンを用いた方法で認識を行う
（ステップ９）。この処理における母音部候補の抽出時
に、前記ステップ４およびステップ５で得られた、入力
された母音系列および音節数の情報を用いて候補を限定
する。

【００３３】第１連続音節認識処理部６で求められた最
適の音節系列を認識結果の単語として出力する（ステッ
プ１０）。

【００３４】次に、本発明第１の実施の形態の作用効果
について説明する。

【００３５】本発明の第１の実施の形態は、第１単音節
認識処理部３で得られた認識結果を第１連続音節認識処
理部６に利用するので、連続音節認識処理で誤りやすい
音節数や母音系列についての情報を補うことができ、高
い子音認識性能を有する連続音節認識の性能が向上す
る。

【００３６】［実施例１］次に、本発明の第１の実施の
形態について具体例を以て説明すべく一実施例の動作を
説明する。

【００３７】たとえば、「よこはま」という単語を認識
させようとする場合について、図１、図２を参照して説
明する。

【００３８】まず、認識処理切り替え部２のスイッチを
１１側に接続して単音節認識処理を選択する（ステップ
Ｓ１）。「よこはま」を音節で区切り、最初の音節
「よ」を発声し、音声入力部１より入力する。入力され
た音声は、第１単音節認識処理部３に送られる（ステッ
プＳ２）。

【００３９】第１単音節認識処理部３では、まず、入力
された発声「よ」に対して、引用文献１に示されるよう
に、ＬＰＣ分析を行ってＬＰＣケプストラムを抽出し、
音声区間を検出する。

【００４０】検出した音声区間から子音部と母音部とを
分離し、母音部の認識を行う。その結果、音節「よ（ｙ
ｏ）」の母音名「ｏ」が単音節認識処理の結果となる
（ステップＳ３）。

【００４１】出力された母音名Ａ（１）＝ｏが、認識結
果記憶部４に格納される（ステップＳ４）。

【００４２】また、音節数計数部５で、音節数Ｎが初期
値０から１にカウントされる（ステップＳ５）。

【００４３】続いてステップＳ２に戻り、次の音節
「コ」を同様に音声入力部１に入力する。以降、発声さ
れた「こ」の音声信号についても、同様にして、第１単
音節認識処理部３で前記単音節認識処理が施され（ステ
ップＳ３）、最も類似度の高い音節「こ（ｋｏ）」の母
音名「ｏ」がＡ（２）＝ｏとして、認識結果記憶部に追
加され（ステップＳ４）、認識結果記憶部４には、母音
系列Ａ（ｎ）＝｛ｏ，ｏ｝（ｎ＝１、２）が登録され
る。このとき、音節数計数部５で、音節数Ｎが１から２
にカウントされる（ステップＳ５）。

【００４４】以降、「は」、「ま」についても、ステッ
プＳ２からステップＳ５まで同様の処理がなされ、認識
結果記憶部４に、母音系列Ａ（ｎ）＝｛ｏ，ｏ，ａ，
ａ｝（ｎ＝１、…、Ｎ）が登録され、音節数計数部５で
は入力された音節の数Ｎ＝４が計数された状態となる。

【００４５】続いて、認識処理切り替え部２のスイッチ
を１２側に接続して、連続音節認識処理を選択する（ス
テップＳ７）。

【００４６】音節を連続して「よこはま」と発声し、音
声入力部１に入力する（ステップＳ８）。

【００４７】入力された音声は、第１連続音節認識処理
部６に送られる。

【００４８】第１連続音節認識処理部６では、上記文献
２に記載されているように、ＣＶパターン、ＶＣＶパタ
ーンを結合した標準パターンを用いた方法で、認識処理
を行う。この時、母音部候補の抽出時に、認識結果記憶
部４に格納されている母音系列Ａ（ｎ）＝｛ｏ，ｏ，
ａ，ａ｝（ｎ＝１、…、Ｎ）と、音節数計数部５で計数
された母音数Ｎ＝４を用いて、母音部候補を限定する
（ステップＳ９）。

【００４９】上記処理の結果から、最適な音節系列は、
「よ」、「こ」、「は」、「ま」が得られ、これを「よ
こはま」という単語として出力する（ステップＳ１
０）。

【００５０】［実施の形態２］次に本発明の第２の実施
の形態について図面を参照して説明する。図３は、本発
明の第２の実施の形態の構成を示すブロック図である。

【００５１】図３において、音声入力部１、認識処理切
り替え部２、認識結果記憶部４、音節数計数部５は、図
１に示した前記第１の実施の形態の構成と同一であるの
で、説明は省略する。

【００５２】図１に示した前記第１の実施の形態の第１
単音節認識処理部３は、母音系列Ａ（ｎ）（ｎ＝１、
…、Ｎ）を出力しているが、図３に示した本発明の第２
の実施の形態における第２の単音節認識処理部２１は、
母音系列Ａ（ｎ）（ｎ＝１、…、Ｎ）に加えて、上位Ｍ
位（Ｍは、予め与えられた値）までの音節認識結果を、
音節系列Ｂ（ｎ，ｍ）（ｎ＝１、…、Ｎ：ｍ＝１、…、
Ｍ）として出力する。

【００５３】また、本発明の第２の実施の形態における
第２連続音節認識処理部２２では、連続音節認識を行う
時、前記第１の実施の形態で説明したように、得られた
母音系列および音節数の情報を母音部候補の抽出時に用
いるだけでなく、上位Ｍ位までの音節系列Ｂ（ｎ，ｍ）
（ｎ＝１、…、Ｎ：ｍ＝１、…、Ｍ）に対するＣＶパタ
ーン、ＶＣＶパターンの標準パターンとのみマッチング
を行う。

【００５４】次に本発明の第２の実施の形態の動作につ
いて、図２と図３を用いて説明する。

【００５５】ステップＳ１からステップＳ２で示される
第２の実施の形態における動作は第１の実施の形態の動
作と同一であるので説明は省略する。

【００５６】ステップＳ３の単音節認識処理では、母音
系列Ａ（ｎ）（ｎ＝１、…、Ｎ）だけでなく、上記文献
１で示されているように、子音部と母音部を分離し、語
頭の過渡部についてシフトマッチングを行い、それに音
節全体の大局的なスペクトルパターン特徴を組み合わせ
て音節の認識を行って得られる上位Ｍ位までの単音節名
Ｂ（ｎ，ｍ）（ｎ＝１、…、Ｎ：ｍ＝１、…、Ｍ）も出
力し、ステップＳ４でその母音系列と単音節名を認識結
果記憶部４に格納する、点が前記第１の実施の形態の動
作と異なる。

【００５７】ステップＳ５からステップＳ８で示される
第２の実施の形態における動作は、前記第１の実施の形
態の動作と同一であるので説明は省略する。

【００５８】ステップＳ９で連続音節認識処理を行う
際、図３の第２の連続音節認識処理部２２では、前記第
１の実施の形態で説明したように、得られた母音系列お
よび音節数の情報を母音部候補の抽出時に用いるだけで
なく、上記文献２で示されるような処理を次の手順で行
う点が第１の実施の形態の動作と異なる。

【００５９】その手順とは、入力音声を特徴ベクトルに
変換し、母音部候補を抽出して各候補の母音名、区間を
求めた後、上位Ｍ位までの音節系列Ｂ（ｎ，ｍ）（ｎ＝
１、…、Ｎ：ｍ＝１、…、Ｍ）に対するＣＶパターン、
ＶＣＶパターンの標準パターンに限定して、ＣＶパター
ン、ＶＣＶパターンレベルのＤＰを用いてマッチングを
行い、その結果から入力全体に対する最適なＣＶパター
ン、ＶＣＶパターンの系列を認識結果として求めるもの
である。

【００６０】ステップＳ１０で示される第２の実施の形
態における動作は、前記第１の実施の形態の動作と同一
であるので説明は省略する。

【００６１】次に、本発明の第２の実施の形態の作用効
果について説明する。

【００６２】本発明の第２の実施の形態は、図３の第２
連続音節認識部２２におけるＣＶパターン、ＶＣＶパタ
ーンレベルのマッチング処理を図３の第２単音節認識処
理部２１で得られた単語を構成する音節だけに制限する
ことが可能となるので、連続音節認識の処理量が低減で
きる。

【００６３】［実施例］次に本発明の第２の実施の形態
について具体例を以て説明すべく一実施例の動作を図
２、図３および図４を用いて説明する。

【００６４】図４は、本発明の第２の実施の形態での認
識結果記憶部４に格納された内容を示す図である。

【００６５】たとえば「よこはま」という単語を認識さ
せようとする場合について図を参照して説明する。

【００６６】ステップＳ１からステップＳ２で示される
第２の実施の形態における実施例の動作は、前記第１の
実施の形態の動作と同一であるので説明は省略する。

【００６７】第２の実施の形態が、前記第１の実施の形
態と相違する点は、最初の音節「よ」の入力に対し、ス
テップＳ３で母音Ａ（１）＝ｏだけでなく、単音節認識
結果の上位Ｍ位の候補であるＢ（１，ｍ）＝｛お，よ，
…，ご｝（ｍ＝１、…、Ｍ）が出力され、これらがステ
ップＳ４で認識結果記憶部４に格納される点である。以
下の音節についても同様に処理され、すべての音節の入
力が終了した時点で認識結果記憶部４に格納される母音
系列および音節系列は、図４に示すように、Ａ（ｎ）＝｛ｏ，ｏ，ａ，ａ｝（ｎ＝１、…、Ｎ）Ｂ（ｎ，ｍ）＝｛“お，よ，…，ご”，“こ，ご，…，
と”，“か，あ，…，は”，“ま，な，…，あ”｝（ｍ
＝１、…、Ｍ）となる。

【００６８】ステップＳ５からステップＳ８で示される
第２の実施の形態における動作は、前記第１の実施の形
態の動作と同一であるので説明は省略する。

【００６９】ここで、第２の実施の形態では、ステップ
Ｓ９の連続音節認識処理において、母音部候補を抽出す
る際に、前記第１の実施の形態と同様に母音系列と音節
数を用いるだけでなく、ＣＶパターン、ＶＣＶパターン
の標準パターンとマッチング処理を行う際、その対象
を、１番目の音節は｛お，よ，…，ご｝に、２番目の音
節は｛こ，ご，…，と｝に、…と、以下同様に認識結果
記憶部４に格納されている音節だけに限定して行う。

【００７０】ステップＳ１０で示される第２の実施の形
態における実施例の動作は、前記第１の実施の形態の動
作と同一であるので説明は省略する。

【００７１】次に本発明の第１および第２の実施の形態
のその他の変形について説明する。

【００７２】前記第１および第２の実施の形態では、単
音節認識処理では、上記文献１に示されているような、
検出した音声から子音部と母音部を分離し、語頭の過渡
部についてシフトマッチングを行い、それに音節全体の
大局的スペクトルパターン特徴を組み合わせて認識を行
い、これらの結果を組合せて判定する方法を用いている
が、上記文献１に示されているような、子音部および母
音部の認識にＤＰマッチングを適応する方法も可能であ
る。

【００７３】また前記第１および第２の実施の形態で
は、連続音節認識には、上記文献２に示されているよう
な、ＣＶパターン、ＶＣＶパターンを結合した標準パタ
ーンを用いて音節を認識する方法を用いているが、例え
ば、電子通信学会技術研究報告ＰＲＬ７５−４４に、
「ＶＣＶ音節を単位とした連続単語音声の認識」と題し
て掲載された論文（以下「文献３」という）に示されて
いるような、入力音声をＶＣＶ音節単位にセグメントし
てセグメント毎に認識する方法などを用いることも可能
である。

【００７４】前記第１の実施の形態では、第１単音節認
識処理部３で得られた母音系列を認識結果記憶部４に出
力し、第１連続音節認識処理部６で、母音系列と音節数
の両方を用いて認識処理を行うが、認識結果記憶部４に
母音系列を出力せずに、音節数計数部５で計数された音
節数のみを用いて第１連続音節認識処理部６における母
音部の候補を限定行うことも可能である。この場合、第
１単音節認識処理部３では、音声の検出だけを行えばよ
い。

【００７５】また、前記第１および第２の実施の形態で
は、認識単位として音節を用いているが、これを、例え
ばアルファベットにすることも可能である。アルファベ
ットを用いた場合も、前記の実施の形態と同様に、アル
ファベット認識処理、連続アルファベット認識処理を行
うことが可能である。

【００７６】そして前記第２の実施の形態では、連続音
節認識でマッチング処理の対象とするものを上位Ｍ位の
候補としているが、これを類似度が一定閾値以上の候補
とすることも可能である。

【００７７】

【発明の効果】以上説明したように、本発明によれば、
単音節認識での認識結果を連続音節認識に利用すること
により、連続音節認識の認識性能の向上を図ることがで
きる、という効果を奏する。

【００７８】その理由は、単音節認識で得られた単語を
構成する音節数や各音節の母音系列は連続音節認識より
も精度が高いので、これらを利用することにより、連続
音節認識での音節の挿入や脱落による誤認識や、母音部
の誤認識を減少させることが可能となるからである。ま
た、これにより、単音節認識だけでは認識精度の低い子
音の認識に対して、連続音節認識の結果を用いることが
できるので、認識性能の向上が図れるからである。

【００７９】さらに、本発明では、連続音節認識におけ
る処理量の削減を図ることができるという効果を奏す
る。

【００８０】その理由は、連続音節認識における各音節
のマッチング対象となる音節を、単音節認識で得られた
一定範囲の上位候補に対応する音節に制限することが可
能となるからである。

【図面の簡単な説明】

【図１】本発明の音声認識装置の第１の実施の形態の構
成を示す図である。

【図２】本発明の実施の形態の処理手順を示すフローチ
ャートである。

【図３】本発明の音声認識装置の第２の実施の形態の構
成を示す図である。

【図４】本発明の第２の実施の形態における認識結果記
憶部４に格納された内容を示す図である。

【符号の説明】

１音声入力部２認識処理切り替え部３第１単音節認識処理部４認識結果記憶部５音節数計数部６第１連続音節認識処理部１１単音節認識処理を選択する時のスイッチ接続点１２連続音節認識処理を選択する時のスイッチ接続点２１第２単音節認識処理部２２第２連続音節認識処理部

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩＧ１０Ｌ 5/06 Ｄ (56)参考文献特開平８−248989（ＪＰ，Ａ) 特開昭64−21497（ＪＰ，Ａ) 特開昭62−87997（ＪＰ，Ａ) 特開昭58−195895（ＪＰ，Ａ) 特開昭57−86899（ＪＰ，Ａ) 特開平８−335093（ＪＰ，Ａ) 特開昭58−159592（ＪＰ，Ａ) 特開昭60−237532（ＪＰ，Ａ) 特開昭59−62900（ＪＰ，Ａ) 特公昭63−16766（ＪＰ，Ｂ２) 日本音響学会誌Ｖｏｌ．42，Ｎｏ. 12，「ＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌに基づいた音声認識」ｐ. 936−941（昭和61年12月１日発行) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 15/28 G10L 15/18 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】音声入力部と、単音節認識単位に区切って発声された音声に対して単音
節認識単位毎の認識処理を行う単音節認識処理部と、前記単音節認識単位に区切って発声された音声に関連し
て連続に発声された音声に対して、前記単音節認識単位
毎の認識結果を用いて連続認識処理を行う連続音節認識
処理部と、前記音声入力部の出力を前記単音節認識処理部または前
記連続音節認識処理部の入力に切替える切替部と、を備え、はじめに前記切替部が前記単音節認識処理部を選択して
おき、音節に区切って発声された音声を前記単音節認識
処理部で認識し、次に前記切替部で連続音節認識処理部を選択して、連続
して発声された音声に対して、前記単音節認識処理部で
得られた情報を用いて前記連続音節認識処理部で認識を
行い、得られた認識結果を出力する、音声認識装置であ
って、前記単音節認識処理部において、認識した結果を記憶部
に記憶し、同時に音節数計数部で音節数をカウントし、
連続して発声された音声に対して、前記単音節認識処理
部で得られた音節数、もしくは認識結果及び音節数に基
づいて、前記連続音節認識処理部で認識を行う、ことを
特徴とする音声認識装置。
【請求項２】前記単音節認識結果のうち上位候補あるい
は類似性が高い音節のみを連続音節認識の対象とする、
ことを特徴とする請求項１記載の音声認識装置。