JP3039453B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP3039453B2
JP3039453B2 JP9165205A JP16520597A JP3039453B2 JP 3039453 B2 JP3039453 B2 JP 3039453B2 JP 9165205 A JP9165205 A JP 9165205A JP 16520597 A JP16520597 A JP 16520597A JP 3039453 B2 JP3039453 B2 JP 3039453B2
Authority
JP
Japan
Prior art keywords
recognition
syllable
processing unit
unit
continuous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP9165205A
Other languages
English (en)
Other versions
JPH10340096A (ja
Inventor
靖子 加藤
和永 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP9165205A priority Critical patent/JP3039453B2/ja
Publication of JPH10340096A publication Critical patent/JPH10340096A/ja
Application granted granted Critical
Publication of JP3039453B2 publication Critical patent/JP3039453B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声認識装置に関
し、特に任意の単語または文の認識が可能な音声認識装
置に関する。
【0002】
【従来の技術】音声認識技術を様々な分野に応用する場
合、認識対象を限定せず、任意の単語や文が入力可能で
あることが理想的である。これを実現する方法として、
従来、文節単位に発声された音声を認識対象とする単音
節認識方式や、あるいは、任意の音節が任意の数だけ連
続して発声された音声を認識対象とする連続音節認識方
式などがあった。
【0003】単音節認識方式の1つとして、文献(古井
貞煕著、「ディジタル音声処理」、8.7章、第170
頁から172頁、東海大学出版会出版)(以下「文献
1」という)に示されている方法がある。
【0004】この方法は、まず、入力された音声をLP
C(Linear Predictive Codin
g)分析してその特徴であるLPCケプストラムを抽出
し、音声区間を検出する。検出した音声から子音部と母
音部を分離し、語頭の過渡部についてシフトマッチング
を行い、それに音節全体の大局的スペクトルパターン特
徴を組合せて認識を行い、これらの結果を組み合わせて
判定するものである。
【0005】連続音節認識方式の1つとして、たとえ
ば、アイキャスプ83、7.9、第320頁から323
頁(ICASSP83 7.9 pp.320〜32
3)に「セグメンテーションフリー シラブル レコグ
ニション イン コンティニュアスリー スポークン
ジャパニーズ(SEGMENTATION−FREE
SYLLABLE RECOGNITION IN C
ONTINUOUSLYSPOKEN JAPANES
E)」と題して掲載されている論文(以下「文献2」と
いう)に示される、音節間の変化の情報を含む子音・母
音連鎖音声パターン(「CVパターン」という)と、母
音・子音・母音連鎖音声パターン(「VCVパターン」
という)を結合した標準パターンを用いて認識する方法
がある。
【0006】これは、入力音声を特徴ベクトルに変換
し、母音部候補を抽出して各候補の母音名、区間を求め
たあと、CVパターン、VCVパターンレベルのマッチ
ングをDPを用いて行い、その結果から入力全体に対す
る最適なCVパターン、VCVパターンの系列を認識結
果として求める方法である。
【0007】
【発明が解決しようとする課題】しかしながら、上記し
た単音節認識方式では、単音節が単独で発声されるので
調音結合の影響が少ないため、母音部は比較的安定して
認識できるが、子音部は継続時間が短いので情報量が少
なく、類似しているものが多いため誤りやすい、という
問題点を有している。
【0008】一方、連続音節認識方式では、語中の破裂
音の認識で破裂前の閉鎖部の有無についての情報が使え
るなど、子音部の認識性能は単音節認識に比べて良いこ
とが期待できる。しかし、連続する音節の数や種類に制
限がないために、音節の挿入や脱落が生じやすく、音節
数の誤りが生じる可能性がある。
【0009】また、連続して発声した音声を対象とする
ので、調音結合の影響により母音の認識誤りも生じやす
い。
【0010】したがって、本発明は、上記問題点に鑑み
てなされたものであって、その目的は、任意に発声され
た単語や文を高精度で認識する音声認識装置を提供する
ことにある。
【0011】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、認識単位に区切って発声された音声に対
して認識単位毎の認識処理を行う単位音声認識処理部
と、前記認識単位に区切って発声された音声に関連して
連続に発声された音声に対し、前記認識単位毎の認識結
果を用いて連続認識処理を行う連続音声認識処理部と、
を有している。より詳細には、音声入力部と、単音節認
識単位に区切って発声された音声に対して単音節認識単
位毎の認識処理を行う単音節認識処理部と、前記単音節
認識単位に区切って発声された音声に関連して連続に発
声された音声に対して、前記単音節認識単位毎の認識結
果を用いて連続認識処理を行う連続音節認識処理部と、
前記音声入力部の出力を前記単音節認識処理部または前
記連続音節認識処理部の入力に切替える切替部と、を備
え、はじめに前記切替部が前記単音節認識処理部を選択
しておき、音節に区切って発声された音声を前記単音節
認識処理部で認識し、次に前記切替部で連続音節認識処
理部を選択して、連続して発声された音声に対して、前
記単音節認識処理部で得られた情報を用いて前記連続音
節認識処理部で認識を行い、得られた認識結果を出力す
る、音声認識装置であって、前記単音節認識処理部にお
いて、認識した結果を記憶部に記憶し、同時に音節数計
数部で音節数をカウントし、連続して発声された音声に
対して、前記単音節認識処理部で得られた音節数、もし
くは認識結果及び音節数に基づいて、前記連続音節認識
処理部で認識を行う。
【0012】
【作用】本発明の作用について説明すると、本発明で
は、単語を入力する際に、入力したい単語をまず音節に
区切って発声し、その後に同じ単語を区切らずに連続し
て発声する。この音節に区切って発声された各音声は、
単音節認識処理部により認識される。このときに得られ
た認識結果を用いて、次に、区切らずに連続して発声さ
れた音声を連続音節認識方式により認識し、その結果を
入力したい単語の認識結果とする。
【0013】単音節認識結果のうち、音節数や母音部の
認識結果の精度は高いことが期待されるので、これらの
情報を連続音節認識に利用することにより、連続音節認
識の性能向上を図る。これにより、単音節認識だけでは
認識精度の低い子音の認識に対して、連続音節認識の結
果を用いることができるので、認識性能の向上が図れ
る。
【0014】また単音節認識結果のうち上位候補あるい
は類似性が高い音節のみを連続音節認識の対象とするこ
とにより、連続音節認識での処理量を削減する。
【0015】以上、認識単位として音節を用いて説明し
たが、これ以外にもたとえば、アルファベットを用いる
場合でも同様の効果が期待できる。以下、音節を認識単
位とした場合についてのみ説明する。
【0016】
【発明の実施の形態】次に本発明の実施の形態について
図面を参照して説明する。
【0017】[実施の形態1]図1は、本発明の第1の
実施の形態の構成を示すブロック図である。
【0018】図1を参照すると、本発明の第1の実施の
形態は、(a)話者の発声した音声を入力する音声入力
部1と、(b)単音節認識処理と連続音節認識処理の切
り替えを行う認識処理切り替え部2と、(c)単音節認
識処理を行う第1単音節認識処理部3と、(d)第1単
音節認識処理部3で得られた認識結果を保持する認識結
果記憶部4と、(e)第1単音節認識処理部3で処理を
行った音節数を計測する音節数計測部5と、(f)連続
音節認識処理を行う第1連続音節認識処理部6と、を含
む。
【0019】認識処理切り替え部2は、スイッチを11
側に接続することにより音声入力部1と第1単音節認識
処理部3とを接続し、スイッチを12側に接続すること
により音声入力部1と第1連続音節認識処理部6とを接
続する。
【0020】第1単音節認識処理部3は、音節に区切っ
て発声された各音声に対して、認識処理を行い、単音節
の母音名を出力する。
【0021】認識結果記憶部4には、認識結果として単
音節の母音名が保持される。
【0022】音節数計数部5では、第1単音節認識処理
部3から出力された認識結果の音節数をカウントする。
【0023】第1連続音節認識部6は、入力された音節
数および母音名の系列を用いて音節に区切らずに連続し
て発声された音声に対して認識処理を行う。
【0024】図2は、本発明の第1の実施の形態の処理
手順を説明するための流れ図である。本発明の第1の実
施の形態の動作について図1および図2を用いて説明す
る。
【0025】まず、認識処理切り替え部2のスイッチを
11側に接続し、音声入力部1と第1単音節認識処理部
3とを接続する(ステップ1)。
【0026】音声入力部1は、マイクロフォン、フィル
タ、A/Dコンバータなどから構成されており、発声さ
れた音声を入力し、第1単音節認識処理部3に出力する
(ステップ2)。
【0027】第1単音節認識処理部3は、入力された音
声に対して、上記文献1に示されている方法を用いて、
単音節認識処理を行い(ステップ3)、単音節の母音名
を出力する。
【0028】第1単音節認識処理部3で求められた単音
節の母音名A(n)(n=1、…、N)(Nは入力され
る音節の数)が、認識結果として認識結果記憶部4に格
納される(ステップ4)。同時に、音節数計数部5で、
音節数Nがカウントされる(ステップ5)。
【0029】前記ステップ2からステップ5の処理は、
1単語分の音節の入力が終了するまで実行され(ステッ
プ6)、1単語分の音節の入力が終了したら、ステップ
7へ進む。
【0030】次に、認識処理切り替え部2のスイッチを
12側に接続し、音声入力部1と第1連続音節認識処理
部6とを接続する(ステップ7)。
【0031】音声入力部1は、発声された音声を入力
し、第1連続音節認識処理部6に出力する(ステップ
8)。
【0032】第1連続音節認識処理部6では、上記文献
2に示されているような、CVパターン、VCVパター
ンを結合した標準パターンを用いた方法で認識を行う
(ステップ9)。この処理における母音部候補の抽出時
に、前記ステップ4およびステップ5で得られた、入力
された母音系列および音節数の情報を用いて候補を限定
する。
【0033】第1連続音節認識処理部6で求められた最
適の音節系列を認識結果の単語として出力する(ステッ
プ10)。
【0034】次に、本発明第1の実施の形態の作用効果
について説明する。
【0035】本発明の第1の実施の形態は、第1単音節
認識処理部3で得られた認識結果を第1連続音節認識処
理部6に利用するので、連続音節認識処理で誤りやすい
音節数や母音系列についての情報を補うことができ、高
い子音認識性能を有する連続音節認識の性能が向上す
る。
【0036】[実施例1]次に、本発明の第1の実施の
形態について具体例を以て説明すべく一実施例の動作を
説明する。
【0037】たとえば、「よこはま」という単語を認識
させようとする場合について、図1、図2を参照して説
明する。
【0038】まず、認識処理切り替え部2のスイッチを
11側に接続して単音節認識処理を選択する(ステップ
S1)。「よこはま」を音節で区切り、最初の音節
「よ」を発声し、音声入力部1より入力する。入力され
た音声は、第1単音節認識処理部3に送られる(ステッ
プS2)。
【0039】第1単音節認識処理部3では、まず、入力
された発声「よ」に対して、引用文献1に示されるよう
に、LPC分析を行ってLPCケプストラムを抽出し、
音声区間を検出する。
【0040】検出した音声区間から子音部と母音部とを
分離し、母音部の認識を行う。その結果、音節「よ(y
o)」の母音名「o」が単音節認識処理の結果となる
(ステップS3)。
【0041】出力された母音名A(1)=oが、認識結
果記憶部4に格納される(ステップS4)。
【0042】また、音節数計数部5で、音節数Nが初期
値0から1にカウントされる(ステップS5)。
【0043】続いてステップS2に戻り、次の音節
「コ」を同様に音声入力部1に入力する。以降、発声さ
れた「こ」の音声信号についても、同様にして、第1単
音節認識処理部3で前記単音節認識処理が施され(ステ
ップS3)、最も類似度の高い音節「こ(ko)」の母
音名「o」がA(2)=oとして、認識結果記憶部に追
加され(ステップS4)、認識結果記憶部4には、母音
系列A(n)={o,o}(n=1、2)が登録され
る。このとき、音節数計数部5で、音節数Nが1から2
にカウントされる(ステップS5)。
【0044】以降、「は」、「ま」についても、ステッ
プS2からステップS5まで同様の処理がなされ、認識
結果記憶部4に、母音系列A(n)={o,o,a,
a}(n=1、…、N)が登録され、音節数計数部5で
は入力された音節の数N=4が計数された状態となる。
【0045】続いて、認識処理切り替え部2のスイッチ
を12側に接続して、連続音節認識処理を選択する(ス
テップS7)。
【0046】音節を連続して「よこはま」と発声し、音
声入力部1に入力する(ステップS8)。
【0047】入力された音声は、第1連続音節認識処理
部6に送られる。
【0048】第1連続音節認識処理部6では、上記文献
2に記載されているように、CVパターン、VCVパタ
ーンを結合した標準パターンを用いた方法で、認識処理
を行う。この時、母音部候補の抽出時に、認識結果記憶
部4に格納されている母音系列A(n)={o,o,
a,a}(n=1、…、N)と、音節数計数部5で計数
された母音数N=4を用いて、母音部候補を限定する
(ステップS9)。
【0049】上記処理の結果から、最適な音節系列は、
「よ」、「こ」、「は」、「ま」が得られ、これを「よ
こはま」という単語として出力する(ステップS1
0)。
【0050】[実施の形態2]次に本発明の第2の実施
の形態について図面を参照して説明する。図3は、本発
明の第2の実施の形態の構成を示すブロック図である。
【0051】図3において、音声入力部1、認識処理切
り替え部2、認識結果記憶部4、音節数計数部5は、図
1に示した前記第1の実施の形態の構成と同一であるの
で、説明は省略する。
【0052】図1に示した前記第1の実施の形態の第1
単音節認識処理部3は、母音系列A(n)(n=1、
…、N)を出力しているが、図3に示した本発明の第2
の実施の形態における第2の単音節認識処理部21は、
母音系列A(n)(n=1、…、N)に加えて、上位M
位(Mは、予め与えられた値)までの音節認識結果を、
音節系列B(n,m)(n=1、…、N:m=1、…、
M)として出力する。
【0053】また、本発明の第2の実施の形態における
第2連続音節認識処理部22では、連続音節認識を行う
時、前記第1の実施の形態で説明したように、得られた
母音系列および音節数の情報を母音部候補の抽出時に用
いるだけでなく、上位M位までの音節系列B(n,m)
(n=1、…、N:m=1、…、M)に対するCVパタ
ーン、VCVパターンの標準パターンとのみマッチング
を行う。
【0054】次に本発明の第2の実施の形態の動作につ
いて、図2と図3を用いて説明する。
【0055】ステップS1からステップS2で示される
第2の実施の形態における動作は第1の実施の形態の動
作と同一であるので説明は省略する。
【0056】ステップS3の単音節認識処理では、母音
系列A(n)(n=1、…、N)だけでなく、上記文献
1で示されているように、子音部と母音部を分離し、語
頭の過渡部についてシフトマッチングを行い、それに音
節全体の大局的なスペクトルパターン特徴を組み合わせ
て音節の認識を行って得られる上位M位までの単音節名
B(n,m)(n=1、…、N:m=1、…、M)も出
力し、ステップS4でその母音系列と単音節名を認識結
果記憶部4に格納する、点が前記第1の実施の形態の動
作と異なる。
【0057】ステップS5からステップS8で示される
第2の実施の形態における動作は、前記第1の実施の形
態の動作と同一であるので説明は省略する。
【0058】ステップS9で連続音節認識処理を行う
際、図3の第2の連続音節認識処理部22では、前記第
1の実施の形態で説明したように、得られた母音系列お
よび音節数の情報を母音部候補の抽出時に用いるだけで
なく、上記文献2で示されるような処理を次の手順で行
う点が第1の実施の形態の動作と異なる。
【0059】その手順とは、入力音声を特徴ベクトルに
変換し、母音部候補を抽出して各候補の母音名、区間を
求めた後、上位M位までの音節系列B(n,m)(n=
1、…、N:m=1、…、M)に対するCVパターン、
VCVパターンの標準パターンに限定して、CVパター
ン、VCVパターンレベルのDPを用いてマッチングを
行い、その結果から入力全体に対する最適なCVパター
ン、VCVパターンの系列を認識結果として求めるもの
である。
【0060】ステップS10で示される第2の実施の形
態における動作は、前記第1の実施の形態の動作と同一
であるので説明は省略する。
【0061】次に、本発明の第2の実施の形態の作用効
果について説明する。
【0062】本発明の第2の実施の形態は、図3の第2
連続音節認識部22におけるCVパターン、VCVパタ
ーンレベルのマッチング処理を図3の第2単音節認識処
理部21で得られた単語を構成する音節だけに制限する
ことが可能となるので、連続音節認識の処理量が低減で
きる。
【0063】[実施例]次に本発明の第2の実施の形態
について具体例を以て説明すべく一実施例の動作を図
2、図3および図4を用いて説明する。
【0064】図4は、本発明の第2の実施の形態での認
識結果記憶部4に格納された内容を示す図である。
【0065】たとえば「よこはま」という単語を認識さ
せようとする場合について図を参照して説明する。
【0066】ステップS1からステップS2で示される
第2の実施の形態における実施例の動作は、前記第1の
実施の形態の動作と同一であるので説明は省略する。
【0067】第2の実施の形態が、前記第1の実施の形
態と相違する点は、最初の音節「よ」の入力に対し、ス
テップS3で母音A(1)=oだけでなく、単音節認識
結果の上位M位の候補であるB(1,m)={お,よ,
…,ご}(m=1、…、M)が出力され、これらがステ
ップS4で認識結果記憶部4に格納される点である。以
下の音節についても同様に処理され、すべての音節の入
力が終了した時点で認識結果記憶部4に格納される母音
系列および音節系列は、図4に示すように、 A(n)={o,o,a,a}(n=1、…、N) B(n,m)={“お,よ,…,ご”,“こ,ご,…,
と”,“か,あ,…,は”,“ま,な,…,あ”}(m
=1、…、M) となる。
【0068】ステップS5からステップS8で示される
第2の実施の形態における動作は、前記第1の実施の形
態の動作と同一であるので説明は省略する。
【0069】ここで、第2の実施の形態では、ステップ
S9の連続音節認識処理において、母音部候補を抽出す
る際に、前記第1の実施の形態と同様に母音系列と音節
数を用いるだけでなく、CVパターン、VCVパターン
の標準パターンとマッチング処理を行う際、その対象
を、1番目の音節は{お,よ,…,ご}に、2番目の音
節は{こ,ご,…,と}に、…と、以下同様に認識結果
記憶部4に格納されている音節だけに限定して行う。
【0070】ステップS10で示される第2の実施の形
態における実施例の動作は、前記第1の実施の形態の動
作と同一であるので説明は省略する。
【0071】次に本発明の第1および第2の実施の形態
のその他の変形について説明する。
【0072】前記第1および第2の実施の形態では、単
音節認識処理では、上記文献1に示されているような、
検出した音声から子音部と母音部を分離し、語頭の過渡
部についてシフトマッチングを行い、それに音節全体の
大局的スペクトルパターン特徴を組み合わせて認識を行
い、これらの結果を組合せて判定する方法を用いている
が、上記文献1に示されているような、子音部および母
音部の認識にDPマッチングを適応する方法も可能であ
る。
【0073】また前記第1および第2の実施の形態で
は、連続音節認識には、上記文献2に示されているよう
な、CVパターン、VCVパターンを結合した標準パタ
ーンを用いて音節を認識する方法を用いているが、例え
ば、電子通信学会技術研究報告PRL75−44に、
「VCV音節を単位とした連続単語音声の認識」と題し
て掲載された論文(以下「文献3」という)に示されて
いるような、入力音声をVCV音節単位にセグメントし
てセグメント毎に認識する方法などを用いることも可能
である。
【0074】前記第1の実施の形態では、第1単音節認
識処理部3で得られた母音系列を認識結果記憶部4に出
力し、第1連続音節認識処理部6で、母音系列と音節数
の両方を用いて認識処理を行うが、認識結果記憶部4に
母音系列を出力せずに、音節数計数部5で計数された音
節数のみを用いて第1連続音節認識処理部6における母
音部の候補を限定行うことも可能である。この場合、第
1単音節認識処理部3では、音声の検出だけを行えばよ
い。
【0075】また、前記第1および第2の実施の形態で
は、認識単位として音節を用いているが、これを、例え
ばアルファベットにすることも可能である。アルファベ
ットを用いた場合も、前記の実施の形態と同様に、アル
ファベット認識処理、連続アルファベット認識処理を行
うことが可能である。
【0076】そして前記第2の実施の形態では、連続音
節認識でマッチング処理の対象とするものを上位M位の
候補としているが、これを類似度が一定閾値以上の候補
とすることも可能である。
【0077】
【発明の効果】以上説明したように、本発明によれば、
単音節認識での認識結果を連続音節認識に利用すること
により、連続音節認識の認識性能の向上を図ることがで
きる、という効果を奏する。
【0078】その理由は、単音節認識で得られた単語を
構成する音節数や各音節の母音系列は連続音節認識より
も精度が高いので、これらを利用することにより、連続
音節認識での音節の挿入や脱落による誤認識や、母音部
の誤認識を減少させることが可能となるからである。ま
た、これにより、単音節認識だけでは認識精度の低い子
音の認識に対して、連続音節認識の結果を用いることが
できるので、認識性能の向上が図れるからである。
【0079】さらに、本発明では、連続音節認識におけ
る処理量の削減を図ることができるという効果を奏す
る。
【0080】その理由は、連続音節認識における各音節
のマッチング対象となる音節を、単音節認識で得られた
一定範囲の上位候補に対応する音節に制限することが可
能となるからである。
【図面の簡単な説明】
【図1】本発明の音声認識装置の第1の実施の形態の構
成を示す図である。
【図2】本発明の実施の形態の処理手順を示すフローチ
ャートである。
【図3】本発明の音声認識装置の第2の実施の形態の構
成を示す図である。
【図4】本発明の第2の実施の形態における認識結果記
憶部4に格納された内容を示す図である。
【符号の説明】
1 音声入力部 2 認識処理切り替え部 3 第1単音節認識処理部 4 認識結果記憶部 5 音節数計数部 6 第1連続音節認識処理部 11 単音節認識処理を選択する時のスイッチ接続点 12 連続音節認識処理を選択する時のスイッチ接続点 21 第2単音節認識処理部 22 第2連続音節認識処理部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI G10L 5/06 D (56)参考文献 特開 平8−248989(JP,A) 特開 昭64−21497(JP,A) 特開 昭62−87997(JP,A) 特開 昭58−195895(JP,A) 特開 昭57−86899(JP,A) 特開 平8−335093(JP,A) 特開 昭58−159592(JP,A) 特開 昭60−237532(JP,A) 特開 昭59−62900(JP,A) 特公 昭63−16766(JP,B2) 日本音響学会誌 Vol.42,No. 12,「Hidden Markov M odel に基づいた音声認識」p. 936−941(昭和61年12月1日発行) (58)調査した分野(Int.Cl.7,DB名) G10L 15/28 G10L 15/18 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】音声入力部と単音節認識単位に区切って発声された音声に対して単音
    節認識単位毎の認識処理を行う単音節認識処理部と前記単音節認識単位に区切って発声された音声に関連し
    て連続に発声された音声に対して、前記単音節認識単位
    毎の認識結果を用いて連続認識処理を行う連続音節認識
    処理部と前記音声入力部の出力を前記単音節認識処理部または前
    記連続音節認識処理部の入力に切替える切替部とを備え、 はじめに前記切替部が前記単音節認識処理部を選択して
    おき、音節に区切って発声された音声を前記単音節認識
    処理部で認識し、 次に前記切替部で連続音節認識処理部を選択して、連続
    して発声された音声に対して、前記単音節認識処理部で
    得られた情報を用いて前記連続音節認識処理部で認識を
    行い、得られた認識結果を出力する、音声認識装置であ
    って、 前記単音節認識処理部において、認識した結果を記憶部
    に記憶し、同時に音節数計数部で音節数をカウントし、
    連続して発声された音声に対して、前記単音節認識処理
    部で得られた音節数、もしくは認識結果及び音節数に基
    づいて、前記連続音認識処理部で認識を行う、ことを
    特徴とする音声認識装置。
  2. 【請求項2】前記単音節認識結果のうち上位候補あるい
    は類似性が高い音節のみを連続音節認識の対象とする、
    ことを特徴とする請求項1記載の音声認識装置。
JP9165205A 1997-06-06 1997-06-06 音声認識装置 Expired - Fee Related JP3039453B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9165205A JP3039453B2 (ja) 1997-06-06 1997-06-06 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9165205A JP3039453B2 (ja) 1997-06-06 1997-06-06 音声認識装置

Publications (2)

Publication Number Publication Date
JPH10340096A JPH10340096A (ja) 1998-12-22
JP3039453B2 true JP3039453B2 (ja) 2000-05-08

Family

ID=15807842

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9165205A Expired - Fee Related JP3039453B2 (ja) 1997-06-06 1997-06-06 音声認識装置

Country Status (1)

Country Link
JP (1) JP3039453B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4807261B2 (ja) * 2007-01-09 2011-11-02 ヤマハ株式会社 音声処理装置およびプログラム
JP2009151314A (ja) * 2008-12-25 2009-07-09 Sony Corp 情報処理装置及び情報処理方法
JP2015169827A (ja) * 2014-03-07 2015-09-28 富士通株式会社 音声処理装置、音声処理方法および音声処理プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
日本音響学会誌 Vol.42,No.12,「Hidden Markov Model に基づいた音声認識」p.936−941(昭和61年12月1日発行)

Also Published As

Publication number Publication date
JPH10340096A (ja) 1998-12-22

Similar Documents

Publication Publication Date Title
EP2048655B1 (en) Context sensitive multi-stage speech recognition
US5680510A (en) System and method for generating and using context dependent sub-syllable models to recognize a tonal language
US20080294433A1 (en) Automatic Text-Speech Mapping Tool
US4769844A (en) Voice recognition system having a check scheme for registration of reference data
Mabokela et al. Modeling code-Switching speech on under-resourced languages for language identification.
US6963832B2 (en) Meaning token dictionary for automatic speech recognition
JP3039453B2 (ja) 音声認識装置
Nakagawa Speaker-independent continuous-speech recognition by phoneme-based word spotting and time-synchronous context-free parsing
JP3058125B2 (ja) 音声認識装置
JP2004177551A (ja) 音声認識用未知発話検出装置及び音声認識装置
EP0987681B1 (en) Speech recognition method and apparatus
JP2813209B2 (ja) 大語彙音声認識装置
Hunt Speaker adaptation for word‐based speech recognition systems
JPH08314490A (ja) ワードスポッティング型音声認識方法と装置
JP3110025B2 (ja) 発声変形検出装置
JPH0736481A (ja) 補完音声認識装置
JP2000276189A (ja) 日本語ディクテーションシステム
JP3033132B2 (ja) 言語処理装置
JP2979912B2 (ja) 音声認識装置
JP2004309654A (ja) 音声認識装置
JPH0695684A (ja) 音声認識システム
KR20040100592A (ko) 이동 기기에서의 실시간 화자독립가변어 음성인식 방법
JP2001013983A (ja) 音声合成を用いた音声認識装置および音声認識方法
JP2006113269A (ja) 発音系列認識装置、発音系列認識方法及び発音系列認識プログラム
JPH07261782A (ja) 音声認識装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000201

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080303

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090303

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees