JPH07319494A - 大語彙音声認識装置 - Google Patents

大語彙音声認識装置

Info

Publication number
JPH07319494A
JPH07319494A JP10733594A JP10733594A JPH07319494A JP H07319494 A JPH07319494 A JP H07319494A JP 10733594 A JP10733594 A JP 10733594A JP 10733594 A JP10733594 A JP 10733594A JP H07319494 A JPH07319494 A JP H07319494A
Authority
JP
Japan
Prior art keywords
dictionary
voice
input
word
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10733594A
Other languages
English (en)
Other versions
JP2833995B2 (ja
Inventor
Hideya Yamaki
秀哉 山木
Yasuo Tomooka
靖夫 友岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
NEC Robotics Engineering Ltd
Original Assignee
NEC Corp
NEC Robotics Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Robotics Engineering Ltd filed Critical NEC Corp
Priority to JP6107335A priority Critical patent/JP2833995B2/ja
Publication of JPH07319494A publication Critical patent/JPH07319494A/ja
Application granted granted Critical
Publication of JP2833995B2 publication Critical patent/JP2833995B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】複数の音声認識用の単語辞書ファイルの総容量
を低減し、複数の辞書ファイルのロードにかかる誤りを
無くすと共に、操作者の手間を軽減させる。 【構成】辞書生成部3はグループ化情報入力部2からの
同時に認識対象となる複数の単語セット1の組を表わし
たグループ化情報を参照し、複数の単語セット1を入力
して最少の辞書ファイル4に変換出力すると同時に辞書
構成情報を生成して辞書構成情報メモリ5に記憶する。
辞書ロード部6は辞書ロード要求を受けたら辞書構成情
報を参照してロードすべき辞書ファイル4を判断し、ま
たすでにロードされていないかを調べ、まだロードされ
ていない時に当該辞書ファイル4を読み込み辞書メモリ
10に書き込む。マイク11からの入力音声は音声特徴
抽出部12で音声特徴が抽出され、比較照合部14で辞
書メモリ10の単語と照合されて認識される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は大語彙音声認識装置に関
する。
【0002】
【従来の技術】従来、この種の大語彙音声認識装置は、
一発声時点の認識対象語数が多いという意味での大語彙
音声認識装置である。
【0003】この種の従来の大語彙音声認識装置につい
て図面を参照して説明する。
【0004】図7は従来の音声認識装置の一例を示すブ
ロック図である。
【0005】図7において、1は認識の対象となる単語
群を記述し記憶したものであり、ここでは単語セットと
呼ぶ。音声認識動作を開始する前に、操作者は予め辞書
生成部3aによりこの複数の単語セット1を音声特徴列
の形に変換して複数の辞書ファイル4aを生成させ、さ
らに辞書ロード指示部7から辞書ロード指示を辞書ロー
ド部6aに与えると、辞書ロード部6aは複数の辞書フ
ァイル4aの内容を辞書メモリ10に展開する。音声認
識動作を開始させるための動作指示が動作指示入力部8
から与えられると、制御部9aは装置各部へ動作指示を
伝え、マイク11から入力された音声は音声特徴抽出部
12により音声特徴に変換されて音声特徴メモリ13に
格納され、比較照合部14はこれと辞書メモリ10の内
容とを比較して最も近い単語を選びだし、これを認識結
果出力部15に出力する。
【0006】ここで、一発声のたびに認識対象語を切替
える用途において、この従来の大語彙音声認識装置によ
ると、各時点毎に認識対象となるような複数の単語セッ
ト1を用意してこれらを事前に複数の辞書ファイル4a
に変換しておき、一発声が終了する毎に別の辞書を辞書
メモリ10に展開するよう辞書ロード指示を与えてい
た。また、同時に複数の単語セット1を認識対象とする
場合には、この複数の単語セット1を合体させた単語セ
ットを用意し、個々の単語セットとはまた別の物として
取り扱っていた。さらに、辞書ロードの回数を減らすた
めに、辞書メモリ10の容量の許す範囲で複数の単語セ
ット1を合わせた単語セットを作成して一つの辞書に変
換して辞書メモリ10にロードしておき、比較照合部1
4に比較対象とする辞書メモリ10上の範囲を制限する
機能を持たせたものも考えられていた。
【0007】
【発明が解決しようとする課題】この従来の大語彙音声
認識装置では、どの辞書ファイルにどのような認識対象
語が含まれているかという辞書構成上の情報が装置とし
て記憶されないため、認識対象語を含んだ辞書ファイル
を辞書メモリに展開するための指示が操作者任せにな
り、その結果次のような問題点がある。
【0008】まず第一に、複数の単語セットがあった場
合、認識時に誤って認識対象と違う単語セットに対応し
た辞書がロードされていたとしてもそれをチェックする
手段がない。
【0009】第二に、現在どの辞書ファイルが辞書メモ
リにロードされているかを操作者が記憶していないと無
駄な辞書ロード指示を与えて装置のレスポンスを悪くす
る結果となる。
【0010】第三に、発声毎の辞書ロード回数をできる
だけ減らして装置のレスポンスを上げるために一度に複
数の認識対象単語群を辞書メモリにロードしておく場合
には、組合せ毎に辞書ファイルの数は増え、ファイル管
理はさらに繁雑なものとなる。
【0011】
【課題を解決するための手段】本発明の大語彙音声認識
装置は、音声認識の対象となる複数の単語を予め定義さ
れた複数のジャンルに分けて記憶する記憶手段と、前記
複数の単語のそれぞれの音声特徴を抽出し且つ前記複数
の単語をグループ化するための予め定義されたグループ
化情報の入力に従って複数に分類して前記音声特徴から
なる音声情報の辞書として複数のファイルへ蓄積すると
共に前記複数の分類によるファイル構成を示した辞書構
成情報を生成して記憶する辞書ファイル生成手段と、入
力音声に関係するグループ化情報が入力されると前記辞
書構成情報を参照して入力された前記グループ化情報に
関連するグループの単語の音声情報を辞書メモリに記憶
されていないかチェックした後前記複数のファイルから
選出して前記辞書メモリへ記憶させる単語辞書生成手段
と、前記入力音声からその音声特徴を抽出し前記辞書メ
モリから抽出した前記音声情報と比較照合して最も類似
した音声特徴を持った単語を選出する音声選出手段とを
備えている。
【0012】本発明の大語彙音声認識装置は、音声認識
の対象となる複数の単語を予め定義された複数のジャン
ルに分けて記憶する記憶手段と、前記複数の単語のそれ
ぞれの音声特徴を抽出し且つ前記複数の単語をグループ
化するための予め定義されたグループ化情報の入力に従
って複数に分類して前記音声特徴からなる音声情報の辞
書として複数のファイルへ蓄積すると共に前記複数の分
類によるファイル構成を示した辞書構成情報を生成して
記憶する辞書ファイル生成手段と、入力音声に関係する
グループ化情報が入力されると前記辞書構成情報を参照
して入力された前記グループ化情報に関連するグループ
の単語の音声情報を辞書メモリに記憶されていないかチ
ェックした後前記複数のファイルから選出して前記辞書
メモリへ記憶させる単語辞書生成手段と、前記入力音声
からその音声特徴を抽出し前記辞書メモリから抽出した
前記音声情報と比較照合して最も類似した音声特徴を持
った単語を選出する音声選出手段とを備えて、前記記憶
手段は音声認識の対象となる複数の単語のそれぞれを予
め定義された複数のジャンル別に記憶する複数の単語セ
ットを有し、前記辞書ファイル生成手段は前記入力音声
に関係する前記予め定義されたグループ化情報を入力す
るグループ化情報入力部と、前記グループ化情報の入力
に従って前記複数の単語セットから単語を選出しその単
語の音声特徴を抽出して複数の辞書ファイルへ記憶させ
る辞書生成部と、前記複数の単語の音声特徴を記憶する
前記複数の辞書ファイルと、前記グループ化情報入力部
に入力された前記グループ化情報を基に生成された前記
辞書構成情報を記憶する辞書構成情報記憶部とを有し、
前記単語辞書生成手段は前記入力音声の入力以前に前も
って前記辞書構成情報を基に選出し前記グループ化情報
によって分類された単語の音声特徴が前記辞書メモリに
記憶されていないかをチェックした後前記複数の辞書フ
ァイルから選出して前記辞書メモリへ記憶させる辞書ロ
ード部と、前記辞書ファイルから選出された複数の前記
単語の音声特徴を記憶する前記辞書メモリとを有し、前
記音声選出手段はマイクロホンから入力された前記入力
音声の音声特徴を抽出する音声特徴抽出部と、抽出され
た前記音声特徴と記憶する音声特徴メモリと、この音声
特徴メモリに記憶された音声特徴と前記辞書メモリから
選出した音声特徴とを比較照合して前記入力音声に対す
る単語を認識しその結果を出力する比較照合部とを有
し、前記辞書生成部は前記入力音声に対する前記複数の
辞書ファイル生成の場合に第1の条件として同時に音声
認識の対象となる前記複数の単語セットを必ず1つの前
記辞書ファイルへ書込み、第2の条件として同じ前記単
語セットは場合によっては前記複数の辞書ファイルへ書
込み、第3の条件として前記複数の辞書ファイルのそれ
ぞれを前記辞書メモリの容量を超えないように単語セッ
トを記憶し、且つ前記グループ化情報を基に前記辞書フ
ァイルの数が最も少なくなるように前記辞書ファイルを
構成する。
【0013】
【実施例】次に、本発明について図面を参照して説明す
る。
【0014】図1は本発明の一実施例を示すブロック図
である。
【0015】図1において、本実施例は音声認識の対象
となる複数の単語のそれぞれを予め定義された複数のジ
ャンル別に記憶する複数の単語セット1と、入力音声に
関係する予め定義されたグループ化情報を入力するグル
ープ化情報入力部2と、グループ化情報の入力に従って
複数の単語セット1から単語を選出しその単語の音声特
徴を抽出して複数の辞書ファイル4へ記憶させる辞書生
成部3と、複数の単語の音声特徴を記憶する複数の辞書
ファイル4と、グループ化情報入力部2に入力された前
記グループ化情報を基に生成された辞書構成情報を記憶
する辞書構成情報メモリ5と、入力音声の入力以前に前
もって辞書構成情報を基に選出しグループ化情報によっ
て分類された単語の音声特徴が辞書メモリ10に記憶さ
れていないかをチェックした後複数の辞書ファイル4か
ら選出して辞書メモリ10へ記憶させる辞書ロード部6
と、辞書ファイル4から選出された複数の単語の音声特
徴を記憶する辞書メモリ10と、マイクロホン(マイ
ク)11から入力された入力音声の音声特徴を抽出する
音声特徴抽出部12と、抽出された音声特徴を記憶する
音声特徴メモリ13と、この音声特徴メモリ13に記憶
された音声特徴と辞書メモリ10から選出した音声特徴
とを比較照合して入力音声に対する単語を認識しその結
果を認識結果出力部15に出力する比較照合部14と、
動作指示入力部8からの動作指示の入力によって辞書ロ
ード部6,音声特徴抽出部12および比較照合部14を
制御する制御部9とを有している。
【0016】また、本実施例の辞書生成部3は入力音声
に対する複数の辞書ファイル生成の場合に第1の条件と
して同時に音声認識の対象となる複数の単語セット1を
必ず1つの辞書ファイル4へ書込み、第2の条件として
同じ単語セット1は場合によっては複数の辞書ファイル
4へ書込み、第3の条件として前記複数の辞書ファイル
4のそれぞれを辞書メモリ10の容量を超えないように
単語セット1を記憶し、且つ前記グループ化情報を基に
辞書ファイル4の数が最も少なくなるように辞書ファイ
ル4を構成する。
【0017】図2は図1の中の辞書ロード部の動作を表
わすフロー図、図3は本実施例におけるジャンル別の単
語セットの一例を示す図、図4は本実施例におけるグル
ープ化情報の一例を示す図、図5は本実施例における辞
書ファイルの5つの構成例を示し、(a),(b),
(c),(d)及び(e)はそれぞれの構成を示す図、
図6は本実施例における辞書構成情報の一例を示す図で
ある。
【0018】次に、図1,図2,図3,図4,図5およ
び図6を参照して、本実施例の動作について説明する。
【0019】単語セット1は認識の対象となる単語群の
最小単位である。具体的には図3に示すような、地名単
語群、品名単語群などを指す。またグループ化情報入力
部2から入力するグループ化情報は、これら複数の単語
セット1のうち、同時に認識対象とするグループを示す
情報である。
【0020】辞書生成部3は、各単語セット1に含まれ
る各単語を音声特徴列に変換して複数の辞書ファイル4
に書き込むが、この時に次のような論理で辞書ファイル
4を構成する。まず第一の論理は、入力されたグループ
化情報によって同一のグループに属する単語セットにつ
いてはそれぞれを音声特徴列に変換した結果を1つの辞
書ファイル4に書き込まなくてはならないという論理で
ある。第二の論理は、別のグループに属する単語セット
1であっても、1つの辞書ファイル4に書き込んでもよ
いという論理である。第三の論理は、複数の辞書ファイ
ル4のそれぞれの容量は、辞書メモリ10の容量以下で
なくてはならないという論理である。第四の論理は、以
上三つの論理を満足する中で、辞書ファイル4の数を最
小とするように辞書ファイル4を構成するという論理で
ある。さらに辞書生成部3は、どの単語セット1のグル
ープをどの辞書ファイル4に書き込んだかという辞書構
成情報を生成して、辞書構成情報メモリ5に記憶する。
【0021】音声認識の動作は、まず、動作指示入力部
8からの動作指示を受けて制御部9が各部に動作指示を
伝えることにより行なわれる。動作指示には、前述のど
の単語セット1のグループを認識対象とするかという情
報が含まれる。制御部9はまず辞書ロード部6にこのグ
ループを伝える。辞書ロード部6は辞書構成情報メモリ
5内の辞書構成情報を参照して、ロードすべき辞書ファ
イル名を知る(S1)。次に、辞書ロード部6は辞書メ
モリ10内部に保持しているロード済み辞書ファイル名
の記憶と照合し、すでにロード済みであるかを調べる
(S2)。もしロード済みでない場合には辞書ファイル
4の内容を辞書メモリ10にロードする(S3)。
【0022】次に、制御部9は、音声特徴抽出部12を
起動させる。音声特徴抽出部12はマイク11から入力
された音声データから音声特徴を抽出して音声特徴メモ
リ13に格納する。さらに制御部9は比較照合部14を
起動させる。比較照合部14は音声特徴メモリ13の内
容と辞書メモリ10の内容とを比較照合し、入力された
音声に最も類似した特徴を有する単語を選びだし、これ
を認識結果出力部15に認識結果として出力する。
【0023】次に、具体例を用いて説明する。
【0024】たとえば、単語セットとして図3に示すよ
うな6つがあるとする。また、グループ化情報として図
4に示すものを考える。ここで、グループ化情報は同時
に認識対象とする単語セット1の組を指定されているの
で、図4において、グループAは、”テレビ”、”ラジ
オ”という「品名」と”B101”などの「物品コー
ド」と”はい”、”やりなおし”などの「制御語」のど
れも同時に認識対象とすることを意味する。同様に、グ
ループBは「担当者名」と「制御語」を、グループCは
「地名」と「営業所名」と「制御語」を同時に認識対象
とすることを意味する。
【0025】辞書生成部3はこれらの単語セット1とグ
ループ化情報とを入力し、前述の四つの論理を満足する
ように辞書ファイル4を生成する。第一の論理と第二の
論理とを考慮すると、図5に示すような(a)〜(e)
の5つの辞書構成案が考えられる。すなわち、これらは
すべて同一のグループに属する単語セット1が1つの辞
書ファイル4に入っており、単語セット1は複数の辞書
ファイル4に入れられることも許されている。図5中の
数字は、それぞれの単語セットを音声特徴列に変換した
際のメモリ容量を示す(単位は省略してある)。ここで
例えば辞書メモリ10の容量が1000であったとする
と、第三の論理を適用して、図5の(c)と(e)は辞
書メモリ10の容量1000を越える辞書ファイル4が
できるため、適切でないので除外される。さらに第四の
論理を適用すると、(a)は辞書ファイル数が多いので
除外される。結局(b)または(d)のいずれかの構成
が選ばれることになる。ここでは(b)を選んだものと
して説明を続ける。辞書生成部3は、図5の(b)の構
成を示すものとして辞書構成情報を生成して辞書構成情
報メモリ5に記憶するが、これはたとえば図6のような
情報テーブルである。
【0026】これら辞書ファイル4と辞書構成情報を予
め作成した後で、認識動作を開始する。
【0027】まず、図6に示すグループAに属する単語
を認識対象とする場合には、動作指示入力部8から”グ
ループAで認識せよ”という動作指示を制御部9に与え
ると、制御部9は辞書ロード部6にグループAのロード
指示を伝える。最初は辞書メモリ10には何もロードさ
れていないので、辞書ロード部6は辞書構成情報によ
り”DIC01”という辞書ファイルをロードする。”
DIC01”にはグループAとグループBの両方に属す
る単語群の音声特徴列が含まれている。比較照合部14
はマイク11から入力された音声をもとに変換された音
声特徴とこのグループAの辞書部分とを照合することに
より認識が可能となる。
【0028】次に、動作指示入力部8から”グループB
で認識せよ”という動作指示を与えたとする。制御部9
からグループBのロード指示が伝えられると辞書ロード
部6は、辞書構成情報メモリ5から辞書構成情報によ
り、グループBもまた”DIC01”という辞書ファイ
ル4に含まれ、これはすでに辞書メモリ10にロードさ
れていることを知り、この場合は何もしない。比較照合
部14はグループBに対応した辞書部分との比較照合に
より、入力音声を認識することが可能である。
【0029】さらに今度は動作指示入力部8から”グル
ープC”で認識せよ”という動作指示を与えたとする
と、今度は辞書ロード部6は辞書構成情報メモリ5から
の辞書構成情報により、”DIC02”をロードすべき
と判断し、これを辞書メモリ10にロードする。
【0030】本実施例においては、単語セット1は単な
る単語の集合体として説明したが、複数の単語を連続さ
せた連続単語セットであってもよい。例えば「物品コー
ド」がアルファベット1文字と数字3文字の組合せによ
って成る場合などでは、アルファベットという基本単語
群と数字という基本単語群から構成される連続単語セッ
トと解釈してもよい。
【0031】また、辞書生成部3において、前述の論理
条件を満たす組合せが見つからなかった場合、たとえば
あるグループに属する単語セットの変換容量が辞書メモ
リ10の容量より大きい場合など、然るべきアラームを
通知する機能を持ち合わせることは当然のことである。
【0032】なお、大語彙単語辞書への適用例として、
例えば全国の「地名」という大語彙を考えた場合、辞書
メモリ10の容量制限のために一度に全ての「地名」を
認識対象とすることができないならば、最初は「都道府
県名」を、次に県内の「都市名」を、というように単語
セットを階層的に分けると、本発明の適用により一発声
毎に辞書をロードするための制御が著しく簡単になるこ
とも、あえてここで言明しておく。
【0033】このように、本実施例においては、辞書生
成部3がグループ化情報入力部2からの同時に認識対象
となる複数の単語セット1の組を表わしたグループ化情
報を参照し、複数の単語セット1を入力して最少の辞書
ファイル4に変換出力すると同時に辞書構成情報を生成
して辞書構成情報メモリ5に記憶する。また、辞書ロー
ド部6は辞書ロード要求を受けたら辞書構成情報を参照
してロードすべき辞書ファイル4を判断し、またすでに
ロードされていないかを調べ、まだロードされていない
時に当該辞書ファイル4を読み込み辞書メモリ10に書
き込むことにより、操作者が誤って認識対象と異なる辞
書ファイル4を辞書メモリ10にロードすることを無く
することができる効果があり、また、既にロードされた
辞書を無駄に再度ロードすることを無くすることがで
き、更に、生成した複数の辞書ファイル4の内容を操作
者がいちいち知る必要がないので、操作者の辞書ファイ
ル4の管理作業を著しく軽減することができる効果があ
る。
【0034】またさらに、最小数の辞書ファイル4を構
成するということは、複数の辞書ファイル4に同じ単語
セット1が重複して格納される場合に、その重複の度合
を最小限にすることになり、結果的に辞書ファイル4の
総容量を少なくすることができる効果がある。
【0035】また、本実施例において、たとえば「品
名」という単語セットにおいて、ある時点では特定の単
語だけが認識の対象になることがあるような場合、それ
らの単語を「品名1」という単語セットに、残りを「品
名2」という単語セットに分割し、グループ化情報をこ
れに合わせて書き換えることにより、変更に伴って辞書
ファイル総容量を増やすことなく、容易にグループ化を
変更することができる効果もある。
【0036】
【発明の効果】以上説明したように本発明は、音声認識
の対象となる複数の単語を予め定義された複数のジャン
ルに分けて記憶する記憶手段と、複数の単語のそれぞれ
の音声特徴を抽出し且つ複数の単語をグループ化するた
めの予め定義されたグループ化情報の入力に従って複数
に分類して音声特徴からなる音声情報の辞書として複数
のファイルへ蓄積すると共に複数の分類によるファイル
構成を示した辞書構成情報を生成して記憶する辞書ファ
イル生成手段と、入力音声に関係するグループ化情報が
入力されると辞書構成情報を参照して入力されたグルー
プ化情報に関連するグループの単語の音声情報を辞書メ
モリに記憶されていないかチェックした後複数のファイ
ルから選出して辞書メモリへ記憶させる単語辞書生成手
段とを備えることにより、操作者が誤って認識対象と異
なる辞書ファイルをロードしておくことを無くすること
ができる効果があり、また、既にロードされた辞書を無
駄に再度ロードすることを無くすることができる効果が
ある。
【0037】さらに、生成した複数の辞書ファイルの内
容を操作者がいちいち知る必要がないので、操作者の辞
書ファイルの管理作業を著しく軽減することができる効
果がある。
【0038】またさらに、最小数の辞書ファイルを構成
することにより、複数の辞書ファイルに同じ単語セット
が重複して格納される場合に、その重複の度合を最小限
にすることになり、結果的に辞書ファイルの総容量を少
なくすることができる効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例を示すブロック図である。
【図2】図1の中の辞書ロード部の動作を表わすフロー
図である。
【図3】本実施例におけるジャンル別の単語セットの一
例を示す図である。
【図4】本実施例におけるグループ化情報の一例を示す
図である。
【図5】本実施例における辞書ファイルの5つの構成例
を示し、(a),(b),(c),(d)及び(e)は
それぞれその構成を示す図である。
【図6】本実施例における辞書構成情報の一例を示す図
である。
【図7】従来の音声認識装置の一例を示すブロック図で
ある。
【符号の説明】
1 単語セット 2 グループ化情報入力部 3 辞書生成部 4 辞書ファイル 5 辞書構成情報メモリ 6 辞書ロード部 8 動作指示入力部 9 制御部 10 辞書メモリ 11 マイクロホン(マイク) 12 音声特徴抽出部 13 音声特徴メモリ 14 比較照合部 15 認識結果出力部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 友岡 靖夫 東京都港区芝五丁目7番1号 日本電気株 式会社内

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 音声認識の対象となる複数の単語を予め
    定義された複数のジャンルに分けて記憶する記憶手段
    と、前記複数の単語のそれぞれの音声特徴を抽出し且つ
    前記複数の単語をグループ化するための予め定義された
    グループ化情報の入力に従って複数に分類して前記音声
    特徴からなる音声情報の辞書として複数のファイルへ蓄
    積すると共に前記複数の分類によるファイル構成を示し
    た辞書構成情報を生成して記憶する辞書ファイル生成手
    段と、入力音声に関係するグループ化情報が入力される
    と前記辞書構成情報を参照して入力された前記グループ
    化情報に関連するグループの単語の音声情報を辞書メモ
    リに記憶されていないかチェックした後前記複数のファ
    イルから選出して前記辞書メモリへ記憶させる単語辞書
    生成手段と、前記入力音声からその音声特徴を抽出し前
    記辞書メモリから抽出した前記音声情報と比較照合して
    最も類似した音声特徴を持った単語を選出する音声選出
    手段とを備えることを特徴とする大語彙音声認識装置。
  2. 【請求項2】 前記記憶手段は音声認識の対象となる複
    数の単語のそれぞれを予め定義された複数のジャンル別
    に記憶する複数の単語セットを有し、前記辞書ファイル
    生成手段は前記入力音声に関係する前記予め定義された
    グループ化情報を入力するグループ化情報入力部と、前
    記グループ化情報の入力に従って前記複数の単語セット
    から単語を選出しその単語の音声特徴を抽出して複数の
    辞書ファイルへ記憶させる辞書生成部と、前記複数の単
    語の音声特徴を記憶する前記複数の辞書ファイルと、前
    記グループ化情報入力部に入力された前記グループ化情
    報を基に生成された前記辞書構成情報を記憶する辞書構
    成情報記憶部とを有することを特徴とする請求項1記載
    の大語彙音声認識装置。
  3. 【請求項3】 前記単語辞書生成手段は前記入力音声の
    入力以前に前もって前記辞書構成情報を基に選出し前記
    グループ化情報によって分類された単語の音声特徴が前
    記辞書メモリに記憶されていないかをチェックした後前
    記複数の辞書ファイルから選出して前記辞書メモリへ記
    憶させる辞書ロード部と、前記辞書ファイルから選出さ
    れた複数の前記単語の音声特徴を記憶する前記辞書メモ
    リとを有すること特徴とする請求項1,2記載の大語彙
    音声認識装置。
  4. 【請求項4】 前記音声選出手段はマイクロホンから入
    力された前記入力音声の音声特徴を抽出する音声特徴抽
    出部と、抽出された前記音声特徴を記憶する音声特徴メ
    モリと、この音声特徴メモリに記憶された音声特徴と前
    記辞書メモリから選出した音声特徴とを比較照合して前
    記入力音声に対する単語を認識しその結果を出力する比
    較照合部とを有することを特徴とする請求項1,2及び
    3記載の大語彙音声認識装置。
  5. 【請求項5】 前記辞書生成部は前記入力音声に対する
    前記複数の辞書ファイル生成の場合に第1の条件として
    同時に音声認識の対象となる前記複数の単語セットを必
    ず1つの前記辞書ファイルへ書込み、第2の条件として
    同じ前記単語セットは場合によっては前記複数の辞書フ
    ァイルへ書込み、第3の条件として前記複数の辞書ファ
    イルのそれぞれを前記辞書メモリの容量を超えないよう
    に単語セットを記憶し、且つ前記グループ化情報を基に
    前記辞書ファイルの数が最も少なくなるように前記辞書
    ファイルを構成することを特徴とする請求項2記載の大
    語彙音声認識装置。
JP6107335A 1994-05-23 1994-05-23 大語彙音声認識装置 Expired - Fee Related JP2833995B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6107335A JP2833995B2 (ja) 1994-05-23 1994-05-23 大語彙音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6107335A JP2833995B2 (ja) 1994-05-23 1994-05-23 大語彙音声認識装置

Publications (2)

Publication Number Publication Date
JPH07319494A true JPH07319494A (ja) 1995-12-08
JP2833995B2 JP2833995B2 (ja) 1998-12-09

Family

ID=14456450

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6107335A Expired - Fee Related JP2833995B2 (ja) 1994-05-23 1994-05-23 大語彙音声認識装置

Country Status (1)

Country Link
JP (1) JP2833995B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001282285A (ja) * 2000-03-31 2001-10-12 Matsushita Electric Ind Co Ltd 音声認識方法及び音声認識装置、並びにそれを用いた番組指定装置
JP2003504675A (ja) * 1999-07-08 2003-02-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 転送手段を有するスピーチ認識装置
JP2005128076A (ja) * 2003-10-21 2005-05-19 Ntt Docomo Inc 端末からの音声データを認識する音声認識システム及び方法
JP2009025753A (ja) * 2007-07-23 2009-02-05 Sony Corp 音声認識装置及び音声認識方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04160636A (ja) * 1990-10-25 1992-06-03 Mitsubishi Electric Corp 駆動情報のロード制御方式
JPH04291398A (ja) * 1991-03-20 1992-10-15 Hitachi Ltd 音声認識方式及び音声認識システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04160636A (ja) * 1990-10-25 1992-06-03 Mitsubishi Electric Corp 駆動情報のロード制御方式
JPH04291398A (ja) * 1991-03-20 1992-10-15 Hitachi Ltd 音声認識方式及び音声認識システム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003504675A (ja) * 1999-07-08 2003-02-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 転送手段を有するスピーチ認識装置
JP4659311B2 (ja) * 1999-07-08 2011-03-30 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー 転送手段を有するスピーチ認識装置
JP2001282285A (ja) * 2000-03-31 2001-10-12 Matsushita Electric Ind Co Ltd 音声認識方法及び音声認識装置、並びにそれを用いた番組指定装置
JP2005128076A (ja) * 2003-10-21 2005-05-19 Ntt Docomo Inc 端末からの音声データを認識する音声認識システム及び方法
JP2009025753A (ja) * 2007-07-23 2009-02-05 Sony Corp 音声認識装置及び音声認識方法

Also Published As

Publication number Publication date
JP2833995B2 (ja) 1998-12-09

Similar Documents

Publication Publication Date Title
US5692177A (en) Method and system for data set storage by iteratively searching for perfect hashing functions
JP2516305B2 (ja) 神経ネットワ―ク装置用拡張インタ―フェ―ス
US8463808B2 (en) Expanding concept types in conceptual graphs
JPH083798B2 (ja) メモリ割当て方法
JPH0634260B2 (ja) 単語辞書照合装置
CA2364886C (en) Pattern retrieving method, pattern retrieval apparatus, computer-readable storage medium storing pattern retrieval program, pattern retrieval system, and pattern retrieval program
Jones On the applied use of human memory models: The memory extender personal filing system
US3618027A (en) Associative memory system with reduced redundancy of stored information
WO2011067463A1 (en) Weight-ordered enumeration of referents and cutting off lengthy enumerations
US9087293B2 (en) Categorizing concept types of a conceptual graph
JPH07319494A (ja) 大語彙音声認識装置
JP3106994B2 (ja) 住所読み取り装置
US5634063A (en) Neural network and method for operating the same
JP6737117B2 (ja) 符号化データ検索プログラム、符号化データ検索方法および符号化データ検索装置
Schwartz et al. Unsupervised topic discovery
KR101089424B1 (ko) 트라이 구조를 이용한 문자열 저장 방법, 검색 방법, 삭제 방법 및 문자열 저장 장치
WO2016185849A1 (ja) 半導体装置及び情報書込/読出方法
EP1173852A1 (en) Memory with call out function
EP0468402B1 (en) Character string retrieving system and method
RAŚ Query answering based on distributed knowledge mining
JP7345897B2 (ja) データ保管装置、データ保管方法、及びデータ保管プログラム
JPH11353316A (ja) 省略語補完装置
Rao et al. A New Neural Network Architecture with Associative Memory, Pruning and Order-Sensitive Learning
Jones “As We May Think”?: 1Psychological Considerations in the Design of a Personal Filing System
JPS5833992B2 (ja) 情報検索装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980901

LAPS Cancellation because of no payment of annual fees