JPH0968998A - 音声認識方法及び音声認識装置 - Google Patents
音声認識方法及び音声認識装置Info
- Publication number
- JPH0968998A JPH0968998A JP7223281A JP22328195A JPH0968998A JP H0968998 A JPH0968998 A JP H0968998A JP 7223281 A JP7223281 A JP 7223281A JP 22328195 A JP22328195 A JP 22328195A JP H0968998 A JPH0968998 A JP H0968998A
- Authority
- JP
- Japan
- Prior art keywords
- word
- syllable
- recognized
- words
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
方法及び音声認識装置を提供することを目的とする。 【構成】 あらかじめ発声されるであろう最大語彙数の
単語を大語彙単語辞書部11に登録しておく。一文字キ
ー入力部14から認識させたい単語の音節を入力し、そ
の音節を用いてしぼり込み部13によって大語彙単語辞
書部11を逐次しぼり込み選択していく。しぼり込みの
途中、一度に認識可能な認識語彙数に達したかどうかを
現状表示部15によって外部に表示する。辞書が充分に
しぼり込まれたら、ユーザは認識させたい目的の言葉を
発声し、単語認識部12により認識され結果が出力され
る。
Description
彙検索に利用する音声認識方法に関するものである。
方法の性能として一度に認識可能な語彙数に限界があ
る。そのためユーザが音声認識システムに対して発声可
能な語彙数は、音声認識方法が認識可能な語彙数と同じ
かそれよりも少なくなるように、システム製作者が音声
認識システムを使用する目的により、語彙と語彙数をシ
ステム作成の際に決めている。そこで、ユーザが音声認
識システムに対して発声可能な語彙数を増やすための方
法として、ユーザが発声可能な語彙をいくつかの意味の
ある単語のカテゴリに分割した単語辞書を作成し、その
単語辞書を階層構造にする。ユーザの発声に従い上位の
階層から階層構造をたどり、階層が代るごとに認識辞書
を切り換えることにより従来の音声認識方法の語彙数以
上の語彙を扱ってきた。
ムで音声認識方法の限界語彙数を越えた大語彙を扱う技
術で、音声認識システムに対してユーザが発声可能な語
彙を、意味のある単語カテゴリに分割し階層構造を構築
するということは、音声認識システムを用いる目的によ
り、システム製作者が、語彙を予測し、全体の語彙を適
当に単語カテゴリに分割し、単語カテゴリ間の繋がりを
考え、階層構造を構築する作業である。しかし、ユーザ
の発声を完全に予想することができないので、システム
製作者にとって、語彙を最適に単語カテゴリに分け、そ
れを階層構造として構築するのは非常に困難であるとい
う課題を有している また、音声認識システムの語彙の単語カテゴリ分けやそ
の階層構造などは、システムを使用するユーザにとって
はわからないので、ユーザは、システムを使用中のある
時点で、階層構造のどこにいるのかそしてどの単語カテ
ゴリの語彙が発声可能なのかということがわからず、発
声すべき単語が何か予想がつかないので、ユーザが語彙
にある発声をしたとしても、単語カテゴリと階層構造を
持つ音声認識システムにとっては適切な発声にならず誤
認識になってしまうという課題を有する。
るもので、システム製作者には、語彙の単語カテゴリ分
けもその階層構造も必要のない単語辞書による音声認識
方法及び音声認識装置を提供し、また、ユーザに対して
は、発声可能な全ての語彙を常時発声することができ、
音声認識システムで従来の音声認識方法の語彙数の限界
を越えた大語彙を扱う音声認識方法及び音声認識装置を
提供ことを目的とする。
に本発明の音声認識方法及び音声認識装置は、ユーザが
音声認識装置に対して発声する語彙を、従来のように単
語カテゴリ分けしてそれを階層構造にするのではなく、
語頭から一音節ごとに順番に五十音順に並べた構造を持
つ大語彙単語辞書部を、一文字キー入力部に入力される
一文字入力を用いて、しぼり込み部が、単語認識部で認
識可能な語彙数に逐次しぼり込み、現状表示部によって
現在しぼり込まれている大語彙単語辞書の状態をユーザ
に知らせるという構成を有している。
の音声認識方法の語彙数の限界を越えた大語彙を扱うと
きに、音声認識装置のシステム製作者は、ユーザが発声
すると予想される語彙を最大限用意し、語頭から一音節
ごとに順番に五十音順に並べた単語辞書を作成すること
により、単語カテゴリ分けとその階層構造を作る必要が
なくなる。
に並べた構造を持つ大語彙単語辞書部を、一文字キー入
力部に認識させたい単語の語頭から一文字ずつ入力して
いき、現状表示部により、単語辞書が一度に認識可能な
語彙数までしぼり込まれたか確認して、単語を発声する
ことで、発声単語がどの単語カテゴリに所属しているか
ということにとらわれずに、従来の音声認識方法の語彙
数の限界を越えた大語彙を扱う音声認識装置を使用する
ことができる。
照しながら説明する。
おいて、11はユーザが発声すると予想される最大の語
彙が記憶されている大語彙単語辞書部、12は単語認識
を行う単語認識部、13は大語彙単語辞書部11を単語
認識部12で認識可能な語彙数にしぼり込むしぼり込み
部、14は認識させたい単語の語頭から一文字ずつ入力
してしぼり込み部におくる一文字キー入力部、15は大
語彙単語辞書11の現在の状況をユーザに知らせる現状
表示部である。
の動作について図2を用いて説明する。
させたい単語の音節を語頭から入力し(図2のステップ
(イ))、しぼり込み部13によって大語彙単語辞書1
1の単語の中から入力された音節と語頭が同一のものだ
けを選択することにより大語彙単語辞書11をしぼり込
む(ステップ(ロ))。現状表示部15でしぼり込まれ
ている辞書の現状、つまり単語認識部12で認識可能な
語彙数までしぼり込まれているか否かを確認し、認識可
能語彙数までしぼり込まれきれなかった場合は一文字キ
ー入力部14からさらに次の一文字を入力する(ステッ
プ(ハ))。これを単語認識部12により認識可能な語
彙数までしぼり込まれるまで続け、しぼり込まれた時点
で、ユーザが単語認識部12に対して単語を発声し(ス
テップ(ニ))、その発声が単語認識部12により認識
され(ステップ(ホ))、結果が出力される(ステップ
(ヘ))。こうのような動作により従来の音声認識方法
で認識可能な語彙数以上の大語彙単語の認識が可能とな
る。
大語彙単語辞書部11には、あらかじめユーザが発声す
ると予想される最大の語彙を登録しておく。この大語彙
単語辞書部11の構造の一例を図3に示す。図3に示す
ように、漢字表記、ひらがな表記及び単語認識部で用い
るその単語の標準パターンの組みなどを五十音順に並べ
る。この構造により、しぼり込み部13において一文字
入力のつど大語彙単語辞書部をしぼり込む。
す。図4において、マイクへのユーザの発声単語の入力
をAD変換部31でデジタル信号へ変換し、その信号に
対して音響分析部32において音響分析を行なう。その
分析結果から特徴パラメータ抽出部33によって音声を
特徴づける特徴パラメータへ変換する。照合部34にお
いてその入力音声の標準パターンと、あらかじめ図1の
しぼり込み部13によってしぼり込まれた大語彙単語辞
書部11の標準パターンを照合し、最も近い単語を認識
結果出力部35で認識結果として出力するものである。
す。図1の一文字キー入力部14から受け取る一文字に
より、図5の一文字入力によるしぼり込み部41が図1
の大語彙単語辞書部11の単語を順次しぼり込み選択し
ていく。また、図1の大語彙単語辞書部から選択された
のが選択辞書部42である。しぼり込み動作の結果、図
1の単語認識部12の認識可能語彙数に達したかどうか
という現在の状態を図1の現状表示部15に送る。
に示す。キーボード51による入力を、一文字入力とし
て図1のしぼり込み部13に送る。
す。図1のしぼり込み部13から受け取った図5の選択
辞書部42の現状を、図7の外部表示部61によりユー
ザに知らせる。図7に外部表示部の一例を示す。この外
部表示部61では、一度に認識可能な語彙数までしぼり
込みできたならば青を、さらにしぼり込みが必要なこと
をユーザに知らせる時には赤を点灯させるインタフェー
スを示している。
認識可能な語彙数以上の大語彙単語の認識が可能とな
る。
入力部14を図8に示す音節認識部に変更しても同様の
効果が得られる。
語の入力をAD変換部81でデジタル信号へ変換し、そ
の信号に対して音響分析部82において音響分析を行な
う。その分析結果から特徴パラメータ抽出部83によっ
て音声を特徴づける特徴パラメータへ変換する。照合部
84においてその入力音節の標準パターンと、あらかじ
め音節辞書部85に蓄えられている音節の特徴パラメー
タを照合し、最も近い音節を図1のしぼり込み部13に
おくるものである。
識装置に対して発声する単語を蓄え、また、従来の音声
認識方法で認識可能な語彙数にしぼり込むための構造を
持つ大語彙単語辞書部と、その大語彙単語辞書を一文字
入力によって逐次しぼり込むしぼり込み部と、発声単語
の語頭から音節をキーボードにより入力する一文字キー
入力部もしくは発声単語の語頭から順次発声された音節
を認識する音節認識部と、現在しぼり込まれている大語
彙単語辞書の状態をユーザに知らせる現状表示部と、従
来の音声認識方法で単語を認識する認単語認識部を構成
として、持つことにより、音声認識装置のシステム製作
者は、従来行われてきた単語カテゴリ分けとその階層構
造を作る必要がなくなり、また、音声認識装置のユーザ
は、発声単語がどの単語カテゴリに所属しているか予想
できないという従来の課題を解決し、優れた大語彙単語
の認識を行う音声認識方法及び音声認識装置を実現でき
るものである。
図
Claims (6)
- 【請求項1】 認識させたい単語の音節を語頭から1音
節ずつ入力し、1音節入力される毎に、入力された音節
を用いて複数の単語が記憶されている単語辞書の一部を
選択し、前記単語辞書の単語数を予め決められた認識可
能語彙数以下にしぼり込んだ後、前記認識させたい単語
を音声入力して単語認識を行う音声認識方法。 - 【請求項2】 キーボードを用いて、認識させたい単語
の音節を語頭から1音節ずつ入力する請求項1記載の音
声認識方法。 - 【請求項3】 音声により、認識させたい単語の音節を
語頭から1音節ずつ入力する請求項1記載の音声認識方
法。 - 【請求項4】 複数の単語が記憶されている大語彙単語
辞書部と、認識させたい単語の音節を語頭から1音節ず
つ入力する一文字入力部と、1音節入力される毎に前記
音節を用いて大語彙単語辞書部の一部を選択するしぼり
込み部と、前記しぼり込み部により選択された大語彙単
語辞書部の単語数が予め決められた認識可能語彙数以下
か否かを表示する現状表示部と、しぼり込まれた大語彙
単語辞書部の単語数が予め決められた認識可能語彙数以
下になることにより、前記認識させたい単語を音声入力
して認識する単語認識部を具備する音声認識装置。 - 【請求項5】 一文字入力部が、キーボードにより音節
を入力するものである請求項4記載の音声認識装置。 - 【請求項6】 一文字入力部が、音声により音節を入力
するものである請求項4記載の音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP22328195A JP3254977B2 (ja) | 1995-08-31 | 1995-08-31 | 音声認識方法及び音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP22328195A JP3254977B2 (ja) | 1995-08-31 | 1995-08-31 | 音声認識方法及び音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0968998A true JPH0968998A (ja) | 1997-03-11 |
JP3254977B2 JP3254977B2 (ja) | 2002-02-12 |
Family
ID=16795677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP22328195A Expired - Fee Related JP3254977B2 (ja) | 1995-08-31 | 1995-08-31 | 音声認識方法及び音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3254977B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11153999A (ja) * | 1997-11-19 | 1999-06-08 | Fujitsu Ltd | 音声認識装置及びそれを用いた情報処理装置 |
JP2003202872A (ja) * | 2001-12-28 | 2003-07-18 | Daiichikosho Co Ltd | 電子目次本機能付きカラオケリモコン装置 |
JP2005517216A (ja) * | 2002-02-07 | 2005-06-09 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 話されたおよび書かれたことばの高速かつパターン認識に支援された書き起こし方法および装置 |
JPWO2005076259A1 (ja) * | 2004-02-10 | 2007-10-18 | 日本電気株式会社 | 音声入力システム、音声入力方法、および、音声入力用プログラム |
JP2009515227A (ja) * | 2005-11-07 | 2009-04-09 | 韓國電子通信研究院 | 音声認識に基づくテキスト入力システムおよび方法 |
-
1995
- 1995-08-31 JP JP22328195A patent/JP3254977B2/ja not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11153999A (ja) * | 1997-11-19 | 1999-06-08 | Fujitsu Ltd | 音声認識装置及びそれを用いた情報処理装置 |
JP2003202872A (ja) * | 2001-12-28 | 2003-07-18 | Daiichikosho Co Ltd | 電子目次本機能付きカラオケリモコン装置 |
JP2005517216A (ja) * | 2002-02-07 | 2005-06-09 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 話されたおよび書かれたことばの高速かつパターン認識に支援された書き起こし方法および装置 |
JPWO2005076259A1 (ja) * | 2004-02-10 | 2007-10-18 | 日本電気株式会社 | 音声入力システム、音声入力方法、および、音声入力用プログラム |
JP4622861B2 (ja) * | 2004-02-10 | 2011-02-02 | 日本電気株式会社 | 音声入力システム、音声入力方法、および、音声入力用プログラム |
JP2009515227A (ja) * | 2005-11-07 | 2009-04-09 | 韓國電子通信研究院 | 音声認識に基づくテキスト入力システムおよび方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3254977B2 (ja) | 2002-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4181813A (en) | System and method for speech recognition | |
US4284846A (en) | System and method for sound recognition | |
JP4468264B2 (ja) | 多言語による名称の音声認識のための方法とシステム | |
JPS603699A (ja) | 適応性自動離散音声認識方法 | |
JP2815579B2 (ja) | 音声認識における単語候補削減装置 | |
CN109545197B (zh) | 语音指令的识别方法、装置和智能终端 | |
RU2466468C1 (ru) | Система и способ распознавания речи | |
JPS62239231A (ja) | 口唇画像入力による音声認識方法 | |
JPH10503033A (ja) | 新ワードのモデル化に基づく音声認識方法及びその装置 | |
JP2002116793A (ja) | データ入力システム及びその方法 | |
US8219386B2 (en) | Arabic poetry meter identification system and method | |
JPH0968998A (ja) | 音声認識方法及び音声認識装置 | |
KR19980076309A (ko) | 음성인식 방법 및 그 장치 | |
JP2000020089A (ja) | 音声認識方法及びその装置、並びに音声制御システム | |
JP4230142B2 (ja) | 悪環境下でのキーパッド/音声を用いたハイブリッドな東洋文字認識技術 | |
JP4094255B2 (ja) | コマンド入力機能つきディクテーション装置 | |
JP5596869B2 (ja) | 音声認識装置 | |
JPH0338699A (ja) | 音声認識装置 | |
JPS6211731B2 (ja) | ||
JPH10116093A (ja) | 音声認識装置 | |
JP3808732B2 (ja) | 音声認識方法及びそのシステム | |
JPH10198393A (ja) | 会話記録装置 | |
JP2002189490A (ja) | ピンイン音声入力の方法 | |
JPH05197390A (ja) | 音声認識装置 | |
JPH04271397A (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071130 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081130 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091130 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091130 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101130 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111130 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |