JPH0968998A - 音声認識方法及び音声認識装置 - Google Patents

音声認識方法及び音声認識装置

Info

Publication number
JPH0968998A
JPH0968998A JP7223281A JP22328195A JPH0968998A JP H0968998 A JPH0968998 A JP H0968998A JP 7223281 A JP7223281 A JP 7223281A JP 22328195 A JP22328195 A JP 22328195A JP H0968998 A JPH0968998 A JP H0968998A
Authority
JP
Japan
Prior art keywords
word
syllable
recognized
words
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7223281A
Other languages
English (en)
Other versions
JP3254977B2 (ja
Inventor
Tomohiro Konuma
知浩 小沼
Masakatsu Hoshimi
昌克 星見
Seiji Hiraoka
省二 平岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP22328195A priority Critical patent/JP3254977B2/ja
Publication of JPH0968998A publication Critical patent/JPH0968998A/ja
Application granted granted Critical
Publication of JP3254977B2 publication Critical patent/JP3254977B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 本発明は、大語彙単語の認識を行う音声認識
方法及び音声認識装置を提供することを目的とする。 【構成】 あらかじめ発声されるであろう最大語彙数の
単語を大語彙単語辞書部11に登録しておく。一文字キ
ー入力部14から認識させたい単語の音節を入力し、そ
の音節を用いてしぼり込み部13によって大語彙単語辞
書部11を逐次しぼり込み選択していく。しぼり込みの
途中、一度に認識可能な認識語彙数に達したかどうかを
現状表示部15によって外部に表示する。辞書が充分に
しぼり込まれたら、ユーザは認識させたい目的の言葉を
発声し、単語認識部12により認識され結果が出力され
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、データ検索などの大語
彙検索に利用する音声認識方法に関するものである。
【0002】
【従来の技術】従来の音声認識システムでは、音声認識
方法の性能として一度に認識可能な語彙数に限界があ
る。そのためユーザが音声認識システムに対して発声可
能な語彙数は、音声認識方法が認識可能な語彙数と同じ
かそれよりも少なくなるように、システム製作者が音声
認識システムを使用する目的により、語彙と語彙数をシ
ステム作成の際に決めている。そこで、ユーザが音声認
識システムに対して発声可能な語彙数を増やすための方
法として、ユーザが発声可能な語彙をいくつかの意味の
ある単語のカテゴリに分割した単語辞書を作成し、その
単語辞書を階層構造にする。ユーザの発声に従い上位の
階層から階層構造をたどり、階層が代るごとに認識辞書
を切り換えることにより従来の音声認識方法の語彙数以
上の語彙を扱ってきた。
【0003】
【発明が解決しようとする課題】従来の音声認識システ
ムで音声認識方法の限界語彙数を越えた大語彙を扱う技
術で、音声認識システムに対してユーザが発声可能な語
彙を、意味のある単語カテゴリに分割し階層構造を構築
するということは、音声認識システムを用いる目的によ
り、システム製作者が、語彙を予測し、全体の語彙を適
当に単語カテゴリに分割し、単語カテゴリ間の繋がりを
考え、階層構造を構築する作業である。しかし、ユーザ
の発声を完全に予想することができないので、システム
製作者にとって、語彙を最適に単語カテゴリに分け、そ
れを階層構造として構築するのは非常に困難であるとい
う課題を有している また、音声認識システムの語彙の単語カテゴリ分けやそ
の階層構造などは、システムを使用するユーザにとって
はわからないので、ユーザは、システムを使用中のある
時点で、階層構造のどこにいるのかそしてどの単語カテ
ゴリの語彙が発声可能なのかということがわからず、発
声すべき単語が何か予想がつかないので、ユーザが語彙
にある発声をしたとしても、単語カテゴリと階層構造を
持つ音声認識システムにとっては適切な発声にならず誤
認識になってしまうという課題を有する。
【0004】本発明は、この2つの課題を同時に解決す
るもので、システム製作者には、語彙の単語カテゴリ分
けもその階層構造も必要のない単語辞書による音声認識
方法及び音声認識装置を提供し、また、ユーザに対して
は、発声可能な全ての語彙を常時発声することができ、
音声認識システムで従来の音声認識方法の語彙数の限界
を越えた大語彙を扱う音声認識方法及び音声認識装置を
提供ことを目的とする。
【0005】
【課題を解決するための手段】上記目的を達成するため
に本発明の音声認識方法及び音声認識装置は、ユーザが
音声認識装置に対して発声する語彙を、従来のように単
語カテゴリ分けしてそれを階層構造にするのではなく、
語頭から一音節ごとに順番に五十音順に並べた構造を持
つ大語彙単語辞書部を、一文字キー入力部に入力される
一文字入力を用いて、しぼり込み部が、単語認識部で認
識可能な語彙数に逐次しぼり込み、現状表示部によって
現在しぼり込まれている大語彙単語辞書の状態をユーザ
に知らせるという構成を有している。
【0006】
【作用】本発明は上記構成により、音声認識装置で従来
の音声認識方法の語彙数の限界を越えた大語彙を扱うと
きに、音声認識装置のシステム製作者は、ユーザが発声
すると予想される語彙を最大限用意し、語頭から一音節
ごとに順番に五十音順に並べた単語辞書を作成すること
により、単語カテゴリ分けとその階層構造を作る必要が
なくなる。
【0007】また、音声認識装置のユーザは、五十音順
に並べた構造を持つ大語彙単語辞書部を、一文字キー入
力部に認識させたい単語の語頭から一文字ずつ入力して
いき、現状表示部により、単語辞書が一度に認識可能な
語彙数までしぼり込まれたか確認して、単語を発声する
ことで、発声単語がどの単語カテゴリに所属しているか
ということにとらわれずに、従来の音声認識方法の語彙
数の限界を越えた大語彙を扱う音声認識装置を使用する
ことができる。
【0008】
【実施例】以下、本発明の一実施例について、図面を参
照しながら説明する。
【0009】図1は、本実施例の構成図である。図1に
おいて、11はユーザが発声すると予想される最大の語
彙が記憶されている大語彙単語辞書部、12は単語認識
を行う単語認識部、13は大語彙単語辞書部11を単語
認識部12で認識可能な語彙数にしぼり込むしぼり込み
部、14は認識させたい単語の語頭から一文字ずつ入力
してしぼり込み部におくる一文字キー入力部、15は大
語彙単語辞書11の現在の状況をユーザに知らせる現状
表示部である。
【0010】以上のような図1の構成において、以下そ
の動作について図2を用いて説明する。
【0011】ユーザは、一文字キー入力部14から認識
させたい単語の音節を語頭から入力し(図2のステップ
(イ))、しぼり込み部13によって大語彙単語辞書1
1の単語の中から入力された音節と語頭が同一のものだ
けを選択することにより大語彙単語辞書11をしぼり込
む(ステップ(ロ))。現状表示部15でしぼり込まれ
ている辞書の現状、つまり単語認識部12で認識可能な
語彙数までしぼり込まれているか否かを確認し、認識可
能語彙数までしぼり込まれきれなかった場合は一文字キ
ー入力部14からさらに次の一文字を入力する(ステッ
プ(ハ))。これを単語認識部12により認識可能な語
彙数までしぼり込まれるまで続け、しぼり込まれた時点
で、ユーザが単語認識部12に対して単語を発声し(ス
テップ(ニ))、その発声が単語認識部12により認識
され(ステップ(ホ))、結果が出力される(ステップ
(ヘ))。こうのような動作により従来の音声認識方法
で認識可能な語彙数以上の大語彙単語の認識が可能とな
る。
【0012】次に各構成要素について詳細に説明する。
大語彙単語辞書部11には、あらかじめユーザが発声す
ると予想される最大の語彙を登録しておく。この大語彙
単語辞書部11の構造の一例を図3に示す。図3に示す
ように、漢字表記、ひらがな表記及び単語認識部で用い
るその単語の標準パターンの組みなどを五十音順に並べ
る。この構造により、しぼり込み部13において一文字
入力のつど大語彙単語辞書部をしぼり込む。
【0013】単語認識部12の構成の一例を図4に示
す。図4において、マイクへのユーザの発声単語の入力
をAD変換部31でデジタル信号へ変換し、その信号に
対して音響分析部32において音響分析を行なう。その
分析結果から特徴パラメータ抽出部33によって音声を
特徴づける特徴パラメータへ変換する。照合部34にお
いてその入力音声の標準パターンと、あらかじめ図1の
しぼり込み部13によってしぼり込まれた大語彙単語辞
書部11の標準パターンを照合し、最も近い単語を認識
結果出力部35で認識結果として出力するものである。
【0014】しぼり込み部13の構成の一例を図5に示
す。図1の一文字キー入力部14から受け取る一文字に
より、図5の一文字入力によるしぼり込み部41が図1
の大語彙単語辞書部11の単語を順次しぼり込み選択し
ていく。また、図1の大語彙単語辞書部から選択された
のが選択辞書部42である。しぼり込み動作の結果、図
1の単語認識部12の認識可能語彙数に達したかどうか
という現在の状態を図1の現状表示部15に送る。
【0015】一文字キー入力部14の構成の一例を図6
に示す。キーボード51による入力を、一文字入力とし
て図1のしぼり込み部13に送る。
【0016】現状表示部15の構成の一例を図7に示
す。図1のしぼり込み部13から受け取った図5の選択
辞書部42の現状を、図7の外部表示部61によりユー
ザに知らせる。図7に外部表示部の一例を示す。この外
部表示部61では、一度に認識可能な語彙数までしぼり
込みできたならば青を、さらにしぼり込みが必要なこと
をユーザに知らせる時には赤を点灯させるインタフェー
スを示している。
【0017】これらの構成により従来の音声認識方法で
認識可能な語彙数以上の大語彙単語の認識が可能とな
る。
【0018】なお、本実施例の構成において一文字キー
入力部14を図8に示す音節認識部に変更しても同様の
効果が得られる。
【0019】図8において、マイクへのユーザの発声単
語の入力をAD変換部81でデジタル信号へ変換し、そ
の信号に対して音響分析部82において音響分析を行な
う。その分析結果から特徴パラメータ抽出部83によっ
て音声を特徴づける特徴パラメータへ変換する。照合部
84においてその入力音節の標準パターンと、あらかじ
め音節辞書部85に蓄えられている音節の特徴パラメー
タを照合し、最も近い音節を図1のしぼり込み部13に
おくるものである。
【0020】
【発明の効果】以上のように本発明は、ユーザが音声認
識装置に対して発声する単語を蓄え、また、従来の音声
認識方法で認識可能な語彙数にしぼり込むための構造を
持つ大語彙単語辞書部と、その大語彙単語辞書を一文字
入力によって逐次しぼり込むしぼり込み部と、発声単語
の語頭から音節をキーボードにより入力する一文字キー
入力部もしくは発声単語の語頭から順次発声された音節
を認識する音節認識部と、現在しぼり込まれている大語
彙単語辞書の状態をユーザに知らせる現状表示部と、従
来の音声認識方法で単語を認識する認単語認識部を構成
として、持つことにより、音声認識装置のシステム製作
者は、従来行われてきた単語カテゴリ分けとその階層構
造を作る必要がなくなり、また、音声認識装置のユーザ
は、発声単語がどの単語カテゴリに所属しているか予想
できないという従来の課題を解決し、優れた大語彙単語
の認識を行う音声認識方法及び音声認識装置を実現でき
るものである。
【図面の簡単な説明】
【図1】本発明の一実施例における音声認識装置の構成
【図2】同実施例におけるの処理の流れ図
【図3】同実施例における大語彙単語辞書部の構造図
【図4】同実施例における単語認識部の構成図
【図5】同実施例におけるしぼり込み部の構成図
【図6】同実施例における一文字キー入力部の構成図
【図7】同実施例における現状表示部の構成図
【図8】同実施例における音節認識部の構成図
【符号の説明】
11 大語彙単語辞書部 12 単語認識部 13 しぼり込み部 14 一文字キー入力部 15 現状表示部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 認識させたい単語の音節を語頭から1音
    節ずつ入力し、1音節入力される毎に、入力された音節
    を用いて複数の単語が記憶されている単語辞書の一部を
    選択し、前記単語辞書の単語数を予め決められた認識可
    能語彙数以下にしぼり込んだ後、前記認識させたい単語
    を音声入力して単語認識を行う音声認識方法。
  2. 【請求項2】 キーボードを用いて、認識させたい単語
    の音節を語頭から1音節ずつ入力する請求項1記載の音
    声認識方法。
  3. 【請求項3】 音声により、認識させたい単語の音節を
    語頭から1音節ずつ入力する請求項1記載の音声認識方
    法。
  4. 【請求項4】 複数の単語が記憶されている大語彙単語
    辞書部と、認識させたい単語の音節を語頭から1音節ず
    つ入力する一文字入力部と、1音節入力される毎に前記
    音節を用いて大語彙単語辞書部の一部を選択するしぼり
    込み部と、前記しぼり込み部により選択された大語彙単
    語辞書部の単語数が予め決められた認識可能語彙数以下
    か否かを表示する現状表示部と、しぼり込まれた大語彙
    単語辞書部の単語数が予め決められた認識可能語彙数以
    下になることにより、前記認識させたい単語を音声入力
    して認識する単語認識部を具備する音声認識装置。
  5. 【請求項5】 一文字入力部が、キーボードにより音節
    を入力するものである請求項4記載の音声認識装置。
  6. 【請求項6】 一文字入力部が、音声により音節を入力
    するものである請求項4記載の音声認識装置。
JP22328195A 1995-08-31 1995-08-31 音声認識方法及び音声認識装置 Expired - Fee Related JP3254977B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP22328195A JP3254977B2 (ja) 1995-08-31 1995-08-31 音声認識方法及び音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22328195A JP3254977B2 (ja) 1995-08-31 1995-08-31 音声認識方法及び音声認識装置

Publications (2)

Publication Number Publication Date
JPH0968998A true JPH0968998A (ja) 1997-03-11
JP3254977B2 JP3254977B2 (ja) 2002-02-12

Family

ID=16795677

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22328195A Expired - Fee Related JP3254977B2 (ja) 1995-08-31 1995-08-31 音声認識方法及び音声認識装置

Country Status (1)

Country Link
JP (1) JP3254977B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11153999A (ja) * 1997-11-19 1999-06-08 Fujitsu Ltd 音声認識装置及びそれを用いた情報処理装置
JP2003202872A (ja) * 2001-12-28 2003-07-18 Daiichikosho Co Ltd 電子目次本機能付きカラオケリモコン装置
JP2005517216A (ja) * 2002-02-07 2005-06-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 話されたおよび書かれたことばの高速かつパターン認識に支援された書き起こし方法および装置
JPWO2005076259A1 (ja) * 2004-02-10 2007-10-18 日本電気株式会社 音声入力システム、音声入力方法、および、音声入力用プログラム
JP2009515227A (ja) * 2005-11-07 2009-04-09 韓國電子通信研究院 音声認識に基づくテキスト入力システムおよび方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11153999A (ja) * 1997-11-19 1999-06-08 Fujitsu Ltd 音声認識装置及びそれを用いた情報処理装置
JP2003202872A (ja) * 2001-12-28 2003-07-18 Daiichikosho Co Ltd 電子目次本機能付きカラオケリモコン装置
JP2005517216A (ja) * 2002-02-07 2005-06-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 話されたおよび書かれたことばの高速かつパターン認識に支援された書き起こし方法および装置
JPWO2005076259A1 (ja) * 2004-02-10 2007-10-18 日本電気株式会社 音声入力システム、音声入力方法、および、音声入力用プログラム
JP4622861B2 (ja) * 2004-02-10 2011-02-02 日本電気株式会社 音声入力システム、音声入力方法、および、音声入力用プログラム
JP2009515227A (ja) * 2005-11-07 2009-04-09 韓國電子通信研究院 音声認識に基づくテキスト入力システムおよび方法

Also Published As

Publication number Publication date
JP3254977B2 (ja) 2002-02-12

Similar Documents

Publication Publication Date Title
US4181813A (en) System and method for speech recognition
US4284846A (en) System and method for sound recognition
JP4468264B2 (ja) 多言語による名称の音声認識のための方法とシステム
JPS603699A (ja) 適応性自動離散音声認識方法
JP2815579B2 (ja) 音声認識における単語候補削減装置
CN109545197B (zh) 语音指令的识别方法、装置和智能终端
RU2466468C1 (ru) Система и способ распознавания речи
JPS62239231A (ja) 口唇画像入力による音声認識方法
JPH10503033A (ja) 新ワードのモデル化に基づく音声認識方法及びその装置
JP2002116793A (ja) データ入力システム及びその方法
US8219386B2 (en) Arabic poetry meter identification system and method
JPH0968998A (ja) 音声認識方法及び音声認識装置
KR19980076309A (ko) 음성인식 방법 및 그 장치
JP2000020089A (ja) 音声認識方法及びその装置、並びに音声制御システム
JP4230142B2 (ja) 悪環境下でのキーパッド/音声を用いたハイブリッドな東洋文字認識技術
JP4094255B2 (ja) コマンド入力機能つきディクテーション装置
JP5596869B2 (ja) 音声認識装置
JPH0338699A (ja) 音声認識装置
JPS6211731B2 (ja)
JPH10116093A (ja) 音声認識装置
JP3808732B2 (ja) 音声認識方法及びそのシステム
JPH10198393A (ja) 会話記録装置
JP2002189490A (ja) ピンイン音声入力の方法
JPH05197390A (ja) 音声認識装置
JPH04271397A (ja) 音声認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071130

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081130

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091130

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091130

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101130

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111130

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees