JPH11259085A - 音声認識装置及び認識結果提示方法 - Google Patents

音声認識装置及び認識結果提示方法

Info

Publication number
JPH11259085A
JPH11259085A JP10062621A JP6262198A JPH11259085A JP H11259085 A JPH11259085 A JP H11259085A JP 10062621 A JP10062621 A JP 10062621A JP 6262198 A JP6262198 A JP 6262198A JP H11259085 A JPH11259085 A JP H11259085A
Authority
JP
Japan
Prior art keywords
information
concept
recognition result
utterance content
importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10062621A
Other languages
English (en)
Inventor
Yasuyuki Masai
康之 正井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10062621A priority Critical patent/JPH11259085A/ja
Publication of JPH11259085A publication Critical patent/JPH11259085A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】認識結果を発話内容の伝達に不可欠なものと補
助的なものに分割し、補助的な情報については表現方法
を抽象化することにより、不可欠ではない情報を正しく
入力するための利用者の負担を大幅に低減する。 【解決手段】利用者の発声した音声を音声認識部12に
て認識し、その認識された発話内容により情報種別分離
部13が認識対象文法記憶部14内の重用度テーブル1
40を参照し、当該テーブル140に登録されている重
要度情報に応じて、上記認識された発話内容を表現上不
可欠な情報と補助的な情報とに分離する。概念変換部1
5は、補助的情報に分離された発話内容部分により概念
変換規則記憶部16内の概念変換テーブル160を参照
して概念情報に変換する。認識結果出力部17は、不可
欠情報に分離された発話内容部分と上記変換された概念
情報とを認識結果として提示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声を認識して、
認識結果を効果的に表現して利用者に提示するのに好適
な音声認識装置及び認識結果提示方法に関する。
【0002】
【従来の技術】利用者が発声した音声を認識する音声認
識装置では、利用者の声質や発話内容、あるいは利用環
境によっては、入力音声を正しく認識できない場合があ
る。従来の音声認識装置において、認識結果が発話内容
と異なっている場合には、利用者が再発声したり、音声
以外の別の入力手段を利用して正しく入力することが、
一般に行われていた。
【0003】
【発明が解決しようとする課題】上記したように従来の
音声認識装置では、利用者の発声した音声を(利用者の
声質や発話内容、あるいは利用環境によって)正しく認
識できない場合、利用者は再発声したり、音声以外の別
の入力手段を利用して正しく入力する必要があった。
【0004】確かに、発話内容の伝達において必要不可
欠な情報については、再度発声したり、音声以外の別の
入力手段を利用して正しく入力することは必要である。
しかし、発話内容を表現するための補助的な情報を表現
する言葉については、必ずしも正しく認識する必要がな
い場合がある。
【0005】ところが従来の音声認識装置では、発話内
容の伝達において必要不可欠な情報と、発話内容を表現
するための補助的な情報とは何ら区別されておらず、共
に発話内容の一部として全く同等に扱われていた。つま
り従来の音声認識装置では、補助的な情報が正しく認識
できなかった場合でも、必要不可欠な情報が正しく認識
できなかった場合と同様に、その認識できなかった情報
(補助的な情報)を正しく入力するために、再度発声し
たり、音声以外の別の入力手段を利用して入力しなけれ
ばならず、使い勝手の点からみると非常に不便なインタ
フェースとなっていた。
【0006】本発明は上記事情を考慮してなされたもの
でその目的は、認識結果を発話内容の伝達に不可欠なも
のと補助的なものに分割し、補助的な情報については表
現方法を抽象化することにより、不可欠ではない情報を
正しく入力するための利用者の負担を大幅に低減するこ
とができる音声認識装置を提供することにある。
【0007】
【課題を解決するための手段】本発明は、発声された音
声を認識する認識手段と、各種キーワードについて、そ
のキーワードが表現上不可欠な情報であるか補助的な情
報であるかの重要度を示す重要度情報が登録された重要
度情報記憶手段と、認識された発話内容により重要度情
報記憶手段を参照し、当該記憶手段に登録されている重
要度情報に応じて、認識された発話内容を表現上不可欠
な情報と補助的な情報とに分離する情報種別分離手段
と、補助的情報となり得る各種キーワードについて、そ
の情報の概念を表す概念情報が登録された概念変換規則
記憶手段と、上記補助的情報に分離された発話内容部分
により概念変換規則記憶手段を参照し、当該発話内容部
分を概念情報に変換する概念変換手段と、上記不可欠情
報に分離された発話内容部分と上記変換された概念情報
とを認識結果として提示する認識結果出力手段とを備え
たことを特徴とする。
【0008】このような構成においては、認識された発
話内容が、重要度情報記憶手段に登録されている重要度
情報に基づいて、表現上不可欠な情報と補助的な情報と
に分離され、更に補助的な情報に分離された発話内容部
分は概念変換規則記憶手段の登録情報に基づいて、その
内容部分を抽象化した概念情報に変換される、そして、
不可欠情報に分離された発話内容部分と変換された概念
情報とが認識結果として提示される。
【0009】このように、音声認識した結果を利用者に
提示する場合に、表現上不可欠な情報と補助的な情報と
に分離し、補助的な情報に関しては、認識結果をそのま
ま提示するのではなく、発話内容を抽象化した概念情報
として利用者に提示することにより、認識誤りの頻度を
少なくして、誤りの訂正に必要な手間の少ない、効率の
良いインタフェース機能を有する音声認識装置を実現で
きる。ここで抽象化した概念情報には、対応する概念を
表すマーク、つまりアイコンや、概念を表す文字列(言
葉)を適用するとよい。なお、重要度情報記憶手段への
情報登録が利用者から行えるような構成とするならば、
認識された発話内容を利用者の意図した通りに分離する
ことが可能となる。
【0010】また本発明は、利用者操作による認識結果
中の概念情報の選択指定が可能な構成とし、概念情報が
選択指定された場合には、当該概念情報のもとになった
認識された候補の一覧を提示することをも特徴とする。
ここで、利用者操作による候補一覧からの任意の候補の
選択指定も可能な構成し、任意の候補が選択指定された
場合には当該候補を概念情報に代えて提示するとよい。
【0011】このような構成においては、概念表現され
た元の照合結果を確認することができるため、通常は補
助情報として扱われる概念に関する具体的な情報が必要
な場合にも、容易に対応することができる。
【0012】また本発明は、利用者操作による認識結果
中の概念情報の選択指定が可能な構成とし、概念情報が
選択指定された場合には、当該概念情報に対応する具体
例の一覧を提示することをも特徴とする。ここで、利用
者操作による具体例一覧からの任意の具体例の選択指定
も可能な構成し、任意の具体例が選択指定された場合に
は当該具体例を概念情報に代えて提示するとよい。
【0013】このような構成においては、概念表現を具
体例で確認できることから、概念表現の意味を利用者は
容易に知ることができる。なお、概念と具体例との対応
関係を利用者から登録設定可能な構成とするならば、同
じ概念であっても、それに対応する具体例を利用者毎に
設定することができる。
【0014】また本発明は、不可欠情報に分離された発
話内容部分のみを認識結果として提示し、補助的情報に
分離された発話内容部分は提示対象外とすることが可能
な構成としたことをも特徴とする。
【0015】このように、補助情報について何も利用者
に提示しないことによって、認識結果提示処理が簡略化
でき、必要不可欠な情報のみが利用者に提示されるの
で、利用者にとって分かりやすいインタフェースを提供
可能となる。
【0016】また本発明は、補助的な情報に分離された
発話内容部分から変換可能な概念情報を複数用意し、そ
のうちの1つが不可欠情報に分離された発話内容部分に
応じて選択的に提示される構成とすることをも特徴とす
る。このように、不可欠情報に応じて異なる概念に変換
可能な構成とすることにより、補助情報を概念に変換し
ても、適切な概念に変換することが可能となる。
【0017】
【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。 [第1の実施形態]図1は本発明の第1の実施形態に係
る音声認識装置のブロック構成図である。
【0018】同図において、音声入力部11は、利用者
が発声した音声をマイクロホンで電気信号(音声信号)
に変換し、増幅処理などを施して適切なレベルに調整し
た後、A/D(アナログ/ディジタル)変換器でディジ
タル信号に変換する。
【0019】音声認識部12は、音声入力部11でディ
ジタル信号に変換された音声信号の特徴を抽出して入力
音声を認識し、その認識結果(利用者の発話内容)をコ
ード化する。
【0020】図2に音声認識部12の詳細構成を示す。
同図において、音響分析部121は、入力された音声信
号を特徴パラメータの系列に変換する。音声認識に使用
される代表的な特徴パラメータとしては、バンドパスフ
ィルタやフーリェ変換によって求めることができるパワ
ースペクトルやLPC(線形予測)分析によって求めた
ケプストラム係数などが知られているが、ここではその
特徴パラメータの種類は問わない。
【0021】音響分析部121は求めた特徴パラメータ
系列をモデル照合部122に出力する。モデル照合部1
22は、予め作成して音声モデル記憶部123に記憶し
ておいた認識対象音声の各音声モデルと特徴パラメータ
系列の類似度あるいは距離を求める演算を行う。モデル
照合部122の照合方法としては、音声モデルも特徴パ
ラメータ系列で表現しておき、DP(動的計画)法で音
声モデルの特徴パラメータ系列と入力音声の特徴パラメ
ータ系列の距離を求める手法や、HMM(隠れマルコフ
モデル)を用いて統計的に音声モデルを表現しておき、
入力音声の特徴パラメータ系列が入力されたときの各音
声モデルの確率を計算する手法などが広く使用されてい
るが、特に手法は間わない。
【0022】照合結果出力部124は、モデル照合部1
22での入力音声の照合結果、つまり認識された発話内
容の各認識候補をコード化して出力する。ここで出力の
対象となる認識候補として、一定の閾値を越える類似度
あるいは一定の閾値を下回る距離となる候補に限定する
とか、上位の一定個数の候補に限定するとよい。なお以
下の説明では、第1位の認識候補列を照合結果と呼ぶこ
ともある。
【0023】再び図1を参照すると、情報種別分離部1
3は、音声認識部12での認識結果であるコード化され
た発話内容を、発話内容を表現するために不可欠(必要
不可欠)な情報と、補助的な情報(補助情報)とに分離
する。この情報種別分離部13による情報分離に必要な
情報は、認識対象文法記憶部14内に重用度テーブル1
40として予め記憶されている。
【0024】重用度テーブル140の一例を図3に示
す。図3から明らかなように、重用度テーブル140の
各エントリは、音声認識部12で認識され得る種々の用
語(キーワード)の項目と、その用語が発話内容を表現
するのに不可欠な情報であるか、あるいは補助的な情報
(補助情報)であるかを識別するための重用度情報の項
目とからなる。
【0025】そこで情報種別分離部13は、音声認識部
12で認識された発話内容を構成する各用語(発話内容
部分)毎に認識対象文法記憶部14内の重用度テーブル
140を検索し、その用語の重要度に応じて、不可欠情
報であるか、あるいは補助情報であるかを識別すること
で、上記認識された発話内容(を構成する各用語)を不
可欠情報と補助情報とに分離(分類)する。
【0026】概念変換部15は、情報種別分離部13で
分離された情報のうち、補助情報として分離された情報
を、その情報の概念を表現する抽象的な情報に変換す
る。この概念変換部15による情報変換に必要な情報
(概念変換規則)は、概念変換規則記憶部16内に概念
変換テーブル160として予め記憶されている。
【0027】概念変換テーブル160の一例を図4に示
す。図4から明らかなように、概念変換テーブル160
の各エントリは、重用度テーブル140に補助情報とし
て登録されている各用語(キーワード)の項目と、その
用語の概念を表現する抽象的な情報(概念情報)の項目
とからなる。
【0028】そこで概念変換部15は、情報種別分離部
13で補助情報として分離された情報により概念変換規
則記憶部16内の概念変換テーブル160を参照し、そ
の情報に定義された概念情報に変換する。
【0029】認識結果出力部17は、情報種別分離部1
3で不可欠情報として分離された情報と、情報種別分離
部13で補助情報として分離されて概念変換部15で概
念情報に変換された情報とを組み合わせ、表示や音声な
どのデバイスを利用して、特に後者の情報については対
応する概念を表す抽象的な表現で、利用者に入力音声の
認識結果を提示する。
【0030】次に、図1の構成の音声認識装置の動作に
ついて、電子的なスケジュール帳への音声によるスケジ
ュール入力を例に、図5のフローチャートを適宜参照し
て説明する。
【0031】スケジュールの入力に不可欠な情報は日時
と用件の2つであり、補助的な情報は相手に関する情報
とする。利用者が「25日1時から田中さんと会議」と
発声し、音声認識部11の照合結果も「25日1時から
田中さんと会議」になったとする。
【0032】情報種別分離部13は、図3に示した(認
識対象文法記憶部14内の)重要度テーブル140を検
索して、音声認識部11の照合結果(発話内容)「25
日1時から田中さんと会議」について、「25日1時か
ら」→不可欠情報(日時)、「田中さんと」→補助情報
(相手)、「会議」→不可欠情報(用件)、のように不
可欠情報と補助情報とに分離する(ステップS1)。
【0033】なお、図3の重要度テーブル140の例で
は、説明を容易にするために、「25日1時から」、
「25日2時から」等の具体的な日時の情報や、「田中
さんと」、「佐藤さんと」等の相手の名前(姓)の情報
をキーワードとしているが、「日時+から」や、「名
前」または「名前+さんと」等をキーワードとする方が
汎用性に富み、またテーブル容量も少なくて済む。この
場合、認識された発話内容に「25日1時から」等が含
まれている場合には、それを「日時+から」からなる日
時情報であると判断し、「田中さんと」等が含まれてい
る場合には、それを「名前+さんと」からなる相手情報
であると判断する文章解析機能を備える必要がある。
【0034】情報種別分離部13での、音声認識部11
の照合結果(発話内容)に対する情報分離結果は概念変
換部15に渡される。概念変換部15は、情報種別分離
部13での情報分離結果のうち、補助情報として分離さ
れた「田中さんと」(相手情報)により図4に示した
(概念変換規則記憶部16内の)概念変換テーブル16
0を参照し、当該補助情報「田中さんと」を「相手」と
いう概念情報に変換する(ステップS2)。
【0035】概念変換部15での補助情報「田中さん
と」に対する「相手」という概念情報への変換結果は、
情報種別分離部13で不可欠情報として分離された「2
5日1時から」(日時)、及び「会議」(用件)と共に
認識結果出力部17に渡される。これを受けて認識結果
出力部17は、「25日1時から」と「会議」という2
つの必要不可欠な情報と、「相手」という概念に変換さ
れた情報とを、それぞれ区別して利用者に提示する(ス
テップS4)。
【0036】提示方法としては、例えば図6の認識結果
表示例に示すように、スケジュール帳の25日の欄に1
時と表示する(つまり不可欠情報の1つである日時を表
示する)と共に、その25日1時の項目に、「相手」と
いう概念を表現した人の形のアイコン(概念アイコン)
60を表示して、当該アイコン60の脇に「会議」と表
示する(つまり不可欠情報の1つである用件を表示す
る)方法などが適用可能である。
【0037】次に、利用者が「25日1時から田中さん
と会議」と発声したにも拘らず、音声認識部12の照合
結果は、「25日1時から佐藤さんと会議」であった場
合を考える。従来の音声認識装置では、「佐藤さんと」
という認識結果が直接提示されるので、利用者は「25
日1時から田中さんと会議」を再発声するか、あるいは
音声以外の入力手段を利用して「佐藤」を「田中」に修
正する必要があった。
【0038】しかし、本実施形態の音声認識装置におい
ては、音声認識部12の照合結果が「25日1時から佐
藤さんと会議」であったとしても、「佐藤さんと」は、
先の「田中さんと」の場合と同様に、「佐藤さんと」→
補助情報→概念情報「相手」のように変換されて、認識
結果は図6に示したように出力されるので、利用者は認
識結果を訂正する必要はない。また、「田中さんと」と
いう発声を全く認識できなかったとしても、スケジュー
ル帳の入力に必要な、日時と用件の項目は入力済みなの
で、図6のような認識結果の出力が可能となる。
【0039】このように本実施形態においては、音声認
識した結果を利用者への伝達に不可欠な情報と補助的な
情報に分離して、補助的な情報(補助情報)は概念化
(抽象化)することにより、補助情報の入力に手間をか
けることなく、必要十分な情報を効率的に入力すること
ができる音声認識装置を実現することができる。
【0040】また、概念変換テーブル160の概念の項
目に登録する情報として、結果として出力しないこと
(出力対象外とすること)を示すキーワード情報、例え
ばNULLという記号(NULLコード)を定義し、概
念変換テーブル160の概念の項目にNULLと記述さ
れている場合には、以下に述べるように、補助情報とし
て認識された発話内容も、概念化した情報も利用者に提
示しないようにすることも可能である。
【0041】ここでは認識結果出力部17は、概念変換
部15によって補助情報から変換された概念情報を受け
取った場合に、図5のフローチャートに示すように、そ
の概念情報がNULLLコードであるか否かをチェック
する(ステップS3)。もし、概念情報がNULLLコ
ードであるならば、認識結果出力部17は、情報種別分
離部13で分離された不可欠情報と補助情報のうちの不
可欠情報のみを提示する(ステップS5)。
【0042】このように、補助情報については何も利用
者に提示しないことによって、認識結果の出力手段を簡
略化でき、必要不可欠な情報のみが利用者に提示される
ので、利用者にとって分かりやすいインタフェースを提
供することができる。
【0043】一方、概念情報がNULLLコードでない
ならば、認識結果出力部17は、情報種別分離部13で
分離された不可欠情報と、当該概念情報を表すアイコン
とを提示する(ステップS4)。
【0044】なお、以上の説明では、補助情報から変換
された概念情報を表すのに、対応する概念を表現したア
イコン(概念アイコン)を用いた場合について説明した
が、その概念を表す言葉(概念文字列)を用いるように
しても構わない。 [第2の実施形態]図7は本発明の第2の実施形態に係
る音声認識装置のブロック構成図であり、図1と同一部
分には同一符号を付してある。
【0045】図7の構成が図1の構成と異なる点は、利
用者に対して提示されている認識結果中の概念アイコン
(概念を表す言葉が用いられている場合には、その言
葉)等を利用者の操作により選択指定するための概念指
定部28が新たに設けられていることと、図1中の認識
結果出力部17に代えて認識結果出力部27が用いられ
ていることである。概念指定部28は、マウス等の位置
指示手段と、当該位置指示手段により指示された位置を
検出する座標入力装置等から構成される。
【0046】認識結果出力部27は、認識結果出力部1
7の持つ認識結果出力機能に加えて、概念指定部28に
より選択指定されたアイコン(または言葉)の示す概念
表現のもとになった(音声認識部12での)照合結果の
候補の一覧を提示する機能と、その候補一覧の中から概
念指定部28により1つの候補が選択指定された場合、
アイコンの提示から当該選択指定された候補の提示に切
り替える機能とを有する。
【0047】次に、図7の構成の音声認識装置の動作に
ついて、前記第1の実施形態と同様に、電子的なスケジ
ュール帳への音声によるスケジュール入力を例に、図8
のフローチャートを適宜参照して説明する。
【0048】今、利用者が「25日1時から田中さんと
会議」と発声し、その発声内容を音声認識部12で認識
した結果、認識結果出力部27により図6に示したよう
なスケジュール帳へのアイコン(「相手」という概念を
示す人の形をしたアイコン60)を含む認識結果表示が
なされたものとする。
【0049】このような状態で利用者が、アイコン60
の示す「相手」に関する具体的な情報を知りたい場合に
は、当該アイコン60を概念指定部28により選択指定
(例えばマウス操作でクリック)する。認識結果出力部
27は、概念指定部28によりアイコン(概念アイコ
ン)が選択指定されたことを検出すると(ステップS1
1)、その選択指定されたアイコンにより表される概念
に対応する音声認識部12での認識結果(照合結果)の
候補の一覧を、当該アイコンの近傍に表示する(ステッ
プS12)。
【0050】ここでは、「相手」という概念を示すアイ
コン60が選択指定されていることから、図9に示すよ
うに、「相手」という概念表現のもとになった認識結果
の候補の一覧90が表示される。この候補一覧90の例
では、利用者が「25日1時から田中さんと会議」と発
声した結果、「相手」を表す発話内容「田中さんと」に
対する認識候補として、「田中さんと」の他に、「佐藤
さんと」及び「鈴木さんと」が得られたことを示してい
る。なお、図9の候補一覧90における各候補の並びは
候補順位順となっており、「田中さんと」が第1位であ
るものとする。
【0051】このように本実施形態においては、概念表
現された元の照合結果を確認することができるため、通
常は補助情報として扱われる概念「相手」に関する具体
的な情報が必要な場合にも、容易に対応することができ
る。
【0052】さて本実施形態では、以下に述べるよう
に、概念を示すアイコンを、概念表現された元の照合結
果の候補の1つに置き換えることができるようになって
いる。今、利用者が、図9のように表示された候補一覧
90の中から、自身の発話内容に一致する候補を概念指
定部28により選択したものとする。認識結果出力部2
7は、概念指定部28により候補一覧(90)の中から
1つの候補が選択指定されたことを検出すると(ステッ
プS13)、対応するアイコン(つまり概念表現)に代
えて、選択された候補を表示する(ステップS14)。
【0053】したがって、図9中の候補一覧90から例
えば「田中さんと」が選択指定された場合、アイコン6
0は、図10に示すように概念表現に変換する前の照合
結果の1つである「田中さんと」の表示に置き換え(切
り替え)られる。
【0054】このように、概念表現に対応して表示され
た照合結果の候補一覧から利用者が所望の候補を選択す
ることによって、概念表現を元の照合結果に置き換える
ことができるため、通常は補助情報である「相手」に関
する具体的な情報が必要な場合にも、容易に対応するこ
とができる。 [第3の実施形態]図11は本発明の第3の実施形態に
係る音声認識装置のブロック構成図であり、図7と同一
部分には同一符号を付してある。
【0055】図11の構成が図7の構成と異なる点は、
概念指定部28により選択指定された概念(アイコン)
に対応する、照合結果とは別の具体例が記憶された具体
例記憶部39が新たに設けられていることと、図7中の
認識結果出力部27に代えて認識結果出力部37が用い
られていることである。認識結果出力部37は、図1中
の認識結果出力部17の持つ認識結果出力機能に加え
て、概念指定部28により選択指定されたアイコンの示
す概念に対応する全ての具体例を具体例記憶部39から
取り出して、その具体例の一覧を提示する機能と、その
具体例一覧の中から概念指定部28により1つの具体例
が選択指定された場合、アイコンの提示から当該選択指
定された具体例の提示に切り替える機能とを有する。
【0056】この図11の構成の音声認識装置では、概
念を表現するアイコン(例えば図6に示したような「相
手」という概念を示すアイコン60)が利用者の操作に
従って概念指定部28により選択指定された場合の動作
は次のようになる。
【0057】まず認識結果出力部37は、概念指定部2
8により選択指定されたアイコンの示す概念(図6の例
では、「相手」)により具体例記憶部39を検索し、そ
の概念に対応する具体例(概念が「相手」であれば、例
えば頻繁に相手となり得る人の名前)を全て取り出す。
次に具体例記憶部39は、取り出した全ての具体例の一
覧を(前記第2の実施形態における照合結果の候補一覧
の表示と同様に)表示する。
【0058】このように、概念表現を具体例で確認でき
ることによって、概念表現の意味を利用者は容易に知る
ことができる。さて本実施形態では、以下に述べるよう
に、概念を示すアイコンを、利用者が選択指定した具体
例に置き換えることができるようになっている。
【0059】即ち、アイコンの選択指定によって表示さ
れた、当該アイコンの示す概念に対応する具体例の一覧
の中から、利用者が所望の具体例を概念指定部28によ
り選択指定すると、認識結果出力部37は、当該アイコ
ンに代えて選択された具体例を表示する。
【0060】このように、概念表現を具体例に置き換え
ることによって、通常は補助情報である「相手」に関す
る具体的な情報が必要な場合にも、簡単に対応すること
ができる。 [第4の実施形態]図12は本発明の第4の実施形態に
係る音声認識装置のブロック構成図であり、図11と同
一部分には同一符号を付してある。
【0061】図12の構成が図11の構成と異なる点
は、具体例記憶部39に記憶(登録)する概念と具体例
との対応関係を、利用者操作により入力可能とするため
の入力手段である具体例入力部40が新たに設けられて
いることである。
【0062】この具体例入力部40を設けたことによ
り、例えば頻繁に会議をする相手の名前を概念「相手」
の具体例として具体例入力部40から入力して、具体例
記憶部39に登録することができる。
【0063】このように、(会議の)相手名という具体
例の登録を行うことにより、例えば「25日1時から田
中さんと会議」と発声した場合に、「田中さんと」が正
しく認識されなかったとしても、具体例一覧からの選択
を行うことで、訂正が非常に楽に行える。同様に、例え
ば「25目1時から会議」とだけ発声して、会議の相手
名は具体例一覧からの選択で入力することも可能であ
る。
【0064】また、利用者が具体例入力部40から概念
の具体例を入力できることによって、同じ概念であって
も、それに対応する具体例を利用者毎に設定することが
できる。 [第5の実施形態]図13は本発明の第5の実施形態に
係る音声認識装置のブロック構成図であり、図11と同
一部分には同一符号を付してある。
【0065】図13の構成が図11の構成と異なる点
は、認識対象文法記憶部14内の重用度テーブル140
に登録するキーワードと重要度情報の両項目の内容を、
利用者操作により入力可能とするための入力手段である
文法入力部58が新たに設けられていることである。
【0066】この図13の構成の音声認識装置では、利
用者は、自身が利用(発声)する可能性のあるキーワー
ド(発話内容)について、文法入力部58から任意に重
要度を指定して、不可欠情報または補助情報を設定登録
することができる。
【0067】このように、利用者が所望のキーワード
(発話内容)について、その重要度を文法入力部58か
ら指定できることによって、同じキーワードであって
も、第1の利用者は必要不可欠情報として入力設定し、
第2の利用者は補助情報として入力することができ、利
用者の要求に応じた重要度に発話内容を分離することが
可能となる。 [第6の実施形態]図14は本発明の第6の実施形態に
係る音声認識装置のブロック構成図であり、図1と同一
部分には同一符号を付してある。
【0068】図14の構成が図1の構成と異なる第1の
点は、認識対象文法記憶部14に代えて、キーワードと
重要度情報の両項目の他に概念変換テーブルポインタの
項目を持つ重用度テーブル640が記憶された認識対象
文法記憶部64が用いられると共に、概念変換規則記憶
部16に代えて、重用度テーブル640内の概念変換テ
ーブルポインタ(TPi )で指定される複数の概念変換
テーブル、例えばn個の概念変換テーブル660-1,6
60-2,…660-nが記憶された概念変換規則記憶部6
6が用いられていることである。ここで概念変換テーブ
ルポインタ(TPi )は、重用度テーブル640内の不
可欠情報として定義されたキーワードが登録されている
各エントリのうち、予め定められたキーワードが登録さ
れているエントリ(のポインタ項目)にのみ設定され
る。他のエントリ(のポインタ項目)には、有効な概念
変換テーブルポインタが設定されていないことを示すn
ull記号(nullコード)が設定される。
【0069】図15に、重用度テーブル640と概念変
換テーブル660-1〜660-nの一例を示す。ここで
は、重用度テーブル640内の不可欠情報として定義さ
れたキーワードのうち、例えば「会議」が登録されてい
るエントリには、概念変換テーブル660-1を指す概念
変換テーブルポインタTP1 が設定され、「出張」が登
録されているエントリには、概念変換テーブル660-2
を指す概念変換テーブルポインタTP2 が設定されてい
る。
【0070】概念変換テーブル660-1は、「会議」を
含む発話内容中に補助情報として分離される用語が含ま
れている場合に、その用語を「会議」に関連した概念情
報に変換するときに選択的に使用されることになる。一
方、概念変換テーブル660-2は、「出張」を含む発話
内容中に補助情報として分離される用語が含まれている
場合に、その用語を「出張」に関連した概念情報に変換
するときに選択的に使用されることになる。
【0071】図14の構成が図1の構成と異なる第2の
点は、情報種別分離部13に代えて、音声認識部12で
の認識結果(照合結果)であるコード化された発話内容
を、認識対象文法記憶部64内の重用度テーブル640
を検索することで不可欠(必要不可欠)情報と補助情報
とに分離する機能に加えて、不可欠情報に対応して概念
変換テーブルポインタTPi (iは1〜nのいずれか)
が設定されている場合には、概念変換規則記憶部66の
中から当該ポインタTPi で指定される概念変換テーブ
ル660-iを(概念変換部15から参照可能なように)
選択する機能を有する情報種別分離部63が用いられて
いることである。
【0072】次に、図14の構成の音声認識装置の動作
について、前記第1の実施形態と同様に、電子的なスケ
ジュール帳への音声によるスケジュール入力を例に説明
する。
【0073】まず、利用者が「25日1時から田中さん
と会議」と発声し、音声認識部11の照合結果も「25
日1時から田中さんと会議」になったとする。情報種別
分離部63は、図15に示した(認識対象文法記憶部6
4内の)重要度テーブル640を検索して、音声認識部
11の照合結果(発話内容)「25日1時から田中さん
と会議」について、「25日1時から」→不可欠情報
(日時)、「田中さんと」→補助情報(相手)、「会
議」→不可欠情報(用件)、のように不可欠情報と補助
情報とに分離すると共に、その不可欠情報に対応して有
効な概念変換テーブルポインタTPi が設定されている
場合には、当該ポインタTPi を取り出す。図15中の
重用度テーブル640の例では、不可欠情報「会議」に
対応して概念変換テーブルポインタTP1 が設定されて
いることから、当該ポインタTP1 が取り出される。こ
の場合、情報種別分離部63は、取り出したポインタT
P1 の指定する(概念変換規則記憶部66内の)概念変
換テーブル660-1(図15参照)を概念変換部15か
ら参照可能なように選択する。
【0074】情報種別分離部63での、音声認識部11
の照合結果(発話内容)に対する情報分離結果は概念変
換部15に渡される。概念変換部15は、情報種別分離
部63での情報分離結果のうち、補助情報として分離さ
れた「田中さんと」(相手情報)により、(概念変換規
則記憶部16内の)現在選択状態にある概念変換テーブ
ル、つまり概念変換部15から見える唯一の概念変換テ
ーブル(ここでは概念変換テーブル660-1)を参照
し、当該補助情報「田中さんと」を概念情報(ここでは
「相手」という概念情報)に変換する。以降の動作は、
前記第1の実施形態と同様である。
【0075】以上の例は、情報種別分離部63により不
可欠情報として分離された用語(発話内容部分)が「会
議」の場合であるが、もし「出張」であったなら、図1
5から明らかなように概念変換テーブルポインタTP2
が取り出されて、概念変換テーブル660-2が選択され
る。この場合、補助情報として分離された「田中さん
と」を概念変換部15にて概念情報に変換するのに、概
念変換テーブル660-2が用いられることになる。
【0076】このように、概念変換規則記憶部66内に
複数の概念変換テーブル660-1〜660-nを用意し、
情報種別分離部63で分離される不可欠情報の内容に応
じて、補助情報を概念に変換するときに使用する概念変
換テーブルを使い分けることにより、同じ発話内容の補
助情報でも、認識した不可欠情報に応じて、異なる概念
に変換することができる。
【0077】即ち本実施形態においては、不可欠情報に
応じて異なる概念に変換できるため、補助情報を概念に
変換しても、適切な概念に変換することが可能となり、
多種多様な意味を表現することが可能となる。
【0078】なお、以上の説明では、情報種別分離部6
3が概念変換テーブルポインタTPi に従って概念変換
テーブル660-1〜660-nの1つを概念変換部15か
ら参照可能なように選択するものとしたが、これに限る
ものではない。例えば、情報種別分離部63が取得した
概念変換テーブルポインタTPi を、情報分離結果と共
に概念変換部15に渡し、概念変換部15が当該ポイン
タTPi の指定する概念変換テーブル660-iを選択し
て参照するようにしても構わない。
【0079】なお、以上の実施形態で述べた、主とし
て、音声認識部12による認識処理、情報種別分離部1
3,63による情報種別分離処理、概念変換部15によ
る概念変換処理、及び認識結果出力部17,27,37
による認識結果提示処理等は、プログラム読み取り可能
なコンピュータ、例えば図16に示すような、マイクロ
ホン71を含む音声入力手段、スピーカ72を含む音声
出力手段、及び表示器73を備えたパーソナルコンピュ
ータ70に、当該処理を実行させるためのプログラムを
記録した記録媒体、例えばCD−ROM74を装着し
て、当該CD−ROM74に記録されているプログラム
をパーソナルコンピュータ70で読み取り実行させるこ
とによっても実現される。なお、プログラムを記録した
記録媒体としては、CD−ROM74の他に、フロッピ
ーディスク、メモリカード等が利用可能である。また、
プログラムを記録した記録媒体の内容が、通信回線等を
介してパーソナルコンピュータ71にダウンロードされ
るものであっても構わない。
【0080】
【発明の効果】以上詳述したように本発明によれば、音
声認識した結果を利用者に提示する場合に、表現上不可
欠な情報と補助的な情報とに分離し、補助的な情報に関
しては、認識結果をそのまま提示するのではなく、発話
内容を抽象化した概念情報として利用者に提示するよう
にしたので、不可欠ではない情報を正しく入力するため
の利用者の負担を大幅に低減することができ、効率の良
いインタフェース機能を実現できる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る音声認識装置の
ブロック構成図。
【図2】図1中の音声認識部12の詳細構成を示すブロ
ック図。
【図3】図1中の重用度テーブル140の一例を示す
図。
【図4】図1中の概念変換テーブル160の一例を示す
図。
【図5】同実施形態の動作を説明するためのフローチャ
ート。
【図6】同実施形態における認識結果表示例を示す図。
【図7】本発明の第2の実施形態に係る音声認識装置の
ブロック構成図。
【図8】同実施形態の動作を説明するためのフローチャ
ート。
【図9】図6中のアイコン60をクリックすることによ
り候補一覧90が表示された認識結果表示例を示す図。
【図10】図9中の候補一覧90から「田中さんと」が
選択指定された結果、アイコン60が「田中さんと」の
表示に置き換えられた認識結果表示例を示す図。
【図11】本発明の第3の実施形態に係る音声認識装置
のブロック構成図。
【図12】本発明の第4の実施形態に係る音声認識装置
のブロック構成図。
【図13】本発明の第5の実施形態に係る音声認識装置
のブロック構成図。
【図14】本発明の第6の実施形態に係る音声認識装置
のブロック構成図。
【図15】図14中の重用度テーブル640と概念変換
テーブル660-1〜660-nの一例を示す図。
【図16】認識結果提示機能等を実現するためのプログ
ラムの読み取り実行が可能なパーソナルコンピュータの
外観を示す図。
【符号の説明】
11…音声入力部 12…音声認識部 13,63…情報種別分離部 14,64…認識対象文法記憶部(重要度情報記憶手
段) 15…概念変換部 16,66…概念変換規則記憶部 17,27,37…認識結果出力部 28…概念指定部 39…具体例記憶部 40…具体例入力部 58…文法入力部 60…アイコン 74…CD−ROM(記録媒体) 90…候補一覧 140,640…重用度テーブル 160,660-1〜660-n…概念変換テーブル

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 発声された音声を認識する認識手段と、 各種キーワードについて、そのキーワードが表現上不可
    欠な情報であるか補助的な情報であるかの重要度を示す
    重要度情報が登録された重要度情報記憶手段と、 前記認識手段で認識された発話内容により前記重要度情
    報記憶手段を参照し、当該記憶手段に登録されている重
    要度情報に応じて、前記認識された発話内容を表現上不
    可欠な情報と補助的な情報とに分離する情報種別分離手
    段と、 前記補助的情報となり得る各種キーワードについて、そ
    の情報の概念を表す概念情報が登録された概念変換規則
    記憶手段と、 前記情報種別分離手段により補助的情報に分離された発
    話内容部分により前記概念変換規則記憶手段を参照し、
    当該発話内容部分を概念情報に変換する概念変換手段
    と、 前記情報種別分離手段により不可欠情報に分離された発
    話内容部分と前記概念変換手段により変換された概念情
    報とを認識結果として提示する認識結果出力手段とを具
    備することを特徴とする音声認識装置。
  2. 【請求項2】 前記認識結果出力手段により提示された
    概念情報を利用者の操作に従って選択指定するための概
    念指定手段を更に具備し、 前記認識結果出力手段は前記概念指定手段により前記概
    念情報が選択指定された場合、当該概念情報のもとにな
    った前記認識手段で認識された候補の一覧を提示するこ
    とを特徴とする請求項1記載の音声認識装置。
  3. 【請求項3】 前記概念指定手段は、利用者の操作に従
    って前記候補の一覧から任意の候補を選択指定可能なよ
    うに構成されており、 前記認識結果出力手段は、前記概念指定手段により前記
    候補の一覧から任意の候補が選択指定された場合、当該
    選択指定された候補を前記概念情報に代えて提示するこ
    とを特徴とする請求項2記載の音声認識装置。
  4. 【請求項4】 各種概念について、その概念に対応する
    具体例の一覧が登録された具体例記憶手段を更に具備
    し、 前記認識結果出力手段は前記概念指定手段により前記概
    念情報が選択指定された場合、当該概念情報に対応して
    前記具体例記憶手段に登録されている具体例一覧を取り
    出して提示する請求項1記載の音声認識装置。
  5. 【請求項5】 前記概念指定手段は、利用者の操作に従
    って前記具体例一覧から任意の具体例を選択指定可能な
    ように構成されており、 前記認識結果出力手段は、前記概念指定手段により前記
    具体例一覧から任意の具体例が選択指定された場合、当
    該選択指定された具体例を前記概念情報に代えて提示す
    ることを特徴とする請求項4記載の音声認識装置。
  6. 【請求項6】 発声された音声を認識する認識手段と、 各種キーワードについて、そのキーワードが表現上不可
    欠な情報であるか補助的な情報であるかの重要度を示す
    重要度情報が登録された重要度情報記憶手段と、 前記認識手段で認識された発話内容により前記重要度情
    報記憶手段を参照し、当該記憶手段に登録されている重
    要度情報に応じて、前記認識された発話内容を表現上不
    可欠な情報と補助的な情報とに分離する情報種別分離手
    段と、 前記情報種別分離手段により不可欠情報に分離された発
    話内容部分のみを認識結果として提示する認識結果出力
    手段とを具備することを特徴とする音声認識装置。
  7. 【請求項7】 発声された音声を認識する認識手段と、 各種キーワードについて、そのキーワードが表現上不可
    欠な情報であるか補助的な情報であるかの重要度を示す
    重要度情報が登録された重要度情報記憶手段と、 前記認識手段で認識された発話内容により前記重要度情
    報記憶手段を参照し、当該記憶手段に登録されている重
    要度情報に応じて、前記認識された発話内容を表現上不
    可欠な情報と補助的な情報とに分離する情報種別分離手
    段と、 前記補助的情報となり得る各種キーワードについて、そ
    の情報の概念またはその情報を出力対象外とすることを
    表す概念情報が登録された概念変換規則記憶手段と、 前記情報種別分離手段により補助的情報に分離された発
    話内容部分により前記概念変換規則記憶手段を参照し、
    当該発話内容部分を概念情報に変換する概念変換手段
    と、 前記概念変換手段により変換された概念情報が対応する
    補助的情報の概念を表す場合には、前記情報種別分離手
    段により不可欠情報に分離された発話内容部分と前記概
    念変換手段により変換された概念情報とを認識結果とし
    て提示し、前記概念情報が出力対象外とすることを表す
    場合には、前記情報種別分離手段により不可欠情報に分
    離された発話内容部分のみを認識結果として提示する認
    識結果出力手段とを具備することを特徴とする音声認識
    装置。
  8. 【請求項8】 利用者の操作に従って、任意のキーワー
    ドについて、そのキーワードが表現上不可欠な情報であ
    るか補助的な情報であるかの重要度を示す重要度情報を
    前記重要度情報記憶手段に登録するための重要度入力手
    段を更に具備することを特徴とする請求項1、請求項
    6、または請求項7に記載の音声認識装置。
  9. 【請求項9】 利用者の操作に従って、任意の概念につ
    いて、その概念の具体例の一覧を前記具体例記憶手段に
    登録するための具体例入力手段を更に具備することを特
    徴とする請求項4記載の音声認識装置。
  10. 【請求項10】 発声された音声を認識する認識手段
    と、 各種キーワードについて、そのキーワードが表現上不可
    欠な情報であるか補助的な情報であるかの重要度を示す
    重要度情報が登録された重要度情報記憶手段と、 前記認識手段で認識された発話内容により前記重要度情
    報記憶手段を参照し、当該記憶手段に登録されている重
    要度情報に応じて、前記認識された発話内容を表現上不
    可欠な情報と補助的な情報とに分離する情報種別分離手
    段と、 前記補助的情報となり得る各種キーワードについて、そ
    の情報の概念を表す概念情報が前記不可欠情報となり得
    る複数のキーワードに対応して複数種登録された概念変
    換規則記憶手段と、 前記情報種別分離手段により補助的情報に分離された発
    話内容部分により前記概念変換規則記憶手段を参照し、
    当該発話内容部分を、当該発話内容部分と前記情報種別
    分離手段により不可欠情報に分離された発話内容部分と
    に対応する概念情報に変換する概念変換手段と、 前記情報種別分離手段により不可欠情報に分離された発
    話内容部分と前記概念変換手段により変換された概念情
    報とを認識結果として提示する認識結果出力手段とを具
    備することを特徴とする音声認識装置。
  11. 【請求項11】 利用者の発声した音声に対する認識結
    果を利用者に提示する認識結果提示方法であって、 認識された発話内容を、その内容の表現上不可欠な情報
    と補助的な情報とに分離した後、 前記補助的な情報に分離された発話内容部分を、その情
    報の概念を表す概念情報に変換し、 前記不可欠情報に分離された発話内容部分と前記変換さ
    れた概念情報とを認識結果として提示することを特徴と
    する認識結果提示方法。
  12. 【請求項12】 利用者操作による前記認識結果中の概
    念情報の選択指定を受け付け、選択指定された概念情報
    のもとになった認識された候補の一覧を提示することを
    特徴とする請求項11記載の認識結果提示方法。
  13. 【請求項13】 利用者操作による前記候補一覧からの
    任意の候補の選択指定を受け付け、選択指定された候補
    を前記概念情報に代えて提示することを特徴とする請求
    項12記載の認識結果提示方法。
  14. 【請求項14】 利用者操作による前記認識結果中の概
    念情報の選択指定を受け付け、選択指定された概念情報
    に対応する具体例の一覧を提示することを特徴とする請
    求項11記載の認識結果提示方法。
  15. 【請求項15】 利用者操作による前記具体例一覧から
    の任意の具体例の選択指定を受け付け、選択指定された
    具体例を前記概念情報に代えて提示することを特徴とす
    る請求項14記載の認識結果提示方法。
  16. 【請求項16】 利用者の発声した音声に対する認識結
    果を利用者に提示する認識結果提示方法であって、 認識された発話内容を、その内容の表現上不可欠な情報
    と補助的な情報とに分離し、 前記不可欠情報に分離された発話内容部分のみを認識結
    果として提示し、補助的情報に分離された発話内容部分
    は提示対象外とすることを特徴とする認識結果提示方
    法。
  17. 【請求項17】 前記補助的な情報に分離された発話内
    容部分から変換可能な概念情報を複数用意し、そのうち
    の1つが前記不可欠情報に分離された発話内容部分に応
    じて選択的に提示されることを特徴とする請求項11記
    載の認識結果提示方法。
  18. 【請求項18】 利用者の発声した音声に対する認識結
    果を利用者に提示するためのプログラムを記録したコン
    ピュータ読取り可能な記録媒体であって、 認識された発話内容を、その内容の表現上不可欠な情報
    と補助的な情報とに分離する処理と、 前記補助的な情報に分離された発話内容部分を、その情
    報の概念を表す概念情報に変換する処理と、 前記不可欠情報に分離された発話内容部分と前記変換さ
    れた概念情報とを認識結果として提示する処理とをコン
    ピュータに実行させるためのプログラムを記録したコン
    ピュータ読取り可能な記録媒体。
JP10062621A 1998-03-13 1998-03-13 音声認識装置及び認識結果提示方法 Withdrawn JPH11259085A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10062621A JPH11259085A (ja) 1998-03-13 1998-03-13 音声認識装置及び認識結果提示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10062621A JPH11259085A (ja) 1998-03-13 1998-03-13 音声認識装置及び認識結果提示方法

Publications (1)

Publication Number Publication Date
JPH11259085A true JPH11259085A (ja) 1999-09-24

Family

ID=13205583

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10062621A Withdrawn JPH11259085A (ja) 1998-03-13 1998-03-13 音声認識装置及び認識結果提示方法

Country Status (1)

Country Link
JP (1) JPH11259085A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008164975A (ja) * 2006-12-28 2008-07-17 Nissan Motor Co Ltd 音声認識装置、および音声認識方法
JP2019049742A (ja) * 2012-08-10 2019-03-28 エイディシーテクノロジー株式会社 音声応答装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008164975A (ja) * 2006-12-28 2008-07-17 Nissan Motor Co Ltd 音声認識装置、および音声認識方法
JP2019049742A (ja) * 2012-08-10 2019-03-28 エイディシーテクノロジー株式会社 音声応答装置

Similar Documents

Publication Publication Date Title
CN109493850B (zh) 成长型对话装置
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
EP2477186B1 (en) Information retrieving apparatus, information retrieving method and navigation system
US20190370398A1 (en) Method and apparatus for searching historical data
JP3944159B2 (ja) 質問応答システムおよびプログラム
US9177545B2 (en) Recognition dictionary creating device, voice recognition device, and voice synthesizer
WO2014201834A1 (en) Method and device of matching speech input to text
JP5824829B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
US20050256717A1 (en) Dialog system, dialog system execution method, and computer memory product
JP3639776B2 (ja) 音声認識用辞書作成装置および音声認識用辞書作成方法、音声認識装置、携帯端末器、並びに、プログラム記録媒体
US20050071170A1 (en) Dissection of utterances into commands and voice data
JP5364412B2 (ja) 検索装置
JP5396530B2 (ja) 音声認識装置および音声認識方法
JP3825526B2 (ja) 音声認識装置
US7181397B2 (en) Speech dialog method and system
WO2014033855A1 (ja) 音声検索装置、計算機読み取り可能な記憶媒体、及び音声検索方法
JP5160594B2 (ja) 音声認識装置および音声認識方法
JP5591428B2 (ja) 自動記録装置
JP3911178B2 (ja) 音声認識辞書作成装置および音声認識辞書作成方法、音声認識装置、携帯端末器、音声認識システム、音声認識辞書作成プログラム、並びに、プログラム記録媒体
JP4839291B2 (ja) 音声認識装置およびコンピュータプログラム
JP2003162293A (ja) 音声認識装置及び方法
JPH11259085A (ja) 音声認識装置及び認識結果提示方法
WO2021215045A1 (ja) 音声解析システム
EP3742301A1 (en) Information processing device and information processing method
JP2008083165A (ja) 音声認識処理プログラム及び音声認識処理方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050309

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050309

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20060811