JP3526101B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP3526101B2
JP3526101B2 JP05481995A JP5481995A JP3526101B2 JP 3526101 B2 JP3526101 B2 JP 3526101B2 JP 05481995 A JP05481995 A JP 05481995A JP 5481995 A JP5481995 A JP 5481995A JP 3526101 B2 JP3526101 B2 JP 3526101B2
Authority
JP
Japan
Prior art keywords
voice
information
voice recognition
recognition device
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP05481995A
Other languages
English (en)
Other versions
JPH08248987A (ja
Inventor
哲也 室井
雅子 広瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP05481995A priority Critical patent/JP3526101B2/ja
Publication of JPH08248987A publication Critical patent/JPH08248987A/ja
Application granted granted Critical
Publication of JP3526101B2 publication Critical patent/JP3526101B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、通信経路を通して行な
われる会話における音声認識方法に関し、より詳細に
は、会話中の音声を認識し、該認識した音声をキーワー
ドとして情報を検索し、該情報を話者に提供するように
した音声認識装置に関する。
【0002】
【従来の技術】従来、例えば、商品の注文を受けたりあ
るいはその商品の問い合わせに答えるというような客と
の会話を電話でする場合に、接客者当人が商品などの情
報を全て記憶しておくことが難しいような場面では、電
話の側に台帳のようなものを用意して会話を進めている
が、客からの注文を注文コードに変換したり、目的の情
報を探し出すのに時間がかかるという欠点があった。
【0003】また、台帳の代わりに注文や情報検索のソ
フトウェアを搭載したコンピュータを使ってキーボード
やマウスにより入力する方法もしばしば採られている
が、操作に慣れていない場合や滅多に現われない注文な
ど、操作に戸惑ってしまい、客との会話がおろそかにな
ってしまうという欠点があった。
【0004】一方、音声認識装置は、情報検索やコード
変換を行う場合にその入力をスムーズに行うことが出来
るため、例えば、「株式会社××の田中さん」と音声で
入力すると自動的に該当人物の電話番号033−311
−xxxxとプッシュトーンを出力するいわゆる音声ダ
イヤリングという技術などがある(特表平2−5021
49号公報,特開昭62−140345号公報など)。
しかし、人間が機械に向かって話しかけるという習慣が
ないために、不自然さ、違和感がやはり問題点として残
っていた。
【0005】
【発明が解決しようとする課題】本発明は、上述した欠
点や問題点を解決しようとするもので、人間と人間が会
話しているという、より自然な状況の中で、その会話を
滞らせることなく、通話者に情報を提供し、或いは、通
話者の操作を支援するための音声認識方法を提供する。
【0006】
【課題を解決するための手段】本発明は、上記目的を達
成するため、(1)音声通信回線で接続された音声認識
装置であって、発話者自身の音声を入力すると共に入力
した音声を前記音声通信回線へ供給する音声入力手段
と、前記音声入力手段で入力した音声を認識する音声認
識手段と、前記認識結果から前記発話者自身に提供する
情報を決定する認識結果処理手段を備えること、更に
は、(2)前記(1)において、認識対象となる入力項
目を指示する指示手段を備え、前記音声認識手段は、前
記指示された入力項目に対応した語彙を認識対象として
音声認識すること、更には、(3)前記(2)におい
て、前記語彙は、単語、単語のグループあるいは単語順
や文章を規定する文法であること、更には、(4)前記
(1)、(2)または(3)において、音声を認識すべ
きタイミングを指定するタイミング指示手段を具備し、
前記音声認識手段は、該タイミング指示手段より指示が
あったときのみ、前記音声入力手段から入力された音声
を認識すること、更には、(5)前記(4)において、
前記タイミング指示手段は、前記指示手段で音声認識の
認識対象となる入力項目を指定したときに、音声認識開
始指示がなされたとみなすようにしたこと、更には、
(6)前記(1)乃至(5)のいずれかにおいて、前記
認識結果処理手段は、検索キーと、該検索キーと対応付
けて記述した情報を1単位として、該情報の単位ごとに
関係付けて格納した情報格納手段と、前記認識結果から
検索キーを抽出する検索キー抽出手段と、前記抽出した
検索キーによって前記情報格納手段から所要の情報を検
索する情報検索手段と、前記検索結果を前記発話者自身
が閲覧可能な状態に提示する情報提示手段を備えるこ
と、更には、(7)前記(6)において、前記情報格納
手段の検索キーを上位概念とし、これに対応付けられた
情報を下位概念とし、前記情報提供手段では、下位概念
の検索結果を提示し、前記発話者はその提示された情報
をもとに相手から聞きだすようにして情報を絞り込むこ
と、更には、(8)前記(6)または(7)において、
前記検索キー抽出手段は、前記認識結果のスコアが特定
の値より小さい場合に、該認識結果のよみまたは表記が
部分的に共通する語と該認識結果とを検索キーとして抽
出すること、更には、(9)前記(6)または(7)に
おいて、前記検索キー抽出手段は 、前記認識結果のスコ
アが特定の値より小さい場合に、該認識結果の表記また
はよみを含む語と該認識結果とを検索キーとして抽出す
ること、更には、(10)前記(6)または(7)にお
いて、前記検索キー抽出手段は、前記認識結果のスコア
が特定の値より小さくかつ該認識結果が数値の場合に、
該認識結果の数値的に前の数値の表記またはよみが部分
的に共通である語と該認識結果とを検索キーとして抽出
すること、更には、(11)前記(1)乃至(10)の
いずれかにおいて、前記情報検索手段は、前記認識結果
から検索式を生成し、検索を行なうようにしたことを特
徴としたものである。
【0007】
【作用】通信経路から抽出された会話中の話者の音声信
号から音声認識を行い、その結果を用いて片方の話者に
対してのみ情報を提供し、あるいは、操作支援を行い、
さらに、情報を提供される前記話者の音声のみを認識す
る。更には、指定されたタイミングのときのみ前記音声
信号を抽出し、また、認識対象を指定された語いとす
る。更には、認識結果より検索キーあるいは検索式を得
て前記情報を検索し、前記話者に提供する。
【0008】
【実施例】1は、本発明の一実施例を説明するための
全体概略構成図で、2人(あるいは2組)の話者は、そ
れぞれ受話器などの音声入出力部1を経て、公衆回線な
どの通信経路2を通して会話を行なっている。ここで、
通信経路2における片方の話者の受話器などから音声信
号の一部を抽出し、音声認識手段3により音声認識を行
なう。音声認識の技術は広く知られており、ここで用い
得る音声認識手段3は、例えば、特徴抽出部3aと照合
部3bよりなり、音声信号は、この特徴抽出部3aで特
徴ベクトルの時系列に変換される。音声認識に適した特
徴量としては、さまざまなものが知られているが、本実
施例では、16kHzでサンプリングした音声波形を窓長
256,シフト幅160,予測次数20次で線形予測解
析した後、10次のLPCメルケプストラムに変換した
ものを用いることにする(10msごとに10次の特徴ベ
クトルが得られることになる)。
【0009】ここで得られた特徴ベクトルは、照合部3
bで照合され、認識結果を得る。照合方式についても、
DPマッチングを用いる方法、HMMを用いる方法など
さまざまな技術が広く知られている。例えば、本実施例
では、例えば、日本音響学会講演論文集1−4−1(平
成5年3月)に開示されている方法を採ることにする。
【0010】次に、認識結果処理手段4において認識さ
れた結果を用いて提供する情報あるいは制御信号を決定
し、その決定にしたがってパーソナルコンピュータのデ
ィスプレーなどの情報提供手段により、片方の話者に情
報の提供を行ない、あるいは話者が操作する機械への入
力とする。
【0011】2は、本発明の、他の実施例を説明する
ための図で、話者Aと話者Bは、公衆回線などの通信経
路2を通して会話を行なっている。ここで、本実施例で
は話者Aが使用している受話器あるいはヘッドセットな
どの音声入力手段11から話者Aの音声のみを抽出し、
音声認識手段3により音声認識を行なう。
【0012】音声認識の方法については様々なものが知
られており、例えば、図1の実施例に開示した方法を用
いれば良い。次に認識された結果を用いて認識結果処理
手段4により提供する情報を決定し、パーソナルコンピ
ュータのディスプレーなどの情報提供手段により、片方
の話者Aに情報の提供を行なう。
【0013】更に具体的に説明すると、従来は、例え
ば、話者Aが電話の交換業務の場合には、 話者B「営業1課の高橋さんをお願いします。」 話者A「はい、営業1課の高橋でございますね。」 というような会話をしつつ、台帳をめくって該当する人
物の内線番号を調べる必要があった。
【0014】しかし、本発明では、上記のような自然な
会話の中で、話者Aの音声を認識して「営業1課」「高
橋」というキーワードから、該当の人物の内線番号を話
者Aに表示することができる。また、提供する情報とし
て、話者Aが操作する機械(この例では交換器)へは、
内線番号を提供し、話者が見るディスプレーには内線番
号だけでなく「営業1課」「高橋」という自然言語も表
示するようにすれば、さらに自然さが増すことになる。
【0015】3は、本発明の他の実施例を説明するた
めの図で、話者Aと話者Bは、公衆回線などの通信経路
2を通して会話を行なっている。ここで、話者Aの音声
入力手段11からの音声信号は、話者Bにつながる通信
経路2と、後述の音声認識手段3とに同時に供給され
る。音声認識の方法については様々なものが知られてお
り、例えば図1の実施例に開示した方法を用いれば良
い。ここで、話者Aは、これから発声する音声を認識す
るかどうかの指示をタイミング指示手段5から行なう。
【0016】タイミング指示手段5としては、マウスあ
るいはキーボードを用いる方法が適当であるが、音声認
識手段3が誤認識する可能性も考慮して、キーボード入
力との併用ができるように、マウスあるいはキーボード
で入力項目の欄にカーソルを合わせたときに、音声認識
が動作するようにするのが好ましい。つまり、音声認識
結果を表示する場所にカーソルを予めセットし、もし音
声認識手段3による結果が誤っていたり、あるいはリジ
ェクトされて認識結果が無かったような場合にもすぐ本
来音声認識されるはずの言語をキーボードなどで入力し
て修復できるようにしておくことが望ましい。
【0017】4は、本発明の他の実施例を説明するた
めの図で、話者Aと話者Bは、公衆回線などの通信経路
2を通して会話を行なっている。ここで、話者Aの受話
器12などの音声入力手段からの音声信号は、話者Bに
つながる通信経路2と、後述の音声認識手段3とに同時
に供給される。音声認識の方法については様々なものが
知られており、例えば図1に示した実施例に開示した方
法を用いれば良い。語指示手段6は、例えば、ディス
プレ上の異なる場所にカーソルを合わせ指定したと
き、認識対象語テーブル10より異なる語を設定す
るようにすれば良い。
【0018】例えば、電話交換業務に本発明の音声認識
方法を適用する場合、図5に示すようなディスプレー画
面7の構成とし、図中の領域91にカーソル8が合って
いるときは、認識対象語いの指示をセットして所属、名
前を認識対象語いとし、図中の領域92にカーソル8が
合っているときは、商品名を認識対象語いとして、「プ
リンターのケーブルのご質問ですね。」の類の会話を音
声認識手段3により認識して、この認識結果を認識結果
処理手段4により処理し、担当する部署の内線番号を出
力するようにする。なお、ここで説明した「語い」とは
単に単語のグループでも良いし、あるいは「部署+名
前」のような単語順を規定した文法でも良いし、さらに
「部署+名前+ですね」のような文章を規定する文法で
もよい。
【0019】また、音声認識の結果が常に100%の認
識率ではないことを考慮し、キー入力との併用をするシ
ステムに本発明を適用する場合には、キー入力の欄と本
発明の語い指示手段6が示す領域を重ねると、誤認識の
訂正やリジェクトされた項目をキーですぐに訂正/追加
することができるので、音声認識が失敗した場合でも会
話を滞らせる時間が少なくなる。
【0020】以上に、認識結果処理手段4を有し、この
認識結果処理手段4により、片方の話者に情報を提供
し、或いは、操作支援を行うことについて説明したが、
前記の認識結果処理手段4として情報検索部を用い、以
下のようにして支援することも可能である。
【0021】情報検索部は音声認識手段3で認識された
結果を検索キーとして検索を行ない、その検索結果を表
示するが、そこには検索されるべき情報を格納した情報
格納部がある。話者は検索された表示結果をもとに対話
を引き続き進めていく。
【0022】6は、検索キーとして用いるキーワード
テーブルの例で、これは認識の候補単語となり、また、
検索キーとなる語のリストで、表記とよみとからなる。
実際の検索では各キーワードに対応する情報の格納場所
を各キーワードに対応付けて記述することもできる。図
7(a)は、情報格納部の例で、検索キーとそれに対応
する情報とからなる。この例により、商品の注文を受け
る場合において、例えば、発注元(図2の話者B)から
の問い合わせの商品が[コピー]の場合について、より
具体的に説明する。今、電話などで、「コピーを買いた
いんだけど」というような注文を受けた場合、受注側
(図2の話者A)はその注文の確認を「コピーでござい
ますね」と繰り返す。この受注側の発話を音声認識手段
で認識する。キーワードテーブル内の単語が発話中にな
いかどうかを認識し、キーワード[コピー]を抽出し、
これを認識結果とする。
【0023】この認識結果[コピー]を検索キーとし
て、情報格納部から検索し、商品[コピー]に関する詳
しい情報をディスプレイの表示、紙への印刷などとして
提示する(図7(a))。受注側は表示された[コピ
ー]に関するデータをもとに引き続き、発注者と対話を
続け、受注作業を行なう。
【0024】従って、この発明によると、対話をとめる
ことなく、また対話中に他の作業をすることなく、業務
中の対話に必要な情報を得ることができ、効率的に業務
を行なうことができる。
【0025】7(b)は、情報格納部の他の例で、検
索キーとそれに対応する情報からなり、各情報はそれ自
体が検索キーとなり、さらには、概念上、下位の情報を
もち、階層的な構造になっている。図7(b´)でいえ
ば、検索キー「コピー」には「タイプ」「価格」が対応
し、この「価格」は、次には、図7(b´´)に示すよ
うに、検索キーとなり「100万円」「200万円」
「500万円」に対応する。
【0026】この例により、商品の注文を受ける場にお
いて、例えば、発注元(図2の話者B)からの問い合わ
せの商品が[コピー]の場合について、より具体的に説
明する。今、電話などで、「コピーを買いたいんだけ
ど」というような注文を受けた場合、受注側(図2の話
者A)はその注文の確認を「コピーでございますね」と
繰り返す。この受注側の発話を音声認識手段で認識し、
キーワードテーブル中の語が発話中にないかどうかを認
識し、キーワード[コピー]を抽出し、これを認識結果
とする。
【0027】この認識結果[コピー]を検索キーとし
て、情報格納部から検索し、結果を提示する(図7
(b)の(b´))。次に、情報を絞りこむために、検
索結果中の語についてたずねる。例えば、「価格はどの
くらいのものでしょうか」と発注元にたずねると、この
発話から検索結果中の語「価格」という語が抽出され
る。次に「価格」を検索キーとして検索する(図7
(b)の(b´´))。これに対し、例えば「500万
円くらい」という返答があれば、受注側は確認の応答
「500万円ですね」と発話する。検索結果中の語が発
話中にないか認識し、「500万円」が認識され、価格
500円の商品が検索される(図7(c))。ここで
さらに対話を続け、情報を検索し、絞り込むことも可能
である。
【0028】従って、この発明によると、対話をとめる
ことなく、必要な情報が検索でき、しかも、関係のある
情報を随時検索、提示することで、対話を円滑に進め、
例えば、受発注などの業務を効率的に行なうことができ
る。特に、検索結果が大量にある場合に情報を絞り込む
ことで、要求にあった適量の情報を参照すればよく、対
話を滞らせず、円滑に進めることができる。
【0029】述した情報検索部を有するものに関し、
以下に、他の実施例について説明する。音声認識の結果
のスコアが特定の値より小さいと誤認識の可能性があ
り、認識された語に似た語に求める正しい検索キーがあ
ると考えられるので、そのための第1の対策として、認
識結果と誤認識結果のよみまたは表記の部分文字列とが
共通の語を、さらなる検索キーとする。
【0030】これを商品に関する問い合わせを受ける場
において、この情報検索部を有する音声認識装置を用い
た場合、例えば、発注元(図2の話者B)からの問い合
わせの商品が「FAX」の場合を例にして具体的に説明
する。
【0031】電話などで「FAXのメモリー送信につい
て聞きたいんだけど」というような問い合わせを受けた
場合、受注側(図2の話者A)はその注文の確認を「F
AXのメモリー送信でございますね」と繰り返す。キー
ワードテーブル内の単語がこの受注側の発話中にないか
どうかを音声認識手段で認識する。認識結果としてキー
ワード[FAX]がスコア30点、キーワード[ポーリ
ング送信]がスコア15点で抽出されたとし、ここでは
認識された結果に対するしきい値を20点とする。
【0032】キーワード[FAX]はしきい値より大な
ので、認識結果[FAX]を検索キーとして、情報格納
部から検索する。次に、キーワード[ポーリング送信]
はスコアがしきい値より大ではないので、キーワード
[ポーリング送信]の部分よみが共通である語をキーワ
ードテーブルで調べる。[メモリー送信][直送送信]
があるので、[ポーリング送信][メモリー送信][直
送送信]を検索キーとして検索し、提示する(図8
(a))。
【0033】従って、この発明によると、認識結果に誤
りがあった場合も、認識された語に似た語を検索するこ
とで、正しい検索結果をえ、対話を円滑にすすめ、業務
を効率的におこなうことができる。
【0034】述と同様の誤認識の第2の対策として認
識結果と誤認識結果の表記またはよみを部分的に含む語
を検索キーとする。これを商品の注文を受ける場におい
て、例えば、発注元(図2の話者Bからの問い合わせの
商品が[コピー]の場合を例により具体的に説明する。
【0035】電話などで「カラーコピーを買いたいんだ
けど」というような注文を受けた場合、受注側(図2の
話者A)はその注文の確認を「カラーコピーでございま
すね」と繰り返す。キーワードテーブル内の単語がこの
受注側の発話中にないかどうかを音声認識手段で認識す
る。認識結果としてキーワード[コピー]をスコア15
点で抽出されたとし、ここでは例えば認識された結果に
対するしきい値を20点とする。
【0036】キーワード[コピー]はスコアがしきい値
より大ではないので、キーワード[コピー]を含む検索
キーをキーワードテーブルで調べる。[カラーコピー]
があるので、[カラーコピー][コピー]を検索キーと
して検索し、提示する(図8(b))。
【0037】従って、この発明によると、認識結果に誤
りがあった場合も、認識された語に似た語を検索するこ
とで、正しい検索結果をえ、対話を円滑にすすめ、業務
を効率的におこなうことができる。
【0038】述と同様の誤認識の第3の対策として認
識結果と該認識結果の時間的に前の部分文字列の表記ま
たはよみが共通である語を検索キーとする。これを商品
に関する問い合わせを受ける場において、例えば、発注
元(図2の話者B)からの問い合わせの商品が[コピ
ー]の場合を例にして具体的に説明する。
【0039】電話などで「コピーのタイプ100につい
て聞きたいんだけど」というような問い合わせを受けた
場合、受注側(図2の話者A)はその注文の確認を「コ
ピーのタイプ100でございますね」と繰り返す。キー
ワードテーブル内の単語が、この受注側の発話中にない
かどうかを音声認識手段で認識する。認識結果としてキ
ーワード[コピー]がスコア30点、キーワード[11
0]がスコア15点で抽出されたとし、ここでは認識さ
れた結果に対するしきい値を20点とする。
【0040】キーワード[FAX]はしきい値より大な
ので、認識結果[FAX]を検索キーとして、情報格納
部から検索する。次にキーワード[110]はスコアが
しきい値より大ではなく、かつ数字からなるので、キー
ワード[110]の前方の部分文字列のよみが共通であ
る語をキーワードテーブルで調べる。[100][10
5]があるので、[100][110][105]を検
索キーとして検索し、ディスプレイに表示し、または紙
に印刷する(図8(c))。
【0041】従って、この発明によると、認識結果に誤
りがあった場合も、認識された語に似た語を検索するこ
とで、正しい検索結果をえ、対話を円滑にすすめ、業務
を効率的におこなうことができる。特に、数詞表現に対
して有効である。
【0042】た、前述の情報検索部を有するものに関
し、さらに、他の実施例を以下に説明する。以上には、
認識結果をそのまま検索キーに用いた例について説明し
たが、以下の実施例では認識結果を検索用の述語として
用いることにしている。
【0043】図9(a)は検索述語対応表であり、検索
結果の語とそれに対応する検索式の述語を対応付けて記
述したものである。この例により、商品の注文を受ける
場において、この検索述語対応表を有する音声認識手段
を用いた場合について、例えば、発注元(図2の話者
B)からの問い合わせの商品が[コピーとFAX]の場
合を例により具体的に説明する。電話などで、「コピー
とFAXを買いたいんだけど」というような注文を受け
た場合、受注側(図2の話者A)はその注文の確認を
「コピーとFAXでございますね」と繰り返す。キーワ
ードテーブルと検索述語対応表の語がこの受注側の発話
中にあるかどうかを音声認識手段で認識し、キーワード
[コピー][と][FAX]を抽出し、これを認識結果
とする。
【0044】検索述語対応表から認識結果の[と]は
[OR]の意味があるので、認識結果[コピー][FA
X]をそれぞれ検索キーとし、「OR」を検索用の述語
として検索式を生成して情報格納部から検索し、商品
[コピー][FAX]に関する詳しい情報を話者に提示
する(図9(b))。
【0045】従って、この発明によると、対話をとめる
ことなく、対話中の表現から検索式を生成するので、対
話中に他の作業をすることなく、業務中の対話に必要な
情報を得ることができ、効率的に業務を行なうことがで
きる。
【0046】
【発明の効果】以上のとおりの本発明の音声認識方法に
よって、次に示すような効果がもたらされることにな
る。
【0047】人間を相手に自然な会話をしながら、情報
が自動的に入手できたり、操作支援を受けたりできる。
また、音声認識をする話者を片方のみに特定し、その音
声のみを認識して提供すべき情報を決定するようにした
ため、特定しない方法に比べて高い認識率となる。一般
に、音声認識装置は、特定話者方式の方が不特定話者方
式の性能より高い。これは、ユーザーの個人の音声を辞
書として登録できるからである。図2で説明した会話の
例では、話者Bは特定できないが、話者Aは特定でき、
話者Aの音声のみを認識して提供すべき情報を決定する
ため、図1の方法に比べて高い認識率で、すなわち安定
して情報提供や操作支援が可能になる。
【0048】また、音声認識させるタイミングを指示す
る音声認識指示手段から、認識をさせる指示があったと
きのみ認識するようになるので、例えば、実施例のよう
な電話交換業務において、 話者B「私、××商会の田中と申します」 話者A「××商会の田中様でございますね」 というような会話中に音声認識が動作していると、電話
を取り次ぐ先の「田中」の内線番号を表示するという話
者が認識させることを意図していない音声の認識による
思わぬ動作で使用者が混乱してしまう。このような混乱
を招く誤動作を防ぐことができる。
【0049】さらに、語い指示手段によって指定された
語いだけを認識対象とするので、識別すべき語い数が減
少し、高い認識率および認識速度を維持することができ
る。また、認識結果を検索キーとして情報を検索すると
いう処理で情報を提供するので間違いのない情報を速く
利用することにより効率的に業務を行なうことができ
る。さらに、検索される情報の格納部を階層構造として
いるので、特に検索結果が大量にある場合に情報を絞り
込むことで、要求にあった適量の情報を参照すればよ
く、対話を滞らせず、円滑に進めることができる。
【0050】また、音声認識の結果のスコアが特定の値
より小さい語についてもその語に似た語を検索キーと
し、特に商品の番号など数詞に対しても有効な手法でこ
の検索キーを得ているので、検索もれをなくすことがで
き、対話を円滑に進め、業務を効率的に行うことができ
る。
【0051】また、対話をとめることなく、必要な情報
が検索でき、しかも、関係のある情報を随時検索、提示
することで、対話を円滑に進め、例えば、受発注などの
業務を効率的に行なうことができる。また、認識結果に
誤りがあった場合も、認識された語に似た語を検索する
ことで、正しい検索結果をえ、対話を円滑にすすめ、業
務を効率的におこなうことができる。
【0052】さらに、音声認識の結果の語を検索キーに
用いるだけではなく、検索用の述語として用い、対話中
の表現から検索式を生成するので、対話をとめたり、対
話中に他の作業をすることなく、業務中の対話に必要な
情報を得ることができ、効率的に業務を行なうことがで
きる。
【図面の簡単な説明】
【図1】 本発明の一実施例の構成例を示す図である。
【図2】 本発明の他の実施例の構成例を示す図であ
る。
【図3】 本発明のさらに他の実施例の構成例を示す図
である。
【図4】 本発明のさらに他の実施例の構成例を示す図
である。
【図5】 語い指示手段の実施例に用いるディスプレー
の画面構成を示す図である。
【図6】 検索キーとして用いるキーワードテーブルの
例を示す図である。
【図7】 検索される情報の格納部の例を示す図であ
る。
【図8】 検索結果の例を示す図である。
【図9】 検索述語対応表及び検索結果の例を示す図で
ある。
【符号の説明】
1…音声入出力部、11…音声入力手段、12…受話器、
2…通信経路、3…音声認識手段、31…認識対象語
い、4…認識結果処理手段、5…タイミング指示手段、
6…語い指示手段、7…ディスプレー画面、8…カーソ
ル。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI H04M 3/42 G10L 3/00 571V (56)参考文献 特開 平4−2252(JP,A) 特開 平3−32148(JP,A) 特開 昭63−269653(JP,A) 特開 平2−141056(JP,A) 特開 平3−257485(JP,A) 特開 平7−271822(JP,A) 特開 平8−63185(JP,A) 特開 平6−4598(JP,A) 井ノ上, 中村, 酒寄, 谷戸, 山本,音声認識技術を用いたオペレータ 作業支援システム,電子情報通信学会平 成7年度秋季研究発表会講演論文集,日 本,1995年 9月,2−2−3,Pag es 43−44 (58)調査した分野(Int.Cl.7,DB名) G10L 15/00 - 15/28 H04M 3/42 JICSTファイル(JOIS)

Claims (11)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声通信回線で接続された音声認識装置
    であって、発話者自身の音声を入力すると共に入力した
    音声を前記音声通信回線へ供給する音声入力手段と、前
    記音声入力手段で入力した音声を認識する音声認識手段
    と、前記認識結果から前記発話者自身に提供する情報を
    決定する認識結果処理手段を備えることを特徴とする音
    声認識装置。
  2. 【請求項2】 請求項1に記載の音声認識装置におい
    て、認識対象となる入力項目を指示する指示手段を備
    え、前記音声認識手段は、前記指示された入力項目に対
    応した語彙を認識対象として音声認識することを特徴と
    する音声認識装置。
  3. 【請求項3】 請求項2に記載の音声認識装置におい
    て、前記語彙は、単語、単語のグループあるいは単語順
    や文章を規定する文法であることを特徴とする音声認識
    装置。
  4. 【請求項4】 請求項1、2または3に記載の音声認識
    装置において、音声を認識すべきタイミングを指定する
    タイミング指示手段を具備し、前記音声認識手段は、該
    タイミング指示手段より指示があったときのみ、前記音
    声入力手段から入力された音声を認識することを特徴と
    する音声認識装置。
  5. 【請求項5】 請求項4に記載の音声認識装置におい
    て、前記タイミング指示手段は、前記指示手段で音声認
    識の認識対象となる入力項目を指定したときに、音声認
    識開始指示がなされたとみなすようにしたことを特徴と
    する音声認識装置。
  6. 【請求項6】 請求項1乃至5のいずれかに記載の音声
    認識装置において、前記認識結果処理手段は、検索キー
    と、該検索キーと対応付けて記述した情報を1単位とし
    て、該情報の単位ごとに関係付けて格納した情報格納手
    段と、前記認識結果から検索キーを抽出する検索キー抽
    出手段と、前記抽出した検索キーによって前記情報格納
    手段から所要の情報を検索する情報検索手段と、前記検
    索結果を前記発話者自身が閲覧可能な状態に提示する情
    報提示手段を備えることを特徴とする音声認識装置。
  7. 【請求項7】 請求項6に記載の音声認識装置におい
    て、前記情報格納手段 の検索キーを上位概念とし、これ
    に対応付けられた情報を下位概念とし、前記情報提供手
    段では、下位概念の検索結果を提示し、前記発話者はそ
    の提示された情報をもとに相手から聞きだすようにして
    情報を絞り込むことを特徴とする音声認識装置。
  8. 【請求項8】 請求項6または7に記載の音声認識装置
    において、前記検索キー抽出手段は、前記認識結果のス
    コアが特定の値より小さい場合に、該認識結果のよみま
    たは表記が部分的に共通する語と該認識結果とを検索キ
    ーとして抽出することを特徴とする音声認識装置。
  9. 【請求項9】 請求項6または7に記載の音声認識装置
    において、前記検索キー抽出手段は、前記認識結果のス
    コアが特定の値より小さい場合に、該認識結果の表記ま
    たはよみを含む語と該認識結果とを検索キーとして抽出
    することを特徴とする音声認識装置。
  10. 【請求項10】 請求項6または7に記載の音声認識装
    置において、前記検索キー抽出手段は、前記認識結果の
    スコアが特定の値より小さくかつ該認識結果が数値の場
    合に、該認識結果の数値的に前の数値の表記またはよみ
    が部分的に共通である語と該認識結果とを検索キーとし
    て抽出することを特徴とする音声認識装置。
  11. 【請求項11】 請求項1乃至10のいずれかに記載の
    音声認識装置において、前記情報検索手段は、前記認識
    結果から検索式を生成し、検索を行なうことを特徴とす
    る音声認識装置。
JP05481995A 1995-03-14 1995-03-14 音声認識装置 Expired - Lifetime JP3526101B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05481995A JP3526101B2 (ja) 1995-03-14 1995-03-14 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05481995A JP3526101B2 (ja) 1995-03-14 1995-03-14 音声認識装置

Publications (2)

Publication Number Publication Date
JPH08248987A JPH08248987A (ja) 1996-09-27
JP3526101B2 true JP3526101B2 (ja) 2004-05-10

Family

ID=12981309

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05481995A Expired - Lifetime JP3526101B2 (ja) 1995-03-14 1995-03-14 音声認識装置

Country Status (1)

Country Link
JP (1) JP3526101B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008287697A (ja) * 2007-04-16 2008-11-27 Sony Corp 音声チャットシステム、情報処理装置およびプログラム
US8620658B2 (en) 2007-04-16 2013-12-31 Sony Corporation Voice chat system, information processing apparatus, speech recognition method, keyword data electrode detection method, and program for speech recognition
CN108922267A (zh) * 2018-07-12 2018-11-30 河南恩久信息科技有限公司 一种用于智慧教室的智能语音系统

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3997459B2 (ja) 2001-10-02 2007-10-24 株式会社日立製作所 音声入力システムおよび音声ポータルサーバおよび音声入力端末
JP3542578B2 (ja) * 2001-11-22 2004-07-14 キヤノン株式会社 音声認識装置及びその方法、プログラム
JP2005283972A (ja) * 2004-03-30 2005-10-13 Advanced Media Inc 音声認識方法及びこの音声認識方法を利用した情報提示方法と情報提示装置
JP3827704B1 (ja) * 2005-03-30 2006-09-27 三菱電機インフォメーションシステムズ株式会社 オペレータ業務支援システム
JP2008028520A (ja) * 2006-07-19 2008-02-07 Nippon Telegr & Teleph Corp <Ntt> コンサルティング支援システム、サーバ、および方法
US9092733B2 (en) * 2007-12-28 2015-07-28 Genesys Telecommunications Laboratories, Inc. Recursive adaptive interaction management system
JP5532598B2 (ja) * 2008-12-15 2014-06-25 富士通株式会社 オペレータ管理システム、その方法、及びプログラム
JP6018133B2 (ja) * 2014-07-18 2016-11-02 キャンバスマップル株式会社 情報検索装置、情報検索プログラム、および情報検索システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
井ノ上, 中村, 酒寄, 谷戸, 山本,音声認識技術を用いたオペレータ作業支援システム,電子情報通信学会平成7年度秋季研究発表会講演論文集,日本,1995年 9月,2−2−3,Pages 43−44

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008287697A (ja) * 2007-04-16 2008-11-27 Sony Corp 音声チャットシステム、情報処理装置およびプログラム
US8620658B2 (en) 2007-04-16 2013-12-31 Sony Corporation Voice chat system, information processing apparatus, speech recognition method, keyword data electrode detection method, and program for speech recognition
CN108922267A (zh) * 2018-07-12 2018-11-30 河南恩久信息科技有限公司 一种用于智慧教室的智能语音系统

Also Published As

Publication number Publication date
JPH08248987A (ja) 1996-09-27

Similar Documents

Publication Publication Date Title
JP3822990B2 (ja) 翻訳装置、記録媒体
US6321196B1 (en) Phonetic spelling for speech recognition
JP3811280B2 (ja) ハイパーリンク化された情報との音声化されたインターフェースのためのシステムおよび方法
US5329608A (en) Automatic speech recognizer
Rabiner Applications of speech recognition in the area of telecommunications
US7383182B2 (en) Systems and methods for speech recognition and separate dialect identification
US7243069B2 (en) Speech recognition by automated context creation
US6801897B2 (en) Method of providing concise forms of natural commands
US7791471B2 (en) Item locator system utilizing item and location bar codes
US6813341B1 (en) Voice activated/voice responsive item locator
Rudnicky et al. Survey of current speech technology
US20030115064A1 (en) Employing speech recognition and capturing customer speech to improve customer service
JPWO2008114811A1 (ja) 情報検索システム、情報検索方法及び情報検索用プログラム
JP3799280B2 (ja) 対話システムおよびその制御方法
JP3526101B2 (ja) 音声認識装置
US20060020471A1 (en) Method and apparatus for robustly locating user barge-ins in voice-activated command systems
JP3468572B2 (ja) 対話処理装置
CN110602334A (zh) 一种基于人机协同的智能外呼方法及系统
JPH10173769A (ja) 音声メッセージ検索装置
JP3340163B2 (ja) 音声認識装置
JP2008216461A (ja) 音声認識・キーワード抽出・知識ベース検索連携装置
JPH1125112A (ja) 対話音声処理方法及び装置、記録媒体
JP5196114B2 (ja) 音声認識装置およびプログラム
EP3742301A1 (en) Information processing device and information processing method
Oberteuffer Commercial applications of speech interface technology: an industry at the threshold.

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040212

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080227

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090227

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100227

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110227

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120227

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130227

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130227

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140227

Year of fee payment: 10

EXPY Cancellation because of completion of term