JPH10326176A - 音声対話制御方法 - Google Patents
音声対話制御方法Info
- Publication number
- JPH10326176A JPH10326176A JP15043797A JP15043797A JPH10326176A JP H10326176 A JPH10326176 A JP H10326176A JP 15043797 A JP15043797 A JP 15043797A JP 15043797 A JP15043797 A JP 15043797A JP H10326176 A JPH10326176 A JP H10326176A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- voice
- output
- speech
- interlocutor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000003672 processing method Methods 0.000 claims abstract description 4
- 230000004044 response Effects 0.000 claims description 8
- 230000003993 interaction Effects 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Electrically Operated Instructional Devices (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
学習者1は「もう一度言って下さい。」といった聞き返
し文を入力する。これが音声認識され、まず聞き返し文
かどうかの判定が行われる。次に、聞き返し文の種類が
判定され、例えば大きい声が必要なら、声を大きくして
再出力する。 【効果】 ボタン操作等による聞き返しと比べて、自然
言語により聞き返し処理を可能にするため、円滑な会話
を妨げない。
Description
つコンピュータを使用した語学訓練装置等において、聞
き取れなかった会話文を聞き返すための音声対話制御方
法に関する。
対話者と所定の対話を行い、語学訓練をする装置があ
る。この装置は、対話者の声をマイクから受け入れて、
その内容を認識する。次に、必要な会話文を選択してス
ピーカ等を用いて発話し、会話を進める。語学訓練装置
に限らず、人の要求を受け入れて各種の操作を実行する
ための装置には、この種の会話型装置が組み込まれる可
能性が高い。こうした装置において、対話者が発話した
言葉を認識できない場合には、例えばブザーを鳴らした
り、ディスプレイに何らかの表示をして、再度の発話を
促す。また、これとは逆に、装置の側からの発話を対話
者が聞き取れない場合もある。こうした場合には対話者
が装置の所定のキーを押したりして再度その言葉を発話
するよう要求する。
な従来の技術には次のような解決すべき課題があった。
上記のように、例えば装置が発話した言葉を対話者が理
解できないようなとき、これを聞き返すための操作は、
装置によって様々な形態となる。語学訓練装置の場合に
は、パーソナルコンピュータが主体となる。従って、対
話者はキーボードやマウスを用いて所定の手順を踏み、
聞き返し処理を行うことになる。しかしながら、こうし
た操作方法を習得しなければ円滑な会話は進まない。ま
た、会話訓練中にこの種の操作をすると、自然な会話が
中断されるという問題もある。さらに、語学訓練装置に
限らず、コンピュータが人と対話するようなシステムで
は、より自然な形で会話が進められることが好ましい。
声認識して、通常の会話文か聞き返し文かを判定すると
ともに、聞き返し文の場合には、音声認識して得られた
認識文を解析して、対話者の聞き返し文の種類を判定
し、この聞き返し文の種類に応じて、直前に出力した音
声データの処理方法を選択することを特徴とする音声対
話制御方法。
種類が、出力音量の変更を要求するものである場合に
は、音声データの出力音量を要求に応じて変更すること
を特徴とする音声対話制御方法。
種類が、出力速度の変更を要求するものである場合に
は、音声データの出力速度を要求に応じて変更すること
を特徴とする音声対話制御方法。
種類に応じて、直前に出力した音声データとともに表示
する表示画像の処理方法を選択することを特徴とする音
声対話制御方法。
話の内容を音声認識して、通常の会話文か聞き返し文か
を判定するとともに、聞き返し文の場合には、音声認識
して得られた認識文を解析して、対話者の聞き返し文の
種類を判定し、この聞き返し文の種類に応じて、直前に
出力した音声データの処理方法を選択するよう制御する
プログラムを記録した記録媒体。
できないとき、予め用意した該当する聞き返し文を選択
して、音声による応答出力を行うことを特徴とする音声
対話制御方法。
できないとき、予め用意した該当する聞き返し文を選択
して、音声による応答出力を行うよう制御するプログラ
ムを記録した記録媒体。
例を用いて説明する。 〈具体例〉図1は、本発明による音声対話制御方法の説
明図である。この説明をする前に、まずこの発明を利用
して動作する語学訓練装置の構成を説明する。図2に、
語学訓練装置のブロック図を図示した。この装置は、学
習者1の語学訓練のために、装置本体2に、ディスプレ
イ3、スピーカ4、マイク5等を備えている。装置本体
2はパーソナルコンピュータ等から構成される。その内
部の機能ブロックをこの図の右側に示した。即ち、装置
本体2には、音声入力部11、音声出力部12、音声認
識部13、画像処理部14、プログラムメモリ15、プ
ロセッサ16及び記憶部17等が設けられている。
者1の音声を取り込む機能を持つ。音声出力部12は装
置の生成した音声をスピーカ4を駆動して出力する機能
を持つ。音声認識部13は音声入力部11により取り入
れた学習者1の音声を認識して、認識文を生成する機能
を持つ。画像処理部14はディスプレイ3を制御する機
能を持つ。
る。この語学訓練装置の制御プログラムはプログラムメ
モリ15に格納される。記憶部17はハードディスク等
の記憶装置で、会話文データファイル18や表示画面デ
ータファイル19を格納している。
者1が発話するべき文や装置本体2から発話させるべき
文が格納されており、その会話文データを用いて対話型
の語学訓練が実行される。表示画面データファイル19
には、学習者1に対し発話のための案内等を表示する画
面データが格納されている。ディスプレイ3には、学習
者1の会話訓練の相手となる画面上の人物(パートナ
ー)が表示される。こうして学習者1とパートナーとの
対話が実施される。
を説明する。図2を用いて説明したようなスピーカ4に
よって、何らかの会話文が出力されたとする(ステップ
S1)。これを学習者1が聞き逃したり、聞き取れなか
った場合に、ここで、例えば「もう一度言って下さ
い。」といった聞き返し文を発話する(ステップS
2)。これはマイク5を通じて装置に入力する。図2を
用いて説明した音声認識部13では、この聞き返し文を
音声認識する(ステップS3)。
うかの判定を行う。もし、聞き返し文であれば、今度は
聞き返し文の種類を判定する(ステップS5)。聞き返
し文の種類としては、この図のステップS6に示すよう
に、例えば単に聞き取れなかった場合と、声が小さすぎ
て聞き取れなかった場合と、速すぎて聞き取れなかった
場合とがある。
の音声出力を繰り返す。声が小さすぎれば大きい声で出
力する。声が速すぎれば遅い速度で出力する。このよう
な出力方法の選択のために、聞き返し文の種類の判定が
される。そして、その種類に応じた出力方法が決定する
と、音声出力部12においてスピーカ4を駆動し、同一
の会話文を出力する(ステップS7)。同時に適切な画
像も表示する。本発明の概略はこの通りであるが、次
に、そのデータ構成等を具体的に説明する。
す。上記のような聞き返し処理を行う場合、対話者の会
話文は音声認識され、その内容が予めメモリ等に記憶し
た会話文と比較される。これによって、どういった種類
の聞き返し文かが判断される。その判断結果に応じて、
対応する音声出力が選択される。この図は対話者の会話
文やその対応する音声出力を、会話文レコードとしてど
のように保持するかを説明している。
定される場面毎に用意される。会話データD1,D2,
D3,…Dnは、設定場面ごとに分類されたデータであ
る。そして、例えば会話データD1には、その場面で出
力される会話文レコードR1〜Rmが書き込まれる。こ
の1つの会話文レコードの構造を図の下側に示した。即
ち、この会話文レコードは、会話文テキストデータ2
1、フラグ22、画像ファイル名23及び音声ファイル
名24から構成される。
容をテキストデータとして表現したものである。これ
は、音声認識して得られた認識文との比較に用いられ
る。この比較の結果により、装置は、対話者の発話内容
を認識する。フラグ22は、音声出力部が音声出力処理
をする際に参照される制御用のパラメータである。フラ
グ22の内容は、この会話文が通常の会話文の場合
“0”、その他の聞き返し文の場合は、図に示すように
“1”,“2”,“3”,“4”,“5”となる。即
ち、「もう一度」という聞き返し文の場合にはフラグが
“1”、「もっと大きく」という聞き返し文の場合には
フラグが“2”、「もっと小さく」という聞き返し文の
場合にはフラグが“3”、「もっとゆっくり」という聞
き返し文の場合にはフラグが“4”、「もっと速く」と
いう聞き返し文の場合にはフラグが“5”となる。
に表示すべき画像ファイルを指定するためのデータであ
る。音声ファイル名24は、その会話文を発話する場合
の合成音声データを格納したファイルを指定している。
この認識文と会話文テキストデータ21とが比較され
る。そして、一致するテキストデータが存在する場合、
その会話文の内容が認識される。一方、音声出力の場合
には、通常の会話文の場合には、画像ファイル名23と
音声ファイル名24が参照され、対応する画像が表示さ
れる。さらに対応する合成音声が出力に使用される。一
方、聞き返し文の場合には、そのフラグ22の内容に応
じて、音声出力部で合成音声データが変換処理される。
なお、対話者から入力する会話文が英語の場合には、図
の*1〜*5に示したような内容にすればよい。
チャートを示す。この図を用いて、対話者の聞き返しに
対応する装置の具体的な動作を説明する。まず、ステッ
プS1において、音声入力があったかどうかが判断され
る。音声入力があると、ステップS2において、その音
声が認識されテキストデータに変換される。次に、ステ
ップS3において、そのデータが通常の会話文か聞き返
し文かの判断がされる。通常の会話文の場合には応答用
データが読み込まれ、その応答用データの出力が行われ
る(ステップS4,ステップS5)。
明したフラグがセットされた後、ステップS3からステ
ップS7方向に向かう。もう一度繰り返し出力するよう
な内容のの場合には、ステップS3からステップS7に
進み、直前のデータを読み込んで、そのデータを出力す
る(ステップS8)。一方、もっと大きくあるいはもっ
と小さく出力する場合には、ステップS6において、音
量の設定変更を行う。そして、ステップS7に進んで直
前のデータを読み込み出力する。一方、もっとゆっくり
あるいはもっと速くという聞き返し文の場合にはステッ
プS9に進み、予め遅く速度の設定してあるデータや速
く設定してあるデータを読み込む。そして、ステップS
10において、そのデータを出力する。このようにし
て、聞き返しの内容に応じた出力が可能になる。その
後、ステップS11に進み、次の会話データがある場合
にはステップS1に戻って同様の動作が繰り返される。
う場合の動作を説明する。これまでとは逆に、対話者の
音声を装置が認識できない場合がある。この場合にも円
滑な対話を妨げないために、音声による応答がされるこ
とが好ましい。これは、次のような手順で実現する。
ャートである。まず、ステップS1において、音声入力
があるかどうかの判断がされる。音声入力がなければ別
処理に進む。音声入力があればその音声を認識し、テキ
ストデータに変換する(ステップS2)。ここで、この
音声からテキストへの変換処理ができたかどうかを判断
する(ステップS3)。
るいはテキストに変換しても該当する会話文がなく、そ
のテキストを認識できない場合の両方がある。いずれの
場合においても、認識ができれば応答処理に進む。認識
ができなければステップS4に進んで、聞き返し動作デ
ータの読込みが行われる。
します。」といったメッセージ17Aが格納されてい
る。このデータ形式は既に図3を用いて説明したものと
同様でよい。こうしたデータが読み込まれ、次のステッ
プS5において、音声出力がされる。こうして装置は、
対話者の音声が聞き取れない場合に、音声によってその
旨を対話者に伝える。従って、対話者はこれに対応して
再度直前に発話した会話文を入力する。なお、ここでは
同一の会話文を再度入力するような要求のみを例にし
た。しかしながら、これまでの対話者側からの聞き返し
文と同様に、声が小さくて認識できない場合等につい
て、別の聞き返し文を用意し発話するようにしてもよ
い。なお、上記のような語学訓練装置は、パーソナルコ
ンピュータのプログラムの制御により実現する。従っ
て、そのプログラムをフロッピーディスクやCD−RO
Mその他の記録媒体に記録してから、コンピュータのハ
ードディスクにインストールしあるいはネットワークを
経由してダウンロードすれば、本発明を実施することが
できる。
によれば、語学訓練装置等において、対話者が装置の発
する会話文を認識できない場合に、特別の操作を意識す
ることなく、通常の聞き返し文を入力することによっ
て、聞き返し処理が可能となる。従って、自然な会話を
妨げず、円滑な語学訓練ができる。また、語学訓練装置
に限らず、対話型の各種の装置において、自然な聞き返
しによる処理ができるため、操作性の向上が図られる。
また、装置の側が聞き返しを行う場合においても、音声
出力により聞き返しを行うことから、対話者の再入力を
自然な状態で行うことが可能になる。
る。
る。
る。
Claims (7)
- 【請求項1】 対話者が発話したとき、 その発話の内容を音声認識して、 通常の会話文か聞き返し文かを判定するとともに、 聞き返し文の場合には、 音声認識して得られた認識文を解析して、 対話者の聞き返し文の種類を判定し、 この聞き返し文の種類に応じて、直前に出力した音声デ
ータの処理方法を選択することを特徴とする音声対話制
御方法。 - 【請求項2】 請求項1において、 聞き返し文の種類が、出力音量の変更を要求するもので
ある場合には、音声データの出力音量を要求に応じて変
更することを特徴とする音声対話制御方法。 - 【請求項3】 請求項1において、 聞き返し文の種類が、出力速度の変更を要求するもので
ある場合には、音声データの出力速度を要求に応じて変
更することを特徴とする音声対話制御方法。 - 【請求項4】 請求項1において、 聞き返し文の種類に応じて、直前に出力した音声データ
とともに表示する表示画像の処理方法を選択することを
特徴とする音声対話制御方法。 - 【請求項5】 対話者が発話したとき、 その発話の内容を音声認識して、 通常の会話文か聞き返し文かを判定するとともに、 聞き返し文の場合には、 音声認識して得られた認識文を解析して、 対話者の聞き返し文の種類を判定し、 この聞き返し文の種類に応じて、直前に出力した音声デ
ータの処理方法を選択するよう制御するプログラムを記
録した記録媒体。 - 【請求項6】 対話者が発話して、 音声認識ができないとき、 予め用意した該当する聞き返し文を選択して、 音声による応答出力を行うことを特徴とする音声対話制
御方法。 - 【請求項7】 対話者が発話して、 音声認識ができないとき、 予め用意した該当する聞き返し文を選択して、 音声による応答出力を行うよう制御するプログラムを記
録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15043797A JPH10326176A (ja) | 1997-05-23 | 1997-05-23 | 音声対話制御方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15043797A JPH10326176A (ja) | 1997-05-23 | 1997-05-23 | 音声対話制御方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10326176A true JPH10326176A (ja) | 1998-12-08 |
Family
ID=15496918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15043797A Pending JPH10326176A (ja) | 1997-05-23 | 1997-05-23 | 音声対話制御方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH10326176A (ja) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000209378A (ja) * | 1999-01-20 | 2000-07-28 | Ricoh Co Ltd | 画像形成装置 |
JP2002269121A (ja) * | 2001-03-13 | 2002-09-20 | Ricoh Co Ltd | 対話システム及びプログラム |
JP2003271193A (ja) * | 2002-03-14 | 2003-09-25 | Denso Corp | 車載用電子機器、車載用電子機器の音声認識結果報知方法、音声認識確認通知用プログラム及びナビゲーションシステム |
JP2010197858A (ja) * | 2009-02-26 | 2010-09-09 | Gifu Univ | 音声対話システム |
JP2014153715A (ja) * | 2013-02-07 | 2014-08-25 | Samsung Electronics Co Ltd | 音声対話機能を備えた携帯端末機及びその音声対話方法 |
EP2827329A2 (en) | 2013-06-13 | 2015-01-21 | Fujitsu Limited | Call device and voice modification method |
JP2016014897A (ja) * | 2015-10-14 | 2016-01-28 | 株式会社東芝 | 音声対話支援装置、方法、およびプログラム |
US9582245B2 (en) | 2012-09-28 | 2017-02-28 | Samsung Electronics Co., Ltd. | Electronic device, server and control method thereof |
JP2019128654A (ja) * | 2018-01-22 | 2019-08-01 | ヤフー株式会社 | 情報処理システム、情報処理方法、およびプログラム |
JP2019128384A (ja) * | 2018-01-22 | 2019-08-01 | ヤフー株式会社 | 情報処理システム、情報処理方法、およびプログラム |
WO2020121638A1 (ja) * | 2018-12-13 | 2020-06-18 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
WO2024071921A1 (ko) * | 2022-09-30 | 2024-04-04 | 삼성전자 주식회사 | 인공지능과 음성 인식을 기반으로 동작하는 전자 장치 및 이의 제어 방법 |
-
1997
- 1997-05-23 JP JP15043797A patent/JPH10326176A/ja active Pending
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000209378A (ja) * | 1999-01-20 | 2000-07-28 | Ricoh Co Ltd | 画像形成装置 |
JP2002269121A (ja) * | 2001-03-13 | 2002-09-20 | Ricoh Co Ltd | 対話システム及びプログラム |
JP2003271193A (ja) * | 2002-03-14 | 2003-09-25 | Denso Corp | 車載用電子機器、車載用電子機器の音声認識結果報知方法、音声認識確認通知用プログラム及びナビゲーションシステム |
JP2010197858A (ja) * | 2009-02-26 | 2010-09-09 | Gifu Univ | 音声対話システム |
US9582245B2 (en) | 2012-09-28 | 2017-02-28 | Samsung Electronics Co., Ltd. | Electronic device, server and control method thereof |
US11086596B2 (en) | 2012-09-28 | 2021-08-10 | Samsung Electronics Co., Ltd. | Electronic device, server and control method thereof |
JP2014153715A (ja) * | 2013-02-07 | 2014-08-25 | Samsung Electronics Co Ltd | 音声対話機能を備えた携帯端末機及びその音声対話方法 |
EP2827329A3 (en) * | 2013-06-13 | 2015-03-11 | Fujitsu Limited | Call device and voice modification method |
EP2827329A2 (en) | 2013-06-13 | 2015-01-21 | Fujitsu Limited | Call device and voice modification method |
JP2016014897A (ja) * | 2015-10-14 | 2016-01-28 | 株式会社東芝 | 音声対話支援装置、方法、およびプログラム |
JP2019128654A (ja) * | 2018-01-22 | 2019-08-01 | ヤフー株式会社 | 情報処理システム、情報処理方法、およびプログラム |
JP2019128384A (ja) * | 2018-01-22 | 2019-08-01 | ヤフー株式会社 | 情報処理システム、情報処理方法、およびプログラム |
WO2020121638A1 (ja) * | 2018-12-13 | 2020-06-18 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
US12002460B2 (en) | 2018-12-13 | 2024-06-04 | Sony Group Corporation | Information processing device, information processing system, and information processing method, and program |
WO2024071921A1 (ko) * | 2022-09-30 | 2024-04-04 | 삼성전자 주식회사 | 인공지능과 음성 인식을 기반으로 동작하는 전자 장치 및 이의 제어 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6463825B2 (ja) | 多重話者音声認識修正システム | |
KR101826714B1 (ko) | 말하기 학습 기능을 구비한 외국어 학습 시스템 및 외국어 학습 방법 | |
KR101143034B1 (ko) | 음성 명령을 명확하게 해주는 중앙집중식 방법 및 시스템 | |
US5577165A (en) | Speech dialogue system for facilitating improved human-computer interaction | |
JP6078964B2 (ja) | 音声対話システム及びプログラム | |
US20090254826A1 (en) | Portable Communications Device | |
JPH05216618A (ja) | 音声対話システム | |
JP2007529831A (ja) | 音声対話型メッセージング方法及び装置 | |
KR101164379B1 (ko) | 사용자 맞춤형 컨텐츠 제작이 가능한 학습 장치 및 이를 이용한 학습 방법 | |
JPH10326176A (ja) | 音声対話制御方法 | |
JP3667615B2 (ja) | 音声対話方法及びそのシステム | |
CN109460548B (zh) | 一种面向智能机器人的故事数据处理方法及系统 | |
JP2001022370A (ja) | 音声案内装置 | |
JP2002259113A (ja) | 音声マクロ処理装置、その方法、そのコンピュータ・プログラムおよびそのプログラムを記録した記録媒体 | |
US7092884B2 (en) | Method of nonvisual enrollment for speech recognition | |
JP2007065291A (ja) | 語学学習支援方法 | |
JP2006139162A (ja) | 語学学習装置 | |
KR20230007502A (ko) | 자동화된 어시스턴트 응답 제시의 핫워드 프리 선점 | |
JP3838193B2 (ja) | 文章読み上げ装置、同装置のためのプログラム及び記録媒体 | |
JP2020204683A (ja) | 電子出版物視聴覚システム、視聴覚用電子出版物作成プログラム、及び利用者端末用プログラム | |
JP2002023903A (ja) | ユーザ対話方法、この方法を実施する装置、およびこの方法を実行するプログラムを記憶する記憶媒体 | |
CN110289010B (zh) | 一种声音采集的方法、装置、设备和计算机存储介质 | |
JPH0816089A (ja) | 発音比較学習装置 | |
US20240257811A1 (en) | System and Method for Providing Real-time Speech Recommendations During Verbal Communication | |
JP7288530B1 (ja) | システムおよびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040520 |
|
RD05 | Notification of revocation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7425 Effective date: 20040527 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060413 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060425 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060822 |