JPH0792987A - 質問文内容構成方式 - Google Patents

質問文内容構成方式

Info

Publication number
JPH0792987A
JPH0792987A JP5234464A JP23446493A JPH0792987A JP H0792987 A JPH0792987 A JP H0792987A JP 5234464 A JP5234464 A JP 5234464A JP 23446493 A JP23446493 A JP 23446493A JP H0792987 A JPH0792987 A JP H0792987A
Authority
JP
Japan
Prior art keywords
voice
input
vocabulary
unit
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5234464A
Other languages
English (en)
Inventor
Kazuhiro Arai
和博 荒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5234464A priority Critical patent/JPH0792987A/ja
Publication of JPH0792987A publication Critical patent/JPH0792987A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 利用者に認識精度が高い音声応答を行わせる
ことができる質問文を生成する機能を持つ質問文内容構
成方式を提案する。 【構成】 利用者に与える質問文のうち、多肢択一式の
質問に関して選択肢の数に閾値を与えて少ない数の選択
肢に制限し、質問の際にすべての選択肢を利用者に呈示
する構成とする。この構成により、応答における発話内
容の範囲が限定されていることを利用者に理解させるこ
とができ、この結果、音声認識に適した音声応答を期待
でき、認識精度の向上を達することができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は質問のための音声を生
成する質問文内容構成方式に関する。
【0002】
【従来の技術】音声対話システムは、システムから質問
文音声を利用者に出力し、利用者はその質問文音声を聴
取して理解し、システムに応答するという形式により、
音声による情報の登録及び検索を行うものである。電話
回線のように利用できるメディアが音声だけに限定され
ている場合には、利用者に入力項目を明確にさせ、認識
処理に適した応答音声が得られるようにする目的から、
(1)語の前後にポーズを挿入する、(2)語の発話速
度を低下させる等の方法を用いて質問文音声の強調を行
っていた。
【0003】
【発明が解決しようとする課題】ところが、音声対話シ
ステムから出力される質問文の発話内容は、利用者が入
力すべき項目を考慮して作成されてはいない。このた
め、不特定多数の利用者が利用する音声対話システムで
は、以下の問題があった。 1.利用者が質問文を聴取し理解できたとしても、適切
な応答方法が分からなければ応答することができない。
【0004】2.利用者が質問文を理解でき応答したと
しても、音声対話システムが予測できる範囲を逸脱した
応答をした場合は、利用者の意図が伝わらない。 3.音声対話システムが予測できる範囲の利用者応答が
あった場合でも、予めシステムに登録されている認識対
象語彙以外の語を用いた応答であった場合は、音声認識
処理によって語彙を同定できない。
【0005】
【課題を解決するための手段】一般に音声対話システム
では、利用者に与える質問文の発話内容によって、利用
者の応答は大きく変化する。このため、利用者に与える
質問文はシステムの性能に大きな影響を与えるものと考
えられる。この発明では利用者に与える質問文のうち、
多肢択一の場合は選択肢の数に閾値を与えて少ない数の
選択肢に制限し、質問の際にすべての選択肢を呈示する
方法を採る。この方法により、応答における発話内容の
範囲が限定されていることを利用者に理解させることが
でき、音声認識に適した応答が期待でき、認識精度の向
上を達することができる。
【0006】
【実施例】図1はこの発明の一実施例である。以下で
は、図1をもとにこの発明による質問文内容構成方式の
実施例を詳細に説明する。図1において、10は音声出
力手段、20は音声入力手段、30は入力項目管理部、
40は語彙蓄積部である。音声出力手段10は、質問文
テンプレート蓄積部11と、発話内容生成部12と、音
声合成部13と、音声出力部14とから構成されてい
る。
【0007】音声入力手段20は音声入力部21と、音
声区間検出部22と、特徴量抽出部23と、音声認識部
24と、入力内容決定部25とから構成されている。以
下、各部の機能について述べる。入力項目管理部30
は、この発明による質問文内容構成方式への入力項目を
管理している。ここで入力項目とは、例えば列車等の座
席予約における乗車日、列車番号、乗車駅、降車駅、座
席の種類(指定席、グリーン席の別)等登録すべき情報
とする。更に、予め入力が予想される語彙を候補として
数え上げ、入力項目の属性として入力語彙候補を設定し
ておく。ここで、入力語彙候補とは、上述の例における
入力項目である「座席の種類」に対する「指定席」、
「グリーン席」或いは他の例として出身地に関する問い
に対して「各県名」などとする。
【0008】語彙蓄積部40には、この発明による方式
を用いて入力される語彙とそれらが発話された音声デー
タを分析して得られる特徴パラメータ時系列を予め登録
してある。各語彙は、入力項目管理部30で入力語彙候
補として、また、音声認識部24での音声認識処理で参
照され、本方式の処理結果として出力される。質問文テ
ンプレート蓄積部11は、本方式が利用者へ出力する質
問文テンプレートを蓄積している。例えば、項目名Aに
関して2つの選択肢B,Cのうち1つを入力項目として
選ばせる場面では、その内容にかかわらず、「Aは、
B,Cのいずれですか」という質問文を用いることがで
きる。また、選択肢が無い場合に対処するため、例えば
「Aは何ですか」という質問文も蓄積しておく。質問文
テンプレートは、項目名、選択肢ならびに項目名と選択
肢を結び付ける文型から構成される。質問文テンプレー
ト蓄積部11は、上述のような質問文のテンプレートを
蓄積しており、この発明による質問文内容構成方式が利
用者への出力音声を生成する際にアクセスされる。
【0009】発話内容生成部12には、選択肢の数を制
限するための閾値が格納されている。例えば出身地を問
う場合に県名を多数読み上げられても、利用者はどのよ
うに応答してよいか分からなくなる。このように入力語
彙候補の数(選択肢の数)が多数存在する場合は、一回
の質問に例えば3つの県名を並べて問い合わせし、この
中に出身地が存在するか否かを応答させ、これを繰り返
すことにより、多数の入力語彙候補の中から目的の入力
語彙候補を選び出すようにすればよい。選択肢の数を制
限するための閾値とはこの例では「3」と言うことにな
る。発話内容生成部12は、この閾値と、質問文テンプ
レート蓄積部11に蓄えられている質問文テンプレート
と、入力項目管理部30より得られる入力項目ならびに
入力語彙候補を参照して、利用者への出力音声の発話内
容を生成する。
【0010】音声合成部13は、発話内容生成部12に
おいて生成された発話内容を公知の方法によって音声信
号に変換する。音声出力部14は、音声合成部13にお
いて生成された音声信号を利用者に出力する。音声入力
部21は、利用者の応答音声を公知の収録装置等により
収録し、雑音除去等の音声認識に対する前処理を行う。
【0011】音声区間検出部22は、音声入力部21に
おいて入力された音声データの振幅値等を測定すること
により、当該音声データの発話開始時点と発話終了時点
を決定する。特徴量抽出部23は、音声区間検出部22
によって発話開始時点ならびに発話終了時点が付与され
た音声データの発話区間(発話開始時点から発話終了時
点まで)を公知の方法により分析し、特徴パラメータ時
系列の抽出を行う。
【0012】音声認識部24は、特徴量抽出部23にお
いて抽出された特徴パラメータ時系列と語彙蓄積部40
に蓄積された各語彙ごとの特徴パラメータ時系列とを公
知の方法により比較し、各語彙に対する入力音声の尤度
及び各語彙の入力音声における開始時点ならびに終了点
を出力する。入力内容決定部25は、音声認識部24に
おいて算出された各語彙に対する尤度及び語彙の開始点
及び終了点を参照し、各語彙の出現位置と出現順序の整
合性を検証することにより入力音声の発話内容を決定す
る。また、入力された内容が入力項目管理部30に登録
されている項目に合致しない場合には、質問文の再出力
を入力項目管理部30に通知する。
【0013】以下では図1に基づき本発明による質問文
音声生成法について述べる。この発明では、入力項目管
理部30において入力項目と入力語彙候補が設定されて
いる。例えば、列車の座席予約においては、「座席の種
類」という入力項目があり、「指定席」、「グリーン
席」等の入力語彙候補が入力項目管理部30に設定され
ている。質問文音声の発話内容を生成する際には、これ
らのデータが発話内容生成部12へ入力される。
【0014】発話内容生成部12は前記入力データに基
づき、発話内容生成のために以下の処理を行う。 (1a)入力項目管理部30に設定された入力語彙候補
の数が、発話内容生成部12に格納された閾値以下であ
る場合には、以下の処理(2a),(3a),(4)を
行う。
【0015】(1b)選択肢の数が閾値より大きい場
合、以下の処理(2b),(3b)を行う。 (2a)質問文テンプレート蓄積部11から選択肢の数
が入力候補語彙数と等しく、すべての選択肢を呈示する
質問文テンプレートを選び、出力質問文内容の基本とす
る。上述の例では、入力語彙候補の数は2であり、質問
文テンプレートとして例えば「Aは、B,Cのいずれで
すか」が選ばれる。
【0016】(2b)質問文テンプレート蓄積部11か
ら選択肢の数が0の質問文テンプレートを選び、出力質
問文内容の基本とする。上述の例では、質問文テンプレ
ートとして例えば「Aは、何ですか」が選ばれる。つま
り、例えば「乗車日は何月何日ですか」のように質問文
テンプレートが選ばれる。 (3a)入力項目管理部30からのデータである入力項
目を用いて、当該質問文テンプレートの項目名を決定す
る。上述の例では、項目名は「座席の種類」であり、こ
れを質問文テンプレートに適用することにより質問文内
容は、例えば「座席の種類は、B,Cのいずれですか」
となる。
【0017】(3b)入力項目管理部30からのデータ
である入力項目を用いて、当該質問文テンプレートの項
目名を決定する。上述の例では、項目名は「座席の種
類」であり、これを質問文テンプレートに適用すること
により、質問文内容は、例えば「座席の種類は、何です
か」となる。 (4)入力項目管理部30からのデータである入力語彙
候補を用いて、当該質問文テンプレートの選択肢を決定
する。上述の例では、選択肢は「指定席」、「グリーン
席」であり、これを質問文テンプレートに適用すること
により質問文内容は、例えば「座席の種類は、指定席、
グリーン席のいずれですか」となる。
【0018】発話内容生成部12において生成された発
話内容は、音声合成部13へ入力され、公知の方法によ
り音声信号に変換され、更に音声出力部14を介して利
用者に呈示される。上述の処理によって生成された質問
文が利用者に提示された後、利用者は提示された質問文
に対する応答を行う。前記、応答は音声入力部21への
入力となり、音声区間検出部22,特徴量抽出部23,
音声認識部24,語彙蓄積部40を経て処理され、入力
内容決定部25への入力となる。
【0019】入力内容決定部25は、入力項目管理部3
0を参照して、利用者の応答が入力候補の一つに合致す
るか否かを判定するため、以下の処理を行う。 (1)音声認識部24において算出された各語彙に対す
る尤度及び語彙の開始点及び終了点を参照し、各語彙の
出現位置と出現順序の整合性を検証することにより入力
音声の発話内容を決定する。
【0020】(2)発話内容に含まれる語と入力項目管
理部30において管理されている入力語彙候補を照合
し、発話内容中の語が入力語彙候補の1つに合致してい
る場合には(3a)の処理を行う。また、合致していな
い場合には(3b)の処理を行う。 (3a)当該項目は正しく入力されたものとして、入力
項目管理部30へ発話内容中に含まれ、入力語彙候補と
合致した語を入力項目として登録する。
【0021】(3b)当該項目は正しく入力されなかっ
たものとして、質問文の再出力を入力項目管理部30に
通知する。入力項目管理部30は、入力内容決定部25
から質問文の再出力の要請を受けた場合には、前述の処
理に基づいて質問文を作成し、利用者に提示する。ただ
し、利用者が正しく応答できなかったという事態を勘案
し、質問文テンプレート蓄積部11に蓄積されている質
問文テンプレートの中から応答の方法に更に強い制限を
加える内容の質問文テンプレートを選択する。例えば、
項目名Aに関して2つの選択肢B,Cのうちいずれか1
つを入力項目として選ばせる場合、一度目の質問では、
「Aは、B,Cのいずれですか」等の質問文テンプレー
トを用いるが、利用者が正しく応答できなかった場合に
は、「Aに関して、B,Cのいずれかだけをお答え下さ
い。」 等といった質問文テンプレートを用いる。
【0022】
【発明の効果】この発明の質問文内容構成方式によれ
ば、以下の効果が期待できる。 1.音声対話システムにおいて利用者に提示される質問
文において、選択肢の数を制限して明示することによ
り、利用者の応答を予め登録された入力候補語彙による
応答に誘導できる。
【0023】2.質問文テンプレートと入力項目から質
問文を構成することにより、同一の入力項目に対して、
強調の方法、文型等の異なる多様な質問文を作成でき
る。 3.入力項目の増加に際して、追加された項目に対応す
る質問文を作成する必要はなく、入力項目と入力語彙候
補を追加し、この追加した入力項目と入力語彙候補を質
問文テンプレートに当てはめることにより質問文を作成
できる。
【図面の簡単な説明】
【図1】この発明の一実施例を示すブロック図。
【符号の説明】
10 音声出力手段 20 音声入力手段 30 入力項目管理部 40 語彙蓄積部 11 質問文テンプレート蓄積部 12 発話内容生成部 13 音声合成部 14 音声出力部 21 音声入力部 22 音声区間検出部 23 特徴量抽出部 24 音声認識部 25 入力内容決定部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 音声を出力するための音声出力手段と、
    利用者からの応答音声を入力するための音声入力手段
    と、利用者からの応答音声によって入力すべき項目を管
    理する入力項目管理部と、入力された応答音声に対する
    処理を行う際に参照される語彙を蓄積している語彙蓄積
    部とから構成される質問文内容構成方式において、 上記音声出力手段から利用者に与える質問文のうち、多
    肢択一式の質問に関して選択肢の数に閾値を与えて少な
    い数の選択肢に制限し、質問の際にすべての選択肢を利
    用者に呈示する構成としたことを特徴とする質問文内容
    構成方式。
  2. 【請求項2】 音声を出力するための音声出力手段と、
    利用者からの応答音声を入力するための音声入力手段
    と、応答音声によって入力すべき項目を管理する入力項
    目管理部と、入力された応答音声に対する処理を行う際
    に参照される語彙を蓄積している語彙蓄積部とから構成
    される質問文内容構成方式において、 音声出力手段が、質問文のテンプレートを複数蓄積して
    いる質問文テンプレート蓄積部と、入力項目管理部から
    与えられる入力項目と自己に格納した選択肢の数を制限
    するための閾値とから質問文テンプレート蓄積部にある
    質問文テンプレートを選択し、質問文発話内容を生成す
    る発話内容生成部と、発話内容生成部で生成された発話
    内容を音声信号に変換する音声合成部と、音声合成部に
    おいて生成された音声信号を出力する音声出力部とを設
    けて構成され、 上記入力項目管理部が、音声応答によって入力されると
    予想される語彙を入力語彙候補として格納し、応答によ
    って入力された項目を処理結果として格納し、上記発話
    内容生成部における質問文発話内容の生成に際して質問
    項目を提供し、質問文を再出力する際に質問文テンプレ
    ートを再選択する機能を具備し、 上記音声入力手段が、音声認識に対する前処理を行う音
    声入力部と、音声入力部において入力された音声データ
    の発話開始時点と発話終了時点を音声区間として決定す
    る音声区間検出部と、音声区間が付与された前記音声デ
    ータの当該区間を分析し、特徴パラメータ時系列を抽出
    する特徴量抽出部と、特徴量抽出部において抽出された
    特徴パラメータ時系列と語彙蓄積部に蓄積された各語彙
    ごとの特徴パラメータ時系列とを比較し、各語彙に対す
    る入力音声の尤度及び各語彙の入力音声における開始点
    ならびに終了点を出力する音声認識部と、音声認識部に
    おいて算出された各語彙に対する尤度及び語彙の開始点
    及び終了点を参照し、各語彙の出現位置と出現順序の整
    合性を検証することにより入力音声の発話内容を決定
    し、応答内容が入力項目管理部に登録されている項目に
    合致しない場合に、質問文の再出力を入力項目管理部に
    通知する入力内容決定部とから構成されることを特徴と
    する質問文内容構成方式。
JP5234464A 1993-09-21 1993-09-21 質問文内容構成方式 Pending JPH0792987A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5234464A JPH0792987A (ja) 1993-09-21 1993-09-21 質問文内容構成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5234464A JPH0792987A (ja) 1993-09-21 1993-09-21 質問文内容構成方式

Publications (1)

Publication Number Publication Date
JPH0792987A true JPH0792987A (ja) 1995-04-07

Family

ID=16971418

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5234464A Pending JPH0792987A (ja) 1993-09-21 1993-09-21 質問文内容構成方式

Country Status (1)

Country Link
JP (1) JPH0792987A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001331192A (ja) * 2000-05-23 2001-11-30 Fujitsu Ten Ltd 音声コマンド案内装置
WO2011145169A1 (ja) * 2010-05-18 2011-11-24 三菱電機株式会社 エレベーターの呼び登録装置
JP2016057508A (ja) * 2014-09-10 2016-04-21 シャープ株式会社 音声対話装置、音声対話装置の制御方法、および制御プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001331192A (ja) * 2000-05-23 2001-11-30 Fujitsu Ten Ltd 音声コマンド案内装置
WO2011145169A1 (ja) * 2010-05-18 2011-11-24 三菱電機株式会社 エレベーターの呼び登録装置
CN102892697A (zh) * 2010-05-18 2013-01-23 三菱电机株式会社 电梯呼梯登记装置
JP5423884B2 (ja) * 2010-05-18 2014-02-19 三菱電機株式会社 エレベーターの呼び登録装置
JP2016057508A (ja) * 2014-09-10 2016-04-21 シャープ株式会社 音声対話装置、音声対話装置の制御方法、および制御プログラム

Similar Documents

Publication Publication Date Title
US20230317074A1 (en) Contextual voice user interface
US11037553B2 (en) Learning-type interactive device
US6839667B2 (en) Method of speech recognition by presenting N-best word candidates
JP4478939B2 (ja) 音声処理装置およびそのためのコンピュータプログラム
US7440900B2 (en) Voice message processing system and method
US7054817B2 (en) User interface for speech model generation and testing
CN104903954A (zh) 使用基于人工神经网络的亚语音单位区分的说话人验证及识别
JP2007114621A (ja) 会話制御装置
JP2005234572A (ja) 談話機能に対する予測モデルを判定する方法およびシステム
KR20140134653A (ko) 텍스트 투 스피치 및 시맨틱스에 기초한 오디오 인적 상호 증명 기법
JPH08508127A (ja) システムをトレーニングする方法、その結果得られる装置、およびその使用方法
CN106486121A (zh) 应用于智能机器人的语音优化方法及装置
CN112309406A (zh) 声纹注册方法、装置和计算机可读存储介质
JP3437617B2 (ja) 時系列データ記録再生装置
US7844459B2 (en) Method for creating a speech database for a target vocabulary in order to train a speech recognition system
US8423354B2 (en) Speech recognition dictionary creating support device, computer readable medium storing processing program, and processing method
KR102020773B1 (ko) 음성합성엔진을 이용한 멀티미디어 음성인식 자동 평가시스템
US11615787B2 (en) Dialogue system and method of controlling the same
CN112102807A (zh) 语音合成方法、装置、计算机设备和存储介质
JP2017204023A (ja) 会話処理装置
JPH0792987A (ja) 質問文内容構成方式
JPH10173769A (ja) 音声メッセージ検索装置
JPH09146580A (ja) 効果音検索装置
JP4220151B2 (ja) 音声対話装置
CN114328867A (zh) 一种人机对话中智能打断的方法及装置