JP4336808B2 - 音声対話プログラム生成システム及び記録媒体 - Google Patents
音声対話プログラム生成システム及び記録媒体 Download PDFInfo
- Publication number
- JP4336808B2 JP4336808B2 JP2000364121A JP2000364121A JP4336808B2 JP 4336808 B2 JP4336808 B2 JP 4336808B2 JP 2000364121 A JP2000364121 A JP 2000364121A JP 2000364121 A JP2000364121 A JP 2000364121A JP 4336808 B2 JP4336808 B2 JP 4336808B2
- Authority
- JP
- Japan
- Prior art keywords
- option
- program
- menu
- options
- evaluation value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【発明の属する技術分野】
本発明は、対話作成者が音声対話プログラムを容易に生成することができる音声対話プログラム生成システム及び方法に関する。特に、音声対話システムの一般的な形式であるメニュー選択形式のプログラム発話の生成において、選択肢の並び順や階層構造を自動的に決定することができる音声対話プログラム生成システム及び方法に関する。
【0002】
【従来の技術】
近年における情報処理関連技術の急速な発展に伴い、人間の音声や合成音声を活用した音声対話システムが、様々な分野において適用されてきている。かかる音声対話システムを構築するために、従来は、対話作成者がVXML等を用いて音声対話プログラムを直接記述するか、あるいは会話による状態遷移図を記述することで、自動的にプログラム変換する等の方法によって、音声対話プログラムを生成していた。
【0003】
例えば、図1に2段階の階層構造を有するメニュー選択方式の音声対話システムにおける状態遷移図の一例を示す。この場合、システム側から合成音声等によって「次の選択肢から一つ選択して下さい。」という発話があるごとに、対話者が選択肢に該当するものを発話していくことで、順次下位の階層へと移動し、各階層において新たな選択肢を選択して発話を行うことになる。
【0004】
図1に示す状態遷移図を音声対話プログラムとしてVXMLで記述した例を図2に示す。図2に示すように、VXMLはHTMLに類似したタグ言語であることから、プログラム作成者は階層構造を的確に把握しておかなければ正確なコーディングを行うことができないようになっている。
【0005】
【発明が解決しようとする課題】
しかしながら、上述したような方法で作成した音声対話プログラムにおいては、最初のプログラム作成時における選択肢の種類、あるいは階層構造に固定されていることから、利用者が繰り返し使用していくにつれて慣れが生じやすく、利用者が真に入力したい選択メニューに到達するまでの効率が必ずしも高くはならないという問題点が生じていた。
【0006】
すなわち、利用者が繰り返し使用することによって慣れが生じているシステムにおいては、初期画面の選択メニュー、あるいは利用者が真に入力したい選択メニューに到達するまでの階層における各選択メニューについては毎回同じ項目を入力しなければならず、固定された選択肢の種類、あるいは階層構造では、利用者にとっては入力が冗長であると感じることが多く、必ずしも使いやすいインタフェースとは言えないという問題点があった。
【0007】
例えば、同じシステムを繰り返し使用する場合、利用者にとっては耳慣れた選択肢が繰り返し発話され、なるべく早く利用者が真に入力したい選択メニューにおいて選択したいにもかかわらず、選択肢の並び順や階層構造はプログラム生成時の形式に固定されていることから、毎回必ず一定のメニュー経路に従って発話を聞かなければならず、利用者が真に入力したい選択メニューが深い階層にある場合にはその利用に煩わしさを感じてしまうことになり、継続的な使用が困難となってしまう。
【0008】
本発明は、上記問題点を解消するべく、開発者(音声対話システム作成者)が選択肢となるべき項目を指定するだけで、利用者にとって使いやすい音声対話プログラムを生成する音声対話プログラム生成システム及び方法を提供することを目的とする。
【0009】
【課題を解決するための手段】
上記目的を達成するために本発明にかかる音声対話プログラム生成システムは、メニューを構成する選択肢を入力する選択肢入力部と、選択肢の並び順及び階層構造を決定してメニューを生成するメニュー生成部と、生成されたメニューを具現化するプログラムコードを生成するプログラム生成部とを含む音声対話プログラム生成システムであって、プログラムコードで示されるプログラムを起動するプログラム起動部と、プログラムが保存する利用履歴を参照して選択肢に関する所定の評価値を算出する評価値決定部をさらに含み、メニュー生成部において、評価値に基づいて選択肢の並び順及び前記メニューにおける階層構造を決定することを特徴とする。
【0010】
かかる構成により、一定の時間内に選択される確率の高い選択肢を読み上げることができるとともに、できるだけ多くの選択肢を読み上げることができるように選択肢の並び順及び選択肢の階層構造を決定することができるので、利用者にとって利用時に選択したい選択肢がなかなか読み上げられないとか、選択したい選択肢を有するメニューまで到達するのが面倒であるといったストレスが生じることなく使用することができる音声対話プログラムのソースコードを容易に生成することが可能となる。
【0011】
また、本発明にかかる音声対話プログラム生成システムは、入力された選択肢の読み上げ時間を計測する読み上げ時間計測部をさらに含み、評価値を、利用履歴から求めた選択肢が選択される確率と選択された選択肢が読み終わるまでの読み上げ時間の累積時間との積の総和で示される期待値とし、選択肢に関する全ての並び順について計算した期待値のうち、期待値が最小となる並び順に選択肢を並べるとともに、最初の選択肢から順次読み上げ時間を累積し、累積値が所定のしきい値を超えた場合に所定のしきい値を超えた時点の選択肢以降の選択肢を下位の階層に分類することが好ましい。期待値が最小であるということは、それだけ早期に利用者の選択したい選択肢が読み上げられることと同義であり、利用者にとってより使用しやすい音声対話プログラムを生成することができるからである。
【0012】
また、本発明にかかる音声対話プログラム生成システムは、利用履歴から求めた選択肢が選択される確率が均等である場合において、評価値を選択肢の読み上げ時間とし、読み上げ時間が短い選択肢から順に並べるとともに、最初の選択肢から順次読み上げ時間を累積し、累積値が所定のしきい値を超えた場合に所定のしきい値を超えた時点の選択肢以降の選択肢を下位の階層に分類することが好ましい。選択肢が選択される確率が均等であれば、期待値を求めるまでもなく、読み上げ時間の大小によって利用者の選択したい選択肢が読み上げられる時期が容易に算出できるからである。
【0013】
また、本発明は、上記のような音声対話プログラム生成システムの有する機能をコンピュータの処理ステップとして実行するソフトウェアを特徴とするものであり、具体的には、メニューを構成する選択肢を入力する工程と、選択肢の並び順及び階層構造を決定してメニューを生成する工程と、生成されたメニューを具現化するプログラムコードを生成する工程とを含む音声対話プログラム生成システムであって、プログラムコードで示されるプログラムを起動する工程と、プログラムが保存する利用履歴を参照して選択肢に関する所定の評価値を算出する工程をさらに含み、メニューを生成する工程において、評価値に基づいて選択肢の並び順及びメニューにおける階層構造を決定する音声対話プログラム生成方法並びにそのような工程をプログラムとして記録したコンピュータ読み取り可能な記録媒体であることを特徴とする。
【0014】
かかる構成により、コンピュータ上へ当該プログラムをロードさせ実行することで、一定の時間内に選択される確率の高い選択肢を読み上げることができるとともに、できるだけ多くの選択肢を読み上げることができるように選択肢の並び順及び選択肢の階層構造を決定することができるので、利用者にとって利用時に選択したい選択肢がなかなか読み上げられないとか、選択したい選択肢を有するメニューまで到達するのが面倒であるといったストレスが生じることなく使用することができる音声対話プログラムのソースコードを容易に生成することができる音声対話プログラム生成システムを実現することが可能となる。
【0015】
【発明の実施の形態】
以下、本発明の実施の形態にかかる音声対話プログラム生成システムについて、図面を参照しながら説明する。図3は本発明の実施の形態にかかる音声対話プログラム生成システムの構成図である。
【0016】
図3において、1は選択肢入力部を示し、音声対話プログラムにおける選択肢の候補となる文字列を開発者が入力するものである。入力方法は特に限定されるものではなく、キーボード等の入力媒体からのキーインや、ファイル渡し、あるいは音声による入力と音声認識プログラムとを組み合わせることも考えられる。なお、開発者とは音声対話システム作成者をいうものとする。
【0017】
2はメニュー生成部を示しており、3に示す利用履歴格納部に格納されている利用者による選択肢の選択履歴情報に基づいて、選択肢の並び順及び選択肢の階層構造を決定するものである。選択履歴情報は、利用者が本システムを利用するごとに更新されるものであり、最新の統計情報に基づいて選択肢の並び順及び選択肢の階層構造を決定することが可能となる。
【0018】
利用履歴格納部3に格納されている選択肢の選択履歴情報としては、例えば選択された回数や、選択肢の読み上げ中のどのタイミングで選択肢として選択されたか等のプログラム実行時における履歴情報が考えられる。
【0019】
また、選択肢の選択履歴情報を個人別に格納しておくことも考えられる。この場合には、選択肢入力部1の前に利用者IDを入力する利用者ID入力部11を設けて、利用者を識別する必要がある。
【0020】
4はプログラムコード生成部を示しており、決定された選択肢の並び順及び選択肢の階層構造に応じて、VXMLのプログラムコードを生成するものである。選択肢の並び順及び選択肢の階層構造については、利用者が利用するごとに更新される利用履歴格納部3に格納されている選択肢の選択履歴情報に基づいて決定されることから、VXMLのプログラムコードについても利用するごとに改変されることになる。
【0021】
なお、本実施の形態においてはVXMLのプログラムコード生成の場合について説明しているが、生成されるプログラムコードとして特にこれに限定されるものではない。また、前回利用した際における選択順位を記録しておき、新たに計算した選択順位と比較することで、前回と同一の選択順位である場合にはプログラムコードを再生成することなく、前回生成されたプログラムコードをそのまま利用することも考えられる。
【0022】
5はプログラム起動部を示しており、生成されたVXMLのプログラムコードに基づいてプログラムを起動するものである。起動されたプログラムを実行した際における利用者の選択肢の選択状況等については、起動されたプログラムによって利用者履歴格納部3へ登録される。
【0023】
次に、図4は本発明の実施の形態1にかかる音声対話プログラム生成システムにおけるメニュー生成部2の構成図である。図4において、21は評価値計算部を示し、利用履歴格納部3に格納されている選択肢の選択履歴情報等に基づいて、入力された選択肢に関する評価値を計算するものである。評価値の種類は特に限定されるものではないが、例えば評価値として選択肢の並び順に基づいた各選択肢を選ぶのにかかると想定される時間(期待値)を採用する場合には、当該評価値が低ければ低いほど、利用者によって選択される確率の高い選択肢であると考えられる。
【0024】
また、22は(利用者)履歴参照部を示し、利用履歴格納部3に格納されている選択肢の選択履歴情報を参照して必要な情報を抽出し、評価値計算部21へ渡すものであり、23は並び順決定部を示し、選択肢の並び順を評価値計算部21において算出された各選択肢の評価値に基づいて、入力された選択肢を評価値の高い順に並べるものである。
【0025】
さらに、24は読み上げ時間計測部を示し、各選択肢について読み始めてから読み終わるまでの時間(以下、「読み上げ時間」という。)を計測するものであり、25は階層決定部を示し、読み上げ時間計測部24で計測した読み上げ時間に基づいて、所定の時間をしきい値として階層分類を行うものである。
【0026】
そして、26はメニュー決定部を示し、並び順決定部23で決定された選択肢の並び順、及び階層決定部25で決定された選択肢の階層構造に基づいてメニューの構成を決定するものである。
【0027】
まず、選択肢の並び順を決定する方法について説明する。利用者にとって、最も効率よく、あるいは心理的にストレスを溜めることなく選択肢から選択できるようにするためには、頻繁に選択される選択肢が選択肢の一つとして早期に読み上げられることが必要となる。したがって、本実施の形態においては、評価値として選択肢の並び順に基づいた各選択肢を選ぶのにかかると想定される時間(期待値)を採用するものとして、以下の手順について説明する。
【0028】
選択肢入力部1からn個(nは自然数)の選択肢が入力された場合、かかる選択肢の並び方としてはn!(nの階乗)通りの並び方が考えられる。これらの並び方の中から、利用者にとって最も選択する時間が短いであろうと想定される並び方を選択するために、期待値Lを(数1)のように算出する。
【0029】
【数1】
【0030】
(数1)において、Ciは選択肢iが選択される確率を、Tiは最初の選択肢を読み始めてから選択肢iが選択されるまでに要する時間を、それぞれ示している。所定の選択肢を選択するまでに要する時間はできるだけ短い方が利用者にとって便利であることから、(数1)に示す期待値Lが小さいほど利用者にとって好ましい並び順であるものと判断することが可能となる。
【0031】
また、最初の選択肢を読み始めてから選択肢iが選択されるまでに要する時間Tiについては、種々のバリエーションが考えられる。まず、一般的なのは、最初の選択肢を読み始めてから選択肢iを読み終わるまでに要する時間とすることである。この場合、利用者は選択したい選択肢iの内容をすべて聞き終えてから選択することになる。
【0032】
また、最初の選択肢を読み始めてから選択肢iが読み上げられていると判断できた時点までに要する時間とすることも考えられる。例えば選択肢が地名であり、「ひょうごきた」及び「ひょうごみなみ」であった場合には、「ひょうごき」あるいは「ひょうごみ」まで読み上げられた時点でどちらの選択肢が読み上げられているのかが判断できることから、「ひょうごき」あるいは「ひょうごみ」まで読み上げられた時点までに要した時間をTiとするものである。こうすることで、より実際の使用に即した並び順の判断が可能となる。
【0033】
さらに、最初の選択肢を読み始めてから、利用者が選択したい選択肢であると判断する選択肢iが読み上げられている場合に、実際に利用者が選択操作によって選択肢読み上げ処理に割り込むまでに要した時間とすることも考えられる。例えば同様の例について、「ひょうごきた」を選択する利用者が、統計的にはどの音が読み上げられた時点で選択割り込みを行うか否かについて判定し、最も統計的確率の高い時点(「ひょうごき」あるいは「ひょうごきた」が読み上げられた時点)までの時間をTiとするものである。こうすることで、さらに実際の選択状況を考慮に入れた判断をすることが可能となる。
【0034】
さらに具体例に基づいて説明する。例えば図5に示すように選択肢が選択される確率が同じである場合において、読み上げ時間が短い順に並べる場合と長い順に並べる場合とを比較する。
【0035】
まず図5(a)のように選択肢を読み上げ時間の短い順に並べる場合、期待値Lは、(数1)に示すように各選択肢の選択される確率と各選択肢を読み終わるまでの時間の積の総和であることから、(数2)のように計算される。
【0036】
【数2】
L=2×1/4+5×1/4+9×1/4+14×1/4
=7.5(秒)
一方、図5(b)のように選択肢を読み上げ時間の長い順に並べる場合、期待値Lは、同様に(数3)のように計算される。
【0037】
【数3】
L=5×1/4+9×1/4+12×1/4+14×1/4
=10(秒)
したがって、(数2)及び(数3)から明らかなように、読み上げ時間が短い順に並べる場合の方が長い順に並べる場合よりも期待値Lが小さいことから、読み上げ時間が短い順に並べる方が、利用者がより効率的に選択できる並び順であると言える。
【0038】
また、図6の例では、選択される確率に差があるとともに、特に読み上げ時間が長い選択肢が著しく選択される確率が高い場合を示している。この場合、まず図6(a)のように選択される確率の高い順に並べると、期待値Lは、(数4)のように計算される。
【0039】
【数4】
L=5×3/6+9×2/6+12×1/6+14×1/6
=9.83(秒)
一方、図6(b)のように選択される確率の低い順に並べる場合、期待値Lは、(数5)のように計算される。
【0040】
【数5】
L=2×1/6+5×1/6+9×2/6+14×3/6
=10.83(秒)
したがって、(数4)及び(数5)から明らかなように、読み上げ時間にかかわらず選択される確率が高い選択肢を先に並べた方が、利用者がより効率的に選択できる並び順であると言える。
【0041】
さらに図7のように選択される確率に差異は存在するものの、著しい差異とは考えられない場合には、一概に選択される確率が高い選択肢を先に並べた方がより効率的な並び順であるとは言えない。
【0042】
この場合、まず図7(a)のように選択される確率の高い順に並べると、期待値Lは、(数6)のように計算される。
【0043】
【数6】
L=4×3/10+9×3/10+12×2/10+14×2/10
=9.4(秒)
一方、図7(b)のように読み上げ時間の長さをも考慮して並び順を変更した場合、期待値Lは、(数7)のように計算される。
【0044】
【数7】
L=2×2/10+6×3/10+11×3/10+14×2/10
=8.3(秒)
したがって、(数6)及び(数7)から明らかなように、読み上げ時間の短い順に並べた方が効率的な並び方であるという観点をも考慮に入れて並び方を決定した方が、利用者がより効率的に選択できる並び順とすることができる。
【0045】
図8は、本発明の実施の形態にかかる音声対話プログラム生成システムにおいて選択肢の並びを決定する処理の概略の流れ図である。図8において、まず入力された選択肢についてすべての並び順を生成する(ステップS81)。入力された選択肢がn個(nは自然数)の場合には、n!(nの階乗)通りの並び順が生成されることになる。そして、各並び順ごとに順次所定の期待値を計算する(ステップS82)。
【0046】
計算された期待値がそれまでに一時記憶されている期待値よりも小さい場合には(ステップS83:Yes)、新たに計算された期待値及びその並び順が一時記憶される(ステップS84)。
【0047】
全ての並び順について期待値を計算するまで上述したような処理を繰り返し行い(ステップS85:No)、全ての並び順について期待値の計算が完了したら(ステップS85:Yes)、一時記憶されている期待値が最小の期待値であることから、その場合の並び順をもって、本システムによって生成される音声対話プログラムにおける選択肢の並び順として採用することになる(ステップS86)。
【0048】
次に、選択肢の階層構造を決定する方法について説明する。本実施の形態においては、並び順決定部23において決定した選択肢の並び順に基づいて、読み上げ時間計測部24において各選択肢の読み上げ時間を計測し、計測された読み上げ時間に応じて階層を決定する。
【0049】
例えば、利用者による割り込み応答(以下、「バージイン」という。)ができない場合においては、階層を設けなければ全ての選択肢について読み上げが完了しなければ利用者が応答入力することができず、音声対話システムとして冗長なシステムとなってしまう。
【0050】
そこで、例えば図9に示すような選択肢が入力された場合、利用者がストレスを感じることなく選択肢の読み上げを聞き続けることができる生理的限界時間を設定することにより、当該限界時間を超える選択肢以降の選択肢については下位の階層とし、以下順次、下位階層に分類していくことが考えられる。例えば当該限界時間を15秒とすると、読み終わる時間が15秒を超えない範囲にある選択肢まで、すなわち「ダブルバーガー」までは第一階層であるが、読み終わる時間が15秒を超える選択肢から、すなわち「エクストラバーガー」からは、次の下位階層へと分類される。以下、順次分類していくことによって、最終的なメニュー構成としては、図10に示すような3段階の階層構造を生成することになる。
【0051】
図11は、本発明の実施の形態にかかる音声対話プログラム生成システムにおいて選択肢の階層構造を決定する処理の流れ図である。図11において、まず入力された選択肢及び決定された選択肢の並び順を取得する(ステップS111)。
【0052】
次に、各選択肢の読み上げ時間を計測し(ステップS112)、決定した選択肢の並び順に応じて順次読み上げ時間を累積する(ステップS113)。累積時間が所定のしきい値を超えたら(ステップS114:Yes)、超えた時点の選択肢以降の選択肢は下位の階層に分類される(ステップS115)。同時に、累積されている累積時間から所定のしきい値を減算する(ステップS116)。
【0053】
そして、すべての選択肢について上述したような処理を繰り返し行い、全ての選択肢について処理が完了した時点で(ステップS117:Yes)、入力された選択肢の階層構造が決定されることになる。
【0054】
以上のように本実施の形態によれば、一定の時間内に選択される確率の高い選択肢を読み上げることができるとともに、できるだけ多くの選択肢を読み上げることができるように選択肢の並び順及び選択肢の階層構造を決定することができるので、利用者にとって利用時に選択したい選択肢がなかなか読み上げられないとか、選択したい選択肢を有するメニューまで到達するのが面倒であるといったストレスが生じることなく使用することができる音声対話プログラムのソースコードを容易に生成することが可能となる。
【0055】
なお、本発明の実施の形態にかかる音声対話プログラム生成システムを実現するプログラムを記憶した記録媒体は、図12に示す記録媒体の例に示すように、CD−ROM122−1やフロッピーディスク122−2等の可搬型記録媒体122だけでなく、通信回線の先に備えられた他の記憶装置121や、コンピュータ123のハードディスクやRAM等の記録媒体124のいずれでも良く、プログラム実行時には、プログラムはローディングされ、主メモリ上で実行される。
【0056】
また、本発明の実施の形態にかかる音声対話プログラム生成システムにより生成された利用者履歴情報等を記録した記録媒体も、図12に示す記録媒体の例に示すように、CD−ROM122−1やフロッピーディスク122−2等の可搬型記録媒体122だけでなく、通信回線の先に備えられた他の記憶装置121や、コンピュータ123のハードディスクやRAM等の記録媒体124のいずれでも良く、例えば本発明にかかる音声対話プログラム生成システムを利用する際にコンピュータ123により読み取られる。
【0057】
(付記1) メニューを構成する選択肢を入力する選択肢入力部と、
前記選択肢の並び順及び階層構造を決定してメニューを生成するメニュー生成部と、
生成された前記メニューを具現化するプログラムコードを生成するプログラム生成部とを含む音声対話プログラム生成システムであって、
前記プログラムコードで示されるプログラムを起動するプログラム起動部と、前記プログラムが保存する利用履歴を参照して前記選択肢に関する所定の評価値を算出する評価値決定部をさらに含み、
前記メニュー生成部において、前記評価値に基づいて選択肢の並び順及び前記メニューにおける階層構造を決定することを特徴とする音声対話プログラム生成システム。
【0058】
(付記2) 入力された選択肢の読み上げ時間を計測する読み上げ時間計測部をさらに含み、前記評価値を、前記利用履歴から求めた前記選択肢が選択される確率と選択された前記選択肢が読み終わるまでの前記読み上げ時間の累積時間との積の総和で示される期待値とし、前記選択肢に関する全ての並び順について前記期待値を計算し、前記期待値が最小となる並び順に前記選択肢を並べるとともに、最初の選択肢から順次前記読み上げ時間を累積し、累積値が所定のしきい値を超えた場合に前記所定のしきい値を超えた時点の選択肢以降の選択肢を下位の階層に分類する付記1記載の音声対話プログラム生成システム。
【0059】
(付記3) 前記利用履歴から求めた前記選択肢が選択される確率が均等である場合において、前記評価値を前記選択肢の読み上げ時間とし、前記読み上げ時間が短い前記選択肢から順に並べるとともに、最初の選択肢から順次前記読み上げ時間を累積し、累積値が所定のしきい値を超えた場合に前記所定のしきい値を超えた時点の選択肢以降の選択肢を下位の階層に分類する付記1記載の音声対話プログラム生成システム。
【0060】
(付記4) 前記利用履歴から求めた前記選択肢が選択される確率が均等である場合において、前記評価値を前記選択肢の内容を把握することができる最小の読み上げ時間とし、前記最小の読み上げ時間が短い前記選択肢から順に並べるとともに、最初の選択肢から順次前記読み上げ時間を累積し、累積値が所定のしきい値を超えた場合に前記所定のしきい値を超えた時点の選択肢以降の選択肢を下位の階層に分類する付記1記載の音声対話プログラム生成システム。
【0061】
より実際の使用状況に即した並び順の判断が可能となるからである。
【0062】
(付記5) 前記利用履歴から求めた前記選択肢が選択される確率が均等である場合において、前記評価値を利用者が前記選択肢を選択するために選択割り込みを行うまでの統計的な時間とし、前記統計的な時間が短い前記選択肢から順に並べるとともに、最初の選択肢から順次前記統計的な時間を累積し、累積値が所定のしきい値を超えた場合に前記所定のしきい値を超えた時点の選択肢以降の選択肢を下位の階層に分類する付記1記載の音声対話プログラム生成システム。
【0063】
さらに実際の選択状況を考慮に入れた判断をすることが可能となるからである。
【0064】
(付記6) メニューを構成する選択肢を入力する工程と、
前記選択肢の並び順及び階層構造を決定してメニューを生成する工程と、
生成された前記メニューを具現化するプログラムコードを生成する工程とを含む音声対話プログラム生成システムであって、
前記プログラムコードで示されるプログラムを起動する工程と、
前記プログラムが保存する利用履歴を参照して前記選択肢に関する所定の評価値を算出する工程をさらに含み、
前記メニューを生成する工程において、前記評価値に基づいて選択肢の並び順及び前記メニューにおける階層構造を決定することを特徴とする音声対話プログラム生成方法。
【0065】
(付記7) メニューを構成する選択肢を入力するステップと、
前記選択肢の並び順及び階層構造を決定してメニューを生成するステップと、
生成された前記メニューを具現化するプログラムコードを生成するステップとを含む音声対話プログラム生成方法を実現するコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記プログラムコードで示されるプログラムを起動するステップと、
前記プログラムが保存する利用履歴を参照して前記選択肢に関する所定の評価値を算出するステップをさらに含み、
前記メニューを生成するステップにおいて、前記評価値に基づいて選択肢の並び順及び前記メニューにおける階層構造を決定することを特徴とするコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
【0066】
【発明の効果】
以上のように本発明にかかる音声対話プログラム生成システムによれば、一定の時間内に選択される確率の高い選択肢を読み上げることができるとともに、できるだけ多くの選択肢を読み上げることができるように選択肢の並び順及び選択肢の階層構造を決定することができるので、利用者にとって利用時に選択したい選択肢がなかなか読み上げられないとか、選択したい選択肢を有するメニューまで到達するのが面倒であるといったストレスが生じることなく使用することができる音声対話プログラムのソースコードを容易に生成することが可能となる。
【図面の簡単な説明】
【図1】 従来の音声対話プログラム生成システムにおけるメニュー選択の状態遷移例示図
【図2】 従来の音声対話プログラム生成システムにおけるコーディング例示図
【図3】 本発明の実施の形態にかかる音声対話プログラム生成システムの構成図
【図4】 本発明の実施の形態にかかる音声対話プログラム生成システムにおけるメニュー生成部の構成図
【図5】 本発明の実施の形態にかかる音声対話プログラム生成システムにおける選択肢の例示図
【図6】 本発明の実施の形態にかかる音声対話プログラム生成システムにおける選択肢の例示図
【図7】 本発明の実施の形態にかかる音声対話プログラム生成システムにおける選択肢の例示図
【図8】 本発明の実施の形態にかかる音声対話プログラム生成システムにおける選択肢並び順決定処理の流れ図
【図9】 本発明の実施の形態にかかる音声対話プログラム生成システムにおける選択肢の例示図
【図10】 本発明の実施の形態にかかる音声対話プログラム生成システムにおける階層構造の例示図
【図11】 本発明の実施の形態にかかる音声対話プログラム生成システムにおける選択肢階層構造決定処理の流れ図
【図12】 記録媒体の例示図
【符号の説明】
1 選択肢入力部
2 メニュー生成部
3 利用者履歴格納部
4 プログラムコード生成部
5 プログラム起動部
11 利用者ID入力部
21 期待値計算部
22 利用者履歴参照部
23 並び順決定部
24 読み上げ時間計測部
25 階層構造決定部
26 メニュー決定部
111 回線先の記憶装置
112 CD−ROMやフロッピーディスク等の可搬型記録媒体
112−1 CD−ROM
112−2 フロッピーディスク
113 コンピュータ
114 コンピュータ上のRAM/ハードディスク等の記録媒体
Claims (6)
- メニューを構成する選択肢を入力する選択肢入力部と、
前記選択肢の並び順及び階層構造を決定してメニューを生成するメニュー生成部と、
当該生成された前記メニューを具現化するプログラムコードを生成するプログラム生成部と、
前記プログラムコードで示されるプログラムを起動するプログラム起動部と、
前記プログラムによる利用履歴を保存する利用履歴格納部と、
前記プログラムが保存する利用履歴を参照して前記選択肢に関する所定の評価値を算出する評価値決定部を備え、
前記メニュー生成部は、更に、前記入力された選択肢の読み上げ時間を計測する読み上げ時間計測部を備え、前記評価値を、前記利用履歴から求めた前記選択肢が選択される確率と選択された前記選択肢が読み終わるまでの前記読み上げ時間の累積時間との積の総和で示される期待値とし、前記期待値が最小となる並び順に基づいて選択肢の並び順を決定することを特徴とする音声対話プログラム生成システム。 - 前記メニュー生成部は、更に、最初の選択肢から順次前記読み上げ時間を累積し、累積値が所定のしきい値を超えた場合に前記所定のしきい値を超えた時点の選択肢以降の選択肢を下位の階層に分類して前記メニューにおける階層構造を決定する請求項1記載の音声対話プログラム生成システム。
- メニューを構成する選択肢を入力する選択肢入力部と、
前記選択肢の並び順及び階層構造を決定してメニューを生成するメニュー生成部と、
生成された前記メニューを具現化するプログラムコードを生成するプログラム生成部と、
前記プログラムコードで示されるプログラムを起動するプログラム起動部と、
前記プログラムが保存する利用履歴を参照して前記選択肢に関する所定の評価値を算出する評価値決定部とを備え、
前記メニュー生成部において、前記評価値に基づいて選択肢の並び順及び前記メニューにおける階層構造を決定する音声対話プログラム生成システムであって、
前記利用履歴から求めた前記選択肢が選択される確率が均等である場合において、前記評価値を前記選択肢の読み上げ時間とし、前記読み上げ時間が短い前記選択肢から順に並べるとともに、最初の選択肢から順次前記読み上げ時間を累積し、累積値が所定のしきい値を超えた場合に前記所定のしきい値を超えた時点の選択肢以降の選択肢を下位の階層に分類する音声対話プログラム生成システム。 - 音声対話プログラム生成方法を実現するコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
メニューを構成する選択肢を入力するステップと、
前記選択肢の並び順及び階層構造を決定してメニューを生成するステップと、
当該生成された前記メニューを具現化するプログラムコードを生成するステップと、
前記プログラムコードで示されるプログラムを起動するステップと、
前記プログラムによる利用履歴を保存するステップと、
前記プログラムが保存する利用履歴を参照して前記選択肢に関する所定の評価値を算出するステップをコンピュータに実行させ、
前記メニューを生成するステップは、更に、前記入力された選択肢の読み上げ時間を計測する読み上げ時間計測ステップを有し、前記評価値を、前記利用履歴から求めた前記選択肢が選択される確率と選択された前記選択肢が読み終わるまでの前記読み上げ時間の累積時間との積の総和で示される期待値とし、前記期待値が最小となる並び順に基づいて選択肢の並び順を決定するステップである、コンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。 - 前記メニューを生成するステップは、更に、最初の選択肢から順次前記読み上げ時間を累積し、累積値が所定のしきい値を超えた場合に前記所定のしきい値を超えた時点の選択肢以降の選択肢を下位の階層に分類して前記メニューにおける階層構造を決定するステップである、請求項4に記載のコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
- メニューを構成する選択肢を入力するステップと、
前記選択肢の並び順及び階層構造を決定してメニューを生成するステップと、
生成された前記メニューを具現化するプログラムコードを生成するステップと、
前記プログラムコードで示されるプログラムを起動するステップと、
前記プログラムが保存する利用履歴を参照して前記選択肢に関する所定の評価値を算出するステップとを実行し、
前記メニューを生成するステップにおいて、前記評価値に基づいて選択肢の並び順及び前記メニューにおける階層構造を決定する音声対話プログラム生成方法を実現するコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記利用履歴から求めた前記選択肢が選択される確率が均等である場合において、前記評価値を前記選択肢の読み上げ時間とし、前記読み上げ時間が短い前記選択肢から順に並べるとともに、最初の選択肢から順次前記読み上げ時間を累積し、累積値が所定のしきい値を超えた場合に前記所定のしきい値を超えた時点の選択肢以降の選択肢を下位の階層に分類するコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000364121A JP4336808B2 (ja) | 2000-11-30 | 2000-11-30 | 音声対話プログラム生成システム及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000364121A JP4336808B2 (ja) | 2000-11-30 | 2000-11-30 | 音声対話プログラム生成システム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002169589A JP2002169589A (ja) | 2002-06-14 |
JP4336808B2 true JP4336808B2 (ja) | 2009-09-30 |
Family
ID=18835120
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000364121A Expired - Fee Related JP4336808B2 (ja) | 2000-11-30 | 2000-11-30 | 音声対話プログラム生成システム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4336808B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070233495A1 (en) * | 2006-03-29 | 2007-10-04 | International Business Machines Corporation | Partially automated technology for converting a graphical interface to a speech-enabled interface |
JP5897240B2 (ja) * | 2008-08-20 | 2016-03-30 | 株式会社ユニバーサルエンターテインメント | 顧客対応システム、並びに会話サーバ |
JP6604542B2 (ja) * | 2015-04-02 | 2019-11-13 | パナソニックIpマネジメント株式会社 | 対話方法、対話プログラム及び対話システム |
-
2000
- 2000-11-30 JP JP2000364121A patent/JP4336808B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002169589A (ja) | 2002-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100563365B1 (ko) | 계층적 언어 모델 | |
US7634406B2 (en) | System and method for identifying semantic intent from acoustic information | |
Gupta et al. | The AT&T spoken language understanding system | |
CA2198306C (en) | Method and apparatus for an improved language recognition system | |
JP4849663B2 (ja) | 会話制御装置 | |
JP4724377B2 (ja) | 自然言語理解(NLU)システムにおける規則ベース文法に関するスロットおよび前終端記号(preterminal)に関する統計モデル | |
KR20190004495A (ko) | 챗봇을 이용한 태스크 처리 방법, 장치 및 시스템 | |
JP2005234572A (ja) | 談話機能に対する予測モデルを判定する方法およびシステム | |
JP6019604B2 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
JP2005301780A (ja) | 情報処理装置および情報処理方法、並びに、プログラム | |
JP6823809B2 (ja) | 対話行為推定方法、対話行為推定装置およびプログラム | |
JP6873805B2 (ja) | 対話支援システム、対話支援方法、及び対話支援プログラム | |
JP2001092496A (ja) | 連続音声認識装置および記録媒体 | |
CN117591663B (zh) | 一种基于知识图谱的大模型prompt生成方法 | |
CN114155839A (zh) | 一种语音端点检测方法、装置、设备及存储介质 | |
JP2008046633A (ja) | 平方根ディスカウンティングを使用した統計的言語による音声認識 | |
JP4820240B2 (ja) | 単語分類装置及び音声認識装置及び単語分類プログラム | |
JP4336808B2 (ja) | 音声対話プログラム生成システム及び記録媒体 | |
JP6806619B2 (ja) | 音声合成システム、音声合成方法、及び音声合成プログラム | |
US11756550B1 (en) | Integration of speech processing functionality with organization systems | |
JP2020204711A (ja) | 登録システム | |
WO2005072359A2 (en) | Method and apparatus for determining when a user has ceased inputting data | |
JP2022067223A (ja) | 生成装置および生成方法 | |
JP3949913B2 (ja) | 手話文認識装置およびユーザインタフェース | |
JP6988680B2 (ja) | 音声対話装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060323 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090120 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090323 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090602 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090609 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120710 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |