JP2006171399A

JP2006171399A - データ入力装置

Info

Publication number: JP2006171399A
Application number: JP2004364218A
Authority: JP
Inventors: Yoshifumi Hirose; 良文廣瀬; Makoto Nishizaki; 誠西崎; Yumiko Kato; 弓子加藤; Katsuyoshi Yamagami; 勝義山上; Takeo Oono; 剛男大野
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 2004-12-16
Filing date: 2004-12-16
Publication date: 2006-06-29

Abstract

【課題】入出力情報が音に限定される場合においても、ユーザに対話を中断させることなく対話の進捗率度を対話を中断することなく提示することができる音声対話装置を提供する。
【解決手段】複数のスロットから構成されるタスクフレームの各スロットにデータを入力する音声対話装置であって、ユーザからの各スロットへのデータの入力を受け付ける入力部１０１と、タスクフレームの複数のスロットへのデータの入力の進捗度を算出する対話管理部１０３と、タスクフレームに対応した音情報を記憶する音情報ＤＢ１０５と、進捗度に基づいて、音情報の変化または選択を行なう出力音生成部１０６と、ユーザへ各スロットのデータの入力を要求する音声出力部１０４と、音声出力部１０４によるデータの入力要求と同時に、変化または選択後の音情報を再生出力する音出力部１０７とを備える。
【選択図】図１

Description

本発明は、対話の進捗度をユーザに提示しながらデータを入力するためのデータ入力装置に関するものである。

従来、人間と機械との対話により、ユーザが所望する動作を実現する技術として、スロットフィリングという技術が知られている（例えば特許文献１参照）。図１０は特許文献１に記載された従来の対話装置を示す図である。

この対話装置は、発話者１との対話を通じて航空機の予約等を行なうための装置であり、音声処理部３、対話管理部５、スクリプトデータ記憶部７、知識ベース９、スロット１１および応答情報記憶部１３により構成されている。発話者１は対話形式により情報をシステムに伝える。対話管理部５は、発話内容解析部１９、対話処理部２１および知識ベース処理部２３により構成され、発話内容解析部１９は、発話者１より入力された発話情報より航空機の予約のために必要な情報を抽出し、スロット１１に記憶させる。また、対話処理部２１は、スロット１１に記憶された情報に基づいて、未だ取得されていない残余の情報の入力を促す応答情報を応答情報記憶部１３から取得し、発話者１に対して発話するため取得した応答情報を音声処理部３に出力する。このような対話装置により、例えば航空機の予約に必要なすべての情報がスロット１１に入力されると航空機の予約を行うという技術がある。
特開２００２−２３７８３号公報（段落００１２から段落００１９、第１図）

しかしながら、従来の対話装置を音声ポータルサービスなどの入出力情報が音に限定される場合に適用させるためには、対話の進捗度を視覚的情報により提示することができない。このため、対話の進捗度を言語表現に変換して、対話装置と対話者（以下「ユーザ」という。）との対話を一時的に中断しながら、進捗度を表す言語表現を挿入するなどの必要がある。

そのため、ユーザは対話の進捗度の提示を受けるたびに、対話を中断しなければならないという課題を有している。

本発明は、上述の課題を解決するためになされたもので、音声ポータルサービスなど入出力情報が音に限定される場合においても、ユーザに対話を中断させることなく対話の進捗度を提示することができるデータ入力装置を提供することを目的とする。

本発明に係るデータ入力装置は、ユーザと対話を行いながら、複数の項目から構成される少なくとも１つ以上の入力フレームの各項目にデータを入力するデータ入力装置であって、前記ユーザからの前記各項目へのデータの入力を受け付ける入力受け付け手段と、前記入力フレームの前記複数の項目へのデータの入力の進捗度を算出する進捗度算出手段と、前記入力フレームにそれぞれ対応した少なくとも１つ以上の音情報を記憶する音情報記憶手段と、前記進捗度に基づいて、前記音情報の変化または選択を行なう音情報変化手段と、前記ユーザへ前記各項目へのデータの入力を要求する入力要求手段と、前記入力要求手段によるデータの入力要求と同時に、変化または選択後の音情報を再生出力する音出力手段とを備えることを特徴とする。

この構成によると、入力フレームの複数の項目へのデータ入力の進捗度に応じて変化または選択された音情報がデータの入力要求と同時に再生出力される。このため、ユーザは、データ入力の進捗度を音情報変化等により直感的に知ることができる。このため、ユーザに対話を中断させることなく対話の進捗度をユーザに提示することが可能となる。

好ましくは、前記音情報変化手段は、前記入力フレームごとの前記進捗度に基づいて、前記入力フレームごとの重みを決定する重み決定部と、前記入力フレームごとの重みに基づいて、前記入力フレームに対応する音情報を混合する音混合部とを有することを特徴とする。

入力フレームごとの進捗度に基づいて、音情報が混合され、出力される。このため、音が大きく聞こえる音情報に対応する入力フレームへのデータ入力の進捗度が大きいことを、ユーザは直感的に理解することができる。

また、前記音情報変化手段は、前記入力フレームごとの前記進捗度が最大となる入力フレームを特定する入力フレーム特定部と、特定された前記入力フレームに対応する音情報を選択する音選択部とを有することを特徴としてもよい。

入力フレームごとの進捗度に基づいて、もっとも進捗度の高い入力フレームに対応する音情報が選択され、出力される。このため、現在のデータの入力時点で最も進捗度が大きい入力フレームを、ユーザは直感的に理解することができる。

さらに、前記進捗度算出手段は、所定の入力フレームの前記複数の項目へのデータの入力の進捗度を算出し、前記音情報変化手段は、前記進捗度に基づいて、前記所定の入力フレームに対応する音情報の音量、音源位置および音程のうちの少なくとも１つを変化させる
ことを特徴としてもよい。

進捗度の変化につれて、所定の入力フレームに対する音情報の音量等が変化する。このため、所定の入力フレームに対するデータの入力の進み具合がどの程度であるかを、ユーザは直感的に理解することができる。

なお、本発明は、このような特徴的な手段を備えるデータ入力装置として実現することができるだけでなく、データ入力装置に含まれる特徴的な手段をステップとするデータ入力方法として実現したり、データ入力方法に含まれる特徴的なステップをコンピュータに実行させるプログラムとして実現したりすることもできる。そして、そのようなプログラムは、ＣＤ−ＲＯＭ（Compact Disc-Read Only Memory）等の記録媒体やインターネット等の通信ネットワークを介して流通させることができるのは言うまでもない。

本発明の音声対話装置によれば、音声ポータルサービスなど音のモーダルのみの使用しかできない場合においても、ユーザに対話を中断させることなく、音声対話装置とユーザとの対話の進捗度をユーザに提示することが可能となる。

本発明は、ユーザが自分の目的に合う条件を順次入力することにより、多数あるタスクの候補の中から効率的にユーザの目的に合うタスクを検索する対話システムに適用される。

以下本発明の実施の形態について、図面を参照しながら説明する。

（実施の形態１）
図１は、本発明の実施の形態１に係る音声対話装置の構成を示すブロック図である。

音声対話装置１００は、スロットフィリングの技術を用い、かつユーザと音声による対話を通じて各種チケット等の予約を行なうためのシステムに用いられる装置であり、入力部１０１と、タスクフレームＤＢ（データベース）１０２と、対話管理部１０３と、音声出力部１０４と、音情報ＤＢ１０５と、出力音生成部１０６と、音出力部１０７とを備えている。

入力部１０１は、ユーザからの入力を受け付ける処理部である。ユーザからの入力方法は特に限定されるものではなく、例えば、マイクによる音声入力や、キーボードによるテキスト入力であっても構わない。

タスクフレームＤＢ１０２は対話システムが実行可能なタスクについての情報を保持するデータベースである。図２にタスクフレームＤＢの一例を示す。本実施の形態では、音声対話装置１００は、対話システムの一例であるチケット予約システムに用いられ、実行可能なタスクとしては、新幹線チケット予約、飛行機チケット予約、船チケット予約、バスチケット予約などがある。各フレームには、タスクを実行する為に必要なスロットが定義されている。例えば、新幹線チケット予約フレーム５０１には、新幹線のチケットを予約する為に必要な情報である「何時発」「何時着」「どこから」「どこまで」「車種」「座席」「喫煙」などがスロットとして定義され、それらの情報がスロットに記憶される。

対話管理部１０３は、タスクフレームＤＢ１０２と、入力部１０１からのユーザの入力とを参照しながら、ユーザとの対話を管理する処理部である。対話管理部１０３は、ユーザからの入力に基づいて、タスクフレームＤＢ１０２を参照して、ユーザからの入力中に各タスクフレームのスロットに関する情報が含まれているか否かを判断し、当該情報が含まれている場合には、各タスクフレームのスロットに当該情報を記憶する。例えば、ユーザが「６時発」と発声した場合には、対話管理部１０３は、各タスクフレームの「何時発」のスロットに「６時」という値を記憶する。また、タスク管理部は、必要に応じてユーザに次の入力を促す応答文を生成し、音声出力部１０４へ出力する。

音声出力部１０４は、対話管理部１０３より出力されるユーザへの応答文に対応する応答音声を生成して出力する処理部である。

音情報ＤＢ１０５は、タスクフレームＤＢ１０２に保持されているタスクに関連した音情報を格納する音情報ＤＢである。図３にタスクに関連する音情報の一例を示す。図３では、新幹線チケット予約に関連する音として、新幹線に関連する背景音、例えば、新幹線の走行音などの音声波形情報が音情報として保持されている。

出力音生成部１０６は、対話管理部１０３により管理されているタスクフレームＤＢ１０２の状態に基づいて、音情報ＤＢ１０５に保持されている音情報から出力音を生成する処理部である。

音出力部１０７は、出力音生成部１０６により生成された出力音を再生する処理部である。

次に、音声対話装置１００の実行する処理について図４のフローチャートを用いて説明する。

入力部１０１は、ユーザからの入力を受け付ける（Ｓ０１）。
対話管理部１０３は、対話が完了したか否かを判断し（Ｓ０２）、完了していれば（Ｓ０２でＹＥＳ）、処理を終了する。対話が完了したか否かの判断は、少なくとも１つのフレームの必須のスロットすべてにデータが書き込まれており、かつ、ユーザが入力部１０１において、処理の終了を宣言した場合か否かにより行なわれる。処理の終了の宣言は、例えば、ユーザが「処理を終了します」との入力をした場合などである。

対話が完了していなければ（Ｓ０２でＮＯ）、対話管理部１０３は、タスクフレームＤＢ１０２に保持されている各タスクのタスクフレームにおいて該当するスロットの値を埋める。例えば、ユーザが「６時発」と発声した場合には、各タスクフレームの「何時発」のスロットに「６時」という値を埋める。次に、対話管理部１０３は、現時点までにユーザが入力した項目と、各タスクのスロットの状況とに基づいて、スロットの充足度を算出し、その充足度を各タスクの進捗度とする（Ｓ０３）。スロットの充足度は、タスク適合度またはタスク再現度により算出される。タスク適合度およびタスク再現度は、それぞれ式１および式２により計算される。

対話管理部１０３は、必要に応じて、ユーザに次の入力を促す応答文を生成する（Ｓ０４）。例えば、「次の入力をお願いします」などといった応答文を生成する。応答文の生成方法は特に限定されるものではない。

一方、出力音生成部１０６は、対話管理部１０３が管理する各タスクの進捗度に基づいて音情報ＤＢ１０５に保持されているタスクに関連した音情報を用いて出力音を生成する（Ｓ０５）。

出力音生成方法について以下に説明する。図５は、出力音生成部１０６をより詳細に記述した図である。出力音生成部１０６は、重み決定部２０１と、音混合部２０２とを備えている。重み決定部２０１は、対話管理部１０３により管理されている各タスクの進捗度に基づいて、音情報ＤＢ１０５により保持されている各タスクに関連する音情報の混合比度、すなわち各タスクの重みを決定する処理部である。音混合部２０２は、重み決定部２０１により決定された重みに基づいて、音情報ＤＢ１０５に保持されている各タスクに関連した音情報を混合し出力音声を生成する処理部である。重み決定部２０１は、式１により計算されるタスク適合度に基づいて、各タスクの重みを計算する。例えば、対話途中において、ユーザが、「６時発」、「東京から」、「グリーン車で」という情報を入力したものとする。このとき、対話管理部１０３により管理される各タスクフレームのスロットには、図２に示すような値が埋められている。図６は、この場合に、各タスクの進捗度を式１および式２を用いて計算した結果を示す図である。この時、重み決定部２０１はタスク適合度に基づき各タスクの重みを決定する。図６に示す例の場合、新幹線のタスクの重みは１００÷（１００＋６７＋６７＋６７）＝０．３３となり、飛行機、船およびバスのタスクの重みは、６７÷（１００＋６７＋６７＋６７）＝０．２２となる。

重み決定部２０１は、タスク再現度に基づいて各タスクの重みを決定するようにしても良い。この場合、新幹線のタスクの重みは、４３÷（４３＋４０＋４０＋５０）＝０．３４となり、飛行機および船のタスクの重みは、４０÷（４３＋４０＋４０＋５０）＝０．３１となり、バスのタスクの重みは、５０÷（４３＋４０＋４０＋５０）＝０．３９となる。

次に音混合部２０２が、音情報ＤＢ１０５により保持されている各タスクに関連した音情報を、重み決定部２０１により決定された重みに基づいて混合する。

なお、出力音生成部１０６を図７に示すように構成してもよい。図７において、出力音生成部１０６は、タスク同定部３０１と、音選択部３０２とを備える。タスク同定部３０１は、対話管理部１０３により管理されている各タスクの進捗度に基づき、ユーザの目的とするタスクを同定する処理部である。音選択部３０２は、タスク同定部３０１により同定されたタスクに関連する音情報を音情報ＤＢ１０５より選択する処理部である。

タスク同定部３０１によるタスクの同定方法としては、タスク適合度を用いる。図６の例の場合、タスク適合度が最も高い「新幹線チケット予約」がタスク同定部３０１により同定される。音選択部３０２は、音情報ＤＢ１０５に保持されている「新幹線チケット予約」に関連する音情報を選択する。

再度図４に示されるフローチャートを用いて音声対話装置１００の実行する処理の続きについて説明する。音声出力部１０４は、対話管理部１０３により生成された応答文を再生する。また、音出力部１０７は、音声出力部１０４による応答文の再生と同じタイミングで、出力音生成部１０６により生成された各タスクに関連する音情報の混合音または選択された音情報を再生する（Ｓ０６）。

以上説明した本実施の形態に係る音声対話装置１００の構成によれば、対話管理部１０３が各タスクの進捗度を管理し、出力音生成部１０６が音情報ＤＢ１０５に保持されている音情報を各タスクの進捗度に基づいて混合または選択する。また、音声出力部１０４が、対話管理部１０３により生成されたユーザに対する応答文を音声出力するのに重畳して、音出力部１０７が、出力音生成部１０６により生成されたタスクの進捗度に基づく音情報をユーザに提示している。これにより、音声対話装置の内部状態である対話の進捗度（ユーザが所望しているであろうと音声対話装置が同定するタスク）を、音情報として対話のシーケンスと同時にユーザに提示することが可能となる。これにより、ユーザは、現在までの対話内容を、音声対話装置がどのように理解しているのかを確認しながら対話を進めることが可能になる。

また、応答文の音声出力に対話の進捗度等を示す音情報が重畳されて再生される。このため、ユーザに対話を中断させることなく、音声対話装置とユーザとの対話の進捗度をユーザに提示することができる。

（実施の形態２）
次に、本発明の実施の形態２に係る音声対話装置について図面を参照しながら説明する。実施の形態１に係る音声対話装置においては、タスクの進捗度を表現するために音情報を混合または選択し、再生を行なっていたが、実施の形態２に係る音声対話装置においては、タスクの進捗度を表現するために、音情報を加工して再生する点が実施の形態１とは異なる。

図８は、本発明の実施の形態２に係る音声対話装置の構成を示すブロック図である。
音声対話装置２００は、図１に示した音声対話装置１００の構成において出力音生成部１０６の代わりに出力音加工部４０１を用いたものである。その他の構成要素については、その機能および名称も同一であるため、同一の符号を用い、説明を省略する。

出力音加工部４０１は、対話管理部１０３により管理されているタスクの進捗度に基づいて、音情報ＤＢ１０５に保持されているタスクに関連した音情報を加工する処理部である。

次に、音声対話装置２００の実行する処理について図９のフローチャートを用いて説明する。なお、音声対話装置２００では、１つのタスク（例えば、新幹線予約に関するタスク）のみを実行するものとする。

入力部１０１は、ユーザからの入力を受け付ける（Ｓ１１）。
対話管理部１０３は、対話が完了したか否かを判断し（Ｓ１２）、完了していれば（Ｓ１２でＹＥＳ）、処理を終了する。対話が完了したか否かの判断は、実施の形態１に示した判断処理（図４のＳ０２）と同様である。

対話が完了していなければ（Ｓ１２でＮＯ）、対話管理部１０３は、タスクフレームＤＢ１０２に保持されているタスクフレームにおいて該当するスロットの値を埋める。例えば、ユーザが「６時発」と発声した場合には、タスクフレームの「何時発」のスロットに「６時」という値を埋める。次に、対話管理部１０３は、現時点までにユーザが入力した項目と、タスクのスロットの状況とに基づいて、タスクの進捗度を算出する（Ｓ１３）。ここでは、上述の式２により計算されるタスク再現度をタスクの進捗度とする。

対話管理部１０３は、必要に応じて、ユーザに次の入力を促す応答文を生成する（Ｓ１４）。例えば、「次の入力をお願いします」などといった応答文を生成する。応答文の生成方法は特に限定されるものではない。

一方、出力音加工部４０１は、対話管理部１０３が管理するタスクの進捗度に基づいて音情報ＤＢ１０５に保持されているタスクに関連した音情報を加工する（Ｓ１５）。

ここで、出力音加工部４０１の動作について以下に説明する。対話システムが実行可能なタスクが「新幹線チケット予約」であった場合について説明する。現在のタスクの状況が、図２に示す新幹線チケット予約フレーム５０１に示されているような状況の場合、タスクの進捗度は、式２のタスク再現度により計算され、０．４３と求められる。

出力音加工部４０１は、上述のタスク進捗度に基づいて、新幹線に関連する音情報を加工する。例えば、新幹線に関連する音情報が新幹線の走行音である場合、その新幹線の走行音の音量をタスク進捗度に応じて変更する。

または、音場制御技術を用いて新幹線走行音を出力する際の仮想音源位置をタスクの進捗度に応じて変更する。この場合、タスクの進捗度が高い程、仮想音源位置をユーザの近くに設定、すなわちタスク進捗度が１．０の時にはユーザの位置より音が出力されるように構成してもよい。

さらに、新幹線の走行音の高低をタスクの進捗度に応じて変更するようにしてもよい。この場合、タスクの進捗度が高いほど、新幹線の走行音が高い音により再生されるように構成してもよい。

再度図９に示されるフローチャートを用いて音声対話装置１００の実行する処理の続きについて説明する。音声出力部１０４は、対話管理部１０３により生成された応答文を再生する。また、音出力部１０７は、音声出力部１０４による応答文の再生と同じタイミングで、出力音加工部４０１により加工されたタスクに関連する音情報を出力する（Ｓ１６）。

以上説明した本実施の形態に係る音声対話装置２００の構成によれば、対話管理部１０３が各タスクの進捗度を管理し、出力音加工部４０１が音情報ＤＢ１０５に保持されている音情報を各タスクの進捗度に基づいて加工する。また、音声出力部１０４が、対話管理部１０３により生成されたユーザに対する応答文を音声出力するのに重畳して、音出力部１０７が出力音加工部４０１により加工されたタスクの進捗度に基づく音情報をユーザに提示している。これにより、音声対話装置の内部状態である対話の進捗度（タスクが実行可能状態になるまでの割合）を、音情報として対話のシーケンスと同時にユーザに提示することが可能となる。これにより、ユーザは、現在までの対話により、どの程度、対話システムがタスクを実行可能な状態にあるのかを、対話を中断することなく理解することが可能となる。

以上、本発明の実施の形態に係る音声対話装置について説明したが、本発明は、この実施の形態に限定されるものではない。今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

本発明にかかる音声対話装置は、ユーザとシステムとの対話の進捗度を音情報により提示する手段を有し、音声対話インタフェース等として有用である。またカーナビゲーションシステムやディジタルテレビ等の用途にも適用できる。

本発明の実施の形態１における音声対話装置の構成を示すブロック図である。タスクフレームＤＢが保持する各タスクのフレームの例を示す図である。音情報ＤＢが保持する各タスクに関連する音情報の例を示す図である。実施の形態１に係る音声対話装置が実行する処理のフローチャートである。出力音声生成部の構成を示す図である。対話管理部が管理する各タスクの進捗度の例を示す図である。出力音声生成部の構成を示す図である。本発明の実施の形態２における音声対話装置の構成を示すブロック図である。実施の形態２に係る音声対話装置が実行する処理のフローチャートである。従来の対話装置の構成を示すブロック図である。

符号の説明

１００，２００音声対話装置
１０１入力部
１０２タスクフレームＤＢ
１０３対話管理部
１０４音声出力部
１０５音情報ＤＢ
１０６出力音生成部
１０７音出力部
２０１重み決定部
２０２音混合部
３０１タスク同定部
３０２音選択部
４０１出力音加工部

Claims

ユーザと対話を行いながら、複数の項目から構成される少なくとも１つ以上の入力フレームの各項目にデータを入力するデータ入力装置であって、
前記ユーザからの前記各項目へのデータの入力を受け付ける入力受け付け手段と、
前記入力フレームの前記複数の項目へのデータの入力の進捗度を算出する進捗度算出手段と、
前記入力フレームにそれぞれ対応した少なくとも１つ以上の音情報を記憶する音情報記憶手段と、
前記進捗度に基づいて、前記音情報の変化または選択を行なう音情報変化手段と、
前記ユーザへ前記各項目へのデータの入力を要求する入力要求手段と、
前記入力要求手段によるデータの入力要求と同時に、変化または選択後の音情報を再生出力する音出力手段と
を備えることを特徴とするデータ入力装置。
前記音情報変化手段は、
前記入力フレームごとの前記進捗度に基づいて、前記入力フレームごとの重みを決定する重み決定部と、
前記入力フレームごとの重みに基づいて、前記入力フレームに対応する音情報を混合する音混合部とを有する
ことを特徴とする請求項１に記載のデータ入力装置。
前記音情報変化手段は、
前記入力フレームごとの前記進捗度が最大となる入力フレームを特定する入力フレーム特定部と、
特定された前記入力フレームに対応する音情報を選択する音選択部とを有する
ことを特徴とする請求項１に記載のデータ入力装置。
前記進捗度算出手段は、所定の入力フレームの前記複数の項目へのデータの入力の進捗度を算出し、
前記音情報変化手段は、前記進捗度に基づいて、前記所定の入力フレームに対応する音情報の音量、音源位置および音程のうちの少なくとも１つを変化させる
ことを特徴とする請求項１に記載のデータ入力装置。
前記進捗度算出手段は、前記入力フレームの前記複数の項目のうち、すでにデータが入力されている個数と、前記ユーザによるデータの入力回数との比から前記進捗度を算出する
ことを特徴とする請求項１〜４のいずれか１項に記載のデータ入力装置。
前記進捗度算出手段は、前記入力フレームの前記複数の項目のうち、すでにデータが入力されている個数と、当該入力フレームに含まれる前記複数の項目の総数との比から前記進捗度を算出する
ことを特徴とする請求項１〜４のいずれか１項に記載のデータ入力装置。
ユーザと対話を行いながら、複数の項目から構成される少なくとも１つ以上の入力フレームの各項目にデータを入力するデータ入力方法であって、
前記ユーザからの前記各項目へのデータの入力を受け付ける入力受け付けステップと、
前記入力フレームの前記複数の項目へのデータの入力の進捗度を算出する進捗度算出ステップと、
前記進捗度に基づいて、前記入力フレームにそれぞれ対応した少なくとも１つ以上の前記音情報の変化または選択を行なう音情報変化ステップと、
前記ユーザへ前記各項目へのデータの入力を要求する入力要求ステップと、
データの入力要求と同時に、変化または選択後の音情報を再生出力する音出力ステップと
を含むことを特徴とするデータ入力方法。
ユーザと対話を行いながら、複数の項目から構成される少なくとも１つ以上の入力フレームの各項目にデータを入力するためのプログラムであって、
前記ユーザからの前記各項目へのデータの入力を受け付ける入力受け付けステップと、
前記入力フレームの前記複数の項目へのデータの入力の進捗度を算出する進捗度算出ステップと、
前記進捗度に基づいて、前記入力フレームにそれぞれ対応した少なくとも１つ以上の前記音情報の変化または選択を行なう音情報変化ステップと、
前記ユーザへ前記各項目へのデータの入力を要求する入力要求ステップと、
データの入力要求と同時に、変化または選択後の音情報を再生出力する音出力ステップと
をコンピュータに実行させることを特徴とするプログラム。
ユーザと対話を行いながら、複数の項目から構成される少なくとも１つ以上の入力フレームの各項目にデータを入力するプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
請求項８に記載のプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。