JP5461967B2 - 音声シナリオ生成プログラム及び音声シナリオ生成装置 - Google Patents

音声シナリオ生成プログラム及び音声シナリオ生成装置 Download PDF

Info

Publication number
JP5461967B2
JP5461967B2 JP2009263773A JP2009263773A JP5461967B2 JP 5461967 B2 JP5461967 B2 JP 5461967B2 JP 2009263773 A JP2009263773 A JP 2009263773A JP 2009263773 A JP2009263773 A JP 2009263773A JP 5461967 B2 JP5461967 B2 JP 5461967B2
Authority
JP
Japan
Prior art keywords
scenario
voice
grammar
execution step
contents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009263773A
Other languages
English (en)
Other versions
JP2011108083A (ja
Inventor
隆也 角森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Advanced Engineering Ltd
Original Assignee
Fujitsu Advanced Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Advanced Engineering Ltd filed Critical Fujitsu Advanced Engineering Ltd
Priority to JP2009263773A priority Critical patent/JP5461967B2/ja
Publication of JP2011108083A publication Critical patent/JP2011108083A/ja
Application granted granted Critical
Publication of JP5461967B2 publication Critical patent/JP5461967B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stored Programmes (AREA)

Description

本発明は、音声シナリオ生成プログラム及び音声シナリオ生成装置に係り、特に音声システムで利用する音声シナリオを生成する音声シナリオ生成プログラム及び音声シナリオ生成装置に関する。
近年、工場や物流現場等の一部では、作業を効率化するため、音声認識技術を活用してデータ入力を行うようになった。音声認識技術を活用した音声システムでは例えばヘッドセットと呼ばれるイヤホンとマイクとを一体化した通話装置が利用されている。音声認識技術を活用した音声システム(以下、音声システムと呼ぶ)では、作業者への音声による指示(音声出力)と作業者からの音声による入力(音声入力)とで作業を進めることができる。
音声システムでは、作業者との会話の手順が示された音声シナリオと、音声を認識するための音声グラマー(変換グラマー)とを利用して、作業者への音声出力と作業者からの音声入力とを行う。具体的に、音声グラマーは音声データをテキストデータに変換する為の音声辞書として利用される。従来、音声システムでは音声シナリオをVoiceXML等でプログラム開発することにより実現していた(例えば特許文献1参照)。
VoiceXMLとはコンピュータを音声による指示で操作するユーザインタフェースを構築する為のXMLベースの言語である。また、音声システムでは音声グラマーについてもVoiceXML等でプログラム内に固定記述したものを個別に用意しておく必要があった。
特開2005−321730号公報
従来、音声システムはプログラム開発することにより実現するものであり、開発側で構築するものであった。従って、音声システムの音声シナリオや音声グラマーを運用側で変更することは技術的に難しかった。また、運用側は音声システムの音声シナリオや音声グラマーを変更するため、個別に音声システムの開発を開発側に依頼する場合、多大なコスト及び期間を必要としていた。
本発明の一実施形態は、上記の点に鑑みなされたもので、音声システムの開発における開発コストの削減と開発期間の短縮とが可能な音声シナリオ生成プログラム及び音声シナリオ生成装置を提供することを目的とする。
上記課題を解決するため、本発明の一実施形態は、コンピュータを、音声シナリオの各実行ステップの内容をシナリオマスタから取得し、取得した該実行ステップの内容に応じて、所定の記述言語で記述した音声シナリオを自動生成するシナリオ自動生成処理手段、出力項目と1つ以上の検索項目との対応をグラマーマスタから取得し、音声入力された内容を、前記音声入力された内容と一致した前記検索項目に対応する出力項目に変換するために利用する音声グラマーを自動生成するグラマー自動生成処理手段として機能させる為の音声シナリオ生成プログラムである。
なお、本発明の一実施形態の構成要素、表現又は構成要素の任意の組合せを、方法、装置、システム、コンピュータプログラム、記録媒体、データ構造などに適用したものも本発明の態様として有効である。
上述の如く、本発明の一実施形態によれば、音声システムの開発における開発コストの削減と開発期間の短縮とが可能である。
本実施例の音声シナリオ生成装置の一例のハードウェア構成図である。 音声シナリオ生成装置の一例のブロック図である。 在庫確認シナリオの一例のイメージ図である。 シナリオマスタの一例の構成図である。 シナリオ自動生成処理部の処理手順を表した一例のフローチャートである。 入出力シナリオ記述処理の一例のフローチャートである。 処理シナリオ記述処理の一例のフローチャートである。 分岐シナリオ記述処理の一例のフローチャートである。 終了シナリオ記述処理の一例のフローチャートである。 3桁コードマスタテーブルの一例の構成図である。 3桁コードマスタテーブルから音声グラマーを生成する手順を表したイメージ図である。 シナリオマスタの具体例を表した構成図(1/6)である。 シナリオマスタの具体例を表した構成図(2/6)である。 シナリオマスタの具体例を表した構成図(3/6)である。 シナリオマスタの具体例を表した構成図(4/6)である。 シナリオマスタの具体例を表した構成図(5/6)である。 シナリオマスタの具体例を表した構成図(6/6)である。 生成されたシナリオファイルのファイル名を表示した一例の画面イメージである。 生成されたシナリオファイルの内容を表す一例の構成図である。 生成されたシナリオファイルの内容を表す一例の構成図である。 生成されたシナリオファイルの内容を表す一例の構成図である。 生成されたシナリオファイルの内容を表す一例の構成図である。 生成されたシナリオファイルの内容を表す一例の構成図である。 生成されたシナリオファイルの内容を表す一例の構成図である。 生成されたシナリオファイルの内容を表す一例の構成図である。 生成されたシナリオファイルの内容を表す一例の構成図である。 生成されたシナリオファイルの内容を表す一例の構成図である。
次に、本発明を実施するための形態を、以下の実施例に基づき図面を参照しつつ説明していく。
図1は本実施例の音声シナリオ生成装置の一例のハードウェア構成図である。音声シナリオ生成装置1は、スタンドアローンの形態でも良いし、インターネットやLANなどのネットワーク経由でユーザ端末にデータ通信可能に接続された形態でもよい。
音声シナリオ生成装置1は、それぞれバスBで相互に接続されている入力装置11,出力装置12,ドライブ装置13,補助記憶装置14,主記憶装置15,演算処理装置16及びインターフェース装置17を有する。
入力装置11はキーボードやマウス等である。入力装置11は、各種信号を入力するために用いられる。出力装置12はディスプレイ装置等である。出力装置12は、各種ウインドウやデータ等を表示するために用いられる。インターフェース装置17は、モデム又はLANカード等である。インターフェース装置17は、ネットワークに接続する為に用いられる。
本実施例の音声シナリオ生成プログラムは、音声シナリオ生成装置1を制御する各種プログラムの少なくとも一部である。音声シナリオ生成プログラムは例えば記録媒体18の配布やネットワークからのダウンロードなどによって提供される。音声シナリオ生成プログラムを記録した記録媒体18はCD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。
音声シナリオ生成プログラムを記録した記録媒体18がドライブ装置13にセットされると、音声シナリオ生成プログラムは記録媒体18からドライブ装置13を介して補助記憶装置14にインストールされる。なお、ネットワークからダウンロードされた音声シナリオ生成プログラムは、インターフェース装置17を介して、補助記憶装置14にインストールされる。補助記憶装置14はインストールされた音声シナリオ生成プログラムを格納すると共に、必要なファイル,データ等を格納する。
主記憶装置15は、音声シナリオ生成プログラムの起動時に補助記憶装置14から音声シナリオ生成プログラムを読み出して格納する。そして、演算処理装置16は主記憶装置15に格納された音声シナリオ生成プログラムに従って、後述するような各種処理を実現している。
図2は音声シナリオ生成装置の一例のブロック図である。音声シナリオ生成装置1はシナリオマスタ21,グラマーマスタ22,シナリオ自動生成処理部23,グラマー自動生成処理部24,グラマー条件指定受付部25を有する。なお、図2では音声シナリオ生成装置1内にシナリオマスタ21,グラマーマスタ22を有しているが、音声シナリオ生成装置1外(例えばDBサーバなど)に設けてもよい。
シナリオマスタ21には、生成する音声シナリオ26の実行ステップが例えばテーブル形式で登録されている。シナリオ自動生成処理部23はシナリオマスタ21から音声シナリオの実行ステップを表すレコードを順次読み出し、読み出したレコードから音声シナリオ26を自動生成する。シナリオ自動生成処理部23は読み出したレコード毎にシナリオファイルを生成し、1つ以上のシナリオファイルにより音声シナリオ26を生成する。複数の音声シナリオ26を生成する場合、シナリオマスタ21には複数の音声シナリオ26毎に、音声シナリオ26の実行ステップがテーブル形式で登録されている。なお、シナリオ自動生成処理部23,シナリオマスタ21及び音声シナリオ26の詳細は後述する。
グラマー条件指定受付部25は、例えば音声シナリオ生成装置1を操作する管理者からの音声グラマー27の生成条件の指定を受け付ける。グラマーマスタ22には、音声入力される音声ワードを出力項目(変換語)に変換する為の1つ以上のテーブルが登録されている。なお、出力項目は音声システムで行うシナリオ制御処理において利用される。
そして、グラマー自動生成処理部24はグラマー条件指定受付部25が受け付けた音声グラマー27の生成条件に従い、グラマーマスタ22に登録されているレコードを読み出し、読み出したレコードから音声グラマー27を自動生成する。なお、グラマー条件指定受付部25,グラマー自動生成処理部24,グラマーマスタ22及び音声グラマー27の詳細は後述する。
以下では、自動生成する音声シナリオ26の一例として、図3に示す在庫確認シナリオを例に説明する。図3の在庫確認シナリオは、在庫確認に関係するステップと、終了確認に関係するステップとを含む。また、図3の在庫確認シナリオは音声システムからの音声指示31〜35と、データ処理36と、作業者の発話41〜43とを含む。
図3の在庫確認シナリオの場合、管理者は例えば図4に示すようなシナリオマスタ21を登録する。図4はシナリオマスタの一例の構成図である。図4に示したシナリオマスタ21は、項目として「No.」,「出力メッセージ」,「処理区分」,「入力格納変数」,「分岐No.1〜n」,「辞書名」,「データ処理名」,「指示パラメータ」,「戻り値」を有する。
項目「No.」は、シナリオの実行ステップを表している。実行ステップは、シナリオが分岐する場合、「分岐No.1〜n」に登録されている「No.」の実行ステップへ遷移する。例えば図4の例では「No.01」の実行ステップからシナリオを開始し、作業者が「はい」を入力した場合に「No.02」の実行ステップに遷移し、「いいえ」を入力した場合に「No.91」の実行ステップに遷移することを表している。
項目「出力メッセージ」は音声システムから作業者へ音声出力するメッセージを表している。例えば図4の例では「No.01」の実行ステップが、音声システムから作業者に対し、「作業を開始しますか?」というメッセージを音声出力することを表している。
項目「処理区分」は、実行ステップの区分「入出力」,「処理」,「分岐」又は「終了」を表している。「入出力」は、音声入力又は音声出力を実行する実行ステップであることを表している。「処理」は、データベース操作処理を実行する実行ステップであることを表している。「分岐」は、処理結果により分岐判別を行う実行ステップであることを表している。「終了」は、音声シナリオ26を終了する実行ステップであることを表している。
例えば図4の例では、「No.01」の実行ステップが、音声システムから作業者へ音声出力し、その音声出力に対して作業者から音声システムへ音声入力を行うことを表している。
「No.03」の実行ステップは、「ZaikoSearch.sql」のデータベース操作処理を実行することを表している。「No.04」の実行ステップは、「No.03」の実行ステップの結果、存在するアドレスの場合に「No.05」の実行ステップへ遷移し、存在しないアドレスの場合に「No.02」の実行ステップへ遷移することを表している。「No.93」の実行ステップは、実行中の音声シナリオ26を終了することを表している。
項目「入力格納変数」は、作業者から音声入力された音声ワードを格納する入力格納変数の名称を表している。例えば図4の例では、「No.01」の出力メッセージに対して作業者から入力された音声ワード(入力値)を入力格納変数「Outou01」に格納することを表している。
項目「分岐No.1〜n」は音声シナリオの分岐条件及び分岐先を表している。例えば図4の例では、「No.01」の実行ステップが、作業者の音声入力の内容によって「No.02」又は「No.91」の実行ステップに遷移することを表している。また、「No.04」の実行ステップは、「No.03」の実行ステップの結果によって、「No.05」又は「No.02」の実行ステップに遷移することを表している。
項目「辞書名」は作業者が入力した音声ワードをテキスト変換するために使用する音声グラマー27のファイル名を表している。例えば図4の例では、「No.01」の実行ステップが、作業者により入力された音声ワードの内容を「共通ワード辞書」という音声グラマー27により認識することを表している。
項目「データ処理名」はデータの検索・更新を必要とする場合に実行するデータ処理名を表している。例えば図4の例では、「No.03」の実行ステップが、データ処理名「ZaikoSearch.sql」のデータベース操作処理を実行することを表している。
項目「指示パラメータ」はデータベース操作処理を実行する際、データベース操作処理へ引き渡すパラメータを表している。例えば図4の例では、「No.03」の実行ステップが、「ZaikoSearch.sql」のデータベース操作処理へ入力格納変数「Outou02」に格納されている格納値をパラメータとして引き渡すことを表している。
また、項目「戻り値」はデータベース操作処理の処理結果を格納する入力格納変数の名称を表している。例えば図4の例では、「No.03」の実行ステップが、「ZaikoSearch.sql」のデータベース操作処理の処理結果を入力格納変数「kekka03」に格納することを表している。
(シナリオ自動生成処理部23)
図5はシナリオ自動生成処理部の処理手順を表した一例のフローチャートである。例えば音声シナリオ生成装置1を操作する管理者から音声シナリオ26の一例としての在庫確認シナリオの生成要求を受けると、ステップS1に進み、シナリオ自動生成処理部23はシナリオマスタ21から在庫確認シナリオに該当する図4のテーブルの最初のレコードを取得する。なお、図4のテーブルの最初のレコードは、在庫確認シナリオの最初の実行ステップに対応する。
ステップS2に進み、シナリオ自動生成処理部23はステップS1で取得したレコードの項目「処理区分」を確認する。ステップS3に進み、シナリオ自動生成処理部23はステップS2で確認した項目「処理区分」が「入出力」であるか否かを判定する。ステップS2で確認した項目「処理区分」が「入出力」であれば、シナリオ自動生成処理部23はステップS4に進み、後述の入出力シナリオ記述処理を行う。なお、入出力シナリオ記述処理では、取得したレコードに応じて、最初の実行ステップに対応するシナリオファイルをVoiceXMLで記述する。図4のテーブルでは、ステップS1で取得したレコードの項目「処理区分」が「入出力」であるため、ステップS4に進み、後述の入出力シナリオ記述処理を行ったあと、ステップS9に進む。
ステップS9では、シナリオ自動生成処理部23が、シナリオマスタ21から在庫確認シナリオに該当する図4のテーブルの次のレコードを取得したあと、ステップS2の処理に戻る。図4のテーブルでは、ステップS9で取得した2番目のレコードの項目「処理区分」が「入出力」であるため、ステップS4に進み、入出力シナリオ記述処理を行ったあと、ステップS9に進む。
ステップS9では、シナリオ自動生成処理部23が、シナリオマスタ21から在庫確認シナリオに該当する図4のテーブルの次のレコードを取得したあと、ステップS2の処理に戻る。図4のテーブルでは、ステップS9で取得した3番目のレコードの項目「処理区分」が「処理」である。
ステップS2で確認した項目「処理区分」が「入出力」でない為、シナリオ自動生成処理部23はステップS5に進み、ステップS2で確認した項目「処理区分」が「処理」であるか否かを判定する。
ステップS2で確認した項目「処理区分」が「処理」であれば、シナリオ自動生成処理部23はステップS6に進み、後述の処理シナリオ記述処理を行う。なお、処理シナリオ記述処理では、取得したレコードに応じて、3番目の実行ステップに対応するシナリオファイルをVoiceXMLで記述する。図4のテーブルでは、ステップS9で取得したレコードの項目「処理区分」が「処理」であるため、ステップS6に進み、後述の処理シナリオ記述処理を行ったあと、ステップS9に進む。
ステップS9では、シナリオ自動生成処理部23が、シナリオマスタ21から在庫確認シナリオに該当する図4のテーブルの次のレコードを取得したあと、ステップS2の処理に戻る。図4のテーブルでは、ステップS9で取得した4番目のレコードの項目「処理区分」が「分岐」である。
ステップS2で確認した項目「処理区分」が「入出力」でない為、シナリオ自動生成処理部23はステップS5に進む。また、ステップS2で確認した項目「処理区分」が「処理」でない為、シナリオ自動生成処理部23はステップS7に進み、ステップS2で確認した項目「処理区分」が「分岐」であるか否かを判定する。
ステップS2で確認した項目「処理区分」が「分岐」であれば、シナリオ自動生成処理部23はステップS8に進み、後述の分岐シナリオ記述処理を行う。なお、分岐シナリオ記述処理では、取得したレコードに応じて、4番目の実行ステップに対応するシナリオファイルをVoiceXMLで記述する。図4のテーブルでは、ステップS9で取得したレコードの項目「処理区分」が「分岐」であるため、ステップS8に進み、後述の分岐シナリオ記述処理を行ったあと、ステップS9に進む。
ステップS9では、シナリオ自動生成処理部23が、シナリオマスタ21から在庫確認シナリオに該当する図4のテーブルの次のレコードを取得したあと、ステップS2の処理に戻る。図4のテーブルでは、ステップS9で5,6及び7番目に取得したレコードの項目「処理区分」が「入出力」である。なお、ステップS9で取得したレコードの項目「処理区分」が「入出力」であるときの処理は前述した為、説明を省略する。
ステップS9では、シナリオ自動生成処理部23が、シナリオマスタ21から在庫確認シナリオに該当する図4のテーブルの8番目のレコードを取得したあと、ステップS2の処理に戻る。図4のテーブルでは、ステップS9で取得した8番目のレコードの項目「処理区分」が「終了」である。
ステップS2で確認した項目「処理区分」が「入出力」でない為、シナリオ自動生成処理部23はステップS5に進む。また、ステップS2で確認した項目「処理区分」が「処理」でない為、シナリオ自動生成処理部23はステップS7に進む。ステップS2で確認した項目「処理区分」が「分岐」でない為、シナリオ自動生成処理部23はステップS2で確認した項目「処理区分」が「終了」であると判定する。
ステップS10に進み、シナリオ自動生成処理部23はステップS10に進み、後述の終了シナリオ記述処理を行う。なお、終了シナリオ記述処理では、取得したレコードに応じて、8番目の実行ステップに対応するシナリオファイルを生成し、在庫確認シナリオの生成を終了するようにVoiceXMLで記述する。
(入出力シナリオ記述処理)
図6は入出力シナリオ記述処理の一例のフローチャートである。シナリオ自動生成処理部23はステップS21に進み、取得したレコードの項目「出力メッセージ」に登録されているメッセージを音声出力ワードとしてVoiceXMLで定義する。なお、音声出力ワードは音声システムから作業者へ音声出力されるメッセージである。
ステップS22に進み、シナリオ自動生成処理部23は、作業者から音声入力があった場合、発話された音声ワードを、取得したレコードの項目「入力格納変数」に登録されている名称の入力格納変数へセットするようVoiceXMLで定義する。
ステップS23に進み、シナリオ自動生成処理部23は入力格納変数へセットされた音声ワードを、取得したレコードの項目「辞書名」で表される音声グラマー27を使用してテキスト変換するようVoiceXMLで定義する。
ステップS24に進み、シナリオ自動生成処理部23はテキスト変換された音声入力の内容によって、取得したレコードの項目「分岐No.1〜n」で表される音声シナリオの分岐条件及び分岐先からシナリオ遷移先を決定するようVoiceXMLで定義する。
例えば図4に示す「No.01」の実行ステップでは、分岐条件「はい」に対する分岐先として「No.02」の実行ステップが登録され、分岐条件「いいえ」に対する分岐先として「No.91」の実行ステップが登録されている。したがって、シナリオ自動生成処理部23は、テキスト変換された音声入力の内容が「はい」であれば「No.02」の実行ステップをシナリオ遷移先として決定する。
(処理シナリオ記述処理)
図7は処理シナリオ記述処理の一例のフローチャートである。シナリオ自動生成処理部23はステップS31に進み、取得したレコードの項目「データ処理名」にセットされたデータベース操作処理へ、取得したレコードの項目「指示パラメータ」にセットされたパラメータを引き渡して実行するようVoiceXMLで定義する。
また、ステップS32に進み、シナリオ自動生成処理部23はデータベース操作処理の結果を、取得したレコードの項目「戻り値」にセットされた入力格納変数へセットするようVoiceXMLで定義する。
(分岐シナリオ記述処理)
図8は分岐シナリオ記述処理の一例のフローチャートである。シナリオ自動生成処理部23はステップS35に進み、取得したレコードの項目「分岐No.1〜n」にセットされた分岐条件及び分岐先と、取得したレコードの項目「戻り値」の入力格納変数にセットされたデータベース操作処理の結果とに応じて、シナリオ遷移先を決定するようVoiceXMLで定義する。
(終了シナリオ記述処理)
図9は終了シナリオ記述処理の一例のフローチャートである。シナリオ自動生成処理部23はステップS41に進み、実行中の音声シナリオ26を終了するようVoiceXMLで定義する。
(グラマー自動生成処理部24)
ここでは、グラマー自動生成処理部24の処理の一例として、操作者が在庫アドレスを音声入力する際に使用する音声グラマー27の生成処理について説明する。グラマー条件指定受付部25は、例えば音声シナリオ生成装置1を操作する管理者から音声グラマー27の生成条件として、使用するテーブルのテーブル名,出力項目,検索項目及び出力する音声グラマー27のファイル名の指定を受け付ける。使用するテーブルはグラマーマスタ22に登録されているテーブルである。
操作者は図10に示すような3桁コードマスタテーブルのテーブル名「3桁コードマスタ」,出力項目「読上げ3桁コード」,検索項目「検索3桁コード」を生成条件として指定したとする。図10は3桁コードマスタテーブルの一例の構成図である。図10に示す3桁コードマスタテーブルは、正式3桁コード,読上げ3桁コード,3つの検索3桁コードを項目として有する。
そして、グラマー自動生成処理部24はグラマー条件指定受付部25が受け付けた音声グラマー27の生成条件に従い、グラマーマスタ22に登録されている図10に示すような3桁コードマスタテーブルを読み出す。そして、グラマー自動生成処理部24は読み出した3桁コードマスタテーブルから図11に示すような手順で音声グラマー27を自動生成する。
図11は3桁コードマスタテーブルから音声グラマーを生成する手順を表したイメージ図である。グラマー自動生成処理部24は3桁コードマスタテーブルからレコードを順次読み出す。グラマー自動生成処理部24は読み出したレコードに基づき、項目「読上げ3桁コード」に対応する3つの「検索3桁コード」を取得する。
グラマー自動生成処理部24は項目「読上げ3桁コード」を出力項目とし、項目「検索3桁コード」を検索項目とした上、出力項目と検索項目とを対応付ける3つのレコードを生成する。具体的に、グラマー自動生成処理部24は項目「読上げ3桁コード」に対応する3つの「検索3桁コード」から、出力項目「イチゼロイチ」及び検索項目「イチゼロイチ」を対応付けるレコード、出力項目「イチゼロイチ」及び検索項目「ワンゼロワン」を対応付けるレコード、出力項目「イチゼロイチ」及び検索項目「イチレイイチ」を対応付けるレコードを生成する。
結果として、グラマー自動生成処理部24は図11に示すような音声グラマー27を自動生成できる。なお、音声グラマー27における検索項目は音声入力された音声ワードを検索キーとして音声グラマー27を検索するときに利用される。検索キーに一致する検索項目が存在すれば、音声システムは音声入力された音声ワードを、検索キーに一致した検索項目に対応する出力項目(変換語)に変換できる。
なお、グラマー自動生成処理部24は、グラマーマスタ22に登録されている複数種類のマスタテーブルを組み合わせて、1つの音声グラマー27を生成してもよい。例えばグラマー自動生成処理部24は苗字マスタテーブル及び名前マスタテーブルがグラマーマスタ22に登録されている場合、苗字マスタテーブル及び名前マスタテーブルから苗字名前に対応する(フルネームに対応する)音声グラマー27を生成してもよい。
(シナリオマスタ21及び音声シナリオ26の具体例)
図12〜図17はシナリオマスタの具体例を表した構成図である。シナリオ自動生成処理部23は図12〜図17に示すシナリオマスタ21から音声シナリオの実行ステップを表すレコードを順次読み出し、読み出したレコード毎にシナリオファイルを生成し、1つ以上のシナリオファイルにより音声シナリオ26を生成する。なお、図12〜図17に示したシナリオマスタ21は項目が多いため、図12〜図17に分割して記載している。
図18は、生成されたシナリオファイルのファイル名を表示した一例の画面イメージである。例えばシナリオ自動生成処理部23は生成したシナリオファイルのファイル名を出力装置12等に表示して管理者に確認させる。生成されたシナリオファイルの内容は例えば図19〜図27のようになる。図19〜図27のシナリオファイルはVoiceXMLで記述されている。
(まとめ)
以上、本実施例の音声シナリオ生成装置1によれば、管理者がシナリオマスタ21及びグラマーマスタ22を登録することで、音声シナリオを自動生成できるので、音声システムの構築が容易になり、音声システムの開発における開発コストの削減と、開発期間の短縮とを実現できる。結果、本実施例の音声シナリオ生成装置1によれば、音声システムの実運用開始までの対応時間を短縮することが可能である。
本発明は、以下に記載する付記のような構成が考えられる。
(付記1)
コンピュータを、
音声シナリオの各実行ステップの内容をシナリオマスタから取得し、取得した該実行ステップの内容に応じて、所定の記述言語で記述した音声シナリオを自動生成するシナリオ自動生成処理手段
として機能させる為の音声シナリオ生成プログラム。
(付記2)
前記シナリオ自動生成処理手段は、音声シナリオの実行ステップ毎に、該実行ステップの内容及び処理区分を登録しているテーブルのレコードを取得し、該レコードに登録されている処理区分に応じて、音声シナリオの記述パターンを変化させて、該レコードに登録されている前記実行ステップの内容から所定の記述言語で記述した音声シナリオを自動生成する付記1記載の音声シナリオ生成プログラム。
(付記3)
前記シナリオ自動生成処理手段は、前記レコードに登録されている処理区分が入出力であるとき、前記実行ステップの内容から音声出力する内容を定義し、音声入力された内容を認識するための音声グラマーを前記実行ステップの内容から定義し、認識された内容に応じたシナリオ遷移先を前記実行ステップの内容から定義する付記2記載の音声シナリオ生成プログラム。
(付記4)
前記シナリオ自動生成処理手段は、前記レコードに登録されている処理区分が処理であるとき、前記実行ステップの内容から実行する処理名及び実行する処理へ引き渡す内容を定義し、処理の結果のセット先を定義する付記3記載の音声シナリオ生成プログラム。
(付記5)
前記シナリオ自動生成処理手段は、前記レコードに登録されている処理区分が分岐であるとき、前記実行ステップの内容から分岐条件及び分岐先と、前記セット先にセットされた処理の結果とに応じて、シナリオ遷移先を決定するよう定義する付記4記載の音声シナリオ生成プログラム。
(付記6)
前記シナリオ自動生成処理手段は、前記レコードに登録されている処理区分が終了であるとき、実行中の音声シナリオを終了するよう定義する付記2乃至5何れか一項記載の音声シナリオ生成プログラム。
(付記7)
音声シナリオを自動生成する音声シナリオ生成装置であって、
音声シナリオの各実行ステップの内容をシナリオマスタから取得し、取得した該実行ステップの内容に応じて、所定の記述言語で記述した音声シナリオを自動生成するシナリオ自動生成処理手段
を有する音声シナリオ生成装置。
本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。
1 音声シナリオ生成装置
11 入力装置
12 出力装置
13 ドライブ装置
14 補助記憶装置
15 主記憶装置
16 演算処理装置
17 インターフェース装置
18 記録媒体
21 シナリオマスタ
22 グラマーマスタ
23 シナリオ自動生成処理部
24 グラマー自動生成処理部
25 グラマー条件指定受付部
26 音声シナリオ
27 音声グラマー
31〜35 音声指示
36 データ処理
41〜43 発話
B バス

Claims (5)

  1. コンピュータを、
    音声シナリオの各実行ステップの内容をシナリオマスタから取得し、取得した該実行ステップの内容に応じて、所定の記述言語で記述した音声シナリオを自動生成するシナリオ自動生成処理手段
    出力項目と1つ以上の検索項目との対応をグラマーマスタから取得し、音声入力された内容を、前記音声入力された内容と一致した前記検索項目に対応する出力項目に変換するために利用する音声グラマーを自動生成するグラマー自動生成処理手段
    として機能させる為の音声シナリオ生成プログラム。
  2. 前記シナリオ自動生成処理手段は、音声シナリオの実行ステップ毎に、該実行ステップの内容及び処理区分を登録しているテーブルのレコードを取得し、該レコードに登録されている処理区分に応じて、音声シナリオの記述パターンを変化させて、該レコードに登録されている前記実行ステップの内容から所定の記述言語で記述した音声シナリオを自動生成する請求項1記載の音声シナリオ生成プログラム。
  3. 前記シナリオ自動生成処理手段は、前記レコードに登録されている処理区分が入出力であるとき、前記実行ステップの内容から音声出力する内容を定義し、音声入力された内容を認識するための前記音声グラマーを前記実行ステップの内容から定義し、認識された内容に応じたシナリオ遷移先を前記実行ステップの内容から定義する請求項2記載の音声シナリオ生成プログラム。
  4. 前記シナリオ自動生成処理手段は、前記レコードに登録されている処理区分が処理であるとき、前記実行ステップの内容から実行する処理名及び実行する処理へ引き渡す内容を定義し、処理の結果のセット先を定義する請求項3記載の音声シナリオ生成プログラム。
  5. 音声シナリオを自動生成する音声シナリオ生成装置であって、
    音声シナリオの各実行ステップの内容をシナリオマスタから取得し、取得した該実行ステップの内容に応じて、所定の記述言語で記述した音声シナリオを自動生成するシナリオ自動生成処理手段と、
    出力項目と1つ以上の検索項目との対応をグラマーマスタから取得し、音声入力された内容を、前記音声入力された内容と一致した前記検索項目に対応する出力項目に変換するために利用する音声グラマーを自動生成するグラマー自動生成処理手段と
    を有する音声シナリオ生成装置。
JP2009263773A 2009-11-19 2009-11-19 音声シナリオ生成プログラム及び音声シナリオ生成装置 Active JP5461967B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009263773A JP5461967B2 (ja) 2009-11-19 2009-11-19 音声シナリオ生成プログラム及び音声シナリオ生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009263773A JP5461967B2 (ja) 2009-11-19 2009-11-19 音声シナリオ生成プログラム及び音声シナリオ生成装置

Publications (2)

Publication Number Publication Date
JP2011108083A JP2011108083A (ja) 2011-06-02
JP5461967B2 true JP5461967B2 (ja) 2014-04-02

Family

ID=44231466

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009263773A Active JP5461967B2 (ja) 2009-11-19 2009-11-19 音声シナリオ生成プログラム及び音声シナリオ生成装置

Country Status (1)

Country Link
JP (1) JP5461967B2 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10171627A (ja) * 1996-12-09 1998-06-26 Nec Corp 音声対話装置用アプリケーション開発方法及び装置
JP2003280687A (ja) * 2002-03-20 2003-10-02 Denso Corp シナリオ作成支援装置及びプログラム
JP4174233B2 (ja) * 2002-04-24 2008-10-29 株式会社日立製作所 音声対話システム及び音声対話方法
JP2004086545A (ja) * 2002-08-27 2004-03-18 Nippon Yunishisu Kk データ項目の状態を管理することでプログラムを自動生成するプログラム開発支援システム
JP2005321730A (ja) * 2004-05-11 2005-11-17 Fujitsu Ltd 対話システム、対話システム実行方法、及びコンピュータプログラム
JP2007033478A (ja) * 2005-07-22 2007-02-08 Hitachi Ltd マルチモーダル対話システム及びマルチモーダルアプリケーション生成ウィザード

Also Published As

Publication number Publication date
JP2011108083A (ja) 2011-06-02

Similar Documents

Publication Publication Date Title
JP5796496B2 (ja) 入力支援システム、方法、およびプログラム
CN110244941B (zh) 任务开发方法、装置、电子设备及计算机可读存储介质
JP5613335B2 (ja) 音声認識システム、認識辞書登録システム及び音響モデル識別子系列生成装置
US7742924B2 (en) System and method for updating information for various dialog modalities in a dialog scenario according to a semantic context
JP2014106523A (ja) 音声入力対応装置及び音声入力対応プログラム
KR20200011198A (ko) 대화형 메시지 구현 방법, 장치 및 프로그램
JP5606951B2 (ja) 音声認識システムおよびこれを用いた検索システム
CN111292721A (zh) 代码编写方法、装置及计算机设备
JP2008145769A (ja) 対話シナリオ生成システム,その方法およびプログラム
US7181397B2 (en) Speech dialog method and system
JP2010182191A (ja) 帳票入力装置、帳票入力システム、帳票入力方法、及びプログラム
JP5461967B2 (ja) 音声シナリオ生成プログラム及び音声シナリオ生成装置
JP2003157095A (ja) 音声認識装置及びその方法、プログラム
JP2011064969A (ja) 音声認識装置及び音声認識方法
JP5701348B2 (ja) 音声認識装置、音声認識方法、およびプログラム
JP5331657B2 (ja) 音声シナリオ設定プログラム及び音声シナリオ設定装置
JP6179884B2 (ja) Wfst作成装置、音声認識装置、音声翻訳装置、wfst作成方法、およびプログラム
JP2012226651A (ja) 情報処理装置、情報処理方法及びプログラム
JP2001306090A (ja) 対話装置および方法、音声制御装置および方法、ならびにコンピュータを対話装置および音声制御装置として機能させるためのプログラムをそれぞれ記録したコンピュータ読取可能な記録媒体
KR102376552B1 (ko) 음성 합성 장치 및 음성 합성 방법
JP2003202890A (ja) 音声認識装置及びその方法、プログラム
KR102267579B1 (ko) 클라우드 기반의 음성 데이터 텍스트 변환 시스템 및 이의 실행 방법
JP3614116B2 (ja) トランスクリプション装置、トランスクリプション方法、トランスクリプションプログラム、およびそのプログラムを記録した記録媒体
JP7166370B2 (ja) 音声記録のための音声認識率を向上させる方法、システム、およびコンピュータ読み取り可能な記録媒体
CN114586021B (zh) 信息输出装置、信息输出方法以及记录介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130326

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130327

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140114

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140116

R150 Certificate of patent or registration of utility model

Ref document number: 5461967

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350