JP2009087172A - Method of creating program - Google Patents

Method of creating program Download PDF

Info

Publication number
JP2009087172A
JP2009087172A JP2007258204A JP2007258204A JP2009087172A JP 2009087172 A JP2009087172 A JP 2009087172A JP 2007258204 A JP2007258204 A JP 2007258204A JP 2007258204 A JP2007258204 A JP 2007258204A JP 2009087172 A JP2009087172 A JP 2009087172A
Authority
JP
Japan
Prior art keywords
program
scenario
scenario execution
speech
execution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007258204A
Other languages
Japanese (ja)
Inventor
Maki Kaneko
眞己 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PRONET CORP
Original Assignee
PRONET CORP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PRONET CORP filed Critical PRONET CORP
Priority to JP2007258204A priority Critical patent/JP2009087172A/en
Publication of JP2009087172A publication Critical patent/JP2009087172A/en
Withdrawn legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To form a program composed of a plurality of scenario execution programs of which an execution order can be changed. <P>SOLUTION: Content of the programs A, B are decomposed into scenarios 1-3, 4-6, and the program A, B are assembled from them. The scenarios 1-6 are formed by arranging a basic scenario which has common parts in voice recognition or voice synthesis. A program C can be created by decomposing into scenarios 8-10, and arranging the basic scenario. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、音声認識を利用したプログラムの作製方法に関するものである。   The present invention relates to a method for creating a program using voice recognition.

従来、音声認識システムを開発する場合には、音声認識エンジンから、データベースとの連携及び音声辞書、音声合成エンジンまで、ゼロから開発する必要があった。つまり、音声認識を利用したプログラムにおいては、1つのファイルとして統合され、そのシステムに固有の処理となっているため、例えば図11(a)に示すように、プラグラムAとプログラムBとの実行順序を変更しようとすると、順序を変更するために、再度プログラムを作成し直す必要があった。また、例えば図11(b)に示すように、組数と人数とを同時に判断させるようなプログラムCを作成しようとすると、前述したプログラムAやプログラムBとは全く異なるプログラムとして、プログラムCを作製する必要があった。つまり、他のシステムのプログラムとして転用ができないのが現状である。   Conventionally, when developing a speech recognition system, it has been necessary to develop from scratch, from a speech recognition engine, to linkage with a database, a speech dictionary, and a speech synthesis engine. That is, in a program using speech recognition, since it is integrated as one file and is a process specific to the system, for example, as shown in FIG. 11A, the execution order of the program A and the program B To change the order, the program had to be recreated to change the order. Further, for example, as shown in FIG. 11B, when trying to create a program C that allows the number of groups and the number of people to be determined at the same time, the program C is created as a completely different program from the programs A and B described above. There was a need to do. In other words, it cannot be diverted as a program for other systems.

ところで、サービスを制御するシステムとサービスを実行するシステムとからなる複数のシステムとの間の通信機能を有するシステムにおいて、前記サービス毎のシナリオをサービスシナリオとして複数保持し、前記サービスシナリオのカスタマイズによりサービスの追加や変更を行うようにしたものが提案されている(例えば、特許文献1参照)。
特開2003−32367号公報(段落0037)
By the way, in a system having a communication function between a plurality of systems including a system that controls a service and a system that executes the service, a plurality of scenarios for each service are stored as service scenarios, and the service scenario is customized by customizing the service scenario. Have been proposed (see, for example, Patent Document 1).
JP2003-32367A (paragraph 0037)

しかしながら、上記特許文献1に記載の技術は、サービスを制御するシステムとサービスを実行するシステムとからなる複数のシステムとの間の通信機能を有するシステムにしかそのまま適用することができない。   However, the technique described in Patent Document 1 can be applied only to a system having a communication function between a plurality of systems including a system that controls a service and a system that executes the service.

そこで、この発明は、各プログラムの中身を、実行順序が変更可能である複数のシナリオ実行プログラムの集合体からなるものとし、シナリオを追加・変更することで、それらの集合体であるプログラムの変更を可能とした、プログラムの作製方法を提供することを目的とする。   In view of this, the present invention assumes that the contents of each program are made up of a set of a plurality of scenario execution programs whose execution order can be changed. It is an object of the present invention to provide a method for creating a program that enables the above.

請求項1の発明は、音声認識或いは音声合成を利用したプログラムを作製するプログラムの作製方法であって、前記プログラムを、実行順序が変更可能である複数のシナリオ実行プログラムの集合体として、前記各シナリオ実行プログラムを、前記音声認識或いは音声合成の音声に共通部分がある基本シナリオ実行プログラムをカスタマイズして作製することを特徴とする。   The invention of claim 1 is a method of creating a program for creating a program using speech recognition or speech synthesis, wherein the program is set as an aggregate of a plurality of scenario execution programs whose execution order can be changed. The scenario execution program is produced by customizing a basic scenario execution program having a common part in the speech of speech recognition or speech synthesis.

このようにすれば、前記プログラムを、実行順序が変更可能である複数のシナリオ実行プログラムの集合体からなるようにし、前記各シナリオ実行プログラムは、基本シナリオ実行プログラムをカスタマイズして作製されるようにしているので、音声認識或いは音声合成を利用したプログラムの内容の変更を容易に行うことができる。   In this way, the program is made up of a collection of a plurality of scenario execution programs whose execution order can be changed, and each scenario execution program is created by customizing the basic scenario execution program. Therefore, it is possible to easily change the contents of the program using speech recognition or speech synthesis.

請求項2に記載のように、請求項1のプログラムの作製方法において、前記基本シナリオ実行プログラムは、回線種別、音声認識エンジン、音声合成エンジン、音声辞書等のロジックが選択可能とされるようにすることが望ましい。   According to a second aspect of the present invention, in the program creation method of the first aspect, the basic scenario execution program can select a logic such as a line type, a voice recognition engine, a voice synthesis engine, a voice dictionary, and the like. It is desirable to do.

このようにすれば、各シナリオ実行プログラムに対応して、ロジックの選択ができる。   In this way, the logic can be selected corresponding to each scenario execution program.

請求項3に記載のように、請求項1又は2のプログラムの作製方法において、前記基本シナリオ実行プログラムは、複数種類で、質問のシナリオ実行プログラムと、確認のシナリオ実行プログラムと、選択を要求するシナリオ実行プログラムと、動作実行のシナリオ実行プログラムを含むようにすることができる。   According to a third aspect of the present invention, in the method for creating a program according to the first or second aspect, the basic scenario execution program is a plurality of types, and a request scenario execution program, a confirmation scenario execution program, and a selection request are requested. A scenario execution program and an operation execution scenario execution program can be included.

このようにすれば、質問、確認、選択の要求及び動作実行のプログラムをそれぞれ組み合わせることで、各種パターンのプログラムの作成に対応することができる。   In this way, it is possible to cope with the creation of various patterns of programs by combining the question, confirmation, selection request, and operation execution programs.

本発明は、前記プログラムを、実行順序が変更可能である複数のシナリオ実行プログラムの集合体からなるようにし、前記各シナリオ実行プログラムは、基本シナリオ実行プログラムをカスタマイズして作製されるようにしているので、音声認識を利用したプログラムの内容の変更を容易に行うことができる。   In the present invention, the program is made up of a collection of a plurality of scenario execution programs whose execution order can be changed, and each scenario execution program is created by customizing a basic scenario execution program. Therefore, it is possible to easily change the contents of the program using voice recognition.

以下、本発明の実施の形態を図面に沿って説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図1は本発明に係る音声認識を利用したプログラムを用いる音声認識システムの概略構成を示すシステム構成図である。   FIG. 1 is a system configuration diagram showing a schematic configuration of a voice recognition system using a program using voice recognition according to the present invention.

図1に示すように、音声認識開発ツールを利用した音声認識システム1は、特定の会社内に設けられ、音声認識プログラムを実行する音声サーバー2と、顧客データを蓄積している顧客データベースサーバー3と、電話回線4を通じて携帯電話6や固定電話7との間で会話を行うための構内交換機5(PBX)とを備える。構内交換機5を介して、オペレータ8が電話回線4を通じて、携帯電話6や固定電話7の利用者との間で対話を行うことができるようになっている。   As shown in FIG. 1, a speech recognition system 1 using a speech recognition development tool is provided in a specific company, and a speech server 2 that executes a speech recognition program and a customer database server 3 that stores customer data. And a private branch exchange 5 (PBX) for carrying out a conversation with the mobile phone 6 or the fixed phone 7 through the telephone line 4. An operator 8 can communicate with a user of a mobile phone 6 or a fixed phone 7 through a telephone line 4 via a private branch exchange 5.

また、音声認識システム1は、保守・点検のために、インターネット9を通じて、メンテナンス会社10と連携されている。   The voice recognition system 1 is linked to a maintenance company 10 through the Internet 9 for maintenance and inspection.

このような音声認識システム1を、例えばコールセンターに用いる場合には、シナリオの流れは図2に示すようにすることができる。即ち、お客様からの連絡が入ると、まず、「お客様サービスデスクです。保全、新契約、保全手続の中から一つを選んでおっしゃってください。」と発話する。これに対して、お客様が「保全。」と回答すると、これを受けて、「保全に関するご紹介でよろしいですか?」と発話する。   When such a speech recognition system 1 is used, for example, in a call center, the scenario flow can be as shown in FIG. In other words, when a customer receives a message, he / she speaks first as "Customer service desk. Please choose one from maintenance, new contract, and maintenance procedure." On the other hand, when the customer answers “Maintenance.”, He / she utters “Are you sure you want to introduce conservation?”

これに対し、お客様が「はい!」と回答すると、これを受けて、「オペレータにおつなぎします。」と発話する。これに対し、お客様が「保全契約」と回答した場合には、「保全手続でよろしいですか?」と発話する。   On the other hand, when the customer answers “Yes!”, He / she utters “I will connect to the operator”. On the other hand, when the customer replies “Maintenance contract”, he / she utters “Are you sure about the maintenance procedure?”.

これに対し、お客様が「はい!」と回答すると、これを受けて、「解約、口座変更、名義変更、住所変更の中から一つをおっしゃってください。」と発話する。   On the other hand, when the customer answers “Yes!”, He / she utters, “Please say one of cancellation, account change, name change, address change.”

これに対し、お客様が「解約」と回答すると、これを受けて、「解約でよろしいですか?」と発話する。   On the other hand, when the customer answers “cancel”, he / she utters “Are you sure you want to cancel?”.

これに対し、お客様が「はい!」と回答すると、これを受けて、「ご契約されている保険番号をおっしゃってください。」と発話する。   On the other hand, when the customer answers “Yes!”, He / she utters “Please tell me your insurance number”.

これに対し、お客様が「1234!」と回答すると、これを受けて、「ご契約番号は、1234の契約者様は山田太郎でよろしいですか?」」と発話する。   On the other hand, when the customer replies “1234!”, He / she utters “Are you sure that the contract number is 1234? Taro Yamada?”

これに対し、お客様が「はい!」と回答すると、これを受けて、「解約書類をお送りします。ご利用ありがとうございました。」と発話して、一連の処理が終了する。   On the other hand, when the customer answers “Yes!”, The customer responds by saying “Thank you for using the cancellation document.” The process ends.

なお、前述したコールセンターに用いる場合において、お客様が「保全。」や「はい!」などと回答し、その回答を認識した際に、「ピィー」などの確認音を発するようにしてもよいのはもちろんである。   In addition, when used in the call center described above, the customer may answer “Maintenance” or “Yes!”, And when the answer is recognized, a confirmation sound such as “Pee” may be emitted. Of course.

また、具体的な説明は省略するが、タクシーの配車受付けに用いる場合には、シナリオの流れを図3に示すようにすることができる。なお、この場合には、お客様の発話内容はそのまま音声として流し、受付完了の時点で配車システムデータベースにデータを送信するので、ここで、配車係がタクシーの配車指示を出すことになる。   Further, although a specific description is omitted, the scenario flow can be as shown in FIG. 3 when used for taxi dispatch. In this case, the content of the customer's utterance is played as audio as it is, and the data is transmitted to the dispatch system database at the time when the reception is completed, so the dispatcher issues a taxi dispatch instruction here.

続いて、音声サーバー2において用いられる具体的な音声認識を利用したプログラムの作製方法について説明する。   Next, a method for creating a program using specific voice recognition used in the voice server 2 will be described.

そして、プログラム全体は、実行順序が変更可能である複数のシナリオ実行プログラムの集合体として作製される。前記各シナリオ実行プログラムは、基本シナリオ実行プログラムをカスタマイズして作製される。つまり、各シナリオ実行プログラムは、文言(音声)の変更、発話内容・順番の変更、利用データベースの設定、利用辞書の選択などが可能である。   The entire program is created as an aggregate of a plurality of scenario execution programs whose execution order can be changed. Each scenario execution program is created by customizing a basic scenario execution program. That is, each scenario execution program can change the word (speech), change the utterance content / order, set the usage database, select the usage dictionary, and the like.

シナリオを作製するために用いる基本ソフトウェア(シナリオライター)でGUIベースでおおよその処理の流れを作製する。作製された複数のシナリオ実行プログラムをコンパイルして、シナリオリストを作製することになる。   The basic software (scenario writer) used to create a scenario is used to create an approximate processing flow on a GUI basis. A plurality of prepared scenario execution programs are compiled to create a scenario list.

基本シナリオ実行プログラムは、回線種別、音声認識エンジン、音声辞書等の各種ロジックが選択可能とされている。各シナリオは、シナリオ名、初期設定、回線種別、データ種別、音声認識エンジン、バージイン機能、音声辞書、入力データ、外部データ実行ファイル、出力データ、発話実行ファイル、条件、シナリオ転送判定、内線番号転送判定、発話内容、音声合成エンジン、シナリオ新規追加、シナリオ複写、保存データ、会話実行ファイル、確認音等の項目を、シナリオ毎に選択或いは変更可能な項目として有する。 In the basic scenario execution program, various types of logic such as a line type, a voice recognition engine, a voice dictionary, and the like can be selected. Each scenario has scenario name, initial setting, line type, data type, voice recognition engine, barge-in function, voice dictionary, input data, external data execution file, output data, utterance execution file, condition, scenario transfer judgment, extension number transfer Items such as determination, utterance content, speech synthesis engine, new scenario addition, scenario copy, saved data, conversation execution file, confirmation sound, etc. are items that can be selected or changed for each scenario.

また、図2や図3に示すように、各シナリオは、「・・・おっしゃってください。」という質問のシナリオ実行プログラム、「・・・・よろしいですか?」という確認のシナリオ実行プログラム、「・・・一つ選んで・・・」という選択を要求するシナリオ実行プログラム、「オペレータにおつなぎします。」や「すぐに、タクシーをお回し致しますので、しばらくお待ちください。」という動作実行のシナリオ実行プログラムなどに分類することができるので、それぞれに対応する基本シナリオ実行プログラムを準備しておけば、それらをアレンジ(変更)することで、すべてのシナリオ実行プログラムを作製することができる。   Also, as shown in FIG. 2 and FIG. 3, each scenario has a scenario execution program that asks “Please say ...”, a scenario execution program that confirms “... Execution of the scenario execution program that requires the selection of "... select one ...", "I will connect you to the operator" and "Please wait for a while as I will turn around the taxi soon." Since the basic scenario execution programs corresponding to the respective scenario execution programs are prepared, all the scenario execution programs can be created by arranging (changing) them.

そして、それぞれのシナリオ実行プログラムの実行順序を決定して、それらを統合すれば、一連の動作を順次実行するプログラムが完成する。   If the execution order of the respective scenario execution programs is determined and integrated, a program for sequentially executing a series of operations is completed.

つまり、図4(a)に示すように、プログラムA,Bの中身をシナリオ1〜3,4〜6に分解し、それらの集合体としてプログラムA,Bを作製することになる。しかも各シナリオ1〜6それぞれを基本シナリオをアレンジして作製することで、変更も容易であるし、追加、削除も容易となる。よって、図4(b)に示すように、プログラムCも、シナリオ8〜10と分解することで、基本シナリオをアレンジして作製することができ、従来のように新たに作製し直す必要がなくなる。   That is, as shown in FIG. 4A, the contents of the programs A and B are decomposed into scenarios 1 to 3 and 4 to 6, and the programs A and B are produced as an aggregate of them. In addition, each scenario 1 to 6 is prepared by arranging the basic scenarios, so that it can be easily changed and added and deleted easily. Therefore, as shown in FIG. 4 (b), the program C can also be created by arranging the basic scenarios by disassembling the scenarios 8 to 10, and there is no need to newly recreate them as in the prior art. .

続いて、前記基本のソフトウェアを用いて、新しいシナリオリストをパソコンにて作製する手順について具体的に説明する。   Subsequently, a procedure for creating a new scenario list on a personal computer using the basic software will be specifically described.

まず、図5に示すように、新しいシナリオを作製する画面が開かれると、シナリオを追加するための新しいシナリオ枠11が作製される。ここで、例えばfile1がシナリオ番号になる。なお、シナリオ番号は変更可能である、例えばfile1をクリックすることで、シナリオ番号の変更が可能となる。   First, as shown in FIG. 5, when a screen for creating a new scenario is opened, a new scenario frame 11 for adding a scenario is created. Here, for example, file1 is the scenario number. Note that the scenario number can be changed. For example, the scenario number can be changed by clicking file1.

シナリオ枠11を、右クリックすると、プロパティリスト11aが表示される。そして、プロパティリストの各項目は、前述したシナリオ毎に選択或いは変更可能な項目である。この各項目を、作製するシナリオに応じて順次登録する。なお、シナリオ枠11の上に接続用分岐点11bが表示される。   When the scenario frame 11 is right-clicked, a property list 11a is displayed. Each item in the property list is an item that can be selected or changed for each scenario described above. Each of these items is sequentially registered according to the scenario to be created. A connection branch point 11 b is displayed on the scenario frame 11.

例えば、最初に実行するシナリオかどうかの『初期設定』を行う場合には、プロパティリストの初期設定をクリックすると、図6(a)に示すように、「あり」「なし」が表示される。通常は、最初に実行するシナリオではないので、「なし」とされているが、最初に実行するシナリオである場合には、図6(a)に示すように、「あり」とする。   For example, in the case of performing “initial setting” as to whether or not the scenario is executed first, when the initial setting in the property list is clicked, “Yes” and “No” are displayed as shown in FIG. Usually, since it is not the scenario to be executed first, it is “None”. However, in the case of the scenario to be executed first, “Yes” is set as shown in FIG.

次の項目『回線種別』では、デジタル回線かアナログ回線かを選択する。アナログ回線を選択する場合には、図6(b)に示すようになる。なお、IP電話に対応可能とすることもできる。   In the next item “line type”, a digital line or an analog line is selected. When an analog line is selected, it is as shown in FIG. Note that it is also possible to support an IP phone.

項目『データ種別』では、音声か電話回線かを選択する。   In the item “data type”, a voice or a telephone line is selected.

項目『音声認識エンジン』では、Nuance8.5(ニュアンスコミュニケーション社製)かその他かを選択する。   In the item “Speech recognition engine”, select Nuance 8.5 (manufactured by Nuance Communication) or others.

項目『音声合成エンジン』では、FineSpeech(富士通製)、録音WAVファイルかその他かを選択する。   In the item "speech synthesis engine", select FineSpeech (Fujitsu), recorded WAV file or other.

項目『バージイン機能』では、発話の途中でも次のシナリオにジャンプさせる場合には「ON」を選択し、ジャンプさせない場合には「OFF」を選択する。   In the item “barge-in function”, “ON” is selected when jumping to the next scenario even during the utterance, and “OFF” is selected when not jumping.

項目『音声辞書』では、図6(c)に示すように、別のウインドウが表示されて、そこで認識させる音声辞書を設定する。なお、シナリオ毎に指定ファイルを選択して実行可能である。   In the item “voice dictionary”, as shown in FIG. 6C, another window is displayed, and a voice dictionary to be recognized is set there. Note that a specified file can be selected and executed for each scenario.

具体的に図示していないが、続く項目『入力データ』『外部データ実行ファイル』でも、別のウインドウが表示されて、そこで設定する。   Although not specifically illustrated, another window is displayed for the subsequent items “input data” and “external data execution file”, and settings are made there.

また、『シナリオ転送判定あり』の場合には、シナリオ枠11の上に、他のシナリオ接続用の分岐点11cが表示される。   In the case of “with scenario transfer determination”, another scenario connection branch point 11 c is displayed on the scenario frame 11.

このようして、シナリオがすべて作製された後、図7に示すように、シナリオ設計書において、各シナリオ枠11の分岐点11b,11cをそれぞれ接続することで、シナリオ全体が完成する。全体が完成した後に、シナリオスクリプト生成を実行すると、シナリオ実行プログラムが完成する。   After all the scenarios are created in this way, the entire scenario is completed by connecting the branch points 11b and 11c of each scenario frame 11 in the scenario design document, as shown in FIG. When scenario script generation is executed after the whole is completed, the scenario execution program is completed.

前記実施の形態では、音声認識開発ツールを利用した音声認識システムについては説明しているが、図8に示すように、音声APSサービスを利用して音声認識システムを構成することも可能である。   In the above embodiment, the voice recognition system using the voice recognition development tool has been described. However, as shown in FIG. 8, the voice recognition system can be configured using the voice APS service.

この場合には、図8に示すように、IDC21(Internet Database Connecter)として、音声認識プログラムを実行する音声サーバー2と、顧客データを蓄積している顧客データベースサーバー3と、電話回線4を通じて携帯電話6や固定電話7との間で会話を行うための構内交換機5(PBX)とを備える。構内交換機5を介して、オペレータ8が電話回線4を通じて、携帯電話6や固定電話7の利用者との間で対話を行うことができるようになっている。   In this case, as shown in FIG. 8, as the IDC 21 (Internet Database Connecter), a voice server 2 that executes a voice recognition program, a customer database server 3 that stores customer data, and a mobile phone through a telephone line 4. 6 and a private branch exchange 5 (PBX) for carrying out a conversation with the fixed telephone 7. An operator 8 can communicate with a user of a mobile phone 6 or a fixed phone 7 through a telephone line 4 via a private branch exchange 5.

また、IDC21は、インターネット9を通じて、メンテナンス会社のパソコン10や、利用者側のパソコン13やオペレータ8と連携されている。   The IDC 21 is linked to the maintenance company personal computer 10, the user personal computer 13, and the operator 8 through the Internet 9.

この場合の、シナリオの一例として、音声版ASPサービス(ゴルフ予約)向けに適用した例について説明する。   As an example of the scenario in this case, an example applied to the voice version ASP service (golf reservation) will be described.

携帯電話或いは固定電話からの連絡があると、まず、IDCにおいて、「こちら○○ゴルフ予約受付センターです。予約、空情報、確認の中から一つを選んでおっしゃってください。」と発話する。   When there is a call from a mobile phone or landline, first speak at the IDC, "Here is the XX golf reservation reception center. Please choose one from reservation, empty information, confirmation."

これに対して、お客様が「予約」と回答する。   In response, the customer answers “reservation”.

これを受けて、「予約を始めます。予約日、スタート時間をおっしゃってください。」と発話する。ここで、予約でなければ、「いいえ」と発話すれば、一つ前に戻ることになる。   In response to this, he utters "Reservation begins. Please tell us the reservation date and start time." Here, if it is not a reservation, if you say “No”, you will return to the previous one.

これに対し、お客様が「10月1日8時頃スタート」と回答する。   In response to this, the customer responds “Starts around 8 o'clock on October 1”.

これを受けて、「10月1日8時頃スタートですね。プレーする人数と組数をおっしゃってください。」と発話する。このとき、日にち或いは時間が違っていれば、「いいえ」と発話すれば、一つ前に戻ることになる。   In response to this, he says, “October 1st, start at 8 o'clock. Please tell us how many people will play and the number of groups.” At this time, if the date or time is different, say “No” to go back one step.

これに対し、お客様が「1組で4人」と回答する。   In response, the customer replied “4 people in one set”.

これを受けて、「プレーする組数は、1組で、人数は4人ですね。それでは、予約確認しますので、しばらくお待ちください。」と発話する。ここで、プレーする組数或いは人数が違っていれば、「いいえ」と発話すれば、一つ前に戻ることになる。   In response to this, he says, “The number of groups to play is one group and the number of players is four. Then, we will confirm the reservation, so please wait for a while.” Here, if the number of groups or the number of players to play is different, saying “No” will return to the previous one.

これに対し、お客様が「はい!」と回答する。   In response, the customer responds “Yes!”.

これを受けて、「9時32分スタートでお取りできますが、予約しますか」と発話する。ここで、スタート時間が、希望時間でなければ、「いいえ」と発話すれば、違う時間をアナウンスすることになる。   In response to this, he says, "You can start at 9:32, but will you make a reservation?" Here, if the start time is not the desired time, saying “No” will announce a different time.

これに対し、お客様が「解約」と回答する。   In response, the customer answers “cancellation”.

これを受けて、「10月1日9時32分INスタートで1組4人でお取りしました。最初のメニューに戻りますか?」と発話する。   In response to this, he said, “October 1 at 9:32 in the IN start, 4 people took one set. Would you like to return to the first menu?”

これに対し、お客様が「いいえ」と回答すると、これにより終了する。   On the other hand, if the customer answers “No”, it ends.

また、お客様が「話したい」といえば、オペレータに転送される。   If the customer says “I want to talk”, it is forwarded to the operator.

前記音声版ASPサービスをゴルフ予約に適用するほか、レストラン予約に適用する場合の例を、図10に示す。この場合も、ゴルフ予約の場合と同様に、予約でなければ、「いいえ」と発話すれば、一つ前に戻ることになり、日にち或いは時間が違っていれば、「いいえ」と発話すれば、一つ前に戻ることになり、お客様の「話したい」との発話によりスタッフに転送される。   FIG. 10 shows an example in which the voice version ASP service is applied to a restaurant reservation in addition to a golf reservation. In this case as well, in the case of a golf reservation, if it is not a reservation, if you say “No”, you will return to the previous one, and if the date or time is different, say “No” , We will return to the previous one and will be transferred to the staff by the customer's utterance "I want to talk".

本発明は、前述したコールセンターの受付業務、タクシー外車の配車受付、ゴルフ場の予約受付、飲食・レストラン予約受付のほか、ホテル・旅館の予約受付、学校・教室の予約受付、病院・診療所の順番予約受付、出前・宅配の注文受付、美容院の予約、通販会社の商品の注文受付、介護の予約受付、各種料金の確認、各種お店の検索(電話番号など)、占い、辞書、ことわざ、時刻表、運賃、距離、価格検索サービス、スケジュール管理サービス、緊急連絡先お知らせ電話番号サービス、資料・カタログ請求代行サービス、アンケートサービス、商品説明及び案内サービスなどにも適用することができる。   The present invention includes the above-mentioned call center reception work, taxi outside vehicle dispatch reception, golf course reservation reception, restaurant / restaurant reservation reception, hotel / inn reservation reservation, school / classroom reservation reception, hospital / clinic reservation Order reservation reception, delivery / delivery order reception, beauty salon reservation, mail order company product order reception, nursing care reservation reception, confirmation of various charges, search of various shops (phone numbers, etc.), fortune-telling, dictionary, proverb It can also be applied to timetables, fares, distances, price search services, schedule management services, emergency contact information telephone number services, document / catalog billing agency services, questionnaire services, product explanations, and guidance services.

本発明に係る音声認識を利用したプログラムを用いる音声認識システムの概略構成を示すシステム構成図である。1 is a system configuration diagram showing a schematic configuration of a speech recognition system using a program using speech recognition according to the present invention. シナリオの一例を示す説明図である。It is explanatory drawing which shows an example of a scenario. シナリオの一例を示す説明図である。It is explanatory drawing which shows an example of a scenario. (a)(b)はそれぞれプログラムとシナリオとの関係を示す図である。(A) (b) is a figure which shows the relationship between a program and a scenario, respectively. シナリオ枠とシナリオプロパティとの関係を示す図である。It is a figure which shows the relationship between a scenario frame and a scenario property. (a)(b)(c)はそれぞれ初期設定、回線種別の選択、音声辞書の選択の説明図である。(A), (b), and (c) are explanatory diagrams of initial setting, line type selection, and voice dictionary selection, respectively. シナリオを統合するシナリオ設計書の説明図である。It is explanatory drawing of the scenario design document which integrates a scenario. 音声APSサービスを利用して音声認識システムを構成する場合のシステム構成図である。It is a system configuration diagram in the case of configuring a speech recognition system using a speech APS service. シナリオの一例を示す説明図である。It is explanatory drawing which shows an example of a scenario. シナリオの一例を示す説明図である。It is explanatory drawing which shows an example of a scenario. 従来例のプログラムの説明図である。It is explanatory drawing of the program of a prior art example.

符号の説明Explanation of symbols

1 音声認識システム
2 音声サーバー
3 顧客データベースサーバー
4 電話回線
5 構内交換機
6 携帯電話
7 固定電話
8 オペレータ
9 インターネット
11 シナリオ枠
21 IDC
DESCRIPTION OF SYMBOLS 1 Voice recognition system 2 Voice server 3 Customer database server 4 Telephone line 5 Private branch exchange 6 Cellular phone 7 Fixed telephone 8 Operator 9 Internet 11 Scenario frame 21 IDC

Claims (3)

音声認識或いは音声合成を利用したプログラムを作製するプログラムの作製方法であって、
前記プログラムを、実行順序が変更可能である複数のシナリオ実行プログラムの集合体として、
前記各シナリオ実行プログラムを、前記音声認識或いは音声合成の音声に共通部分がある基本シナリオ実行プログラムをカスタマイズして作製することを特徴とするプログラムの作製方法。
A method of creating a program for creating a program using speech recognition or speech synthesis,
The program as a set of a plurality of scenario execution programs whose execution order can be changed,
A method for producing a program, characterized in that each scenario execution program is created by customizing a basic scenario execution program having a common part in the speech of speech recognition or speech synthesis.
前記基本シナリオ実行プログラムは、回線種別、音声認識エンジン、音声合成エンジン、音声辞書等の各種ロジックが選択可能とされていることを特徴とする請求項1記載のプログラムの作製方法。   2. The program creation method according to claim 1, wherein the basic scenario execution program can select various types of logic such as a line type, a speech recognition engine, a speech synthesis engine, and a speech dictionary. 前記基本シナリオ実行プログラムは、複数種類で、質問のシナリオ実行プログラムと、確認のシナリオ実行プログラムと、選択を要求するシナリオ実行プログラムと、動作を実行させるシナリオ実行プログラムと含むことを特徴とする請求項1又は2記載のプログラムの作製方法。   The basic scenario execution program includes a plurality of types of a scenario execution program for a question, a scenario execution program for confirmation, a scenario execution program for requesting selection, and a scenario execution program for executing an operation. A method for producing the program according to 1 or 2.
JP2007258204A 2007-10-02 2007-10-02 Method of creating program Withdrawn JP2009087172A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007258204A JP2009087172A (en) 2007-10-02 2007-10-02 Method of creating program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007258204A JP2009087172A (en) 2007-10-02 2007-10-02 Method of creating program

Publications (1)

Publication Number Publication Date
JP2009087172A true JP2009087172A (en) 2009-04-23

Family

ID=40660490

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007258204A Withdrawn JP2009087172A (en) 2007-10-02 2007-10-02 Method of creating program

Country Status (1)

Country Link
JP (1) JP2009087172A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018159729A (en) * 2017-03-22 2018-10-11 株式会社東芝 Interaction system construction support device, method and program
JP2019105685A (en) * 2017-12-11 2019-06-27 トヨタ自動車株式会社 Interactive management device and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018159729A (en) * 2017-03-22 2018-10-11 株式会社東芝 Interaction system construction support device, method and program
JP2019105685A (en) * 2017-12-11 2019-06-27 トヨタ自動車株式会社 Interactive management device and program

Similar Documents

Publication Publication Date Title
US7286985B2 (en) Method and apparatus for preprocessing text-to-speech files in a voice XML application distribution system using industry specific, social and regional expression rules
US7184539B2 (en) Automated call center transcription services
US20200007680A1 (en) Interactive voice response system design, development and testing tool
CN102263863B (en) The tree view of the process integration of interactive voice response design controls
CN107493400A (en) Upgrading to human operator who
McTear et al. Conversational interfaces: Past and present
CN107112016A (en) Multi-modal cycle of states
CN102045456A (en) Selection and initiation of IVR scripts by contact center agents
CN101138228A (en) Customisation of voicexml application
CN109873909A (en) A kind of voice call method, device and equipment and computer storage medium
WO2002051114A1 (en) Service request processing performed by artificial intelligence systems in conjunction with human intervention
WO2005013099A2 (en) A system and method for enabling automated dialogs
CN111009233A (en) Voice processing method and device, electronic equipment and storage medium
US7359860B1 (en) Call flow object model in a speech recognition system
US11114092B2 (en) Real-time voice processing systems and methods
Baggia et al. Field trials of the Italian ARISE train timetable system
TWI761841B (en) Mobile device, system and method for task management based on voice intercom function
US20030046181A1 (en) Systems and methods for using a conversation control system in relation to a plurality of entities
JP2009087172A (en) Method of creating program
Schnelle et al. Voice User Interface Design Patterns.
CN101292256A (en) Dialog authoring and execution framework
US8468027B2 (en) Systems and methods for deploying and utilizing a network of conversation control systems
US20030046102A1 (en) Systems and methods for maintaining consistency in interpersonal communications related to marketing operations
Kumar et al. Spoken web: using voice as an accessibility tool for disadvantaged people in developing regions
JP7377668B2 (en) Control device, control method and computer program

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20101207