JP2011107503A - Voice scenario setting program and voice scenario setting device - Google Patents
Voice scenario setting program and voice scenario setting device Download PDFInfo
- Publication number
- JP2011107503A JP2011107503A JP2009263772A JP2009263772A JP2011107503A JP 2011107503 A JP2011107503 A JP 2011107503A JP 2009263772 A JP2009263772 A JP 2009263772A JP 2009263772 A JP2009263772 A JP 2009263772A JP 2011107503 A JP2011107503 A JP 2011107503A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- scenario
- user
- proficiency level
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、音声シナリオ設定プログラム及び音声シナリオ設定装置に係り、特に音声システムで利用する音声シナリオを設定する音声シナリオ設定プログラム及び音声シナリオ設定装置に関する。 The present invention relates to an audio scenario setting program and an audio scenario setting device, and more particularly to an audio scenario setting program and an audio scenario setting device for setting an audio scenario used in an audio system.
近年、工場や物流現場等の一部では、作業を効率化するため、音声認識技術を活用してデータ入力を行うようになった。音声認識技術を活用した音声システムでは例えばヘッドセットと呼ばれるイヤホンとマイクとを一体化した通話装置が利用されている。音声認識技術を活用した音声システム(以下、音声システムと呼ぶ)では、作業者への音声による指示(音声出力)と作業者からの音声による入力(音声入力)とで作業を進めることができる。 In recent years, some factories, distribution sites, and the like have entered data using voice recognition technology to improve work efficiency. In a voice system using a voice recognition technology, for example, a telephone device called a headset that integrates an earphone and a microphone is used. In a voice system utilizing voice recognition technology (hereinafter referred to as a voice system), work can be performed by voice instructions to the worker (voice output) and voice input from the worker (voice input).
音声システムでは、作業者との会話の手順が示された音声シナリオと、音声を認識するための音声グラマー(変換グラマー)とを利用して、作業者への音声出力と作業者からの音声入力とを行う。具体的に、音声グラマーは音声データをテキストデータに変換する為の音声辞書として利用される。従来、音声システムでは音声シナリオをVoiceXML等でプログラム開発することにより実現していた(例えば特許文献1参照)。 In the voice system, voice output to the worker and voice input from the worker are made using a voice scenario showing the procedure of conversation with the worker and a voice grammar (conversion grammar) for recognizing the voice. And do. Specifically, the voice grammar is used as a voice dictionary for converting voice data into text data. Conventionally, in an audio system, an audio scenario has been realized by developing a program using VoiceXML or the like (see, for example, Patent Document 1).
VoiceXMLとはコンピュータを音声による指示で操作するユーザインタフェースを構築する為のXMLベースの言語である。また、音声システムでは音声グラマーについてもVoiceXML等でプログラム内に固定記述したものを個別に用意しておく必要があった。 VoiceXML is an XML-based language for constructing a user interface for operating a computer with voice instructions. In the voice system, it is necessary to prepare voice grammars that are fixedly described in the program using VoiceXML or the like.
このように、音声システムはプログラム開発することにより実現するものであり、開発側で構築するものであった。従って、音声システムの音声シナリオや音声グラマーを運用側で変更することは技術的に難しかった。また、運用側は音声システムの音声シナリオや音声グラマーを変更するため、個別に音声システムの開発を開発側に依頼する場合、多大なコスト及び期間を必要としていた。 As described above, the audio system is realized by developing a program, and is constructed on the development side. Therefore, it is technically difficult to change the voice scenario or voice grammar of the voice system on the operation side. In addition, since the operation side changes the voice scenario and the voice grammar of the voice system, enormous cost and time are required when requesting the development side to develop the voice system individually.
従来、音声システムでは管理者が作業者ごとに作業の習熟度を判断し、個々の作業者に適した音声シナリオを設定していた。また、作業者に適した音声シナリオが無い場合は特定の音声シナリオを利用できるように作業者をトレーニングしていた。なお、ユーザのシステムへのアクセス回数等からユーザの慣れの程度を判定し、ユーザの慣れの程度に応じて音声案内を変更する音声案内装置は既に知られている(例えば特許文献2参照)。 Conventionally, in an audio system, an administrator determines the proficiency level of work for each worker, and sets a voice scenario suitable for each worker. In addition, when there is no voice scenario suitable for the worker, the worker is trained so that a specific voice scenario can be used. Note that a voice guidance device that determines a user's familiarity from the number of accesses to the user's system and changes the voice guidance according to the familiarity of the user is already known (see, for example, Patent Document 2).
例えば作業者は、音声システムを利用し続けることで、次第に作業の習熟度が向上していく。したがって、従来の音声システムでは作業者の作業の習熟度の向上に従い、音声シナリオを設定し直す必要があった。しかしながら、作業者の作業の習熟度の向上は個人差が大きい。このため、従来の音声システムでは、管理者が作業者ごとに作業の習熟度の向上を見極め、作業の習熟度に合った音声シナリオを作業者ごとに設定し直さなければならない。 For example, the worker gradually improves the proficiency level of the work by continuing to use the voice system. Therefore, in the conventional voice system, it is necessary to reset the voice scenario in accordance with the improvement of the worker's proficiency level. However, the improvement in the skill level of the worker's work varies greatly among individuals. For this reason, in the conventional voice system, the manager must determine the improvement of the proficiency level of the work for each worker and reset the voice scenario suitable for the proficiency level of the work for each worker.
作業者ごとに作業の習熟度の向上を見極め、作業の習熟度に合った音声シナリオを作業者ごとに設定し直す作業は容易でなく、管理者にとって大きな作業負担になるという問題があった。 There is a problem that it is not easy to determine the improvement of work proficiency for each worker and to reset the voice scenario suitable for the work proficiency for each worker, which causes a heavy work load for the administrator.
本発明の一実施形態は、上記の点に鑑みなされたもので、作業者の作業の習熟度に適した音声シナリオを容易に設定できる音声シナリオ設定プログラム及び音声シナリオ設定装置を提供することを目的とする。 An embodiment of the present invention has been made in view of the above points, and an object thereof is to provide an audio scenario setting program and an audio scenario setting device that can easily set an audio scenario suitable for an operator's proficiency level. And
上記課題を解決するため、本発明の一実施形態は、コンピュータを、ユーザの音声入力実績を取得し、前記音声入力実績と習熟レベルとを対応付けるテーブルに基づいて、ユーザの前記音声入力実績に対応する前記習熟レベルを選択し、ユーザの前記習熟レベルに応じた音声シナリオを自動設定するシナリオ自動設定処理手段として機能させる為の音声シナリオ設定プログラムである。 In order to solve the above-described problem, an embodiment of the present invention is a computer that corresponds to a user's voice input record based on a table that acquires the user's voice input record and associates the voice input record with a proficiency level. This is a voice scenario setting program for functioning as a scenario automatic setting processing means for selecting the learning level to be set and automatically setting a voice scenario according to the user's learning level.
なお、本発明の一実施形態の構成要素、表現又は構成要素の任意の組合せを、方法、装置、システム、コンピュータプログラム、記録媒体、データ構造などに適用したものも本発明の態様として有効である。 In addition, what applied the component, the expression, or the arbitrary combinations of the component of one Embodiment of this invention to a method, an apparatus, a system, a computer program, a recording medium, a data structure, etc. is also effective as an aspect of this invention. .
上述の如く、本発明の一実施形態によれば、作業者の作業の習熟度に適した音声シナリオを容易に設定できる。 As described above, according to an embodiment of the present invention, it is possible to easily set a voice scenario suitable for an operator's proficiency level.
次に、本発明を実施するための形態を、以下の実施例に基づき図面を参照しつつ説明していく。以下の実施例では、音声シナリオを生成する音声シナリオ生成装置について説明した後、音声シナリオを設定する音声シナリオ設定装置について説明する。 Next, modes for carrying out the present invention will be described based on the following embodiments with reference to the drawings. In the following embodiments, a voice scenario generation apparatus that generates a voice scenario will be described, and then a voice scenario setting apparatus that sets a voice scenario will be described.
(音声シナリオ生成装置1)
図1は本実施例の音声シナリオ生成装置の一例のハードウェア構成図である。音声シナリオ生成装置1は、スタンドアローンの形態でも良いし、インターネットやLANなどのネットワーク経由でユーザ端末にデータ通信可能に接続された形態でもよい。
(Voice scenario generation device 1)
FIG. 1 is a hardware configuration diagram of an example of a voice scenario generation apparatus according to the present embodiment. The voice
音声シナリオ生成装置1は、それぞれバスBで相互に接続されている入力装置11,出力装置12,ドライブ装置13,補助記憶装置14,主記憶装置15,演算処理装置16及びインターフェース装置17を有する。
The voice
入力装置11はキーボードやマウス等である。入力装置11は、各種信号を入力するために用いられる。出力装置12はディスプレイ装置等である。出力装置12は、各種ウインドウやデータ等を表示するために用いられる。インターフェース装置17は、モデム又はLANカード等である。インターフェース装置17は、ネットワークに接続する為に用いられる。
The
本実施例の音声シナリオ生成プログラムは、音声シナリオ生成装置1を制御する各種プログラムの少なくとも一部である。音声シナリオ生成プログラムは例えば記録媒体18の配布やネットワークからのダウンロードなどによって提供される。音声シナリオ生成プログラムを記録した記録媒体18はCD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。
The voice scenario generation program of this embodiment is at least a part of various programs that control the voice
音声シナリオ生成プログラムを記録した記録媒体18がドライブ装置13にセットされると、音声シナリオ生成プログラムは記録媒体18からドライブ装置13を介して補助記憶装置14にインストールされる。なお、ネットワークからダウンロードされた音声シナリオ生成プログラムは、インターフェース装置17を介して、補助記憶装置14にインストールされる。補助記憶装置14はインストールされた音声シナリオ生成プログラムを格納すると共に、必要なファイル,データ等を格納する。
When the
主記憶装置15は、音声シナリオ生成プログラムの起動時に補助記憶装置14から音声シナリオ生成プログラムを読み出して格納する。そして、演算処理装置16は主記憶装置15に格納された音声シナリオ生成プログラムに従って、後述するような各種処理を実現している。
The
図2は音声シナリオ生成装置の一例のブロック図である。音声シナリオ生成装置1はシナリオマスタ21,グラマーマスタ22,シナリオ自動生成処理部23,グラマー自動生成処理部24,グラマー条件指定受付部25を有する。なお、図2では音声シナリオ生成装置1内にシナリオマスタ21,グラマーマスタ22を有しているが、音声シナリオ生成装置1外(例えばDBサーバなど)に設けてもよい。
FIG. 2 is a block diagram of an example of a voice scenario generation device. The voice
シナリオマスタ21には、生成する音声シナリオ26の実行ステップが例えばテーブル形式で登録されている。シナリオ自動生成処理部23はシナリオマスタ21から音声シナリオの実行ステップを表すレコードを順次読み出し、読み出したレコードから音声シナリオ26を自動生成する。シナリオ自動生成処理部23は読み出したレコード毎にシナリオファイルを生成し、1つ以上のシナリオファイルにより音声シナリオ26を生成する。複数の音声シナリオ26を生成する場合、シナリオマスタ21には複数の音声シナリオ26毎に、音声シナリオ26の実行ステップがテーブル形式で登録されている。なお、シナリオ自動生成処理部23,シナリオマスタ21及び音声シナリオ26の詳細は後述する。
In the
グラマー条件指定受付部25は、例えば音声シナリオ生成装置1を操作する管理者からの音声グラマー27の生成条件の指定を受け付ける。グラマーマスタ22には、音声入力される音声ワードを出力項目(変換語)に変換する為の1つ以上のテーブルが登録されている。なお、出力項目は音声システムで行うシナリオ制御処理において利用される。
The grammar condition
そして、グラマー自動生成処理部24はグラマー条件指定受付部25が受け付けた音声グラマー27の生成条件に従い、グラマーマスタ22に登録されているレコードを読み出し、読み出したレコードから音声グラマー27を自動生成する。なお、グラマー条件指定受付部25,グラマー自動生成処理部24,グラマーマスタ22及び音声グラマー27の詳細は後述する。
Then, the grammar automatic
以下では、自動生成する音声シナリオ26の一例として、図3に示す在庫確認シナリオを例に説明する。図3の在庫確認シナリオは、在庫確認に関係するステップと、終了確認に関係するステップとを含む。また、図3の在庫確認シナリオは音声システムからの音声指示31〜35と、データ処理36と、作業者の発話41〜43とを含む。
In the following, an example of the inventory confirmation scenario shown in FIG. 3 will be described as an example of the
図3の在庫確認シナリオの場合、管理者は例えば図4に示すようなシナリオマスタ21を登録する。図4はシナリオマスタの一例の構成図である。図4に示したシナリオマスタ21は、項目として「No.」,「出力メッセージ」,「処理区分」,「入力格納変数」,「分岐No.1〜n」,「辞書名」,「データ処理名」,「指示パラメータ」,「戻り値」を有する。
In the case of the inventory confirmation scenario of FIG. 3, the administrator registers a
項目「No.」は、シナリオの実行ステップを表している。実行ステップは、シナリオが分岐する場合、「分岐No.1〜n」に登録されている「No.」の実行ステップへ遷移する。例えば図4の例では「No.01」の実行ステップからシナリオを開始し、作業者が「はい」を入力した場合に「No.02」の実行ステップに遷移し、「いいえ」を入力した場合に「No.91」の実行ステップに遷移することを表している。 The item “No.” represents a scenario execution step. When the scenario branches, the execution step transitions to the “No.” execution step registered in “Branch Nos. 1 to n”. For example, in the example of FIG. 4, when the scenario is started from the execution step “No. 01”, when the operator inputs “Yes”, the process proceeds to the execution step “No. 02” and “No” is input. Represents transition to the execution step of “No. 91”.
項目「出力メッセージ」は音声システムから作業者へ音声出力するメッセージを表している。例えば図4の例では「No.01」の実行ステップが、音声システムから作業者に対し、「作業を開始しますか?」というメッセージを音声出力することを表している。 The item “output message” represents a message output from the voice system to the worker. For example, in the example of FIG. 4, the execution step of “No. 01” indicates that a message “Do you want to start work?” Is output from the voice system to the worker.
項目「処理区分」は、実行ステップの区分「入出力」,「処理」,「分岐」又は「終了」を表している。「入出力」は、音声入力又は音声出力を実行する実行ステップであることを表している。「処理」は、データベース操作処理を実行する実行ステップであることを表している。「分岐」は、処理結果により分岐判別を行う実行ステップであることを表している。「終了」は、音声シナリオ26を終了する実行ステップであることを表している。
The item “processing category” represents the category “input / output”, “processing”, “branch” or “end” of the execution step. “Input / output” represents an execution step for executing voice input or voice output. “Process” represents an execution step for executing a database operation process. “Branch” represents an execution step for performing branch determination based on the processing result. “End” represents an execution step for ending the
例えば図4の例では、「No.01」の実行ステップが、音声システムから作業者へ音声出力し、その音声出力に対して作業者から音声システムへ音声入力を行うことを表している。 For example, in the example of FIG. 4, the execution step of “No. 01” represents that a voice is output from the voice system to the worker, and the voice is input from the worker to the voice system in response to the voice output.
「No.03」の実行ステップは、「ZaikoSearch.sql」のデータベース操作処理を実行することを表している。「No.04」の実行ステップは、「No.03」の実行ステップの結果、存在するアドレスの場合に「No.05」の実行ステップへ遷移し、存在しないアドレスの場合に「No.02」の実行ステップへ遷移することを表している。「No.93」の実行ステップは、実行中の音声シナリオ26を終了することを表している。
The execution step of “No. 03” represents that the database operation process of “ZaikoSearch.sql” is executed. The execution step of “No. 04” makes a transition to the execution step of “No. 05” when the address exists as a result of the execution step of “No. 03”, and “No. 02” when the address does not exist. This represents a transition to the execution step. The execution step of “No. 93” indicates that the
項目「入力格納変数」は、作業者から音声入力された音声ワードを格納する入力格納変数の名称を表している。例えば図4の例では、「No.01」の出力メッセージに対して作業者から入力された音声ワード(入力値)を入力格納変数「Outou01」に格納することを表している。 The item “input storage variable” represents the name of an input storage variable for storing a speech word input by speech from an operator. For example, in the example of FIG. 4, the voice word (input value) input from the operator with respect to the output message “No. 01” is stored in the input storage variable “Outou01”.
項目「分岐No.1〜n」は音声シナリオの分岐条件及び分岐先を表している。例えば図4の例では、「No.01」の実行ステップが、作業者の音声入力の内容によって「No.02」又は「No.91」の実行ステップに遷移することを表している。また、「No.04」の実行ステップは、「No.03」の実行ステップの結果によって、「No.05」又は「No.02」の実行ステップに遷移することを表している。 The item “branch No. 1 to n” represents the branch condition and branch destination of the voice scenario. For example, the example of FIG. 4 represents that the execution step “No. 01” transitions to the execution step “No. 02” or “No. 91” depending on the contents of the voice input by the operator. Further, the execution step of “No. 04” represents a transition to the execution step of “No. 05” or “No. 02” depending on the result of the execution step of “No. 03”.
項目「辞書名」は作業者が入力した音声ワードをテキスト変換するために使用する音声グラマー27のファイル名を表している。例えば図4の例では、「No.01」の実行ステップが、作業者により入力された音声ワードの内容を「共通ワード辞書」という音声グラマー27により認識することを表している。
The item “dictionary name” represents the file name of the
項目「データ処理名」はデータの検索・更新を必要とする場合に実行するデータ処理名を表している。例えば図4の例では、「No.03」の実行ステップが、データ処理名「ZaikoSearch.sql」のデータベース操作処理を実行することを表している。 The item “data processing name” represents a data processing name to be executed when data search / update is required. For example, in the example of FIG. 4, the execution step “No. 03” indicates that the database operation process with the data processing name “ZaikoSearch.sql” is executed.
項目「指示パラメータ」はデータベース操作処理を実行する際、データベース操作処理へ引き渡すパラメータを表している。例えば図4の例では、「No.03」の実行ステップが、「ZaikoSearch.sql」のデータベース操作処理へ入力格納変数「Outou02」に格納されている格納値をパラメータとして引き渡すことを表している。 The item “instruction parameter” represents a parameter delivered to the database operation process when the database operation process is executed. For example, in the example of FIG. 4, the execution step of “No. 03” represents passing the storage value stored in the input storage variable “Outou02” as a parameter to the database operation process of “ZaikoSearch.sql”.
また、項目「戻り値」はデータベース操作処理の処理結果を格納する入力格納変数の名称を表している。例えば図4の例では、「No.03」の実行ステップが、「ZaikoSearch.sql」のデータベース操作処理の処理結果を入力格納変数「kekka03」に格納することを表している。 The item “return value” represents the name of an input storage variable that stores the processing result of the database operation processing. For example, in the example of FIG. 4, the execution step “No. 03” represents that the processing result of the database operation processing “ZaikoSearch.sql” is stored in the input storage variable “kekka03”.
(シナリオ自動生成処理部23)
図5はシナリオ自動生成処理部の処理手順を表した一例のフローチャートである。例えば音声シナリオ生成装置1を操作する管理者から音声シナリオ26の一例としての在庫確認シナリオの生成要求を受けると、ステップS1に進み、シナリオ自動生成処理部23はシナリオマスタ21から在庫確認シナリオに該当する図4のテーブルの最初のレコードを取得する。なお、図4のテーブルの最初のレコードは、在庫確認シナリオの最初の実行ステップに対応する。
(Scenario automatic generation processing unit 23)
FIG. 5 is a flowchart illustrating an example of a processing procedure of the scenario automatic generation processing unit. For example, when an inventory confirmation scenario generation request as an example of the
ステップS2に進み、シナリオ自動生成処理部23はステップS1で取得したレコードの項目「処理区分」を確認する。ステップS3に進み、シナリオ自動生成処理部23はステップS2で確認した項目「処理区分」が「入出力」であるか否かを判定する。ステップS2で確認した項目「処理区分」が「入出力」であれば、シナリオ自動生成処理部23はステップS4に進み、後述の入出力シナリオ記述処理を行う。なお、入出力シナリオ記述処理では、取得したレコードに応じて、最初の実行ステップに対応するシナリオファイルをVoiceXMLで記述する。図4のテーブルでは、ステップS1で取得したレコードの項目「処理区分」が「入出力」であるため、ステップS4に進み、後述の入出力シナリオ記述処理を行ったあと、ステップS9に進む。
Proceeding to step S2, the scenario automatic
ステップS9では、シナリオ自動生成処理部23が、シナリオマスタ21から在庫確認シナリオに該当する図4のテーブルの次のレコードを取得したあと、ステップS2の処理に戻る。図4のテーブルでは、ステップS9で取得した2番目のレコードの項目「処理区分」が「入出力」であるため、ステップS4に進み、入出力シナリオ記述処理を行ったあと、ステップS9に進む。
In step S9, the scenario automatic
ステップS9では、シナリオ自動生成処理部23が、シナリオマスタ21から在庫確認シナリオに該当する図4のテーブルの次のレコードを取得したあと、ステップS2の処理に戻る。図4のテーブルでは、ステップS9で取得した3番目のレコードの項目「処理区分」が「処理」である。
In step S9, the scenario automatic
ステップS2で確認した項目「処理区分」が「入出力」でない為、シナリオ自動生成処理部23はステップS5に進み、ステップS2で確認した項目「処理区分」が「処理」であるか否かを判定する。
Since the item “processing category” confirmed in step S2 is not “input / output”, the scenario automatic
ステップS2で確認した項目「処理区分」が「処理」であれば、シナリオ自動生成処理部23はステップS6に進み、後述の処理シナリオ記述処理を行う。なお、処理シナリオ記述処理では、取得したレコードに応じて、3番目の実行ステップに対応するシナリオファイルをVoiceXMLで記述する。図4のテーブルでは、ステップS9で取得したレコードの項目「処理区分」が「処理」であるため、ステップS6に進み、後述の処理シナリオ記述処理を行ったあと、ステップS9に進む。
If the item “Processing category” confirmed in Step S2 is “Processing”, the scenario automatic
ステップS9では、シナリオ自動生成処理部23が、シナリオマスタ21から在庫確認シナリオに該当する図4のテーブルの次のレコードを取得したあと、ステップS2の処理に戻る。図4のテーブルでは、ステップS9で取得した4番目のレコードの項目「処理区分」が「分岐」である。
In step S9, the scenario automatic
ステップS2で確認した項目「処理区分」が「入出力」でない為、シナリオ自動生成処理部23はステップS5に進む。また、ステップS2で確認した項目「処理区分」が「処理」でない為、シナリオ自動生成処理部23はステップS7に進み、ステップS2で確認した項目「処理区分」が「分岐」であるか否かを判定する。
Since the item “processing classification” confirmed in step S2 is not “input / output”, the scenario automatic
ステップS2で確認した項目「処理区分」が「分岐」であれば、シナリオ自動生成処理部23はステップS8に進み、後述の分岐シナリオ記述処理を行う。なお、分岐シナリオ記述処理では、取得したレコードに応じて、4番目の実行ステップに対応するシナリオファイルをVoiceXMLで記述する。図4のテーブルでは、ステップS9で取得したレコードの項目「処理区分」が「分岐」であるため、ステップS8に進み、後述の分岐シナリオ記述処理を行ったあと、ステップS9に進む。
If the item “processing category” confirmed in step S2 is “branch”, the scenario automatic
ステップS9では、シナリオ自動生成処理部23が、シナリオマスタ21から在庫確認シナリオに該当する図4のテーブルの次のレコードを取得したあと、ステップS2の処理に戻る。図4のテーブルでは、ステップS9で5,6及び7番目に取得したレコードの項目「処理区分」が「入出力」である。なお、ステップS9で取得したレコードの項目「処理区分」が「入出力」であるときの処理は前述した為、説明を省略する。
In step S9, the scenario automatic
ステップS9では、シナリオ自動生成処理部23が、シナリオマスタ21から在庫確認シナリオに該当する図4のテーブルの8番目のレコードを取得したあと、ステップS2の処理に戻る。図4のテーブルでは、ステップS9で取得した8番目のレコードの項目「処理区分」が「終了」である。
In step S9, the scenario automatic
ステップS2で確認した項目「処理区分」が「入出力」でない為、シナリオ自動生成処理部23はステップS5に進む。また、ステップS2で確認した項目「処理区分」が「処理」でない為、シナリオ自動生成処理部23はステップS7に進む。ステップS2で確認した項目「処理区分」が「分岐」でない為、シナリオ自動生成処理部23はステップS2で確認した項目「処理区分」が「終了」であると判定する。
Since the item “processing classification” confirmed in step S2 is not “input / output”, the scenario automatic
ステップS10に進み、シナリオ自動生成処理部23は、後述の終了シナリオ記述処理を行う。なお、終了シナリオ記述処理では、取得したレコードに応じて、8番目の実行ステップに対応するシナリオファイルを生成し、在庫確認シナリオの生成を終了するようにVoiceXMLで記述する。
In step S10, the automatic scenario
(入出力シナリオ記述処理)
図6は入出力シナリオ記述処理の一例のフローチャートである。シナリオ自動生成処理部23はステップS21に進み、取得したレコードの項目「出力メッセージ」に登録されているメッセージを音声出力ワードとしてVoiceXMLで定義する。なお、音声出力ワードは音声システムから作業者へ音声出力されるメッセージである。
(I / O scenario description processing)
FIG. 6 is a flowchart of an example of the input / output scenario description process. The scenario automatic
ステップS22に進み、シナリオ自動生成処理部23は、作業者から音声入力があった場合、発話された音声ワードを、取得したレコードの項目「入力格納変数」に登録されている名称の入力格納変数へセットするようVoiceXMLで定義する。
Proceeding to step S22, when there is a voice input from the operator, the scenario automatic
ステップS23に進み、シナリオ自動生成処理部23は入力格納変数へセットされた音声ワードを、取得したレコードの項目「辞書名」で表される音声グラマー27を使用してテキスト変換するようVoiceXMLで定義する。
In step S23, the scenario automatic
ステップS24に進み、シナリオ自動生成処理部23はテキスト変換された音声入力の内容によって、取得したレコードの項目「分岐No.1〜n」で表される音声シナリオの分岐条件及び分岐先からシナリオ遷移先を決定するようVoiceXMLで定義する。
In step S24, the scenario automatic
例えば図4に示す「No.01」の実行ステップでは、分岐条件「はい」に対する分岐先として「No.02」の実行ステップが登録され、分岐条件「いいえ」に対する分岐先として「No.91」の実行ステップが登録されている。したがって、シナリオ自動生成処理部23は、テキスト変換された音声入力の内容が「はい」であれば「No.02」の実行ステップをシナリオ遷移先として決定する。なお、シナリオ自動生成処理部23は入力格納変数へセットされた音声ワードをテキスト変換できなかった場合の分岐条件及び分岐先も登録する。
For example, in the execution step of “No. 01” shown in FIG. 4, the execution step of “No. 02” is registered as the branch destination for the branch condition “Yes”, and “No. 91” as the branch destination for the branch condition “No”. Execution steps are registered. Accordingly, the scenario automatic
(処理シナリオ記述処理)
図7は処理シナリオ記述処理の一例のフローチャートである。シナリオ自動生成処理部23はステップS31に進み、取得したレコードの項目「データ処理名」にセットされたデータベース操作処理へ、取得したレコードの項目「指示パラメータ」にセットされたパラメータを引き渡して実行するようVoiceXMLで定義する。
(Processing scenario description processing)
FIG. 7 is a flowchart of an example of the process scenario description process. The scenario automatic
また、ステップS32に進み、シナリオ自動生成処理部23はデータベース操作処理の結果を、取得したレコードの項目「戻り値」にセットされた入力格納変数へセットするようVoiceXMLで定義する。
In step S32, the scenario automatic
(分岐シナリオ記述処理)
図8は分岐シナリオ記述処理の一例のフローチャートである。シナリオ自動生成処理部23はステップS35に進み、取得したレコードの項目「分岐No.1〜n」にセットされた分岐条件及び分岐先と、取得したレコードの項目「戻り値」の入力格納変数にセットされたデータベース操作処理の結果とに応じて、シナリオ遷移先を決定するようVoiceXMLで定義する。
(Branch scenario description process)
FIG. 8 is a flowchart of an example of a branch scenario description process. The scenario automatic
(終了シナリオ記述処理)
図9は終了シナリオ記述処理の一例のフローチャートである。シナリオ自動生成処理部23はステップS41に進み、実行中の音声シナリオ26を終了するようVoiceXMLで定義する。
(End scenario description process)
FIG. 9 is a flowchart of an example of the end scenario description process. The scenario automatic
(グラマー自動生成処理部24)
ここでは、グラマー自動生成処理部24の処理の一例として、操作者が在庫アドレスを音声入力する際に使用する音声グラマー27の生成処理について説明する。グラマー条件指定受付部25は、例えば音声シナリオ生成装置1を操作する管理者から音声グラマー27の生成条件として、使用するテーブルのテーブル名,出力項目,検索項目及び出力する音声グラマー27のファイル名の指定を受け付ける。使用するテーブルはグラマーマスタ22に登録されているテーブルである。
(Glammer automatic generation processing unit 24)
Here, as an example of the process of the grammar automatic
操作者は図10に示すような3桁コードマスタテーブルのテーブル名「3桁コードマスタ」,出力項目「読上げ3桁コード」,検索項目「検索3桁コード」を生成条件として指定したとする。図10は3桁コードマスタテーブルの一例の構成図である。図10に示す3桁コードマスタテーブルは、正式3桁コード,読上げ3桁コード,3つの検索3桁コードを項目として有する。 Assume that the operator designates the table name “3-digit code master”, the output item “read-out 3-digit code”, and the search item “search 3-digit code” in the 3-digit code master table as shown in FIG. FIG. 10 is a configuration diagram of an example of a three-digit code master table. The three-digit code master table shown in FIG. 10 has items including an official three-digit code, a reading three-digit code, and three search three-digit codes.
そして、グラマー自動生成処理部24はグラマー条件指定受付部25が受け付けた音声グラマー27の生成条件に従い、グラマーマスタ22に登録されている図10に示すような3桁コードマスタテーブルを読み出す。そして、グラマー自動生成処理部24は読み出した3桁コードマスタテーブルから図11に示すような手順で音声グラマー27を自動生成する。
Then, the grammar automatic
図11は3桁コードマスタテーブルから音声グラマーを生成する手順を表したイメージ図である。グラマー自動生成処理部24は3桁コードマスタテーブルからレコードを順次読み出す。グラマー自動生成処理部24は読み出したレコードに基づき、項目「読上げ3桁コード」に対応する3つの「検索3桁コード」を取得する。
FIG. 11 is an image diagram showing a procedure for generating an audio grammar from the 3-digit code master table. The grammar automatic
グラマー自動生成処理部24は項目「読上げ3桁コード」を出力項目とし、項目「検索3桁コード」を検索項目とした上、出力項目と検索項目とを対応付ける3つのレコードを生成する。具体的に、グラマー自動生成処理部24は項目「読上げ3桁コード」に対応する3つの「検索3桁コード」から、出力項目「イチゼロイチ」及び検索項目「イチゼロイチ」を対応付けるレコード、出力項目「イチゼロイチ」及び検索項目「ワンゼロワン」を対応付けるレコード、出力項目「イチゼロイチ」及び検索項目「イチレイイチ」を対応付けるレコードを生成する。
The grammar automatic
結果として、グラマー自動生成処理部24は図11に示すような音声グラマー27を自動生成できる。なお、音声グラマー27における検索項目は音声入力された音声ワードを検索キーとして音声グラマー27を検索するときに利用される。検索キーに一致する検索項目が存在すれば、音声システムは音声入力された音声ワードを、検索キーに一致した検索項目に対応する出力項目(変換語)に変換できる。
As a result, the grammar automatic
なお、グラマー自動生成処理部24は、グラマーマスタ22に登録されている複数種類のマスタテーブルを組み合わせて、1つの音声グラマー27を生成してもよい。例えばグラマー自動生成処理部24は苗字マスタテーブル及び名前マスタテーブルがグラマーマスタ22に登録されている場合、苗字マスタテーブル及び名前マスタテーブルから苗字名前に対応する(フルネームに対応する)音声グラマー27を生成してもよい。
Note that the grammar automatic
(シナリオマスタ21及び音声シナリオ26の具体例)
図12〜図17はシナリオマスタの具体例を表した構成図である。シナリオ自動生成処理部23は図12〜図17に示すシナリオマスタ21から音声シナリオの実行ステップを表すレコードを順次読み出し、読み出したレコード毎にシナリオファイルを生成し、1つ以上のシナリオファイルにより音声シナリオ26を生成する。なお、図12〜図17に示したシナリオマスタ21は項目が多いため、図12〜図17に分割して記載している。
(Specific examples of
12 to 17 are configuration diagrams showing specific examples of scenario masters. The scenario automatic
図18は、生成されたシナリオファイルのファイル名を表示した一例の画面イメージである。例えばシナリオ自動生成処理部23は生成したシナリオファイルのファイル名を出力装置12等に表示して管理者に確認させる。生成されたシナリオファイルの内容は例えば図19〜図27のようになる。図19〜図27のシナリオファイルはVoiceXMLで記述されている。
FIG. 18 is an example screen image displaying the file name of the generated scenario file. For example, the scenario automatic
(音声シナリオ設定装置100)
音声シナリオ設定装置100のハードウェア構成図は図1に示した音声シナリオ生成装置1のハードウェア構成図と同様である。音声シナリオ設定装置100は、スタンドアローンの形態でも良いし、インターネットやLANなどのネットワーク経由でユーザ端末にデータ通信可能に接続された形態でもよい。
(Voice scenario setting device 100)
The hardware configuration diagram of the voice
本実施例の音声シナリオ設定プログラムは、音声シナリオ設定装置100を制御する各種プログラムの少なくとも一部である。音声シナリオ設定プログラムは例えば記録媒体18の配布やネットワークからのダウンロードなどによって提供される。
The voice scenario setting program of this embodiment is at least a part of various programs for controlling the voice
音声シナリオ設定プログラムを記録した記録媒体18は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。
The
音声シナリオ設定プログラムを記録した記録媒体18がドライブ装置13にセットされると、音声シナリオ設定プログラムは記録媒体18からドライブ装置13を介して補助記憶装置14にインストールされる。なお、ネットワークからダウンロードされた音声シナリオ設定プログラムは、インターフェース装置17を介して、補助記憶装置14にインストールされる。補助記憶装置14はインストールされた音声シナリオ設定プログラムを格納すると共に、必要なファイル,データ等を格納する。
When the
主記憶装置15は、音声シナリオ設定プログラムの起動時に補助記憶装置14から音声シナリオ設定プログラムを読み出して格納する。そして、演算処理装置16は主記憶装置15に格納された音声シナリオ設定プログラムに従って、後述するような各種処理を実現している。
The
図28は音声シナリオ設定装置の一例のブロック図である。音声シナリオ設定装置100は、音声入力DB101,音声入力実績収集処理部102,音声入力実績ログDB103,実績評価DB104,習熟レベル選択処理部105,習熟レベル変換テーブル106及び音声シナリオ設定テーブル107を有する。なお、図28では音声シナリオ設定装置100内に音声入力DB101,実績評価DB104,習熟レベル変換テーブル106及び音声シナリオ設定テーブル107を有しているが、音声シナリオ設定装置100外(例えばDBサーバなど)に設けてもよい。
FIG. 28 is a block diagram of an example of a voice scenario setting device. The voice
音声入力DB101は、作業者から音声システムへ音声入力された音声入力データを作業者別に格納している。音声入力実績収集処理部102は、音声入力DB101に格納されている作業者別の音声入力データから、作業者別の音声入力実績をログ情報として収集して音声入力実績ログDB103に格納する。
The
音声入力実績には、音声認識率,音声適正認識回数,音声読上げ速度,再確認回数,応答時間が含まれる。音声認識率は、作業者の音声入力に対する認識成功率(例えば音声シナリオ26で想定されている音声ワードに認識できた回数/作業者の音声入力の回数)である。
The voice input results include the voice recognition rate, the number of times of proper voice recognition, the voice reading speed, the number of reconfirmations, and the response time. The voice recognition rate is a recognition success rate (for example, the number of times that a voice word assumed in the
音声適正認識回数は、推奨される音声ワードで認識された回数である。推奨される音声ワードは例えば音声グラマー27の出力項目に格納されている音声ワードである。具体的には、例えば音声ワード「トウキョウ」が推奨される音声ワードであると判定され、音声ワード「トオキョオ」が推奨される音声ワードであると判定されない。
The number of times of proper speech recognition is the number of times recognized by a recommended speech word. The recommended speech word is, for example, a speech word stored in the output item of the
また、音声読上げ速度は作業者が音声システムの使用時に設定している音声出力の速度である。再確認回数は作業者が音声出力を再確認する為の「ヘルプ」や「もう一度」を音声入力した回数である。応答時間は音声出力に対する音声入力までの経過時間である。 The voice reading speed is the voice output speed set by the operator when using the voice system. The number of reconfirmations is the number of times that the operator inputs “help” and “again” for reconfirming the voice output. The response time is the elapsed time until the voice input with respect to the voice output.
実績評価DB104は、習熟レベル選択処理部105が習熟レベル選択処理に利用する実績評価テーブルを格納している。実績評価テーブルは、図29に示すような音声発話能力評価テーブル,図30に示すような音声ヒアリング能力評価テーブル,図31に示すような音声応答時間評価テーブルを格納している。
The
図29は音声発話能力評価テーブルの一例の構成図である。音声発話能力評価テーブルは音声認識率と音声適正認識回数とのマトリックスを作成し、それぞれに該当する評価点を登録したものである。 FIG. 29 is a configuration diagram of an example of a speech utterance ability evaluation table. The speech utterance ability evaluation table is a table in which a matrix of speech recognition rates and appropriate speech recognition times is created, and the corresponding evaluation points are registered.
図30は音声ヒアリング能力評価テーブルの一例の構成図である。音声ヒアリング能力評価テーブルは音声読上げ速度と再確認回数とのマトリックスを作成し、それぞれに該当する評価点を登録したものである。図31は音声応答時間評価テーブルの一例の構成図である。音声応答時間評価テーブルは応答時間に対応する係数を登録したものである。 FIG. 30 is a configuration diagram of an example of a voice hearing ability evaluation table. The voice hearing ability evaluation table is a table in which a matrix of the voice reading speed and the number of reconfirmations is created, and the corresponding evaluation points are registered. FIG. 31 is a configuration diagram of an example of a voice response time evaluation table. The voice response time evaluation table is a table in which coefficients corresponding to response times are registered.
習熟レベル選択処理部105は、音声入力実績ログDB103に格納されている作業者別の音声入力実績と実績評価DB104に格納されている実績評価テーブルとに基づいて作業者毎に評価点を算出する。評価点の算出には、以下の式(1)を利用する。
The proficiency level
評価点=(音声発話能力の評価点+音声ヒアリング能力の評価点)×応答時間に対応する係数・・・(1) Evaluation point = (Evaluation point of voice utterance ability + Evaluation point of voice hearing ability) × Coefficient corresponding to response time (1)
習熟レベル変換テーブル106は評価点と習熟レベルとを対応付けている。習熟レベル選択処理部105は習熟レベル変換テーブル106を利用して、評価点を習熟レベルに変換する。そして、習熟レベル選択処理部105は習熟レベルと作業者とを対応付けて音声シナリオ設定テーブル107に格納する。習熟レベルは作業者と音声シナリオ26とを対応付けるものである。例えば習熟レベルを初級,中級,上級に分けた場合、習熟レベルは作業者と、初級,中級,上級の音声シナリオ26の何れかと、を対応付ける。例えば音声シナリオ設定テーブル107は、音声システムで行うシナリオ制御処理において、作業者の音声シナリオ26を選択する為に利用される。
The proficiency level conversion table 106 associates evaluation points with proficiency levels. The proficiency level
次に、習熟レベル選択処理部105の処理の具体例について説明する。ここでは、図32に示すような初級,中級,上級の音声シナリオ26を準備しているものとする。図32は初級,中級,上級の音声シナリオの一例のイメージ図である。
Next, a specific example of processing of the proficiency level
習熟レベル選択処理部105は、音声入力実績ログDB103から例えば1ヶ月の作業者Aの音声入力実績として、音声認識率:83%,音声適正認識回数:1200回,音声読上げ速度:レベル8,再確認回数:30回,応答時間:0.4を取得する。
The proficiency level
習熟レベル選択処理部105は取得した音声認識率:83%,音声適正認識回数:1200回と図29の音声発話能力評価テーブルとに基づき、音声発話能力の評価点「2」を得る。また、習熟レベル選択処理部105は取得した音声読上げ速度:レベル8,再確認回数:30回と図30の音声ヒアリング能力評価テーブルとに基づき、音声ヒアリング能力の評価点「3」を得る。
The proficiency level
さらに、習熟レベル選択処理部105は取得した応答時間:0.4と図31の音声応答時間評価テーブルとに基づき、応答時間に対応する係数「1.5」を得る。習熟レベル選択処理部105は式(1)を利用して、音声発話能力の評価点「2」,音声ヒアリング能力の評価点「3」及び応答時間に対応する係数「1.5」から、評価点「7.5」を算出する。
Further, the proficiency level
習熟レベル変換テーブル106は評価点「3未満」を習熟レベル「初級」、評価点「4以上〜6未満」を習熟レベル「中級」、評価点「7以上」を習熟レベル「上級」に対応付けているものとする。習熟レベル選択処理部105は習熟レベル変換テーブル106及び評価点「7.5」から、作業者Aの使用する音声シナリオ26として上級の音声シナリオ26を選択する。
The proficiency level conversion table 106 associates the evaluation score “less than 3” with the proficiency level “beginning”, the evaluation score “4 to less than 6” with the proficiency level “intermediate”, and the evaluation score “7 or higher” with the proficiency level “advanced”. It shall be. The proficiency level
なお、中級及び上級の音声シナリオ26を使用する作業者については、一度、習熟レベルが上がると落ちにくい評価基準とするため、習熟レベル変換テーブル106の内容を習熟レベルに応じて異ならせてもよい。例えば初級の音声シナリオ26を使用する作業者の習熟レベル変換テーブル106は、評価点「3未満」を習熟レベル「初級」、評価点「4以上〜6未満」を習熟レベル「中級」、評価点「7以上」を習熟レベル「上級」に対応付ける。中級の音声シナリオ26を使用する作業者の習熟レベル変換テーブル106は評価点「2未満」を習熟レベル「初級」、評価点「3以上〜6未満」を習熟レベル「中級」、評価点「7以上」を習熟レベル「上級」に対応付ける。上級の音声シナリオ26を使用する作業者の習熟レベル変換テーブル106は評価点「2未満」を習熟レベル「初級」、評価点「3以上〜4未満」を習熟レベル「中級」、評価点「5以上」を習熟レベル「上級」に対応付ける。
It should be noted that for the workers who use the intermediate and
このように、中級及び上級の音声シナリオ26を使用する作業者については、一度、習熟レベルが上がると落ちにくい評価基準とすることにより、一時的な要因(体調不良や周囲の騒音などの不利な環境下)での習熟レベルの低下に対処できる。
As described above, for the workers who use the intermediate and
(まとめ)
以上、本実施例の音声シナリオ生成装置1によれば、管理者がシナリオマスタ21及びグラマーマスタ22を登録することで、音声シナリオを自動生成できるので、音声システムの構築が容易になり、音声システムの開発における開発コストの削減と、開発期間の短縮とを実現できる。結果、本実施例の音声シナリオ生成装置1によれば、音声システムの実運用開始までの対応時間を短縮することが可能である。
(Summary)
As described above, according to the voice
また、本実施例の音声シナリオ設定装置100によれば、作業者の習熟度を自動的に判定するため、管理者による作業者の習熟度の判断が不要となる。さらに、本実施例の音声シナリオ生成装置1及び音声シナリオ設定装置100によれば、シナリオマスタ21及びグラマーマスタ22の試作を繰り返しながら、音声システムを運用できるため、運用に即したシナリオマスタ21及びグラマーマスタ22を生成でき、音声認識率の高い音声システムの提供が容易となる。
Further, according to the voice
本実施例では音声シナリオ生成装置1及び音声シナリオ設定装置100を別々に説明したが、一つの装置としてもよいし、音声システムの機能として含ませてもよい。
In the present embodiment, the voice
本発明は、以下に記載する付記のような構成が考えられる。
(付記1)
コンピュータを、
ユーザの音声入力実績を取得し、前記音声入力実績と習熟レベルとを対応付けるテーブルに基づいて、ユーザの前記音声入力実績に対応する前記習熟レベルを選択し、ユーザの前記習熟レベルに応じた音声シナリオを自動設定するシナリオ自動設定処理手段
として機能させる為の音声シナリオ設定プログラム。
(付記2)
前記シナリオ自動設定処理手段は、ユーザの音声入力実績として、音声発話能力を評価する為の音声入力実績,音声ヒアリング能力を評価する為の音声入力実績,音声応答能力を評価する為の音声入力実績を取得し、前記音声発話能力を評価する為の音声入力実績と評価情報とを対応付けるテーブルと、前記音声ヒアリング能力を評価する為の音声入力実績と評価情報とを対応付けるテーブルと、前記音声応答能力を評価する為の音声入力実績と評価情報とを対応付けるテーブルとに基づいて、ユーザの前記音声入力実績に対応する前記習熟レベルを選択する付記1記載の音声シナリオ設定プログラム。
(付記3)
前記シナリオ自動設定処理手段は、ユーザの現在の前記習熟レベルに応じて、ユーザの前記音声入力実績に対応する前記習熟レベルを異ならせ、前記習熟レベルが下がりにくくする付記1又は2記載の音声シナリオ設定プログラム。
(付記4)
前記音声発話能力を評価する為の音声入力実績は、音声認識率及び音声適正認識回数であり、前記音声ヒアリング能力を評価する為の音声入力実績は、音声読上げ速度及び再確認回数であり、前記音声応答能力を評価する為の音声入力実績、音声出力に対する応答時間である付記2記載の音声シナリオ設定プログラム。
(付記5)
音声シナリオを自動設定する音声シナリオ設定装置であって、
ユーザの音声入力実績を取得し、前記音声入力実績と習熟レベルとを対応付けるテーブルに基づいて、ユーザの前記音声入力実績に対応する前記習熟レベルを選択し、ユーザの前記習熟レベルに応じた音声シナリオを自動設定するシナリオ自動設定処理手段
を有する音声シナリオ設定装置。
The present invention may have the following configurations as described below.
(Appendix 1)
Computer
A voice scenario corresponding to the user's proficiency level is selected by acquiring the user's voice input record, selecting the proficiency level corresponding to the user's voice input record based on a table associating the voice input record and the proficiency level. Voice scenario setting program for functioning as an automatic scenario setting processing means for automatically setting
(Appendix 2)
The scenario automatic setting processing means includes a voice input record for evaluating voice utterance ability, a voice input record for evaluating voice hearing ability, and a voice input record for evaluating voice response ability as a user's voice input record. And a table associating the speech input performance and the evaluation information for evaluating the speech utterance ability, a table associating the speech input record and the evaluation information for evaluating the speech hearing ability, and the speech response ability The voice scenario setting program according to
(Appendix 3)
The audio scenario according to
(Appendix 4)
The speech input performance for evaluating the speech utterance ability is a speech recognition rate and the number of proper speech recognitions, and the speech input performance for evaluating the speech hearing ability is a speech reading speed and the number of reconfirmations, The voice scenario setting program according to
(Appendix 5)
A voice scenario setting device for automatically setting a voice scenario,
A voice scenario corresponding to the user's proficiency level is selected by acquiring the user's voice input record, selecting the proficiency level corresponding to the user's voice input record based on a table associating the voice input record and the proficiency level. A voice scenario setting device having scenario automatic setting processing means for automatically setting a voice.
本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。なお、特許請求の範囲に記載したシナリオ自動設定処理手段は習熟レベル選択処理部105に相当する。
The present invention is not limited to the specifically disclosed embodiments, and various modifications and changes can be made without departing from the scope of the claims. The scenario automatic setting processing means described in the claims corresponds to the proficiency level
1 音声シナリオ生成装置
11 入力装置
12 出力装置
13 ドライブ装置
14 補助記憶装置
15 主記憶装置
16 演算処理装置
17 インターフェース装置
18 記録媒体
21 シナリオマスタ
22 グラマーマスタ
23 シナリオ自動生成処理部
24 グラマー自動生成処理部
25 グラマー条件指定受付部
26 音声シナリオ
27 音声グラマー
31〜35 音声指示
36 データ処理
41〜43 発話
100 音声シナリオ設定装置
101 音声入力DB
102 音声入力実績収集処理部
103 音声入力実績ログDB
104 実績評価DB
105 習熟レベル選択処理部
106 習熟レベル変換テーブル
107 音声シナリオ設定テーブル
B バス
DESCRIPTION OF
102 voice input record
104 Performance evaluation DB
105 Proficiency Level
Claims (4)
ユーザの音声入力実績を取得し、前記音声入力実績と習熟レベルとを対応付けるテーブルに基づいて、ユーザの前記音声入力実績に対応する前記習熟レベルを選択し、ユーザの前記習熟レベルに応じた音声シナリオを自動設定するシナリオ自動設定処理手段
として機能させる為の音声シナリオ設定プログラム。 Computer
A voice scenario corresponding to the user's proficiency level is selected by acquiring the user's voice input record, selecting the proficiency level corresponding to the user's voice input record based on a table associating the voice input record and the proficiency level. Voice scenario setting program for functioning as an automatic scenario setting processing means for automatically setting
ユーザの音声入力実績を取得し、前記音声入力実績と習熟レベルとを対応付けるテーブルに基づいて、ユーザの前記音声入力実績に対応する前記習熟レベルを選択し、ユーザの前記習熟レベルに応じた音声シナリオを自動設定するシナリオ自動設定処理手段
を有する音声シナリオ設定装置。 A voice scenario setting device for automatically setting a voice scenario,
A voice scenario corresponding to the user's proficiency level is selected by acquiring the user's voice input record, selecting the proficiency level corresponding to the user's voice input record based on a table associating the voice input record and the proficiency level. A voice scenario setting device having scenario automatic setting processing means for automatically setting a voice.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009263772A JP5331657B2 (en) | 2009-11-19 | 2009-11-19 | Voice scenario setting program and voice scenario setting device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009263772A JP5331657B2 (en) | 2009-11-19 | 2009-11-19 | Voice scenario setting program and voice scenario setting device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011107503A true JP2011107503A (en) | 2011-06-02 |
JP5331657B2 JP5331657B2 (en) | 2013-10-30 |
Family
ID=44231023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009263772A Active JP5331657B2 (en) | 2009-11-19 | 2009-11-19 | Voice scenario setting program and voice scenario setting device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5331657B2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004233676A (en) * | 2003-01-30 | 2004-08-19 | Honda Motor Co Ltd | Interaction controller |
JP2005024869A (en) * | 2003-07-02 | 2005-01-27 | Toshiba Tec Corp | Voice responder |
JP2005050273A (en) * | 2003-07-31 | 2005-02-24 | Denso Corp | In-vehicle apparatus operation supporting system |
JP2005234331A (en) * | 2004-02-20 | 2005-09-02 | Honda Motor Co Ltd | Voice interaction device |
-
2009
- 2009-11-19 JP JP2009263772A patent/JP5331657B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004233676A (en) * | 2003-01-30 | 2004-08-19 | Honda Motor Co Ltd | Interaction controller |
JP2005024869A (en) * | 2003-07-02 | 2005-01-27 | Toshiba Tec Corp | Voice responder |
JP2005050273A (en) * | 2003-07-31 | 2005-02-24 | Denso Corp | In-vehicle apparatus operation supporting system |
JP2005234331A (en) * | 2004-02-20 | 2005-09-02 | Honda Motor Co Ltd | Voice interaction device |
Also Published As
Publication number | Publication date |
---|---|
JP5331657B2 (en) | 2013-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10037758B2 (en) | Device and method for understanding user intent | |
WO2020215554A1 (en) | Speech recognition method, device, and apparatus, and computer-readable storage medium | |
JP5703256B2 (en) | Speech recognition system and method based on word level conversion candidate generation | |
US9940932B2 (en) | System and method for speech-to-text conversion | |
US7742924B2 (en) | System and method for updating information for various dialog modalities in a dialog scenario according to a semantic context | |
CN105336326A (en) | Speech recognition repair using contextual information | |
JP6585112B2 (en) | Voice keyword detection apparatus and voice keyword detection method | |
CN110807093A (en) | Voice processing method and device and terminal equipment | |
CN114783424A (en) | Text corpus screening method, device, equipment and storage medium | |
JP5606951B2 (en) | Speech recognition system and search system using the same | |
JP6391925B2 (en) | Spoken dialogue apparatus, method and program | |
JP5166503B2 (en) | Interactive device | |
JP2010182191A (en) | Business form input device, business form input system, business form input method, and program | |
JP2014134640A (en) | Transcription device and program | |
JP5331657B2 (en) | Voice scenario setting program and voice scenario setting device | |
JP2019211689A (en) | Recognition device, recognition system, terminal device, server device, method and program | |
JP4254753B2 (en) | Speaker recognition method | |
JP2013088488A (en) | Speech search device, speech search method, and program | |
JP6179884B2 (en) | WFST creation device, speech recognition device, speech translation device, WFST creation method, and program | |
JP5461967B2 (en) | Voice scenario generation program and voice scenario generation apparatus | |
KR20210098250A (en) | Electronic device and Method for controlling the electronic device thereof | |
JP3614116B2 (en) | Transcription apparatus, transcription method, transcription program, and recording medium recording the program | |
WO2021205832A1 (en) | Information processing device, information processing system, and information processing method, and program | |
KR102267579B1 (en) | System of cloud-based conversion speech source to text and method performing the same | |
JP2003202890A (en) | Speech recognition device, and method and program thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120816 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130418 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130430 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130701 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130723 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130729 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5331657 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |