JP2007108524A - 音声入力評価装置及び方法並びにプログラム - Google Patents

音声入力評価装置及び方法並びにプログラム Download PDF

Info

Publication number
JP2007108524A
JP2007108524A JP2005300636A JP2005300636A JP2007108524A JP 2007108524 A JP2007108524 A JP 2007108524A JP 2005300636 A JP2005300636 A JP 2005300636A JP 2005300636 A JP2005300636 A JP 2005300636A JP 2007108524 A JP2007108524 A JP 2007108524A
Authority
JP
Japan
Prior art keywords
scene
scenario
voice
unit
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005300636A
Other languages
English (en)
Inventor
Eiji Hirata
英二 平田
Toshiaki Ishii
利明 石井
Hajime Takezawa
元 竹澤
Shinji Konuma
信治 小沼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tokyo Electric Power Company Holdings Inc
Original Assignee
Tokyo Electric Power Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Electric Power Co Inc filed Critical Tokyo Electric Power Co Inc
Priority to JP2005300636A priority Critical patent/JP2007108524A/ja
Publication of JP2007108524A publication Critical patent/JP2007108524A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 新人オペレータのスキル向上を簡易にかつ短時間で行う。
【解決手段】 シナリオ選択部21により任意の受付用件及びシナリオを選択し、選択されたシナリオに含まれているシーンを再生するモードを再生モード選択部22により選択し、選択された再生モードにしたがってシーンを再生し、再生されたシーンにより要求される応答及び端末操作を行い、当該応答及び端末操作を評価する。
【選択図】 図2

Description

本発明は、予測されるシーンごとに応答者の応答を評価する音声入力評価装置及び方法並びにプログラムに関する。
オペレータは、直接電話によって顧客に応対する。このときのオペレータの応対により、会社全体の印象が決定されてしまう。したがって、オペレータの顧客に対する電話応対スキルは、非常に重要である。
また、新人のオペレータを訓練する場合には、実際の電話応対に先だって、業務知識及び応対スキルを身につけるための研修を行う。研修では、例えば、指導者の指導の下において、実際の電話受付の模擬(シミュレーション)を顧客役とオペレータ役に分けて応答訓練を行う。また、研修が終了したオペレータは、実際の電話応対をするときに、応対に馴れるまでの間は、先輩オペレータが補助して個別の指導を行っている。
特開2004−219779号公報
ところで、新人の研修時間を長期間とり、指導者が手厚く指導すれば、電話応対のスキル向上をさせることができるが、その分、時間とコストがかかってしまう。しかしながら、オペレータの研修を短期間で行ってしまうと、電話応対のスキルが低いため、必要な確認事項を欠落してしまったり、言葉使いの未熟さによって顧客に悪印象を与えてしまったりして、誤処理の発生確率が高くなってしまう。
したがって、新人のオペレータに対しては、十分な訓練を積む必要があるが、端末の操作や会話を滑らかに行うことができるように指導するには、指導者の人員を割り当てなければならない。この場合には、指導者の都合によっては新人のオペレータ指導が滞ってしまう。
そこで、本願発明では、上述した問題点を解決するために、指導者を不要とし、短時間で安価にオペレータの電話応対のスキル向上を図ることを目的とする音声入力評価装置及び方法並びにプログラムを提供する。
本発明に係る音声入力評価装置は、上述の課題を解決するために、所定の対話により構成されるシーンが一以上含まれて構成されるシナリオが1以上格納されているシナリオ格納手段と、シナリオ格納手段に格納されているシナリオの中から任意のシナリオを選択するシナリオ選択手段と、再生モードを選択する再生モード選択手段と、再生モード選択手段により選択された再生モードにしたがって、シナリオ選択手段により選択された任意のシナリオに含まれているシーンを再生するシーン再生手段と、シーン再生手段により再生された画像を表示する画像表示手段と、シーン再生手段により再生された音声を出力する音声出力手段と、画像表示手段に表示されている画像及び音声出力手段に出力されている音声に基づいて、要求される応答を音声により入力する音声入力手段と、音声入力手段により入力された音声を認識する音声認識手段と、音声認識手段により認識された結果に基づいて、予め定められた応答テキストを参照し、シーン再生手段により再生されるシーンごとに音声入力手段により入力された応答を評価する評価手段とを備える。
また、本発明に係る音声入力評価方法は、上述の課題を解決するために、所定の対話により構成されるシーンが一以上含まれて構成されるシナリオが1以上格納されているシナリオ格納部から、任意のシナリオを選択するシナリオ選択工程と、シナリオ選択工程により選択された任意のシナリオに含まれているシーンを再生するシーン再生工程と、再生モードを選択する再生モード選択工程と、再生モード選択工程により選択された再生モードにしたがって、シーン再生工程により再生された画像と音声に基づいて、要求される応答をマイクロホンにより入力する音声入力工程と、音声入力工程により入力された音声を認識する音声認識工程と、音声認識工程により認識された結果に基づいて、予め定められた応答テキストを参照し、シーン再生工程により再生されるシーンごとに音声入力工程により入力された応答を評価する評価工程とを備える。
また、本発明に係るプログラムは、上述の課題を解決するために、所定の対話により構成されるシーンが一以上含まれて構成されるシナリオが1以上格納されているシナリオ格納部から、任意のシナリオを選択するシナリオ選択工程と、再生モードを選択する再生モード選択工程と、再生モード選択工程により選択された再生モードにしたがって、シナリオ選択工程により選択された任意のシナリオに含まれているシーンを再生するシーン再生工程と、シーン再生工程により再生された画像が所定の対話とともに表示部に表示され、シーン再生工程により再生された音声が音声出力部に出力される練習工程と、シーン再生工程により再生された画像が表示部に表示され、シーン再生工程により再生された音声が音声出力部に出力され、当該画像及び音声に基づいて、要求される応答が音声により入力され、入力された音声を認識し、認識された結果に基づいて、予め定められた応答テキストを参照し、シーン再生工程により再生されるシーンごとに、入力された応答を評価する訓練工程とをコンピュータに実行させるためのものである。
本発明によれば、利用者自身の好きな時間に個人練習をすることができ、短時間でスキルの向上を図ることができる。また、本発明によれば、利用者は、自身の習熟度や弱点を発見し、効果的に学習をすることができる。
本発明では、利用者(オペレータ)にカスタマーセンター(コールセンター)における電話受付の場面(通話の開始から後処理を終えるまで)を模擬的に提供し、実際に体験してもらうことにより、電話受付に必要となる技術や知識の習得を実現するためのものである。また、本発明により訓練可能な主なものとしては、スクリプト(電話応答のための台本)の習得及び暗記、スクリプトに基づく発声練習、電話受付に付随する端末操作の習得等である。また、本発明が想定している主な利用者は、初めてカスタマーセンターで電話受付を経験する電話受付オペレータ、経験したことのない受付用件の習得を新たに目指す電話受付オペレータ、電話受付手順の再確認及びレベル向上を目指す電話受付オペレータである。
また、コールセンターでの利用を想定して構成された本発明によれば、コールセンター以外でも定型的な接客(営業)を行う利用者に対して利用することが可能である。このような利用者としては、例えば、ファーストフード等での接客及びレジ操作の訓練者や、営業用端末を用いた店頭や訪問販売における営業業務(セールス)の訓練者である。
ここで、以下に、本発明の実施の形態としての音声入力評価装置及び方法並びにプログラムについて詳細に説明する。なお、以下の実施の形態では、オペレータにより入力された音声及び操作の評価を図る装置を一実施例として説明する。
本発明に係るオペレータにより入力された音声及び操作の評価は、例えば、図1に示すように、所定の演算を行うCPU10と、画像を表示する画像表示部11と、ユーザの操作に応じて操作信号を生成するポインティングデバイス12と、音声が出力される音声出力部13と、ユーザの発した音声を入力する音声入力部14と、所定のアプリケーション・プログラムが格納されている記憶部15と、CPU10が各種演算を行う際に利用するワーキングメモリ16を備えるPC(パーソナルコンピュータ)1により行われる。
画像表示部11は、画像を表示するCRT等のディスプレイである。
ポインティングデバイス12は、画像表示部11に表示されているGUI化された画像をユーザが操作し、当該ユーザの操作に応じて所定の操作信号を生成し、生成した操作信号をCPU10に供給する。
CPU10は、ポインティングデバイス12から供給された操作信号に応じて、記憶部14からオペレータにより入力された音声及び操作の評価を行うためのアプリケーション・プログラムAを読み出し、読み出したプログラムAをワーキングメモリ16に展開し、GUI(graphical user interface)を画像表示部11に表示させる。
音声出力部13は、音声を出力するスピーカである。
音声入力部14は、音声を入力するマイクロホンである。
また、音声出力部13と音声入力部14は、ヘッドセットとして一体的に構成されていても良い。
ここで、PC1により、本発明に係るオペレータにより入力された音声及び操作の評価を行うための構成について以下に説明する。なお、以下では、オペレータにより入力された音声及び操作の評価を行う装置を音声入力評価装置と呼ぶ。
音声入力評価装置2は、図2に示すように、所定の対話により構成されるシーンが一以上含まれて構成されるシナリオが1以上格納されているシナリオ格納部20と、シナリオ格納部20に格納されているシナリオの中から任意のシナリオを選択するシナリオ選択部21と、再生モードを選択する再生モード選択部22と、再生モード選択部22により選択された再生モードにしたがって、シナリオ選択部21により選択された任意のシナリオに含まれているシーンを再生し、再生した画像を画像表示部11に表示させ、再生した音声を音声出力部13に出力するシーン再生部23と、画像表示部11に表示されている画像及び音声出力部13に出力されている音声に応じて、要求される応答を音声により音声入力部14に入力し、音声入力部14により入力された音声をシーンに対応付けて記憶する音声記憶部24と、音声入力部14により入力された音声を認識する音声認識部25と、音声入力部14により入力された音声の分析処理を行う分析部26と、ポインティングデバイス12により操作された様子を記憶する画像操作記憶部27と、分析部26により分析された結果と、ポインティングデバイス12により操作された結果と、音声認識部25により認識された結果に基づいて、シーン再生部23により再生されるシーンごとに音声入力部14により入力された応答を評価する評価部28とを備える。
シナリオ格納部20に格納されているシナリオは、複数個あり、カテゴリー(受付用件)ごとに分類されている。受付用件には、例えば、「契約変更」に関する用件や、「電気の供給停止」に関する用件がある。また、例えば、「契約変更」に関する用件には、「電気方式が単相3線の顧客が、電流制限値を40Aから50Aに契約変更を依頼するシナリオ」や、「電気方式が単相2線の顧客が、電流制限値を30Aから40Aに契約変更を依頼するシナリオ」が含まれている。
また、これらの各シナリオは、所定の対話と、当該対話に対応する画像操作イメージにより構成されるシーンが一以上含まれている。ここで、シーンについて図3を用いて説明する。なお、以下では、例えば、用件として、「契約変更」が選択され、シナリオとして、「電気方式が単相2線の顧客が、電流制限値を30Aから40Aに契約変更を依頼するシナリオ」が選択されたものとする。
シーン1(開始シーン)は、オペレータが電話を取り、第一声を発するシーンである。
シーン2は、顧客が用件(電流制限値を変更したい旨の用件)を伝達するシーンである。
シーン3は、オペレータがシーン2により伝達された用件の確認を行うシーンである。
シーン4は、顧客の本人確認を行うシーンである。
シーン5は、顧客がシーン4による要求に応じて本人情報の伝達を行うシーンである。なお、シーン5以降のシーンは、割愛する。
シーンn(最終シーン)は、オペレータが電話を切る際に、最後の一声を発するシーンである。
また、シーン2や、シーン4のように顧客が発言するシーンでは、後述する音声出力部13により音声が出力される。
また、各シーンには対応する画像操作イメージが付随しており、後述する画像表示部11にGUI(graphical user interface)として表示される。
シナリオ選択部21は、シナリオ格納部20から受付用件を選択し、その選択した受付用件に含まれているシナリオの中から任意のシナリオを選択する手動選択モードAと、受付用件及びシナリオをランダムに選択するランダム選択モードBと、すべての受付用件及びシナリオの中から、過去にオペレータが行った回数の少ないもの(最小実施)から受付用件及びシナリオを選択する最小実施選択モードCとを有しており、ユーザにより、いずれかのモードが選択される。
また、シナリオ選択部21は、上述以外のモードを有していても良く、例えば、オペレータの苦手な受付用件及びシナリオを選択するモードや、重要項目として指定されている受付用件及びシナリオを優先的に選択するモード等である。
再生モード選択部22は、練習モードXか本番モードYかを選択する。練習モードXでは、シーン再生部23により再生される画像が所定の対話(テキスト)とともに画像表示部11に表示され、また、シーン再生部23により再生される音声が音声出力部13から出力される。また、練習モードXでは、要点を押さえたアドバイスを行うアシスト機能が付加されている。練習モードXは、主に初心者のオペレータを対象としており、シーンごとの発生すべき対話(スクリプト)及びスクリプトに対応する端末操作を画像表示部11に表示し、スクリプト及び操作をオペレータに学習させるモードである。
本番モードYでは、シーン再生部23により再生される画像が画像表示部11に表示され、また、シーン再生部23により再生される音声が音声出力部13から出力される。本番モードYは、主にスクリプトの学習が終了したオペレータを対象とし、本番の応答受付に近い状況で模擬的に一連の電話応答及び端末操作を行わせ、当該応答及び操作を評価する、いわゆるテストモードである。
シーン再生部23は、再生モード選択部22により選択されたモードに応じて、シナリオ選択部21によって選択されたシナリオに含まれているシーンを再生する。シーン再生部23は、シーンが複数ある場合には、所定のタイミングで各シーンを再生する。なお、シーン再生部23の詳細な動作については後述する。
音声記憶部24は、音声入力部14により入力されたオペレータが発生した音声を記憶する。音声記憶部24は、再生モード選択部22で本番モードYが選択された場合に、オペレータが音声入力部14に入力した音声を記憶しておく。オペレータは、本番モードYが終了した後に、自身が入力した音声を再生することにより、学習に役立てることができる。
音声認識部25は、音声入力部14により入力されたオペレータが発生した音声を文字に変換する。
分析部26は、音声入力部14により入力されたオペレータが発生した発話された音声の音圧、ピッチ等の情報を分析する。
画像操作記憶部27は、再生モード選択部22で本番モードYが選択された場合に、オペレータがポインティングデバイス12により操作した様子を記憶する。オペレータは、本番モードYが終了した後に、自身が操作した様子を再生することにより、学習に役立てることができる。また、音声入力評価装置2では、オペレータの要求に応じて、音声記憶部24により記憶されている音声と、画像操作記憶部27に記憶されている操作とをシーンとともに再生しても良い。
評価部28は、音声認識部25により認識された結果に基づいて、予め定められている応答テキストを参照し、オペレータが定められている応答を行ったかどうかについて評価する。また、評価部28は、ポインティングデバイス12により操作された結果に基づいて、予め定められている操作手順を参照し、オペレータが定められている操作を行ったかどうかについて評価する。また、評価部28は、分析部26により分析された発話の明確さに基づいてオペレータの発話を評価する。
評価部28は、上述した各評価に基づいて総合評価を行い、例えば、シーンごとに点数化する。
また、音声入力評価装置2は、擬似的に顧客の各情報(氏名、住所、電話番号等)を格納する顧客情報格納部29を備える。シーン再生部23は、シナリオ選択部21によって選択されたシナリオに含まれているシーンに基づいて、顧客情報格納部29から任意の顧客情報を読み出し、読み出した顧客情報を再生される画像に反映させる。このような構成にすることにより、臨場感のある応答状況を再生することができる。
また、音声入力評価装置2は、オペレータごとに訓練履歴を保存する訓練履歴格納部30を備える。例えば、音声入力評価装置2を利用する際に、オペレータが自己に固有のIDを入力して、練習モードXや本番モードYを実行する。訓練履歴格納部2は、オペレータが行ったシナリオの履歴や、本番モードYにおける評価部28による評価結果を記憶保持する。このような構成にすることにより、オペレータは、訓練履歴格納部30に格納されている自己の訓練履歴を参照し、自己の習熟度を知ることができ、今後の訓練の目標を定めることが可能となる。
ここで、音声入力評価装置2の動作について図4に示すフローチャートを参照して説明する。なお、以下では、オペレータの操作により、音声入力評価装置2が起動され、画像表示部11にオペレータにより入力された音声及び操作の評価を行うためのアプリケーション・プログラムAに起因するGUIが表示されているものとする。
ステップS1において、シナリオ選択部21は、受付用件及びシナリオを選択する。ここで、シナリオ選択部21の動作について図5に示すフローチャートを参照して説明する。
シナリオ選択部21は、オペレータによるポインティングデバイス12の操作により、手動選択モードAか、ランダム選択モードBか、最小実施選択モードCが選択される(ステップS20)。ステップS20の工程により、手動選択モードAが選択された場合には、シナリオ選択部21は、受付用件及びシナリオを一覧表示する(ステップS21)。シナリオ選択部21は、ステップS21の工程により示されている一覧の中からオペレータにより選択されたものを受付用件及びシナリオとして決定する(ステップS24)。
また、ステップS20の工程により、ランダム選択モードBが選択された場合には、シナリオ選択部21は、シナリオ格納部20からランダムに一の受付用件及びシナリオを選択する(ステップS22)。この際、該当者の訓練履歴を参照することにより、シナリオの評価点数に基づいて点数の低いものほど選ばれる確率を上げた上でランダムに選択することも可能である。シナリオ選択部21は、ステップS22の工程により選択されたものを受付用件及びシナリオとして決定する(ステップS24)。
また、ステップS20の工程により、最小実施選択モードCが選択された場合には、シナリオ選択部21は、訓練履歴格納部30を参照し、オペレータの実行回数の少ないものから順に受付用件及びシナリオを一覧表示する(ステップS23)。シナリオ選択部21は、ステップS23の工程により示されている一覧の中からオペレータにより選択されたものを受付用件及びシナリオとして決定する(ステップS24)。
ステップS2において、再生モード選択部22は、再生モードを選択する。再生モード選択部22は、オペレータによるポインティングデバイス12の操作により、練習モードX又は本番モードYを選択する。
ステップS3において、シーン再生部23は、ステップS2の工程により練習モードXが選択された場合には、ステップS1の工程により選択されたシナリオを練習モードXにしたがって再生する。
ステップS4において、シーン再生部23は、ステップS2の工程により本番モードYが選択された場合には、ステップS1の工程により選択されたシナリオを本番モードYにしたがって再生する。
ここで、シーン再生部23によりシーン1(開始シーン)からシーンn(最終シーン)まで再生する際の動作について図6に示すフローチャートを参照して説明する。
シーン再生部23は、ステップS1の工程により選択されたシナリオを読み込み(ステップS30)、シーンに応じて顧客が発声するシーンか、オペレータが発声するシーンかを判別する(ステップS31)。シーン再生部23は、顧客が発声するシーンであると判別した場合には、シナリオ格納部20からシーンに対応する音声を読み出し、読み出した音声を音声出力部13から出力する(ステップS32)。なお、シーン再生部23は、シーンに対応した音声がシナリオ格納部20にない場合には、シーンに対応した音声を生成し、生成した音声を音声出力部13から出力するような構成であっても良い。
シーン再生部23は、顧客の音声を出力した後は、シーンを次のシーンに切り替え、ステップS31の工程に戻る。
シーン再生部23は、オペレータが発声するシーンであると判別した場合には、オペレータにより発声された音声が音声入力部14に入力され、音声入力部14に入力された音声を音声認識部25で認識処理を開始し、また、音声の録音を開始する(ステップS33)。
シーン再生部23は、一のシーンから続く次のシーンへ切り替えるために、ステップS33の工程により認識された音声に基づき、所定のキーワードとの比較を行い、また、無音部分を検知する(ステップS34)。ここで、ステップS34の工程について図7に示すフローチャートを参照して詳述する。
シーン再生部23は、音声認識部25により認識された結果に基づき、所定のキーワードが含まれているかどうかを判断する(ステップS40)。シーン再生部23は、所定のキーワードが含まれていた場合には、「true」と判断し、所定のキーワードが含まれていない場合には、「false」と判断する。
シーン再生部23は、ステップS40の工程により「false」と判断した場合には、現在のシーンに切り替わってからの経過時間が、予め定められている最大所要時間に達しているかどうかを判断する(ステップS41)。シーン再生部23は、経過時間>最大所要時間ならば「true」と判断し、経過時間>最大所要時間でないならば「false」と判断する。
シーン再生部23は、ステップS41の工程により「false」と判断した場合には、無音(オペレータが何も発声しない)時間が、予め定められている最大無音時間に達しているかどうかを判断する(ステップS42)。シーン再生部23は、無音時間>最大無音時間ならば「true」と判断し、無音時間>最大無音時間でないならば「false」と判断する。
なお、上述は、音声認識結果通知イベントについての処理に関する説明であるが、一定の時間、音声認識結果通知イベントが発生しない場合には、タイマーイベントにより強制的に、音声認識結果通知イベントによる発生がなされたものとしてステップS40に移行し、若しくは、直接的にステップS40に移行する。
シーン再生部23は、ステップS40の工程、ステップS41の工程又はステップS42の工程において、「true」と判断された場合には、音声の認識処理及び録音を停止し(ステップS35)、シーンを次のシーンへ切り替え、ステップS31の工程に戻る。
ステップS31の工程において、シーン再生部23は、切り替えるシーンがないとき、つまり、最終シーンの再生が終わったと判断した場合には、シーンの再生処理を終了する。
ステップS5において、評価部28は、オペレータにより入力された音声からスクリプトの実施率調査(オペレータが予め定められているスクリプトに沿って応答できているかどうかの調査)と、端末操作の調査を行う。
ステップS6において、分析部26は、音声の分析処理を行う。
ステップS7において、評価部28は、ステップS5の工程による調査結果及び、ステップS6の工程による音声の分析処理の結果に基づいて、シーンごとに評価を行う。評価部28は、分析部26の結果から、オペレータの発声の明瞭度、発話の速度、焦り度合い、威圧感、抑揚の適切さ等の評価を行う。また、評価部28は、シーンごとに重み付けを行い、重要なシーンにおいては厳しく評価したり、あまり重要でないシーンにおいては甘く評価したりしても良い。また、評価部28は、例えば、シーン3〜シーン5については順不同なものとし、シーン3〜シーン5を総合してオペレータの応答及び端末操作を評価するような構成であっても良い。
ステップS8において、評価部28は、画像表示部11に評価(採点)結果を表示する。評価部28は、結果の表示形態として、例えば、シーンごとに点数化して表示する。また、評価部28は、評価結果を訓練履歴格納部30に格納する。
また、音声入力評価装置2は、オペレータの操作により、訓練実施状況を画像表示部11に表示させるような構成であっても良いし、訓練履歴格納部30にアクセスし、過去の採点履歴を画像表示部11に一覧表示させるような構成であっても良い。
このようにして本発明に係る音声入力評価装置2は、シナリオ選択部21により任意の受付用件及びシナリオを選択し、選択されたシナリオに含まれているシーンを再生するモードを再生モード選択部22により選択し、選択された再生モードにしたがってシーンを再生し、再生されたシーンにより要求される応答及び端末操作を行い、当該応答及び端末操作を評価する。したがって、本発明に係る音声入力評価装置2を利用すれば、オペレータは、自身の好きな時間に個人練習をすることができ、短時間でスキルの向上を図ることができる。また、本発明に係る音声入力評価装置2を利用すれば、オペレータは、自身の習熟度や弱点を発見し、効果的に学習をすることができる。また、本発明によれば、オペレータのスキル向上に指導者が不要となるので、人員の削減を図ることができる。
また、本発明では、上述で説明した音声入力評価装置2による一連の処理は、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。また、当該プログラムは、CD−ROMのようなリムーバブルメディアに記録されてユーザに配布されても良いし、ネットワークを介してユーザのコンピュータにダウンロードされることにより配布されても良い。
なお、本発明は、図面を参照して説明した上述の実施例に限定されるものではなく、添付の請求の範囲及びその主旨を逸脱することなく、様々な変更、置換又はその同等のものを行うことが可能である。
本発明に係るオペレータにより入力された音声及び操作の評価を行う装置の構成を示すブロック図である。 本発明に係る音声入力評価装置の機能を示すブロック図である。 本発明に係るシナリオに含まれているシーンの構成を示す図である。 本発明に係る音声入力評価装置の動作についての説明に供するフローチャートである。 シナリオ選択部の動作についての説明に供するフローチャートである。 シーン再生部の動作についての説明に供するフローチャートである。 キーワードの比較及び無音部分の検知についての説明に供するフローチャートである。
符号の説明
1 PC(パーソナルコンピュータ)、2 音声入力評価装置、10 CPU、11 画像表示部、12 ポインティングデバイス、13 音声出力部、14 音声入力部、15 記憶部、16 ワーキングメモリ、20 シナリオ格納部、21 シナリオ選択部、22 再生モード選択部、23 シーン再生部、24 音声記憶部、25 音声認識部、26 分析部、27 画像操作記憶部、28 評価部、29 顧客情報格納部、30 訓練履歴格納部

Claims (7)

  1. 所定の対話により構成されるシーンが一以上含まれて構成されるシナリオが1以上格納されているシナリオ格納手段と、
    上記シナリオ格納手段に格納されているシナリオの中から任意のシナリオを選択するシナリオ選択手段と、
    再生モードを選択する再生モード選択手段と、
    上記再生モード選択手段により選択された再生モードにしたがって、上記シナリオ選択手段により選択された任意のシナリオに含まれているシーンを再生するシーン再生手段と、
    上記シーン再生手段により再生された画像を表示する画像表示手段と、
    上記シーン再生手段により再生された音声を出力する音声出力手段と、
    上記画像表示手段に表示されている画像及び上記音声出力手段に出力されている音声に基づいて、要求される応答を音声により入力する音声入力手段と、
    上記音声入力手段により入力された音声を認識する音声認識手段と、
    上記音声認識手段により認識された結果に基づいて、予め定められた応答テキストを参照し、上記シーン再生手段により再生されるシーンごとに上記音声入力手段により入力された応答を評価する評価手段とを備えることを特徴とする音声入力評価装置。
  2. 上記音声入力手段により入力された音声を記憶する記憶手段を備えることを特徴とする請求項1記載の音声入力評価装置。
  3. 上記音声入力手段により入力された音声の分析処理を行う分析手段を備え、
    上記評価手段は、上記分析手段により行われた音声の分析処理の結果を評価することを特徴とする請求項1記載の音声入力評価装置。
  4. 上記表示手段に表示されている画像を操作する画像操作手段を備え、
    上記シナリオ格納手段は、所定の対話と、当該対話に対応する画像操作により構成されるシーンが一以上含まれて構成されるシナリオが複数個格納されており、
    上記画像操作手段は、上記シーン再生手段により再生されている画像において要求される操作を行い、
    上記評価手段は、上記画像操作手段により行われた操作の結果を加味して、上記音声認識手段により認識された結果を評価することを特徴とする請求項1記載の音声入力評価装置。
  5. 上記画像操作手段により操作された様子を記憶する画像操作記憶手段を備えることを特徴とする請求項4記載の音声入力評価装置。
  6. 所定の対話により構成されるシーンが一以上含まれて構成されるシナリオが1以上格納されているシナリオ格納部から、任意のシナリオを選択するシナリオ選択工程と、
    上記シナリオ選択工程により選択された任意のシナリオに含まれているシーンを再生するシーン再生工程と、
    再生モードを選択する再生モード選択工程と、
    上記再生モード選択工程により選択された再生モードにしたがって、上記シーン再生工程により再生された画像と音声に基づいて、要求される応答をマイクロホンにより入力する音声入力工程と、
    上記音声入力工程により入力された音声を認識する音声認識工程と、
    上記音声認識工程により認識された結果に基づいて、予め定められた応答テキストを参照し、上記シーン再生工程により再生されるシーンごとに上記音声入力工程により入力された応答を評価する評価工程とを備えることを特徴とする音声入力評価方法。
  7. 所定の対話により構成されるシーンが一以上含まれて構成されるシナリオが1以上格納されているシナリオ格納部から、任意のシナリオを選択するシナリオ選択工程と、
    再生モードを選択する再生モード選択工程と、
    上記再生モード選択工程により選択された再生モードにしたがって、上記シナリオ選択工程により選択された任意のシナリオに含まれているシーンを再生するシーン再生工程と、
    上記シーン再生工程により再生された画像が所定の対話とともに表示部に表示され、上記シーン再生工程により再生された音声が音声出力部に出力される練習工程と、
    上記シーン再生工程により再生された画像が表示部に表示され、上記シーン再生工程により再生された音声が音声出力部に出力され、当該画像及び音声に基づいて、要求される応答が音声により入力され、上記入力された音声を認識し、上記認識された結果に基づいて、予め定められた応答テキストを参照し、上記シーン再生工程により再生されるシーンごとに、上記入力された応答を評価する訓練工程とをコンピュータに実行させるためのプログラム。
JP2005300636A 2005-10-14 2005-10-14 音声入力評価装置及び方法並びにプログラム Pending JP2007108524A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005300636A JP2007108524A (ja) 2005-10-14 2005-10-14 音声入力評価装置及び方法並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005300636A JP2007108524A (ja) 2005-10-14 2005-10-14 音声入力評価装置及び方法並びにプログラム

Publications (1)

Publication Number Publication Date
JP2007108524A true JP2007108524A (ja) 2007-04-26

Family

ID=38034416

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005300636A Pending JP2007108524A (ja) 2005-10-14 2005-10-14 音声入力評価装置及び方法並びにプログラム

Country Status (1)

Country Link
JP (1) JP2007108524A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012123663A (ja) * 2010-12-09 2012-06-28 Toshiba Tec Corp トレーニング装置、トレーニングシステムおよびそのプログラム
JP2014032702A (ja) * 2013-11-07 2014-02-20 Toshiba Tec Corp トレーニング装置、トレーニングシステムおよびそのプログラム
JP5485436B1 (ja) * 2013-03-08 2014-05-07 メディアアクティブ株式会社 仮想電話着信装置、および仮想電話着信プログラム
JP2017049710A (ja) * 2015-08-31 2017-03-09 キヤノン株式会社 情報処理装置、情報処理システム、情報処理方法、及びプログラム
JP2019211743A (ja) * 2018-06-08 2019-12-12 博樹 市川 台詞練習システム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08204834A (ja) * 1995-01-27 1996-08-09 Kokusai Denshin Denwa Co Ltd <Kdd> 教育訓練装置
JP2002341735A (ja) * 2001-05-16 2002-11-29 Alice Factory:Kk ブロードバンド・ディジタル・ラーニング・システム
JP2004012752A (ja) * 2002-06-06 2004-01-15 Fujitsu Ltd 端末操作教育装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08204834A (ja) * 1995-01-27 1996-08-09 Kokusai Denshin Denwa Co Ltd <Kdd> 教育訓練装置
JP2002341735A (ja) * 2001-05-16 2002-11-29 Alice Factory:Kk ブロードバンド・ディジタル・ラーニング・システム
JP2004012752A (ja) * 2002-06-06 2004-01-15 Fujitsu Ltd 端末操作教育装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012123663A (ja) * 2010-12-09 2012-06-28 Toshiba Tec Corp トレーニング装置、トレーニングシステムおよびそのプログラム
JP5485436B1 (ja) * 2013-03-08 2014-05-07 メディアアクティブ株式会社 仮想電話着信装置、および仮想電話着信プログラム
JP2014032702A (ja) * 2013-11-07 2014-02-20 Toshiba Tec Corp トレーニング装置、トレーニングシステムおよびそのプログラム
JP2017049710A (ja) * 2015-08-31 2017-03-09 キヤノン株式会社 情報処理装置、情報処理システム、情報処理方法、及びプログラム
JP2019211743A (ja) * 2018-06-08 2019-12-12 博樹 市川 台詞練習システム
JP7340784B2 (ja) 2018-06-08 2023-09-08 博樹 市川 台詞練習システム

Similar Documents

Publication Publication Date Title
US11030992B2 (en) System for communication skills training using juxtaposition of recorded takes
US11183187B2 (en) Dialog method, dialog system, dialog apparatus and program that gives impression that dialog system understands content of dialog
JP6705956B1 (ja) 教育支援システム、方法及びプログラム
JP2004246184A (ja) 視覚化された発音の提案を備えた言語学習システム及び方法
WO2005099414A2 (en) Comprehensive spoken language learning system
WO2010133072A1 (zh) 发音评测装置及其方法
WO2012171022A1 (en) Method and system for creating controlled variations in dialogues
Callaway et al. Experiments with mobile drama in an instrumented museum for inducing conversation in small groups
JP2007108524A (ja) 音声入力評価装置及び方法並びにプログラム
CN111459453A (zh) 一种辅助阅读的方法、装置、存储介质及电子设备
JP6166831B1 (ja) 単語学習支援装置、単語学習支援プログラム、単語学習支援方法
KR101949997B1 (ko) 더빙/증강현실을 이용한 참여형 대화훈련 학습 방법
JP2017021245A (ja) 語学学習支援装置、語学学習支援方法および語学学習支援プログラム
KR20190070682A (ko) 강의 콘텐츠 구성 및 제공을 위한 시스템 및 방법
JP2019070717A (ja) 電子機器、その制御方法、および、プログラム
US20080293021A1 (en) Foreign Language Voice Evaluating Method and System
JP6155102B2 (ja) 学習支援装置
KR101944628B1 (ko) 화상 학습 기반의 일대일 외국어 학습 시스템
KR100593590B1 (ko) 콘텐츠 자동 생성방법 및 이를 이용한 어학학습방법
KR20170014810A (ko) 음성 인식을 이용한 영어 학습방법
WO2017200075A1 (ja) 対話方法、対話システム、対話シナリオ生成方法、対話シナリオ生成装置、及びプログラム
TWI470589B (zh) 雲端數位語音教學錄音系統
JP7338737B2 (ja) 電子機器、その制御方法、および、プログラム
JP7359349B1 (ja) 評価支援システム、情報処理装置の制御方法、及び情報処理装置の制御プログラム
JP2018072810A (ja) 学習支援装置、学習支援方法、及び、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081002

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101221

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110419