以下、本発明に係る接客態度評価システム及び接客態度評価方法を具体的に開示した実施の形態(以下、「本実施の形態」という)について、図面を参照して説明する。本実施の形態の接客態度評価システムは、接客業務が行われる室内(例えば、公共機関、小売店、卸売店、百貨店、コンビニエンスストア、スーパーマーケット、飲食店、金融機関)に設置され、従業員(これ以降、「従業員」には公共機関等の職員も含まれるものとして説明する)の状況および発話内容をモニタリングし、顧客に対して各種の接客イベント(例えば来退室挨拶等)を行う従業員の接客態度を客観的に評価する。以下の説明において、従業員の顧客に対する接客態度を客観的に評価した結果の定量的な指標(値)を「接客発話評価値」という。
なお、本発明は、接客態度評価システムを構成する各装置(例えば後述する接客評価装置)、当該接客態度評価システムを構成する各装置が行う動作を含む方法、又は、当該方法をコンピュータである接客評価装置に実行させるためのプログラムとして表現することも可能である。
(接客態度評価システムの概略)
図1は、本実施の形態の接客態度評価システム100(図2参照)が設置された室内のイメージの一例を示す図である。図1は、接客業務が行われる室内において、窓口業務を行う従業員が顧客(これ以降、「顧客」には公共機関の来訪者も含まれるものとして説明する)に応対している状況を示している。室内には、窓口業務以外の業務を行う従業員も在籍している。これらの従業員にも、顧客に対して「いらっしゃいませ」等の発話を行うことが求められる。
室内には、各従業員の音声を収音するためのマイクアレイ装置AM1が少なくとも1個設置され、各従業員を撮像するカメラ装置C1が少なくとも1個設置され、更に、顧客の入退室を検出するためのセンサ装置S1が室内の入り口付近に設置されている。
接客態度評価システム100は、後述する種々の接客イベント毎に接客イベントの有無を検出するための接客イベント判定条件を含む接客イベントデータを基に、従業員による接客イベントを検出する。
接客態度評価システム100は、接客イベントを検出した場合には、例えばマイクアレイ装置AM1、カメラ装置C1、センサ装置S1又はこれらの組み合わせにより得られたデータを基に、所定の発話想定キーワードに対応する接客発話評価値(言い換えると、発話想定キーワードを発話した従業員に対する接客発話評価値)を算定する。また、接客態度評価システム100は、算定された接客発話評価値を、従業員の識別情報と従業員の位置及び接客時刻により特定される従業員の音声データに対応付けて記憶する。
(接客態度評価システムの構成例)
次に、本実施の形態の接客態度評価システムのシステム構成例について、図2を参照して説明する。図2は、本実施の形態の接客態度評価システム100のシステム構成例を示すブロック図である。
図2に示す接客態度評価システム100は、少なくとも1個のマイクアレイ装置AM1,…,AML(Lは1以上の整数)と、少なくとも1個のカメラ装置C1,…,CM(Mは1以上の整数)と、少なくとも1個のセンサ装置S1,…,SN(Nは1以上の整数)と、管理サーバ2と、接客評価装置3と、レコーダ装置4と、を含む。マイクアレイ装置AM1,…,AML、カメラ装置C1,…,CM、センサ装置S1,…,SN、管理サーバ2、接客評価装置3およびレコーダ装置4は、ネットワークNWを介して相互に接続されている。ネットワークNWは、有線ネットワーク(例えばイントラネット、インターネット)でもよく、無線ネットワーク(例えば無線LAN(Local Area Network))でもよい。
収音部の一例としてのマイクアレイ装置AM1,…,AMLは、例えば天井面に固定して設置され、収音領域の従業員の音声を収音する。マイクアレイ装置AM1,…,AMLは、具体的には収音素子の一例としてのマイクロホンを複数含み、複数のマイクロホンを用いて、マイクアレイ装置AM1,…,AMLの設置位置を中心として360°の方向(全方位)からの音声(例えば従業員の音声)を収音する。マイクアレイ装置AM1,…,AMLは、各々のマイクロホンにより収音された音声データを含む音声パケット(不図示)を、ネットワークNWを介して、レコーダ装置4に送信する。
撮像部の一例としてのカメラ装置C1,…、CMは、例えば室内の天井面に固定して設置され、監視カメラ又は防犯カメラとしての機能を有し、ネットワークNWに接続された接客評価装置3からの遠隔操作によって、ズーム機能(例えばズームイン処理、ズームアウト処理)や光軸移動機能(パン、チルト)を用いて、それぞれのカメラ装置C1,…,CMの画角内の映像を撮像する。カメラ装置C1,…、CMは、各々、撮像した映像データを含む映像パケット(不図示)を、ネットワークNWを介して、レコーダ装置4に送信する。
各カメラ装置C1,…,CMの設置位置や方向は、例えば接客評価装置3のメモリ32に予め登録されている。パン、チルト、ズームに関する制御情報は、接客評価装置3に随時送信され、映像を構成する各画像位置と指向方向との位置関係は常に関連付けが行われている。また、各カメラ装置C1,…,CMは、例えば全方位カメラである場合には、収音領域の全方位の映像を示す映像データ(即ち、全方位映像データ)、又は全方位映像データに所定の歪み補正処理を施してパノラマ変換して生成した平面映像データを、ネットワークNWを介して接客評価装置3に送信する。なお、それぞれのカメラ装置C1,…,CMの画角及び光軸は固定でもよい。
顧客検出部の一例としてのセンサ装置S1,…,SNは、顧客の来室又は退室を検出し、検出結果に関する情報をセンサデータとしてレコーダ装置4に送信する。なお、センサ装置S1,…,SNは、接客態度評価システム100が検出可能な接客イベントの種類や数に応じて、複数設けられてもよい。
管理サーバ2は、各従業員の接客発話評価値の算定または閲覧の際に必要となる各種データを管理DB(Database)2aとして格納(保存)している。また、管理サーバ2は、接客評価装置3において算定された接客イベント毎の各従業員の接客発話評価値を管理DB2aに格納している。
管理DB2aは、接客イベント情報DBと、接客発話評価DBと、接客状況DBと、を有する。各々のDBの内容の詳細については後述する。なお、管理サーバ2は、接客態度評価システム100が設置される室内自体に配置されなくてもよく、例えばネットワークNWを介して接続されるオンラインストレージ(例えばクラウドサービスにおいて使用されるストレージ)でもよい。
接客評価装置3は、接客イベントを検出し、検出した接客イベント中の従業員の音声データを基に、接客イベント中の各従業員の所定の発話想定キーワードに対応する接客発話評価値を算定する。接客評価装置3は、例えばPC(ラップトップやデスクトップも含む)、スマートフォン、タブレット端末、携帯電話機又はPDA(Personal Digital Assistant)等のデータ通信機器により構成され、操作部31と、メモリ32と、接客発話評価部33と、出力部34と、表示装置35と、スピーカ装置36と、を有する。
操作部31は、ユーザ(例えば責任者・評価者)の操作内容を接客発話評価部33又は出力部34に通知するためのユーザインターフェース(UI:User Interface)であり、例えばマウス、キーボード等のポインティングデバイスである。また、操作部31は、例えば表示装置35の画面に対応して配置され、ユーザの指FG又はスタイラスペンによって操作が可能なタッチパネル又はタッチパッドにより構成されてもよい。また、操作部31は、表示装置35に表示された画面上の画像(例えばカメラ装置C1,…,CMのうちいずれかのカメラ装置により撮像された画像)に対し、ユーザの操作によって指定された画面上の画像の位置を示す座標データを取得して接客発話評価部33又は出力部34に出力する。
メモリ32は、例えばRAM(Random Access Memory)により構成され、接客評価装置3の各部の動作時のワークメモリとして機能し、更に、接客評価装置3の各部の動作時に必要なデータを記憶する。
接客発話評価部33は、例えばCPU(Central Processing Unit)、MPU(Micro Processing Unit)又はDSP(Digital Signal Processor)により構成され、接客イベント検出部331と、接客発話評価値算定部332と、発話可否判定部333と、を有する。
検出部の一例としての接客イベント検出部331は、管理サーバ2の管理DB2aの接客イベント情報DB(接客イベントデータ、後述参照)に基づいて接客イベントを検出する。接客イベントの検出方法の詳細については後述する。
算定部の一例としての接客発話評価値算定部332は、接客イベント検出部331により検出された接客イベントにおいて、レコーダ装置4に格納(記憶)された従業員の音声データを基に、所定の発話想定キーワードに対応する接客発話評価値を算定する。接客発話評価値の算定方法の詳細については後述する。
判定部の一例としての発話可否判定部333は、接客イベント検出部331により検出された接客イベントにおいて、各従業員が、発話可能な状況であったか否かを、従業員の業務状況に基づいて判定する。判定の基準となる業務状況として、例えば、(1)従業員が離席していたか否か、(2)従業員が電話対応中であったか否か、(3)従業員が他の従業員と会話中であったか否か、等が挙げられる。なお、発話可否判定部333は、接客イベント時に従業員が離席していたか否かを、カメラ装置C1,…,CMによって撮像された映像データに基づいて判定する。また、発話可否判定部333は、接客イベント時に従業員が他の従業員と会話中であったか否かを、カメラ装置C1,…,CMによって撮像された映像データおよびマイクアレイ装置AM1,…,AMLにより収音された音声データに基づいて判定する。
そして、(1)従業員が離席していない、(2)従業員が電話対応中ではない、かつ、(3)従業員が他の従業員と会話中でない、という業務状況の場合、発話可否判定部333は、当該従業員が発話可能な状況であったと判定する。一方、(1)従業員が離席している、(2)従業員が電話対応中である、および、(3)従業員が他の従業員と会話中である、のいずれかの業務状況である場合、発話可否判定部333は、当該従業員が発話可能な状況ではなかったと判定する。
出力部34は、例えばCPU、MPU又はDSPにより構成され、接客発話評価値算定部332により算定された接客発話評価値を、従業員の識別情報及び接客時刻により特定される従業員の音声データに対応付けてメモリ32又は管理サーバ2の管理DB2aに記憶させる。
また、出力部34は、接客態度評価システム100の各装置との間のネットワークNWを介した通信機能(有線通信機能、無線通信機能)を有するとともに、表示装置35やスピーカ装置36の動作を制御し、ユーザの所定の入力操作に応じて、接客態度評価システム100に関する各種画面を表示装置35に表示させたり、マイクアレイ装置AM1,…,AMLから送信された音声パケット(不図示)を受信してスピーカ装置36から出力させたりする。
また、出力部34は、例えばユーザの入力操作に応じて、カメラ装置C1,…,CMのうちいずれかのカメラ装置から送信された映像データを表示装置35に表示させる。
表示部の一例としての表示装置35は、例えばLCD(Liquid Crystal Display)又は有機EL(Electroluminescence)により構成され、ユーザの入力操作に応じて、出力部34の制御の下で、接客態度評価システム100に関する各種画面を表示する。
スピーカ装置36は、マイクアレイ装置AM1,…,AMLから送信された音声パケットに含まれる音声データを出力する。なお、表示装置35及びスピーカ装置36は、接客評価装置3と一体に構成されてもよいし、接客評価装置3と異なる装置でもよい。
指向性制御部37は、表示装置35の画面上に表示された映像からユーザの位置の指定操作に応じて、その映像を撮像したカメラ装置に対応付けられたいずれかのマイクアレイ装置AM1,…,AMLから、指定位置に対応する音声位置に向かう指向方向を示す座標を算定する。指向性制御部37の指向方向を示す座標の算定方法は公知技術であるため、その詳細な説明を省略する。
レコーダ装置4は、マイクアレイ装置AM1,…,AMLにより収音された各従業員の接客イベントの際に発話した音声データ、接客イベントの際にカメラ装置C1,…,CMにより撮像された各従業員の映像データ、および、センサ装置S1,…,SNにより検出されたセンサデータを、モニタリングデータ4aとして格納(保存)している。
なお、接客態度評価システム100において、室内の既定位置(プリセット位置)を収音するマイクアレイ装置AM1,…,AMLと既定位置を撮像するカメラ装置C1,…,CMとは予め対応付けされている。このため、プリセット位置の識別情報であるプリセットIDとそのプリセット位置を撮像するカメラ装置C1,…,CMの識別情報であるカメラIDとは予め対応づけられる。
それぞれのカメラ装置C1,…,CMは、撮像した映像データが表示装置35の画面上に表示された状態でユーザの指FG又はスタイラスペンによって任意の位置が指定されると、指定位置の座標データを接客評価装置3から受信し、自装置から、指定位置に対応する実空間上の位置(以下、単に「音声位置」と略記する)までの距離、方向(水平角及び垂直角を含む)のデータを算定して接客評価装置3に送信する。なお、カメラ装置による、距離、方向のデータ算定処理は公知技術であるため、その詳細な説明を省略する。
指向性制御部37は、例えばカメラ装置C1の設置位置から音声位置までの距離、方向のデータをカメラ装置C1から取得し、これらのデータを用いて、例えばマイクアレイ装置AM1(例えばカメラ装置C1とマイクアレイ装置AM1とが予め対応付けられているとする)の設置位置から音声位置に向かう指向方向を示す座標を算定する。例えばカメラ装置C1の筐体を囲むようにマイクアレイ装置AM1の筐体とカメラ装置C1とが一体的に取り付けられている場合には、カメラ装置C1から音声位置までの方向(水平角,垂直角)は、マイクアレイ装置AM1から音声位置までの指向方向を示す座標として用いることができる。
カメラ装置C1の筐体とマイクアレイ装置AM1の筐体とが離れて取り付けられている場合には、指向性制御部37は、事前に算定されたキャリブレーションパラメータのデータと、カメラ装置C1から音声位置までの方向(水平角,垂直角)のデータとを用いて、マイクアレイ装置AM1から音声位置までの指向方向を示す座標を算定する。なお、キャリブレーションとは、接客評価装置3の指向性制御部37が指向方向を示す座標を算定するために必要となる所定のキャリブレーションパラメータを算定又は取得する動作であり、公知技術である。
指向方向を示す座標は、マイクアレイ装置AM1から音声位置に向かう指向方向の水平角と垂直角とにより示される。なお、音声位置は、操作部31が表示装置35の画面上に表示された映像においてユーザの指FG又はスタイラスペンによって指定された指定位置に対応する実際の監視対象又は収音対象となる現場の位置である。
また、指向性制御部37は、例えばマイクアレイ装置AM1から送信された音声パケットに含まれる従業員の音声データを用いて、算定した座標に対応する指向方向の音声データを強調処理し、強調処理後の音声データを生成して出力部34に出力する。言い換えると、指向性制御部37は、マイクアレイ装置AM1から送信された音声パケットに含まれる音声データを用いて、算定した座標に対応する指向方向に音声データの指向性を形成する。なお、指向性制御部37における強調処理は、ユーザが選択した映像を撮像したカメラ装置C1,…,CMに対応するいずれかのマイクアレイ装置AM1,…,AMLにより行われてもよい。
(接客態度評価システム全体の動作手順)
次に、本実施の形態に係る接客態度評価システム100全体の動作手順について、図3を参照して説明する。図3は、本実施の形態の接客態度評価システムの全体の動作手順の一例を説明するフローチャートである。
図3において、接客評価が終了する場合には(S1、YES)、図3に示す接客態度評価システム100の動作は終了する。なお、接客評価が終了する場合とは、例えば接客評価装置3にインストールされている接客評価用のアプリケーションの「終了」ボタンが押下された場合や、接客評価装置3がシャットダウンした場合が挙げられるが、これらの場合に限定されない。
一方、接客評価が終了しない場合には(S1、NO)、接客評価装置3は、接客発話評価部33の接客発話評価値算定部332が従業員の接客発話評価値を算定するために、レコーダ装置4から取得するモニタリングデータ4aを所定時間間隔(例えば10秒程度)毎に切り取るための起点となる開始時刻を所定時間(例えば1秒程度)シフト処理することにより開始時刻を設定する(S2)。但し、接客評価装置3は、初回のモニタリングデータ4aの切り取り時にはシフト処理を行わない。ステップS2の処理は、ステップS3において取得されるモニタリングデータ4aの所定時間間隔の境界時点に接客イベントがあると、モニタリングデータ4aの中から接客イベントの検出が困難になってしまうことを回避するために設けられる。
ステップS2の後、接客評価装置3は、設定された開始時刻から所定時間間隔(例えば10秒程度)毎のモニタリングデータ4aをレコーダ装置4から取得し(S3)、取得したモニタリングデータ4aとモニタリングデータ4a(具体的には、モニタリングデータ4aに含まれる従業員の音声データ)の開始時刻及び終了時刻とを対応付けてメモリ32に保持する(S4)。なお、終了時刻は、開始時刻から所定時間間隔の時間を加算した時刻である。
ステップS4の後、接客評価装置3の接客発話評価部33において、イベント検出可否判定処理が行われ(S5)、イベント検出可否フラグが「可」に設定されていれば(S6、YES)、接客評価装置3の出力部34は、ステップS4においてメモリ32に保持した所定時間間隔毎のモニタリングデータ4aを接客発話評価部33の各部(つまり、接客イベント検出部331,接客発話評価値算定部332、発話可否判定部333)に出力する(S7)。ステップS7の後、接客発話評価部33の接客イベント検出部331において、接客イベント検出処理が行われる(S8)。
一方、イベント検出可否フラグが「否」に設定されている場合(S6、NO)又はステップS8の後、接客態度評価システム100の動作はステップS1に戻る。
(イベント検出可否判定処理の動作手順)
図4は、イベント検出可否判定処理の詳細な動作手順の一例を説明するフローチャートである。図4において、接客評価装置3の接客発話評価部33は、ステップS4においてメモリ32に保持した所定時間間隔毎のモニタリングデータ4aの所定領域(例えばヘッダ領域、ペイロード領域の一部又はその他のオプション領域)に、顧客のプライバシー保護を示す所定情報の一例としてのプライバシー保護マークが含まれているか否かを判定する(S5−1)。
接客発話評価部33は、プライバシー保護マークが含まれていると判定すると(S5−1、YES)、接客イベントの検出処理の有無を示すイベント検出可否フラグを「否」(つまり、接客イベント処理は行わずに省略すること)に設定する(S5−2)。ステップS5−2の後、接客態度評価システム100の動作はステップS6に進む。
一方、接客発話評価部33は、プライバシー保護マークが含まれていないと判定すると(S5−1、NO)、顧客の音声がモニタリングデータ4aに含まれていないかを判定する(S5−3)。
例えば、接客発話評価部33は、モニタリングデータ4aに含まれる音声データに、顧客が発話する可能性が高いキーワードが含まれている(より具体的には、例えばモニタリングデータ4aに含まれる音声データに対して顧客が発話する可能性が高いキーワードのワードスポッティング処理結果が所定のレベル以上)と判定した場合に、顧客の音声がモニタリングデータ4aに含まれていると判定する(S5−4、YES)。
あるいは、接客発話評価部33は、モニタリングデータ4aに含まれる映像データに対して画像処理することにより、予め登録された従業員の顔画像以外の顔を検出し、更にその検出された顔の方向を収音するマイクアレイ装置AM1,…,AMLからの音声、或いはその検出された顔の方向に指向性を形成した音声に人の音声が含まれていると判定した場合に、顧客の音声がモニタリングデータ4aに含まれていると判定する(S5−4、YES)。
接客発話評価部33は、顧客の音声が含まれていると判定した場合(S5−4、YES)、イベント検出可否フラグを「否」に設定する(S5−5)。ステップS5−5の後、接客態度評価システム100の動作はステップS6に進む。
一方、接客発話評価部33は、顧客の音声が含まれていないと判定した場合(S5−4、NO)、イベント検出可否フラグを「可」に設定する(S5−6)。ステップS5−6の後、接客態度評価システム100の動作はステップS6に進む。
(接客イベント検出処理の動作手順)
次に、接客イベント検出処理(図3に示すステップS8参照)の詳細について、図5及び図6を参照して説明する。図5は、接客イベント検出処理の詳細な動作手順の一例を説明するフローチャートである。図6は、図5中の接客イベント情報処理の詳細な動作手順の一例を説明するフローチャートである。
なお、接客イベント検出処理の説明を具体的かつ分かりやすくするために、図7に示す接客イベント情報DBの各レコードの内容を参照して具体的に説明する。
先ず、接客イベント検出部331は、開始時刻及び終了時刻が定められた所定時間間隔(例えば10秒程度)毎のモニタリングデータ4aを接客発話評価部33から受け取り(S8−1)、管理サーバ2の管理DB2aに格納されている接客イベント情報DB(図7参照)を読み込む(S8−2)。
ステップS8−2の後、接客イベント検出部331は、未取得である接客イベント情報DBの1行目のレコード(接客イベントID「EID1」、接客イベント名「来退室挨拶」)を取得し(S8−3)、接客イベント情報処理を開始する(S8−4)。
図6に示す接客イベント情報処理(図5のS8−4)において、接客イベント検出部331は、モニタリングデータ4aから照合対象データとしての映像データとセンサデータに含まれる検出結果(自動ドア開閉履歴データ)とを取得し(S11)、自動ドア開閉履歴データに自動ドアの開閉動作があるか否かを照合する(S12)。
自動ドア開閉履歴データが自動ドアの開閉動作を含まない場合には(S13、NO)、図6に示す接客イベント情報処理は終了し、フローは図5のステップS8−5に進む。
一方、自動ドア開閉履歴データが自動ドアの開閉動作を含む場合には(S13、YES)、接客イベント検出部331は、図7に示す接客イベント情報DBの接客イベント出力情報(具体的には、各従業員の位置座標、カメラID(カメラ装置の識別情報:1〜CNのうち該当するもの)、従業員ID(従業員の識別情報:1〜ENのうち該当するもの)、接客イベントID)を接客状況DB(図8参照)に格納(保持)する(S14)。
なお、接客イベント検出部331は、所定の映像データを画像処理することにより各従業員の位置座標を得ることができる。表示装置35の画面上に表示された映像データにおいて各従業員が存在する位置の座標として出力される。また、カメラIDは、接客イベント検出部331が所定の映像データを画像処理することで、自動ドアの開閉動作時に各従業員が存在した位置を最も近くで撮像するカメラ装置の識別情報として出力される。マイクIDは、カメラIDと予め対応付けられているので、カメラIDが選択された時点で選択されることになって出力される。
図2に示す接客態度評価システム100では指向性の形成処理が可能のため(S15、YES)、接客イベント検出部331は、検出された接客イベントに対応する各従業員の位置座標のデータと、モニタリングデータ4aに含まれる接客イベントに対応する各従業員の音声データとを指向性制御部37に入力し、指向性制御部37において各従業員の音声データに対して各従業員に最も近いマイクアレイ装置から各従業員に向かう方向に指向性が形成された後の音声データを取得する(S17)。なお、指向性の形成処理が不可能なシステムの場合(S15、NO)、接客イベント検出部331は、単に、モニタリングデータ4aから、接客イベントに対応する音声データを取得する(S16)。そして、接客イベント検出部331は、接客発話評価値算定部332に、各従業員の従業員位置座標(例えば表示装置35の画面上に表示された従業員の存在する位置の座標)のデータとステップS16またはS17において取得した音声データと接客イベントIDとを入力する(S18)。
その後、接客発話評価値算定部332は、図9に示す接客発話評価処理を実行する(S19)。そして、検出状態のフラグが「−1」でない場合には(S20、NO)、接客発話評価出力値を接客状況DBに格納(保持)する(S20−1)。一方、検出状態のフラグが「−1」である場合には(S20、YES)、接客発話評価出力値を接客状況DBに格納(保持)しない。これにより、図6に示す接客イベント情報処理が終了し、フローは図5のステップS8−5に進む。図5において、ステップS8−4の後、接客イベント情報DBの全てのレコードが取得されていない場合には(S8−5、NO)、接客イベント検出部331の処理はステップS8−3に戻る。一方、接客イベント情報DBの全てのレコードが取得された場合には(S8−5、YES)、接客イベント検出部331の処理は終了する。
(接客イベント情報DBの一例)
次に、上記接客イベント検出処理の説明で用いた接客イベント情報DBの一例について、図7を参照して説明する。図7に示す接客イベント情報DBは、接客イベントIDと、接客イベント名と、接客イベント判定条件(つまり、モニタリングデータ4aに接客イベントが検出されたか否かを判定するための条件)と、接客イベント出力情報(つまり、接客イベントが検出されたときに出力する情報)との各項目に対応するデータの種類、種別が規定される。
図7に示す接客イベント情報DBの接客イベント判定条件では、接客イベントの検出トリガが接客イベント毎に異なり、入り口付近に設置されたセンサ装置S1(例えば自動ドア)が開閉動作したことを検出したこと、所定のプリセットIDに対応する既定位置(プリセット位置)に、接客を行う従業員が滞在して更に所定の来客者位置プリセットIDに対応する位置(即ち、接客イベント時に顧客がいる可能性が高い位置)に顧客が所定時間(例えば5秒程度)滞在したこと、がそれぞれ規定されている。
図7に示す接客イベント情報DBの接客イベント出力情報は、接客イベント毎に異なり、従業員の位置座標とカメラIDと従業員IDと接客イベントIDとの組み合わせと、プリセットIDと従業員IDと接客イベントIDとの組み合わせとがそれぞれ規定されている。従業員の位置座標は、指向性制御部37が各従業員の音声データを収音したマイクアレイ装置から各従業員に向かう方向に音声の指向性を形成する際に用いられる。
(接客状況DBの一例)
次に、接客状況DBの一例について、図8を参照して説明する。図8に示す接客状況DBは、接客状況データIDと、接客発話評価値と、イベント開始時刻と、イベント終了時刻と、従業員IDと、接客イベントIDと、の各項目に対応するデータが規定される。
なお、接客状況データID「ID1」における、接客発話評価値V11…V1nの左側の添え字である「1」は接客イベントID「EID1」に対応しており、接客発話評価値V11…V1nの右側の添え字である「1」から「n」は所定時間間隔毎に切り取られるモニタリングデータ4aの中で同一の接客イベントIDの接客イベントが検出された場合の接客イベントの識別情報を示す。nは1以上の整数であり、例えば10秒程度のモニタリングデータ4aの中で同一の接客イベントIDの接客イベントが複数検出された場合には、nは2以上の整数となる。
同様に、接客状況データID「ID2」における、接客発話評価値V21…V2mの左側の添え字である「2」は接客イベントID「EID2」に対応しており、接客発話評価値V21…V1mの右側の添え字である「1」から「m」は所定時間間隔毎に切り取られるモニタリングデータ4aの中で同一の接客イベントIDの接客イベントが検出された場合の接客イベントの識別情報を示す。mは1以上の整数であり、例えば10秒程度のモニタリングデータ4aの中で同一の接客イベントIDの接客イベントが複数検出された場合には、mは2以上の整数となる。
図2に示す接客態度評価システム100は、図8に示す接客状況DBを有することにより、該当する接客イベントの開始時刻から終了時刻までの音声データ及び映像データを接客評価装置3において出力(再生)することができ、責任者又は評価者が接客イベント時の従業員の接客状況を音声及び映像で確認しながら注意深く観察、レビューすることができる。なお、接客評価装置3は、接客イベントIDに対応する接客イベントの検出時に収音された音声データをレコーダ装置4から取得した上で出力(再生)する。
(接客発話評価処理の動作手順)
次に、接客発話評価処理(図6に示すステップS19参照)の動作手順の詳細について、図9を参照して説明する。図9は、接客発話評価処理の動作手順の一例を説明するフローチャートである。
図9において、接客発話評価値算定部332は、ステップS18において接客イベント検出部331から渡された音声データと接客イベントIDとを取得し(S21)、騒音レベル判定処理を行い(S22)、接客キーワードの発話判定処理を行う(S23)。ステップS23の後、接客発話評価値算定部332は、検出状態(後述参照)のフラグが「1」であるか否かを判定する(S24)。検出状態のフラグが「1」である場合には(S24、YES)、接客発話評価値算定部332は、スコアリング処理を行う(S25)。また、検出状態のフラグが「0」である場合には(S24、NO、S26、YES)、接客発話評価値算定部332は、接客発話評価値をゼロ点に設定するか所定点数を減点する(S27)。
ステップS25又はステップS27の後、接客発話評価値算定部332は、スコアリングデータとして、検出したキーワードID(後述参照)と接客発話評価値とを接客発話評価部33に出力する(S28)。なお、検出状態のフラグが「1」、「0」のいずれでもない場合には(S24、NO、S26、NO)、接客発話評価値算定部332は、スコアリングデータを出力しない。
(騒音レベル判定処理の動作手順)
次に、騒音レベル判定処理(図9に示すステップS22参照)の動作手順の詳細について、図10を参照して説明する。図10は、騒音レベル判定処理の動作手順の一例を説明するフローチャートである。
図10において、接客発話評価値算定部332は、接客評価装置3が取得した収音領域の周囲の騒音レベルが所定値x[dB]以下であるか否かを判定する(S22−1)。騒音レベルは、マイクアレイ装置AM1,…,AMLにより収音されて接客評価装置3に送信される。接客発話評価値算定部332は、騒音レベルが所定値x[dB]以下であると判定した場合には(S22−1、YES)、発話判定閾値(後述参照)をα1に決定する(S22−2)。
一方、接客発話評価値算定部332は、騒音レベルが所定値x[dB]を超える場合には(S22−1、NO)、騒音レベルが所定値y(>x)[dB]以下であるか否かを判定する(S22−3)。接客発話評価値算定部332は、騒音レベルが所定値y[dB]以下であると判定した場合には(S22−3、YES)、発話判定閾値(後述参照)をα2に決定する(S22−4)。一方、接客発話評価値算定部332は、騒音レベルが所定値y[dB]を超えると判定した場合には(S22−3、NO)、発話判定閾値(後述参照)をα3に決定する(S22−5)。
(接客キーワードの発話判定処理)
次に、接客キーワードの発話判定処理(図9に示すステップS23参照)の動作手順の詳細について、図11A、図11Bを参照して説明する。図11A、図11Bは、接客キーワードの発話判定処理の動作手順の一例を説明するフローチャートである。
図11Aにおいて、発話可否判定部333は、接客イベントにおいて、各従業員が、発話可能な状況であったか否かを、従業員の業務状況に基づいて判定する(S23−1)。判定の基準となる業務状況として、例えば、(1)従業員が離席していたか否か、(2)従業員が電話対応中であったか否か、(3)従業員が他の従業員と会話中であったか否か、等が挙げられる。
そして、(1)従業員が離席していない、(2)従業員が電話対応中ではない、かつ、(3)従業員が他の従業員と会話中でない、という業務状況の場合、発話可否判定部333は、当該従業員が発話可能な状況であったと判定する(S23−2、YES)。一方、(1)従業員が離席している、(2)従業員が電話対応中である、および、(3)従業員が他の従業員と会話中である、のいずれかの業務状況である場合、発話可否判定部333は、当該従業員が発話可能な状況ではなかったと判定し(S23−2、NO)、接客発話評価値算定部332は、検出状態のフラグを「−1」に設定する(S23−3)。その後、図11Aに示す接客発話評価値算定部332の処理は終了する。
従業員が発話可能な状況である場合には(S23−2、YES)、接客発話評価値算定部332は、検出状態のフラグを「0」に設定する(S23−4)。検出状態のフラグとは、接客イベントにおいて従業員が発話する可能性が高い又は発話するべき模範的な発話想定キーワード(図16(A)参照)が発話された状態を示す情報である。
接客発話評価値算定部332は、ステップS21において取得した音声データを接客発話評価値算定部332の音声認識エンジン(不図示)に入力し(S23−5)、更に、接客イベントIDに対応する全ての発話想定キーワードと、検出した発話想定キーワードを識別するキーワードIDとの組を管理サーバ2の管理DB2aの接客発話評価DBから取得する(S23−6)。
接客発話評価値算定部332は、音声認識エンジンによる音声認識処理結果に発話想定キーワードが含まれるか否かを判定する(S23−7)。音声認識エンジンによる音声認識結果に発話想定キーワードが含まれないと判定された場合には(S23−7、NO)、図11Aに示す接客発話評価値算定部332の処理は終了する。
一方、接客発話評価値算定部332は、音声認識エンジンによる音声認識処理結果に発話想定キーワードが含まれると判定した場合には(S23−7、YES)、音声認識処理結果の評価値がステップS22−2、ステップS22−4又はステップS22−5において決定された発話判定閾値(α1,α2,α3のうちいずれか)以上であるか否かを判定する(S23−8)。音声認識処理結果の評価値が発話判定閾値(α1,α2,α3のうちいずれか)未満であると判定された場合には(S23−8、NO)、図11Aに示す接客発話評価値算定部332の処理は終了する。
一方、接客発話評価値算定部332は、音声認識処理結果の評価値が発話判定閾値(α1,α2,α3のうちいずれか)以上であると判定した場合には(S23−8、YES)、検出状態のフラグを「1」に設定変更し(S23−9)、ステップS21において取得した音声データを、発話想定キーワードに対応するキーワードの発話部分のみに切り取って更新して上書き保存する(S23−10)。その後、図11Aに示す接客発話評価値算定部332の処理は終了する。
なお、接客キーワードの発話判定処理では、図11Bに示すように、図11Aに対して、S23−1、S23−2の処理をS23−8とS23−9の間に行うように、処理順序を変更するようにしてもよい。
図12(A)、(B)は、従業員の業務状況を示すタイムチャートの一例を示す図である。発話可否判定部333は、図12(A)、(B)に示すようなタイムチャートを参照して発話可否の判定の処理(S23−1、S23−2)を行う。
例えば、図12(A)において、9時37分から38分の間に来室挨拶の接客イベント(入イベント)が発生している。この間、座席Aの従業員は、離席していたため、発話可否判定部333は、当該従業員が発話可能な状況ではなかったと判定する。一方、座席Bの従業員は、離席しておらず、電話応答中でもなく、他の従業員(周囲)との会話中でもないため、発話可否判定部333は、当該従業員が発話可能な状況であったと判定する。なお、この時、座席Bの従業員は、「いらっしゃいませ」等の発話を行ったため、接客発話評価値がカウントされている。
また、図12(B)において、9時50分から51分の間に退室挨拶の接客イベント(出イベント)が発生している。この間、座席Aの従業員および座席Bの従業員は、離席しておらず、電話応答中でもなく、他の従業員(周囲)との会話中でもないため、発話可否判定部333は、当該従業員が発話可能な状況であったと判定する。なお、この時、座席Bの従業員は、「ありがとうございました」等の発話を行っていなかったため、接客発話評価値がカウントされていない。
(スコアリング処理の動作手順)
次に、スコアリング処理(図9に示すステップS25参照)の動作手順の詳細について、図13を参照して説明する。図13は、スコアリング処理の動作手順の一例を説明するフローチャートである。
図13において、接客発話評価値算定部332は、ステップS23−10において更新された音声データを用いて、発話長さ判定処理を行い(S25−1)、更に、周波数特性判定処理を行う(S25−2)。更に、接客発話評価値算定部332は、発話長さ判定処理及び周波数特性判定処理の結果としてのスコアリングデータ(具体的には、ステップS23−8において更新された音声データの中で検出したキーワードを識別するキーワードIDと接客発話評価値との組)をメモリ32に保持する(S25−3)。
(発話長さ判定処理および周波数特性判定処理の動作手順)
次に、発話長さ判定処理(図13に示すステップS25−1参照)及び周波数特性判定処理(図13に示すステップS25−2参照)の動作手順の詳細について、図14(A)及び(B)を参照して説明する。図14(A)は、発話長さの判定処理の動作手順の一例を説明するフローチャートである。図14(B)は、周波数特性の判定処理の動作手順の一例を説明するフローチャートである。
図14(A)において、接客発話評価値算定部332は、管理サーバ2の管理DB2aの接客発話評価DBを参照し、ステップS21において取得した接客イベントIDに対応する接客発話モデルIDにより特定されるモデル音声データを管理サーバ2の管理DB2aから取得する(S31)。接客発話評価値算定部332は、ステップS23−10において更新された音声データの音声部分(例えば従業員の発話部分)の長さが模範的な所定範囲内であるか否かを判定する(S32)。
図15は、モデル音声を用いた発話長さの判定処理の具体例を示す図である。図15では、横軸は時間を示し、例えば「来室挨拶」の接客イベントにおいて発話される「いらっしゃいませ」の模範的な所定範囲の音声の発話長さl0の「いらっしゃいませ」と、所定範囲を超える音声の発話長さl1の「いらっしゃいませ」(図15に示すNo.1参照)及び発話長さl2の「いらっしゃいませ」(図15に示すNo.2参照)とが示されている。
接客発話評価値算定部332は、ステップS23−10において更新された音声データの発話長さがモデル音声データの発話長さ(発話長さl0)より所定範囲(例えば10%)内を超える場合(例えば図15に示すNo.1及びNo.2参照)には(S32、NO)、接客発話評価値から所定点数を減点する(S34)。
例えば、図15に示すNo.1のケースでは、発話された「いらっしゃいませ」の発話長さがモデル音声データの「いらっしゃいませ」の発話長さより所定範囲ほど短く、この場合には、接客発話評価値算定部332は、所定点数として、「100×(0.9l0−l1)/l0」を減点する。l1は、図15に示すNo.1のケースで発話された「いらっしゃいませ」の発話長さを示す。より具体的には、モデル音声データの「いらっしゃいませ」の発話長さが1秒で、所定範囲がモデル音声データの「いらっしゃいませ」の発話長さの±10%であると、図15に示すNo.1のケースで発話された「いらっしゃいませ」の発話長さが0.9秒〜1.1秒の間であれば減点はされないが、例えば0.7秒であった場合には、20点(=100×(0.9×1秒−0.7秒))が減点される。
また、例えば図15に示すNo.2のケースでは、発話された「いらっしゃいませ」の発話長さがモデル音声データの「いらっしゃいませ」の発話長さより所定範囲ほど長く、この場合には、接客発話評価値算定部332は、所定点数として、「100×(l2−1.1l0)/l0」を減点する。l2は、図15に示すNo.2のケースで発話された「いらっしゃいませ」の発話長さを示す。より具体的には、モデル音声データの「いらっしゃいませ」の発話長さが1秒で、所定範囲がモデル音声データの「いらっしゃいませ」の発話長さの±10%であると、図15に示すNo.2のケースで発話された「いらっしゃいませ」の発話長さが0.9秒〜1.1秒の間であれば減点はされないが、例えば1.3秒であった場合には、20点(=100×(1.3秒−1.1×1秒))が減点される。
一方、接客発話評価値算定部332は、ステップS23−10において更新された音声データの発話長さがモデル音声データの発話長さ(発話長さl0)より所定範囲(例えば10%)内を超えない場合(S32、YES)又はステップS34の後、スコアリングデータ(具体的には、ステップS23−8において更新された音声データの中で検出したキーワードを識別するキーワードIDとステップS34で減点された後若しくはステップS34で減点されなかった初期値(例えば100点)である接客発話評価値との組)をメモリ32に保持する(S33)。
図14(B)において、接客発話評価値算定部332は、管理サーバ2の管理DB2aの接客発話評価DBを参照し、ステップS21において取得した接客イベントIDに対応する接客発話モデルIDにより特定されるモデル音声データを管理サーバ2の管理DB2aから取得する(S41)。接客発話評価値算定部332は、ステップS23−10において更新された音声データの音素(一つ一つの言葉の音)毎の周波数特性(例えば周波数)が模範的な音素毎の基本周波数から所定範囲内であるか否かを判定する(S42)。
図16は、モデル音声の各音素の基本周波数を用いた周波数特性の判定処理の具体例を示す図である。図16では、横軸は時間を示し、点線の丸はモデル音声データの各音素の基本周波数f1〜f7を示し、実線の丸はステップS23−8において更新された音声データの各音素の周波数f’1〜f’7を示し、例えば「来室挨拶」の接客イベントにおいて発話される「いらっしゃいませ」の模範的な音素の基本周波数f1〜f7毎の所定範囲(図16に示す直線型の各実線矢印参照)が示されている。
接客発話評価値算定部332は、ステップS23−10において更新された音声データの音素毎に、各音素の周波数特性(例えば周波数)がモデル音声データの各音素の周波数特性毎の所定範囲(例えば60[Hz])内を超えると判定した場合には(S42、NO)、所定範囲を超えた音素の数に応じて、接客発話評価値から所定点数を減点する(S44)。
例えば、図16に示すケースでは、音素「ら」と音素「ま」の周波数f’1,f’6が対応する各基本周波数f1,f6毎の所定範囲を超えているので、接客発話評価値算定部332は、周波数差分(例えば|f1−f’1|)が60[Hz]から120[Hz]であれば5点を該当する音素毎に減点し、周波数差分(例えば|f1−f’1|)が120[Hz]を超えるなら10点を該当する音素毎に減点する。なお、地域や業界によっては発話想定キーワードの語尾が上げ調子で発話されることが好ましい場合もあるので(図16に示す一点鎖線参照)、例えば語尾又は語尾を含む所定数個の音素に対しては、基本周波数の値が増加されて使用されてもよい。
一方、接客発話評価値算定部332は、ステップS23−10において更新された音声データの音素毎に、各音素の周波数特性(例えば周波数)がモデル音声データの各音素の周波数特性毎の所定範囲(例えば60[Hz])内を超えないと判定した場合には(S42、YES)又はステップS44の後、スコアリングデータ(具体的には、ステップS23−8において更新された音声データの中で検出したキーワードを識別するキーワードIDとステップS44で減点された後若しくはステップS44で減点されなかった初期値(例えば100点)である接客発話評価値との組)をメモリ32に保持する(S43)。
図17(A)は、接客発話評価DBの一部を構成する発話想定キーワード表の一例を示す図である。図17(B)は、接客発話評価DBの一部を構成する接客発話モデルの一覧表の一例を示す図である。
図17(A)に示す発話想定キーワード表は、接客イベントIDと、接客イベント名と、キーワードIDと、発話想定キーワードと、接客発話モデルIDとの各項目に対応するデータが規定される。キーワードIDは、発話想定キーワードを識別する。接客発話モデルIDは、図17(B)に示すように、発話想定キーワードの音声が発話される接客発話モデルの音声データを識別する。図17(A)に示すように、1つの接客発話モデルIDに対応して1つ以上の発話想定キーワードが規定されてもよい(図17(A)に示す接客イベントID「EID2」のレコード参照)。
(評価結果の表示例)
接客態度評価システム100が上記処理を行うことによって得られた各従業員の発話評価結果の表示例について図18(A)、(B)を用いて説明する。図18(A)、(B)では、従業員毎(座席A、B、C、D)に、所定の期間(5日間)における、各接客イベント(来室(図18(A)及び退室(図18(B))のスコアを、日付毎に数値および棒グラフで表示すると供に、当該期間の平均値を表示している。
(効果)
以上のように、本実施の形態の接客態度評価システム100は、所定の接客イベント毎の接客イベント判定条件を含む接客イベント情報DB(接客イベントデータ)を基に、従業員の接客イベントを検出し、モニタリングデータ4aに含まれる従業員の音声データを基に、所定の発話想定キーワードに対応する接客発話評価値を算定する。また、接客態度評価システム100は、算定された接客発話評価値を、従業員IDと従業員位置及び接客時刻により特定される従業員の音声データに対応付けて記憶する。
これにより、接客態度評価システム100は、従来技術のように調査員のような人的リソースを用いること無く、所定の収音領域内の顧客に対する各種の接客イベント時における各従業員の接客発話の内容を客観的な接客発話評価値として得ることができ、従業員の顧客に対する接客態度を的確かつ客観的に評価することができる。
また、接客態度評価システム100は、所定の接客イベント毎の発話想定キーワードを含む接客発話評価DBの発話想定キーワード表(キーワードデータ)を管理サーバ2の管理DB2aに記憶し、従業員の音声データに接客イベントに対応する発話想定キーワードが含まれていない場合には接客発話評価値をゼロに設定し又は接客発話評価値から所定点数を減点するので、接客イベント時に発話想定キーワードを発話しない従業員を正確に評価することができる。
また、接客態度評価システム100は、接客イベント各従業員が発話可能な状況ではない場合には、接客発話評価値の算出対象から除外するので、従業員を正確に評価することができる。
また、接客態度評価システム100は、従業員の音声データの発話想定キーワードの発話長さがキーワード音声データの発話想定キーワードの発話長さから所定範囲を超える場合に、接客発話評価値から所定点数を減点するので、接客イベント時に発話想定キーワードを模範的な発話長さから逸脱して発話した従業員を正確に評価することができる。
また、接客態度評価システム100は、従業員の音声データの発話想定キーワードの音素毎の周波数がキーワード音声データの発話想定キーワードの音素毎の基本周波数から所定範囲を超える場合に接客発話評価値から所定点数を減点するので、接客イベント時に発話想定キーワードを模範的な基本周波数から逸脱して発話した従業員を正確に評価することができる。
また、接客態度評価システム100は、センサ装置S1,…,SNにより得られた所定の収音領域における顧客の来室又は退室の検出結果をモニタリングデータ4aとしてレコーダ装置4に記憶し、この検出結果を基に従業員の接客イベントを検出するので、所定の収音領域の来退室挨拶の接客イベントが行われる動機を与えるセンサ装置(例えば開閉する自動ドア)の検出結果に応じて、来退室挨拶の接客イベントが適正に行われているか否かを正確に評価することができる。
また、接客態度評価システム100は、いずれかのマイクアレイ装置AM1,…,AMLから所定の指向方向に音声の指向性を形成した従業員の音声データを基に接客発話評価値を算定するので、指向性が形成されない場合に比べて、従業員の音声データを強調することができるので、接客発話評価値の算定精度を向上することができ、従業員に対する接客発話評価値を正確に算定することができる。
最後に、本発明に係る接客態度評価システム及び接客態度評価方法の構成、作用、効果について説明する。
本発明の一実施の形態は、所定の収音領域に居る各従業員の音声を収音する収音部と、前記収音領域の顧客に対する接客イベントの発生を検出する検出部と、前記接客イベントの発生時において、前記各従業員が発話可能な状況であるか否かを判定する判定部と、前記接客イベントにおいて発話可能な状況であった各従業員について、前記接客イベントの発生時における当該従業員の音声データと、前記接客イベントに対応する発話キーワードとの対比により接客発話評価値を算定する算定部と、前記接客発話評価値に関する情報を、前記従業員の情報と関連付けて表示部に表示させる出力部と、を具備する接客態度評価システムである。
これにより、接客態度評価システムは、従来技術のように調査員のような人的リソースを用いること無く、所定の収音領域内の顧客に対する各種の接客イベント時における従業員の接客発話の内容を客観的な接客発話評価値として得ることができ、従業員の顧客に対する接客態度を的確かつ客観的に評価することができる。
また、本発明の一実施の形態は、所定の収音領域に居る各従業員の音声を収音するステップと、前記収音領域の顧客に対する接客イベントの発生を検出するステップと、前記接客イベントの発生時において、前記各従業員が発話可能な状況であるか否かを判定するステップと、前記接客イベントにおいて発話可能な状況であった各従業員について、前記接客イベントの発生時における当該従業員の音声データと、前記接客イベントに対応する発話キーワードとの対比により接客発話評価値を算定するステップと、前記接客発話評価値に関する情報を、前記従業員の情報と関連付けて表示部に表示させるステップと、を具備する接客態度評価方法である。
これにより、接客態度評価方法は、従来技術のように調査員のような人的リソースを用いること無く、所定の収音領域内の顧客に対する各種の接客イベント時における従業員の接客発話の内容を客観的な接客発話評価値として得ることができ、従業員の顧客に対する接客態度を的確かつ客観的に評価することができる。
以上、図面を参照しながら各種の実施の形態について説明したが、本発明はかかる例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。