JP2011237965A - Conversation ratio calculation device, customer service data recording device, conversation ratio calculation method and program - Google Patents

Conversation ratio calculation device, customer service data recording device, conversation ratio calculation method and program Download PDF

Info

Publication number
JP2011237965A
JP2011237965A JP2010108060A JP2010108060A JP2011237965A JP 2011237965 A JP2011237965 A JP 2011237965A JP 2010108060 A JP2010108060 A JP 2010108060A JP 2010108060 A JP2010108060 A JP 2010108060A JP 2011237965 A JP2011237965 A JP 2011237965A
Authority
JP
Japan
Prior art keywords
conversation
section
customer
voice
customer service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010108060A
Other languages
Japanese (ja)
Inventor
Junichi Yoshizawa
潤一 吉澤
Masashi Aonuma
正志 青沼
孝 ▲浜▼
Takashi Hama
Tetsuo Ozawa
哲雄 小沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2010108060A priority Critical patent/JP2011237965A/en
Publication of JP2011237965A publication Critical patent/JP2011237965A/en
Pending legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a conversation ratio calculation device, a customer service data recording device, a conversation ratio calculation method and program capable of calculating an accurate conversation ratio.SOLUTION: A conversation ratio calculation device, a customer service data recording device, a conversation ratio calculation method and program equipped with; a conversation acquisition part 102 which acquires a conversation between a clerk and a customer; an utterance detection part 101 which is fixed by the clerk and detects a utterance of the clerk; a voice extraction part 154 which extracts a clerk's voice as a voice of the clerk and a customer's voice as a voice of the customer from an acquired conversation based on a detection result of the utterance detection part 101; a conversation ratio calculation part 155 which calculates a conversation ratio as a ratio of the length of the clerk's voice to the customer's voice, or a ratio of the length of the clerk's voice or the customer's voice to the total length of the clerk's voice and the customer's voice.

Description

人物の音声を取得して会話状況を推定するための会話比率算出装置、接客データ記録装置、会話比率算出方法およびプログラムに関するものである。   The present invention relates to a conversation ratio calculation apparatus, a customer service data recording apparatus, a conversation ratio calculation method, and a program for acquiring a voice of a person and estimating a conversation state.

従来、会話状況を推定する技術として、人物の音声に基づいて感情を認識する感情認識技術が知られている。例えば、特許文献1では、被験者が入力した音声信号から、音声の強度、テンポおよび抑揚などの変化量を、「怒り」、「悲しみ」および「喜び」などそれぞれの感情状態に対応付けて感情認識を行っている。   Conventionally, as a technique for estimating a conversation state, an emotion recognition technique for recognizing an emotion based on a person's voice is known. For example, in Patent Document 1, emotion recognition is performed by associating changes in speech intensity, tempo, and intonation with each emotional state such as “anger”, “sadness”, and “joy” from the speech signal input by the subject. It is carried out.

一方、小売店などの店舗では、販売促進に活用するためのマーケティングデータとして、顧客データや売り上げデータを収集する試みが行われている。例えば、特許文献2では、POSデータを分析して消費者の併売傾向を数量的に把握し、販売促進に反映させるマーケティングデータ収集分析技術が提案されている。   On the other hand, in stores such as retail stores, attempts are being made to collect customer data and sales data as marketing data for use in sales promotion. For example, Patent Document 2 proposes a marketing data collection / analysis technique that analyzes POS data to quantitatively grasp the tendency of simultaneous sales by consumers and reflects it in sales promotion.

ところで、マーケティングの分野では、生産性や効率を多少犠牲にしてでも顧客満足度を高めた方が、消費者のリピーター化などを通じて結果的には良いと言われている。また、小売店を初めとするホスピタリティを重視する店舗では、売り上げと顧客満足度には密接な関連性があるため、顧客満足度を高めるために、接客スキルのトレーニングや、顧客に対する印象を良くするための笑顔や挨拶のトレーニングを行っている。中でも、接客スキルの一つである会話テクニックは重要視され、顧客との会話比率に着目したトレーニングが行われている。一般的に、店員と顧客の会話比率は、顧客の割合が大きい方が好ましいとされており(例えば、2:8など)、これを維持することで、顧客満足度に好影響を与えると言われている。   By the way, in the field of marketing, it is said that increasing customer satisfaction at the expense of productivity and efficiency is better as a result of consumer repeaters. Also, retailers and other stores that emphasize hospitality have a close relationship between sales and customer satisfaction, so customer service skills training and customer impressions are improved to increase customer satisfaction. For training of smiles and greetings. In particular, conversation techniques, which are one of customer service skills, are regarded as important, and training focusing on the ratio of conversations with customers is conducted. Generally speaking, it is said that the ratio of the conversation between the store clerk and the customer is preferably larger (for example, 2: 8), and maintaining this will have a positive impact on customer satisfaction. It has been broken.

特開2002−91482号公報JP 2002-91482 A 特開2007−94592号公報JP 2007-94592 A

ところが、接客に好ましいとされる会話比率が分かっていても、会話比率を測定する方法が無いため、各店員がそれを実践できているか否かは不明である。つまり、会話比率に着目したトレーニングを行って、仮に売り上げが向上した場合でも、その関連性を証明できないという問題がある。また、小売業界では、マーケティングデータとして、実際に接客している最中の会話比率に関する情報を収集して経営戦略に役立てたいという要望があるが、未だ実現されていない。   However, even if the conversation ratio that is preferable for customer service is known, there is no method for measuring the conversation ratio, so it is unclear whether or not each store clerk can practice it. In other words, there is a problem that even if sales are improved by performing training focusing on the conversation ratio, the relevance cannot be proved. Further, in the retail industry, there is a request to collect information on the conversation ratio during the actual customer service as marketing data and use it for the management strategy, but it has not been realized yet.

本発明は、上記の問題点に鑑み、正確な会話比率を算出し、当該会話比率を記録可能な会話比率算出装置、接客データ記録装置、会話比率算出方法およびプログラムを提供することを目的とする。   In view of the above problems, an object of the present invention is to provide a conversation ratio calculation device, a customer service data recording device, a conversation ratio calculation method, and a program capable of calculating an accurate conversation ratio and recording the conversation ratio. .

本発明の会話比率算出装置は、人物Aと人物Bの会話を取得する会話取得部と、取得した会話から、人物Aの音声であるA音声と、人物Bの音声であるB音声と、を抽出する音声抽出部と、A音声とB音声の長さの比率、若しくはA音声またはB音声の長さの、A音声とB音声の長さの合計に対する比率である会話比率を算出する会話比率算出部と、を備えたことを特徴とする。   The conversation ratio calculation apparatus according to the present invention includes a conversation acquisition unit that acquires a conversation between a person A and a person B, and an A sound that is a sound of the person A and a B sound that is a sound of the person B from the acquired conversation. A speech ratio for calculating a speech ratio that is a ratio of the length of the A voice and the B voice, or a ratio of the length of the A voice or the B voice to the total length of the A voice and the B voice. And a calculating unit.

本発明の会話比率算出方法は、コンピューターが、人物Aと人物Bの会話を取得する会話取得ステップと、取得した会話から、人物Aの音声であるA音声と、人物Bの音声であるB音声と、を抽出する音声抽出ステップと、A音声とB音声の長さの比率、若しくはA音声またはB音声の長さの、A音声とB音声の長さの合計に対する比率である会話比率を算出する会話比率算出ステップと、を実行することを特徴とする。   The conversation ratio calculation method of the present invention includes a conversation acquisition step in which a computer acquires a conversation between a person A and a person B, and an A sound that is the sound of the person A and a B sound that is the sound of the person B from the acquired conversation. And a conversation ratio that is a ratio of the length of the A voice and the B voice or a ratio of the length of the A voice or the B voice to the total length of the A voice and the B voice. Performing a conversation ratio calculating step.

これらの構成によれば、会話から人物Aの音声であるA音声と、人物Bの音声であるB音声と、を抽出することで、人物Aと人物Bの会話比率を算出できる。この場合、会話比率は、(1)A音声の長さをLa、B音声の長さをLbとしたとき、LaとLbの比率、(2)LaまたはLbの(La+Lb)に対する比率、のいずれかとして算出できる。これにより、会話比率に関する情報をマーケティングデータとして収集して経営戦略に役立てたり、接客スキルのトレーニングに利用したりすることができる。また、本発明を個人で利用することで、個人間の会話スキル(会話テクニック)の向上に役立てることができる。
なお、人物Aと人物Bは必ずしも1の会話取得部(マイクなど)によって取得される必要はなく、2つの会話取得部によって個別に取得しても良い。この場合、音声抽出部は、取得した会話取得部によって、A音声とB音声を区別し、各音声を抽出する。
According to these configurations, the conversation ratio between the person A and the person B can be calculated by extracting the A sound that is the sound of the person A and the B sound that is the sound of the person B from the conversation. In this case, the conversation ratio is either (1) the ratio of La and Lb when the length of the A voice is La and the length of the B voice is Lb, or (2) the ratio of La or Lb to (La + Lb). Can be calculated as As a result, information related to the conversation ratio can be collected as marketing data and used for management strategies, or used for training in customer service skills. Further, by using the present invention individually, it can be used to improve conversation skills (conversation techniques) between individuals.
The person A and the person B are not necessarily acquired by one conversation acquisition unit (such as a microphone), and may be acquired individually by two conversation acquisition units. In this case, the voice extraction unit distinguishes between the A voice and the B voice by the acquired conversation acquisition unit, and extracts each voice.

上記に記載の会話比率算出装置において、人物Aに取り付けられ、当該人物Aが発話したことを検出する発話検出部をさらに備え、音声抽出部は、発話検出部の検出結果に基づいて、会話に含まれる音声が、人物Aの音声であるか人物Bの音声であるかを判別し、当該判別結果に基づいて各音声を抽出することが好ましい。   In the conversation ratio calculation apparatus described above, the speech ratio calculation unit further includes an utterance detection unit that is attached to the person A and detects that the person A uttered, and the voice extraction unit performs conversation based on the detection result of the utterance detection unit. It is preferable to determine whether the included sound is the sound of the person A or the sound of the person B, and extract each sound based on the determination result.

上記に記載の会話比率算出方法において、コンピューターは、人物Aに取り付けられ、当該人物Aが発話したことを検出する発話検出部と接続されており、音声抽出ステップでは、発話検出部の検出結果に基づいて、会話に含まれる音声が、人物Aの音声であるか人物Bの音声であるかを判別し、当該判別結果に基づいて各音声を抽出することが好ましい。   In the conversation ratio calculation method described above, the computer is attached to the person A and connected to an utterance detection unit that detects that the person A uttered, and in the voice extraction step, the detection result of the utterance detection unit is displayed. Based on this, it is preferable to determine whether the voice included in the conversation is the voice of the person A or the voice of the person B, and extract each voice based on the determination result.

これらの構成によれば、発話検出部を用いることで、正確に人物Aの音声と人物Bの音声を判別し、ひいては、より正確に会話比率を算出することができる。
なお、発話検出部としては、例えば、人物の音声が骨や肉を伝わって体表に届く体導音を検出する体導音センサーが挙げられる。この場合、体導音センサーは、頭頚部の体表に装着されることが好ましい。
According to these configurations, by using the utterance detection unit, it is possible to accurately discriminate between the voice of the person A and the voice of the person B, and thus more accurately calculate the conversation ratio.
As the utterance detection unit, for example, a body conduction sensor that detects body conduction sound that a person's voice reaches the body surface through bones and meat can be cited. In this case, it is preferable that the body sound sensor is mounted on the body surface of the head and neck.

上記に記載の会話比率算出装置において、人物Aおよび人物Bは、接客中における店員および顧客を指し、A音声およびB音声は、店員音声および顧客音声を指すことが好ましい。   In the conversation ratio calculation apparatus described above, it is preferable that the person A and the person B indicate a store clerk and a customer who are serving customers, and the A sound and the B sound indicate a store clerk sound and a customer sound.

この構成によれば、店員と顧客の会話から、実際に接客している最中の会話比率に関する情報を収集することができる。   According to this configuration, it is possible to collect information on the conversation ratio during the actual customer service from the conversation between the store clerk and the customer.

上記に記載の会話比率算出装置において、息継ぎのない連続する音声区間を1発話区間、所定時間以上途切れないまま繰り返される店員または顧客の発話区間の集合体を1話し掛け区間、としたとき、店員音声の長さは、店員による話し掛け区間の長さを指し、顧客音声の長さは、顧客による話し掛け区間の長さを指すことが好ましい。   In the conversation ratio calculation apparatus described above, when a continuous speech section without breathing is defined as one utterance section, and a set of clerk or customer utterance sections repeated without interruption for a predetermined time or more is defined as one talk section, the clerk voice Is the length of the talking section by the store clerk, and the length of the customer voice is preferably the length of the talking section by the customer.

この構成によれば、店員と顧客の話し掛け区間の長さに基づいて会話比率を算出できる。また、話し掛け区間は、所定時間以上途切れないまま繰り返される店員または顧客の発話区間の集合体であるため、息継ぎ(ブレス)などによって発話区間が途切れた場合でも、発話区間のインターバルも含めて店員および顧客の話し掛け区間(店員音声の長さおよび顧客音声の長さ)を特定できる。   According to this configuration, the conversation ratio can be calculated based on the length of the talk section between the store clerk and the customer. In addition, since the talk section is a collection of clerk or customer utterance sections that are repeated without interruption for a predetermined time or more, even if the utterance section is interrupted due to breathing, etc. The customer's talking section (the length of the clerk voice and the length of the customer voice) can be specified.

上記に記載の会話比率算出装置において、息継ぎのない連続する音声区間を1発話区間、所定時間以上途切れないまま繰り返される店員または顧客の発話区間の集合体を1話し掛け区間、としたとき、店員音声の長さは、店員による話し掛け区間に含まれる各発話区間の長さの合計を指し、顧客音声の長さは、顧客による話し掛け区間に含まれる各発話区間の長さの合計を指すことが好ましい。   In the conversation ratio calculation apparatus described above, when a continuous speech section without breathing is defined as one utterance section, and a set of clerk or customer utterance sections repeated without interruption for a predetermined time or more is defined as one talk section, the clerk voice Is preferably the total length of each utterance section included in the talk section by the store clerk, and the length of the customer voice is preferably the total length of each utterance section included in the talk section by the customer. .

この構成によれば、店員と顧客の発話区間の長さの合計に基づいて会話比率を算出できる。つまり、息継ぎ(ブレス)などによって発話区間が途切れた場合、そのインターバルを除いて、店員音声の長さおよび顧客音声の長さを特定できる。   According to this configuration, the conversation ratio can be calculated based on the total length of the utterance sections of the store clerk and the customer. That is, when the speech section is interrupted due to breathing or the like, the length of the clerk voice and the length of the customer voice can be specified excluding the interval.

上記に記載の会話比率算出装置において、店員と顧客の話し掛け区間が所定時間以上途切れないまま交互に繰り返される話し掛け区間の集合体を1会話区間としたとき、会話比率算出部は、会話区間に含まれる1以上の話し掛け区間に基づいて、会話区間ごとの会話比率を算出することが好ましい。   In the conversation ratio calculation apparatus described above, when the conversation section of the store clerk and the customer is alternately repeated without interruption for a predetermined time or more as one conversation section, the conversation ratio calculation unit is included in the conversation section. It is preferable to calculate a conversation ratio for each conversation section based on one or more talk sections.

この構成によれば、一連の話し掛け区間の集合体である会話区間ごとに会話比率を算出するため、単位時間ごとに算出する場合と比較して、信頼度の高い会話比率を算出できる。   According to this configuration, since the conversation ratio is calculated for each conversation section that is an aggregate of a series of talk sections, it is possible to calculate a conversation ratio with higher reliability as compared to the case where the conversation ratio is calculated for each unit time.

上記に記載の会話比率算出装置において、所定時間以上途切れないまま繰り返される会話区間の集合体を1接客区間としたとき、会話比率算出部は、接客区間に含まれる各会話区間の会話比率の平均値を、当該接客区間における会話比率として算出することが好ましい。   In the conversation ratio calculation device described above, when a set of conversation sections that are repeated without interruption for a predetermined time or more is defined as one customer service section, the conversation ratio calculation unit calculates the average conversation ratio of each conversation section included in the customer service section. The value is preferably calculated as the conversation ratio in the customer service section.

上記に記載の会話比率算出装置において、店員と顧客の話し掛け区間が所定時間以上途切れないまま交互に繰り返される話し掛け区間の集合体を1会話区間、所定時間以上途切れないまま繰り返される会話区間の集合体を1接客区間、としたとき、会話比率算出部は、接客区間に含まれる、店員による各話し掛け区間の長さの合計または各発話区間の長さの合計であるΣLa(但し、ΣLaはΣLa≧0となる変数)と、顧客による各話し掛け区間の長さの合計または各発話区間の長さの合計であるΣLb(但し、ΣLbはΣLb≧0となる変数)と、を算出し、ΣLaとΣLbの比率、若しくはΣLaまたはΣLbの(ΣLa+ΣLb)に対する比率を、接客区間における会話比率として算出することが好ましい。   In the conversation ratio calculation apparatus described above, a set of conversation sections in which the conversation sections of the store clerk and the customer are alternately repeated without interruption for a predetermined time or more is one conversation section, a collection of conversation sections that are repeated without interruption for a predetermined time or more. Is a customer service section, the conversation ratio calculation unit ΣLa (where ΣLa is ΣLa ≧ Σ), which is the sum of the length of each talk section or the total length of each speech section included in the customer service section ΣLb (where ΣLb is a variable that satisfies ΣLb ≧ 0), and ΣLa and ΣLb Or the ratio of ΣLa or ΣLb to (ΣLa + ΣLb) is preferably calculated as the conversation ratio in the customer service section.

これらの構成によれば、接客区間ごとの会話比率を算出するため、各接客について、総合的に好ましい接客であったか否か(例えば、店員音声の長さ:顧客音声の長さが2:8に近い値となったか否か)を把握できる。この場合、接客区間における会話比率は、(1)接客区間に含まれる各会話区間の会話比率の平均値、(2)接客区間に含まれる、店員による各話し掛け区間の長さの合計をΣLa、顧客による各話し掛け区間の長さの合計をΣLbとした場合の、ΣLaとΣLbの比率、若しくはΣLaまたはΣLbの(ΣLa+ΣLb)に対する比率、(3)接客区間に含まれる、店員による各発話区間の長さの合計をΣLa、顧客による各発話区間の長さの合計をΣLbとした場合の、ΣLaとΣLbの比率、若しくはΣLaまたはΣLbの(ΣLa+ΣLb)に対する比率、のいずれかとして算出できる。   According to these configurations, in order to calculate the conversation ratio for each customer service section, whether or not each customer service is a comprehensive customer service (for example, the length of the clerk voice: the customer voice length is 2: 8). It is possible to grasp whether or not the value is close. In this case, the conversation ratio in the customer service section is (1) the average value of the conversation ratio of each conversation section included in the customer service section, and (2) the sum of the lengths of each talk section by the store clerk included in the customer service section is ΣLa, The ratio of ΣLa and ΣLb or the ratio of ΣLa or ΣLb to (ΣLa + ΣLb) when the total length of each talking section by the customer is ΣLb, (3) the length of each utterance section by the store clerk included in the customer service section ΣLa and ΣLb, or the ratio of ΣLa or ΣLb to (ΣLa + ΣLb), where ΣLa is the total length of utterances by the customer.

本発明の接客データ記録装置は、上記に記載の会話比率算出装置における各部と、会話取得部により取得した会話の当事者である店員および顧客を識別する人物識別部と、人物識別部により識別された店員の顧客に対する売り上げ実績である売り上げ情報を取得する売り上げ情報取得部と、人物識別部により識別された店員および顧客と、会話比率算出部により算出された接客区間における会話比率と、売り上げ情報と、を関連付け、接客データとして記録する接客データ記録部と、を備えたことを特徴とする。   The customer service data recording device of the present invention is identified by each unit in the conversation ratio calculation device described above, a person identifying unit that identifies a clerk and a customer who are parties to the conversation acquired by the conversation acquiring unit, and a person identifying unit A sales information acquisition unit that acquires sales information that is sales results for a customer of the store clerk, a store clerk and a customer identified by the person identification unit, a conversation ratio in the customer service section calculated by the conversation rate calculation unit, sales information, And a customer service data recording unit for recording the data as customer service data.

この構成によれば、会話比率を接客データとして記録することで、これをマーケティングデータとして利用できる。また、接客データには、識別した店員および顧客が関連付けられるため、算出された会話比率が、どの店員のどの顧客に対する接客であったかを特定できる。これにより、個々の店員に対して適切な接客トレーニングを行うことができる。さらに、接客データには、売り上げ情報が関連付けられるため、会話比率と売り上げとの相関関係を把握できる。   According to this configuration, by recording the conversation ratio as customer service data, it can be used as marketing data. In addition, since the identified store clerk and customer are associated with the customer service data, it is possible to specify which store clerk is serving the customer for which customer the calculated conversation ratio. Thereby, appropriate customer service training can be performed for each store clerk. Furthermore, since sales information is associated with the customer service data, the correlation between the conversation ratio and the sales can be grasped.

上記に記載の接客データ記録装置において、会話取得部により取得した会話の接客区間に相当する音声データを録音する音声データ録音部をさらに備え、接客データ記録部は、店員および顧客、会話比率および売り上げ情報に、音声データ録音部の録音データを関連付け、接客データとして記録することが好ましい。   The customer service data recording device described above further includes a voice data recording unit that records voice data corresponding to a customer service section of the conversation acquired by the conversation acquisition unit, wherein the customer data recording unit includes a store clerk and a customer, a conversation ratio, and sales. It is preferable that the information is associated with the recording data of the voice data recording unit and recorded as customer service data.

この構成によれば、接客データには、録音データが関連付けられるため、例えば、好ましい会話比率が関連付けられた録音データを抽出して再生することで、接客トレーニングの教材として利用できる。つまり、会話スキルの高い店員の接客状況を、それ以外の店員に対して効率的に示すことができるため、会話スキルの水平展開に役立つ。   According to this configuration, since the recorded data is associated with the customer service data, for example, the recorded data associated with a preferable conversation ratio can be extracted and played back, and used as a service training material. That is, since the customer service situation of a salesclerk with high conversation skills can be efficiently shown to other salesclerks, it is useful for horizontal development of conversation skills.

上記に記載の接客データ記録装置において、接客区間において、店員の音声と顧客の音声とが重複した回数である重複回数を計測する重複回数計測部をさらに備え、接客データ記録部は、店員および顧客、会話比率および売り上げ情報に、重複回数を関連付け、接客データとして記録することが好ましい。   In the customer service data recording apparatus described above, the customer service data recording unit further includes an overlap count measuring unit that measures the number of times of overlap between the store clerk's voice and the customer's voice in the customer service section. It is preferable to associate the number of duplications with the conversation ratio and the sales information and record it as customer service data.

この構成によれば、接客データには、重複回数が関連付けられるため、会話比率だけでなく、当該重複回数からも、好ましい接客であったか否かを推測できる。一般的に、顧客の音声に店員の音声が被ってしまうと顧客満足度を低下させる要因となると考えられている。このため、重複回数が多い場合は、会話比率が好ましい値であったとしても、好ましい接客ではなかったと判断できる。
なお、会話比率と重複回数とに基づいて、接客点数を算出しても良い。この場合、店員音声の長さと顧客音声の長さの比率が2:8に近いほど接客点数を高くし、重複回数が少ないほど接客点数を高くすることが好ましい。また、接客点数に応じて、好ましい接客であったか否かを判定し、その判定結果や接客点数を、接客データの一部として記録しても良い。
さらに、会話区間または接客区間の終了ごとに、好ましい接客であったか否かの判定結果と、接客点数とを、対象となる店員に対して通知しても良い。この構成によれば、店員が接客中に、好ましい接客を行っているか否かを把握できるため、接客手法の向上が期待できる。
According to this configuration, since the number of times of duplication is associated with the customer service data, it is possible to infer whether or not the customer service is preferable from the number of times of duplication as well as the conversation ratio. In general, it is considered that if the voice of a store clerk is covered with the voice of a customer, it becomes a factor that lowers customer satisfaction. For this reason, when the number of times of duplication is large, even if the conversation ratio is a preferable value, it can be determined that the customer service is not preferable.
The customer service score may be calculated based on the conversation ratio and the number of times of duplication. In this case, it is preferable to increase the number of customer service points as the ratio between the length of the clerk voice and the length of the customer speech is closer to 2: 8, and to increase the customer service score as the number of overlaps decreases. Further, it may be determined whether or not the customer service is preferable according to the number of customer service points, and the determination result and the customer service score may be recorded as a part of the customer service data.
Further, at the end of the conversation section or the customer service section, the determination result as to whether or not the customer service is favorable and the customer service score may be notified to the target store clerk. According to this structure, since it can be grasped | ascertained whether the store clerk is performing the preferable customer service during customer service, improvement of the customer service method can be expected.

上記に記載の接客データ記録装置において、接客データを確認するためのビューアー画面を表示する画面表示部をさらに備え、画面表示部は、店員および/または顧客を識別するための人物識別情報の選択または入力により、当該人物識別情報を含む接客データを抽出して、ビューアー画面に表示することが好ましい。   The customer service data recording apparatus described above further includes a screen display unit that displays a viewer screen for confirming customer service data, wherein the screen display unit selects person identification information for identifying a clerk and / or a customer or It is preferable that the customer service data including the person identification information is extracted by input and displayed on the viewer screen.

この構成によれば、店員および顧客の少なくとも一方を識別するための人物識別情報を検索条件として選択または入力することにより、ビューアー画面上で、所望する接客データを確認することができる。   According to this configuration, desired customer service data can be confirmed on the viewer screen by selecting or inputting person identification information for identifying at least one of a store clerk and a customer as a search condition.

上記に記載の接客データ記録装置において、画面表示部は、抽出した接客データに含まれる録音データの再生操作を行うための再生操作領域を、ビューアー画面に表示することが好ましい。   In the customer service data recording apparatus described above, the screen display unit preferably displays a playback operation area for performing a playback operation of the recorded data included in the extracted customer service data on the viewer screen.

この構成によれば、ビューアー画面に表示された再生操作領域を用いて、録音データを確認することができる。
なお、接客状況を撮像する接客撮像部を備え、その撮像データを、録音データと共に確認できるようにしても良い。この場合、撮像データは、接客データに含めて記録される。また、撮像データとその他のデータとの紐付けは、撮像データから顔認識技術を用いて識別した店員および顧客の識別情報を利用可能である。
According to this configuration, the recorded data can be confirmed using the playback operation area displayed on the viewer screen.
In addition, the customer service imaging part which images a customer service situation may be provided, and the imaging data may be confirmed together with the recording data. In this case, the imaging data is recorded by being included in the customer service data. In addition, associating the imaging data with other data can use the identification information of the clerk and customer identified from the imaging data using the face recognition technology.

上記に記載の接客データ記録装置において、再生操作領域は、再生位置を示すプログレスバーを含み、プログレスバーは、店員による話し掛け区間と、顧客による話し掛け区間と、これら両区間が重複した重複区間と、を区別して表示することが好ましい。   In the customer service data recording apparatus described above, the playback operation area includes a progress bar indicating a playback position, and the progress bar includes a talk section by a store clerk, a talk section by a customer, an overlapping section in which both sections overlap, Are preferably displayed separately.

この構成によれば、プログレスバーの表示から、会話比率や重複回数を一目で推定できる。これにより、店員による話し掛け区間のみの再生や、重複区間のみの再生などを、容易に行うことができる。
なお、「区別して表示する」とは、色分け表示、マーク付加表示、テキスト付加表示など、ユーザーが各区間を識別できるように表示することを指す。
According to this configuration, the conversation ratio and the number of times of duplication can be estimated at a glance from the display of the progress bar. As a result, the store clerk can easily reproduce only the talking section or only the overlapping section.
Note that “display with distinction” refers to display so that the user can identify each section, such as color-coded display, mark addition display, and text addition display.

上記に記載の接客データ記録装置において、画面表示部は、接客データに含まれる会話比率と売り上げ情報との相関関係を図示した相関図を、ビューアー画面に表示することが好ましい。   In the customer service data recording apparatus described above, it is preferable that the screen display unit displays a correlation diagram illustrating a correlation between a conversation ratio included in the customer service data and sales information on the viewer screen.

この構成によれば、ビューアー画面に表示された相関図から、会話比率と売り上げ情報との相関関係を一目で把握できる。つまり、相関図から、対象となる店員、および/または対象となる顧客にとって、会話比率をどの程度にすれば売り上げが向上するかを把握できる。
なお、相関図とは、散布図や点図表などを指す。
According to this configuration, the correlation between the conversation ratio and the sales information can be grasped at a glance from the correlation diagram displayed on the viewer screen. That is, from the correlation diagram, it is possible to grasp how much the sales ratio is improved for the target store clerk and / or the target customer.
Note that the correlation diagram refers to a scatter diagram, a dot diagram, and the like.

本発明のプログラムは、コンピューターに、上記に記載の会話比率算出方法における各ステップを実行させることを特徴とする。   A program according to the present invention causes a computer to execute each step in the conversation ratio calculation method described above.

このプログラムを用いることにより、正確な会話比率を算出可能な会話比率算出方法を実現できる。   By using this program, a conversation ratio calculation method capable of calculating an accurate conversation ratio can be realized.

第1実施形態に係る接客支援システムのシステム構成図である。1 is a system configuration diagram of a customer service support system according to a first embodiment. 店員用端末の制御ブロック図である。It is a control block diagram of the terminal for shop assistants. レシートプリンターの制御ブロック図である。It is a control block diagram of a receipt printer. 管理サーバーの制御ブロック図である。It is a control block diagram of a management server. 発話区間、話し掛け区間、会話区間および接客区間の説明図である。It is explanatory drawing of a speech section, a talk section, a conversation section, and a customer service section. 第1実施形態に係る接客支援システムの機能ブロック図である。It is a functional block diagram of the customer service support system concerning a 1st embodiment. 第1実施形態に係る管理サーバー用データベースの説明図である。It is explanatory drawing of the database for management servers which concerns on 1st Embodiment. 会話比率の算出アルゴリズムを示す図である。It is a figure which shows the calculation algorithm of a conversation ratio. 音声データ管理テーブル、店員発話区間管理テーブル、顧客発話区間管理テーブルの一例を示す図である。It is a figure which shows an example of an audio | voice data management table, a salesclerk utterance area management table, and a customer utterance area management table. 第1実施形態に係る音声データ保存処理を示すフローチャートである。It is a flowchart which shows the audio | voice data preservation | save process which concerns on 1st Embodiment. 第1実施形態に係る接客区間特定処理を示すフローチャートである。It is a flowchart which shows the service area specific process which concerns on 1st Embodiment. 第1実施形態に係る店員話し掛け区間特定処理を示すフローチャートである。It is a flowchart which shows the shop assistant talk area specific process which concerns on 1st Embodiment. 第1実施形態に係る顧客話し掛け区間B特定処理を示すフローチャートである。It is a flowchart which shows the customer talk area B specific process which concerns on 1st Embodiment. 第1実施形態に係る顧客話し掛け区間A特定処理を示すフローチャートである。It is a flowchart which shows the customer talk area A specific process which concerns on 1st Embodiment. 重複回数の計測方法を示す図である。It is a figure which shows the measuring method of the frequency | count of duplication. ビューアー画面(会話比率一覧表)の一例を示す図である。It is a figure which shows an example of a viewer screen (conversation ratio list). ビューアー画面(会話比率−売り上げ実績相関図)の一例を示す図である。It is a figure which shows an example of a viewer screen (conversation ratio-sales performance correlation diagram). 接客点数の算出アルゴリズム、並びに会話比率判定テーブルおよび重複回数判定テーブルを示す図である。It is a figure which shows the calculation algorithm of a customer service score, a conversation ratio determination table, and a duplication count determination table. 第2実施形態に係る接客支援システムの機能ブロック図である。It is a functional block diagram of the customer service support system which concerns on 2nd Embodiment. 第2実施形態に係る管理サーバー用データベースの説明図である。It is explanatory drawing of the database for management servers which concerns on 2nd Embodiment. 顧客満足度の算出アルゴリズムを示す図である。It is a figure which shows the calculation algorithm of customer satisfaction. ビューアー画面(満足度−会話比率一覧表)の一例を示す図である。It is a figure which shows an example of a viewer screen (satisfaction-conversation ratio list). ビューアー画面(満足度−会話比率重ね合わせグラフ)の一例を示す図である。It is a figure which shows an example of a viewer screen (satisfaction-conversation ratio overlay graph). 第3実施形態に係る接客支援システムの機能ブロック図である。It is a functional block diagram of the customer service assistance system which concerns on 3rd Embodiment. 第3実施形態に係る管理サーバー用データベースの説明図である。It is explanatory drawing of the database for management servers which concerns on 3rd Embodiment. 切替検出データの一例を示す図、および接客切替期間のイメージ図である。It is a figure which shows an example of switching detection data, and an image figure of a customer service switching period. 接客会話区間特定結果の一例を示す図、および接客会話区間のイメージ図である。It is a figure which shows an example of a service conversation area specific result, and an image figure of a service conversation section. 接客区間特定パターンAの説明図である。It is explanatory drawing of the service area identification pattern A. 接客区間特定パターンBの説明図である。It is explanatory drawing of the service area specific pattern B. 接客区間特定パターンCの説明図である。It is explanatory drawing of the customer service area specific pattern C. FIG. 接客区間設定の説明図である。It is explanatory drawing of a service area setting.

[第1実施形態]
以下、添付の図面を参照し、本発明の会話比率算出装置、接客データ記録装置、会話比率算出方法およびプログラムについて説明する。なお、以下に示す各実施形態では、本発明の会話比率算出装置を、接客支援システムSYに適用した場合について例示する。当該接客支援システムSYは、小売業、飲食業およびサービス業などに関する店舗や会場内において、人物(顧客,来場者)の音声を取得し、その結果を顧客満足度の向上や接客スキルの向上に生かすべく構築されたものである。そこで、以下の各実施形態では、アパレル店や宝飾品店などの小売店舗内に、接客支援システムSYを導入する場合を例示する。
[First Embodiment]
Hereinafter, a conversation ratio calculation device, a service data recording device, a conversation ratio calculation method, and a program according to the present invention will be described with reference to the accompanying drawings. In each embodiment shown below, the conversation ratio calculation apparatus of the present invention is exemplified for the case where it is applied to the customer service support system SY. The customer service support system SY acquires voices of people (customers, visitors) in stores and venues related to retail, restaurants and service industries, and uses the results to improve customer satisfaction and customer service skills. It was built accordingly. Thus, in each of the following embodiments, a case where the customer service support system SY is introduced into a retail store such as an apparel store or a jewelry store is illustrated.

図1は、第1実施形態に係る接客支援システムSY1のシステム構成図である。同図に示すように、接客支援システムSY1は、店員に装着された体導音センサー1、音声取得用マイク2および店員用端末5と、店舗の入り口および店内各所に配置された店内カメラ11(同図では、1台のみ図示)と、レジカウンター14に設置されたPOS(Point Of Sales)端末12およびレシートプリンター13と、店舗のバックヤードに設置された管理サーバー15および表示端末16と、から成る。なお、請求項におけるコンピューターは、体導音センサー1以外の各装置から成る。   FIG. 1 is a system configuration diagram of a customer service support system SY1 according to the first embodiment. As shown in the figure, the customer service support system SY1 includes a body conduction sound sensor 1, a voice acquisition microphone 2 and a clerk terminal 5 attached to a clerk, and in-store cameras 11 ( In the figure, only one unit is shown), a POS (Point Of Sales) terminal 12 and a receipt printer 13 installed at the checkout counter 14, a management server 15 and a display terminal 16 installed in the backyard of the store. Become. In addition, the computer in a claim consists of each apparatus other than the body-conduction sound sensor 1. FIG.

体導音センサー1は、店員の頭頚部に装着され、店員の音声が骨や肉を伝わって体表に届く体導音を検出する。本実施形態では、音声取得用マイク2により取得された音声が、店員(人物A)のものであるか顧客(人物B)のものであるかを識別するために用いられる。音声取得用マイク2は、店員の制服(胸元近傍)に取り付けられ、店員および顧客の音声を取得する。なお、体導音センサー1および音声取得用マイク2に代えて、店員と顧客に対してそれぞれ指向性を有するマイクを用いても良い。すなわち、店員音声取得用と顧客音声取得用との2つのマイクを使用し、いずれのマイクで取得されたかによって、店員の音声と顧客の音声を識別しても良い。   The body-conducting sound sensor 1 is mounted on the head and neck of the store clerk, and detects the body-conducted sound that the store clerk's voice reaches the body surface through bones and meat. In the present embodiment, the voice acquired by the voice acquisition microphone 2 is used to identify whether it is that of a store clerk (person A) or a customer (person B). The voice acquisition microphone 2 is attached to the clerk's uniform (near the chest) and acquires the clerk's and customer's voices. In place of the body-conducting sound sensor 1 and the voice acquisition microphone 2, microphones having directivity for the store clerk and the customer may be used. In other words, the clerk's voice and the customer's voice may be identified by using two microphones, one for obtaining the clerk's voice and the other for obtaining the customer's voice.

店員用端末5は、店員の制服(ベルトなど)に取り付けられ、専用ケーブルを介して体導音センサー1および音声取得用マイク2と接続されている。また、レシートプリンター13との無線通信機能を有しており、当該レシートプリンター13を介して、管理サーバー15と情報の授受を行う。店内カメラ11は、店内各所の天井や壁に設けられ、来店した顧客、並びに接客中の店員および顧客を撮像する。なお、店内カメラ11としては、CCDカメラやPTZ(Pan Tilt Zoom)カメラを採用可能である。   The store clerk terminal 5 is attached to a store clerk's uniform (belt or the like), and is connected to the body conduction sound sensor 1 and the voice acquisition microphone 2 via a dedicated cable. In addition, it has a wireless communication function with the receipt printer 13, and exchanges information with the management server 15 via the receipt printer 13. The in-store camera 11 is provided on the ceiling and walls of various places in the store, and images customers who have come to the store as well as clerk and customers who are serving customers. As the in-store camera 11, a CCD camera or a PTZ (Pan Tilt Zoom) camera can be used.

POS端末12は、一般的なレジスターの構成を有しており、POSアプリケーションにしたがって会計処理を行う。また、不図示のバーコードスキャナーまたはキーボードから商品コードを取得し、商品マスタ18を参照して、会計レシートR(図3参照)に印刷するためのレシートデータを生成する。なお、商品マスタ18は、POS端末12に接続されたPOSサーバー(図示省略)内に備えても良い。   The POS terminal 12 has a general register configuration, and performs accounting processing according to the POS application. Further, a product code is obtained from a bar code scanner or a keyboard (not shown), and receipt data for printing on the accounting receipt R (see FIG. 3) is generated with reference to the product master 18. The product master 18 may be provided in a POS server (not shown) connected to the POS terminal 12.

レシートプリンター13は、POS端末12と専用ケーブルを介して接続され、POS端末12から取得したレシート印刷データをレシート用紙に印刷する。また、レシートプリンター13は、店員用端末5との無線通信機能および管理サーバー15との有線通信機能を有している。このように、レシートプリンター13を主幹として各種情報の入出力を行うことで(レシートプリンター13が、取得した各種情報をフィルタリングして必要な情報を出力することで)、POS基幹ネットワーク(POS端末12を主幹としたネットワーク)のトラフィックに影響を与えることがない。また、既存のPOSシステムに本発明を適用する際、POS基幹ネットワーク自体の変更が不要となる。   The receipt printer 13 is connected to the POS terminal 12 via a dedicated cable, and prints receipt print data acquired from the POS terminal 12 on receipt paper. The receipt printer 13 has a wireless communication function with the clerk terminal 5 and a wired communication function with the management server 15. In this way, by inputting / outputting various information with the receipt printer 13 as the main (the receipt printer 13 filters the acquired various information and outputs necessary information), the POS backbone network (POS terminal 12). Network) is not affected. Further, when applying the present invention to an existing POS system, it is not necessary to change the POS backbone network itself.

管理サーバー15は、レシートプリンター13と、イントラネット等のネットワーク19を介して接続されており、当該レシートプリンター13を介して、店員用端末5と各種情報の授受を行う。また、店員用端末5から取得した音声データに基づいて、音声データの録音、会話比率の算出および重複回数の計測などを行う。また、管理サーバー15は、算出した会話比率や、録音した音声データを確認するためのビューアー画面D(図16等参照)を、表示端末16の表示画面16aに表示する。   The management server 15 is connected to the receipt printer 13 via a network 19 such as an intranet, and exchanges various information with the clerk terminal 5 via the receipt printer 13. Further, based on the voice data acquired from the clerk terminal 5, the voice data is recorded, the conversation ratio is calculated, and the number of times of duplication is measured. Further, the management server 15 displays the calculated conversation ratio and the viewer screen D (see FIG. 16 and the like) for confirming the recorded voice data on the display screen 16 a of the display terminal 16.

次に、図2ないし図4を参照し、店員用端末5、レシートプリンター13および管理サーバー15のハードウェア構成について説明する。図2は、店員用端末5の制御ブロック図である。店員用端末5は、レシートプリンター13との無線通信機能を実現するための無線LANアンテナ21、無線LANRF(Radio Frequency)部22、無線LAN変復調部23および無線LANベースバンド部24を有している。無線LANベースバンド部24は、店員用端末5を識別するためのMACアドレスを記憶している。また、店員用端末5は、体導音センサー1の検出結果を取得するためのアンプ部28およびA/Dコンバータ29と、音声取得用マイク2から音声データを取得するためのアンプ部32およびA/Dコンバータ33と、を有している。   Next, the hardware configuration of the clerk terminal 5, the receipt printer 13, and the management server 15 will be described with reference to FIGS. FIG. 2 is a control block diagram of the clerk terminal 5. The clerk terminal 5 includes a wireless LAN antenna 21, a wireless LAN RF (Radio Frequency) unit 22, a wireless LAN modem unit 23, and a wireless LAN baseband unit 24 for realizing a wireless communication function with the receipt printer 13. . The wireless LAN baseband unit 24 stores a MAC address for identifying the clerk terminal 5. In addition, the store clerk terminal 5 includes an amplifier unit 28 and an A / D converter 29 for acquiring the detection result of the body conduction sound sensor 1, and an amplifier unit 32 and A for acquiring audio data from the audio acquisition microphone 2. / D converter 33.

また、店員用端末5は、各部の統括制御を行う制御部25と、ファームウェアを初めとする各種データ(音声取得用マイク2から音声データも含む)を記憶するメモリ26と、店員用端末5に電力供給を行うバッテリー34と、を有している。制御部25は、A/Dコンバータ29およびA/Dコンバータ33から取得した検出データおよび音声データに基づいて、店員の発話区間(連続する音声の時間帯)を特定する店員発話区間特定機能と、音声データに基づいて、音声レベルを判定する音声レベル判定機能と、を有している。   The clerk terminal 5 includes a control unit 25 that performs overall control of each unit, a memory 26 that stores various data including the firmware (including voice data from the voice acquisition microphone 2), and a clerk terminal 5. A battery 34 for supplying power. The control unit 25, based on the detection data and the voice data acquired from the A / D converter 29 and the A / D converter 33, a store clerk utterance section specifying function for specifying the clerk's utterance section (continuous voice time zone), A sound level determination function for determining a sound level based on the sound data.

図3は、レシートプリンター13の制御ブロック図である。レシートプリンター13は、店員用端末5との無線通信機能を実現するための無線LANアンテナ41、無線LANRF部42、無線LAN変復調部43および無線LANベースバンド部44を有している。無線LANベースバンド部44は、レシートプリンター13を識別するためのMACアドレスを記憶している。また、レシートプリンター13は、POS端末12からレシートデータが入力される入力インターフェイス部45と、文字パターンを記憶するCG−ROM46と、各部の統括制御を行う制御部47と、印刷ヘッド、ヘッド駆動機構およびレシート用紙搬送機構などを含む印刷機構48と、管理サーバー15と有線LANを介して接続される有線LANインターフェイス部49と、を有している。   FIG. 3 is a control block diagram of the receipt printer 13. The receipt printer 13 includes a wireless LAN antenna 41, a wireless LAN RF unit 42, a wireless LAN modem unit 43, and a wireless LAN baseband unit 44 for realizing a wireless communication function with the clerk terminal 5. The wireless LAN baseband unit 44 stores a MAC address for identifying the receipt printer 13. The receipt printer 13 includes an input interface unit 45 for receiving receipt data from the POS terminal 12, a CG-ROM 46 for storing character patterns, a control unit 47 for performing overall control of each unit, a print head, and a head drive mechanism. And a printing mechanism 48 including a receipt paper transport mechanism, and a wired LAN interface unit 49 connected to the management server 15 via a wired LAN.

制御部47は、所定のコマンドを含むレシートデータの解析や、会計レシートRに印刷するための印刷データの生成などを行うメイン処理部47aと、本実施形態特有の構成であるレシートデータ意味解析部47bと、を有している。レシートデータ意味解析部47bは、レシートデータから、POS端末12の端末番号、レシート番号、商品コード、商品名称、商品単価、金額、オペレーター氏名などを認識し、上位システムとなる管理サーバー15が解釈可能な所定のデータ形式(例えば、XML形式)に変換する。なお、当該レシートデータの認識結果を所定のデータ形式に変換したものを、以下「変換データ」と称する。また、制御部47は、店員用端末5から無線LANを介して受信した音声データ(無線LANベースバンド部44から取得した音声データ)を、有線LANインターフェイス部49を介して、管理サーバー15に転送する。   The control unit 47 includes a main processing unit 47a that performs analysis of receipt data including a predetermined command, generation of print data to be printed on the accounting receipt R, and a receipt data semantic analysis unit that is a configuration unique to the present embodiment. 47b. The receipt data semantic analysis unit 47b recognizes the terminal number of the POS terminal 12, the receipt number, the product code, the product name, the product unit price, the amount of money, the operator name, and the like from the receipt data, and can be interpreted by the management server 15 serving as the host system. To a predetermined data format (for example, XML format). In addition, what converted the recognition result of the receipt data into a predetermined data format is hereinafter referred to as “converted data”. In addition, the control unit 47 transfers the voice data received from the clerk terminal 5 via the wireless LAN (voice data acquired from the wireless LAN baseband unit 44) to the management server 15 via the wired LAN interface unit 49. To do.

図4は、管理サーバー15の制御ブロック図である。管理サーバー15は、レシートプリンター13から、音声データおよび変換データを取得すると共に、店内カメラ11から映像データを取得するための有線LANインターフェイス部51と、表示端末16に各種情報を表示させるための表示処理部52と、マウスやキーボードなどの入力装置55から入力データを取得すると共に各部の統括制御を行う制御部53と、各種情報を記憶する記憶部54と、を有している。制御部53は、取得した音声データに基づいて、接客区間(店員が顧客に対して接客を行っている時間帯)を特定する接客区間特定機能と、接客区間あたりの店員と顧客の会話比率を算出する会話比率算出機能と、接客区間あたりの会話の重複回数を計測する重複回数計測機能と、入力装置55からの情報入力に基づいてビューアー画面D(図16等参照)の表示制御を行うビューアー画面表示制御機能と、を有している。また、記憶部54は、ハードディスクにより実現され、音声抽出プログラムや会話比率算出プログラムなどの各種制御プログラムを記憶する他、後述する管理サーバー用データベースDB1として機能する。   FIG. 4 is a control block diagram of the management server 15. The management server 15 acquires audio data and conversion data from the receipt printer 13 and also displays a wired LAN interface unit 51 for acquiring video data from the in-store camera 11 and a display for displaying various information on the display terminal 16. The processing unit 52 includes a control unit 53 that acquires input data from an input device 55 such as a mouse or a keyboard and performs overall control of each unit, and a storage unit 54 that stores various types of information. Based on the acquired audio data, the control unit 53 determines a customer service section specifying function for specifying a customer service section (a time zone during which the store clerk is serving customers), and a conversation ratio between the customer clerk and the customer per customer service section. A conversation ratio calculation function to be calculated, an overlap count measurement function that measures the number of overlaps of conversation per service section, and a viewer that controls display of the viewer screen D (see FIG. 16 and the like) based on information input from the input device 55 And a screen display control function. The storage unit 54 is realized by a hard disk, and stores various control programs such as a voice extraction program and a conversation ratio calculation program, and also functions as a management server database DB1 described later.

次に、図5を参照し、音声区間の定義について説明する。まず、同一人物(店員または顧客)により連続して発声される音声の区間、つまりブレスなどが入らない1フレーズの区間を「発話区間」と称する。本実施形態では、当該発話区間単位で、感情認識や音声認識を行う。また、図5(a)に示すように、所定時間以上途切れないまま繰り返される店員または顧客の発話区間の集合体を「話し掛け区間」と称する。つまり、インターバルが所定時間X未満となる1以上の発話区間の集合体を言う(但し、XはX>0となる定数)。同図の例は、店員の話し掛け区間(以下、「店員話し掛け区間」と称する)、並びに当該店員の話し掛け区間に前後する2つの顧客の話し掛け区間(以下、「顧客話し掛け区間」と称する)が、全て2つの発話区間から成る場合を示している。   Next, the definition of the voice section will be described with reference to FIG. First, a section of speech continuously uttered by the same person (a store clerk or a customer), that is, a section of one phrase that does not contain a breath or the like is referred to as an “utterance section”. In the present embodiment, emotion recognition and voice recognition are performed for each utterance section. Further, as shown in FIG. 5A, a collection of clerk or customer utterance sections that are repeated without interruption for a predetermined time or longer is referred to as a “talking section”. That is, it refers to a set of one or more utterance sections whose interval is less than the predetermined time X (where X is a constant that satisfies X> 0). In the example shown in the figure, a store clerk talk section (hereinafter referred to as “store clerk talk section”) and two customer talk sections (hereinafter referred to as “customer talk section”) around the store clerk talk section. The case where all are composed of two utterance sections is shown.

また、同じく図5(a)に示すように、店員と顧客の話し掛け区間が所定時間以上途切れないまま交互に繰り返される話し掛け区間の集合体を「会話区間」と称する。つまり、インターバルが所定時間Y未満となる1以上の話し掛け区間の集合体を言う(但し、YはY≧Xとなる定数)。なお、本実施形態では、店員話し掛け区間を中心とした前後の顧客話し掛け区間の集合体(すなわち最低1つ、最大3つの話し掛け区間の集合体)を「1会話パターン」=「1会話区間」と定義する。   Similarly, as shown in FIG. 5A, a group of talking sections in which the talking sections of the store clerk and the customer are alternately repeated without being interrupted for a predetermined time or longer are referred to as “conversation sections”. That is, it refers to an aggregate of one or more talking sections whose interval is less than the predetermined time Y (where Y is a constant satisfying Y ≧ X). In the present embodiment, a group of customer talk sections before and after the store staff talk section (that is, a collection of at least one and up to three talk sections) is expressed as “one conversation pattern” = “one conversation section”. Define.

また、図5(b)に示すように、所定時間以上途切れないまま繰り返される会話区間の集合体を「接客区間」と称する。つまり、インターバルが所定時間Z未満となる1以上の会話区間の集合体を言う(但し、ZはZ>Yとなる定数)。同図の例は、2つの会話区間から成る接客区間1と、3つの会話区間から成る接客区間2と、を示している。このように、接客区間に含まれる会話区間の数は任意である。なお、Zの値は、数分〜数十分程度など、XやYの値と比較して明らかに大きな値とすることが好ましい。   In addition, as shown in FIG. 5B, a collection of conversation sections that are repeated without interruption for a predetermined time or longer is referred to as a “service section”. That is, it refers to an aggregate of one or more conversation sections whose interval is less than the predetermined time Z (where Z is a constant such that Z> Y). The example of the figure shows a service section 1 composed of two conversation sections and a service section 2 composed of three conversation sections. Thus, the number of conversation sections included in the customer service section is arbitrary. Note that it is preferable that the value of Z is obviously large compared to the values of X and Y, such as several minutes to several tens of minutes.

次に、図6および図7を参照し、第1実施形態に係る接客支援システムSY1の機能構成について説明する。図6は、接客支援システムSY1のブロック図である。店内カメラ11は、主な機能構成として、接客撮像部111を有している。接客撮像部111は、店員および顧客を含む接客状況を撮像する。本実施形態において、接客撮像部111は常時撮像を行っており、その映像データは、随時管理サーバー15に出力される。   Next, with reference to FIG. 6 and FIG. 7, the functional configuration of the customer service support system SY1 according to the first embodiment will be described. FIG. 6 is a block diagram of the customer service support system SY1. The in-store camera 11 has a customer service imaging unit 111 as a main functional configuration. The customer service imaging unit 111 captures a customer service situation including a clerk and a customer. In the present embodiment, the customer service imaging unit 111 always performs imaging, and the video data is output to the management server 15 as needed.

体導音センサー1は、主な機能構成として、発話検出部101を有している。発話検出部101は、体導音に基づいて、店員が発話したこと、およびその発話区間を検出する。音声取得用マイク2は、主な機能構成として、会話取得部102を有している。会話取得部102は、店員および顧客の会話に基づく音声(音声信号)を取得する。店員用端末5は、主な機能構成として、音声データ送信部105を有している。音声データ送信部105は、音声レベル判定機能にあるパワーフィルターにより音声の有無を判定し、所定の音声レベル以上(例えば、アンプ増幅後1.5v以上など)の音声データを管理サーバー15に送信する。また、発話検出部101の検出結果および会話取得部102の音声取得結果に基づいて店員発話区間を特定し(店員発話区間特定機能)、当該店員発話区間の発生を管理サーバー15に通知する。なお、店員用端末5と管理サーバー15は、レシートプリンター13を介して通信を行う。   The body sound sensor 1 has an utterance detection unit 101 as a main functional configuration. The utterance detection unit 101 detects that the clerk uttered and the utterance section based on the body conduction sound. The voice acquisition microphone 2 has a conversation acquisition unit 102 as a main functional configuration. The conversation acquisition unit 102 acquires sound (voice signal) based on the conversation between the store clerk and the customer. The clerk terminal 5 has an audio data transmission unit 105 as a main functional configuration. The audio data transmission unit 105 determines the presence / absence of audio using a power filter in the audio level determination function, and transmits audio data of a predetermined audio level or higher (for example, 1.5 v or higher after amplifier amplification) to the management server 15. . Further, the store clerk utterance section is specified based on the detection result of the utterance detection unit 101 and the voice acquisition result of the conversation acquisition unit 102 (store clerk utterance section specifying function), and the management server 15 is notified of the occurrence of the clerk utterance section. Note that the clerk terminal 5 and the management server 15 communicate via the receipt printer 13.

レシートプリンター13は、主な機能構成として、変換データ送信部113を有している。変換データ送信部113は、POS端末12から出力されたレシートデータをXML形式に変換した変換データを、管理サーバー15に送信する。   The receipt printer 13 has a conversion data transmission unit 113 as a main functional configuration. The conversion data transmission unit 113 transmits the conversion data obtained by converting the receipt data output from the POS terminal 12 into the XML format to the management server 15.

管理サーバー15は、主な機能構成として、映像記録部151、人物識別部152、音声データ録音部153、音声抽出部154、会話比率算出部155、重複回数計測部156、変換データ取得部157、接客データ記録部158、画面表示部159および管理サーバー用データベースDB1を有している。   The management server 15 includes a video recording unit 151, a person identification unit 152, a voice data recording unit 153, a voice extraction unit 154, a conversation ratio calculation unit 155, a duplication count measurement unit 156, a converted data acquisition unit 157, as main functional configurations. A service data recording unit 158, a screen display unit 159, and a management server database DB1 are provided.

映像記録部151は、接客撮像部111から、映像データを取得し、これを管理サーバー用データベースDB1に記録する。人物識別部152は、映像データに含まれる顔特徴量に基づいて店員および顧客を識別する。例えば、店員については、予め店員識別情報と店員の顔特徴量とを関連付けて管理サーバー用データベースDB1内に記憶しておく(図7の店員情報記憶部82参照)。また、店内カメラ11の撮像結果を解析して顔検出を行い、検出した当該顔部分の画像を正規化して算出された顔特徴量と、管理サーバー用データベースDB1に記憶されている店員の顔特徴量とを照合し、それらの中から最も類似度の高い店員であると判定する。同様に、顧客についても、予め顧客識別情報と顧客の顔特徴量とを関連付けて管理サーバー用データベースDB1内に記憶しておき(図7の顧客情報記憶部81参照)、算出された顧客の顔特徴量と、管理サーバー用データベースDB1に記憶されている多数の顧客の顔特徴量とを照合し、それらの中から最も類似度の高い顧客であると判定する。なお、人物識別部152の識別結果である店員識別情報と顧客識別情報は紐付けされ、後述する接客データ記憶部88に記憶される。   The video recording unit 151 acquires video data from the customer service imaging unit 111 and records it in the management server database DB1. The person identifying unit 152 identifies a store clerk and a customer based on the facial feature amount included in the video data. For example, for a clerk, the clerk identification information and the clerk's facial feature quantity are associated in advance and stored in the management server database DB1 (see the clerk information storage unit 82 in FIG. 7). In addition, the face detection is performed by analyzing the imaging result of the in-store camera 11, the face feature amount calculated by normalizing the detected image of the face portion, and the face feature of the clerk stored in the management server database DB1. The amount is collated, and it is determined that the salesclerk has the highest similarity among them. Similarly, for the customer, the customer identification information and the facial feature amount of the customer are associated with each other and stored in the management server database DB1 (see the customer information storage unit 81 in FIG. 7), and the calculated customer face is stored. The feature quantity is compared with the face feature quantities of many customers stored in the management server database DB1, and it is determined that the customer has the highest similarity among them. Note that the clerk identification information and customer identification information, which are the identification results of the person identification unit 152, are linked and stored in the customer service data storage unit 88 described later.

音声データ録音部153は、店員と顧客の会話、すなわち音声データ送信部105から送信された音声データを録音する(管理サーバー用データベースDB1に記録する)。音声抽出部154は、取得した会話(音声データ)から、店員音声と顧客音声をそれぞれ抽出する。具体的には、発話検出部101の検出結果に基づいて、会話に含まれる音声が店員音声であるか顧客音声であるかを判別し、当該判別結果に基づいて各音声を抽出する。なお、各音声は、発話区間単位または話し掛け区間単位で抽出する。詳細については後述する。   The voice data recording unit 153 records the conversation between the store clerk and the customer, that is, the voice data transmitted from the voice data transmission unit 105 (records in the management server database DB1). The voice extraction unit 154 extracts a clerk voice and a customer voice from the acquired conversation (voice data). Specifically, based on the detection result of the utterance detection unit 101, it is determined whether the voice included in the conversation is a store clerk voice or a customer voice, and each voice is extracted based on the determination result. Each voice is extracted in units of utterance sections or talk sections. Details will be described later.

会話比率算出部155は、制御部53の会話比率算出機能を指すものであり、店員と顧客の会話比率を算出する。具体的には、会話区間ごとに会話比率を算出し、当該会話区間ごとの算出結果に基づいて、接客区間ごとの会話比率(平均会話比率)を算出する。算出された会話比率は、接客データの一部として、接客データ記憶部88に記憶される。なお、会話比率の算出アルゴリズムについては後述する。   The conversation ratio calculation unit 155 indicates the conversation ratio calculation function of the control unit 53, and calculates the conversation ratio between the store clerk and the customer. Specifically, the conversation ratio is calculated for each conversation section, and the conversation ratio (average conversation ratio) for each service section is calculated based on the calculation result for each conversation section. The calculated conversation ratio is stored in the customer service data storage unit 88 as part of the customer service data. The conversation ratio calculation algorithm will be described later.

重複回数計測部156は、制御部53の重複回数計測機能を指すものであり、接客区間において、店員の音声と顧客の音声とが重複した回数(重複区間の個数)である重複回数を計測する。計測された重複回数は、接客データの一部として、接客データ記憶部88に記憶される。なお、重複区間の検出方法および重複区間の計測方法についても後述する。   The overlap number measurement unit 156 indicates the overlap number measurement function of the control unit 53, and measures the number of overlaps, which is the number of times that the clerk's voice and the customer's voice are overlapped in the customer service section (number of overlap sections). . The measured number of overlaps is stored in the customer service data storage unit 88 as part of the customer service data. An overlapping section detection method and an overlapping section measurement method will also be described later.

変換データ取得部157は、レシートプリンター13の変換データ送信部113から送信された変換データを取得し、管理サーバー用データベースDB1に記録する。なお、変換データは、上記の接客データの一部として記録する、売り上げ情報を得るために用いられる。なお、変換データの記録は、変換データに含まれる情報の中から、顧客識別情報(会員番号など)、レシート番号(売り上げNo.)および合計金額など、売り上げの有無や売り上げ金額を特定可能な情報のみを抽出し、これを売り上げ情報として記録しても良いし、変換データの全てを管理サーバー用データベースDB1に記録しても良い。   The conversion data acquisition unit 157 acquires the conversion data transmitted from the conversion data transmission unit 113 of the receipt printer 13 and records it in the management server database DB1. The converted data is used to obtain sales information recorded as a part of the customer service data. The conversion data is recorded in the information included in the conversion data, such as customer identification information (membership number, etc.), receipt number (sales No.), total amount, etc. that can specify the presence or absence of sales and the sales amount. May be extracted and recorded as sales information, or all of the conversion data may be recorded in the management server database DB1.

接客データ記録部158は、接客区間ごとに、人物識別部152の識別結果である店員識別情報および顧客識別情報、並びに会話比率算出部155の算出結果などを含む接客データを紐付けして、管理サーバー用データベースDB1に記録する。なお、顧客識別情報および店員識別情報は、上記のとおり顔特徴量から特定される。また、店員識別情報と、店員用端末5のMACアドレスとは、対応付けて記憶されており(図7の店員情報記憶部82参照)、管理サーバー15が取得した映像データと音声データの紐付けができるようになっている。   The customer service data recording unit 158 associates and manages customer service data including the clerk identification information and customer identification information, which are identification results of the person identification unit 152, and the calculation result of the conversation ratio calculation unit 155, for each customer service section. Record in the server database DB1. Note that the customer identification information and the clerk identification information are specified from the face feature amount as described above. Further, the clerk identification information and the MAC address of the clerk terminal 5 are stored in association with each other (see the clerk information storage unit 82 in FIG. 7), and the video data acquired by the management server 15 is associated with the audio data. Can be done.

画面表示部159は、記録した接客データを確認するためのビューアー画面D(図16等参照)を表示画面16a上に表示する。なお、ビューアー画面Dについても、具体例を挙げて後に詳述する。   The screen display unit 159 displays a viewer screen D (see FIG. 16 and the like) for confirming the recorded customer service data on the display screen 16a. The viewer screen D will be described in detail later with a specific example.

図7は、第1実施形態に係る管理サーバー用データベースDB1の説明図である。管理サーバー用データベースDB1は、顧客情報記憶部81、店員情報記憶部82、音声データ記憶部83、映像データ記憶部84、音声データ管理テーブル85、店員発話区間管理テーブル86、顧客発話区間管理テーブル87および接客データ記憶部88として機能する。なお、管理サーバー用データベースDB1は、店舗ごとに設けても良いし、複数店舗で共有しても良い。   FIG. 7 is an explanatory diagram of the management server database DB1 according to the first embodiment. The management server database DB1 includes a customer information storage unit 81, a clerk information storage unit 82, an audio data storage unit 83, a video data storage unit 84, an audio data management table 85, a clerk utterance section management table 86, and a customer utterance section management table 87. And functions as a customer service data storage unit 88. The management server database DB1 may be provided for each store, or may be shared by a plurality of stores.

顧客情報記憶部81は、顧客識別情報(顧客IDなど)と、顧客の顔特徴量と、顧客データ(氏名、住所、電話番号、生年月日、性別などの個人情報を含む)と、を関連付けて記憶する。また、店員情報記憶部82は、店員識別情報(店員IDなど)と、店員の顔特徴量と、店員用端末5のMACアドレスと、を関連付けて記憶する。また、音声データ記憶部83は、音声データ録音部153により常時録音された音声データをタイムスタンプと共に記憶する。また、映像データ記憶部84は、接客撮像部111により常時撮像された映像データをタイムスタンプと共に記憶する。   The customer information storage unit 81 associates customer identification information (customer ID and the like), customer face feature amounts, and customer data (including personal information such as name, address, telephone number, date of birth, and sex). Remember. The store clerk information storage unit 82 stores store clerk identification information (store clerk ID, etc.), the store clerk's facial feature quantity, and the MAC address of the store clerk terminal 5 in association with each other. Also, the voice data storage unit 83 stores the voice data always recorded by the voice data recording unit 153 together with a time stamp. In addition, the video data storage unit 84 stores video data always captured by the customer service imaging unit 111 together with a time stamp.

また、音声データ管理テーブル85は、店員と顧客を区別することなく、取得した音声データを、連続する音声の区間(以下、「連続発話区間」と称する)ごとに記録したテーブルである(図9(a)参照))。また、店員発話区間管理テーブル86は、店員の発話区間を記録したテーブルである(図9(b)参照)。また、顧客発話区間管理テーブル87は、顧客の発話区間を記録したテーブルである(図9(c)参照)。   The voice data management table 85 is a table in which the acquired voice data is recorded for each continuous voice section (hereinafter referred to as “continuous speech section”) without distinguishing between the store clerk and the customer (FIG. 9). (See (a))). Further, the store clerk utterance section management table 86 is a table in which store section utterance sections are recorded (see FIG. 9B). The customer utterance section management table 87 is a table in which customer utterance sections are recorded (see FIG. 9C).

また、接客データ記憶部88は、人物識別部152の識別結果である顧客識別情報および店員識別情報と、音声データ記憶部83に記憶された音声データのうち、接客区間分の音声データに相当する録音データと、映像データ記憶部84に記憶された映像データのうち、接客区間分の映像データに相当する撮像データと、会話比率算出部155の算出結果である、当該接客区間の会話比率と、重複回数計測部156の計測結果である、当該接客区間の重複回数と、当該接客による(接客区間内または接客区間終了後所定時間以内に発生した)売り上げの有無および売り上げ金額を示す売り上げ情報と、接客日並びに接客開始時刻および接客終了時刻を示す接客日時と、を関連付けて記憶する。なお、売り上げ情報については、精算場所に設置された店内カメラ11により撮影された顧客の映像から算出された顧客の顔特徴量と、予め管理サーバー用データベースDB1内に記憶されている多数の顧客の顔特徴量とを照合し、それらの中から最も類似度の高い顧客の顧客識別情報によって、紐付けされる接客データを特定可能である。また、レシートプリンター13から送信された変換データに含まれる顧客識別情報によって、紐付けされる接客データを特定することも可能である。また、変換データに店員識別情報(オペレーター氏名または店員番号など)が含まれる場合は、顧客識別情報および店員識別情報の両方が合致する接客データに、紐付けされることが好ましい。   The customer service data storage unit 88 corresponds to the customer identification information and the clerk identification information, which are identification results of the person identification unit 152, and the voice data for the customer service section among the voice data stored in the voice data storage unit 83. Among the recorded data and the video data stored in the video data storage unit 84, the imaging data corresponding to the video data for the service section, and the conversation ratio of the service section, which is the calculation result of the conversation ratio calculation unit 155, The number of times of overlap of the customer service section, which is a measurement result of the overlap number measuring unit 156, the sales information indicating the presence or absence of sales by the customer service (generated within the customer service section or within a predetermined time after the end of the customer service section), and the sales amount, A customer service date and a customer service date and time indicating a customer service start time and a customer service end time are stored in association with each other. As for the sales information, the customer's facial feature amount calculated from the customer's video imaged by the in-store camera 11 installed at the checkout location and a large number of customer's information stored in the management server database DB1 in advance. It is possible to identify the customer service data to be associated with the customer identification information of the customer having the highest similarity from the facial feature amounts. It is also possible to specify customer service data to be associated with the customer identification information included in the conversion data transmitted from the receipt printer 13. When the converted data includes store clerk identification information (such as operator name or store clerk number), it is preferably linked to customer service data that matches both customer identification information and store clerk identification information.

次に、図8を参照し、各種会話比率の算出アルゴリズム(計算式)について説明する。図8(a)に示すように、会話区間における会話比率としては、「店員:顧客の相対会話比率」、「店員の会話比率」および「顧客の会話比率」の3つのパターンを算出可能である。例えば、「店員:顧客の相対会話比率」は、会話区間に含まれる各店員話し掛け区間の長さの合計をLa、会話区間に含まれる各顧客話し掛け区間の長さの合計をLbとしたとき、La:Lbの値を指す。また、「店員の会話比率」は、La/(La+Lb)の値を指し、顧客の会話比率は、「Lb/(La+Lb)」の値を指す。ここで、「話し掛け区間の長さ」とは、話し掛け区間の開始時刻から終了時刻までの長さを言う。   Next, various conversation ratio calculation algorithms (calculation formulas) will be described with reference to FIG. As shown in FIG. 8A, as the conversation ratio in the conversation section, three patterns of “store clerk: customer relative conversation ratio”, “store clerk conversation ratio”, and “customer conversation ratio” can be calculated. . For example, “relative conversation ratio of clerk: customer” is expressed as follows: La is the total length of each clerk talk section included in the conversation section, and Lb is the total length of each customer talk section included in the conversation section. La: Refers to the value of Lb. “Conversation ratio of store clerk” indicates a value of La / (La + Lb), and conversation ratio of a customer indicates a value of “Lb / (La + Lb)”. Here, “the length of the talking section” refers to the length from the start time to the end time of the talking section.

なお、Laを、会話区間に含まれる各店員発話区間の長さの合計として規定しても良い。つまり、図5(a)に示すように、話し掛け区間には、インターバルXが含まれる場合があるが、そのインターバルの長さを差し引いた長さとしてLaを規定しても良い。例えば、図5(a)に示す顧客話し掛け区間Aの場合、Laは、発話区間1の開始時刻から終了時刻までの長さと、発話区間2の開始時刻から終了時刻までの長さの合計となる。Lbについても同様である。   Note that La may be defined as the total length of each clerk utterance section included in the conversation section. That is, as shown in FIG. 5A, the talk section may include the interval X, but La may be defined as a length obtained by subtracting the length of the interval. For example, in the case of the customer talk section A shown in FIG. 5A, La is the sum of the length from the start time to the end time of the utterance section 1 and the length from the start time to the end time of the utterance section 2. . The same applies to Lb.

一方、図8(b)に示すように、接客区間における会話比率は、接客区間に含まれる各会話区間の会話比率の平均値によって算出可能である。なお、各会話区間の会話比率の平均値に代えて、最高値、最低値、中間値などの各種統計量を、接客区間における会話比率として算出しても良い。また、接客区間における会話比率も、会話区間における会話比率(図8(a)参照)としてどのパターンを採用したかに応じて、「店員:顧客の相対会話比率」、「店員の会話比率」および「顧客の会話比率」の3つのパターンを算出可能である。   On the other hand, as shown in FIG. 8B, the conversation ratio in the customer service section can be calculated by the average value of the conversation ratios in the respective conversation sections included in the customer service section. Note that various statistics such as the maximum value, the minimum value, and the intermediate value may be calculated as the conversation ratio in the customer service section instead of the average value of the conversation ratio in each conversation section. Further, the conversation ratio in the customer service section also depends on which pattern is adopted as the conversation ratio in the conversation section (see FIG. 8A), and the “relative conversation ratio of the clerk: customer”, “conversation ratio of the clerk” and Three patterns of “customer conversation ratio” can be calculated.

また、接客区間における会話比率の算出方法の変形例として、図8(c)のアルゴリズムを用いても良い。この場合、「店員:顧客の相対会話比率」は、接客区間に含まれる各店員話し掛け区間の長さの合計をΣLa、接客区間に含まれる各顧客話し掛け区間の長さの合計をΣLbとしたとき、ΣLa:ΣLbの値を指す。また、「店員の会話比率」は、ΣLa/(ΣLa+ΣLb)の値を指し、「顧客の会話比率」は、ΣLb/(ΣLa+ΣLb)の値を指す。   Moreover, you may use the algorithm of FIG.8 (c) as a modification of the calculation method of the conversation ratio in a service area. In this case, the “relative conversation ratio of store clerk: customer” is the sum of the lengths of the talker sections included in the customer service section is ΣLa, and the total length of the customer talk sections included in the customer service section is ΣLb. , ΣLa: refers to the value of ΣLb. Further, “the clerk conversation ratio” indicates a value of ΣLa / (ΣLa + ΣLb), and “customer conversation ratio” indicates a value of ΣLb / (ΣLa + ΣLb).

なお、Laを、会話区間に含まれる各店員発話区間の長さの合計として規定したのと同様に、ΣLaを、接客区間に含まれる各店員発話区間の長さの合計として規定しても良い。ΣLbについても同様である。   Note that ΣLa may be defined as the total length of each clerk utterance section included in the customer service section in the same manner as La is defined as the total length of each clerk utterance section included in the conversation section. . The same applies to ΣLb.

次に、図9を参照し、音声データ管理テーブル85、店員発話区間管理テーブル86および顧客発話区間管理テーブル87について説明する。図9(a)は、音声データ管理テーブル85の一例を示す図である。音声データ管理テーブル85は、店員と顧客の音声を区別しない連続する音声の区間である連続発話区間(少なくとも1の発話区間が含まれる区間)ごとに付与される「音声データNo.」と、連続発話区間の開始時間に相当する「録音開始時間」と、連続発話区間の終了時間に相当する「録音終了時間」と、顧客の発声に基づく音声データか、店員の発声に基づく音声データか、または両方の発声に基づく音声データかを示す「重複フラグ」と、音声データを保存する「音声データ保存先アドレス」と、を関連付けたものである。例えば、「音声データNo.:201」の音声データは、12時36分03秒を開始時間とし12時36分16秒を終了時間とする連続発話区間であり、少なくとも一部の区間において、顧客の音声と店員の発声が重複していることを示している。   Next, the voice data management table 85, the clerk utterance section management table 86, and the customer utterance section management table 87 will be described with reference to FIG. FIG. 9A shows an example of the audio data management table 85. The voice data management table 85 includes “voice data No.” continuously assigned to each continuous utterance section (section including at least one utterance section) which is a continuous voice section that does not distinguish between the clerk and the customer's voice. “Recording start time” corresponding to the start time of the utterance section and “Recording end time” corresponding to the end time of the continuous utterance section and voice data based on the customer's utterance or voice data based on the clerk's utterance, or The “duplicate flag” indicating whether the voice data is based on both utterances and the “voice data storage destination address” for storing the voice data are associated with each other. For example, the voice data of “voice data No .: 201” is a continuous utterance section having a start time of 12:36:03 and an end time of 12:36:16. Indicates that the clerk ’s voice and the clerk ’s voice overlap.

図9(b)は、店員発話区間管理テーブル86の一例を示す図である。店員発話区間管理テーブル86は、店員発話区間ごとに付与される「店員発話No.」と、店員発話区間の開始時間である「店員発話開始時間」と、店員発話区間の終了時間である「店員発話終了時間」と、どの店員話し掛け区間に属するかを示す「話し掛けNo.」と、顧客の発声との重複区間の開始時間である「重複開始時間」と、顧客の発声との重複区間の終了時間である「重複終了時間」と、を関連付けたものである。例えば、「店員発話No.:100」と「店員発話No.:101」の発話区間は、インターバルが所定時間X(例えば、3秒)未満であるため、一連の話し掛け区間と看做され、同一の話し掛けNo.が付加されている。また、「店員発話No.:100」の発話区間は、その区間全体が顧客の発声と重複していることを示している。   FIG. 9B is a diagram showing an example of the store clerk utterance section management table 86. The clerk utterance section management table 86 includes a “clerk utterance number” assigned to each clerk utterance section, a “clerk utterance start time” that is the start time of the clerk utterance section, and a “clerk clerk utterance section end time” End of the overlapping section of "Speech end time", "Speaking No." indicating which store clerk talk section belongs to, "Overlapping start time" which is the start time of overlapping section with customer utterance, and customer utterance The “duplication end time”, which is the time, is associated with each other. For example, the utterance sections of “Clerk utterance No .: 100” and “Clerk utterance No .: 101” are regarded as a series of talk sections because the interval is less than a predetermined time X (for example, 3 seconds), and are the same. Talk No. Is added. Further, the utterance section of “clerk utterance number: 100” indicates that the entire section overlaps with the customer's utterance.

図9(c)は、顧客発話区間管理テーブル87の一例を示す図である。顧客発話区間管理テーブル87は、顧客発話区間ごとに付与される「顧客発話No.」と、顧客発話区間の開始時間である「顧客発話開始時間」と、顧客発話区間の終了時間である「顧客発話終了時間」と、どの顧客話し掛け区間に属するかを示す「話し掛けNo.」と、店員の発声との重複区間の開始時間である「重複開始時間」と、店員の発声との重複区間の終了時間である「重複終了時間」と、を関連付けたものである。例えば、「顧客発話No.:101」と「顧客発話No.:102」の発話区間は、インターバルが所定時間X(例えば、3秒)を超えているため、異なる話し掛け区間と看做され、異なる話し掛けNo.が付与されている。また、「顧客発話No.:100」の発話区間は、13秒の区間長さのうち6秒間が店員の発声と重複していることを示している。   FIG. 9C is a diagram illustrating an example of the customer utterance section management table 87. The customer utterance section management table 87 includes “customer utterance No.” given to each customer utterance section, “customer utterance start time” which is the start time of the customer utterance section, and “customer utterance section end time”. End of the overlapping section of the “speech end time”, “speaking No.” indicating which customer speaking section it belongs to, “duplication start time” which is the start time of the overlapping section with the clerk utterance, and the clerk utterance The “duplication end time”, which is the time, is associated with each other. For example, the utterance sections of “customer utterance No .: 101” and “customer utterance No .: 102” are regarded as different talk sections because the intervals exceed a predetermined time X (for example, 3 seconds). Talk No. Is granted. Further, the utterance section of “customer utterance No .: 100” indicates that 6 seconds out of the section length of 13 seconds overlaps with the clerk's utterance.

次に、図10のフローチャートを参照し、音声データ保存処理について説明する。なお、上記のとおり、店員用端末5と管理サーバー15は、レシートプリンター13を介して通信を行うが、レシートプリンター13は単に情報を経由しているだけなので、図示を省略する。   Next, the audio data storing process will be described with reference to the flowchart of FIG. As described above, the clerk terminal 5 and the management server 15 communicate with each other via the receipt printer 13, but the illustration is omitted because the receipt printer 13 simply passes information.

店員用端末5(制御部25)は、音声取得用マイク2から音声信号(音声)を取得すると(S11)、音声レベル判定機能のパワーフィルターにより音声レベルを判定する(S12)。ここで、音声レベルが所定レベル以上の場合、音声「有」と判定し、メモリ26内の音声データ保存領域(図示省略)に音声データのバッファリングを開始する(S13)。また、このとき、音声データ保存領域に録音開始時間を記録する。   When the store clerk terminal 5 (control unit 25) acquires an audio signal (audio) from the audio acquisition microphone 2 (S11), the audio level is determined by the power filter of the audio level determination function (S12). Here, if the audio level is equal to or higher than the predetermined level, it is determined that the audio is “present”, and buffering of the audio data is started in the audio data storage area (not shown) in the memory 26 (S13). At this time, the recording start time is recorded in the audio data storage area.

続いて、音声信号を受信しなくなると、録音終了時間を確定して音声データ保存領域に記録すると共に、バッファリングを終了する(S14)。その後、管理サーバー15に対して、音声データの送信を宣言し(S15)、音声データ保存領域にバッファリングされた音声データを、録音開始時間および録音終了時間と共に送信する(S16)。   Subsequently, when no audio signal is received, the recording end time is determined and recorded in the audio data storage area, and the buffering is ended (S14). Thereafter, transmission of audio data is declared to the management server 15 (S15), and the audio data buffered in the audio data storage area is transmitted together with the recording start time and recording end time (S16).

管理サーバー15(制御部53)は、店員用端末5から音声データを受信すると(S17)、音声データ管理テーブル85(図9(a)参照)に、一意に定めた音声データNo.と、録音開始時間および録音終了時間を登録する(S18)。また、音声データ管理テーブル85で指定された音声データ保存先(所定のフォルダ)に、音声データを保存する(S19)。   When the management server 15 (control unit 53) receives the voice data from the store clerk terminal 5 (S17), the voice data No. uniquely determined in the voice data management table 85 (see FIG. 9A) is obtained. Then, the recording start time and recording end time are registered (S18). Also, the audio data is stored in the audio data storage destination (predetermined folder) designated in the audio data management table 85 (S19).

次に、図11ないし図14のフローチャートを参照し、接客区間特定処理の一連の流れについて説明する。図11は、メイン処理(接客区間特定処理)を示すフローチャートであり、図12ないし図14は、そのサブルーチンを示すフローチャートである。図11に示すように、管理サーバー15(制御部53)は、まず店員話し掛け区間を特定した後(S21)、店員話し掛け区間の後に発生した顧客話し掛け区間Bを特定する(S22)と共に、店員話し掛け区間の前に発生した顧客話し掛け区間Aを特定する(S23)。その後、これらS21〜S23の工程により特定された話し掛け区間に基づいて、会話区間を特定する(S24,図5(a)参照)。また、S21〜S24の工程を繰り返すことにより、接客区間を特定する(S25,図5(b)参照)。   Next, with reference to the flowcharts of FIGS. 11 to 14, a series of flow of the service area identification process will be described. FIG. 11 is a flowchart showing the main process (service section identification process), and FIGS. 12 to 14 are flowcharts showing the subroutine. As shown in FIG. 11, the management server 15 (control unit 53) first specifies a store clerk talk section (S21), then specifies a customer talk section B that occurs after the store clerk talk section (S22), and also stores the store clerk talk. The customer talk section A that occurred before the section is specified (S23). Thereafter, a conversation section is specified based on the conversation section specified by the steps S21 to S23 (see S24, FIG. 5A). Further, by repeating the steps S21 to S24, the customer service section is specified (S25, see FIG. 5B).

次に、図12のフローチャートを参照し、図11のS21に相当する店員話し掛け区間特定処理について説明する。店員用端末5は、体導音センサー1からその検出データを取得すると(S31)、店員発話区間特定機能のパワーフィルターにより検出レベルを判定し、所定レベル以上の場合、その検出時間を店員発話開始時間として確定し、メモリ26内に記録する(S32)。続いて、店員発話区間特定機能のパワーフィルターにより検出レベルを判定し、一定時間以上所定レベル未満の状態が保持された場合(無信号区間が発生した場合)、所定レベル以上の検出レベルがあった最後の検出時間を店員発話区間終了時間として確定し、メモリ26内に記録する(S33)。その後、管理サーバー15に対して、店員発話区間の発生通知を行う(S34)。このとき、メモリ26内に記録されている店員発話開始時間および店員発話終了時間も送信する。   Next, with reference to the flowchart of FIG. 12, the clerk talk section specifying process corresponding to S21 of FIG. 11 will be described. When the clerk terminal 5 acquires the detection data from the body conduction sound sensor 1 (S31), the clerk terminal section determines the detection level by the power filter of the clerk utterance section specifying function. The time is determined and recorded in the memory 26 (S32). Subsequently, when the detection level is determined by the power filter of the store clerk utterance section specifying function and the state below the predetermined level is maintained for a certain period of time (when no signal section occurs), the detection level is above the predetermined level. The last detection time is determined as the clerk utterance section end time and recorded in the memory 26 (S33). Thereafter, the management server 15 is notified of the occurrence of the clerk utterance section (S34). At this time, the clerk utterance start time and the clerk utterance end time recorded in the memory 26 are also transmitted.

一方、管理サーバー15(制御部53)は、店員用端末5から店員発話区間の発生通知を受信すると(S35)、店員発話区間管理テーブル86(図9(b)参照)に、一意に定めた店員発話データNo.と、店員話し掛け区間ごとに定めた店員話し掛けNo.と、店員発話開始時間および店員発話終了時間を登録する(S36)。その後、所定時間内に次の店員発話区間の発生通知を受信したか否かを判別し(S37)、受信した場合は(S37:Yes)、一意に定めた店員発話データNo.と、上記と同じ店員話し掛けNo.と、店員発話開始時間および店員発話終了時間を登録する(S36)。これにより、前に発生した店員発話区間と今回発生した店員発話区間とを、一連の話し掛け区間として定義することができる。なお、所定時間内に次の店員発話区間の発生通知を受信しなかった場合は(S37:No)、店員による一連の話し掛け区間が終了したとして、処理を終了する。   On the other hand, when the management server 15 (control unit 53) receives the notification of the occurrence of the clerk utterance section from the clerk terminal 5 (S35), it is uniquely determined in the clerk utterance section management table 86 (see FIG. 9B). Sales clerk utterance data No. And the clerk talk number set for each clerk talk section. Then, the clerk utterance start time and the clerk utterance end time are registered (S36). Thereafter, it is determined whether or not a notification of occurrence of the next clerk utterance section is received within a predetermined time (S37). If received (S37: Yes), the clerk utterance data No. And the same clerk Talk No. Then, the clerk utterance start time and the clerk utterance end time are registered (S36). Thereby, the salesclerk utterance section generated before and the salesclerk utterance section generated this time can be defined as a series of talk sections. Note that, when the occurrence notification of the next clerk utterance section is not received within a predetermined time (S37: No), the process is terminated assuming that a series of talk sections by the clerk is over.

次に、図13のフローチャートを参照し、図11のS22に相当する顧客話し掛け区間B特定処理について説明する。管理サーバー15(制御部53)は、店員による一連の話し掛け区間の特定が終了した後、音声データ管理テーブル85を参照し、最後の店員発話区間の店員発話終了時間から所定時間内に音声データが存在するか否かを判別する(S41)。ここで、音声データが存在しない場合は(S41:No)、顧客話し掛け区間Bは存在しないものとして処理を終了する。また、音声データが存在する場合は(S41:Yes)、音声データ管理テーブル85から、その音声データの録音開始時間と録音終了時間を読み込み、一意に定めた顧客発話No.と、顧客話し掛け区間ごとに定めた顧客話し掛けNo.と、顧客発話開始時間および顧客発話終了時間を顧客発話区間管理テーブル87に登録する(S42)。   Next, with reference to the flowchart of FIG. 13, the customer talk section B specifying process corresponding to S22 of FIG. 11 will be described. The management server 15 (the control unit 53) refers to the voice data management table 85 after the end of identification of a series of talk sections by the clerk, and the voice data is stored within a predetermined time from the clerk utterance end time of the last clerk utterance section. It is determined whether or not it exists (S41). Here, when there is no voice data (S41: No), it is determined that the customer talk section B does not exist, and the process ends. If the voice data exists (S41: Yes), the recording start time and the recording end time of the voice data are read from the voice data management table 85, and the uniquely defined customer utterance number. And customer talk No. determined for each customer talk section. Then, the customer utterance start time and customer utterance end time are registered in the customer utterance section management table 87 (S42).

その後、音声データ管理テーブル85を参照し、最後の顧客発話区間の顧客発話終了時間から所定時間内に音声データが存在するか否かを判別し(S43)、存在する場合は(S43:Yes)、一意に定めた顧客発話No.と、上記と同じ顧客話し掛けNo.と、顧客発話開始時間および顧客発話終了時間を登録する(S42)。これにより、前に発生した顧客発話区間と今回発生した顧客発話区間とを、一連の話し掛け区間として定義することができる。なお、最後の顧客発話区間の顧客発話終了時間から所定時間内に音声データが存在しない場合は(S43:No)、顧客によるその後の話し掛け区間は存在しないものとして、処理を終了する。   Thereafter, referring to the voice data management table 85, it is determined whether or not voice data exists within a predetermined time from the customer utterance end time of the last customer utterance section (S43), and if present (S43: Yes). Unique customer utterance No. And the same customer talk number as above. The customer utterance start time and customer utterance end time are registered (S42). Thereby, the customer utterance section generated before and the customer utterance section generated this time can be defined as a series of talk sections. If there is no voice data within a predetermined time from the customer utterance end time of the last customer utterance section (S43: No), the process is terminated assuming that there is no subsequent talk section by the customer.

次に、図14のフローチャートを参照し、図11のS23に相当する顧客話し掛け区間A特定処理について説明する。管理サーバー15は、顧客話し掛け区間Bの特定が終了した後、音声データ管理テーブル85を参照し、店員発話区間の店員発話開始時間から所定時間前までに、顧客の発声に基づく未処理の音声データが存在するか否かを判別する(S51)。ここで、未処理の音声データが存在しない場合は(S51:No)、顧客話し掛け区間Aが存在しないものとして、処理を終了する。また、未処理の音声データが存在する場合は(S51:Yes)、その音声データの録音開始時間と録音終了時間を読み込み、一意に定めた顧客発話No.と、顧客話し掛け区間ごとに定めた顧客話し掛けNo.と、顧客発話開始時間および顧客発話終了時間を顧客発話区間管理テーブル87に登録する(S52)。   Next, with reference to the flowchart of FIG. 14, the customer talk section A specifying process corresponding to S23 of FIG. 11 will be described. The management server 15 refers to the voice data management table 85 after the identification of the customer talk section B is completed, and unprocessed voice data based on the customer's utterance from the clerk utterance start time of the clerk utterance section to a predetermined time before. Whether or not exists is determined (S51). Here, when there is no unprocessed audio data (S51: No), it is determined that the customer talk section A does not exist, and the process is terminated. If unprocessed voice data exists (S51: Yes), the recording start time and the recording end time of the voice data are read, and the uniquely defined customer utterance number. And customer talk No. determined for each customer talk section. The customer utterance start time and customer utterance end time are registered in the customer utterance section management table 87 (S52).

その後、音声データ管理テーブル85を参照し、登録した顧客発話区間の顧客発話開始時間から所定時間前までに未処理の音声データが存在するか否かを判別し(S53)、存在する場合は(S53:Yes)、その音声データの録音開始時間と録音終了時間を読み込み、一意に定めた顧客発話No.と、上記と同じ顧客話し掛けNo.と、顧客発話開始時間および顧客発話終了時間を登録する(S52)。これにより、前に登録した顧客発話区間と今回特定した顧客発話区間とを、一連の話し掛け区間として定義することができる。なお、登録した顧客発話区間の顧客発話開始時間から所定時間前までに未処理の音声データが存在しない場合は(S53:No)、顧客によるそれ以前の話し掛け区間は存在しないものとして、処理を終了する。   Thereafter, referring to the voice data management table 85, it is determined whether or not unprocessed voice data exists before a predetermined time from the customer utterance start time of the registered customer utterance section (S53). S53: Yes), the recording start time and the recording end time of the voice data are read, and the customer utterance No. uniquely determined is read. And the same customer talk number as above. Then, the customer utterance start time and customer utterance end time are registered (S52). Thereby, the customer utterance section registered previously and the customer utterance section specified this time can be defined as a series of talk sections. If there is no unprocessed voice data within a predetermined time before the customer utterance start time of the registered customer utterance section (S53: No), the processing is ended assuming that there is no previous talk section by the customer. To do.

以上、図10ないし図14に示した各処理により、音声データ管理テーブル85、店員発話区間管理テーブル86および顧客発話区間管理テーブル87への登録を行い、店員話し掛け区間、その前後における顧客話し掛け区間Aおよび顧客話し掛け区間Bを特定することができる。ここで、店員話し掛け区間と顧客話し掛け区間との重複区間の検出について簡単に説明する。管理サーバー15は、各話し掛け区間を特定した後、店員発話区間管理テーブル86および顧客発話区間管理テーブル87を参照し、重複区間の検出と、各テーブル85,86,87への記録を行う。具体的には、まず、店員発話区間管理テーブル86を参照し、同一話し掛けNo.の最も早い店員発話開始時間と最も遅い店員発話終了時間を、店員話し掛け区間の開始時間と終了時間に設定する。同様に、顧客発話区間管理テーブル87を参照し、同一話し掛けNo.の最も早い顧客発話開始時間と最も遅い顧客発話終了時間を、顧客話し掛け区間の開始時間と終了時間に設定する。そして、店員話し掛け区間と顧客話し掛け区間とに重複区間が存在しないかを判定し、存在する場合は、店員発話区間管理テーブル86および顧客発話区間管理テーブル87に、重複区間(重複開始時間および重複終了時間)を登録すると共に、音声データ管理テーブル85に重複フラグを立てる(図9(a)の重複フラグ欄における「客・店」に相当)。   As described above, registration into the voice data management table 85, the clerk utterance section management table 86, and the customer utterance section management table 87 is performed by the processes shown in FIGS. And the customer talk section B can be specified. Here, the detection of the overlap section between the store clerk talk section and the customer talk section will be briefly described. After specifying each talking section, the management server 15 refers to the store clerk utterance section management table 86 and the customer utterance section management table 87, detects an overlapping section, and records it in each table 85, 86, 87. Specifically, first, referring to the clerk utterance section management table 86, the same talk No. The earliest clerk utterance start time and the latest clerk utterance end time are set as the start time and end time of the clerk talk section. Similarly, referring to the customer utterance section management table 87, the same talk No. The earliest customer utterance start time and the latest customer utterance end time are set as the start time and end time of the customer talk section. Then, it is determined whether or not there is an overlapping section between the clerk talk section and the customer talk section. If there is a duplicate section, the clerk utterance section management table 86 and the customer utterance section management table 87 indicate the overlapping sections (duplication start time and duplication end time). Time) and a duplication flag is set in the audio data management table 85 (corresponding to “customer / store” in the duplication flag column of FIG. 9A).

次に、図15を参照し、重複回数の計測方法について説明する。図15(a)に示す例では、店員話し掛け区間と顧客話し掛け区間とが重複する重複区間が、4つ存在している。但し、2つ目の重複区間は、短い発話区間(所定時間以下の話し掛け区間)であるため、重複計測の対象とならない。したがって、同図の例では、重複計測区間(1)〜(3)の3回が、重複回数として計測される。   Next, a method for measuring the number of times of duplication will be described with reference to FIG. In the example shown in FIG. 15A, there are four overlapping sections in which the store clerk talk section and the customer talk section overlap. However, since the second overlapping section is a short utterance section (talking section of a predetermined time or less), it is not subject to overlap measurement. Therefore, in the example of the figure, three times of overlap measurement sections (1) to (3) are measured as the number of overlaps.

なお、重複計測区間(2),(3)は、1話し掛け区間に含まれる区間であるため、これを1重複計測区間として計測しても良い。この場合、図15(a)に示す例では、重複回数が2回と計測される。   Note that since the overlap measurement sections (2) and (3) are sections included in one talk section, this may be measured as one overlap measurement section. In this case, in the example shown in FIG. 15A, the number of times of duplication is measured as two.

また、所定時間以下の話し掛け区間についても、全ての重複区間を重複計測の対象としても良い。この場合、図15(a)に示す例では、重複回数が4回と計測される。   In addition, all overlapping sections of the talking section having a predetermined time or less may be subjected to overlap measurement. In this case, in the example shown in FIG. 15A, the number of times of duplication is measured as four.

また、図15(b)に示す例のように、店員側からの話し掛けにより重複した区間のみを重複計測の対象としても良い。同図の例では、店員話し掛け区間と顧客話し掛け区間とが重複する重複区間が、4つ存在している。但し、2つ目と4つ目の重複区間は、顧客側からの話し掛けにより重複した区間であるため、重複計測の対象とならない。つまり、店員話し掛け区間が先行して開始されている状態で顧客の話し掛けが開始したような場合は、重複区間が発生しても、それを重複計測の対象としない。したがって、同図の例では、重複計測区間(1),(2)の2回が、重複回数として計測される。このように、店員側からの話し掛けにより重複した区間のみを重複計測の対象とすることで、店員の接客手法が良否を正確に判定することができる。   Further, as in the example shown in FIG. 15B, only the sections that are overlapped by talking from the store clerk may be subject to overlap measurement. In the example of the figure, there are four overlapping sections in which the store clerk talk section and the customer talk section overlap. However, since the second and fourth overlapping sections are overlapping sections due to a talk from the customer, they are not subject to overlapping measurement. That is, when a customer's talk starts in a state where the store clerk talk section is started in advance, even if an overlap section occurs, it is not subject to overlap measurement. Therefore, in the example of the same figure, two times of the overlap measurement sections (1) and (2) are measured as the number of overlaps. In this way, by setting only the section that overlaps due to the conversation from the store clerk as the object of overlap measurement, the store clerk's customer service method can accurately determine whether or not it is good.

次に、図16および図17を参照し、接客データを確認するためのビューアー画面Dについて説明する。なお、ビューアー画面Dは、表示端末16の表示画面16aに表示される。図16は、会話比率一覧表のビューアー画面D01を示す図である。当該ビューアー画面D01には、照会条件を選択する照会条件選択領域E11と、会話比率の一覧を表示する一覧表示領域E12と、接客データに含まれる録音データの再生操作を行うための再生操作領域E13と、が含まれる。   Next, a viewer screen D for confirming customer service data will be described with reference to FIGS. 16 and 17. The viewer screen D is displayed on the display screen 16a of the display terminal 16. FIG. 16 is a diagram showing a viewer screen D01 of the conversation ratio list. The viewer screen D01 includes an inquiry condition selection area E11 for selecting an inquiry condition, a list display area E12 for displaying a list of conversation ratios, and a reproduction operation area E13 for performing an operation for reproducing recorded data included in the customer service data. And are included.

照会条件選択領域E11は、「店舗」、「日付」、「店員(人物識別情報)」を選択(入力)可能となっている。ここで選択(入力)された条件に合致する接客データが、一覧表示領域E12に表示される。なお、「店員」ではなく、「顧客(人物識別情報)」を選択(入力)可能とし、当該顧客に関連付けられた接客データを、一覧表示領域E12に表示させても良い。また、「店員」と「顧客」の両方を選択(入力)可能とし、これらのand条件またはor条件を満たす接客データを、一覧表示領域E12に表示させても良い。   In the inquiry condition selection area E11, “Store”, “Date”, and “Clerk (person identification information)” can be selected (input). The customer service data that meets the conditions selected (input) here is displayed in the list display area E12. Note that it is possible to select (input) “customer (person identification information)” instead of “store clerk”, and display the customer service data associated with the customer in the list display area E12. Further, both “clerk” and “customer” can be selected (input), and customer service data satisfying these and conditions or conditions may be displayed in the list display area E12.

一覧表示領域E12は、接客データごとに、「店舗」、「日付」、「店員」、「接客区間No.」、「接客開始」、「接客終了」、「相対会話比率」、「重複回数」、「顧客」、「売り上げ金額」、「売り上げNo.」を関連付け、表形式で表示する。なお、「接客区間No.」は、接客区間ごとに自動付与される識別番号であり、「接客開始」および「接客終了」は、接客区間の開始時刻および終了時刻を指す。また、「相対会話比率」および「重複回数」は、当該接客区間における相対会話比率および重複回数を指す。また、「顧客」としては、当該接客の対象となった顧客氏名を表示し、「売り上げ金額」および「売り上げNo.」は、変換データから得られた、会計レシートRの合計金額およびレシートNo.を指す。なお、一覧表示領域E12では、いずれか1の接客データ(行)を選択可能となっており(枠211参照)、選択した接客データに含まれる録音データを、再生操作領域E13により再生可能である。   The list display area E12 includes, for each customer service data, “store”, “date”, “store clerk”, “customer service section No.”, “customer service start”, “customer service end”, “relative conversation ratio”, “duplication number”. , “Customer”, “sales amount”, and “sales number” are related and displayed in a table format. “Service section No.” is an identification number automatically assigned to each service section, and “service start” and “service end” indicate the start time and end time of the service section. “Relative conversation ratio” and “number of duplications” refer to the relative conversation ratio and the number of duplications in the customer service section. “Customer” displays the name of the customer who is the object of the customer service, and “Sales Amount” and “Sales No.” are the total amount of the receipt R and the receipt No. obtained from the conversion data. Point to. In the list display area E12, any one of the customer service data (rows) can be selected (see the frame 211), and the recorded data included in the selected customer service data can be reproduced in the reproduction operation area E13. .

再生操作領域E13は、接客区間における録音データおよび撮像データの再生操作を行うためのボタン群212と、再生位置を示すプログレスバー213と、音量調節スライダ214と、を表示する。なお、特に図示しないが、管理サーバー15は、再生操作領域E13の操作にしたがって、録音データおよび撮像データを再生するための再生部(スピーカー等の音声出力部を含む)を備えている。プログレスバー213は、横軸方向に分単位の時間目盛りが記されている。また、プログレスバー213は、店員話し掛け区間と、顧客話し掛け区間と、重複区間と、これらいずれにも該当しない非会話区間と、を区別して表示する。同図では、異なるハッチと空白によって、これらを識別可能としているが、色分け表示、マーク付加表示、テキスト付加表示など、ユーザーが各区間を識別できれば、その表示形態を問わない。なお、プログレスバー213の目盛りは、分単位ではなく時間単位としても良い。また、接客データ内の録音データ全体の再生状況を把握できるように、録音データの長さに応じて、目盛りの単位および目盛り間隔を可変しても良い。   The reproduction operation area E13 displays a button group 212 for performing a reproduction operation of recording data and imaging data in the service section, a progress bar 213 indicating a reproduction position, and a volume adjustment slider 214. Although not particularly illustrated, the management server 15 includes a reproduction unit (including an audio output unit such as a speaker) for reproducing the recording data and the imaging data in accordance with the operation of the reproduction operation area E13. The progress bar 213 has a time scale in minutes in the horizontal axis direction. In addition, the progress bar 213 distinguishes and displays the clerk talk section, the customer talk section, the overlap section, and the non-conversation section that does not correspond to any of these sections. In the figure, these can be identified by different hatches and blanks, but any display form can be used as long as the user can identify each section such as color-coded display, mark-added display, and text-added display. The scale of the progress bar 213 may be a time unit instead of a minute unit. Further, the unit of the scale and the scale interval may be varied according to the length of the recorded data so that the reproduction status of the entire recorded data in the customer service data can be grasped.

図17は、会話比率−売り上げ実績相関図のビューアー画面D02を示す図である。当該ビューアー画面D02には、照会条件を選択する照会条件選択領域E21と、会話比率と売り上げ実績(売り上げ情報)の相関図を表示する相関図表示領域E22と、が含まれる。   FIG. 17 is a diagram showing a viewer screen D02 of a conversation ratio-sales performance correlation diagram. The viewer screen D02 includes an inquiry condition selection area E21 for selecting an inquiry condition, and a correlation diagram display area E22 for displaying a correlation diagram between the conversation ratio and the sales performance (sales information).

照会条件選択領域E21は、「店舗」、「日付区間」、「店員(人物識別情報)」を選択(入力)可能となっている。また、「店員」は、「ALL(全ての店員)」を選択可能となっている。ここで選択(入力)された条件に合致する接客データに基づいて、相関図表示領域E22が表示される。   The inquiry condition selection area E21 can select (input) “store”, “date section”, and “store clerk (person identification information)”. In addition, “clerk” can select “ALL (all clerk)”. The correlation diagram display area E22 is displayed based on the customer service data that matches the condition selected (input) here.

相関図表示領域E22は、横軸を顧客会話比率(単位:%)、縦軸を客単価(単位:円)とした散布図である。ここでは、全店員の3月5日に接客した全ての接客データに基づいて、平均会話比率と売り上げ情報(客単価)の交点となる「点」がプロットされている。これにより、ユーザーは、その店舗にとって、会話比率をどの程度にすれば売り上げが向上するかを一目で把握できる。例えば、同図の例では、顧客会話比率を70%程度にすることにより、売り上げ向上に繋がると推測できる。   The correlation diagram display area E22 is a scatter diagram in which the horizontal axis represents the customer conversation ratio (unit:%) and the vertical axis represents the customer unit price (unit: yen). Here, on the basis of all customer service data received on March 5 by all the store clerk, “points” that are the intersections of the average conversation ratio and sales information (customer unit price) are plotted. Thereby, the user can grasp at a glance how much the sales ratio is improved for the store. For example, in the example shown in the figure, it can be estimated that by increasing the customer conversation ratio to about 70%, the sales can be improved.

以上説明したとおり、第1実施形態に係る接客支援システムSY1によれば、店員と顧客の会話比率を算出することにより、これを収集して経営戦略に役立てたり、接客スキルのトレーニングに利用したりすることができる。また、接客データには、店員識別情報および顧客識別情報が関連付けられるため、算出された会話比率が、どの店員のどの顧客に対する接客であったかを特定できる。これにより、個々の店員に対して適切な接客トレーニングを行うことができる。さらに、接客データには、売り上げ情報が関連付けられるため、会話比率と売り上げとの相関関係を、マーケティングデータとして収集できる。   As described above, according to the customer service support system SY1 according to the first embodiment, by calculating the conversation ratio between the store clerk and the customer, this can be collected and used for management strategy, or used for customer service skill training. can do. In addition, since the clerk identification information and the customer identification information are associated with the customer service data, it is possible to specify which store clerk is serving the customer for which customer. Thereby, appropriate customer service training can be performed for each store clerk. Furthermore, since sales information is associated with customer service data, the correlation between the conversation ratio and sales can be collected as marketing data.

また、接客区間ごとに会話比率を算出し、これをビューアー画面Dに表示するため、各接客について、総合的に好ましい接客であったか否か(例えば、店員音声の長さ:顧客音声の長さが2:8に近い値となったか否か)を把握できる。また、接客データには、録音データが関連付けられるため、例えば、好ましい会話比率が関連付けられた録音データを抽出して再生することで、接客トレーニングの教材として利用できる。つまり、会話スキルの高い店員の接客状況を、それ以外の店員に対して効率的に示すことができるため、会話スキルの水平展開に役立つ。   In addition, since the conversation ratio is calculated for each customer service section and displayed on the viewer screen D, whether or not each customer service is an overall favorable customer service (for example, the length of the clerk voice: the length of the customer voice is Whether or not the value is close to 2: 8 can be grasped. Further, since the recorded data is associated with the customer service data, for example, the recorded data associated with a preferable conversation ratio can be extracted and reproduced to be used as a service training material. That is, since the customer service situation of a salesclerk with high conversation skills can be efficiently shown to other salesclerks, it is useful for horizontal development of conversation skills.

また、接客データには、重複回数が関連付けられるため、会話比率だけでなく、当該重複回数からも、好ましい接客であったか否かを推測できる。例えば、重複回数が多い場合は、会話比率が好ましい値であったとしても、好ましい接客ではなかったと判断できる。   In addition, since the number of times of duplication is associated with the customer service data, it can be estimated whether or not the customer service is preferable from the number of times of duplication as well as the conversation ratio. For example, when the number of times of duplication is large, even if the conversation ratio is a preferable value, it can be determined that the customer service is not preferable.

なお、第1実施形態の変形例として、会話比率と重複回数とに基づく接客点数を算出し、これをビューアー画面Dに表示させても良い。以下、図18を参照し、当該変形例について説明する。図18(a)に示すように、接客点数は、“会話比率レベル”および“重複回数レベル”をパラメーターとして算出される。また、“会話比率レベル”および“重複回数レベル”には、それぞれ重み付けP1およびP2が乗算され、それらの合計値が、接客点数となる。なお、一般的に重み付けは、0≦P2≦P1≦1となり、P2よりもP1の方が大きな値となる。つまり、接客点数は、“会話比率レベル”の方が“重複回数レベル”よりも重み付けを大きくして算出される。但し、利用される店舗の状況により、利用者が任意に設定できることが好ましい。   As a modification of the first embodiment, the number of customer service points based on the conversation ratio and the number of overlaps may be calculated and displayed on the viewer screen D. Hereinafter, the modification will be described with reference to FIG. As shown in FIG. 18A, the number of customer service points is calculated using “conversation ratio level” and “duplication count level” as parameters. Further, the “conversation ratio level” and the “duplication number level” are multiplied by weights P1 and P2, respectively, and the total value thereof becomes the number of customer service points. In general, the weighting is 0 ≦ P2 ≦ P1 ≦ 1, and P1 is larger than P2. In other words, the number of customer service points is calculated with a higher weight for the “conversation ratio level” than for the “duplication number level”. However, it is preferable that the user can arbitrarily set depending on the situation of the store used.

ここで、“会話比率レベル”とは、店員と顧客の会話比率が2:8に近いほど高い値となる。つまり、図18(b)に示すように、“会話比率レベル”は、顧客会話比率に応じて「0〜3」のいずれかの数値となる。また、“重複回数レベル”とは、重複回数が少ないほど高い値となる。つまり、図18(c)に示すように、“重複回数レベル”は、重複回数に応じて「0〜3」のいずれかの数値となる。   Here, the “conversation ratio level” is higher as the conversation ratio between the clerk and the customer is closer to 2: 8. That is, as shown in FIG. 18B, the “conversation ratio level” is a numerical value of “0 to 3” depending on the customer conversation ratio. Further, the “duplication number level” is higher as the number of duplication is smaller. That is, as shown in FIG. 18C, the “duplication number level” is a numerical value of “0 to 3” depending on the number of duplications.

このように、接客点数を算出することで、接客についての判定を客観的に行うことができる。また、その判定結果や接客点数を、接客データの一部として記録してビューアー画面Dに表示することで、店長やマネージャーなどの管理者が、一目で接客結果を確認することができる。   Thus, by calculating the number of customer service points, it is possible to objectively determine the customer service. Further, by recording the determination result and the number of customer service points as part of the customer service data and displaying them on the viewer screen D, managers such as store managers and managers can check the customer service results at a glance.

なお、会話区間の終了ごと、若しくは接客区間の終了ごとに、好ましい接客であったか否かの判定結果および/または接客点数を、対象となる店員に対して通知しても良い。この場合、管理サーバー15によって、接客の判定および接客点数の算出を行い、レシートプリンター13および店員用端末5を介して、店員に装着された音声指示用イヤホン(図示省略)から、それらの情報を通知することが好ましい。この構成によれば、店員自身が接客中に、好ましい接客を行っているか否かを把握できるため、接客手法の向上が期待できる。   It should be noted that at each end of the conversation section or each end of the customer service section, a determination result as to whether or not the customer service is favorable and / or the number of customer service points may be notified to the target store clerk. In this case, the management server 15 determines the customer service and calculates the customer service score, and receives the information from the voice instruction earphone (not shown) attached to the store clerk via the receipt printer 13 and the store clerk terminal 5. It is preferable to notify. According to this configuration, since it is possible to grasp whether or not the store clerk is performing a favorable customer service during the customer service, an improvement in the customer service method can be expected.

また、上記の実施形態では、店員話し掛け区間を中心とした前後の顧客話し掛け区間の集合体(すなわち最低1つ、最大3つの話し掛け区間の集合体)を「1会話区間」と定義したが、「1会話区間」に含まれる話し掛け区間の数の制限を無くしても良い。すなわち、店員と顧客の話し掛け区間が所定時間(インターバルY)以上途切れないまま交互に繰り返される話し掛け区間の集合体を「1会話区間」としても良い。   In the above embodiment, a group of customer talk sections before and after the store staff talk section (that is, a collection of at least one and up to three talk sections) is defined as “one conversation section”. The restriction on the number of talking sections included in “one conversation section” may be eliminated. That is, a group of talking sections in which the talking sections of the store clerk and the customer are alternately repeated without interruption for a predetermined time (interval Y) or more may be set as “one conversation section”.

また、上記の実施形態では、店員と顧客の会話比率を算出する場合を例示したが、人物間の関係は、これに限定されるものではない。つまり、会社の上司と部下、夫婦やカップル、友人同士などであっても良い。   Moreover, although said embodiment illustrated the case where the conversation ratio of a salesclerk and a customer was calculated, the relationship between persons is not limited to this. That is, it may be a company boss and subordinate, a couple, a couple, or friends.

また、上記の実施形態では、会話区間または接客区間ごとに会話比率を算出したが、所定時間内における会話比率を算出しても良い。例えば、所定時間10分間の間に発声された店員と顧客の音声に基づいて会話比率を算出しても良い。また、店員の1日の勤務における会話比率を算出しても良い。   In the above embodiment, the conversation ratio is calculated for each conversation section or customer service section. However, the conversation ratio within a predetermined time may be calculated. For example, the conversation ratio may be calculated based on the clerk and customer voices spoken during a predetermined time of 10 minutes. Moreover, you may calculate the conversation ratio in the daily work of a store clerk.

また、上記の実施形態では、会話区間ごと、または接客区間ごとに会話比率を算出したが、単純に、隣り合う店員と顧客の話し掛け区間に基づいて(2つの話し掛け区間の比に基づいて)、会話比率を算出しても良い。   In the above embodiment, the conversation ratio is calculated for each conversation section or for each customer service section. However, simply based on the conversation section of the adjacent store clerk and the customer (based on the ratio of the two conversation sections), The conversation ratio may be calculated.

また、上記の実施形態において、人物識別部152は、顔認識技術を用いて顧客を識別したが、他の方法を採用しても良い。例えば、無線IC(RFID:Radio Frequency Identificationなど)が組み込まれた会員カードを各顧客が所持し、これを店舗の入り口に設置したICリーダーで読み取って顧客識別情報を取得することで、顧客を識別しても良い。また、店員にも無線ICが組み込まれた店員カードの所持を義務付け、当該店員カードを読み取ることで店員を識別可能としても良い。この方法により、読み取った店員カードと会員カードを同時期に読み取った場合、当該店員が当該顧客を接客しているものとして、両者を紐付けることができる。また、磁気情報が記録された会員カード(磁気カード)を、POS端末12に付属の磁気カードリーダーで読み取ることで、顧客を識別しても良い。この場合は、接客を担当する店員が、同時に自分の店員カードを読み取らせることで、顧客と店員を紐付けることができる。なお、磁気カードリーダーは、管理サーバー15に直接接続しても良い。さらに、顔認識技術ではなく音声認識技術を用いても良い。この場合、顧客情報記憶部81および店員情報記憶部82は、顔特徴量に代えて、声紋を記憶する必要がある。   In the above embodiment, the person identifying unit 152 identifies the customer using the face recognition technique, but other methods may be employed. For example, each customer possesses a membership card with a built-in wireless IC (RFID: Radio Frequency Identification, etc.), and this is read with an IC reader installed at the entrance of the store to identify the customer, thereby identifying the customer You may do it. Further, the store clerk may be obliged to have a store clerk card in which a wireless IC is incorporated, and the store clerk may be identified by reading the store clerk card. By this method, when the read clerk card and the membership card are read at the same time, it is possible to associate the two as if the clerk is serving the customer. Further, the customer may be identified by reading the membership card (magnetic card) on which the magnetic information is recorded with a magnetic card reader attached to the POS terminal 12. In this case, the store clerk in charge of customer service can associate the customer with the store clerk by having his / her store clerk card read at the same time. The magnetic card reader may be directly connected to the management server 15. Furthermore, voice recognition technology may be used instead of face recognition technology. In this case, the customer information storage unit 81 and the store clerk information storage unit 82 need to store a voiceprint instead of the face feature amount.

また、上記の実施形態では、店内カメラ11の撮像結果を、有線LANを介して直接管理サーバー15に送信する構成としたが、レシートプリンター13を介して管理サーバー15に送信しても良い。逆に、店員用端末5は、レシートプリンター13を介して管理サーバー15に音声データを送信する構成としたが、店員用端末5から直接管理サーバー15に送信しても良い。また、管理サーバー15の各機能を、POSシステムやWWWサーバーで実現しても良い。   In the above embodiment, the imaging result of the in-store camera 11 is directly transmitted to the management server 15 via the wired LAN, but may be transmitted to the management server 15 via the receipt printer 13. Conversely, the clerk terminal 5 is configured to transmit audio data to the management server 15 via the receipt printer 13, but may be directly transmitted from the clerk terminal 5 to the management server 15. Each function of the management server 15 may be realized by a POS system or a WWW server.

[第2実施形態]
次に、図19ないし図23を参照し、本発明の接客データ記録装置、接客データ記録方法およびプログラムについて、第2実施形態として説明する。本実施形態に係る接客支援システムSY2は、会話比率データと満足度データとを関連付けた接客データを記録し、これをマーケティングデータとして利用することを特徴とする。そこで、第1実施形態と異なる点のみ説明する。なお、本実施形態において、第1実施形態と同様の構成部分については同様の符号を付し、詳細な説明を省略する。また、第1実施形態と同様の構成部分について適用される変形例は、本実施形態についても同様に適用される。
[Second Embodiment]
Next, with reference to FIG. 19 thru | or FIG. 23, the customer service data recording device of this invention, the customer service data recording method, and a program are demonstrated as 2nd Embodiment. The customer service support system SY2 according to the present embodiment records customer service data in which conversation ratio data and satisfaction data are associated, and uses this as marketing data. Therefore, only differences from the first embodiment will be described. In the present embodiment, the same components as those in the first embodiment are denoted by the same reference numerals, and detailed description thereof is omitted. Moreover, the modification applied about the component similar to 1st Embodiment is applied similarly about this embodiment.

図19は、第2実施形態に係る接客支援システムSY2の機能ブロック図である。本実施形態に係る管理サーバー15は、第1実施形態と比較して、話し掛け区間抽出部161、顧客感情認識部162および顧客満足度算出部163が追加されている。   FIG. 19 is a functional block diagram of the customer service support system SY2 according to the second embodiment. In the management server 15 according to the present embodiment, compared to the first embodiment, a talk section extraction unit 161, a customer emotion recognition unit 162, and a customer satisfaction calculation unit 163 are added.

話し掛け区間抽出部161は、第1実施形態の音声抽出部154に相当し、取得した会話(音声データ)から、店員話し掛け区間および顧客話し掛け区間を抽出する。   The talk section extraction unit 161 corresponds to the voice extraction unit 154 of the first embodiment, and extracts a store clerk talk section and a customer talk section from the acquired conversation (voice data).

顧客感情認識部162は、録音データ(接客区間に相当する音声データ)から抽出した顧客話し掛け区間に対し、音声の強度、音声の発生速度(単位時間当たりのモーラ数など)、単語別の強度、音量、音声スペクトルなどの変化量に基づいて、感情認識を行う。具体的には、録音データに含まれる顧客の発話区間ごとに感情認識を行う。このように、1フレーズごとに感情認識を行うことで、高精度な感情データを得ることができる。さらに、顧客感情認識部162は、図15)に示したように、顧客話し掛け区間と店員話し掛け区間とが時間軸上で重複する重複区間を特定し、当該重複区間を「感情認識非対象区間」として、当該重複区間を除く顧客話し掛け区間に対して感情認識を行う。このように、顧客の音声と店員の音声が混合しており正確な感情認識を行うことができない重複区間を除いて感情認識を行うことで、誤認識を防止することができる。   The customer emotion recognition unit 162 applies the voice strength, the voice generation speed (number of mora per unit time, etc.), the strength for each word to the customer talking section extracted from the recorded data (voice data corresponding to the customer service section), Emotion recognition is performed based on the amount of change such as volume and voice spectrum. Specifically, emotion recognition is performed for each customer utterance section included in the recorded data. Thus, highly accurate emotion data can be obtained by performing emotion recognition for each phrase. Further, as shown in FIG. 15), the customer emotion recognition unit 162 identifies an overlapping section in which the customer talk section and the store clerk talk section overlap on the time axis, and identifies the overlap section as an “emotion recognition non-target section”. Then, emotion recognition is performed on the customer talk section excluding the overlap section. In this way, misrecognition can be prevented by performing emotion recognition excluding overlapping sections in which customer voice and store clerk voice are mixed and accurate emotion recognition cannot be performed.

顧客満足度算出部163は、顧客感情認識部162の認識結果に基づいて、顧客満足度を算出する。また、顧客感情認識部162が発話区間ごとに感情認識を行うことに伴い、顧客満足度算出部163も、発話区間ごとに顧客満足度を算出する。なお、顧客満足度の具体的な算出方法については、後述する。   The customer satisfaction calculation unit 163 calculates customer satisfaction based on the recognition result of the customer emotion recognition unit 162. Further, as the customer emotion recognition unit 162 performs emotion recognition for each utterance section, the customer satisfaction calculation unit 163 also calculates the customer satisfaction for each utterance section. A specific method for calculating customer satisfaction will be described later.

本実施形態の接客データ記録部158は、会話比率算出部155により算出された会話比率に基づく会話比率データ、および顧客満足度算出部163により算出された顧客満足度に基づく満足度データを関連付け、接客データの一部として管理サーバー用データベースDB2に記録する。   The customer service data recording unit 158 of the present embodiment associates the conversation ratio data based on the conversation ratio calculated by the conversation ratio calculation unit 155 and the satisfaction data based on the customer satisfaction calculated by the customer satisfaction calculation unit 163, Recorded in the management server database DB2 as part of the customer service data.

図20は、第2実施形態に係る管理サーバー用データベースDB2の説明図である。管理サーバー用データベースDB2は、第1実施形態と比較して、接客データ記憶部91の記憶内容が異なる。本実施形態の接客データ記憶部91は、顧客識別情報、店員識別情報、録音データ、撮像データ、売り上げ情報および接客日時の他、会話比率算出部155の算出結果に基づく会話比率データと、顧客満足度算出部163の算出結果に基づく満足度データと、を関連付けて記憶する。ここで、会話比率データとは、接客区間における会話比率と、各会話区間における会話比率と、を指す。また、満足度データとは、接客区間における顧客満足度と、各会話区間における顧客満足度と、を指す。   FIG. 20 is an explanatory diagram of the management server database DB2 according to the second embodiment. The management server database DB2 is different from the first embodiment in the storage contents of the customer service data storage unit 91. The customer service data storage unit 91 of the present embodiment includes customer identification information, store clerk identification information, recording data, imaging data, sales information, customer service date, conversation ratio data based on the calculation result of the conversation ratio calculation unit 155, and customer satisfaction. The satisfaction degree data based on the calculation result of the degree calculation unit 163 is stored in association with each other. Here, the conversation ratio data refers to the conversation ratio in the customer service section and the conversation ratio in each conversation section. The satisfaction data refers to customer satisfaction in the customer service section and customer satisfaction in each conversation section.

次に、図21を参照し、顧客満足度の算出アルゴリズム(計算式)について説明する。同図に示すように、顧客満足度は、発話区間、会話区間、接客区間の順に算出される。まず、発話区間別満足度は、図21(a)に示すように、計算式「“発話区間別満足度”=“喜データ”+“笑データ”×A」により算出される。ここで、“喜データ”は「喜び」の感情データ(例えば、0〜50までの数値、以下同様)、“笑データ”は「笑い」の感情データ、Aは0≦A≦1となる定数を意味する。なお、当該算出アルゴリズムは、人物の満足度が、「快」の心理状態と、その心理的強度の乗算結果とに基づくという発想から導き出したものである。   Next, a customer satisfaction calculation algorithm (calculation formula) will be described with reference to FIG. As shown in the figure, the customer satisfaction is calculated in the order of the utterance section, the conversation section, and the customer service section. First, as shown in FIG. 21A, the satisfaction level for each utterance section is calculated by the formula ““ satisfaction level for each utterance section ”=“ joy data ”+“ laughing data ”× A”. Here, “joy data” is emotion data of “joy” (for example, numerical values from 0 to 50, the same applies hereinafter), “laugh data” is emotion data of “laughter”, and A is a constant satisfying 0 ≦ A ≦ 1. Means. The calculation algorithm is derived from the idea that the degree of satisfaction of a person is based on the psychological state of “pleasant” and the multiplication result of the psychological strength.

また、図21(b)に示すように、発話区間別実満足度は、計算式「“発話区間別実満足度”=“発話区間別満足度”−“発話区間別不満足度”×C」、すなわち「(“喜データ”+“笑データ”×A)−(“怒データ”+“悲データ”×B)×C」により算出される。ここで、“怒データ”は「怒り」の感情データ、“悲データ”は「悲しみ」の感情データ、Bは0≦B≦1となる定数、Cは0≦C≦1となる定数を意味する。このように、「喜び」および「笑い」の他に、「怒り」および「悲しみ」の感情データを用いることで、複雑な感情を考慮した、より信頼度の高い満足度を算出することができる。なお、当該算出アルゴリズムは、人物の不満足度が、「不快」の心理状態と、その心理的強度の乗算結果とに基づくという発想と、実満足度が、「快」および「不快」の心理状態に基づくという発想から導き出したものである。   Further, as shown in FIG. 21 (b), the actual satisfaction level for each utterance section is calculated using the formula "" Real satisfaction level for each utterance section "=" Satisfaction level for each utterance section "-" Satisfaction level for each utterance section "× C". That is, “(“ joy data ”+“ laugh data ”× A) − (“ anger data ”+“ sad data ”× B) × C” is calculated. Here, “anger data” means “anger” emotion data, “sad data” means “sadness” emotion data, B means a constant satisfying 0 ≦ B ≦ 1, and C means a constant satisfying 0 ≦ C ≦ 1. To do. As described above, by using emotion data of “anger” and “sadness” in addition to “joy” and “laughter”, it is possible to calculate a more reliable satisfaction considering complex emotions. . The calculation algorithm is based on the idea that the person's dissatisfaction level is based on the psychological state of “uncomfortable” and the multiplication result of the psychological strength, and the psychological state where the actual satisfaction level is “pleasant” and “unpleasant”. It is derived from the idea of being based on.

また、図21(c)に示すように、会話区間別満足度は、「“会話区間別満足度”=会話区間に含まれる各顧客発話区間の“発話区間別実満足度”の平均値」から得られる。また、図21(d)に示すように、接客区間別満足度は、「“接客区間別満足度”=接客区間に含まれる各会話区間の“会話区間別満足度”の平均値」から得られる。   Further, as shown in FIG. 21C, the satisfaction level for each conversation section is ““ satisfaction level for each conversation section ”= an average value of“ actual satisfaction level for each utterance section ”of each customer utterance section included in the conversation section”. Obtained from. In addition, as shown in FIG. 21 (d), the satisfaction level by customer service section is obtained from ““ Satisfaction level by customer service section ”= average value of“ satisfaction level by conversation section ”of each conversation section included in the service section. It is done.

次に、図22および図23を参照し、第2実施形態に係るビューアー画面Dについて説明する。図22は、満足度−会話比率一覧表のビューアー画面D03を示す図である。当該ビューアー画面D03は、例えば図16に示したビューアー画面D01から、「満足度−会話比率一覧表」を表示するための不図示のボタン操作により表示されるものであり、接客区間No.を示す区間No.表示領域E31と、顧客満足度と顧客会話比率とを関連付けた一覧を表示する一覧表示領域E32とが含まれる。一覧表示領域E32は、接客区間の開始時刻および終了時刻を示す「時刻」の他、接客区間に含まれる各会話区間の「会話区間No.」、各会話区間の「顧客満足度」および各会話区間の「顧客会話比率」を関連付け、表形式で表示している。ここで、各会話区間の「顧客満足度」とは、図21(c)に示した会話区間別満足度を指す。   Next, the viewer screen D according to the second embodiment will be described with reference to FIGS. FIG. 22 is a diagram showing a viewer screen D03 of the satisfaction level-conversation ratio list. The viewer screen D03 is displayed by, for example, a button operation (not shown) for displaying the “satisfaction-conversation ratio list” from the viewer screen D01 shown in FIG. Section No. indicating A display area E31 and a list display area E32 for displaying a list in which the customer satisfaction and the customer conversation ratio are associated are included. The list display area E32 includes “time” indicating the start time and end time of the service section, “conversation section No.” of each conversation section included in the service section, “customer satisfaction” of each conversation section, and each conversation. The “customer conversation ratio” of the section is related and displayed in a table format. Here, “customer satisfaction” of each conversation section refers to the satisfaction degree by conversation section shown in FIG.

図23は、満足度−会話比率重ね合わせグラフのビューアー画面D04を示す図である。当該ビューアー画面D04は、例えば図16または図22に示したビューアー画面D01,D03から、「満足度−会話比率重ね合わせグラフ」を表示するための不図示のボタン操作により表示されるものであり、接客データに含まれる一部の情報を表示する接客データ表示領域E41と、顧客満足度と会話比率との関係をグラフ化したグラフ表示領域E42と、が含まれる。   FIG. 23 is a diagram showing a viewer screen D04 of the satisfaction-conversation ratio overlay graph. The viewer screen D04 is displayed by, for example, a button operation (not shown) for displaying the “satisfaction-conversation ratio superimposed graph” from the viewer screens D01 and D03 shown in FIG. 16 or FIG. A customer service data display area E41 that displays part of the information included in the customer service data, and a graph display area E42 that graphs the relationship between customer satisfaction and the conversation ratio are included.

接客データ表示領域E41は、「日付」、「店員」、「顧客」、「接客時間」、「売り上げNo.」、「売り上げ金額」、「顧客の平均会話比率」、「平均顧客満足度」および「接客区間No.」を表示する。ここで、「接客時間」とは、接客開始時刻および接客終了時刻を指す。また、「平均顧客満足度」とは、図21(d)に示した接客区間別満足度を指す。   The customer service data display area E41 includes “date”, “store clerk”, “customer”, “customer service time”, “sales number”, “sales amount”, “average customer conversation ratio”, “average customer satisfaction” and “Service section No.” is displayed. Here, “customer service time” refers to a customer service start time and a customer service end time. Further, the “average customer satisfaction” refers to the satisfaction by customer service section shown in FIG.

グラフ表示領域E42は、横軸を「会話区間No.」、縦軸を「顧客満足度」とした第1の折れ線グラフ(実線、黒丸にて図示)と、横軸を「会話区間No.」、縦軸を「会話比率」とした第2の折れ線グラフ(破線、白丸にて図示)と、を重ね合わせた重ね合わせグラフを表示する。ここで、横軸の「会話区間No.」は、時系列に並べられている。なお、「会話区間No.」に代えて、横軸を時間(時刻)としても良い。また、「顧客満足度」は、0〜100の数値で表されるように、感情データおよび定数A,B,Cの値が定められているものとする。また、「会話比率」は、顧客会話比率を単位%で示したものであり、0〜100%で表される。このように、接客区間内の、各会話区間における顧客満足度の推移と、各会話区間における会話比率の推移とを、共通する時間軸上でグラフ化して表示することにより、ユーザーは、1接客内における会話状況の変化や顧客の感情の変化、並びにそれらの相関関係を一目で把握することができる。   The graph display area E42 includes a first line graph (shown by a solid line and a black circle) whose horizontal axis is “conversation section No.” and whose vertical axis is “customer satisfaction”, and whose horizontal axis is “conversation section No.”. Then, a superposition graph in which a second line graph (shown by broken lines and white circles) with the vertical axis as “conversation ratio” is overlaid is displayed. Here, the “conversation section No.” on the horizontal axis is arranged in time series. Instead of “conversation section No.”, the horizontal axis may be time (time). In addition, it is assumed that the “customer satisfaction” includes emotion data and values of constants A, B, and C as represented by numerical values of 0 to 100. The “conversation ratio” indicates the customer conversation ratio in unit%, and is represented by 0 to 100%. In this way, by displaying the transition of customer satisfaction in each conversation section and the transition of the conversation ratio in each conversation section within the customer service section in a graph on the common time axis, the user can receive one customer service. It is possible to grasp at a glance changes in conversation status, customer emotions, and their correlations.

以上説明したとおり、第2実施形態に係る接客支援システムSY2によれば、会話比率データと満足度データとを関連付け、接客データとして記録するため、これをマーケティングデータとして利用することができる。また、当該接客データにより、会話比率がどの程度顧客満足度に影響するかを推定でき、会話トレーニングの成果を証明できる。また、会話比率データとして各会話区間における会話比率を記録すると共に、満足度データとして各会話区間における顧客満足度を記録し、これらをビューアー画面D03,D04に表示することで、1接客内における会話状況の変化や顧客の感情の変化を確認できる。さらに、接客データとして、各接客区間における平均会話比率および平均顧客満足度を記録・表示するため(図23のE41参照)、各接客の総合的な評価を容易に把握することができる。   As described above, according to the customer service support system SY2 according to the second embodiment, the conversation ratio data and the satisfaction level data are associated with each other and recorded as the customer service data, so that it can be used as marketing data. In addition, the customer service data can estimate how much the conversation ratio affects customer satisfaction, and can prove the results of conversation training. In addition, the conversation ratio in each conversation section is recorded as conversation ratio data, and the customer satisfaction in each conversation section is recorded as satisfaction data, and these are displayed on the viewer screens D03 and D04, thereby providing conversation within one customer service. You can see changes in situations and customer sentiment. Furthermore, since the average conversation ratio and average customer satisfaction in each customer service section are recorded and displayed as customer service data (see E41 in FIG. 23), it is possible to easily grasp the overall evaluation of each customer service.

なお、上記の実施形態では、接客管理を目的として、店員と顧客の会話比率および顧客満足度を算出したが、個人で利用しても良い。これにより、収集した会話比率データや満足度データを、個人間の会話スキル(会話テクニック)の向上に役立てることができる。   In the above embodiment, the conversation ratio between the store clerk and the customer and the customer satisfaction are calculated for the purpose of customer service management, but they may be used by individuals. As a result, the collected conversation ratio data and satisfaction data can be used to improve conversation skills (conversation techniques) between individuals.

[第3実施形態]
次に、図24ないし図31を参照し、本発明の接客支援装置、接客支援方法およびプログラムについて、第3実施形態として説明する。本実施形態に係る接客支援システムSY3は、店員や顧客を監視する監視部の監視結果に基づいて、接客対象となる顧客別に接客区間を特定することを特徴とする。そこで、上記の各実施形態と異なる点のみ説明する。なお、本実施形態において、上記の各実施形態と同様の構成部分については同様の符号を付し、詳細な説明を省略する。また、上記の各実施形態と同様の構成部分について適用される変形例は、本実施形態についても同様に適用される。
[Third Embodiment]
Next, with reference to FIG. 24 to FIG. 31, a customer service support apparatus, a customer service support method, and a program according to the present invention will be described as a third embodiment. The customer service support system SY3 according to this embodiment is characterized in that a customer service section is specified for each customer serving as a customer service based on a monitoring result of a monitoring unit that monitors a store clerk or a customer. Therefore, only differences from the above embodiments will be described. In the present embodiment, the same components as those in the above-described embodiments are denoted by the same reference numerals, and detailed description thereof is omitted. Moreover, the modification applied about the component similar to said each embodiment is applied similarly about this embodiment.

図24は、第3実施形態に係る接客支援システムSY3の機能ブロック図である。本実施形態では、音声取得用マイク2が監視部として機能する。つまり、監視部は、会話取得部102を含んでおり(監視部の他の例については後述する)、会話取得部102は、店員と顧客の会話を取得する。   FIG. 24 is a functional block diagram of the customer service support system SY3 according to the third embodiment. In the present embodiment, the voice acquisition microphone 2 functions as a monitoring unit. That is, the monitoring unit includes a conversation acquisition unit 102 (other examples of the monitoring unit will be described later), and the conversation acquisition unit 102 acquires a conversation between a salesclerk and a customer.

また、本実施形態に係る管理サーバー15は、第2実施形態と比較し、接客切替検出部171、切替検出データ記録部172、接客切替区間特定部173、接客会話区間特定部174および接客区間特定部175が追加されている。   In addition, the management server 15 according to the present embodiment is different from the second embodiment in that the customer service switching detection unit 171, the switching detection data recording unit 172, the customer service switching segment identification unit 173, the customer service conversation segment identification unit 174, and the customer service segment identification. A part 175 is added.

接客切替検出部171は、監視部の監視結果、すなわち会話取得部102によって取得した会話に含まれる顧客の音声に基づいて、店員の接客対象となっている対象顧客の切り替わりを検出する。本実施形態では、顧客の音声に対して、定期的に声紋認証を行い、当該声紋認証結果の変化により、対象顧客の切り替わりを検出する。なお、顧客の音声から、声紋以外の声の特徴量(声の高さや早さなど)を判別し、当該特徴量の変化によって、対象顧客の切り替わりを検出しても良い。   The customer service switching detection unit 171 detects the switching of the target customer who is the customer service target of the store clerk based on the monitoring result of the monitoring unit, that is, the voice of the customer included in the conversation acquired by the conversation acquisition unit 102. In the present embodiment, voice print authentication is periodically performed on the customer's voice, and the change of the target customer is detected based on a change in the voice print authentication result. Note that it is also possible to discriminate voice feature amounts (voice pitch, speed, etc.) other than the voiceprint from the customer's voice, and detect the change of the target customer based on the change in the feature amount.

切替検出データ記録部172は、店員を識別する店員識別情報と、接客切替検出部171の検出時刻(タイムスタンプ)と、を関連付け、切替検出データとして管理サーバー用データベースDB3に記録する。   The switching detection data recording unit 172 associates the clerk identification information for identifying the clerk and the detection time (time stamp) of the customer service switching detection unit 171, and records them in the management server database DB 3 as switching detection data.

接客切替区間特定部173は、記録した切替検出データに基づいて、検出開始からN番目(但し、NはN≧1となる整数)の検出時刻を区間開始時刻とし、且つN+1番目の検出時刻を区間終了時刻とする接客切替区間を特定する。つまり、「接客切替区間」は、切替検出データに基づいて特定される区間である。   Based on the recorded switching detection data, the service switching section identification unit 173 sets the Nth detection time (where N is an integer satisfying N ≧ 1) as the section start time and the N + 1th detection time based on the recorded switching detection data. The customer service switching section used as the section end time is specified. That is, the “customer service switching section” is a section specified based on the switching detection data.

接客会話区間特定部174は、話し掛け区間抽出部161により抽出された話し掛け区間に基づいて、接客会話区間を特定する。なお、第1実施形態および第2実施形態に係る「接客区間」は、本実施形態に係る「接客会話区間」に相当する。前述の通り、会話区間は、店員と顧客による話し掛け区間が所定時間以上途切れないまま交互に繰り返される話し掛け区間の集合体であるから、所定時間以上途切れないまま繰り返される会話区間の集合体を、1接客会話区間として特定する。つまり、「接客会話区間」は、接客データに含まれる録音データに基づいて特定される区間である。   The service conversation section identification unit 174 identifies a service conversation section based on the conversation section extracted by the conversation section extraction unit 161. The “service section” according to the first embodiment and the second embodiment corresponds to the “service conversation section” according to the present embodiment. As described above, since the conversation section is a collection of conversation sections that are alternately repeated without interruption for a predetermined time or more by the store clerk and the customer, a conversation section that is repeated without interruption for a predetermined time or more is defined as 1 Specify as a customer service section. That is, the “customer service conversation section” is a section specified based on the recording data included in the customer service data.

また、接客区間特定部175は、接客切替区間特定部173により特定された接客切替区間と、接客会話区間特定部174により特定された接客会話区間と、に基づいて接客区間を特定する。具体的には、接客会話区間と接客切替区間とを、and演算またはor演算することにより、接客区間を特定する。なお、接客区間特定部175は、店員識別情報によって、任意の切替検出データと、録音データを紐付けし、比較演算を行う。接客区間特定部175による接客区間の特定方法については、後に詳述する。   Further, the customer service section specifying unit 175 specifies the customer service section based on the customer service switching section specified by the customer service switching section specifying unit 173 and the customer service conversation section specified by the customer service conversation section specifying unit 174. Specifically, the customer service section is specified by performing an AND operation or an OR operation on the customer service conversation section and the customer service switching section. The customer service section identification unit 175 associates arbitrary switching detection data and recorded data with the store clerk identification information, and performs a comparison operation. A method for identifying a service section by the service section identifying unit 175 will be described in detail later.

上記の構成により、本実施形態の会話比率算出部155は、接客区間特定部175により特定された接客区間における会話比率を算出する。また、本実施形態の接客データ記録部158は、接客区間特定部175により特定された接客区間に相当する音声データである録音データや、同じく接客区間特定部175により特定された接客区間に相当する映像データである撮像データを、接客データとして記録する。また、本実施形態の画面表示部159は、ユーザーの操作に基づいて、接客切替区間特定部173により特定された接客切替区間、接客会話区間特定部174により特定された接客会話区間、および接客区間特定部175により特定された接客区間を、ビューアー画面Dに表示する(例えば、図26ないし図30参照)。また、ユーザーの操作に基づき、ビューアー画面D上で、接客区間の開始時間および終了時間の修正ができるようになっている。   With the above configuration, the conversation ratio calculation unit 155 of the present embodiment calculates the conversation ratio in the service section specified by the service section specification unit 175. In addition, the customer service data recording unit 158 of the present embodiment corresponds to recorded data that is voice data corresponding to the customer service section specified by the customer service section specifying unit 175, or a customer service section specified by the customer service section specifying unit 175. Imaging data that is video data is recorded as customer service data. Further, the screen display unit 159 of the present embodiment, based on the user's operation, the customer service switching section specified by the customer service switching section specifying unit 173, the customer service conversation section specified by the customer service conversation section specifying unit 174, and the customer service section The customer service section specified by the specifying unit 175 is displayed on the viewer screen D (see, for example, FIGS. 26 to 30). Further, the start time and end time of the customer service section can be corrected on the viewer screen D based on the user's operation.

図25は、第3実施形態に係る管理サーバー用データベースDB3の説明図である。管理サーバー用データベースDB3は、第1実施形態および第2実施形態で示した各部の他に、さらに切替検出データ記憶部93として機能する。当該切替検出データ記憶部93は、切替検出データ記録部172により記録された切替検出データを記憶する。また、本実施形態の接客データ記憶部94は、顧客識別情報、店員識別情報、接客区間分の音声データに相当する録音データ、接客区間分の映像データに相当する撮像データ、接客区間における会話比率の他、接客区間データを記憶する。当該接客区間データは、接客区間の区間開始時刻および区間終了時刻を含むデータを指す。   FIG. 25 is an explanatory diagram of the management server database DB3 according to the third embodiment. The management server database DB3 further functions as a switching detection data storage unit 93 in addition to the units shown in the first and second embodiments. The switch detection data storage unit 93 stores the switch detection data recorded by the switch detection data recording unit 172. Further, the customer service data storage unit 94 of the present embodiment includes customer identification information, store clerk identification information, recording data corresponding to voice data for the customer service section, imaging data corresponding to video data for the customer service section, and conversation ratio in the customer service section. In addition, customer service section data is stored. The customer service section data refers to data including a section start time and a section end time of the service section.

次に、図26を参照し、切替検出データおよび切替検出期間について説明する。図26(a)に示すように、切替検出データは、「店員識別情報」、「日付」および「切替検出時刻」が関連付けられた情報である。なお、「切替検出時刻」は、接客切替検出部171により、対象顧客の切り替わりが検出された時刻を指す。本実施形態では、顧客の音声に対して、定期的に声紋認証を行い、当該声紋認証結果が変化したとき(異なる顧客の声紋を認識したとき)、対象顧客が切り替わったと判定する。   Next, the switching detection data and the switching detection period will be described with reference to FIG. As shown in FIG. 26A, the switching detection data is information in which “salesperson identification information”, “date”, and “switching detection time” are associated with each other. The “switching detection time” refers to the time when the customer service switching detection unit 171 detects the switching of the target customer. In the present embodiment, voice print authentication is periodically performed on the customer's voice, and when the voice print authentication result is changed (when a voice print of a different customer is recognized), it is determined that the target customer has been switched.

図26(b)は、接客切替区間を時間軸上で示したイメージ図である。接客切替区間は、切替検出ごとに新たな区間が発生するものとして定義されるため、同図に示すように、隣り合う区間の間に間隙が生じることがなく、連続した区間となる。   FIG. 26B is an image diagram showing the customer service switching section on the time axis. The customer service switching section is defined as a new section generated every time switching is detected, and therefore, as shown in the figure, there is no gap between adjacent sections, and the section is a continuous section.

次に、図27を参照し、接客会話区間について説明する。図27(a)は、接客会話区間特定結果の一例を示す図である。なお、接客会話区間は、第1実施形態で示した接客区間の特定方法によって特定される。ここでは、特定結果として、「店員識別情報」、「日付」、「顧客識別情報」および「接客会話区間」を示している。また、接客会話区間のインターバルの基準長さ(図5(b)におけるインターバルZ)は、1分30秒であるものとする。   Next, the customer service conversation section will be described with reference to FIG. FIG. 27A is a diagram illustrating an example of the service conversation section identification result. The service conversation section is specified by the service section specifying method described in the first embodiment. Here, “clerk identification information”, “date”, “customer identification information”, and “customer conversation section” are shown as specific results. Further, it is assumed that the reference length of the interval of the service conversation section (interval Z in FIG. 5B) is 1 minute 30 seconds.

図27(b)は、接客会話区間を時間軸上で示したイメージ図である。接客会話区間は、所定時間以上途切れないまま繰り返される会話区間の集合体として定義されるため、同図に示すように、隣り合う区間の間に間隙が生じる。   FIG. 27B is an image diagram showing the customer service section on the time axis. Since the customer service section is defined as a collection of conversation sections that are repeated without interruption for a predetermined time or longer, a gap occurs between adjacent sections as shown in FIG.

次に、図28ないし図30を参照し、接客区間の特定方法について説明する。接客区間の特定方法として、ここでは3つのパターン(接客区間特定パターンA〜C)を例示する。図28は、接客区間特定パターンAを示す図である。接客区間特定パターンAは、接客会話区間を基準にして接客区間を特定する。但し、複数の連続する接客会話区間が、1の接客切替区間に含まれる場合(接客会話区間(1),(2)と接客切替区間(1)の関係)、当該複数の接客会話区間の開始時刻から終了時刻までを、1接客区間とする(接客区間(1))。また、接客会話区間の途中で、接客切替区間が途切れる場合(接客会話区間(3)と接客切替区間(2),(3)の関係)、当該接客切替区間が途切れた時刻によって接客区間を分割する。つまり、同図の例では、接客会話区間(3)の開始時刻から接客切替期間(2)の終了時刻までを、接客区間(2)とし、接客切替区間(2)の終了時刻(接客会話区間(3)の開始時刻)から接客会話区間(3)の終了時刻までを、接客区間(3)とする。なお、これらの特定方法によって特定された接客区間の区間長が、所定時間未満の場合、その区間を接客区間として特定しない(無視する)ことが好ましい。   Next, with reference to FIG. 28 to FIG. 30, a method for specifying the customer service section will be described. Here, as a method for specifying the service section, three patterns (service section specification patterns A to C) are illustrated here. FIG. 28 is a diagram illustrating a service section identification pattern A. The customer service section specifying pattern A specifies a customer service section based on the customer service conversation section. However, when a plurality of consecutive customer service conversation sections are included in one customer service switching section (a relationship between the customer service conversation sections (1) and (2) and the customer service switching section (1)), the start of the plurality of customer service conversation sections From the time to the end time is defined as one customer service section (a customer service section (1)). In addition, when the customer service switching section is interrupted in the middle of the customer service conversation section (the relationship between the customer service conversation section (3) and the customer service switching sections (2) and (3)), the customer service section is divided according to the time when the customer service switching section is interrupted. To do. That is, in the example of the figure, the service period (2) is defined as the service period (2) from the start time of the service conversation section (3) to the end time of the service switching period (2) (service conversation section). The service section (3) is defined from the start time of (3) to the end time of the customer service section (3). In addition, when the section length of the customer service section specified by these specifying methods is less than a predetermined time, it is preferable not to specify (ignore) that section as the customer service section.

このように接客区間特定パターンAでは、本実施形態のように、顧客の声紋の変化によって対象顧客の切り替わりを検出する構成において、顧客別の接客区間を、正確に特定することができる。例えば、接客切替区間のみによって接客区間を特定する(接客切替区間=接客区間とする)と、既に対象顧客が切り替わっているが、顧客の発声がないために前の接客が続いていると誤判定される可能性がある(例えば、接客切替区間(1)で接客会話区間(2)がないケースでは、接客会話区間(2)に相当する時間が接客会話区間(1)に加算されてしまう)。したがって、接客会話区間を基準に接客区間を特定することで、接客区間終了時刻の誤差を無くすことができる。   As described above, the customer service section identification pattern A can accurately identify the customer service section for each customer in the configuration in which the change of the target customer is detected based on the change of the customer's voiceprint as in the present embodiment. For example, if a customer service section is specified only by the customer service switch section (customer service switch section = customer service section), the target customer has already been switched, but it is erroneously determined that the previous customer service continues because there is no customer utterance. (For example, in the case where there is no service conversation section (2) in the service switching section (1), a time corresponding to the service conversation section (2) is added to the service conversation section (1)). . Therefore, by specifying the customer service section on the basis of the customer service conversation section, the error of the customer service section end time can be eliminated.

また、接客会話区間のみによって接客区間を特定する(接客会話区間=接客区間とする)と、同じ対象顧客であるにも拘らず、会話が所定時間以上途切れたために、異なる接客であると誤判定されてしまう(例えば、接客会話区間(1),(2)と接客切替区間(1)の関係)。また、逆に、対象顧客が切り替わったにも拘らず、会話が所定時間以上途切れなかったために、同じ接客であると誤判定されることもある(例えば、接客会話区間(3)と接客切替区間(2),(3)の関係)。したがって、接客会話区間と接客切替区間のいずれか一方のみではなく、両方を比較演算して接客区間を特定することで、正確な接客区間を特定できる。   Also, if the customer service section is specified only by the customer service conversation section (customer service conversation section = customer service section), it is erroneously determined that the customer is a different customer service because the conversation is interrupted for a predetermined time or more, even though the customer is the same target customer. (For example, the relationship between the service conversation sections (1) and (2) and the service switching section (1)). On the other hand, since the conversation has not been interrupted for a predetermined time or more even though the target customer is switched, it may be erroneously determined that the customer is the same customer service (for example, the customer service conversation section (3) and the customer service switching section). (Relationship between (2) and (3)). Therefore, it is possible to specify an accurate customer service section by comparing and calculating not only one of the customer service conversation section and the customer service switching section, but also the service section.

なお、本実施形態の接客切替検出部171は、定期的に声紋認証を行い、当該声紋認証結果が変化したとき、対象顧客が切り替わったと判定するものとしたが、所定時間内における同一声紋の出現率が所定値以下となったことにより、対象顧客の切り替わりを検出しても良い。この構成によれば、接客対象が家族連れの場合など、対象顧客が一人であるとは限らないため、所定時間内における同一声紋の出現率に応じて、対象顧客の切り替わりを検出することで、対象顧客別の接客区間を正確に特定することができる。例えば、同一人物の声紋が1分間に1回以上認識できている間は、対象顧客の切り替わりを検出しない、などが考えられる。なお、所定時間内における同一声紋の出現率に応じて、対象顧客の切り替わりを検出するのではなく、所定時間以上継続して同一声紋を検出しない場合、対象顧客が切り替わったと判定しても良い。   Note that the customer service switching detection unit 171 of this embodiment periodically performs voiceprint authentication, and determines that the target customer has been switched when the voiceprint authentication result changes. However, the appearance of the same voiceprint within a predetermined time When the rate is equal to or lower than the predetermined value, the switching of the target customer may be detected. According to this configuration, since the target customer is not always alone, such as when the customer service target is a family member, by detecting the switching of the target customer according to the appearance rate of the same voice print within a predetermined time, It is possible to accurately identify the customer service section for each target customer. For example, it is conceivable that the change of the target customer is not detected while the voice print of the same person can be recognized once or more per minute. In addition, instead of detecting the change of the target customer according to the appearance rate of the same voice print within a predetermined time, if the same voice print is not detected continuously for a predetermined time or more, it may be determined that the target customer has been switched.

続いて、図29を参照し、接客区間特定パターンBについて説明する。接客区間特定パターンBは、接客会話区間と接客切替区間とが重複する区間を抽出して(and条件で比較演算を行い)、接客区間を特定する。例えば、接客区間(1),(2)については、いずれも接客切替区間(1)に含まれる区間であるため、接客会話区間(1),(2)と同じ区間となる。また、接客切替区間(2)は、接客会話区間(3)に含まれる区間であるため、接客切替区間(2)が接客区間(3)となる。さらに、接客会話区間(3)と接客切替区間(3)とを比較し、その重複部分を抽出して接客区間(4)とする。なお、本例においても、区間長が所定時間未満の接客区間を特定しないことが好ましい。   Subsequently, the customer service section specifying pattern B will be described with reference to FIG. The customer service section identification pattern B extracts a section where the customer service conversation section and the customer service switching section overlap (performs a comparison operation under the “and” condition) to identify the customer service section. For example, the customer service sections (1) and (2) are sections included in the customer service switching section (1), and thus are the same sections as the customer service conversation sections (1) and (2). Moreover, since the customer service switching section (2) is included in the customer service conversation section (3), the customer service switching section (2) becomes the customer service section (3). Furthermore, the customer service conversation section (3) and the customer service switching section (3) are compared, and the overlapping portion is extracted as the service section (4). In this example as well, it is preferable not to identify a customer service section whose section length is less than a predetermined time.

続いて、図30を参照し、接客区間特定パターンCについて説明する。接客区間特定パターンCは、接客切替区間を基準にして接客区間を特定する。例えば、接客区間(1)については、接客切替区間(1)と同じ区間となる。但し、接客切替区間よりも接客会話区間が長い場合は(接客会話区間(3)と接客切替区間(2)との関係)、当該接客切替区間の終了時刻を接客区間の切替時刻としない。つまり、同図の例では、接客切替区間(2),(3)を合計した区間を接客区間(2)とする(接客区間(2)の開始時刻は、接客切替区間(2)の開始時刻となり、接客区間(2)の終了時刻は、接客切替区間(3)の終了時刻となる)。なお、本例においても、区間長が所定時間未満の接客区間を特定しないことが好ましい。   Subsequently, the customer service section specifying pattern C will be described with reference to FIG. The customer service section specifying pattern C specifies a customer service section based on the customer service switching section. For example, the customer service section (1) is the same section as the customer service switching section (1). However, when the customer service conversation section is longer than the customer service switching section (a relationship between the customer service conversation section (3) and the customer service switching section (2)), the end time of the customer service switching section is not set as the service section switching time. That is, in the example of the figure, the total of the customer service switching sections (2) and (3) is defined as the service section (2) (the service section (2) start time is the service switching section (2) start time). And the end time of the service section (2) is the end time of the service switching section (3)). In this example as well, it is preferable not to identify a customer service section whose section length is less than a predetermined time.

次に、図31を参照し、接客区間設定(本実施形態の変形例)について説明する。本実施形態では、監視手段を音声取得用マイク2とし、顧客の声紋の変化を検出したとき、対象顧客が切り替わったと判定した。つまり、監視手段(監視内容)として、同図(a−1)を採用した。また、この場合、接客区間特定方法としては、接客区間特定パターンAを採用することが好ましいと記載したが(同図(b−1))、他の特定パターンを採用しても良い。つまり、接客区間特定パターンB(同図(b−2))や、接客区間特定パターンC(同図(b−3))を採用しても良い。さらに、その他の接客区間特定方法として、接客切替区間=接客区間とする方法(同図(b−4))や、接客会話区間=接客区間とする方法(同図(b−5))を採用しても良い。   Next, with reference to FIG. 31, the customer service section setting (modified example of this embodiment) will be described. In the present embodiment, the monitoring means is the voice acquisition microphone 2 and it is determined that the target customer has been switched when a change in the voiceprint of the customer is detected. That is, the same figure (a-1) was employ | adopted as a monitoring means (monitoring content). In this case, it is described that the service section specifying pattern A is preferably used as the service section specifying method ((b-1) in the figure), but other specific patterns may be used. That is, the customer service section specifying pattern B (FIG. (B-2)) and the service section specifying pattern C (FIG. (B-3)) may be employed. Further, as other service area identification methods, a service switching section = a service section (FIG. (B-4)) and a service conversation section = a service section (FIG. (B-5)) are adopted. You may do it.

また、同図(a−2)に示すように、監視内容として、店員のキーワードを監視しても良い。この場合、接客切替検出部171は、店員の音声に対して、音声認識を行い、当該音声認識によって所定のキーワードを検出することにより、対象顧客の切り替わりを検出する。また、管理サーバー15は、音響分析部、音響モデル、言語モデル、単語辞書およびテキスト変換部を含む音声認識部を備えることが前提となる。なお、音声認識部は、録音データに含まれる店員の音声を、発話区間ごとに認識することが好ましい。この構成によれば、所定のキーワードを検出することにより、対象顧客の切り替わりを容易に検出できる。例えば、接客区間の開始を示す「いらっしゃいませ」を検出した時刻を切替検出時刻としても良い。また、接客区間の終了を示す「またのご来店をお待ちしております」、「お買い上げありがとうございます」、「少々お待ちください」を検出した時刻を切替検出時刻としても良い。また、店舗ごとに、接客終了時に発声するキーワードを決めておき、そのキーワードを検出した時刻を切替検出時刻としても良い。この場合のキーワードとしては、例えば「終わり」、「バイバイ」など、通常接客時に使用しないキーワードを採用することが好ましい。さらに、接客区間の開始を示す開始キーワードと、接客区間の終了を示す終了キーワードとの両方を検出することにより、対象顧客の切り替わりをより正確に検出しても良い。つまり、「いらっしゃいませ」キーワード検出によって接客切替区間の開始と看做し、「またのご来店をお待ちしております」のキーワード検出によって接客切替区間の終了と看做しても良い。この場合、上記の実施形態の例とは異なり、隣り合う接客切替区間の間に、間隙が生じることとなる。   Further, as shown in (a-2) in the figure, as a monitoring content, a clerk keyword may be monitored. In this case, the customer service switching detection unit 171 performs voice recognition on the clerk's voice, and detects a target keyword by detecting a predetermined keyword by the voice recognition. The management server 15 is assumed to include a speech recognition unit including an acoustic analysis unit, an acoustic model, a language model, a word dictionary, and a text conversion unit. Note that the voice recognition unit preferably recognizes the clerk's voice included in the recording data for each utterance section. According to this configuration, it is possible to easily detect the change of the target customer by detecting the predetermined keyword. For example, the time at which “welcome” indicating the start of the customer service section is detected may be set as the switching detection time. In addition, the time at which “waiting for another visit”, “thank you for your purchase”, and “please wait for a while” indicating the end of the customer service section may be used as the switching detection time. In addition, a keyword to be uttered at the end of customer service is determined for each store, and the time when the keyword is detected may be set as the switching detection time. As a keyword in this case, it is preferable to adopt a keyword that is not used during normal customer service, such as “End” and “Bye Bye”. Furthermore, the change of the target customer may be detected more accurately by detecting both the start keyword indicating the start of the customer service section and the end keyword indicating the end of the service section. That is, it may be regarded as the start of the customer service switching section by detecting the keyword “I welcome you”, and may be regarded as the end of the customer service switching section by detecting the keyword “Waiting for another visit”. In this case, unlike the example of the above embodiment, a gap is generated between adjacent customer service switching sections.

また、同図(a−3)に示すように、監視手段として店内カメラ11を利用し、店員の行動を監視しても良い。この場合、店員と顧客の接客状況を撮像する接客撮像部111が監視部として機能し、接客切替検出部171は、接客撮像部111により撮像された映像に基づいて、対象顧客の切り替わりを検出する。具体的には、映像の画像認識により、店員を特定し、当該店員の所定の行動を検出することにより、対象顧客の切り替わりを検出する。なお、店内カメラ11は、天井や机に取り付けても良いし、店内カメラ11に代えて、店員の服や体に小型カメラを装着しても良い。また、所定の行動としては、接客終了時に行うお辞儀など、自然発生するアクションが考えられ、この場合の、お辞儀の検出時刻を切替検出時刻としても良い。また、店舗ごとに、接客終了時に行うアクション(合図)を決めておき、そのアクションの検出により、対象顧客の切り替わりを検出しても良い。この場合のアクションとしては、例えば「カメラに向かいVサインを行う」、「所定の場所に移動する」など、通常接客時に行わないアクションを採用することが好ましい。さらに、接客区間の開始を示す開始アクションと、接客区間の終了を示す終了アクションとの両方を検出することにより、対象顧客の切り替わりをより正確に検出しても良い。つまり、「カメラに向かいVサインを行う」行動の検出によって接客切替区間の開始と看做し、「お辞儀」の行動検出によって接客切替区間の終了と看做しても良い。この場合も、隣り合う接客切替区間の間に、間隙が生じることとなる。   In addition, as shown in FIG. 3A-3, the in-store camera 11 may be used as monitoring means to monitor the behavior of the store clerk. In this case, the customer service imaging unit 111 that captures the customer service situation of the clerk and the customer functions as a monitoring unit, and the customer service switching detection unit 171 detects the switching of the target customer based on the video imaged by the customer service imaging unit 111. . Specifically, a store clerk is identified by image recognition of a video, and a change in the target customer is detected by detecting a predetermined behavior of the store clerk. The in-store camera 11 may be attached to a ceiling or a desk, or a small camera may be attached to a store clerk's clothes or body instead of the in-store camera 11. Further, as the predetermined action, a naturally occurring action such as a bow performed at the end of customer service is conceivable, and the detection time of the bow in this case may be set as the switching detection time. In addition, for each store, an action (signal) to be performed at the end of customer service may be determined, and the change of the target customer may be detected by detecting the action. As an action in this case, it is preferable to adopt an action that is not normally performed at the time of customer service, such as “perform a V sign toward the camera” or “move to a predetermined place”. Further, by detecting both a start action indicating the start of the customer service section and an end action indicating the end of the customer service section, the switching of the target customer may be detected more accurately. That is, it may be regarded as the start of the customer service switching section by detecting the action of “V sign toward the camera” and the end of the customer service switching section by detecting the action of “bow”. Also in this case, a gap is generated between adjacent customer service switching sections.

また、同図(a−4)に示すように、監視手段として角度センサー(図示省略)を利用し、店員の動作を監視しても良い。この場合、店員に取り付けられ、当該店員の動作を検出する動作検出部(図示省略)が監視部として機能し、接客切替検出部171は、動作検出部の検出結果に基づいて、対象顧客の切り替わりを検出する。なお、動作検出部は、店員の上半身に取り付けられることが好ましい。また、角度センサーに代えて、重力センサーやジャイロセンサーを採用しても良い。また、動作検出部は、店員用端末5にその検出結果を出力し、店員用端末5から管理サーバー15に出力結果が送信されることが好ましい。この場合、接客切替検出部171は、動作検出部により店員の上半身が傾く動作を検出したことにより、対象顧客の切り替わりを検出する。この構成によれば、店員の上半身が傾く動作により、接客終了時に行うお辞儀が行われたと判定できるため、当該動作検出により、対象顧客の切り替わりを正確に検出できる。   Further, as shown in FIG. 4A-4, an angle sensor (not shown) may be used as monitoring means to monitor the operation of the store clerk. In this case, an operation detection unit (not shown) that is attached to the store clerk and detects the operation of the store clerk functions as a monitoring unit, and the customer service switching detection unit 171 switches target customers based on the detection result of the operation detection unit. Is detected. The motion detection unit is preferably attached to the upper half of the store clerk. Further, a gravity sensor or a gyro sensor may be employed instead of the angle sensor. Moreover, it is preferable that an operation | movement detection part outputs the detection result to the terminal 5 for salesclerks, and the output result is transmitted to the management server 15 from the terminal 5 for salesclerks. In this case, the customer service switching detection unit 171 detects the switching of the target customer by detecting the motion of the store clerk being tilted by the motion detection unit. According to this configuration, since it is possible to determine that the bow performed at the end of customer service has been performed by the operation of tilting the upper body of the store clerk, switching of the target customer can be accurately detected by detecting the operation.

なお、店員の動作としては、上記のような、自然発生する動作の他、店舗ごとに、予め接客終了時に行う動作を決めておき、その動作の検出により、対象顧客の切り替わりを検出しても良い。この場合の動作としては、例えば「店員カードをさわる」、「ポケットをたたく」など、通常接客時に行わない動作が考えられる。また、動作検出部としては、接触センサーや赤外線センサーなど他のセンサーを採用しても良い。また、センサー以外にも、店員によって操作されるタッチ式ボタンなど、各種操作手段を、動作検出部として用いても良い。さらに、接客区間の開始を示す開始動作と、接客区間の終了を示す終了動作との両方を検出することにより、対象顧客の切り替わりをより正確に検出しても良い。つまり、「店員カードをさわる」動作の検出によって接客切替区間の開始と看做し、「お辞儀」の動作検出によって接客切替区間の終了と看做しても良い。この場合も、隣り合う接客切替区間の間に、間隙が生じることとなる。   In addition, as the operation of the store clerk, in addition to the naturally occurring operation as described above, an operation to be performed at the end of the customer service is determined in advance for each store, and the change of the target customer is detected by detecting the operation. good. As an operation in this case, for example, an operation that is not normally performed at the time of customer service such as “touching a clerk card” or “tapping a pocket” is conceivable. Further, as the operation detection unit, another sensor such as a contact sensor or an infrared sensor may be employed. In addition to the sensor, various operation means such as a touch button operated by a store clerk may be used as the motion detection unit. Furthermore, the switching of the target customer may be detected more accurately by detecting both the start operation indicating the start of the service section and the end operation indicating the end of the service section. In other words, it may be regarded as the start of the customer service switching section by detecting the operation of “touching the clerk card”, and may be regarded as the end of the customer service switching section by detecting the operation of “bowing”. Also in this case, a gap is generated between adjacent customer service switching sections.

このように、ユーザーは、管理サーバー15に備えられた入力装置55等により、監視手段および接客区間特定方法として、複数の選択肢から任意の候補を選択可能となっている。また、監視手段と接客区間特定方法の組み合わせは任意であり、使用状況やユーザーのニーズに応じて変更可能である。   As described above, the user can select an arbitrary candidate from a plurality of options as the monitoring means and the customer service section specifying method by using the input device 55 provided in the management server 15 or the like. Further, the combination of the monitoring means and the customer service section specifying method is arbitrary, and can be changed according to the use situation and the needs of the user.

以上説明したとおり、第3実施形態に係る接客支援システムSY3によれば、店員および顧客の少なくとも一方の監視結果から、接客対象となっている対象顧客の切り替わりを検出し、その検出時刻を店員識別情報と関連付け、切替検出データとして記録しておくため、当該切替検出データから、接客切替区間を特定できる。また、切替検出データを記録しておくため、これをマーケティングデータとして集計し、各店員の接客スキルの向上に役立てることができる。   As described above, according to the customer service support system SY3 according to the third embodiment, a change in the target customer serving as a customer is detected from the monitoring result of at least one of the customer and the customer, and the detection time is identified as the customer clerk. Since it is associated with information and recorded as switching detection data, the customer service switching section can be specified from the switching detection data. In addition, since the switching detection data is recorded, it can be aggregated as marketing data, which can be used to improve customer service skills of each store clerk.

また、切替検出データに基づいて特定した接客切替区間と、録音データに基づいて特定した接客会話区間とを、比較演算して接客区間を特定するため、接客対象となる顧客別の接客区間を正確に特定することができる。また、正確な接客区間を特定することで、信頼性の高い会話比率を算出できる。また、算出した会話比率は、接客データの一部として記録されるため、これを接客手法の教材として利用できると共に、各接客(接客データ)について良い接客であったか否かを判別できる。これにより、例えば、会話比率から良い接客と考えられる接客状況を、各店員に示すなど、接客スキルの水平展開に役立てることができる。   In addition, since the customer service switching section specified based on the switching detection data and the customer service conversation section specified based on the recording data are compared and specified to determine the customer service section, the customer service section for each customer to be serviced is accurately determined. Can be specified. Further, by specifying an accurate customer service section, a highly reliable conversation ratio can be calculated. Further, since the calculated conversation ratio is recorded as a part of the customer service data, it can be used as a teaching material for the customer service method, and it can be determined whether or not each customer (customer service data) is a good customer service. Thereby, for example, the customer service situation considered to be a good customer service based on the conversation ratio can be used for horizontal development of customer service skills, such as showing each store clerk.

なお、上記の実施形態では、接客区間特定部175により特定された接客区間における会話比率を算出したが、当該接客区間における顧客満足度を算出し、これらに基づく会話比率データと満足度データとを関連付け、接客データとして記録しても良い。つまり、第2実施形態と第3実施形態を組み合わせた構成としても良い。   In the above embodiment, the conversation ratio in the customer service section specified by the customer service section specifying unit 175 is calculated. However, the customer satisfaction in the customer service section is calculated, and the conversation ratio data and the satisfaction data based on these are calculated. You may record as correlation and customer service data. That is, it is good also as a structure which combined 2nd Embodiment and 3rd Embodiment.

以上、第1実施形態ないし第3実施形態を示したが、これらの各実施形態に示した接客支援システムSY1,SY2,SY3の各処理をプログラムとして提供することが可能である。また、そのプログラムを各種記録媒体(CD−ROM、フラッシュメモリー等)に格納して提供することも可能である。すなわち、コンピューターを、接客支援システムSY1,SY2,SY3の各構成要素として機能させるためのプログラム、およびそれを記録した記録媒体も、本発明の権利範囲に含まれるものである。その他、上述した実施例によらず、各接客支援システムSY1,SY2,SY3のシステム構成や処理工程等について、本発明の要旨を逸脱しない範囲で、適宜変更が可能である。   While the first to third embodiments have been described above, it is possible to provide each process of the customer service support systems SY1, SY2, and SY3 shown in each of these embodiments as a program. Further, the program can be provided by being stored in various recording media (CD-ROM, flash memory, etc.). That is, a program for causing a computer to function as each component of the customer service support system SY1, SY2, SY3 and a recording medium on which the program is recorded are also included in the scope of rights of the present invention. In addition, the system configuration and processing steps of the customer service support systems SY1, SY2, and SY3 can be appropriately changed without departing from the gist of the present invention, regardless of the above-described embodiments.

1…体導音センサー 2…音声取得用マイク 5…店員用端末 6…ビューアー画面 11…店内カメラ 12…POS端末 13…レシートプリンター 14…レジカウンター 15…管理サーバー 16…表示端末 16a…表示画面 18…商品マスタ 19…ネットワーク 212…ボタン群 213…プログレスバー 214…音量調節スライダ D…ビューアー画面 DB…管理サーバー用データベース E11…照会条件選択領域 E12…一覧表示領域 E13…再生操作領域 E21…照会条件選択領域 E22…相関図表示領域 E32…一覧表示領域 E41…接客データ表示領域 E42…グラフ表示領域 R…会計レシート SY…接客支援システム   DESCRIPTION OF SYMBOLS 1 ... Body-conduction sound sensor 2 ... Sound acquisition microphone 5 ... Clerk terminal 6 ... Viewer screen 11 ... In-store camera 12 ... POS terminal 13 ... Receipt printer 14 ... Cash register counter 15 ... Management server 16 ... Display terminal 16a ... Display screen 18 ... Product master 19 ... Network 212 ... Button group 213 ... Progress bar 214 ... Volume control slider D ... Viewer screen DB ... Management server database E11 ... Inquiry condition selection area E12 ... List display area E13 ... Reproduction operation area E21 ... Inquiry condition selection Area E22 ... Correlation diagram display area E32 ... List display area E41 ... Customer service data display area E42 ... Graph display area R ... Accounting receipt SY ... Customer service support system

Claims (18)

人物Aと人物Bの会話を取得する会話取得部と、
取得した前記会話から、前記人物Aの音声であるA音声と、前記人物Bの音声であるB音声と、を抽出する音声抽出部と、
前記A音声と前記B音声の長さの比率、若しくは前記A音声または前記B音声の長さの、前記A音声と前記B音声の長さの合計に対する比率である会話比率を算出する会話比率算出部と、を備えたことを特徴とする会話比率算出装置。
A conversation acquisition unit for acquiring a conversation between the person A and the person B;
A voice extraction unit for extracting A voice, which is the voice of the person A, and B voice, which is the voice of the person B, from the acquired conversation;
Conversation ratio calculation for calculating a conversation ratio that is a ratio of the length of the A voice and the B voice or a ratio of the length of the A voice or the B voice to the total length of the A voice and the B voice A conversation ratio calculation device.
前記人物Aに取り付けられ、当該人物Aが発話したことを検出する発話検出部をさらに備え、
前記音声抽出部は、前記発話検出部の検出結果に基づいて、前記会話に含まれる音声が、前記人物Aの音声であるか前記人物Bの音声であるかを判別し、当該判別結果に基づいて各音声を抽出することを特徴とする請求項1に記載の会話比率算出装置。
An utterance detection unit that is attached to the person A and detects that the person A uttered;
The voice extraction unit determines whether the voice included in the conversation is the voice of the person A or the voice of the person B based on the detection result of the utterance detection unit, and based on the determination result 2. The conversation ratio calculation apparatus according to claim 1, wherein each voice is extracted.
前記人物Aおよび前記人物Bは、接客中における店員および顧客を指し、
前記A音声および前記B音声は、店員音声および顧客音声を指すことを特徴とする請求項1または2に記載の会話比率算出装置。
The person A and the person B refer to a store clerk and a customer during customer service,
The conversation ratio calculation apparatus according to claim 1 or 2, wherein the A voice and the B voice indicate a clerk voice and a customer voice.
息継ぎのない連続する音声区間を1発話区間、所定時間以上途切れないまま繰り返される前記店員または前記顧客の前記発話区間の集合体を1話し掛け区間、としたとき、
前記店員音声の長さは、前記店員による話し掛け区間の長さを指し、
前記顧客音声の長さは、前記顧客による話し掛け区間の長さを指すことを特徴とする請求項3に記載の会話比率算出装置。
When a continuous speech section without breathing is a single utterance section, and a group of the utterance sections of the store clerk or the customer repeated without interruption for a predetermined time or more is a single talk section,
The length of the clerk voice refers to the length of the talk section by the clerk,
The conversation ratio calculation apparatus according to claim 3, wherein the length of the customer voice indicates a length of a talk section by the customer.
息継ぎのない連続する音声区間を1発話区間、所定時間以上途切れないまま繰り返される前記店員または前記顧客の前記発話区間の集合体を1話し掛け区間、としたとき、
前記店員音声の長さは、前記店員による話し掛け区間に含まれる各発話区間の長さの合計を指し、
前記顧客音声の長さは、前記顧客による話し掛け区間に含まれる各発話区間の長さの合計を指すことを特徴とする請求項3に記載の会話比率算出装置。
When a continuous speech section without breathing is a single utterance section, and a group of the utterance sections of the store clerk or the customer repeated without interruption for a predetermined time or more is a single talk section,
The length of the clerk voice refers to the total length of each utterance section included in the talk section by the clerk,
4. The conversation ratio calculation apparatus according to claim 3, wherein the length of the customer voice indicates a total length of each utterance section included in the talk section by the customer.
前記店員と前記顧客の前記話し掛け区間が所定時間以上途切れないまま交互に繰り返される前記話し掛け区間の集合体を1会話区間としたとき、
前記会話比率算出部は、前記会話区間に含まれる1以上の話し掛け区間に基づいて、会話区間ごとの前記会話比率を算出することを特徴とする請求項4または5に記載の会話比率算出装置。
When the conversation section of the store clerk and the customer is alternately repeated without interruption for a predetermined time or more as a conversation section,
The conversation ratio calculation apparatus according to claim 4, wherein the conversation ratio calculation unit calculates the conversation ratio for each conversation section based on one or more conversation sections included in the conversation section.
所定時間以上途切れないまま繰り返される前記会話区間の集合体を1接客区間としたとき、
前記会話比率算出部は、前記接客区間に含まれる各会話区間の会話比率の平均値を、当該接客区間における会話比率として算出することを特徴とする請求項6に記載の会話比率算出装置。
When a set of conversation sections that are repeated without interruption for a predetermined time or longer is defined as one customer service section,
The conversation ratio calculation apparatus according to claim 6, wherein the conversation ratio calculation unit calculates an average value of conversation ratios of the conversation sections included in the service section as a conversation ratio in the service section.
前記店員と前記顧客の前記話し掛け区間が所定時間以上途切れないまま交互に繰り返される前記話し掛け区間の集合体を1会話区間、所定時間以上途切れないまま繰り返される前記会話区間の集合体を1接客区間、としたとき、
前記会話比率算出部は、前記接客区間に含まれる、前記店員による各話し掛け区間の長さの合計または各発話区間の長さの合計であるΣLa(但し、ΣLaはΣLa≧0となる変数)と、前記顧客による各話し掛け区間の長さの合計または発話区間の長さの合計であるΣLb(但し、ΣLbはΣLb≧0となる変数)と、を算出し、ΣLaとΣLbの比率、若しくはΣLaまたはΣLbの(ΣLa+ΣLb)に対する比率を、前記接客区間における会話比率として算出することを特徴とする請求項4または5に記載の会話比率算出装置。
The conversation section of the store clerk and the customer is alternately repeated without interruption for a predetermined time or more, and the conversation section is repeated for one conversation section, and the conversation section is repeated for a predetermined time or more without interruption. When
The conversation ratio calculation unit includes ΣLa (where ΣLa is a variable satisfying ΣLa ≧ 0) that is the sum of the length of each talking section or the total length of each utterance section included in the customer service section. ΣLb (where ΣLb is a variable satisfying ΣLb ≧ 0), and the ratio of ΣLa and ΣLb, or ΣLa or 6. The conversation ratio calculation apparatus according to claim 4, wherein a ratio of ΣLb to (ΣLa + ΣLb) is calculated as a conversation ratio in the customer service section.
請求項7または8に記載の会話比率算出装置における各部と、
前記会話取得部により取得した会話の当事者である前記店員および前記顧客を識別する人物識別部と、
前記人物識別部により識別された前記店員の前記顧客に対する売り上げ実績である売り上げ情報を取得する売り上げ情報取得部と、
前記人物識別部により識別された前記店員および前記顧客と、前記会話比率算出部により算出された前記接客区間における会話比率と、前記売り上げ情報と、を関連付け、接客データとして記録する接客データ記録部と、を備えたことを特徴とする接客データ記録装置。
Each part in the conversation ratio calculation device according to claim 7 or 8,
A person identification unit for identifying the store clerk and the customer who are parties to the conversation acquired by the conversation acquisition unit;
A sales information acquisition unit that acquires sales information that is a sales record for the customer of the store clerk identified by the person identification unit;
A customer service data recording unit that associates the sales clerk and the customer identified by the person identification unit with the conversation ratio in the customer service section calculated by the conversation ratio calculation unit and the sales information, and records it as customer service data; A customer service data recording device comprising:
前記会話取得部により取得した会話の前記接客区間に相当する音声データを録音する音声データ録音部をさらに備え、
前記接客データ記録部は、前記店員および前記顧客、前記会話比率および前記売り上げ情報に、前記音声データ録音部の録音データを関連付け、前記接客データとして記録することを特徴とする請求項9に記載の接客データ記録装置。
A voice data recording unit that records voice data corresponding to the customer service section of the conversation acquired by the conversation acquisition unit;
The said customer service data recording part associates the recording data of the said audio | voice data recording part with the said salesclerk and the said customer, the said conversation ratio, and the said sales information, and records it as said customer service data. Hospitality data recording device.
前記接客区間において、前記店員の音声と前記顧客の音声とが重複した回数である重複回数を計測する重複回数計測部をさらに備え、
前記接客データ記録部は、前記店員および前記顧客、前記会話比率および前記売り上げ情報に、前記重複回数を関連付け、前記接客データとして記録することを特徴とする請求項9または10に記載の接客データ記録装置。
In the customer service section, further comprising a duplication number measuring unit that measures the number of times of duplication, which is the number of times that the voice of the clerk and the voice of the customer are duplicated,
The customer service data recording unit according to claim 9 or 10, wherein the customer service data recording unit associates the number of times of duplication with the store clerk and the customer, the conversation ratio, and the sales information, and records them as the customer service data. apparatus.
前記接客データを確認するためのビューアー画面を表示する画面表示部をさらに備え、
前記画面表示部は、前記店員および/または前記顧客を識別するための人物識別情報の選択または入力により、当該人物識別情報を含む前記接客データを抽出して、前記ビューアー画面に表示することを特徴とする請求項10または11に記載の接客データ記録装置。
A screen display unit for displaying a viewer screen for confirming the customer service data;
The screen display unit extracts the customer service data including the person identification information by selecting or inputting the person identification information for identifying the store clerk and / or the customer, and displays the data on the viewer screen. The service data recording apparatus according to claim 10 or 11.
前記画面表示部は、抽出した前記接客データに含まれる前記録音データの再生操作を行うための再生操作領域を、前記ビューアー画面に表示することを特徴とする請求項12に記載の接客データ記録装置。   13. The customer service data recording apparatus according to claim 12, wherein the screen display unit displays a playback operation area for performing a playback operation of the recorded data included in the extracted customer service data on the viewer screen. . 前記再生操作領域は、再生位置を示すプログレスバーを含み、
前記プログレスバーは、前記店員による話し掛け区間と、前記顧客による話し掛け区間と、これら両区間が重複した重複区間と、を区別して表示することを特徴とする請求項13に記載の接客データ記録装置。
The playback operation area includes a progress bar indicating a playback position,
14. The service data recording apparatus according to claim 13, wherein the progress bar distinguishes and displays a talk section by the store clerk, a talk section by the customer, and an overlapping section in which both sections overlap.
前記画面表示部は、前記接客データに含まれる前記会話比率と前記売り上げ情報との相関関係を図示した相関図を、前記ビューアー画面に表示することを特徴とする請求項12ないし14のいずれか1項に記載の接客データ記録装置。   The said screen display part displays the correlation diagram which illustrated the correlation with the said conversation ratio contained in the said customer service data, and the said sales information on the said viewer screen, The any one of Claim 12 thru | or 14 characterized by the above-mentioned. Service data recording device according to item. コンピューターが、
人物Aと人物Bの会話を取得する会話取得ステップと、
取得した前記会話から、前記人物Aの音声であるA音声と、前記人物Bの音声であるB音声と、を抽出する音声抽出ステップと、
前記A音声と前記B音声の長さの比率、若しくは前記A音声または前記B音声の長さの、前記A音声と前記B音声の長さの合計に対する比率である会話比率を算出する会話比率算出ステップと、を実行することを特徴とする会話比率算出方法。
Computer
A conversation acquisition step of acquiring a conversation between the person A and the person B;
A voice extraction step of extracting A voice, which is the voice of the person A, and B voice, which is the voice of the person B, from the acquired conversation;
Conversation ratio calculation for calculating a conversation ratio that is a ratio of the length of the A voice and the B voice or a ratio of the length of the A voice or the B voice to the total length of the A voice and the B voice And a step of executing a conversation ratio calculation method.
前記コンピューターは、前記人物Aに取り付けられ、当該人物Aが発話したことを検出する発話検出部と接続されており、
前記音声抽出ステップでは、前記発話検出部の検出結果に基づいて、前記会話に含まれる音声が、前記人物Aの音声であるか前記人物Bの音声であるかを判別し、当該判別結果に基づいて各音声を抽出することを特徴とする請求項16に記載の会話比率算出方法。
The computer is attached to the person A and connected to an utterance detection unit that detects that the person A uttered,
In the voice extraction step, it is determined whether the voice included in the conversation is the voice of the person A or the voice of the person B based on the detection result of the utterance detection unit, and based on the determination result The method according to claim 16, wherein each voice is extracted.
コンピューターに、請求項16または17に記載の会話比率算出方法における各ステップを実行させるためのプログラム。   The program for making a computer perform each step in the conversation ratio calculation method of Claim 16 or 17.
JP2010108060A 2010-05-10 2010-05-10 Conversation ratio calculation device, customer service data recording device, conversation ratio calculation method and program Pending JP2011237965A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010108060A JP2011237965A (en) 2010-05-10 2010-05-10 Conversation ratio calculation device, customer service data recording device, conversation ratio calculation method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010108060A JP2011237965A (en) 2010-05-10 2010-05-10 Conversation ratio calculation device, customer service data recording device, conversation ratio calculation method and program

Publications (1)

Publication Number Publication Date
JP2011237965A true JP2011237965A (en) 2011-11-24

Family

ID=45325884

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010108060A Pending JP2011237965A (en) 2010-05-10 2010-05-10 Conversation ratio calculation device, customer service data recording device, conversation ratio calculation method and program

Country Status (1)

Country Link
JP (1) JP2011237965A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5879616B1 (en) * 2014-10-07 2016-03-08 パナソニックIpマネジメント株式会社 Activity status analysis system, activity status analysis device, activity status analysis method, activity status analysis program, and storage medium for storing the program
WO2019139101A1 (en) * 2018-01-12 2019-07-18 ソニー株式会社 Information processing device, information processing method, and program

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5879616B1 (en) * 2014-10-07 2016-03-08 パナソニックIpマネジメント株式会社 Activity status analysis system, activity status analysis device, activity status analysis method, activity status analysis program, and storage medium for storing the program
WO2016056192A1 (en) * 2014-10-07 2016-04-14 パナソニックIpマネジメント株式会社 Activity status analysis system, activity status analysis device, activity status analysis method, activity status analysis program, and recording medium storing said program
JP2016076092A (en) * 2014-10-07 2016-05-12 パナソニックIpマネジメント株式会社 Activity state analysis system, activity state analysis device, activity state analysis method, activity state analysis program, and storage medium for storing program
WO2019139101A1 (en) * 2018-01-12 2019-07-18 ソニー株式会社 Information processing device, information processing method, and program
JPWO2019139101A1 (en) * 2018-01-12 2021-01-28 ソニー株式会社 Information processing equipment, information processing methods and programs
JP7276158B2 (en) 2018-01-12 2023-05-18 ソニーグループ株式会社 Information processing device, information processing method and program
US11837233B2 (en) 2018-01-12 2023-12-05 Sony Corporation Information processing device to automatically detect a conversation

Similar Documents

Publication Publication Date Title
JP5477153B2 (en) Service data recording apparatus, service data recording method and program
JP5533219B2 (en) Hospitality data recording device
US20110282662A1 (en) Customer Service Data Recording Device, Customer Service Data Recording Method, and Recording Medium
JP2011210133A (en) Satisfaction degree calculation method, satisfaction degree calculation device and program
JP6596899B2 (en) Service data processing apparatus and service data processing method
JP2011237966A (en) Customer service support device, customer service support method and program
JP2011210100A (en) Customer service data recording device, customer service data recording method and program
US20170154293A1 (en) Customer service appraisal device, customer service appraisal system, and customer service appraisal method
JP2011221891A (en) Keyword recording device, customer service support device, keyword recording method and program
JP2011221683A (en) Customer service support device, customer service support method, and program
JP4778532B2 (en) Customer information collection management system
WO2016088369A1 (en) Information processing device, conduct evaluation method, and program storage medium
JP2011118583A (en) Injustice degree calculation device, method for controlling injustice degree calculation device and program
JP5874886B1 (en) Service monitoring device, service monitoring system, and service monitoring method
JP5540645B2 (en) Information processing apparatus, information processing apparatus control method, and program
JP5499616B2 (en) Information processing apparatus, information processing apparatus control method, and program
JP2011237957A (en) Satisfaction calculation device, satisfaction calculation method and program
JP2016218911A (en) Customer service evaluating device, customer service evaluating system equipped with the same, and customer service evaluating method
JP2011221627A (en) Customer service support device, customer service support method and program
JP2011237965A (en) Conversation ratio calculation device, customer service data recording device, conversation ratio calculation method and program
JP2011113442A (en) Apparatus for determining accounting processing, method for controlling the apparatus, and program
JP7092035B2 (en) Information processing equipment and information processing method
JP5482079B2 (en) Receipt printer, receipt printer control method and program
JP2011118653A (en) Injustice degree recording device, method for controlling injustice degree recording device and program
JP2008197826A (en) Order data management apparatus and order data management method