JP2014085886A - マーケティング調査システム、マーケティング調査データ抽出装置、マーケティング調査方法及びマーケティング調査データ抽出方法 - Google Patents

マーケティング調査システム、マーケティング調査データ抽出装置、マーケティング調査方法及びマーケティング調査データ抽出方法 Download PDF

Info

Publication number
JP2014085886A
JP2014085886A JP2012235028A JP2012235028A JP2014085886A JP 2014085886 A JP2014085886 A JP 2014085886A JP 2012235028 A JP2012235028 A JP 2012235028A JP 2012235028 A JP2012235028 A JP 2012235028A JP 2014085886 A JP2014085886 A JP 2014085886A
Authority
JP
Japan
Prior art keywords
marketing
survey
data
dictionary
location
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012235028A
Other languages
English (en)
Inventor
Kazuhiro Tachibana
一洋 橘
Takeshi Kato
武 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nissha Printing Co Ltd
Original Assignee
Nissha Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nissha Printing Co Ltd filed Critical Nissha Printing Co Ltd
Priority to JP2012235028A priority Critical patent/JP2014085886A/ja
Publication of JP2014085886A publication Critical patent/JP2014085886A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】任意に集まる人々の会話情報から多くのマーケティング調査データを抽出する。
【解決手段】音声認識装置4は、音声収録装置2で生成される収録データ31aを用いて音声認識を行ない、場所・辞書連結情報としての位置情報31bに関連付けて話者別のキャラクタデータ36を生成する。マーケティング調査データ抽出装置5は、位置情報31bを用いて記憶装置3からマーケティング調査及び収録場所に適する調査用辞書32を取得し、取得された調査用辞書32を用いてキャラクタデータ36を解釈し、マーケティング調査に使用するマーケティングテキストデータ39を抽出する。
【選択図】図1

Description

本発明は、音声認識技術を用いるマーケティング調査システム、マーケティング調査データ抽出装置、マーケティング調査方法及びマーケティング調査データ抽出方法に関する。
マーケティング調査方法には、目的に応じた様々な方法が存在するが、街頭や電話やインターネットにおいてアンケート調査をするのが一般的である。
アンケート調査以外の調査方法としては、電話回線やインターネットなどの特定のチャネルを用いることで調査対象者を特定して、調査対象者との会話から商品に関連する情報を収集するというマーケティング調査方法が考えられる。このようなマーケティング調査方法では、調査対象者を一定時間拘束する必要が生じる。また、アンケート調査の対象者を特定すると、マーケティング調査に必要なデータを確実に得られはするが、アンケート調査対象者にその者がアンケート調査の対象となっているという情報を与えてしまうため、調査対象者がアンケート調査を意識することによって調査結果が変質するという可能性を生じてしまうことにもなる。
そこで、例えば特許文献1(特開2002−197252号公報)に記載されている情報収集システムでは、任意に集まった人々の会話情報を音声認識してキーワードを抽出し、キーワードに基づいて会話情報を分類してデータベースに追加するという手法が採られている。
特開2002−197252号公報
しかし、特許文献1に記載されている情報収集システムでは、キーワードに基づいて会話情報を分類するため、特徴のあるキーワードが含まれる会話情報しかマーケティング調査の対象にされないという問題がある。
本発明の課題は、任意に集まる人々の会話情報から多くのマーケティング調査データを抽出することにある。
以下に、課題を解決するための手段として複数の態様を説明する。これら態様は、必要に応じて任意に組み合せることができる。
本発明の一見地に係るマーケティング調査システムは、収録場所を特定して音声を収録して収録データを生成する音声収録装置と、マーケティング調査の調査項目に応じて準備される複数の調査用辞書を記憶するための記憶装置と、収録データを用いて音声認識を行ない、収録場所に適用可能な調査用辞書を選択するための場所・辞書連結情報に関連付けて話者別のキャラクタデータを生成する音声認識装置と、場所・辞書連結情報を用いて記憶装置からマーケティング調査及び収録場所に適する調査用辞書を取得し、取得された調査用辞書を用いて音声認識装置で認識されるキャラクタデータを解釈し、マーケティング調査に使用するマーケティングテキストデータを抽出するマーケティング調査データ抽出装置と、を備えるものである。
収録場所に任意に集まる人々の会話の音声が音声収録装置に収録され、音声収録装置が生成する収録データから音声認識装置によって話者別にキャラクタデータが位置情報と関連付けて生成される。マーケティング調査データ抽出装置が抽出するマーケティングテキストデータには、話者別のキャラクタデータの中から調査項目に関連があると推察されるマーケティングテキストデータを抽出する際に、マーケティング調査及び収録場所に適する調査用辞書を用いることによって調査項目に関連があるとはじめて推察できるマーケティングテキストデータも含まれる。このようなマーケティングテキストデータを含めることができるので、マーケティング調査及び収録場所に適する調査用辞書を使ってマーケティングテキストデータを抽出しない場合に比べてマーケティング調査に使える情報量を確実に増やせる。
このマーケティング調査システムにおいて、収録データに関連付けるための場所・辞書連結情報を入力する情報入力装置、又は音声収録装置の音声収録時に収録データに関連付けるための場所・辞書連結情報として収録場所の位置情報を生成するポジショニング装置をさらに備えてもよい。情報入力装置又はポジショニング装置を用いることによって、場所・辞書連結情報のマーケティング調査データ抽出装置による入力が容易になる。
このマーケティング調査システムにおいて、調査用辞書を書き換えるための辞書編集装置をさらに備えてもよい。辞書編集装置によって調査用辞書を書き換えることにより、さらにマーケティング調査に適したマーケティングテキストデータの抽出が可能になる。
このマーケティング調査システムにおいて、音声認識装置は、話者の性別、話者の年齢及び話者の感情のうちの少なくとも一つの話者属性情報をキャラクタデータに関連付けて生成し、マーケティング調査データ抽出装置は、マーケティングテキストデータに話者属性情報を関連付けてもよい。話者属性情報が関連付けられているマーケティングテキストデータを用いれば、話者属性情報との関連付けがなされていないマーケティングテキストデータを用いる場合に比べてマーケティング調査の情報量が増える。
このマーケティング調査システムにおいて、マーケティング調査データ抽出装置は、場所・辞書連結情報に含まれる位置情報と関連付けられているコーザル情報を取得して、抽出されるキャラクタデータに関するコーザル情報を位置情報から特定し、マーケティングテキストデータにコーザル情報を関連付けてもよい。コーザル情報が関連付けられているマーケティングテキストデータを用いれば、コーザル情報との関連付けがなされていないマーケティングテキストデータを用いる場合に比べてマーケティング調査の情報量が増える。
このマーケティング調査システムにおいて、収録場所にいる個体の数を検出する個体数検知装置をさらに備え、マーケティング調査データ抽出装置は、個体数検知装置で検知される個体数と音声認識装置で認識されるキャラクタデータの両方を用いてマーケティング調査に関係した話者数を特定してもよい。音声認識だけで個体数を特定しようとすると音声認識の精度を向上させる必要が生じてシステムが高価なものとなり、個体数検知装置だけで個体数を特定しようとするとマーケティング調査に無関係な個体数までカウントしてしまう可能性が高くなる。音声認識装置で認識されるキャラクタデータと個体数検知装置で検知される個体数とを併用することで安価にマーケティング調査に関係ある個体数を精度よく特定できる。
このマーケティング調査システムにおいて、マーケティング調査データ抽出装置が抽出したマーケティングテキストデータを取得し、マーケティング調査の調査仕様を取得し、調査仕様に関連するマーケティングテキストデータを検索することにより、マーケティング調査のための収録場所を選定する収録場所選定装置をさらに備えてもよい。収録場所選定装置によりマーケティング調査のための収録場所を選定でき、マーケティング調査に習熟していない調査者でもマーケティング調査に適した収録場所の選定が容易になる。
このマーケティング調査システムにおいて、所定の話者を識別する話者識別情報を取得し、所定の話者に関するキャラクタデータのみを抽出又は非抽出にする話者別キャラクタデータ選択装置をさらに備えてもよい。不要な所定の話者の情報をマーケティングテキストデータから除くことができ、マーケティング調査の情報の価値が高まる。または、所定の話者の情報をマーケティングテキストデータから拾うことができ、POS(販売時点情報管理)との連動が可能になる。
本発明の他の見地に係るマーケティング調査データ抽出装置は、所定の収録場所で収録される音声の収録データから音声認識して得られるキャラクタデータを取得するキャラクタデータ取得部と、マーケティング調査の調査項目に応じて準備される複数の調査用辞書の中から、収録場所に適用可能な調査用辞書を選択するための場所・辞書連結情報を用いて、マーケティング調査及び収録場所に適する調査用辞書を取得する辞書取得部と、辞書取得部で取得された調査用辞書を用いてキャラクタデータを解釈し、マーケティング調査に使用するマーケティングテキストデータを抽出するマーケティングテキストデータ抽出部と、を備えるものである。
話者別のキャラクタデータの中から調査項目に関連があると推察されるマーケティングテキストデータを抽出する際に、マーケティング調査及び収録場所に適する調査用辞書を用いることによって調査項目に関連があるとはじめて推察できるマーケティングテキストデータも含めることができる。それにより、マーケティング調査及び収録場所に適する調査用辞書を使ってマーケティングテキストデータを抽出しない場合に比べてマーケティング調査に使える情報量を確実に増やせる。
本発明のさらに他の見地に係るマーケティング調査方法は、収録場所を特定して音声を収録して収録データを生成する音声収録ステップと、収録データを用いて音声認識を行ない、収録場所に適用可能な調査用辞書を選択するための場所・辞書連結情報に関連付けて話者別のキャラクタデータを生成する音声認識ステップと、場所・辞書連結情報を用いてマーケティング調査の調査項目に応じて準備される複数の調査用辞書からマーケティング調査及び収録場所に適する調査用辞書を取得し、取得した調査用辞書を用いて音声認識ステップで認識されるキャラクタデータを解釈し、マーケティング調査に使用するマーケティングテキストデータを抽出するマーケティング調査データ抽出ステップと、を備えるものである。
収録場所に任意に集まる人々の会話の音声が音声収録ステップで収録され、その音声に関する収録データから音声認識ステップにおいて話者別にキャラクタデータが生成される。マーケティング調査データ抽出ステップで抽出されるマーケティングテキストデータには、話者別のキャラクタデータの中から調査項目に関連があると推察されるマーケティングテキストデータを抽出する際に、マーケティング調査及び収録場所に適する調査用辞書を用いることによって調査項目に関連があるとはじめて推察できるマーケティングテキストデータも含まれる。そのため、マーケティング調査及び収録場所に適する調査用辞書を使ってマーケティングテキストデータを抽出しない場合に比べてマーケティング調査に使える情報量が確実に増える。
このマーケティング調査方法において、収録データに関連付けるための場所・辞書連結情報を入力する入力ステップ、又は音声収録ステップの音声収録時に収録データに関連付けるための場所・辞書連結情報として収録場所の位置情報を生成するポジショニングステップをさらに備えてもよい。入力ステップ又はポジショニングステップを用いることによって、マーケティング調査データ抽出ステップでの場所・辞書連結情報の入力が容易になる。
このマーケティング調査方法において、音声認識ステップでは、話者の性別、話者の年齢及び話者の感情のうちの少なくとも一つの話者属性情報をキャラクタデータに関連付けて生成し、マーケティング調査データ抽出ステップでは、マーケティングテキストデータと話者属性情報とを関連付けてもよい。話者属性情報が関連付けられているマーケティングテキストデータを用いれば、話者属性情報との関連付けがなされていないマーケティングテキストデータを用いる場合に比べてマーケティング調査の情報量が増える。
このマーケティング調査方法において、マーケティング調査データ抽出ステップでは、場所・辞書連結情報に含まれる位置情報と関連付けられているコーザル情報を取得して、抽出されるキャラクタデータに関するコーザル情報を位置情報から特定し、マーケティングテキストデータにコーザル情報を関連付けてもよい。コーザル情報が関連付けられているマーケティングテキストデータを用いれば、コーザル情報との関連付けがなされていないマーケティングテキストデータを用いる場合に比べてマーケティング調査の情報量が増える。
このマーケティング調査方法において、収録場所にいる個体の数を検出する個体数検知ステップをさらに備え、マーケティング調査データ抽出ステップでは、個体数検知ステップで検知される個体数と音声認識ステップで認識されるキャラクタデータの両方を用いてマーケティング調査に関係した話者数を特定してもよい。音声認識だけで個体数を特定しようとすると音声認識の精度を向上させる必要が生じてシステムが高価なものとなり、個体数検知ステップだけで個体数を特定しようとするとマーケティング調査に無関係な個体数までカウントしてしまう可能性が高くなる。音声認識ステップのキャラクタデータと個体数検知ステップで検知される個体数とを併用することで安価にマーケティング調査に関係ある個体数を精度よく特定できる。
このマーケティング調査方法において、マーケティング調査データ抽出ステップで抽出されたマーケティングテキストデータを取得し、マーケティング調査の調査用辞書を取得し、調査用辞書に関連するマーケティングテキストデータを検索してマーケティング調査のための収録場所を選定する収録場所選定ステップをさらに備えてもよい。収録場所選定ステップによりマーケティング調査のための収録場所を選定でき、マーケティング調査に習熟していない調査者でもマーケティング調査に適した収録場所の選定が容易になる。
このマーケティング調査方法において、所定の話者を識別する話者識別情報を取得し、所定の話者に関するキャラクタデータのみを抽出又は非抽出にするキャラクタデータ選択ステップをさらに備えてもよい。不要な所定の話者の情報をマーケティングテキストデータから除くことができ、マーケティング調査の情報の価値が高まる。または、所定の話者の情報をマーケティングテキストデータから拾うことができ、POSとの連動が可能になる。
本発明のさらに他の見地に係るマーケティング調査データ抽出方法は、所定の収録場所で収録される音声の収録データから音声認識して得られるキャラクタデータを取得するキャラクタデータ取得ステップと、マーケティング調査の調査項目に応じて準備される複数の調査用辞書の中から、収録場所に適用可能な調査用辞書を選択するための場所・辞書連結情報を用いて、マーケティング調査及び収録場所に適する調査用辞書を取得する辞書取得ステップと、辞書取得ステップで取得された調査用辞書を用いてキャラクタデータを解釈し、マーケティング調査に使用するマーケティングテキストデータを抽出するマーケティングテキストデータ抽出ステップと、を備えるものである。
抽出されるマーケティングテキストデータには、話者別のキャラクタデータの中から調査項目に関連があると推察されるマーケティングテキストデータを抽出する際にマーケティング調査及び収録場所に適する調査用辞書を用いることによって調査項目に関連があるとはじめて推察できるマーケティングテキストデータも含まれる。そのため、マーケティング調査及び収録場所に適する調査用辞書を使ってマーケティングテキストデータを抽出しない場合に比べてマーケティング調査に使える情報量が確実に増える。
本発明によれば、任意に集まる人々の会話情報から多くのマーケティング調査データを抽出することができる。
一実施形態に係るマーケティング調査システムの概要を示すブロック図。 マーケティング調査システムの具体的な構成の一例を示すブロック図。 一実施形態に係るマーケティング調査方法の概要を示すフローチャート。 マーケティング調査が行なわれるエリアを模式的に示す平面図。 一実施形態に係るマーケティング調査システムの変形例を示すブロック図。 一実施形態に係るマーケティング調査システムの変形例を示すブロック図。 一実施形態に係るマーケティング調査システムの変形例を示すブロック図。 台帳を説明するための説明図。 (a)辞書選択用場所属性情報を説明するための概念図、(b)他の辞書選択用場所属性情報を説明するための概念図、(c)場所・辞書連結情報を説明するための概念図、(d)他の場所・辞書連結情報を説明するための概念図。
(1)マーケティング調査システムの構成の概要
図1は、一実施形態に係るマーケティング調査システムの概要を示すブロック図である。
図1に示されているマーケティング調査システム1は、音声収録装置2と、記憶装置3と、音声認識装置4と、マーケティング調査データ抽出装置5とを備えている。
マーケティング調査システム1は、音声収録装置2により、収録場所を特定して音声を収録する。音声収録装置2により収録される音声は、音声収録装置2で電気信号に変換されて記憶装置3に記憶可能な収録データとして生成される。収録データは、音声収録装置2から記憶装置3に送信され、記憶装置3に記憶される。音声信号は、所定間隔(例えば1分おき)で時間のタグが付加されており、何時何分に録音されたものであるかが識別できるようになっている。
記憶装置3には、収録データ31a及び収録データ31aの位置情報31bが蓄積されるビッグデータ31以外に、複数の調査用辞書32と、話者属性情報33と、収録場所の場所属性情報34と、コーザル情報35と、辞書選択用場所属性情報37とが記憶されている。なお、音声信号に付されていた時間のタグは、収録データ31aにも付加されている。ここでは、位置情報31bは、収録データ31aが収録された収録場所に適用可能な調査用辞書を選択するための場所・辞書連結情報として収録データ31aに関連付けて記憶される。場所・辞書連結情報とは、収録場所の位置情報、収録時間(時間情報)、調査項目などで収録場所と調査用辞書とを結びつけるための情報である。
音声認識装置4は、記憶装置3に記憶されている収録データ31a及び位置情報31bを取得して、収録データ31aの音声認識を行なう。音声認識により単なる音声を示す収録データ31aが、言葉(話している内容)に対応付けられ、キャラクタデータに変換される。一般には、音声認識装置4で認識されたデータをテキストデータと呼ぶことが多いが、以下で説明するマーケティング調査用テキストデータと区別しやすいように、音声認識されたデータをキャラクタデータと呼ぶ。このマーケティング調査システム1では、収録場所で収録する調査対象者を限定する必要がなく、不特定複数の話者が調査対象者となる。そのため、音声認識装置4で収録データ31aが音声認識されると、不特定複数の話者の音声が話者ごとに区別され、話者別にキャラクタデータ(テキストデータ)が生成される。以下、この話者を区別して生成されるキャラクタデータを話者別のキャラクタデータという。このキャラクタデータにも収録データ31aに付されていた時間のタグは引き継がれる。
この音声認識装置4が音声認識を行なうときも音声認識用辞書41を参照する。音声認識装置4が音声認識の際に参照する音声認識用辞書41は、上述の調査用辞書32とは別に準備されるものであり、一般には調査項目や収録場所によって変更されるものではない。なお、ここでは、記憶装置3に音声認識用辞書41が記憶される場合について示しているが、音声認識用辞書41は音声認識装置4が保持していてもよい。
ところで、収録場所は、一つに限られるものでなく、複数であってもよい。また、複数の収録場所が設定され、異なる時間に複数の収録場所で音声の収録が行なわれてもよく、同時に複数の収録場所で音声の収録が行なわれてもよい。そのため、音声認識の対象としている収録データが、どの収録場所で収録されたものであるかを区別するために収録場所を特定するための位置情報31bがキャラクタデータに関連付けられる。音声認識装置4で位置情報31bが関連付けられたキャラクタデータ36が音声認識装置4から記憶装置3に送信されて記憶される。
記憶装置3に記憶されているキャラクタデータ36は、収録場所で不特定複数の話者が話した文や語句の集合体である。これらの膨大な数の文や語句の中には、マーケティング調査に役立つ情報を含むものと役立つ情報を含まないものとがある。これら膨大な数の文や語句をマーケティング調査の担当者が一つ一つ選別するという方法も考えられる。しかし、収録データが膨大であると、そのような担当者による選別は不合理である。そこで、キャラクタデータ36の中からマーケティング調査に使用するマーケティングテキストデータの抽出がマーケティング調査データ抽出装置5において行なわれる。
例えば、「あれ、美味しかったね。」というAさんの会話文がキャラクタデータ36に含まれているものとする。収録場所が『レストラン』であり、マーケティング調査の調査項目がレストランの『料理』であれば、このAさんの会話文はマーケティング調査に役立つ文である。ところが、収録場所が『デパートの靴売り場』であり、調査項目が『靴』であれば、このAさんの会話文はマーケティング調査には役立たない文である。このように同じ内容のAさんの会話文が、収録場所の場所属性ひいては調査項目の種類によっては、役立つものであったり役立たないものであったりする。
そこで、マーケティング調査の調査項目に対応できるように複数の調査用辞書32が準備されている。例えば調査用辞書32αが調査項目『料理』に対応する調査用辞書であるとすれば、調査用辞書32αには、『美味しい』という単語をマーケティング調査にとって有益な単語と解釈するように記述され、『格好いい』という単語をマーケティング調査にとって無益な単語と解釈されるように記述されている。一方、例えば調査用辞書32βが調査項目『靴』に対応する調査用辞書であるとすれば、調査用辞書32βには、『美味しい』という単語をマーケティング調査にとって無益な単語と解釈するように記述され、『格好いい』という単語をマーケティング調査にとって有益な単語と解釈されるように記述されている。
マーケティング調査データ抽出装置5は、マーケティングテキストデータを抽出する準備として、キャラクタデータ36に対応する位置情報31bに適した調査用辞書32を記憶装置3から取得する。次に、マーケティング調査データ抽出装置5は、調査用辞書32を用いてキャラクタデータ36を解釈してマーケティングテキストデータを抽出する。例えば、上述の例では、レストランで収録されたキャラクタデータ36を解釈するために、マーケティング調査データ抽出装置5は、レストランについてのマーケティング調査に適する調査項目『料理』に対応する調査用辞書32αを記憶装置3から取得する。そして、マーケティング調査データ抽出装置5は、例えば、キャラクタデータ36に含まれている「あれ、美味しかったね。」という会話文を、「あの料理、美味しかったね。」あるいは「あのレストランの料理、美味しかったね。」のように解釈し、マーケティングテキストデータとして記憶装置3のマーケティングテキストデータファイル39に蓄積する。
また、マーケティング調査データ抽出装置5は、記憶装置3に蓄積されるマーケティングテキストデータに対して、話者属性情報33や場所属性情報34やコーザル情報35などの関連付けを行なう。
マーケティング調査データ抽出装置5が記憶装置3に蓄積したマーケティングテキストデータファイル39を使って、データ分析装置6は、調査項目に関係する顧客などの行動や関心や満足度などを数値化したり、明文化したりするマーケティング分析を行なう。
(2)マーケティング調査システムを構成する各装置
(2−1)音声収録装置
音声収録装置2には、2つのタイプがある。1つ目は一つのマーケット調査における音声収録中は移動されない固定型の音声収録装置2Aであり、2つ目は一つのマーケット調査における音声収録中に移動される携帯型の音声収録装置2Bである。
音声収録装置2Aは、本体部21と情報入力装置22と固定具23とを備えている。本体部21は、マイクロフォンなどの音声入力部と音声を電気信号に変換して音声信号を生成する変換部、音声信号を記憶するメモリチップなどの記録媒体などを有している。情報入力装置22は、例えばタッチパネルやキーボードなどであり、収録位置の入力に用いられる。本体部21は、音声収録が終了するまで三脚などの固定具23によって所定の箇所に固定される。
音声収録装置2Bは、本体部24とGPS(Global Positioning System)25とを備えている。本体部24は、マイクロフォンなどの音声入力部と、音声を電気信号に変換して音声信号を生成する変換部と、収録データを記憶するメモリチップなどの記録媒体などを有している。ここで、収録データには、音声信号以外に音声信号が収録された時間を示す時間のタグ及び収録場所の位置情報が記録されている。GPS25は、本体部24から音声収録を実施していることを示す信号を受け取ると、音声収録中の収録場所の位置を示す収録位置信号を生成する。そのため、音声収録装置2Bは、収録位置を変更しても収録場所の位置を自動的に記憶装置3に与えることができる。
また、音声収録装置2A,2Bには、ワイヤレスマイクロフォン2Cを付属させることもできる。例えば、店員W1が顧客W2に対して接客する場合に、その顧客W2に対する接客情報を店員控え室など音声収録装置2A,2Bでの音声集録ができない場所で話すケースも発生する。そのような店員W1の話を収録するために、店員W1にワイヤレスマイクロフォン2Cを装着して使用することができる。ワイヤレスマイクロフォン2Cは、例えば音声を収録するために話者に装着される小型の受話送信器26と受話送信機からの無線信号を受信する受信機27とで構成される。ワイヤレスマイクロフォン2Cで収録される収録データは、音声収録装置2A,2Bで収録される収録データに付属させてもよく、それらとは区別してメモリチップに記憶されるように構成してもよい。
(2−2)記憶装置
記憶装置3には、音声収録装置2A,2Bの記録媒体に記録されている音声信号を読み取る読取装置102(図2参照)が設けられている。読取装置102は、読み取った収録データ31aを記憶装置3のビッグデータ31に蓄積する。このとき同時に、音声収録装置2A,2Bの記録媒体に記録されている収録場所を示す信号を読み取って、収録場所の物理的な位置を収録データ31と関連付けて位置情報31bとして記憶する。
記憶装置3には、マーケティング調査の調査項目に適した複数の調査用辞書32α,32β,32γ…を含む調査用辞書32が記憶されている。調査項目別の調査用辞書32α,32β,32γ…には、例えば、調査項目に適した語句が記述されており、また、主語がない文や指示代名詞が主語となっている文の解釈の仕方が記述されている。
また、記憶装置3には、話者属性情報33と、場所属性情報34と、コーザル情報35と、辞書選択用場所属性情報37とが記憶される。話者属性情報33は、話者の性別や年齢や会話時の感情などである。話者属性情報33は、音声認識装置4が音声認識の際に認識する情報であり、これらの認識には既存の音声認識技術が用いられる。場所属性情報34は、収録場所で行なわれる調査項目や位置とを関連付ける情報である。例えば、遊園地のアトラクションを調査する場合であれば、アトラクションに関連するエリアの位置を記した地図と、調査項目である各エリアのアトラクションとが関連付けられているものである。例えば、同じアトラクションに属するエリアでも、アトラクションからの距離によってエリアごとに重み付けがなされているようなマップであってもよい。このように、その場所についての調査項目との関連の深さなども場所属性情報34に含まれる。このような重み付けを行なうことで、携帯型の音声収録装置2Bで音声を収録する場合に、音声が収録された場所によってマーケティングテキストデータの重要性の判断を異ならせることができる。コーザル情報35とは、価格以外で商品の販売数に影響を与える環境情報である。コーザル情報35には、例えば季節、天候、時間などの自らの意思とは無関係に発生するイベントに関する情報と、セールの実施やチラシの配布など自らの意志決定によって発生が管理できるイベントに関する情報が含まれる。コーザル情報35のうちの時間情報35aは、単なる時間ではなく、音声収録装置2が音声信号を収録した時間のタグとはことなるものである。例えば、レストランの顧客について、朝、昼、夕方などに分けてマーケティング調査をしたい場合に、朝、昼、夕方などのどれに属するかは時間情報35aに照らして時間のタグを用いて判断される。例えば、時間情報35aに朝が開店から午前10時まで、昼が午前10時から午後2時まで、夕方が午後2時から閉店までという記述があり、レストランで収録される収録データ31aαは、朝の収録データと昼の収録データと夜の収録データに分類される。この実施形態において、辞書選択用場所属性情報37は、場所属性情報のうち、調査用辞書32の選択のために収録場所の物理的な位置情報を解釈するのに用いられる情報である。
(2−3)音声認識装置
音声認識装置4は、既存の音声認識技術によって、ヒトの話す音声言語をコンピュータによって解析し、話している内容を文字データとして取り出す装置である。音声認識装置4は、従来と同様に、音声認識のときに音声認識用辞書41を使用する。この音声認識装置4は、収録場所の位置情報31bを音声認識後のキャラクタデータ36に関連付けて記憶装置3に出力する。また、この音声認識装置4は、複数の話者の会話を音声認識によって話者別に認識することができる。例えば、AさんとBさんとCさんの3人の会話が収録データ31aαに収録されている場合に、Aさんが「あのパン、美味しかったね。」、Bさんが「そうだね。」、Cさんが「このバターもいけるよ。」、Aさんが「バターも美味しかったね。」と話したとすると、最初と最後の話者が同じで、次の話者とその次の話者は最初の話者とは別の人であるということを特定して認識できる。
また、音声認識装置4は、例えばAさんが女性であることをその音声の周波数などから特定できる。さらには、年齢や喜怒哀楽の感情が認識できるものであってもよい。性別や年齢や感情などの話者属性情報33を収集することでマーケティング調査の価値が上がる。
(2−4)マーケティング調査データ抽出装置
マーケティング調査データ抽出装置5は、辞書取得部51と、キャラクタデータ取得部52と、マーケティングテキストデータ抽出部53と、情報関連付け部54とを備えている。
辞書取得部51は、記憶装置3に記憶されている調査用辞書32を取得する。調査用辞書32の中からマーケティング調査及び収録場所に適したものを取得するために、辞書取得部51は、キャラクタデータ36に関連付けられている位置情報31bを記憶装置3から取得する。位置情報31bは単に収録場所の物理的な位置を示すに過ぎないため、位置情報31bだけでは、収録場所がどのような属性、例えば調査項目に関係するブランドや商品の陳列場所であるなど、マーケティング調査に係わるどのような特徴を持っているかが分からない。つまり、収録場所の場所属性が分からなければ、調査用辞書32の選択ができない。例えば、デパートの5階のPエリアということが分かっても、それだけの情報では調査する調査項目が認定できないからである。そこで、辞書取得部51は、キャラクタデータ36に関連している位置情報31bを辞書選択用場所属性情報37に照らしてキャラクタデータ36の解釈に用いる調査用辞書32の取得を行なう。辞書選択用場所属性情報37に照らしてキャラクタデータ36の調査項目を特定し、複数の調査用辞書32の中から、特定した調査項目に適する調査用辞書の選択を行なう。例えば、キャラクタデータ36がレストランで収録された収録データ31aαであれば、レストランの『料理』についての調査用辞書32αを辞書取得部51が取得すると言った具合である。調査用辞書32の取得については後ほど詳しく説明する。
辞書取得部51の動作と並行して、キャラクタデータ取得部52は、記憶装置3に記憶されているキャラクタデータ36を取得する。
マーケティングテキストデータ抽出部53は、キャラクタデータ取得部52が取得したキャラクタデータ36を、辞書取得部51が取得した調査用辞書32を用いて解釈し、マーケティング調査で使用するマーケティングテキストデータを膨大なキャラクタデータ36の中から抽出する。マーケティングテキストデータの抽出については、後ほどフローチャートを用いて詳しく説明する。
情報関連付け部54は、マーケティングテキストデータ抽出部53が抽出する各マーケティングテキストデータに話者属性情報33と場所属性情報34とコーザル情報35とを関連付ける。話者属性情報33として男性と女性の区別を関連付ける場合には、例えばマーケティングテキストデータ抽出部53でキャラクタデータ36の文が時系列の順に抽出対象となるよう処理するのであれば、それらの文に対応する男性と女性を識別する符号が文と同様に時系列の順に並べられる。このような場合には、情報関連付け部54では、マーケティングテキストデータとして抽出されたキャラクタデータ36に対応する文の男女別の符号のみを残す作業を行なうことで、マーケティングテキストデータに話者属性情報33として男女の性別を関連付けることができる。
情報関連付け部54は、キャラクタデータ36に付されている時間のタグを用いて、コーザル情報35をマーケティングテキストデータに付加する。例えば、○月○日の午後5時から午後6時にタイムサービスがあったのであれば、その期間の時間のタグを持つマーケティングテキストデータに『タイムサービス』を示す符号を情報関連付け部54は付加する。また、渋谷で○月○日の午前10時から正午までは『雨』という情報がコーザル情報35に記述されていれば、情報関連付け部54は、場所属性情報34を使って渋谷に属するマーケティングテキストデータを特定し、さらにそれらのマーケティングテキストデータが持つ時間のタグから○月○日の午前10時から正午までに収録されたマーケティングテキストデータを特定して『雨』を示す符号を付加する。
データ分析装置6では、情報関連付け部54で話者属性情報33、場所属性情報34及びコーザル情報35が関連付けされているマーケティングテキストデータを用いてマーケティングに関する各種の分析が行なわれる。
(3)マーケティング調査システムの具体的な構成例
マーケティング調査システム1は、具体的には図2に示されているように、主に、音声収録装置2とパーソナルコンピュータ100とによって構成される。パーソナルコンピュータ100は、例えば、CPU(中央演算装置)101と、読取装置102と、データ入力装置103と、メモリシステム104と、表示装置105と、印刷装置106とを備えている。
読取装置102は、音声収録装置2で収録された音声信号が記録されている記録媒体から収録データを読み取る。メモリシステム104には、データ入力装置103から入力されるソフトウェアが記憶される。メモリシステム103に記憶されているソフトウェアを実行することにより、図1に示されている記憶装置3、音声認識装置4、マーケティング調査データ抽出装置5及びデータ分析装置6の各機能ブロックが実現される。表示装置105及び印刷装置106は、収録データの入力やデータ分析に必要な情報の入力を促すためディスプレイを使った表示、あるいはデータ分析結果などの情報のディスプレイを使った表示や用紙を使った印字などの出力を行なうための出力装置である。
(4)マーケティング調査方法の説明
(4−1)マーケティング調査方法の流れ
音声収録装置2及びパーソナルコンピュータ100を使ったマーケティング調査方法について図3のフローチャートに沿って説明する。分かりやすく説明を行なうために、具体的に例を挙げて説明する。
図4に示されているように、4台の音声収録装置2a,2b,2c,2dを使ってデパートの洋服売り場200のマーケティング調査を行なうことを考える。洋服売り場200には、XブランドのエリアPと、ネクタイとジャケットを販売するYブランドのエリアQと、女性の洋服を販売するLブランドのエリアRがあり、エリアPにはネクタイを売るエリアP1とジャケットを売るエリアP2があるものとする。音声収録装置2aがエリアP1に固定され、音声収録装置2bがエリアP2に固定され、音声収録装置2cがエリアQに固定され、音声収録装置2dがエリアRに固定されている。
まず、音声収録装置2a〜2dに、固定されている上述の場所の位置情報が情報入力装置22を使って入力される(ステップS1)。
次に、音声収録装置2a〜2dに、音声が収録される(ステップS2)。音声収録装置2a〜2dの内部では、音声がマイクロフォンなどによって音声信号として取り込まれ、音声信号からコンピュータで読み取り可能な収録データに変換されて音声収録装置2a〜2d内部のメモリチップなどに記憶される。ここでは、所定期間の音声収録が終了した音声収録装置2a〜2dの各メモリチップを、パーソナルコンピュータ100の読取装置102で読み取ることで、メモリシステム104に収録データ31aが読み込まれる。それにより、パーソナルコンピュータ100の中に構築されている記憶装置3に収録データ31aが記憶される。この実施形態では読取装置102も記憶装置3の一部になっている。
次に、パーソナルコンピュータ100のデータ入力装置103を使って場所属性情報34、コーザル情報35及び辞書選択用場所属性情報37などの属性情報が入力される(ステップS3)。ここでは、音声収録後(ステップS2)の後に場所属性情報34及びコーザル情報35が入力される場合について説明しているが、音声の収録前に入力できるものは、音声の収録前(ステップS2よりも前)に入力されてもよい。
場所属性情報34は、例えば、エリアP1の調査項目がネクタイであってブランドはXであり、エリアP2の調査項目がジャケットであってエリアP2のブランドがXであり、エリアQの調査項目がネクタイとジャケットであってエリアQのブランドがYであり、エリアRの調査項目が婦人服であってエリアRのブランドがLである、などという情報である。
辞書選択用場所属性情報37は、例えば、図4に示されているエリアP,Qが調査項目『紳士服』の調査用辞書32εに対応し、エリアQが調査項目『Yブランドの紳士服』の調査用辞書32δに対応し、エリアPが調査項目『Xブランドの紳士服』の調査用辞書32γに対応し、エリアP2が調査項目『ジャケット』の調査用辞書32βに対応し、エリアP1が調査項目『ベルト』の調査用辞書32αに対応する、といった情報である。
コーザル情報35は、例えば、○月○日にブランドXのジャケットのバーゲンセールがある、という情報である。コーザル情報35は、収録日時を過ぎてからでないと入力できないものもあり、例えば天気や収録中に発生したアクシデントなどが収録日時を過ぎてからでないと入力できないコーザル情報である。
次に、収録されている収録データの音声認識が行なわれる(ステップS4)。紳士服に関しては男性客の反応が重要であり、婦人服に関しては女性客の反応が重要であるので、音声認識の際に、男性か女性かの話者属性情報33もこのステップS4で認識される。この話者属性情報33は、メモリシステム104に蓄積される。換言すれば、音声認識装置4から記憶装置3に話者属性情報33が記憶されるということである。
次に、ステップS5からステップS8がマーケティングテキストデータを抽出するステップである。これらのステップについては後ほど詳細に説明する。
最後に、ステップS5からステップS8で抽出されるマーケティングテキストデータを使ってデータ分析が行なわれる(ステップS9)。
(4−2)マーケティングテキストデータの抽出
はじめに、図3に示されているステップS5とステップS6は、この順序で行なわれなければならないものではなく、例えば同時並行で行なわれてもよく、逆の順序で行なわれてもよいという点を説明しておく。ここでは、図3に従って、ステップS5、次にステップS6の順に説明する。
マーケティングテキストデータの抽出を行なうために、まず、調査用辞書32の取得が行なわれる。調査用辞書32は、記憶装置3(メモリシステム104)に予め準備されている。例えば、Xブランドのネクタイに関するマーケティング調査と、Xブランドのジャケットに関するマーケティング調査を個別に行なう場合には、辞書選択用場所属性情報37には、エリアP1のマーケティングテキストデータの抽出に用いる調査用辞書32として調査項目『ベルト』の調査用辞書32αが記述されており、エリアP2のマーケティングテキストデータの抽出に用いる調査用辞書32として調査項目『ジャケット』の調査用辞書32βが記述されている。
まず、音声収録装置2aでの収録に係るキャラクタデータ36からマーケティングテキストデータの抽出が行なわれる。そのため、辞書取得部51は、音声収録装置2aでの収録に係るキャラクタデータ36の位置情報31bαを用いて、辞書選択用場所属性情報37からエリアP1のマーケティングテキストデータの抽出に調査用辞書32αを選択すべきことを読み取り、記憶装置3からその調査用辞書32αを取得する。キャラクタデータ取得部52が音声収録装置2aでの収録に係るキャラクタデータ36を取得し(ステップS6)、マーケティングテキストデータ抽出部53で、この調査用辞書32αを用いてキャラクタデータ36の解釈が行なわれる(ステップS7)。調査用辞書32αには「格好いい」というのはマーケティング調査に有益という記述があるので、「これ、格好いいね。」という文はマーケティングテキストデータとして抽出される。そして、「これ、格好いいね。」という文は、『ネクタイ』の調査用辞書32αを用いることで、「このネクタイは格好いい。」と解釈される。一方、「あれ、美味しかったね。」という文は、『ネクタイ』の調査用辞書32αを用いることで『ネクタイ』のマーケティング調査には無益な文と解釈されるから、マーケティングテキストデータとして抽出されることはない。
次に、音声収録装置2bでの収録に係るキャラクタデータ36からマーケティングテキストデータの抽出が行なわれる。そのため、辞書取得部51は、音声収録装置2bでの収録に係るキャラクタデータ36の位置情報31bβを用いて、辞書選択用場所属性情報37からマーケティングテキストデータの抽出に調査用辞書32βを選択すべきことを読み取り、記憶装置3からその調査用辞書32βを取得する。キャラクタデータ取得部52が音声収録装置2bでの収録に係るキャラクタデータ36を取得し(ステップS6)、マーケティングテキストデータ抽出部53で、この調査用辞書32βを用いてキャラクタデータ36の解釈が行なわれる(ステップS7)。「これ、格好いいね。」という文は、『ジャケット』の調査用辞書32βを用いることで、マーケティングテキストデータとして抽出され、「このジャケットは格好いい。」と解釈される。
このように、音声収録装置2a,2bで収録される音声を異なる調査用辞書32α,32βによって解釈し、例えば、データ分析装置6で、Xブランドについてネクタイとジャケットを比較して、どちらの商品に対して「格好いい」といった顧客が多かったかを分析することができる。
上述の例では、調査項目の異なるものについてマーケティングテキストデータを抽出する場合について説明したが、次は、紳士服のブランドの比較調査をする場合について説明する。この場合、辞書選択用場所属性情報37には、エリアP1(エリアPの一部)の調査項目『Xブランドの紳士服』の調査用辞書32γを選択すべきことが記述されており、エリアP2(エリアPの一部)の調査項目『Xブランドの紳士服』の調査用辞書32γを選択すべきことが記述され、エリアQの調査項目『Yブランドの紳士服』の調査用辞書32δを選択すべきことが記述されている。
まず、音声収録装置2aでの収録に係るキャラクタデータ36からマーケティングテキストデータの抽出が行なわれる。そのため、辞書取得部51は、音声収録装置2aでの収録に係るキャラクタデータ36の位置情報31bαを用いて、辞書選択用場所属性情報37からエリアP1(エリアPの一部)の調査項目『Xブランドの紳士服』の調査用辞書32γを選択すべきことを読み取り、記憶装置3から調査用辞書32γを取得する。キャラクタデータ取得部52が音声収録装置2aでの収録に係るキャラクタデータ36を取得し(ステップS6)、マーケティングテキストデータ抽出部53で、この調査用辞書32γを用いてキャラクタデータ36の解釈が行なわれる(ステップS7)。調査用辞書32γには「格好いい」というのはマーケティング調査に有益という記述があるので、「これ、格好いいね。」という文はマーケティングテキストデータとして抽出される。そして、「これ、格好いいね。」という文は、『Xブランドの紳士服』の調査用辞書32γを用いることで、「このXブランドの紳士服は格好いい。」と解釈される。
次に、音声収録装置2bでの収録に係るキャラクタデータ36からマーケティングテキストデータの抽出が行なわれる。そのため、辞書取得部51は、音声収録装置2bでの収録に係るキャラクタデータ36の位置情報31bβを用いて、辞書選択用場所属性情報37からエリアP2(エリアPの一部)の調査項目『Xブランドの紳士服』の調査用辞書32γを選択すべきことを読み取り、記憶装置3から調査用辞書32γを取得する。キャラクタデータ取得部52が音声収録装置2bでの収録に係るキャラクタデータ36を取得し(ステップS6)、マーケティングテキストデータ抽出部53で、この調査用辞書32γを用いてキャラクタデータ36の解釈が行なわれる(ステップS7)。「これ、格好いいね。」という文は、『Xブランドの紳士服』の調査用辞書32γを用いることで、マーケティングテキストデータとして抽出され、「このXブランドの紳士服は格好いい。」と解釈される。
さらに、音声収録装置2cでの収録に係るキャラクタデータ36からマーケティングテキストデータの抽出が行なわれる。そのため、辞書取得部51は、音声収録装置2cでの収録に係るキャラクタデータ36の位置情報31bγを用いて、辞書選択用場所属性情報37からエリアQの調査項目『Yブランドの紳士服』の調査用辞書32δを選択すべきことを読み取り、記憶装置3から調査用辞書32δを取得する。キャラクタデータ取得部52が音声収録装置2cでの収録に係るキャラクタデータ36を取得し(ステップS6)、マーケティングテキストデータ抽出部53で、この調査用辞書32δを用いてキャラクタデータ36の解釈が行なわれる(ステップS7)。「これ、格好いいね。」という文は、『Yブランドの紳士服』の調査用辞書32δを用いることで、マーケティングテキストデータとして抽出され、「このYブランドの紳士服は格好いい。」と解釈される。
このように、音声収録装置2a,2bと音声収録装置2cで収録される音声を異なる調査用辞書32γ,32δによって解釈し、例えば、データ分析装置6で、XブランドとYブランドを比較して、どちらのブランドに対して「格好いい」といった顧客が多かったかを分析することができる。
同様に、『紳士服』と『婦人服』の調査用辞書32を準備することで、エリアP,QとエリアRの顧客の『紳士服』と『婦人服』に対するマーケティング調査を行なうことができる。
(5)実施形態の作用効果
(5−1)
上述のように、収録場所P1,P2,Q,Rに任意に集まる人々の会話の音声が音声収録装置2a,2b,2c,2dに収録される(ステップS2(音声収録ステップの一例))。その収録データから音声認識装置4によって話者別にキャラクタデータが位置情報31b(場所・辞書連結情報の一例)と関連付けて生成される(ステップS4(音声認識ステップの一例))。例えば、Aさんは、「これ、格好いいね。」といい、それに対して、Bさんが「それ、格好悪いよ。」といったとすると、これらの2つの文は、AさんとBさんの会話文として区別して認識される。
マーケティング調査データ抽出装置5が抽出するマーケティングテキストデータには、話者別の抽出対象のキャラクタデータ36の中から調査項目に関連があると推察されるマーケティングテキストデータを抽出する際(ステップS5〜S7(マーケティング調査データ抽出ステップの一例))に、位置情報31bを用いることによってはじめて調査項目に関連があると推察できるマーケティングテキストデータも含めることができる。
上述のAさんとBさんの会話を、例えば特許文献1に記載されているような収録場所が異なっても同じキーワードで抽出しようとすると、レストランや洋服売り場に特有のキーワードが含まれていないために、上述のAさんとBさんの会話は無益な文として捨てられてしまう。それに対して、位置情報31bを使って上記実施形態のように調査に適した調査用辞書32を取得して用いることで、Aさんの会話文から調査項目を「格好いい」と評価したという情報が得られ、Bさんの会話文から調査項目を「格好悪い」と評価したという情報が得られる。このように、位置情報31bを使ってマーケティングテキストデータを抽出することにより、位置情報31bを使わずにマーケティングテキストデータを抽出しようとする場合に比べてマーケティング調査に使える情報量を確実に増やせる。
(5−2)
上記実施の形態では、情報入力装置22又はGPS25(ポジショニング装置の一例)を用いて位置情報を入力すること(ステップS1(情報入力ステップ又はポジショニングステップの一例))によって、収録データ31aに位置情報31bを関連付けられるので、位置情報31bのマーケティング調査データ抽出装置5による取得が容易になる。
(5−3)
上記実施形態で説明した話者属性情報33が関連付けられているマーケティングテキストデータを用いれば、話者属性情報33との関連付けがなされていないマーケティングテキストデータを用いる場合に比べてマーケティング調査の情報量が増える。
例えば、話者属性情報33として性別が関連付けられているマーケティングテキストデータを用いれば、図4の婦人服売り場であるエリアRで得られたマーケティングテキストデータが女性から得られたものと男性から得られたものに分類することができ、婦人服に対するマーケティング調査の対象者を女性に限定することができる。
同様に、コーザル情報35が関連付けられているマーケティングテキストデータを用いれば、コーザル情報35との関連付けがなされていないマーケティングテキストデータを用いる場合に比べてマーケティング調査の情報量が増える。
例えば、バーゲンセールの有無等のコーザル情報35によって、図4のエリアP2のジャケット売り場でのマーケティングテキストデータを分類すると、バーゲンセールがあった場合となかった場合を比較するマーケティング調査が行なえる。
(6)変形例
(6−1)変形例1A
上記実施形態では、音声収録装置2がパーソナルコンピュータ100に収録データを与える構成としてメモリチップに記憶させて読取装置102で収録データを読み取る構成を説明した。しかし、音声収録装置2が記憶装置3に収録データを与える構成は、このような構成に限られるものではなく、例えば、音声収録装置2とパーソナルコンピュータ100を公衆回線で繋いで、公衆回線を経由して収録データの送受信を行なってもよい。
(6−2)変形例1B
上記実施形態では、音声収録装置2によって生成される収録データが記憶装置3に記憶される場合について説明したが、収録データが記憶されるのは記憶装置3に限られるものではない。例えば、音声収録装置2自身のメモリに記憶されて、音声収録装置2のメモリから音声認識装置4が直接収録データを読み出すように構成することもできる。また、収録でデータが記憶されているメモリチップから音声認識装置4が直接収録データを読み出すように構成することもできる。
(6−3)変形例1C
上記実施形態では、複数の調査用辞書32から適切な辞書を選択して用いる場合だけを説明したが、調査用辞書32は追加、変更あるいは訂正を行うように構成することもできる。
例えば、図5に示されているように、辞書編集装置9を設けてもよい。図4に示されているエリアQが若者向けのブランドである場合を例に上げて考える。調査用辞書32δを用いて、Yブランドの紳士服について「格好いい」といった顧客のマーケティングテキストデータを抽出したところ、予想に反してマーケティングテキストデータの量が極めて少なかったとする。調べてみると、マーケティング調査の時期には、若者の間で「格好いい」という意味で「クール」という表現が流行していたとする。このような状況であれば、辞書編集装置9を用いて、「格好いい」という表現と同等の表現として「クール」という表現を追加するよう辞書を編集する。このように、調査用辞書32δを更新することで、そのときの状況やその場所の属性をさらに詳細に織り込んで調査用辞書32を改良することができる。例えば、辞書編集装置9の入力装置として、データ入力装置103を用いることができ、辞書編集装置9は、メモリシステム104に記憶されているプログラムを実行することにより実現される。
(6−4)変形例1D
上記実施形態では、音声認識装置4によって話者別に音声認識をするので、話者の数を特定することができる。それによってマーケティング調査の対象者の人数を特定することができる。しかし、音声認識において、例えば図4の音声収録装置2a〜2dと話者の距離の変化や向きの変化などによって、話者の特定に誤差が生じる可能性がある。
そこで、マーケティング調査システム1は、図4に示されている人感センサー211,212,213(個体数検知装置の一例)を合わせて用いて調査対象者の人数(個体数)を特定できるように構成されてもよい。例えば、エリアP,Q,Rがドア201,202,203を通って出入りするようなブースであり、マーケティング調査システム1が人感センサー211,212,213でブースに出入りした人数を検知できるように構成されているとする。
エリアP,Q,Rに入ったものが常にマーケティングテキストデータとして抽出できるような会話をするとは限らない。そのため、人感センサー211,212,213だけでは調査対象者の人数を把握するのは難しい。しかし、ブースにいる人数の変動が人感センサー211,212,213で検知できるように構成されることで、ブースの人数が変化しないときに音声認識による話者の人数が変化すれば、その音声認識による話者の変化が誤差であるとマーケティング調査システム1が判断して補正することができる。
このように、音声認識装置4によって区別される話者を、人感センサー211,212,213によって補正することによって、抽出されるマーケティングテキストデータに関連する話者数をより正確に特定することができる。
(6−5)変形例1E
上記実施形態のマーケティング調査システム1は、例えば図6に示されているように、マーケティング調査のための収録場所を選定する収録場所選定装置7をさらに備えてもよい。収録場所選定装置7は、調査仕様入力装置70と、情報抽出部71と、収録場所抽出部72とを備えている。また、記憶装置3は、マーケティングテキストデータファイル39を記憶している。このマーケティングテキストデータファイル39には、位置情報だけでなく、話者属性情報、場所属性情報及びコーザル情報が関連付けられている。調査仕様入力装置70から入力される調査仕様に含まれる調査項目が情報抽出部71で抽出される。この情報抽出部71で抽出される調査項目に合うマーケティングテキストデータが、収録場所抽出部72によって抽出され、抽出されたマーケティングテキストデータが収録された場所を次期の収録場所候補として収録場所選定装置7で選定することができる。調査項目に合うマーケティングテキストデータの抽出は、例えば、『ネクタイ』というキーワードを用いて検索することで行なわれる。例えば、「このネクタイは格好いい。」と解釈されたマーケティングテキストデータが抽出され、エリアP1が収録場所候補として抽出される。調査仕様入力装置70に入力される調査仕様とは、例えば、「調査期間−『○月○日〜△月△日』、調査項目−『ネクタイ』、内容−『ネクタイの好みに関する調査』、性別−『男性』、バーゲンセールの有無−『無』、…、調査担当−『○○』、…」のような調査の仕様が記述されているデータである。
収録場所選定装置7は、選定の際に、抽出されたマーケティングテキストデータに関連する、記憶装置3に記憶されている話者属性情報33、場所属性情報34及びコーザル情報35などをパーソナルコンピュータ100の表示装置105を使って参照できるように構成されてもよい。
また、上述の変形例では、調査仕様を入力する調査仕様入力装置70を用いる場合について説明したが、調査仕様入力装置70に代えて、収録場所を選定するための情報のみを直接入力する装置、例えば収録場所を選定するために調査項目を入力する調査項目入力装置を用いてもよい。
(6−5)変形例1F
上記実施形態のマーケティング調査システム1は、例えば図7に示されているように、所定の話者に関するキャラクタデータのみを抽出又は非抽出にする話者別キャラクタデータ選択装置8をさらに備えてもよい。図7のマーケティング調査システム1には、所定の話者を識別する話者識別情報38が記憶されている。話者識別情報38とは、例えば予め録音された話者の音声信号である。
例えば、デパートの洋服売り場200では、店員の会話文をマーケティングテキストデータとしては抽出したくないような場合がある。このような場合には、店員(所定の話者)の音声信号などを話者識別情報38として記憶装置3に記憶しておき、音声認識の際に、話者別キャラクタデータ選択装置8によって音声認識装置4に店員の音声を認識しないように指示させる。それにより、店員のキャラクタデータのみを非抽出にすることができる。
逆に、デパートの洋服売り場200では、店員の会話文のみをマーケティングテキストデータとしては抽出したい場合がある。例えば各店員の持つノウハウを他店員へも展開したい場合などである。このような場合には、店員(所定の話者の一例)の音声信号などを話者識別情報38として記憶装置3に記憶しておき、音声認識の際に、話者別キャラクタデータ選択装置8によって音声認識装置4に店員の音声のみを抽出するように、あるいは一般の顧客と区別できるように識別符号をつけるように指示させる。それにより、店員のキャラクタデータのみを抽出することもできる。
例えば、店員と顧客との会話を音声収録装置2Aで収録するとともに、店員同士の会話や店員の独り言をワイヤレスマイクロフォン2Cで収録する。話者別キャラクタデータ選択装置8によって、例えば、エリアQがデパートの1階のテニス用品売り場であり、エリアQの店員のキャラクタデータ36aを話者別キャラクタデータ選択装置8により区別して保存するものとする。このキャラクタデータ36aには、その店員W1の顧客△▽▽さんとの会話が記録されるとともに、その店員の独り言が記録される。店員W1が独り言で、「台帳入力、顧客名、△▽▽、年齢、20代前半、商品、N社ランニングシューズ、内容、これからランニングを始めたい、…色はピンク系が希望、購入の有無、N社RAN−T207,備考その他、会員カード作成済み。」とワイヤレスマイクロフォン2Cに対して喋っていたものとする。キャラクタデータ36aには、このエリアQの店員の独り言が含まれる。また、記憶装置3の調査用辞書32にはエリアQの店員W1の台帳作成用の調査用辞書32θも登録されていて、辞書取得部51は、店員W1の台帳作成用の調査用辞書32θを取得する。そして、キャラクタデータ取得部52は、キャラクタデータ36aをマーケティングテキストデータ抽出部53に出力する。マーケティングテキストデータ抽出部53は、調査用辞書32θを使って、キャラクタデータ取得部52から受け取ったキャラクタデータ36aから、『台帳入力』、『顧客名』、『年齢』、『商品』、『内容』、『購入の有無』、『備考その他』をキーワードとして図8に記載されている台帳のマーケティングテキストデータを分類して抽出する。
データ分析装置6によって、このマーケティングテキストデータ抽出部53で抽出される台帳のマーケティングテキストデータが蓄積されて、図8に示されているような台帳が作成される。
(6−6)変形例1G
上記実施形態では、辞書選択用場所属性情報37をパーソナルコンピュータ100で入力する場合について説明したが、辞書選択用場所属性情報37の入力はパーソナルコンピュータ100を用いる場合に限られるものではない。例えば、音声収録装置2Aの情報入力装置22を用いて辞書選択用場所属性情報37を入力してもよい。
また、上記実施形態では、位置情報を場所・辞書連結情報として、図9(a)に示されているように、例えばエリアP2であれば、調査用辞書32β、32γ、32εを自動的に選択してマーケティングテキストデータの抽出が行なわれたが、図9(b)に示されているように、例えば、図2のデータ入力装置103から調査項目を入力して一部の調査用辞書32δ,32γのみを選択するように構成することもできる。図9(b)の例では、調査項目として「Xブランドの紳士服」、「Yブランドの紳士服」をデータ入力装置103から入力することで、エリアP2で収録される収録データの解釈には調査用辞書32γが用いられ、調査用辞書32ε,32βが用いられない。それにより、余分なマーケティングテキストデータの抽出を行なわなくてもよくなる。
また、図9(c)に示されているように、位置情報と時間情報の両方を場所・辞書連結情報として用いてもよい。例えば、同じ場所でも、その場所の陳列商品が変更されたり、デパートの催し物会場のように日替わりで陳列商品が変更されたりするなど時間によって調査項目が変更される場合もあるからである。もし、収録場所が固定されていて時間情報のみによって調査用辞書32の選択が可能な場合には、場所・辞書連結情報として時間情報のみを用いることもできる。
また、図9(d)に示されているように、場所・辞書連結情報として、調査項目と調査用辞書との関係を用いてもよい。例えば、音声収録装置2Aの情報入力装置22により収録場所で行なわれるマーケティング調査の調査項目を入力して、情報入力装置22により入力された調査項目とキャラクタデータ36との関連付けを行なってもよい。そうすれば、エリアP1で収録されて音声認識されたキャラクタデータ36からマーケティングテキストデータを抽出する際に、図9(d)に示されているように調査用辞書32αを用いることができる。
以上説明したように、収録場所と調査用辞書とを関連付ける場所・辞書連結情報は、位置情報に限られるものではない。
(6−7)変形例1H
また、上記実施形態では、マーケティングデータ抽出装置5や収録場所選定装置7の各機能ブロックが、メモリシステム104(ROM、RAM、ハードディスク等)に格納された上述した処理手順を実行可能なプログラムデータがCPU101によって解釈実行されることで実現される場合について説明した。このプログラムデータは、記録媒体を介してメモリシステム104内に導入されてもよいし、記録媒体上から直接実行されてもよい。なお、記録媒体は、ROMやRAMやフラッシュメモリ等の半導体メモリ、フレキシブルディスクやハードディスク等の磁気ディスクメモリ、CD−ROMやDVDやBD等の光ディスクメモリ、及びメモリカード等をいう。また、記録媒体は、電話回線や搬送路等の通信媒体も含む概念である。
また、上記実施形態のマーケティングデータ抽出装置5や収録場所選定装置7の機能ブロックは、集積回路であるLSIとして実現されてもよい。これらは、個別に1チップ化されてもよいし、一部又は全部を含むように1チップ化されてもよい。また、集積回路化の手法は、LSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。また、LSI製造後にプログラムすることが可能なFPGA(Field Programmable Gate Array)などを利用してもよい。
1 マーケティング調査システム
2,2A,2B,2a〜2d 音声収録装置
3 記憶装置
32,32α〜32ε 調査用辞書
4 音声認識装置
5 マーケティング調査データ抽出装置
6 データ分析装置
7 収録場所選定装置
8 話者別キャラクタデータ選択装置
9 辞書編集装置
22 情報入力装置
25 GPS
31 ビッグデータ
31a 収録データ
31b 位置情報
33 話者属性情報
34 場所属性情報
35 コーザル情報
36,36a キャラクタデータ
39 マーケティングテキストデータ
51 辞書取得部
52 キャラクタデータ取得部
53 マーケティングテキストデータ抽出部
211〜213 人感センサー

Claims (17)

  1. 収録場所を特定して音声を収録して収録データを生成する音声収録装置と、
    マーケティング調査の調査項目に応じて準備される複数の調査用辞書を記憶するための記憶装置と、
    前記収録データを用いて音声認識を行ない、前記収録場所に適用可能な前記調査用辞書を選択するための場所・辞書連結情報に関連付けて話者別のキャラクタデータを生成する音声認識装置と、
    前記場所・辞書連結情報を用いて前記記憶装置から前記マーケティング調査及び前記収録場所に適する前記調査用辞書を取得し、取得された前記調査用辞書を用いて前記音声認識装置で認識される前記キャラクタデータを解釈し、マーケティング調査に使用するマーケティングテキストデータを抽出するマーケティング調査データ抽出装置と、
    を備える、マーケティング調査システム。
  2. 前記収録データに関連付けるための前記場所・辞書連結情報を入力する情報入力装置、又は前記音声収録装置の音声収録時に前記収録データに関連付けるための前記場所・辞書連結情報として前記収録場所の位置情報を生成するポジショニング装置をさらに備える、
    請求項1に記載のマーケティング調査システム。
  3. 前記調査用辞書を書き換えるための辞書編集装置をさらに備える、
    請求項1又は請求項2に記載のマーケティング調査システム。
  4. 前記音声認識装置は、話者の性別、話者の年齢及び話者の感情のうちの少なくとも一つの話者属性情報を前記キャラクタデータに関連付けて生成し、
    前記マーケティング調査データ抽出装置は、前記マーケティングテキストデータに前記話者属性情報を関連付ける、
    請求項1から3のいずれか一項に記載のマーケティング調査システム。
  5. 前記マーケティング調査データ抽出装置は、前記場所・辞書連結情報に含まれる位置情報と関連付けられているコーザル情報を取得して、抽出される前記キャラクタデータに関する前記コーザル情報を前記位置情報から特定し、前記マーケティングテキストデータに前記コーザル情報を関連付ける、
    請求項1から4のいずれか一項に記載のマーケティング調査システム。
  6. 前記収録場所にいる個体の数を検出する個体数検知装置をさらに備え、
    前記マーケティング調査データ抽出装置は、前記個体数検知装置で検知される個体数と前記音声認識装置で認識される前記キャラクタデータの両方を用いてマーケティング調査に関係した話者数を特定する、
    請求項1から5のいずれか一項に記載のマーケティング調査システム。
  7. 前記マーケティング調査データ抽出装置が抽出した前記マーケティングテキストデータを取得し、マーケティング調査の調査仕様を取得し、前記調査仕様に関連する前記マーケティングテキストデータを検索することによりマーケティング調査のための前記収録場所を選定する収録場所選定装置をさらに備える、
    請求項1から6のいずれか一項に記載のマーケティング調査システム。
  8. 所定の話者を識別する話者識別情報を取得し、前記所定の話者に関する前記キャラクタデータのみを抽出又は非抽出にする話者別キャラクタデータ選択装置をさらに備える、
    請求項1から7のいずれか一項に記載のマーケティング調査システム。
  9. 所定の収録場所で収録される音声の収録データから音声認識して得られるキャラクタデータを取得するキャラクタデータ取得部と、
    マーケティング調査の調査項目に応じて準備される複数の調査用辞書の中から、前記収録場所に適用可能な前記調査用辞書を選択するための場所・辞書連結情報を用いて、前記マーケティング調査及び前記収録場所に適する前記調査用辞書を取得する辞書取得部と、
    前記辞書取得部で取得された前記調査用辞書を用いて前記キャラクタデータを解釈し、マーケティング調査に使用するマーケティングテキストデータを抽出するマーケティングテキストデータ抽出部と、
    を備える、マーケティング調査データ抽出装置。
  10. 収録場所を特定して音声を収録して収録データを生成する音声収録ステップと、
    前記収録データを用いて音声認識を行ない、前記収録場所に適用可能な前記調査用辞書を選択するための場所・辞書連結情報に関連付けて話者別のキャラクタデータを生成する音声認識ステップと、
    前記場所・辞書連結情報を用いてマーケティング調査の調査項目に応じて準備される複数の調査用辞書から前記マーケティング調査及び前記収録場所に適する前記調査用辞書を取得し、取得した前記調査用辞書を用いて前記音声認識ステップで認識される前記キャラクタデータを解釈し、マーケティング調査に使用するマーケティングテキストデータを抽出するマーケティング調査データ抽出ステップと、
    を備える、マーケティング調査方法。
  11. 前記収録データに関連付けるための前記場所・辞書連結情報を入力する入力ステップ、又は前記音声収録ステップの音声収録時に前記収録データに関連付けるための前記場所・辞書連結情報として前記収録場所の位置情報を生成するポジショニングステップをさらに備える、
    請求項10に記載のマーケティング調査方法。
  12. 前記音声認識ステップでは、話者の性別、話者の年齢及び話者の感情のうちの少なくとも一つの話者属性情報を前記キャラクタデータに関連付けて生成し、
    前記マーケティング調査データ抽出ステップでは、前記マーケティングテキストデータと前記話者属性情報とを関連付ける、
    請求項10又は請求項11に記載のマーケティング調査方法。
  13. 前記マーケティング調査データ抽出ステップでは、前記場所・辞書連結情報に含まれる位置情報と関連付けられているコーザル情報を取得して、抽出される前記キャラクタデータに関する前記コーザル情報を前記位置情報から特定し、前記マーケティングテキストデータに前記コーザル情報を関連付ける、
    請求項10から12のいずれか一項に記載のマーケティング調査方法。
  14. 前記収録場所にいる個体の数を検出する個体数検知ステップをさらに備え、
    前記マーケティング調査データ抽出ステップでは、前記個体数検知ステップで検知される個体数と前記音声認識ステップで認識される前記キャラクタデータの両方を用いてマーケティング調査に関係した話者数を特定する、
    請求項10から13のいずれか一項に記載のマーケティング調査方法。
  15. 前記マーケティング調査データ抽出ステップで抽出された前記マーケティングテキストデータを取得し、マーケティング調査の調査用辞書を取得し、前記調査用辞書に関連する前記マーケティングテキストデータを検索してマーケティング調査のための前記収録場所を選定する収録場所選定ステップをさらに備える、
    請求項10から14のいずれか一項に記載のマーケティング調査方法。
  16. 所定の話者を識別する話者識別情報を取得し、前記所定の話者に関する前記キャラクタデータのみを抽出又は非抽出にするキャラクタデータ選択ステップをさらに備える、
    請求項10から15のいずれか一項に記載のマーケティング調査方法。
  17. 所定の収録場所で収録される音声の収録データから音声認識して得られるキャラクタデータを取得するキャラクタデータ取得ステップと、
    マーケティング調査の調査項目に応じて準備される複数の調査用辞書の中から、前記収録場所に適用可能な前記調査用辞書を選択するための場所・辞書連結情報を用いて、前記マーケティング調査及び前記収録場所に適する前記調査用辞書を取得する辞書取得ステップと、
    前記辞書取得ステップで取得された前記調査用辞書を用いて前記キャラクタデータを解釈し、マーケティング調査に使用するマーケティングテキストデータを抽出するマーケティングテキストデータ抽出ステップと、
    を備える、マーケティング調査データ抽出方法。
JP2012235028A 2012-10-24 2012-10-24 マーケティング調査システム、マーケティング調査データ抽出装置、マーケティング調査方法及びマーケティング調査データ抽出方法 Pending JP2014085886A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012235028A JP2014085886A (ja) 2012-10-24 2012-10-24 マーケティング調査システム、マーケティング調査データ抽出装置、マーケティング調査方法及びマーケティング調査データ抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012235028A JP2014085886A (ja) 2012-10-24 2012-10-24 マーケティング調査システム、マーケティング調査データ抽出装置、マーケティング調査方法及びマーケティング調査データ抽出方法

Publications (1)

Publication Number Publication Date
JP2014085886A true JP2014085886A (ja) 2014-05-12

Family

ID=50788884

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012235028A Pending JP2014085886A (ja) 2012-10-24 2012-10-24 マーケティング調査システム、マーケティング調査データ抽出装置、マーケティング調査方法及びマーケティング調査データ抽出方法

Country Status (1)

Country Link
JP (1) JP2014085886A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5874886B1 (ja) * 2015-03-20 2016-03-02 パナソニックIpマネジメント株式会社 接客モニタリング装置、接客モニタリングシステムおよび接客モニタリング方法
JP7178750B1 (ja) 2022-03-30 2022-11-28 株式会社スキマデパート 情報分析装置、情報分析システム、及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5874886B1 (ja) * 2015-03-20 2016-03-02 パナソニックIpマネジメント株式会社 接客モニタリング装置、接客モニタリングシステムおよび接客モニタリング方法
WO2016151643A1 (ja) * 2015-03-20 2016-09-29 パナソニックIpマネジメント株式会社 接客モニタリング装置、接客モニタリングシステムおよび接客モニタリング方法
JP2016177664A (ja) * 2015-03-20 2016-10-06 パナソニックIpマネジメント株式会社 接客モニタリング装置、接客モニタリングシステムおよび接客モニタリング方法
JP7178750B1 (ja) 2022-03-30 2022-11-28 株式会社スキマデパート 情報分析装置、情報分析システム、及びプログラム
JP2023147582A (ja) * 2022-03-30 2023-10-13 株式会社スキマデパート 情報分析装置、情報分析システム、及びプログラム

Similar Documents

Publication Publication Date Title
US12039583B2 (en) System for virtual agents to help customers and businesses
JP5796496B2 (ja) 入力支援システム、方法、およびプログラム
CN103765440B (zh) 使用背景信息的移动装置上的光学字符辨识
Chon et al. Automatically characterizing places with opportunistic crowdsensing using smartphones
CN104737523B (zh) 通过指派用于数据群集的情境标签来管理移动装置中的情境模型
US20160086135A1 (en) Evaluation apparatus, evaluation method and evaluation system for evaluating evaluation target person
CN106682090A (zh) 主动交互实现装置、方法及智能语音交互设备
CN103488666B (zh) 信息处理设备和方法、电子装置以及计算机可读存储介质
WO2019015641A1 (zh) 模型的训练方法、数据相似度的确定方法、装置及设备
US20060224438A1 (en) Method and device for providing information
US10706371B2 (en) Data processing techniques
CN104392370A (zh) 一种自动获取顾客信息的电子商务系统和方法
CN106599110A (zh) 基于人工智能的语音搜索方法及装置
CN110770714A (zh) 使用自然语言对话的信息取回
CN110168544A (zh) 应答装置、应答装置的控制方法、及控制程序
CN106951433A (zh) 一种检索方法及装置
Ilakkuvan et al. Cameras for public health surveillance: a methods protocol for crowdsourced annotation of point-of-sale photographs
JP6105337B2 (ja) 評価システム及び評価方法
JP2015104078A (ja) 撮像装置、撮像システム、サーバ、撮像方法、及び撮像プログラム
KR20050035076A (ko) 개인정보 축적장치 및 개인정보 관리장치
CN108305629B (zh) 一种场景学习内容获取方法、装置、学习设备及存储介质
JP2014085886A (ja) マーケティング調査システム、マーケティング調査データ抽出装置、マーケティング調査方法及びマーケティング調査データ抽出方法
JP2003099582A (ja) 画像データを用いた状況分析支援方法及びシステム
Hocutt Interrogating Alexa: Holding voice assistants accountable for their answers
US20220051670A1 (en) Learning support device, learning support method, and recording medium