JP2024008408A - 情報管理システム、情報管理装置、情報管理方法及び情報管理プログラム - Google Patents

情報管理システム、情報管理装置、情報管理方法及び情報管理プログラム Download PDF

Info

Publication number
JP2024008408A
JP2024008408A JP2022110261A JP2022110261A JP2024008408A JP 2024008408 A JP2024008408 A JP 2024008408A JP 2022110261 A JP2022110261 A JP 2022110261A JP 2022110261 A JP2022110261 A JP 2022110261A JP 2024008408 A JP2024008408 A JP 2024008408A
Authority
JP
Japan
Prior art keywords
facility
name
information
customer
information management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022110261A
Other languages
English (en)
Other versions
JP7455162B2 (ja
Inventor
建 新井
Ken Arai
雄大 羽賀
Takehiro Haga
弘彰 横山
Hiroaki Yokoyama
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Toyota Systems Corp
Original Assignee
Toyota Motor Corp
Toyota Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp, Toyota Systems Corp filed Critical Toyota Motor Corp
Priority to JP2022110261A priority Critical patent/JP7455162B2/ja
Publication of JP2024008408A publication Critical patent/JP2024008408A/ja
Application granted granted Critical
Publication of JP7455162B2 publication Critical patent/JP7455162B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】各種施設の特徴を表す情報を効率良く収集及び管理することを課題とする。【解決手段】情報管理システムは、施設利用履歴データ14dに対して、クレンジング21、名寄せ22、スクレイピング25、マッチング26などの処理を行って利用した施設の特徴を推定し、この推定結果と顧客属性データ14b及びアンケートデータ14cを用いて機械学習の訓練を行い、顧客プロファイリングスコア予測モデルを生成する。生成した顧客プロファイリングスコア予測モデルに対して、予測対象顧客のデータを入力することにより、予測対象顧客のプロファイリングスコアを予測結果として出力する。【選択図】図1

Description

本発明は、各種施設の特徴を表す情報を効率良く収集及び管理することができる情報管理システム、情報管理装置、情報管理方法及び情報管理プログラムに関する。
従来、顧客が商品の購入又はサービスの提供を受けた場合に、決済情報に基づくWeb検索を行って、商品又はサービス若しくは店舗に関連する情報を収集する技術が知られている。例えば、特許文献1には、ユーザのクレジットカードに係る決済情報を取得し、決済情報が示すクレジットカードの加盟店(クレジットカードを使用できる店舗)の情報又はユーザが購入した商品若しくはサービスの情報に基づくWeb検索を行い、加盟店、商品又はサービスと関連した関連情報を収集する技術が開示されている。この特許文献1では、投稿情報をSNS(Social Networking Service)上に出力するために、加盟店、商品又はサービスと関連した関連情報を収集している。
また、Web検索により収集された情報をグルーピングする技術も知られている(例えば、特許文献2を参照)。これらの先行技術を用いることにより、店舗、商品又はサービスと関連した関連情報を入手し、店舗に係る情報、商品又はサービスに係る情報を取得することができる。
特許第6723030号公報 特開2008-226235号公報
しかしながら、上記特許文献1のものは、加盟店すなわち店舗に関連する関連情報をWeb検索によって収集するものであり、店舗の特徴を表すキーワードを抽出するものではない。SNSへの投稿情報を生成するうえで、店舗の特徴を示すキーワードまでは抽出する必要が無いためである。
このように、特許文献1等では収集することができないが、店舗の特徴を表すキーワードは、顧客の属性情報のプロファイリングやマーケッティング分析などを行う際に重要な情報である。このため、いかに効率良く店舗の特徴を表すキーワードを収集するかが重要な課題となっている。なお、かかる課題は、店舗に限定されるものではなく、公園、海岸、公共場所などの各種のエリア(施設)を対象とする場合にも同様に生ずる課題である。
本発明は、上記の従来技術の課題を解消するためになされたものであって、各種施設の特徴を表す情報を効率良く収集及び管理することができる情報管理システム、情報管理装置、情報管理方法及び情報管理プログラムを提供すること目的とする。
上記課題を解決するため、本発明は、Webページを提供する複数のWebサーバにアクセス可能な情報管理装置を有する情報管理システムであって、前記情報管理装置は、所定の施設の名称を取得する名称取得手段と、前記名称取得手段により取得された施設の名称を正規化する正規化手段と、前記正規化手段により正規化された施設の名称に係る情報を取得可能なWebページから前記施設の特徴をなす特徴情報を収集する特徴情報収集手段と、前記特徴情報収集手段により収集された特徴情報と前記施設の名称とを対応付けて管理する管理手段とを備えたことを特徴とする。
また、本発明は、上記発明において、前記名称取得手段は、顧客が立ち寄った施設の名称又は購買履歴に含まれる施設の名称を取得することを特徴とする。
また、本発明は、上記発明において、前記名称取得手段は、キャッシュレス決済利用登録済みの顧客が立ち寄った施設の名称又は前記顧客の購買履歴に含まれる施設の名称を取得することを特徴とする。
また、本発明は、上記発明において、前記正規化手段は、前記名称取得手段により取得された施設の名称を名寄せ処理して正規化することを特徴とする。
また、本発明は、上記発明において、前記特徴情報収集手段は、前記正規化手段により正規化された施設の名称に係る情報に基づくWebスクレイピングにより、前記Webページから前記施設の特徴をなす特徴情報を収集することを特徴とする。
また、本発明は、上記発明において、前記情報管理装置は、顧客に関する属性情報を記憶した属性情報記憶手段と、前記顧客の属性情報に関するプロファイリングスコアを算出する算出手段と、前記算出手段により算出されたプロファイリングスコアに基づいて、前記属性情報記憶手段に記憶された顧客に関する属性情報に変化が生じたか否かを判定する判定手段とをさらに備えたことを特徴とする。
また、本発明は、上記発明において、前記算出手段は、施設の名称に対応する特徴情報に基づくジャンルを特徴量としたルールベースに基づいて、前記顧客の属性情報に関するプロファイリングスコアを算出することを特徴とする。
また、本発明は、上記発明において、前記情報管理装置は、前記顧客によるアンケートの回答結果を受信する受信手段をさらに備え、前記算出手段は、前記顧客によるアンケートの回答結果を正解データとして学習させた学習済モデルに基づいて、前記顧客の属性情報に関するプロファイリングスコアを算出することを特徴とする。
また、本発明は、上記発明において、前記判定手段は、前記顧客によるアンケートの回答結果と、前記プロファイリングスコアとに基づいて、前記属性情報記憶手段に記憶された顧客に関する属性情報に変化が生じたか否かを判定することを特徴とする。
また、本発明は、Webページを提供する複数のWebサーバにアクセス可能な情報管理装置であって、所定の施設の名称を取得する名称取得手段と、前記名称取得手段により取得された施設の名称を正規化する正規化手段と、前記正規化手段により正規化された施設の名称に係る情報を取得可能なWebページから前記施設の特徴をなす特徴情報を収集する特徴情報収集手段と、前記特徴情報収集手段により収集された特徴情報と前記施設の名称とを対応付けて管理する管理手段とを備えたことを特徴とする。
また、本発明は、Webページを提供する複数のWebサーバにアクセス可能な情報管理装置を有する情報管理システムにおける情報管理方法であって、前記情報管理装置が、所定の施設の名称を取得する名称取得工程と、前記名称取得工程により取得された施設の名称を正規化する正規化工程と、前記正規化工程により正規化された施設の名称に係る情報を取得可能なWebページから前記施設の特徴をなす特徴情報を収集する特徴情報収集工程と、前記特徴情報収集工程により収集された特徴情報と前記施設の名称とを対応付けて管理する管理工程とを含むことを特徴とする。
また、本発明は、Webページを提供する複数のWebサーバにアクセス可能な情報管理装置において実行させる情報管理プログラムであって、所定の施設の名称を取得する名称取得手順と、前記名称取得手順により取得された施設の名称を正規化する正規化手順と、前記正規化手順により正規化された施設の名称に係る情報を取得可能なWebページから前記施設の特徴をなす特徴情報を収集する特徴情報収集手順と、前記特徴情報収集手順により収集された特徴情報と前記施設の名称とを対応付けて管理する管理手順とをコンピュータに実行させることを特徴とする。
本発明によれば、各種施設の特徴を表す情報を効率良く収集及び管理することが可能となる。
図1は、実施形態に係る情報管理システムの概要の説明図である。 図2は、実施形態に係る管理装置の構成を示す図である。 図3は、図2に示した特徴データ、顧客属性データ及びアンケートデータの一例を示す図である。 図4は、図2に示した施設利用履歴データ及び名寄せデータの一例を示す図である。 図5は、図2に示した施設特徴データ及び利用施設特徴データの一例を示す図である。 図6は、実施形態に係る顧客プロファイル予測処理を説明するための説明図である。 図7は、実施形態に係る利用施設の特徴推定処理を説明するための説明図である。 図8は、図7に示したクレンジング処理及び名寄せ処理の一例を示す図である。 図9は、図7に示したクローリング処理、除外サイトの反映処理、スクレイピング処理及びマッチング処理の一例を示す図である。 図10は、実施形態に係る顧客プロファイリングスコア予測結果の一例を示す図である。 図11は、実施形態に係る顧客プロファイリングスコア予測モデル生成の処理手順を示すフローチャートである。
以下に、本実施形態に係る情報管理システム、情報管理装置、情報管理方法及び情報管理プログラムの実施の形態を図面に基づいて詳細に説明する。
<実施形態に係る情報管理システムの概要>
まず、本実施形態に係る情報管理システムの概要について説明する。図1は、本実施形態に係る情報管理システムの概要を説明するための説明図である。
本実施形態に係る情報管理システムは、顧客の氏名、年齢、家族構成などを示す顧客属性データ14bと、趣味や嗜好などの顧客へのアンケートの結果を示すアンケートデータ14cと、顧客が利用した店舗などの施設の利用履歴を示す施設利用履歴データ14dとを記憶する。
情報管理システムは、施設利用履歴データ14dに対して、クレンジング処理21、名寄せ処理22、スクレイピング処理25、マッチング処理26などを行って、利用した施設の特徴を推定する。
情報管理システムは、かかる推定結果と、顧客属性データ14b及びアンケートデータ14cとを用いて機械学習の訓練を行い、顧客プロファイリングスコア予測モデルを生成する。
情報管理システムは、この顧客プロファイリングスコア予測モデルに対して、予測対象となる顧客(以下、「予想対象顧客」と言う)のデータを入力することにより、予測対象顧客のプロファイリングスコアを予測結果として出力する。
このように、本実施形態に係る情報管理システムでは、施設利用履歴データから推定した利用施設の特徴、顧客属性データ及びアンケートデータを用いて訓練した顧客プロファイリングスコア予測モデルを生成し、この顧客プロファイリングスコア予測モデルに予測対象顧客のデータを入力することにより、予測対象顧客のプロファイリングスコアを予測結果として出力するよう構成したので、各種施設の特徴を表す情報を効率良く収集及び管理することが可能となる。
<管理装置10の構成>
次に、本実施形態に係る管理装置10の構成について説明する。図2は、本実施形態に係る管理装置10の構成を示す図である。図2に示すように、管理装置10は、表示部11及び入力部12と接続され、通信部13、記憶部14及び制御部15を有する。
表示部11は、液晶パネルやディスプレイ装置等の表示デバイスである。入力部12は、キーボードやマウス等の入力デバイスである。通信部13は、外部ネットワークであるインターネットとデータ通信するためのインタフェース部である。
記憶部14は、ハードディスク装置や不揮発性メモリ等の記憶デバイスであり、特徴データ14a、顧客属性データ14b、アンケートデータ14c、施設利用履歴データ14d、名寄せデータ14e、施設特徴データ14f及び利用施設特徴データ14gを記憶する。
特徴データ14aは、冠婚葬祭や教育機関などのカテゴリーに対して、その特徴を示すジャンルを関連付けたデータである。顧客属性データ14bは、顧客により登録された該顧客の氏名、年齢、性別、家族構成などを示すデータである。
アンケートデータ14cは、顧客に対して行ったアンケートの結果を示すデータである。アンケートデータ14cは、家族に関する項目、仕事に関する項目、趣味や嗜好に関する項目を含む。
施設利用履歴データ14dは、顧客が利用した施設の履歴を示すデータである。名寄せデータ14eは、施設利用履歴データ14dに対して、クレンジング処理及び名寄せ処理を行って出力したデータである。
施設特徴データ14fは、施設とその特徴を示すジャンルとを関連付けたデータである。施設特徴データ14fは、名寄せデータ14eに対して、クローリング処理、除外サイトの反映処理、スクレイピング処理及び施設特徴データ14fを用いたマッチング処理を行ったデータである。
利用施設特徴データ14gは、施設利用履歴データ14dに対して、名寄せデータ14eを用いた名寄せ処理及び施設特徴データ14fのジャンルの対応付け処理を行ったデータである。
制御部15は、管理装置10の全体制御を行う制御部であり、特徴管理部15a、顧客管理部15b、アンケート管理部15c、施設利用履歴管理部15d、名寄せ処理部15e、施設特徴処理部15f、利用施設特徴管理部15g、モデル訓練部15h及びモデル予測部15iを有する。実際には、これらのプログラムをCPU(Central Processing Unit)にロードして実行することにより、特徴管理部15a、顧客管理部15b、アンケート管理部15c、施設利用履歴管理部15d、名寄せ処理部15e、施設特徴処理部15f、利用施設特徴管理部15g、モデル訓練部15h及びモデル予測部15iにそれぞれ対応するプロセスを実行させることになる。
特徴管理部15aは、特徴データ14aを管理する処理部である。特徴管理部15aは、入力部12からカテゴリー及びジャンルのデータを受け付けたならば、受け付けたデータを特徴データ14aに記憶する。なお、通信部13を介して、カテゴリー及びジャンルを含むデータをインターネット上のカテゴリー及びジャンルを管理するサイトからダウンロードし、特徴データ14aに記憶するようにしてもよい。
顧客管理部15bは、顧客属性データ14bを管理する処理部である。顧客管理部15bは、入力部12から顧客に係るデータを受け付けたならば、受け付けたデータを顧客属性データ14bに記憶する。なお、通信部13を介して、顧客に係るデータをインターネット上の顧客に係るデータを管理するサイトからダウンロードし、顧客属性データ14bに記憶するようにしてもよい。
アンケート管理部15cは、アンケートデータ14cを管理する処理部である。アンケート管理部15cは、入力部12からアンケート内容を受け付けたならば、顧客属性データ14bの顧客IDに対応付けられたメールアドレスに対して、このアンケート内容を送信する。アンケート管理部15cは、顧客が返信したアンケート結果のデータを受け付けたならば、アンケート結果のデータをアンケートデータ14cに記憶する。なお、アンケートは他のサーバ装置又はアプリを介して送信することもできる。また、他のサーバ装置から転送されたアンケートデータ結果のデータを受信して記憶することもできる。
施設利用履歴管理部15dは、施設利用履歴データ14dを管理する処理部である。施設利用履歴管理部15dは、入力部12から顧客の施設利用履歴に係るデータを受け付けたならば、受け付けたデータを施設利用履歴データ14dに記憶する。なお、施設利用履歴には、クレジットカードや電子マネーなどのキャッシュレス決済による購買履歴及びキャッシュレス決済に登録した顧客情報と紐づけられたコネクテッドカーやスマートフォンの位置情報を用いて、顧客が利用した施設を記録するようにしてもよい。また、施設利用履歴は、管理装置10内又はインターネット上に設置されたデータベースに記憶して管理してもよい。
名寄せ処理部15eは、名寄せデータ14eを管理する処理部である。名寄せ処理部15eは、施設利用履歴データ14dに対して、クレンジング処理及び名寄せ処理を行い、名寄せデータ14eを生成する。
施設特徴処理部15fは、施設特徴データ14fを管理する処理部である。施設特徴処理部15fは、名寄せデータ14eに対して、クローリング処理、除外サイトの反映処理、スクレイピング処理及びマッチング処理を行い、施設特徴データ14fを生成する。施設特徴処理部15fは、マッチング処理において、特徴データ14aを用いて処理を行う。
利用施設特徴管理部15gは、利用施設特徴データ14gを管理する処理部である。利用施設特徴管理部15gは、施設利用履歴データ14d及び施設特徴データ14fを用いて、利用施設特徴データ14gを生成する。
モデル訓練部15hは、顧客プロファイリングスコア予測モデルの訓練を行う処理部である。モデル訓練部15hは、顧客プロファイリングスコア予測モデルの訓練を機械学習により行う。機械学習は、教師あり学習、教師なし学習及び強化学習に区分されるが、本実施形態では教師あり学習を用いた場合を説明する。教師あり学習では、教師データとしての入力及び出力を含む訓練データを用いて、機械学習の訓練を行う。
具体的には、モデル訓練部15hは、顧客属性データ14b及び利用施設特徴データ14gを入力データとし、アンケートデータ14cを正しい出力として訓練を行う。
なお、機械学習には、ニアレストネイバー法、サポートベクターマシン、決定木、線形回帰など、様々なアルゴリズムが知られているが、深層学習やルールベースアプローチを使用することによって、顧客のプロファイリングスコア予測をすることもできる。
モデル予測部15iは、訓練された顧客プロファイリングスコア予測モデルを用いて、予測対象顧客のプロファイリングスコアの予測を行う処理部である。モデル予測部15iは、入力部12から予測対象顧客の顧客IDを受け付けたならば、顧客属性データ14b及び利用施設特徴データ14gから、この顧客IDに対応するデータを抽出して顧客プロファイリングスコア予測モデルに入力する。モデル予測部15iは、顧客プロファイリングスコア予測モデルから出力された予測対象顧客のプロファイリングスコア予測結果を表示部11に表示する。
次に、図2に示した管理装置10の記憶部14が記憶するデータの一例について説明する。図3~図5は、図2に示した特徴データ14a、顧客属性データ14b、アンケートデータ14c、施設利用履歴データ14d、名寄せデータ14e、施設特徴データ14f及び利用施設特徴データ14gの一例を示す図である。
図3(a)に示す特徴データ14aは、カテゴリー「冠婚葬祭」に対して、ジャンル「宗教関係」、「ウェディング」、「ファッション」、「雑貨」を対応付け、カテゴリー「教育機関」に対して、ジャンル「大学」、「受験」、「検定・試験」、「生協」を対応付け、カテゴリー「ペット用品」に対して、ジャンル「ペット」、「サロン」、「トリミング」、「通販」を対応付けている。
図3(b)に示す顧客属性データ14bは、顧客ID「KD12345」に対して、登録日「2010/01/15」、氏名「特許太郎」、年齢「35」歳、性別「男」、年収「500」万円、家族構成「妻、子×1」を対応付け、顧客ID「KD67890」に対して、登録日「2012/04/23」、氏名「開発花子」、年齢「22」歳、性別「女」、年収「250」万円、家族構成「父、母、妹」を対応付けている。
図3(c)に示すアンケートデータ14cは、顧客ID「KD12345」に対して、回答日「2015/03/02」、家族「妻、子×2」、仕事「年収650」万円、趣味・嗜好「キャンプ」を対応付け、顧客ID「KD67890」に対して、回答日「2018/03/18」、家族「夫、子×1」、仕事「専業主婦」、趣味・嗜好「料理」を対応付けている。
図4(a)に示す施設利用履歴データ14dは、年月日「2022/05/01」、顧客ID「KD12345」に対して、利用施設「BCDショッピングセンター」を対応付け、年月日「2022/05/02」、顧客ID「KD12345」に対して、利用施設「EFGスポーツ新宿店」を対応付けている。また、年月日「2022/05/05」、顧客ID「KD67890」に対して、利用施設「HIJ料理教室」を対応付け、年月日「2022/05/07」、顧客ID「KD67890」に対して、利用施設「LMNスーパー」を対応付けている。また、年月日「2022/05/12」、顧客ID「KD12345」に対して、利用施設「EFG-Sports-Shinjuku」を対応付けている。
図4(b)に示す名寄せデータ14eは、利用施設「EFGスポーツ新宿店」に対して、施設名「EFGスポーツ新宿店」を対応付け、利用施設「EFG-Sports-Shinjuku」に対して、施設名「EFGスポーツ新宿店」を対応付け、利用施設「HIJクッキング教室」に対して、施設名「HIJクッキング教室」を対応付け、利用施設「HIJ料理教室」に対して、施設名「HIJクッキング教室」を対応付けている。
図5(a)に示す施設特徴データ14fは、施設名「EFGスポーツ新宿店」に対して、ジャンル「スポーツ」、「アウトドア」、「キャンプ」、「登山」を対応付け、施設名「HIJクッキング教室」に対して、ジャンル「料理」、「教室」、「雑貨」、「サロン」を対応付けている。
図5(b)に示す利用施設特徴データ14gは、年月日「2022/05/01」、顧客ID「KD12345」に対して、利用施設「BCDショッピングセンター」、ジャンル「大型店舗」、「小売店」を対応付けている。また、年月日「2022/05/02」、顧客ID「KD12345」に対して、利用施設「EFGスポーツ新宿店」、ジャンル「スポーツ」、「アウトドア」を対応付けている。また、年月日「2022/05/05」、顧客ID「KD67890」に対して、利用施設「HIJクッキング教室」、ジャンル「料理」、「教室」を対応付けている。また、年月日「2022/05/07」、顧客ID「KD67890」に対して、利用施設「LMNスーパー」、ジャンル「小売店」、「食材」を対応付け、年月日「2022/05/12」、顧客ID「KD12345」に対して、利用施設「EFGスポーツ新宿店」、ジャンル「スポーツ」、「アウトドア」を対応付けている。
<実施形態に係る顧客プロファイル予測>
次に、本実施形態に係る顧客プロファイル予測について説明する。図6は、本実施形態に係る顧客プロファイル予測を説明するための説明図である。
図6に示すように、訓練された顧客プロファイリングスコア予測モデルに対して、顧客属性データ14b及び利用施設特徴データ14gの中で、予測対象顧客に該当するデータを入力することにより、顧客のプロファイリングスコアを予測する。
例えば、顧客属性データ14bに登録された時点での予測対象顧客のデータが「男性、25歳、未婚」であった場合、その後の5年間で「ワインに興味」を持ち、「結婚」、その後の5年間では、「アウトドアに興味」を持ち、「出産」、そして「旅行に興味」を持つと予測する。
<実施形態に係る利用施設の特徴推定>
次に、本実施形態に係る利用施設の特徴推定について説明する。図7は、本実施形態に係る利用施設の特徴推定を説明するための説明図である。
図7に示すように、施設利用履歴データ14dに対して、クレンジング処理21及び名寄せ処理22を行うことにより、名寄せデータ14eを生成する。
クレンジング処理21では、施設利用履歴データ14d内の各データにおいて、データの欠落や文字化け、データ形式の間違いがあった場合に、適正なデータへの修正を行う。名寄せ処理22では、同一の施設に対して、複数の名称が記録されていた場合に、同一の名称に統合する処理を行う。
名寄せデータ14eに対して、クローリング処理23、除外サイトの反映処理24、スクレイピング処理25及びマッチング処理26を行うことにより、施設特徴データ14fを生成する。
クローリング処理23では、名寄せデータ14eの施設名を検索ワードとしてインターネット上のサイトの情報を収集し、サイト一覧を生成する。除外サイトの反映処理24では、生成したサイト一覧から、重要度の低いサイトを除外する。例えば、対象施設の公式サイトが最も重要と判定したならば、それ以外のサイトを除外する。
スクレイピング処理25では、対象となるサイトから文字情報を取得し、そのサイトの特徴となるキーワードを抽出してキーワード一覧を生成する。この際、取得した文字情報を言語上で意味を持つ最小単位に分割して、それぞれの品詞や変化などを判別する形態素解析によりキーワードを抽出することができる。
マッチング処理26では、特徴データ14aを用いて、キーワード一覧から対象施設のジャンルを抽出する。そして、対象施設と抽出したジャンルを対応付けて、施設特徴データ14fを生成する。
<利用施設の特徴推定の一例>
次に、本実施形態に係る利用施設の特徴推定の一例について説明する。図8及び図9は、図7に示したクレンジング処理21、名寄せ処理22、クローリング処理23、除外サイトの反映処理24、スクレイピング処理25及びマッチング処理26の一例を示す図である。
図8に示すように、クレンジング処理21では、施設利用履歴データ14d内の各データにおいて、データの欠落や文字化けなどがあったならば、それぞれに適正なデータに修正する。例えば、利用施設が「HIJ料理教室$」、「EFG-Sports-Shinjuk%」と文字化けしていたならば、「HIJ料理教室」、「EFG-Sports-Shinjuku」と修正する。
名寄せ処理22では、施設の住所が同一で施設名が似ている場合には同一の施設と判定し、施設名を同一の名称に統合する。例えば、住所が「東京都新宿区・・・1-2-3」である「EFGスポーツ新宿店」及び「EFG-Sports-Shinjuku」を同一施設と判定し、施設名「EFGスポーツ新宿店」で統一する。同様に、「HIJクッキング教室」及び「HIJ料理教室」を同一施設と判定し、施設名「HIJクッキング教室」で統一する。
図9に示すように、クローリング処理23では、名寄せ処理された施設名を検索ワードとしてインターネット上のサイトの情報を収集する。例えば、施設名「EFGスポーツ新宿店」に対して、「EFGスポーツ新宿店公式サイト」、「EFGスポーツ新宿SNSサイト」、「EFGスポーツ新宿動画サイト」などをサイト一覧として生成する。
除外サイトの反映処理24では、生成したサイト一覧から、重要度の低いサイトを除外する。例えば、施設名「EFGスポーツ新宿店」に対するサイト一覧において、公式サイトを最も重要と判定して、それ以外のサイトをサイト一覧から除外する。
スクレイピング処理25では、対象となるサイトから、形態素解析によりそのサイトの特徴となるキーワードを抽出してキーワード一覧を生成する。例えば、施設名「EFGスポーツ新宿店」に対して、キーワード「スポーツ」、「アウトドア」、「山」、「海」、「キャンプ」、「登山」が対応付けられる。
マッチング処理26では、特徴データ14aを用いて、キーワード一覧から対象施設のジャンルを抽出する。例えば、施設名「EFGスポーツ新宿店」に対して、ジャンル「スポーツ」、「アウトドア」、「キャンプ」、「登山」が対応付けられる。
<顧客プロファイリングスコア予測結果の一例>
次に、本実施形態に係る顧客プロファイリングスコア予測結果の一例について説明する。図10は、本実施形態に係る顧客プロファイリングスコア予測結果の一例を示す図である。
図10に示すように、顧客プロファイリングスコア予測結果は、顧客IDに対して、氏名、年齢、性別、職業、世帯年収、家族構成、ジャンルを対応付ける。なお、ジャンルは100を最大値とした場合の関心度を示している。
例えば、顧客ID「KD12345」に対して、氏名「特許太郎」、年齢「47」歳、性別「男」、職業「会社員」、世帯年収「800」万円、家族構成「妻、子×2」、ジャンルとして、教育「80」、教室「20」、旅行「60」、スポーツ「70」、キャンプ「90」、料理「20」を対応付けている。この顧客は、教育、スポーツ及びキャンプに強い興味を示す傾向にあることが分かる。
また、顧客ID「KD67890」に対して、氏名「開発花子」、年齢「32」歳、性別「女」、職業「パート」、世帯年収「500」万円、家族構成「夫、子×2」、ジャンルとして、教育「60」、教室「90」、旅行「40」、スポーツ「60」、キャンプ「10」、料理「90」を対応付けている。この顧客は、教室及び料理に強い興味を示す傾向にあることが分かる。
<顧客プロファイリングスコア予測モデル生成の処理手順>
次に、本実施形態に係る顧客プロファイリングスコア予測モデル生成の処理手順について説明する。図11は、本実施形態に係る顧客プロファイリングスコア予測モデル生成の処理手順を示すフローチャートである。
図11に示すように、アンケートデータ14cが更新され(ステップS101:Yes)、施設利用履歴データ14dが更新されたならば(ステップS102:Yes)、利用施設の特徴推定を行って利用施設特徴データ14gを更新する(ステップS103)。
アンケートデータ14c及び利用施設特徴データ14gが訓練データとして十分でなく、訓練を行わないならば(ステップS104:No)、ステップS101に移行する。
アンケートデータ14c及び利用施設特徴データ14gが訓練データとして十分整い、訓練を行うならば(ステップS104:Yes)、顧客属性データ14b及び利用施設特徴データ14gを入力データとし、アンケートデータ14cを正しい出力として訓練を実施して顧客プロファイリングスコア予測モデルを生成し(ステップS105)、処理を終了する。
上述してきたように、本実施形態に係る情報管理システムでは、施設利用履歴データから推定した利用施設の特徴、顧客属性データ及びアンケートデータを用いて訓練した顧客プロファイリングスコア予測モデルを生成し、この顧客プロファイリングスコア予測モデルに予測対象顧客のデータを入力することにより、予測対象顧客のプロファイリングスコアを予測結果として出力するよう構成したので、各種施設の特徴を表す情報を効率良く収集及び管理することが可能となる。
なお、上記の実施形態では、教師あり学習を採用した機械学習によって、顧客プロファイリングスコア予測モデルの訓練を行う場合について説明したが、本発明はこれに限定されるものではなく、教師なし学習を採用した機械学習によって、顧客プロファイリングスコア予測モデルの訓練を行うよう構成することもできる。
また、上記の実施形態では、顧客プロファイリングスコア予測モデルを用いて顧客プロファイリングスコアを予測する場合について説明したが、本発明はこれに限定されるものではなく、算出した顧客プロファイリングスコアを用いて、施設や車種などの項目との関連を集計する、あるいは、この集計結果を用いて顧客に対するクラスタリングを行うよう構成することもできる。
例えば、顧客プロファイリングスコアと施設や車種との関連を集計することによって、ワインとゴルフに興味を示す顧客は、種類Sの施設を利用する傾向にあると推定することができる。同様に、ワインとゴルフに興味を示す顧客は、車種Kの車を購入する傾向にあると推定することもできる。
また、この集計結果を用いた顧客に対するクラスタリングを行うことによって、施設Tをよく利用する顧客は、ファミリークラスタであると推定することができる。同様に、車種Lの車を所有する顧客は、高級志向クラスタであることを推定することもできる。
また、施設を良く利用する顧客にキーワードとなるジャンルを付与し、この顧客に対して教師なし学習を用いて自己組織化マップを構成し、クラスタリングを行う。そして、サービスや商品の典型的なユーザ像を示すペルソナの特定やジャンルの関係性を予測するよう構成することもできる。例えば、顧客が女性クラスタにクラスタリングされた場合には、フリマ、服、化粧品、マンガ又はイケメンアーティスト等のペルソナやジャンルに関係すると予測することができる。なお、自己組織化マップ(SOM; Self-Organizing Map)とは、T. Kohonenにより提案された教師なし学習を行うニューラルネットワークアルゴリズムであり、高次元データを2次元平面上へ非線形写像するデータ解析手法である。
また、上記の実施形態で図示した各構成は機能概略的なものであり、必ずしも物理的に図示の構成をされていることを要しない。すなわち、各装置の分散・統合の形態は図示のものに限られず、その全部又は一部を各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。
本発明に係る情報管理システム、情報管理装置、情報管理方法及び情報管理プログラムは、各種施設の特徴を表す情報を効率良く収集及び管理する場合に有用である。
10 管理装置
11 表示部
12 入力部
13 通信部
14 記憶部
14a 特徴データ
14b 顧客属性データ
14c アンケートデータ
14d 施設利用履歴データ
14e 名寄せデータ
14f 施設特徴データ
14g 利用施設特徴データ
15 制御部
15a 特徴管理部
15b 顧客管理部
15c アンケート管理部
15d 施設利用履歴管理部
15e 名寄せ処理部
15f 施設特徴処理部
15g 利用施設特徴管理部
15h モデル訓練部
15i モデル予測部
21 クレンジング
22 名寄せ
23 クローリング
24 除外サイトの反映
25 スクレイピング
26 マッチング
上記課題を解決するため、本発明は、Webページを提供する複数のWebサーバにアクセス可能な情報管理装置を有する情報管理システムであって、前記情報管理装置は、所定の施設の名称を取得する名称取得手段と、前記名称取得手段により取得された施設の名称を正規化する正規化手段と、前記正規化手段により正規化された施設の名称に係る情報を取得可能なWebページから前記施設の特徴をなす特徴情報を収集する特徴情報収集手段と、前記特徴情報収集手段により収集された特徴情報と前記施設の名称とを対応付けて管理する管理手段と、前記管理手段により施設名称に対応付けられた特徴情報と、顧客の施設利用履歴情報とに基づいて、利用施設特徴情報を生成する生成手段と、前記生成手段により生成された前記利用施設特徴情報及び/又は前記顧客に関する属性情報に基づいてプロファイリングスコアを算出する算出手段と、前記算出手段により算出された前記プロファイリングスコアを出力する出力手段とを備えたことを特徴とする。
また、本発明は、上記発明において、前記算出手段は、教師データとしての学習用利用施設特徴情報、学習用顧客属性情報及びアンケートデータに基づいて学習された学習済モデルに対して、前記生成手段により生成された前記利用施設特徴情報及び/又は前記顧客に関する属性情報を入力してプロファイリングスコアを算出することを特徴とする。
また、本発明は、上記発明において、前記算出手段は、学習用利用施設特徴情報、学習用顧客属性情報及びアンケートデータに基づいて教師なし学習によって学習された学習済モデルに対して、前記生成手段により生成された前記利用施設特徴情報及び/又は前記顧客に関する属性情報を入力してプロファイリングスコアを算出することを特徴とする。
また、本発明は、上記発明において、前記情報管理装置は、前記顧客によるアンケートの回答結果を受信する受信手段をさらに備え、前記学習済モデルは、前記教師データとしての学習用利用施設特徴情報、学習用顧客属性情報及び前記顧客によるアンケートの回答結果を示すアンケートデータに基づいて学習された学習済モデルであることを特徴とする。
また、本発明は、上記発明において、前記利用施設特徴情報は、顧客を識別する顧客識別情報と、利用施設と、施設を利用した年月日とを含むことを特徴とすることを特徴とする。
また、本発明は、上記発明において、前記利用施設特徴情報は、施設のジャンルであることを特徴とする。
また、本発明は、Webページを提供する複数のWebサーバにアクセス可能な情報管理装置であって、所定の施設の名称を取得する名称取得手段と、前記名称取得手段により取得された施設の名称を正規化する正規化手段と、前記正規化手段により正規化された施設の名称に係る情報を取得可能なWebページから前記施設の特徴をなす特徴情報を収集する特徴情報収集手段と、前記特徴情報収集手段により収集された特徴情報と前記施設の名称とを対応付けて管理する管理手段と、前記管理手段により施設名称に対応付けられた特徴情報と、顧客の施設利用履歴情報とに基づいて、利用施設特徴情報を生成する生成手段と、前記生成手段により生成された前記利用施設特徴情報及び/又は前記顧客に関する属性情報に基づいてプロファイリングスコアを算出する算出手段と、前記算出手段により算出された前記プロファイリングスコアを出力する出力手段とを備えたことを特徴とする。
また、本発明は、Webページを提供する複数のWebサーバにアクセス可能な情報管理装置を有する情報管理システムにおける情報管理方法であって、前記情報管理装置が、所定の施設の名称を取得する名称取得工程と、前記名称取得工程により取得された施設の名称を正規化する正規化工程と、前記正規化工程により正規化された施設の名称に係る情報を取得可能なWebページから前記施設の特徴をなす特徴情報を収集する特徴情報収集工程と、前記特徴情報収集工程により収集された特徴情報と前記施設の名称とを対応付けて管理する管理工程と、前記管理工程により施設名称に対応付けられた特徴情報と、顧客の施設利用履歴情報とに基づいて、利用施設特徴情報を生成する生成工程と、前記生成工程により生成された前記利用施設特徴情報及び/又は前記顧客に関する属性情報に基づいてプロファイリングスコアを算出する算出工程と、前記算出工程により算出された前記プロファイリングスコアを出力する出力工程とを含むことを特徴とする。
また、本発明は、Webページを提供する複数のWebサーバにアクセス可能な情報管理装置において実行させる情報管理プログラムであって、所定の施設の名称を取得する名称取得手順と、前記名称取得手順により取得された施設の名称を正規化する正規化手順と、前記正規化手順により正規化された施設の名称に係る情報を取得可能なWebページから前記施設の特徴をなす特徴情報を収集する特徴情報収集手順と、前記特徴情報収集手順により収集された特徴情報と前記施設の名称とを対応付けて管理する管理手順と、前記管理手順により施設名称に対応付けられた特徴情報と、顧客の施設利用履歴情報とに基づいて、利用施設特徴情報を生成する生成手順と、前記生成手順により生成された前記利用施設特徴情報及び/又は前記顧客に関する属性情報に基づいてプロファイリングスコアを算出する算出手順と、前記算出手順により算出された前記プロファイリングスコアを出力する出力手順とをコンピュータに実行させることを特徴とする。

Claims (12)

  1. Webページを提供する複数のWebサーバにアクセス可能な情報管理装置を有する情報管理システムであって、
    前記情報管理装置は、
    所定の施設の名称を取得する名称取得手段と、
    前記名称取得手段により取得された施設の名称を正規化する正規化手段と、
    前記正規化手段により正規化された施設の名称に係る情報を取得可能なWebページから前記施設の特徴をなす特徴情報を収集する特徴情報収集手段と、
    前記特徴情報収集手段により収集された特徴情報と前記施設の名称とを対応付けて管理する管理手段と
    を備えたことを特徴とする情報管理システム。
  2. 前記名称取得手段は、
    顧客が立ち寄った施設の名称又は購買履歴に含まれる施設の名称を取得することを特徴とする請求項1に記載の情報管理システム。
  3. 前記名称取得手段は、
    キャッシュレス決済利用登録済みの顧客が立ち寄った施設の名称又は前記顧客の購買履歴に含まれる施設の名称を取得することを特徴とする請求項2に記載の情報管理システム。
  4. 前記正規化手段は、
    前記名称取得手段により取得された施設の名称を名寄せ処理して正規化することを特徴とする請求項1に記載の情報管理システム。
  5. 前記特徴情報収集手段は、
    前記正規化手段により正規化された施設の名称に係る情報に基づくWebスクレイピングにより、前記Webページから前記施設の特徴をなす特徴情報を収集することを特徴とする請求項1に記載の情報管理システム。
  6. 前記情報管理装置は、
    顧客に関する属性情報を記憶した属性情報記憶手段と、
    前記顧客の属性情報に関するプロファイリングスコアを算出する算出手段と、
    前記算出手段により算出されたプロファイリングスコアに基づいて、前記属性情報記憶手段に記憶された顧客に関する属性情報に変化が生じたか否かを判定する判定手段と
    をさらに備えたことを特徴とする請求項1に記載の情報管理システム。
  7. 前記算出手段は、
    施設の名称に対応する特徴情報に基づくジャンルを特徴量としたルールベースに基づいて、前記顧客の属性情報に関するプロファイリングスコアを算出することを特徴とする請求項6に記載の情報管理システム。
  8. 前記情報管理装置は、
    前記顧客によるアンケートの回答結果を受信する受信手段をさらに備え、
    前記算出手段は、
    前記顧客によるアンケートの回答結果を正解データとして学習させた学習済モデルに基づいて、前記顧客の属性情報に関するプロファイリングスコアを算出することを特徴とする請求項6に記載の情報管理システム。
  9. 前記判定手段は、
    前記顧客によるアンケートの回答結果と、前記プロファイリングスコアとに基づいて、前記属性情報記憶手段に記憶された顧客に関する属性情報に変化が生じたか否かを判定することを特徴とする請求項8に記載の情報管理システム。
  10. Webページを提供する複数のWebサーバにアクセス可能な情報管理装置であって、
    所定の施設の名称を取得する名称取得手段と、
    前記名称取得手段により取得された施設の名称を正規化する正規化手段と、
    前記正規化手段により正規化された施設の名称に係る情報を取得可能なWebページから前記施設の特徴をなす特徴情報を収集する特徴情報収集手段と、
    前記特徴情報収集手段により収集された特徴情報と前記施設の名称とを対応付けて管理する管理手段と
    を備えたことを特徴とする情報管理装置。
  11. Webページを提供する複数のWebサーバにアクセス可能な情報管理装置を有する情報管理システムにおける情報管理方法であって、
    前記情報管理装置が、所定の施設の名称を取得する名称取得工程と、
    前記名称取得工程により取得された施設の名称を正規化する正規化工程と、
    前記正規化工程により正規化された施設の名称に係る情報を取得可能なWebページから前記施設の特徴をなす特徴情報を収集する特徴情報収集工程と、
    前記特徴情報収集工程により収集された特徴情報と前記施設の名称とを対応付けて管理する管理工程と
    を含むことを特徴とする情報管理方法。
  12. Webページを提供する複数のWebサーバにアクセス可能な情報管理装置において実行させる情報管理プログラムであって、
    所定の施設の名称を取得する名称取得手順と、
    前記名称取得手順により取得された施設の名称を正規化する正規化手順と、
    前記正規化手順により正規化された施設の名称に係る情報を取得可能なWebページから前記施設の特徴をなす特徴情報を収集する特徴情報収集手順と、
    前記特徴情報収集手順により収集された特徴情報と前記施設の名称とを対応付けて管理する管理手順と
    をコンピュータに実行させることを特徴とする情報管理プログラム。
JP2022110261A 2022-07-08 2022-07-08 情報管理システム、情報管理装置、情報管理方法及び情報管理プログラム Active JP7455162B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022110261A JP7455162B2 (ja) 2022-07-08 2022-07-08 情報管理システム、情報管理装置、情報管理方法及び情報管理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022110261A JP7455162B2 (ja) 2022-07-08 2022-07-08 情報管理システム、情報管理装置、情報管理方法及び情報管理プログラム

Publications (2)

Publication Number Publication Date
JP2024008408A true JP2024008408A (ja) 2024-01-19
JP7455162B2 JP7455162B2 (ja) 2024-03-25

Family

ID=89544829

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022110261A Active JP7455162B2 (ja) 2022-07-08 2022-07-08 情報管理システム、情報管理装置、情報管理方法及び情報管理プログラム

Country Status (1)

Country Link
JP (1) JP7455162B2 (ja)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004234288A (ja) 2003-01-30 2004-08-19 Nippon Telegr & Teleph Corp <Ntt> Web検索方法及び装置、Web検索プログラム並びにそのプログラムを記録した記録媒体
JP2008152589A (ja) 2006-12-19 2008-07-03 National Institute Of Advanced Industrial & Technology 実店舗指向コミュニティサービスシステム
JP4957796B2 (ja) 2007-05-24 2012-06-20 富士通株式会社 差分算出プログラム、差分算出装置および差分算出方法
EP2325762A1 (en) 2009-10-27 2011-05-25 Exalead Method and system for processing information of a stream of information
JP2013105185A (ja) 2011-11-10 2013-05-30 Zenrin Datacom Co Ltd 情報収集サーバ、情報収集方法および情報収集プログラム
JP6723030B2 (ja) 2016-03-08 2020-07-15 株式会社日本総合研究所 プログラム、情報処理方法及び情報処理装置
JP7333931B2 (ja) 2019-02-08 2023-08-28 憲一 坂 投稿分析システム、投稿分析装置および投稿分析方法
JP7554460B2 (ja) 2019-10-01 2024-09-20 技研商事インターナショナル株式会社 店舗データ利用システム及びそのプログラム

Also Published As

Publication number Publication date
JP7455162B2 (ja) 2024-03-25

Similar Documents

Publication Publication Date Title
Toral et al. Identification of the unique attributes of tourist destinations from online reviews
US10769702B2 (en) Recommendations based upon explicit user similarity
Berger et al. Customer lifetime value: Marketing models and applications
Nilashi et al. An analytical approach for big social data analysis for customer decision-making in eco-friendly hotels
JP5960887B1 (ja) 算出装置、算出方法及び算出プログラム
CN111784455A (zh) 一种物品推荐方法及推荐设备
Rezaeinia et al. Recommender system based on customer segmentation (RSCS)
CN111400613A (zh) 物品推荐方法、装置、介质及计算机设备
Kasem et al. Customer profiling, segmentation, and sales prediction using AI in direct marketing
Batmaz et al. AE-MCCF: an autoencoder-based multi-criteria recommendation algorithm
Noorian A BERT-based sequential POI recommender system in social media
Wei et al. Online shopping behavior analysis for smart business using big data analytics and blockchain security
Egorova et al. Customer transactional behaviour analysis through embedding interpretation
Sáez-Ortuño et al. How can entrepreneurs improve digital market segmentation? A comparative analysis of supervised and unsupervised learning algorithms
Albuquerque et al. Support vector clustering for customer segmentation on mobile tv service
Xie et al. Personalized choice model for managed lane travel behavior
US20230081797A1 (en) Computer implemented method and system for retail management and optimization
JP7455162B2 (ja) 情報管理システム、情報管理装置、情報管理方法及び情報管理プログラム
Ansari et al. Using decision trees to analyse the customers' shopping location preferences
Adesunkanmi et al. Prediction of Pavement Overall Condition Index Based on Wrapper Feature-Selection Techniques Using Municipal Pavement Data
JP2022178650A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
Pawełoszek et al. An approach to discovery of customer profiles
Madani et al. Predicting Consumer Purchasing Decision in The Online Food Delivery Industry
JP6152215B2 (ja) 算出装置、算出方法及び算出プログラム
Lin et al. Hybrid method for assessing marketable fashion designs: diamond pairwise comparison combined with the Choquet integral

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230919

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20231117

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20231121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20231121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240312

R150 Certificate of patent or registration of utility model

Ref document number: 7455162

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150