JP6034451B1 - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP6034451B1
JP6034451B1 JP2015115828A JP2015115828A JP6034451B1 JP 6034451 B1 JP6034451 B1 JP 6034451B1 JP 2015115828 A JP2015115828 A JP 2015115828A JP 2015115828 A JP2015115828 A JP 2015115828A JP 6034451 B1 JP6034451 B1 JP 6034451B1
Authority
JP
Japan
Prior art keywords
item
data
predetermined
item data
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015115828A
Other languages
English (en)
Other versions
JP2017004161A (ja
Inventor
玄 田村
玄 田村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Video Research Co Ltd
Original Assignee
Video Research Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Video Research Co Ltd filed Critical Video Research Co Ltd
Priority to JP2015115828A priority Critical patent/JP6034451B1/ja
Application granted granted Critical
Publication of JP6034451B1 publication Critical patent/JP6034451B1/ja
Publication of JP2017004161A publication Critical patent/JP2017004161A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザに関する項目を含むリストに含まれていない項目のデータを、適切に推定し、リストに付与する。【解決手段】ユーザ識別情報に関連付けられた1又は複数の第1項目Xi及び項目データを含むリストを記憶する記憶部と、所定の第1項目Xsが取り得る項目データxsjごとに、第1項目とは異なる第2項目Yが取り得る項目データykについての条件付き確率P(yk|xsj)を取得する取得部と、リスト内の前記所定の第1項目Xsに設定された項目データ、及び条件付き確率P(yk|xsj)に基づいて、所定のユーザ識別情報に対応する第2項目Yが、項目データYkをそれぞれ取る可能性を示すパラメータZ(yk)を算出する算出部と、第2項目を前記リストに追加する追加部と、パラメータZ(yk)に基づいて、所定のユーザ識別情報に関連付けられた第2項目Yの項目データを設定する設定部と、を備える。【選択図】図3

Description

本発明は、所定のリストにデータ項目を追加する情報処理装置、情報処理方法、及びプログラムに関する。
従来、ID−POS(ID付きpoint of sales system)データを利用する情報配信システムが知られている。(例えば特許文献1参照)。
特開2014−191735号公報
しかしながら、従来技術では、ID−POSデータなどの、ユーザに関する項目を含むリストを用いて情報を配信する技術等はあるが、このリストに含まれていないデータは、当然のことながら利用することはできない。
そこで、本発明の所定の態様は、上記課題に鑑みてなされたものであり、ユーザに関する項目を含むリストに含まれていない項目のデータを、適切に推定し、リストに付与することができる情報処理装置、情報処理方法、及びプログラムを提供することを目的とする。
本発明の一態様における情報処理装置は、ユーザ識別情報に関連付けられた1又は複数の第1項目Xi(1≦i≦n)及び項目データを含むリストを記憶する記憶部と、所定の第1項目Xs(i=s)が取り得る項目データxsj(1≦j≦m)ごとに、前記第1項目とは異なる第2項目Yが取り得る項目データyk(1≦k≦p)についての条件付き確率P(yk|xsj)を取得する取得部と、前記リスト内の前記所定の第1項目Xsに設定された項目データ、及び前記条件付き確率P(yk|xsj)に基づいて、所定のユーザ識別情報に対応する第2項目Yが、項目データykをそれぞれ取る可能性を示すパラメータZ(yk)を算出する算出部と、前記第2項目を前記リストに追加する追加部と、前記パラメータZ(yk)に基づいて、前記所定のユーザ識別情報に関連付けられた前記第2項目Yの項目データを設定する設定部と、を備える。
また、本発明の他の態様における情報処理方法は、ユーザ識別情報に関連付けられた1又は複数の第1項目Xi(1≦i≦n)及び項目データを含むリストを記憶する記憶部を有するコンピュータが、所定の第1項目Xs(i=s)が取り得る項目データxsj(1≦j≦m)ごとに、前記第1項目とは異なる第2項目Yが取り得る項目データyk(1≦k≦p)についての条件付き確率P(yk|xsj)を取得する取得ステップと、前記リスト内の前記所定の第1項目Xsに設定された項目データ、及び前記条件付き確率P(yk|xsj)に基づいて、所定のユーザ識別情報に対応する第2項目Yが、項目データykをそれぞれ取る可能性を示すパラメータZ(yk)を算出する算出ステップと、前記第2項目を前記リストに追加する追加ステップと、前記パラメータZ(yk)に基づいて、前記所定のユーザ識別情報に関連付けられた前記第2項目Yの項目データを設定する設定ステップと、を実行する。
また、本発明の他の態様におけるプログラムはユーザ識別情報に関連付けられた1又は複数の第1項目Xi(1≦i≦n)及び項目データを含むリストを記憶する記憶部を有するコンピュータに、所定の第1項目Xs(i=s)が取り得る項目データxsj(1≦j≦m)ごとに、前記第1項目とは異なる第2項目Yが取り得る項目データyk(1≦k≦p)についての条件付き確率P(yk|xsj)を取得する取得ステップと、前記リスト内の前記所定の第1項目Xsに設定された項目データ、及び前記条件付き確率P(yk|xsj)に基づいて、所定のユーザ識別情報に対応する第2項目Yが、項目データykをそれぞれ取る可能性を示すパラメータZ(yk)を算出する算出ステップと、前記第2項目を前記リストに追加する追加ステップと、前記パラメータZ(yk)に基づいて、前記所定のユーザ識別情報に関連付けられた前記第2項目Yの項目データを設定する設定ステップと、を実行させる。
本発明の所定の態様によれば、ユーザに関する項目を含むリストに含まれていない項目のデータを、適切に推定し、リストに付与することができる。
実施形態における情報処理システムの概略構成の一例を示す図である。 実施形態における情報処理装置のハードウェアの概略構成の一例を示すブロック図である。 実施形態における情報処理装置の機能構成の一例を示すブロック図である。 顧客リストの一例を示す図である。 条件付き確率の一例を示す図である。 第2項目への設定処理(その1)を説明するための図である。 第2項目への設定処理(その2)を説明するための図である。 第2項目への設定処理(その3)を説明するための図である。 図4に示す顧客リストに複数の項目を追加した例を示す図である。 実施形態における情報処理装置の処理の一例を示すフローチャートである。
以下、添付図面を参照しながら本発明の実施形態について詳細に説明する。
[実施形態]
<システム構成>
図1は、実施形態における情報処理システム1の概略構成の一例を示す図である。図1に示す情報処理システム1において、例えば、第1記憶装置10Aと、第2記憶装置10Bと、情報処理装置20とが、ブロードバンド回線等の有線又は無線のネットワークNを介して接続される。
第1記憶装置10Aは、ユーザ識別情報に関連付けられた1又は複数の項目(第1項目)及び項目データを含むリストを記憶する。このリストの例として、ID−POSデータなどがある。ID−POSデータ(顧客リスト)は、顧客IDに関連付けて、いつ、どの商品が、どの店で、いくらで、何個売れたのかなどを示すデータである。なお、リストは、ユーザIDに関連付けられた、ユーザに関するデータを含むものであればよい。
第2記憶装置10Bは、リストに含まれる項目を少なくとも1つを含み、リストの項目とは異なる項目(第2項目)を含み、さらに各項目の項目データを含む調査データを記憶する。調査データは、例えば、生活者属性、商品関与、メディア接触などの生活者の詳細なプロフィールを含むACR/exや、Web閲覧履歴や、Web閲覧履歴とプロフィールとを組み合わせたWebPACにより提供されるデータなどである。
例えば、ACR/exは、調査対象者に対し、回答者端末が配布され、第1項目や第2項目に関する回答結果が、回答者端末から定期的に受信される場合の当該回答結果に基づく調査データである。また、WebPACのデータは、Webサイトの接触状況とユーザのプロフィールデータを組み合わせて、集計/分析するサービスにより提供される調査データである。このように、第2記憶装置10Bは、リストに含まれる項目を少なくとも1つ含み、プロモーション戦略、商品開発、事業戦略など、マーケティング全般に活用できる調査データを記憶する。
また、第2記憶装置10Bは、リストに含まれる所定の項目(所定の第1項目という。)の項目データを用いて、リストに含まれていない第2項目の項目データが推定可能な調査データが記憶されていればよい。例えば、所定の第1項目が所定の項目データである条件のもとに、第2項目の所定の項目データである条件付き確率が算出可能なデータが、第2記憶装置10Bに記憶されていればよい。
情報処理装置20は、例えばPC(Personal Computer)であり、第1記憶装置10Aや第2記憶装置10Bからリストや調査データを取得し、リストに含まれていない項目を、調査データから適切に推定し、推定した結果をリストに追加する。以下、リストは、ID−POSデータを、調査データは、ACR/exを例にして説明する。
新規項目追加後のリストは、ターゲティング広告配信やプロモーション戦略などを行う会社に出力されてもよい。出力とは、例えば、画面表示、メール送信、音声出力、郵送などを含む。
なお、図1に示す例では、第1記憶装置10Aと、第2記憶装置10Bと、情報処理装置20とは、別の装置として説明したが、1つ又は2つの装置内に各機能が組み込まれるように実装されてもよい。
<ハードウェア構成>
次に、情報処理装置20のハードウェア構成について説明する。図2は、実施形態における情報処理装置20のハードウェアの概略構成の一例を示すブロック図である。なお、第1記憶装置10A及び第2記憶装置10Bは、HDD(Hard Disk Drive)とネットワークI/F(Interface)とを少なくとも備える。
図2に示すように、情報処理装置20は、CPU(Central Processing Unit)102と、RAM(Random Access Memory)104と、ROM(Read Only Memory)106と、ドライブ装置108と、ネットワークI/F110と、入力装置112と、及び表示装置114とを有する。これら各構成は、バスを介して相互にデータ送受信可能に接続されている。
CPU102は、コンピュータの中で、各装置の制御やデータの演算、加工を行う制御部である。また、CPU102は、RAM104又はROM106に記憶されたリスト追加処理のプログラムを実行する演算装置である。CPU102は、入力装置112やネットワークI/F110などからデータを受け取り、演算、加工した上で、演算結果を表示装置114や記憶装置などに出力する。
RAM104は、例えば主記憶部などである。RAM104は、CPU102が実行する基本ソフトウェアであるOS(Operating System)やアプリケーションソフトウェアなどのプログラムやデータを記憶又は一時保存する記憶装置である。
ROM106は、例えばアプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。また、図示しないが、情報処理装置20は、大容量のデータを記憶可能なHDDを保持してもよい。
ドライブ装置108は、記録媒体116、例えばCD−ROMやSDカードなどからプログラムを読み出し、記憶装置にインストールする。
また、記録媒体116は、所定のプログラムを格納し、この記録媒体116に格納されたプログラムは、ドライブ装置108を介して情報処理装置20にインストールされる。インストールされた所定のプログラムは、情報処理装置20により実行可能となる。
ネットワークI/F110は、通信機能を有する周辺機器と情報処理装置20とのインターフェースである。また、ネットワークI/F110は、例えば、有線及び/又は無線回線などのデータ伝送路により構築されたLAN(Local Area Network)、WAN(Wide Area Network)などのネットワークNを介して接続される。
入力装置112は、カーソルキー、数字入力及び各種機能キー等を備えたキーボード、表示装置114の表示画面上でキーの選択等を行うためのマウスやスライドパッド等を有する。また、入力装置112は、ユーザがCPU102に操作指示を与えたり、データを入力したりするためのユーザインターフェースである。
表示装置114は、LCD(Liquid Crystal Display)等により構成され、CPU102から入力される表示データに応じた表示が行われる。なお、入力装置112や表示装置114は、情報処理装置20の外部に設けられてもよい。
<機能構成>
次に、情報処理装置20の機能構成について説明する。図3は、実施形態における情報処理装置20の機能構成の一例を示すブロック図である。図3に示す情報処理装置20は、制御部200と、記憶部214とを備える。制御部200は、確率算出部202、取得部204、推定値算出部206、追加部208、設定部210、及び出力部212を少なくとも備える。
以下、顧客リスト内に含まれる1又は複数の第1項目をXi(1≦i≦n,iは整数,nは顧客リスト内に含まれる第1項目の数)と定義し、顧客リストに追加したい第2項目をYと定義する。また、顧客リスト内の所定の第1項目をXs(i=s)と定義し、第1項目Xsの取り得る項目データをxsj(1≦j≦m,jは整数,mは第1項目Xsの取り得る項目データ数)と定義し、第2項目Yの取り得る項目データをyk(1≦k≦p,kは整数,pは、第2項目Yの取り得る項目データ数)と定義する。
制御部200は、例えばCPU102やワークメモリとしてのRAM104、ネットワークI/F110等により実現されうる。制御部200は、プログラムが実行されることにより、以下に説明する顧客リストへの項目追加に関する機能を有する。
記憶部214は、例えばRAM104やROM106、HDD等により実現されうる。記憶部214は、制御部200により処理されたデータを記憶したり、第1記憶装置10A、及び第2記憶装置10Bから取得された顧客リストや、ACR/exなどの調査データなどを記憶したりする。
確率算出部202は、顧客リスト内の所定の第1項目Xsを用いて、項目データxsjごとに、第2項目Yが取り得る項目データykについての条件付き確率P(yk|xsj)を算出する。例えば、所定の第1項目Xsとして、購入商品、第2項目Yとして、性別、例えば男性か否かとした場合、確率算出部202は、商品Aを購入したユーザが、男性である確率P(男性である|商品A)、又は男性ではない確率P(男性ではない|商品A)や、商品Bを購入したユーザが、男性である確率P(男性である|商品B)、又は男性ではない確率P(男性ではない|商品B)などを算出する。
具体的には、確率算出部202は、管理者等の操作により、調査データの中から、所定の第1項目Xsと第2項目Yとを指定されて、条件付き確率を算出するとよい。この場合、管理者は、顧客リストに追加したい項目(第2項目Y)と、顧客リストに含まれている項目(所定の第1項目Xs)とを調査データの中から選択すればよい。算出された条件付き確率P(yk|xsj)は、取得部204に出力される。例えば、上述した条件付き確率P(男性である|商品A)の場合、確率算出部202は、調査データに基づいて、確率P(男性である|商品A)=商品Aを購入した男性の数/商品Aの購入者数を算出する。
なお、確率算出部202は、事前にこのような条件付き確率が算出されて、第2記憶装置10Bに記憶されている場合は、算出処理を行わなくてもよい。
取得部204は、確率算出部202又は第2記憶装置10Bから条件付き確率P(yk|xsj)を取得する。この条件付き確率P(yk|xsj)は、上述したとおり、顧客リストに新たに追加したい項目の項目データykが、顧客リストに存在する所定の第1項目の或る項目データxsjのもとに成り立つ確率である。取得された条件付き確率P(yk|xsj)は、推定値算出部206に出力される。
また、取得部204は、第1記憶装置10Aから顧客リストを取得し、この顧客リストを記憶部214に記憶させてもよい。
推定値算出部206は、顧客リスト内の所定の顧客IDにおける所定の第1項目Xsに設定された項目データ、及び条件付き確率に基づいて、所定のユーザ識別情報に対応する第2項目Yが、項目データykをそれぞれ取る可能性を示すパラメータZ(yk)を算出する。以下、パラメータZ(yk)は、推定値とも称する。推定値の詳細については、図6〜8に示す具体例を用いて後述する。算出された推定値は、設定部210に出力される。
追加部208は、管理者が顧客リストに追加したい項目である第2項目Yを、顧客リストに追加する。顧客リストに追加するタイミングは、任意のタイミングでよい。例えば、追加部208は、条件付き確率が求められる際に、管理者により第2項目が選択されると、この第2項目を顧客リストに追加してもよく、推定値が算出された際に、この第2項目を顧客リストに追加してもよく、設定部210により第2項目のデータが設定される前に、この第2項目を顧客リストに追加すればよい。
設定部210は、所定の顧客IDに関連付けられた第2項目の項目データを、推定値に基づいて設定する。例えば、設定部210は、所定の顧客IDが示すユーザの第2項目について、推定値に基づく尤もらしい項目データを設定する。設定される項目データの詳細については、図6〜8に示す具体例を用いて後述する。項目が新たに追加された顧客リストは、出力部212に出力される。
以上の処理により、顧客リストに追加した第2項目の項目データについて、他の調査データに含まれる項目を利用して適切に推定し、推定されたパラメータに基づいて第2項目の項目データを設定することができる。その結果、顧客データに存在する項目以外の項目についても、適切な項目データを推定し追加することで、詳細な顧客分析が可能になる。よって、この顧客リストは、ターゲティング広告配信やプロモーション戦略などに利用され、より詳細な分析を行うことが可能になる。
出力部212は、項目が追加された顧客リストを、例えば、画面などに表示したり、所定の宛先に添付してメール送信したり、内容を音声により出力したり、プリントアウトして郵送されるようにしたりして、出力する。これにより、この顧客リストを利用したい会社等に、顧客リストの内容を知らせることができる。
また、推定値算出部206は、所定の第1項目Xsに設定された複数の各データに対し、このデータ1つ毎に、推定値を更新してもよい。推定値算出部206は、例えば、購入商品として、AとBとが設定されていた場合、商品Aの条件付き確率に基づいて推定した推定値に、さらに商品Bの条件付き確率を乗算することで、推定値を順に更新する。更新される順は特に問わないが、例えば、顧客リストに登録された順で更新されればよい。
各推定値が順に算出される場合、設定部210は、推定値が更新される毎に、この推定値に基づいて第2項目の項目データを設定するとよい。これにより、所定の第1項目の項目データが新たに設定されるごとに、各推定値も更新されていくので、第2項目に設定される項目データの信頼性を上げていくことができる。
また、推定値が更新される場合、推定値算出部206は、推定値の正規化を行い、正規化された推定値が、第1閾値以上となるときに、推定値の更新を停止してもよい。或る推定値が第1閾値以上となり、第2項目が或る項目データである可能性が非常に高くなれば、それ以上の更新処理を停止することで、処理負荷を軽減することができる。
また、更新処理の停止判定がされる場合、推定値算出部206は、各推定値の算出回数が第2閾値未満のとき、第1閾値以上の推定値が算出されても、推定値の更新を継続してもよい。これにより、更新の初期段階では、停止処理をせずに更新処理が継続されるので、推定値の確度を上げることができ、その結果、第2項目の項目データの信頼性を向上させることができる。
また、設定部210は、第2項目の取り得る各項目データに対応する各推定値の差異が所定値よりも小さければ、判定不能を示すフラグを第2項目に設定してもよい。これにより、設定部210は、各推定値に基づいても第2項目の項目データについて判定できない場合は、その旨を示すフラグを設定することができる。
また、推定値算出部206は、更新処理及び停止判定処理を行う際、所定の第1項目に関連する日時が所定時間内であれば、この所定時間内に含まれる1又は複数の第1項目を単位として、更新処理及び停止判定処理を行ってもよい。例えば、ユーザが、まとめて一度に購入した商品に対しては、これらの商品を単位として、更新処理、及び停止判定処理を行うようにする。これにより、ユーザがまとめて一度に購入した商品は、ユーザの性質をよりよく表すと考えられるので、この考えを考慮して更新処理及び停止判定処理を行うことができる。
<具体例>
次に、実施形態の具体例について説明する。以下では、所定の第1項目として、顧客リストの「購入商品」(Xs)を例にし、第2項目として、ACR/exの「年収」(Y)を例にする。
図4は、顧客リストの一例を示す図である。図4に示す顧客リストは、ユーザID(又は顧客ID)に関連付けられた、購入商品の項目、性の項目、年齢の項目(Xi,1≦i≦3)を含む。なお、顧客リストには、ID−POSシステムにより取得可能な購入日時の項目などを含んでもよい。
例えば、図4に示す例では、ユーザID「1」のユーザは、商品「A」を購入し、性が「男」であり、年齢が「24」である。また、このユーザID「1」のユーザは、商品「B」も購入している。
図5は、条件付き確率の一例を示す図である。図5に示す条件付き確率は、例えば、第2記憶装置10Bに記憶されたACR/exのデータから、確率算出部202により算出される。
確率算出部202による算出の結果、以下のとおりとする。なお、H1は、年収1000万以上を表す項目データであり、H2は、年収1000万未満を表す項目データである。また、Aは、商品Aの購入を表す項目データであり、Bは、商品Bの購入を表す項目データであり、Cは、商品Cの購入を表す項目データである。
・商品Aの購入者が年収1000万以上である確率
P(H1|A)=0.75
・商品Aの購入者が年収1000万未満である確率
P(H2|A)=0.25
・商品Bの購入者が年収1000万以上である確率
P(H1|B)=0.1
・商品Bの購入者が年収1000万未満である確率
P(H2|B)=0.9
・商品Cの購入者が年収1000万以上である確率
P(H1|C)=0.8
・商品Cの購入者が年収1000万未満である確率
P(H2|C)=0.2
以上を踏まえ、管理者の操作により、追加部208は、顧客リストに、第2項目として、年収の項目を追加したとする。
図6は、第2項目への設定処理(その1)を説明するための図である。図6に示す例では、ユーザID「U」のユーザが、商品「A」を購入していることから、図5に示す条件付き確率を用いると、推定値算出部206により以下の推定値Z(yk)の比が算出される。推定値Z(yk)は、次の式で算出される。
Z(yk)=Πj=1項目Xsニ設定サレテイル項目テ゛ータP(yk|xsj
H1である推定値:H2である推定値
=P(H1|A):P(H2|A)
=0.75:0.25
これは、商品「A」を購入したユーザID「U」のユーザは、「年収1000万以上」である推定値が、0.75であることに対し、「年収1000万未満」である推定値が、0.25であることを示す。この推定値は、値が大きい方が尤もらしいことを示す。
よって、設定部210は、「年収1000万以上」である推定値の方が、「年収1000万未満」である推定値よりも大きいので、このユーザID「U」のユーザは「年収1000万以上」であると推定し、項目データ「年収1000万以上」を設定する。この例では、設定部210は、「年収1000万以上」であることを示す記号「〇」を、この項目に設定する。なお、項目データとは、英数字、記号、文字などのデータを含む。
次に、推定値算出部206は、購入商品「C」について処理をする。図7は、第2項目への設定処理(その2)を説明するための図である。図7に示す例では、ユーザID「U」のユーザが、商品「C」を購入していることから、図5に示す条件付き確率を用いると、推定値算出部206により以下の推定値の比が算出される。
H1である推定値:H2である推定値
=P(H1|A)×P(H1|C):P(H2|A)×P(H2|C)
=0.75×0.1:0.25×0.9
=0.075:0.225
これは、さらに商品「C」を購入したユーザID「U」のユーザは、「年収1000万以上」である推定値が、0.075であることに対し、「年収1000万未満」である推定値が、0.225であることを示す。
よって、設定部210は、「年収1000万未満」である推定値の方が、「年収1000万以上」である推定値よりも大きいので、このユーザID「U」のユーザは「年収1000万未満」であると推定し、項目データ「年収1000万未満」を設定する。なお、この例では、設定部210は、「年収1000万未満」であることを示す記号「×」を、この項目に設定する。
次に、推定値算出部206は、購入商品「B」について処理をする。図8は、第2項目への設定処理(その3)を説明するための図である。図8に示す例では、ユーザID「U」のユーザが、商品「B」を購入していることから、図5に示す条件付き確率を用いると、推定値算出部206により以下の推定値の比が算出される。
H1である推定値:H2である推定値
=P(H1|A)×P(H1|C)×P(H1|B):P(H2|A)×P(H2|C) ×P(H2|B)
=0.75×0.1×0.8:0.25×0.9×0.2
=0.06:0.045
これは、さらに商品「B」を購入したユーザID「U」のユーザは、「年収1000万以上」である推定値が、0.06であることに対し、「年収1000万未満」である推定値が、0.045であることを示す。
よって、設定部210は、「年収1000万以上」である推定値の方が、年収1000万未満である推定値よりも大きいので、このユーザID「U」のユーザは「年収1000万以上」であると推定し、項目データ「年収1000万以上」を設定する。この例では、設定部210は、「年収1000万以上」であることを示す記号「〇」を、この項目に設定する。
以上の処理により、顧客リストに含まれていない項目(年収)について、他のデータ(調査データ)を利用して、この項目の項目データを適切に推定することで、新たな項目を顧客リストに設定することができる。
また、顧客リスト内の所定の第1項目に複数の項目データが設定されている場合は、このデータ毎に各推定値が算出される。これにより、各推定値の確度を上げることで、設定データの信頼性を高めることができる。
なお、推定値算出部206は、算出される各推定値に対し、正規化を行ってもよい。この場合、推定値算出部206は、正規化後の各推定値を、更新後の各推定値とする。例えば、推定値算出部206は、図7に示す例の場合、以下のように正規化してもよい。
H1である推定値:H2である推定値
=P(H1|A)×P(H1|C):P(H2|A)×P(H2|C)
=0.75×0.1:0.25×0.9
=0.075:0.225
=0.075/(0.075+0.225):0.225/(0.075+0.225)
=0.25:0.75
また、推定値算出部206は、図8に示す例の場合、以下のように正規化してもよい。
H1である推定値:H2である推定値
=P(H1|A)×P(H1|C)×P(H1|B):P(H2|A)×P(H2|C) ×P(H2|B)
=0.75×0.1×0.8:0.25×0.9×0.2
=0.06:0.045
=0.06/(0.06+0.045):0.045/(0.06+0.045)
=0.571:0.429
正規化後の推定値が用いられるとき、推定値算出部206は、或る推定値が、例えば0.95(第1閾値)以上となった場合、更新処理を停止してもよい。また、推定値算出部206は、更新処理の回数が、例えば10回(第2閾値)以上になった場合、停止判定を判定するようにしてもよい。つまり、推定値算出部206は、更新処理の回数が10回未満であれば、停止処理をせずに更新処理を継続する。
また、推定値算出部206は、顧客リストに購入日時の項目がある場合、購入日が同じもの、又は同時に購入されたものと判定される商品群については、まとめて更新処理及び停止判定処理をするようにしてもよい。
また、設定部210は、正規化後の各推定値の差分が、例えば0.2以内であれば、判定不能を示す項目データ「△」を第2項目に設定してもよい。この例の場合、図8に示すユーザ「X」の年収の項目は、0.571−0.429=0.142となるため、項目データ「△」が設定される。
図9は、図4に示す顧客リストに複数の項目を追加した例を示す図である。図9に示すように、設定部210は、複数のユーザIDに対して、推定された項目データを、追加した項目に設定することができる。図9に示す例では、子供有の第2項目が、顧客リストに新たに追加されている。
なお、追加される項目の取り得る項目データは、2つである必要はなく、例えば、子供の人数という第2項目に対し、0人、1人、2人、・・・などの3以上であってもよい。この場合、算出される推定値の数が増えるだけであり、設定部210は、上述したように、推定値が最も大きい項目データを、尤もらしい項目データとして推定し、この項目に設定する。
<動作>
次に、情報処理装置20の動作について説明する。図10は、実施形態における情報処理装置20の処理の一例を示すフローチャートである。図10に示す処理は、例えば、リスト及び調査データが各記憶装置から取得された場合に実行される。
ステップS102で、確率算出部202は、所定の第1項目Xsが取り得る項目データxsjごとに、リスト内の第1項目とは異なる第2項目Yが取り得る各項目データykについての各条件付き確率P(yk|xsj)を算出する。例えば、確率算出部202は、具体例で説明した条件付き確率P(H1|A)などを算出する。
ステップS104で、取得部204は、確率算出部202により算出された各条件付き確率P(yk|xsj)を取得する。
ステップS106で、追加部208は、リストに追加したい第2項目Yを、このリストに追加する。例えば、追加部208は、具体例で説明した年収の項目を、顧客リストに追加する。リストに追加したい第2項目は、管理者等により指定されればよい。
ステップS108で、推定値算出部206は、顧客リストの中から、第2項目に項目データを設定したい所定のユーザのユーザ識別情報を選択する。ユーザ選択は、管理者操作により、所定のユーザが選択されてもよいし、顧客リストの中から、所定のユーザが順に選択されてもよい。例えば、推定値算出部206は、具体例で説明したユーザID「U」を選択する。
ステップS110で、推定値算出部206は、顧客リストの中から、所定の第1項目の項目データを選択する。例えば、推定値算出部206は、具体例で説明した購入商品の商品「A」や「B」などを選択する。
ステップS112で、推定値算出部206は、リスト内の所定のユーザ識別情報における所定の第1項目の各項目データ、及び各条件付き確率に基づいて、所定のユーザ識別情報が示すユーザの第2項目が、この第2項目の各項目データである可能性を示す各推定値を算出する。例えば、推定値算出部206は、具体例で説明したH1である推定値や、H2である推定値を算出する。
ステップS114で、設定部210は、所定のユーザ識別情報に関連付けられた第2項目の項目データを、推定値算出部206により推定された各推定値に基づいて設定する。例えば、設定部210は、具体例で説明したH1である推定値や、H2である推定値に基づいて、「年収1000万以上」である項目データを、この項目に設定する。
ステップS116で、推定値算出部206は、或る推定値が、第1閾値以上であるか否かを判定する。或る推定値が第1閾値以上であれば(ステップS116−YES)、この処理は終了し、或る推定値が閾値未満であれば(ステップS116−NO)、この処理はステップS118に進む。
ステップS118で、推定値算出部206は、所定の第1項目の全項目データを処理したか否かを判定する。所定の第1項目の全項目データが処理されていれば(ステップS118−YES)、この処理は終了し、所定の第1項目の全項目データが処理されていなければ(ステップS118−NO)、この処理はステップS110に戻り、他の項目データを選択する。例えば、推定値算出部206は、具体例で説明したように、商品「A」、「C」、「B」全てについて処理したか否かを判定する。
なお、上述した処理のフローに含まれる各処理ステップは、処理内容に矛盾を生じない範囲で、任意に順番を変更して又は並列に実行することができるとともに、各処理ステップ間に他のステップを追加してもよい。また、便宜上1ステップとして記載されているステップは、複数ステップに分けて実行することができる一方、便宜上複数ステップに分けて記載されているものは、1ステップとして把握することができる。また、必ずしも必要のないステップは、省いてもよい。また、ステップS108の所定のユーザの選択が顧客リスト内の全てのユーザを選択するまで、ステップS110〜S118の処理を繰り返してもよい。
以上、ユーザに関する項目を含むリストに含まれていない項目の項目データを、適切に推定し、リストに付与することができる。
なお、上記の情報処理装置20で実行される、リストへ項目を追加するプログラムについて、CPU102がROM106からこのプログラムを読み出して実行することにより、上記各部のうち1又は複数の各部がRAM104上にロードされ、1又は複数の各部がRAM104上に生成されるようになっている。
このように、上述した実施形態で説明したリストへ項目を追加する処理は、コンピュータに実行させるためのプログラムとして実現されてもよい。このプログラムをサーバ等からインストールしてコンピュータに実行させることで、前述したリストに項目を追加する処理を実現することができる。
また、このプログラムを記録媒体116に記録し、このプログラムが記録された記録媒体116をコンピュータに読み取らせて、前述したリストに項目を追加する処理を実現させることも可能である。
なお、記録媒体116は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリー等、様々なタイプの記録媒体を用いることができる。
以上、各実施例について詳述したが、上記実施例に限定されるものではなく、特許請求の範囲に記載された範囲内において、上記実施例以外にも種々の変形及び変更が可能である。
20 情報処理装置
102 CPU
104 RAM
106 ROM
202 確率算出部
204 取得部
206 推定値算出部
208 追加部
210 設定部
212 出力部

Claims (7)

  1. ユーザ識別情報に関連付けられた1又は複数の第1項目Xi(1≦i≦n)及び項目 データを含むリストを記憶する記憶部と、
    所定の第1項目Xs(i=s)が取り得る項目データxsj(1≦j≦m)ごとに、前 記第1項目 s (i=s)とは異なる第2項目Yが取り得る項目データyk(1≦k≦ p)についての条件付き確率P(yk|xsj)を取得する取得部と、
    前記リスト内の前記所定の第1項目Xs (i=s)に設定された項目データ、及び前 記条件付き確率P(yk|xsj)に基づいて、所定のユーザ識別情報に対応する第2項 目Yが、項目データyk (1≦k≦p)をそれぞれ取る可能性を示すパラメータZ(y k)を算出する算出部と、
    前記第2項目を前記リストに追加する追加部と、
    前記パラメータZ(yk)に基づいて、前記所定のユーザ識別情報に関連付けられた 前記第2項目Yの項目データを設定する設定部と、
    を備える情報処理装置。
  2. 前記算出部は、
    前記所定の第1項目 s (i=s)に設定された複数の項目データに対し、該項目デ ータ毎に前記パラメータZ(y k を更新し、
    前記設定部は、
    前記パラメータZ(y k が更新される毎に、更新されたパラメータに基づいて前記 第2項目の項目データを設定する、請求項1に記載の情報処理装置。
  3. 前記算出部は、
    前記パラメータZ(y k の正規化を行い、正規化されたパラメータが、第1閾値以 上となる場合、前記パラメータZ(y k の更新を停止する、請求項2に記載の情報処 理装置。
  4. 前記算出部は、
    前記パラメータZ(y k の更新回数が第2閾値未満の場合、前記第1閾値以上のパ ラメータが算出されても、前記パラメータZ(y k の更新を継続する、請求項3に記 載の情報処理装置。
  5. 前記第2項目及び前記所定の第1項目 s (i=s)、並びにそれぞれの項目デー タを含む調査データに基づいて、前記条件付き確率P(y k |x sj を算出する確率算 出部をさらに備え、
    前記取得部は、
    前記確率算出部により算出された条件付き確率を取得する、請求項1乃至4いずれか 一項に記載の情報処理装置。
  6. ユーザ識別情報に関連付けられた1又は複数の第1項目Xi(1≦i≦n)及び項目 データを含むリストを記憶する記憶部を有するコンピュータが、
    所定の第1項目Xs(i=s)が取り得る項目データxsj(1≦j≦m)ごとに、前 記第1項目 s (i=s)とは異なる第2項目Yが取り得る項目データyk(1≦k≦ p)についての条件付き確率P(yk|xsj)を取得する取得ステップと、
    前記リスト内の前記所定の第1項目Xs (i=s)に設定された項目データ、及び前 記条件付き確率P(yk|xsj)に基づいて、所定のユーザ識別情報に対応する第2項 目Yが、項目データyk (1≦k≦p)をそれぞれ取る可能性を示すパラメータZ(y k)を算出する算出ステップと、
    前記第2項目を前記リストに追加する追加ステップと、
    前記パラメータZ(yk)に基づいて、前記所定のユーザ識別情報に関連付けられた 前記第2項目Yの項目データを設定する設定ステップと、
    を実行する情報処理方法。
  7. ユーザ識別情報に関連付けられた1又は複数の第1項目Xi(1≦i≦n)及び項目 データを含むリストを記憶する記憶部を有するコンピュータに、
    所定の第1項目Xs(i=s)が取り得る項目データxsj(1≦j≦m)ごとに、前 記第1項目 s (i=s)とは異なる第2項目Yが取り得る項目データyk(1≦k≦ p)についての条件付き確率P(yk|xsj)を取得する取得ステップと、
    前記リスト内の前記所定の第1項目Xs (i=s)に設定された項目データ、及び前 記条件付き確率P(yk|xsj)に基づいて、所定のユーザ識別情報に対応する第2項 目Yが、項目データyk (1≦k≦p)をそれぞれ取る可能性を示すパラメータZ(y k)を算出する算出ステップと、
    前記第2項目を前記リストに追加する追加ステップと、
    前記パラメータZ(yk)に基づいて、前記所定のユーザ識別情報に関連付けられた 前記第2項目Yの項目データを設定する設定ステップと、
    を実行させるプログラム。
JP2015115828A 2015-06-08 2015-06-08 情報処理装置、情報処理方法及びプログラム Active JP6034451B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015115828A JP6034451B1 (ja) 2015-06-08 2015-06-08 情報処理装置、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015115828A JP6034451B1 (ja) 2015-06-08 2015-06-08 情報処理装置、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP6034451B1 true JP6034451B1 (ja) 2016-11-30
JP2017004161A JP2017004161A (ja) 2017-01-05

Family

ID=57419808

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015115828A Active JP6034451B1 (ja) 2015-06-08 2015-06-08 情報処理装置、情報処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6034451B1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009163615A (ja) * 2008-01-09 2009-07-23 Nippon Telegr & Teleph Corp <Ntt> 共クラスタリング装置、共クラスタリング方法、共クラスタリングプログラム、および、そのプログラムを記録した記録媒体
JP2012238153A (ja) * 2011-05-11 2012-12-06 Hitachi Systems Ltd データ整形システム、方法、及びプログラム
JP2014215792A (ja) * 2013-04-25 2014-11-17 株式会社Jvcケンウッド 情報選択装置、情報選択方法、および情報選択プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009163615A (ja) * 2008-01-09 2009-07-23 Nippon Telegr & Teleph Corp <Ntt> 共クラスタリング装置、共クラスタリング方法、共クラスタリングプログラム、および、そのプログラムを記録した記録媒体
JP2012238153A (ja) * 2011-05-11 2012-12-06 Hitachi Systems Ltd データ整形システム、方法、及びプログラム
JP2014215792A (ja) * 2013-04-25 2014-11-17 株式会社Jvcケンウッド 情報選択装置、情報選択方法、および情報選択プログラム

Also Published As

Publication number Publication date
JP2017004161A (ja) 2017-01-05

Similar Documents

Publication Publication Date Title
US20170236182A1 (en) System and method of generating a recommendation of a product or service based on inferring a demographic characteristic of a customer
US20120239590A1 (en) Managing customer communications among a plurality of channels
JP2010073170A (ja) 推薦商品選択装置、推薦商品選択プログラムおよび商品検索装置
WO2012049987A1 (ja) 商品推薦システムおよび商品推薦方法
US20220108374A1 (en) Smart Basket for Online Shopping
JP2015082246A (ja) 販売情報提示方法、販売情報提示プログラム
JP2018120360A (ja) 評価処理装置、店員評価方法、およびプログラム
US20190012693A1 (en) Method for selling no-show item at special price and apparatus therefor
JP2015146126A (ja) 顧客分析プログラム、顧客分析方法、及び顧客分析装置
JP2012058785A (ja) 情報共有システム、及び情報管理装置
US20200294079A1 (en) Method and apparatus for calculating promotion adjusted loyalty
EP3896636A1 (en) Information processing device and program
US20120246030A1 (en) Information providing device, method, and system
JP6034451B1 (ja) 情報処理装置、情報処理方法及びプログラム
CN110796520A (zh) 商品推荐的方法、装置、计算设备以及介质
US20160148271A1 (en) Personalized Marketing Based on Sequence Mining
JP6601820B2 (ja) 提供装置、提供方法、及び提供プログラム
JP6660168B2 (ja) 情報提供装置、情報提供方法、及びプログラム
US10108650B2 (en) Information processing device and information processing method
JP6809148B2 (ja) プログラムおよび組み合わせ抽出システム
JP6958994B2 (ja) 決定装置、決定方法、及び決定プログラム
JP2020154782A (ja) 提案装置、提案方法および提案プログラム
JP7303855B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP2014153887A (ja) データ編集装置およびプログラム
JP2018195201A (ja) 算出装置、算出方法、及び算出プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161027

R150 Certificate of patent or registration of utility model

Ref document number: 6034451

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250