JP2024068560A - 情報処理システム、コンピュータプログラム、及び情報処理方法 - Google Patents

情報処理システム、コンピュータプログラム、及び情報処理方法 Download PDF

Info

Publication number
JP2024068560A
JP2024068560A JP2022179100A JP2022179100A JP2024068560A JP 2024068560 A JP2024068560 A JP 2024068560A JP 2022179100 A JP2022179100 A JP 2022179100A JP 2022179100 A JP2022179100 A JP 2022179100A JP 2024068560 A JP2024068560 A JP 2024068560A
Authority
JP
Japan
Prior art keywords
sales
products
store
stores
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022179100A
Other languages
English (en)
Other versions
JP7248858B1 (ja
Inventor
環 奥井
Tamaki Okui
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hakuhodo Inc
Original Assignee
Hakuhodo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hakuhodo Inc filed Critical Hakuhodo Inc
Priority to JP2022179100A priority Critical patent/JP7248858B1/ja
Application granted granted Critical
Publication of JP7248858B1 publication Critical patent/JP7248858B1/ja
Publication of JP2024068560A publication Critical patent/JP2024068560A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】店舗特性の分析に役立つ新規技術を提供する。【解決手段】各商品が複数の店舗の少なくとも一店舗以上で販売される複数の商品に関して、店舗毎に販売商品データが取得される(S110)。販売商品データは、複数の商品のうち、対応する店舗で販売される一以上の商品である一以上の販売商品、及び、一以上の販売商品のそれぞれの対応する店舗内における販売量に関するシェアを判別可能なデータである。複数の店舗に関して、販売商品データから判別される一以上の販売商品のそれぞれのシェアを根拠に、トピックモデルを用いて、各店舗のトピック分布が判別される(S150)。【選択図】図3

Description

本開示は、情報処理システム、コンピュータプログラム、及び情報処理方法に関する。
複数の店舗を複数のクラスタに分類する技術が既に知られている(例えば特許文献1参照)。この技術によれば、複数の店舗の店舗属性を取得し、店舗属性に基づいて複数の店舗を複数のクラスタに分類する。
店舗属性は、店舗タイプ(駅前、住宅街、複合施設等)、広さ、駐車場数に基づいて定義される。特許文献1は、払出量に係る情報又は学習された払出量の予測モデルに基づいて、複数の店舗を複数のクラスタに分類する技術も開示する。
国際公開第2015/040790号
商品の売れ行きは、商圏内の消費者集合の購買特性に関係する。そこで、本開示の一側面によれば、購買特性を考慮した店舗特性の分析に役立つ新規技術を提供できることが望ましい。
本開示の一側面によれば、情報処理システムが提供される。情報処理システムは、取得部と、判別部とを備える。取得部は、各商品が複数の店舗の少なくとも一店舗以上で販売される複数の商品に関して、店舗毎に販売商品データを取得するように構成される。
販売商品データは、複数の商品のうち、対応する店舗で販売される一以上の商品である一以上の販売商品、及び、一以上の販売商品のそれぞれの、対応する店舗における販売量の大きさを判別可能なデータである。
判別部は、複数の店舗に関して、販売商品データから判別される一以上の販売商品のそれぞれの販売量の大きさを根拠に、トピックモデルを用いて、各店舗のトピック分布を判別するように構成される。
この情報処理システムによれば、複数の店舗に関して、商品の販売量に基づくトピック分布を判別することができる。トピックは、店舗を利用する消費者の購買特性を少なくとも間接的に表す。従って、本開示の一側面によれば、購買特性を考慮した店舗特性の分析に役立つ新規技術を提供することができる。
本開示の一側面によれば、判別部は、複数の店舗に関して、各店舗の販売商品データを文書に対応付け、各店舗の販売商品データから判別される一以上の販売商品のそれぞれを、文書内の単語に対応付け、各店舗における一以上の販売商品のそれぞれの販売量の大きさを、対応する単語の文書内での出現頻度に対応付けたトピックモデルを用いて、各店舗のトピック分布を判別するように構成され得る。
本開示の一側面によれば、トピックモデルは、潜在ディリクレ配分法に基づくトピックモデルであり得る。
本開示の一側面によれば、判別部は、店舗毎に、各販売商品のTF-IDF値を販売量の大きさに基づき算出することによって、複数の店舗及び複数の商品に関して、店舗及び商品の組合せ毎のTF-IDF値を算出するように構成され得る。
本開示の一側面によれば、判別部は、TF-IDF値を根拠に、トピックモデルを用いて、各店舗のトピック分布を判別するように構成され得る。TF-IDF値を用いることによれば、トピック分布の判別を適切に行うことができる。
本開示の一側面によれば、販売量の大きさは、対応する商品の、対応する店舗における販売量の占有割合としてのシェアであり得る。TF-IDF値は、TF値とIDF値とに基づいて算出され得る。TF値は、対応する店舗における一以上の販売商品のシェア合計に対して、対応する商品のシェアが占める割合に対応し得る。IDF値は、対応する商品が一以上の販売商品に含まれる店舗の数の逆数に対応し得る。
本開示の一側面によれば、一以上の販売商品は、対応する店舗で販売される商品の一群のうち、販売量の大きさが基準以上の商品の一群であり得る。販売量の少ない商品を除いた販売量の多い商品に注目して、トピック分布を判別することによれば、店舗特性を明確化することができる。
本開示の一側面によれば、情報処理システムは、複数の店舗のそれぞれのトピック分布に基づき、複数の店舗を、複数のグループに分類するように構成される分類部を更に備え得る。
本開示の一側面によれば、上述した情報処理システムにおける取得部と、判別部としての機能を、コンピュータに実現させるためのコンピュータプログラムが提供されてもよい。
本開示の一側面によれば、上述した情報処理システムにおける取得部と、判別部と、分類部としての機能を、コンピュータに実現させるためのコンピュータプログラムが提供されてもよい。
本開示の一側面によれば、情報処理方法が提供されてもよい。情報処理方法は、コンピュータにより実行され得る。情報処理方法は、各商品が複数の店舗の少なくとも一店舗以上で販売される複数の商品に関して、店舗毎に販売商品データを取得することを含み得る。
販売商品データは、複数の商品のうち、対応する店舗で販売される一以上の商品である一以上の販売商品、及び、一以上の販売商品のそれぞれの対応する店舗における販売量の大きさを判別可能なデータであり得る。
情報処理方法は更に、複数の店舗に関して、販売商品データから判別される一以上の販売商品のそれぞれの販売量の大きさを根拠に、トピックモデルを用いて、各店舗のトピック分布を判別することを含み得る。
本開示の一側面によれば、情報処理方法は、複数の店舗のそれぞれのトピック分布に基づき、複数の店舗を、複数のグループに分類することを更に含み得る。この情報処理方法によれば、上述した情報処理システムと同様の効果を得ることができる。
情報処理システムの構成を表すブロック図である。 販売商品データの構成を表す図である。 プロセッサが実行する分析処理を表すフローチャートである。 図4Aは、トピック分布に関する説明図であり、図4Bは、商品分布に関する説明図である。 トピック分布の類似性に基づき、複数の店舗を複数のクラスタに分類する例を説明する図である。
以下に本開示の例示的実施形態を、図面を参照しながら説明する。
本実施形態の情報処理システム1は、汎用のコンピュータシステムに、本実施形態に特有のコンピュータプログラムがインストールされることにより構成される。図1に示す情報処理システム1は、プロセッサ11と、メモリ12と、ストレージ13と、ディスプレイ15と、入力デバイス17と、メディアリーダ/ライタ18と、通信デバイス19とを備える。
プロセッサ11は、ストレージ13が記憶するコンピュータプログラムに従う処理を実行するように構成される。メモリ12は、RAMを含む。メモリ12は、プロセッサ11がコンピュータプログラムに従う処理を実行する際、作業領域として使用される。メモリ12は、ストレージ13から読み出されたコンピュータプログラム及びデータを一時記憶する。
ストレージ13は、コンピュータプログラム及び各種データを格納する。ストレージ13に格納されるコンピュータプログラムの一つには、複数の店舗のそれぞれのトピック分布を判別し、トピック分布に基づき、複数の店舗を分類する処理をプロセッサ11に実行させるためのコンピュータプログラムが含まれる。ストレージ13の例には、ハードディスクドライブ及びソリッドステートドライブが含まれる。
ディスプレイ15は、ユーザに向けて各種情報を表示するように構成される。ディスプレイ15は、例えば液晶ディスプレイである。入力デバイス17は、ユーザからの操作信号をプロセッサ11に入力するように構成される。入力デバイス17は、ユーザが操作可能なキーボード及びポインティングデバイスを備える。
メディアリーダ/ライタ18は、メモリカードなどの記録メディアに記録された情報を読取可能、及び、記録メディアに新規情報を書込可能に構成される。通信デバイス19は、プロセッサ11により制御されて、ローカルエリアネットワーク内の、及び/又は、広域ネットワーク内の外部装置と通信するように構成される。
上述のように、本実施形態の情報処理システム1は、コンピュータプログラムに基づく処理の実行を通じて、複数の店舗のそれぞれのトピック分布を判別し、複数の店舗を分類するように構成される。これにより、情報処理システム1は、複数の店舗のそれぞれを、対応する店舗の商圏特性に応じて分類するように構成される。
以下では、この分類のために準備されるデータ、及び、プロセッサ11が実行する分析処理の詳細を説明する。以下では、分析処理による分類対象の複数の店舗のことを、複数の対象店舗と表現する。
分析処理実行前の準備段階では、複数の対象店舗のうちの一店舗以上で取り扱われる特定カテゴリの複数の商品のそれぞれに、商品の識別コードである商品IDが割り当てられる。分析処理では、商品IDが、商品の識別のために用いられる。以下、商品IDが割り当てられる特定カテゴリの複数の商品のことを、カテゴリ商品群と表現する。
準備段階では更に、複数の対象店舗に関して、店舗毎に、対応する店舗における所定期間の売上データが収集される。売上データは、例えばPOS(Point Of Sales)データであり得る。更には、店舗毎に、対応する店舗の売上データに基づき、カテゴリ商品群に関する商品毎のシェアが算出される。シェアは、店舗内での販売量の大きさを表す指標として採用される。
ここで算出されるシェアは、対応する商品の店舗内における販売量の占有割合のことである。一つの注目店舗における一つの注目商品のシェアは、カテゴリ商品群のうち、一つの注目店舗が販売する複数の商品全体の販売量合計に対して、一つの注目商品の販売量が占める割合を意味する。
一例によれば、商品の販売量は、対応する商品の販売数である。別例によれば、商品の販売量は、対応する商品の売上金額である。店舗において販売されていない商品に関するシェアは、値ゼロとして取扱われる。
本実施形態によれば、算出されたシェアを説明する店舗毎の販売商品データが用意され、ストレージ13に格納される。図2に示すように各店舗の販売商品データは、カテゴリ商品群のうち、対応する店舗において販売される一以上の商品である一以上の販売商品に関して、販売商品毎に、対応する商品IDと、対応する商品の店舗内でのシェアを記述する。
本実施形態では、このように準備されたデータに基づく分析処理の実行を通じて、対象店舗のそれぞれのトピック分布を判別する。トピック分布は、潜在ディリクレ配分法(LDA)に基づくトピックモデルを用いて算出される。トピックモデルを用いた統計的潜在意味解析は、文書中に出現する単語の種類と出現頻度とに基づいて、文書の潜在的な意味を、トピックとして解析する技術である。
本実施形態では、文書を対象としたトピックモデルを、各店舗のトピック分布の判別に用いるために、複数の対象店舗のそれぞれの販売商品データが一つの文書に対応付けられる。更に、販売商品データから判別される一以上の販売商品のそれぞれが、文書内の単語に対応付けられる。一以上の販売商品のそれぞれのシェアが、対応する単語の文書内での出現頻度に対応付けられる。このような販売商品データ、販売商品、及びシェアの対応付けを通じて、トピックモデルが店舗のトピック分布の判別に使用される。
プロセッサ11は、入力デバイス17を通じて入力されるユーザからの指令に従って分析処理を開始すると、S110において、複数の対象店舗に対応する販売商品データの一群を、ストレージ13から読み出す。これにより、プロセッサ11は、対象店舗毎の販売商品データを取得する。
続くS120において、プロセッサ11は、複数の対象店舗に関して、店舗毎に、対応する店舗の販売商品データに基づき、シェアが基準以上の販売商品を判別する。以下では、シェアが基準以上の販売商品のことを、高シェア商品と表現する。プロセッサ11は、例えば、シェアが10%以上の販売商品を、高シェア商品として判別することができる。
続くS130において、プロセッサ11は、シェアを整数化する。すなわち、プロセッサ11は、店舗毎に、対応する店舗における高シェア商品群に属する各商品のシェアを、シェア整数値X[i,k]に変換する。シェアの整数化は、任意の尺度で行うことができる。
X[i,k]は、カテゴリ商品群のうち、第k商品の第i店舗におけるシェア整数値である。すなわち、X[i,k]は、カテゴリ商品群のうち、第i店舗が販売する商品全体の販売量合計に対して、第k商品の販売量が占める割合を整数化した値に対応する。
iは、対象店舗数がMであるとき、値1から値Mまでの整数値を採る。kは、カテゴリ商品群に属する商品の数がNであるとき、値1から値Nまでの整数値を採る。各店舗において高シェア商品に該当しない商品についてのシェア整数値X[i,k]は、値ゼロとして取扱われる。
続くS140において、プロセッサ11は、複数の対象店舗及びカテゴリ商品群に関して、店舗及び商品の組み合わせ毎に、対応する商品のシェア整数値X[i,k]を、TF-IDF値Y[i,k]に変換する。Y[i,k]は、第i店舗の第k商品に関するTF-IDF値である。
TF-IDF値は、TF(Term Frequency)値とIDF(Inverse Document Frequency)値とに基づいて、式Y[i,k]=Y1[i,k]xY2[k]により計算される。
Y1[i,k]は、第i店舗の第k商品に関するTF値である。Y2[k]は、第k商品に関するIDF値である。TF値は、トピックモデルにおいて、文書内での、対応する単語の出現頻度を表す値として取扱われる。IDF値は、トピックモデルにおいて、対応する単語の希少度を表す値、具体的には、文書の一群のうち、対応する単語が含まれる文書の割合の逆数を表す値として取扱われる。
本実施形態によれば、上述の対応付けにより、TF値Y1[i,k]は、第i店舗内での第k商品のシェアの、第i店舗における高シェア商品群全体のシェア合計に占める割合として算出される。IDF値Y2[k]は、複数の対象店舗のうち、第k商品が高シェア商品として販売される店舗の割合の逆数を表す値としてされる。
具体的に、TF値Y1[i,k]は、次式によって算出される。ΣX[i,k]は、第i店舗における高シェア商品群のシェア整数値X[i,k]の合計である。
Y1[i,k]=X[i,k]/ΣX[i,k]
IDF値Y2[k]は、次式によって算出される。Mは、上述の通り、対象店舗の数である。M[k]は、第k商品が高シェア商品群に含まれる対象店舗の数である。
Y2[k]=log(M/M[k])
続くS150において、プロセッサ11は、店舗及び商品の組み合わせ毎のTF-IDF値Y[i,k](i=1,2,…,M及びk=1,2,…,N)を用いて、LDA(潜在ディリクレ配分法)に基づくモデル学習を行う。すなわち、プロセッサ11は、トピックモデルを学習する。
モデル学習に際しては、例えば、公知の評価指標であるパープレキシティ(Perplexity)及びコヒーレンス(Coherence)を用いて、トピック数が指定される。トピック数は、パープレキシティができるだけ低く、コヒーレンスができるだけ高くなるように指定される。
LDAに基づくモデル学習によれば、事後確率分布として、文書毎のトピック分布及びトピック毎の単語分布が得られる。トピック分布は、対応する文書におけるトピックの構成比を表す。単語分布は、対応するトピックにおける各単語の出現確率を表す。
本実施形態によれば、店舗及び商品の組み合わせ毎のTF-IDF値Y[i,k]に基づくモデル学習によって、図4Aに例示するように、複数の対象店舗に関して、店舗毎のトピック分布が得られる。トピック分布は、対応する店舗におけるトピックの構成比を表す。更には、図4Bに例示するように、トピック毎の商品分布が得られる。商品分布は、対応するトピックにおける各商品の出現確率を表す。
続くS160において、プロセッサ11は、モデル学習により得られた複数の対象店舗のそれぞれのトピック分布に基づき、複数の対象店舗を、複数のクラスタに分類する。図5は、トピック分布の類似性に基づき、複数の対象店舗を、複数のクラスタに分類する処理を概念的に説明する図である。図5における横棒グラフは、対応する店舗におけるトピック構成比を例示する。分類は、例えばk-means法等のクラスタリング技術を用いて行われる。
具体的には、プロセッサ11は、トピック構成比を表す特徴ベクトル間のユークリッド距離に基づいて、対象店舗間の類似度を評価し、複数の対象店舗を、複数のクラスタに分類することができる。同じクラスタに属する店舗群は、トピック構成比が類似する店舗群である。
各トピックは、店舗を利用する消費者の購買特性を少なくとも間接的に表す。トピック構成比が類似することは、商圏における消費者の購買特性が類似することを意味する。従って、複数の対象店舗を、複数のクラスタに分類することは、複数の対象店舗を、商圏特性が類似する店舗グループに、分類することに対応し得る。
続くS170において、プロセッサ11は、分析結果として、複数の対象店舗のそれぞれのトピック分布及び所属クラスタ、更には、各トピックの商品分布を説明するデータをストレージ13に記録する。更に、プロセッサ11は、各店舗のトピック分布及び所属クラスタと、各トピックの商品分布とを説明する画面をディスプレイ15に表示させることができる。その後、プロセッサ11は、図3に示す分析処理を終了する。
LDAでは、ユーザからトピックの種類が指定されることはない。ユーザは、各トピックの意味を、各トピックの商品分布から判別することができる。あるいは、商品分布からトピックの意味を推定するためのコンピュータプログラムが用意されてもよい。
本実施形態によれば、例えばトピックの商品分布から「低価格帯が売れる」「中価格帯が売れる」「高価格帯が売れる」「色々な商品を試したい消費者層」「特定ブランドのリピータ」「ファミリー層」「若年層」「高年齢層」などのトピックの意味が推定され得る。
以上に説明した本実施形態の情報処理システム1によれば、商品の販売量に基づいて、各店舗のトピック分布を判別することができ、複数の店舗を、トピック分布の類似性に基づいて分類することができる。従って、この情報処理システム1は、購買特性を考慮した店舗の商圏特性の分析に役立つ。
特に、本実施形態の情報処理システム1は、モデル学習を行う際に、店舗毎にシェアの大きい商品群に限定して、各商品に対するTF-IDF値を計算し、トピックモデル学習を行う。従って、各店舗の販売傾向を、高シェア商品群によって明確に表現することができ、クラスタリングを適切に行うことができる。
[その他の実施形態]
本開示は、上記実施形態に限定されるものではなく、種々の態様を採ることができる。例えば、上記実施形態では、各店舗が取り扱う特定カテゴリの商品の一群のうち、シェアが基準以上の商品に限ってTF-IDF値を算出し、これをモデル学習に使用した。
しかしながら、シェアが基準未満の商品も含めて、各店舗が取り扱う特定カテゴリの商品の一群に注目して、これら商品のTF-IDF値を算出し、これをモデル学習に使用してもよい。
その他、トピックモデルを用いたトピック分布の判別には、LDAに限られず、様々な手法を適用することができる。
上記実施形態における1つの構成要素が有する機能は、複数の構成要素に分散して設けられてもよい。複数の構成要素が有する機能は、1つの構成要素に統合されてもよい。上記実施形態の構成の一部は、省略されてもよい。上記実施形態の構成の少なくとも一部は、他の上記実施形態の構成に対して付加又は置換されてもよい。特許請求の範囲に記載の文言から特定される技術思想に含まれるあらゆる態様が本開示の実施形態である。
[本明細書が開示する技術思想]
本明細書には、次の技術思想が開示されていると理解することができる。
[項目1]
各商品が複数の店舗の少なくとも一店舗以上で販売される複数の商品に関して、店舗毎に、前記複数の商品のうち、対応する店舗で販売される一以上の商品である一以上の販売商品、及び、前記一以上の販売商品のそれぞれの前記対応する店舗における販売量の大きさを判別可能な販売商品データを取得するように構成される取得部と、
前記複数の店舗に関して、前記販売商品データから判別される前記一以上の販売商品のそれぞれの前記販売量の大きさを根拠に、トピックモデルを用いて、各店舗のトピック分布を判別するように構成される判別部と、
を備える情報処理システム。
[項目2]
前記判別部は、前記複数の店舗に関して、各店舗の前記販売商品データを文書に対応付け、前記各店舗の前記販売商品データから判別される前記一以上の販売商品のそれぞれを、前記文書内の単語に対応付け、前記各店舗における前記一以上の販売商品のそれぞれの前記販売量の大きさを、対応する単語の前記文書内での出現頻度に対応付けた前記トピックモデルを用いて、前記各店舗のトピック分布を判別する項目1記載の情報処理システム。
[項目3]
前記トピックモデルは、潜在ディリクレ配分法に基づく項目1又は項目2記載の情報処理システム。
[項目4]
前記判別部は、
前記店舗毎に、各販売商品のTF-IDF値を前記販売量の大きさに基づき算出することによって、前記複数の店舗及び前記複数の商品に関して、店舗及び商品の組合せ毎のTF-IDF値を算出し、
前記TF-IDF値を根拠に、前記トピックモデルを用いて、前記各店舗のトピック分布を判別する
ように構成される項目1~項目3のいずれか一項記載の情報処理システム。
[項目5]
前記販売量の大きさは、対応する商品の、対応する店舗における販売量の占有割合としてのシェアであり、
前記TF-IDF値は、TF値とIDF値とに基づいて算出され、前記TF値は、対応する店舗における前記一以上の販売商品のシェア合計に対して、対応する商品のシェアが占める割合に対応し、前記IDF値は、前記対応する商品が前記一以上の販売商品に含まれる店舗の数の逆数に対応する項目4記載の情報処理システム。
[項目6]
前記一以上の販売商品は、対応する店舗で販売される商品の一群のうち、前記販売量の大きさが基準以上の商品の一群である項目1~項目5のいずれか一項記載の情報処理システム。
[項目7]
前記複数の店舗のそれぞれの前記トピック分布に基づき、前記複数の店舗を、複数のグループに分類するように構成される分類部
を更に備える項目1~項目6のいずれか一項記載の情報処理システム。
[項目8]
項目1~項目6のいずれか一項記載の情報処理システムにおける前記取得部と、前記判別部としての機能を、コンピュータに実現させるためのコンピュータプログラム。
[項目9]
項目7記載の情報処理システムにおける前記取得部と、前記判別部と、前記分類部としての機能を、コンピュータに実現させるためのコンピュータプログラム。
[項目10]
コンピュータにより実行される情報処理方法であって、
各商品が複数の店舗の少なくとも一店舗以上で販売される複数の商品に関して、店舗毎に、前記複数の商品のうち、対応する店舗で販売される一以上の商品である一以上の販売商品、及び、前記一以上の販売商品のそれぞれの前記対応する店舗における販売量の大きさを判別可能な販売商品データを取得することと、
前記複数の店舗に関して、前記販売商品データから判別される前記一以上の販売商品のそれぞれの前記販売量の大きさを根拠に、トピックモデルを用いて、各店舗のトピック分布を判別することと、
を含む情報処理方法。
[項目11]
前記複数の店舗のそれぞれの前記トピック分布に基づき、前記複数の店舗を、複数のグループに分類することを更に含む項目10記載の情報処理方法。
1…情報処理システム、11…プロセッサ、12…メモリ、13…ストレージ、15…ディスプレイ、17…入力デバイス、18…メディアリーダ/ライタ、19…通信デバイス。

Claims (11)

  1. 各商品が複数の店舗の少なくとも一店舗以上で販売される複数の商品に関して、店舗毎に、前記複数の商品のうち、対応する店舗で販売される一以上の商品である一以上の販売商品、及び、前記一以上の販売商品のそれぞれの前記対応する店舗における販売量の大きさを判別可能な販売商品データを取得するように構成される取得部と、
    前記複数の店舗に関して、前記販売商品データから判別される前記一以上の販売商品のそれぞれの前記販売量の大きさを根拠に、トピックモデルを用いて、各店舗のトピック分布を判別するように構成される判別部と、
    を備える情報処理システム。
  2. 前記判別部は、前記複数の店舗に関して、各店舗の前記販売商品データを文書に対応付け、前記各店舗の前記販売商品データから判別される前記一以上の販売商品のそれぞれを、前記文書内の単語に対応付け、前記各店舗における前記一以上の販売商品のそれぞれの前記販売量の大きさを、対応する単語の前記文書内での出現頻度に対応付けた前記トピックモデルを用いて、前記各店舗のトピック分布を判別する請求項1記載の情報処理システム。
  3. 前記トピックモデルは、潜在ディリクレ配分法に基づく請求項1記載の情報処理システム。
  4. 前記判別部は、
    前記店舗毎に、各販売商品のTF(Term Frequency)-IDF(Inverse Document Frequency)値を前記販売量の大きさに基づき算出することによって、前記複数の店舗及び前記複数の商品に関して、店舗及び商品の組合せ毎のTF-IDF値を算出し、
    前記TF-IDF値を根拠に、前記トピックモデルを用いて、前記各店舗のトピック分布を判別する
    ように構成される請求項1記載の情報処理システム。
  5. 前記販売量の大きさは、対応する商品の、対応する店舗における販売量の占有割合としてのシェアであり、
    前記TF-IDF値は、TF値とIDF値とに基づいて算出され、前記TF値は、対応する店舗における前記一以上の販売商品のシェア合計に対して、対応する商品のシェアが占める割合に対応し、前記IDF値は、前記対応する商品が前記一以上の販売商品に含まれる店舗の数の逆数に対応する請求項4記載の情報処理システム。
  6. 前記一以上の販売商品は、対応する店舗で販売される商品の一群のうち、前記販売量の大きさが基準以上の商品の一群である請求項1記載の情報処理システム。
  7. 前記複数の店舗のそれぞれの前記トピック分布に基づき、前記複数の店舗を、複数のグループに分類するように構成される分類部
    を更に備える請求項1~請求項6のいずれか一項記載の情報処理システム。
  8. 請求項1~請求項6のいずれか一項記載の情報処理システムにおける前記取得部と、前記判別部としての機能を、コンピュータに実現させるためのコンピュータプログラム。
  9. 請求項7記載の情報処理システムにおける前記取得部と、前記判別部と、前記分類部としての機能を、コンピュータに実現させるためのコンピュータプログラム。
  10. コンピュータにより実行される情報処理方法であって、
    各商品が複数の店舗の少なくとも一店舗以上で販売される複数の商品に関して、店舗毎に、前記複数の商品のうち、対応する店舗で販売される一以上の商品である一以上の販売商品、及び、前記一以上の販売商品のそれぞれの前記対応する店舗における販売量の大きさを判別可能な販売商品データを取得することと、
    前記複数の店舗に関して、前記販売商品データから判別される前記一以上の販売商品のそれぞれの前記販売量の大きさを根拠に、トピックモデルを用いて、各店舗のトピック分布を判別することと、
    を含む情報処理方法。
  11. 前記複数の店舗のそれぞれの前記トピック分布に基づき、前記複数の店舗を、複数のグループに分類することを更に含む請求項10記載の情報処理方法。
JP2022179100A 2022-11-08 2022-11-08 情報処理システム、コンピュータプログラム、及び情報処理方法 Active JP7248858B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022179100A JP7248858B1 (ja) 2022-11-08 2022-11-08 情報処理システム、コンピュータプログラム、及び情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022179100A JP7248858B1 (ja) 2022-11-08 2022-11-08 情報処理システム、コンピュータプログラム、及び情報処理方法

Publications (2)

Publication Number Publication Date
JP7248858B1 JP7248858B1 (ja) 2023-03-29
JP2024068560A true JP2024068560A (ja) 2024-05-20

Family

ID=85726041

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022179100A Active JP7248858B1 (ja) 2022-11-08 2022-11-08 情報処理システム、コンピュータプログラム、及び情報処理方法

Country Status (1)

Country Link
JP (1) JP7248858B1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012221469A (ja) * 2011-04-14 2012-11-12 Nippon Telegr & Teleph Corp <Ntt> 購買データ解析装置、方法、及びプログラム
JP2017228056A (ja) * 2016-06-22 2017-12-28 株式会社野村総合研究所 情報分析装置および情報分析方法
JP2018120527A (ja) * 2017-01-27 2018-08-02 株式会社リコー 画像処理装置、画像処理方法及び画像処理システム
JP2021163122A (ja) * 2020-03-31 2021-10-11 株式会社日立システムズ コンサルティング支援システム、コンサルティング支援方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012221469A (ja) * 2011-04-14 2012-11-12 Nippon Telegr & Teleph Corp <Ntt> 購買データ解析装置、方法、及びプログラム
JP2017228056A (ja) * 2016-06-22 2017-12-28 株式会社野村総合研究所 情報分析装置および情報分析方法
JP2018120527A (ja) * 2017-01-27 2018-08-02 株式会社リコー 画像処理装置、画像処理方法及び画像処理システム
JP2021163122A (ja) * 2020-03-31 2021-10-11 株式会社日立システムズ コンサルティング支援システム、コンサルティング支援方法

Also Published As

Publication number Publication date
JP7248858B1 (ja) 2023-03-29

Similar Documents

Publication Publication Date Title
US11501205B2 (en) System and method for synthesizing data
CN106919619B (zh) 一种商品聚类方法、装置及电子设备
US6397166B1 (en) Method and system for model-based clustering and signal-bearing medium for storing program of same
Chen et al. A hierarchical multiple kernel support vector machine for customer churn prediction using longitudinal behavioral data
US6061658A (en) Prospective customer selection using customer and market reference data
US7885859B2 (en) Assigning into one set of categories information that has been assigned to other sets of categories
Mencía et al. Efficient voting prediction for pairwise multilabel classification
CN107357874B (zh) 用户分类方法及装置、电子设备、存储介质
US20040039548A1 (en) Method, system, and computer program product for outlier detection
Dew et al. Modeling dynamic heterogeneity using Gaussian processes
CN106021362A (zh) 查询式的图片特征表示的生成、图片搜索方法和装置
CN108648038B (zh) 一种基于子图挖掘的信用炒作与恶意评价识别方法
Vucetic et al. A regression-based approach for scaling-up personalized recommender systems in e-commerce
CN111966886A (zh) 对象推荐方法、对象推荐装置、电子设备及存储介质
CN103597485A (zh) 模式提取装置及其方法
Kothari et al. Learning from labeled and unlabeled data
McAlister et al. Incorporating choice dynamics in models of consumer behavior
Devi et al. An efficient document clustering using hybridised harmony search K-means algorithm with multi-view point
JP2007316867A (ja) エリア評価装置及び方法
JP7248858B1 (ja) 情報処理システム、コンピュータプログラム、及び情報処理方法
Yao et al. Combining unsupervised and supervised data mining techniques for conducting customer portfolio analysis
CN114238758A (zh) 一种基于多源跨界数据融合的用户画像预测方法
JP2009053983A (ja) 情報構造化装置、情報構造化方法、及びプログラム
JP2009032118A (ja) 情報構造化装置、情報構造化方法、及びプログラム
CN114881677A (zh) 一种用户需求分析方法、装置及设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221108

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20221108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230316

R150 Certificate of patent or registration of utility model

Ref document number: 7248858

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150