JP7177107B2 - 情報処理装置、情報処理方法および情報処理プログラム - Google Patents

情報処理装置、情報処理方法および情報処理プログラム Download PDF

Info

Publication number
JP7177107B2
JP7177107B2 JP2020019975A JP2020019975A JP7177107B2 JP 7177107 B2 JP7177107 B2 JP 7177107B2 JP 2020019975 A JP2020019975 A JP 2020019975A JP 2020019975 A JP2020019975 A JP 2020019975A JP 7177107 B2 JP7177107 B2 JP 7177107B2
Authority
JP
Japan
Prior art keywords
service
information processing
services
user
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020019975A
Other languages
English (en)
Other versions
JP2021125128A (ja
Inventor
貴之 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2020019975A priority Critical patent/JP7177107B2/ja
Publication of JP2021125128A publication Critical patent/JP2021125128A/ja
Application granted granted Critical
Publication of JP7177107B2 publication Critical patent/JP7177107B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、情報処理装置、情報処理方法および情報処理プログラムに関する。
利用者の行動履歴をベクトル化する技術が開示されている。
特開2009-128937号公報 特開2017-208044号公報
しかしながら、上記の従来技術は、利用者がPC上で行ったWeb閲覧行動の記録から、閲覧行動をカテゴリ分けして、特徴ベクトルを求めるというものや、行動履歴データから、ターゲット変数集合と特徴ベクトル集合とを生成し特徴ベクトルに基づいてアイテムが多くの利用者が採用しているアイテムであるか否かを分類するための分類器のパラメータベクトルを学習するというものである。
本願は、上記に鑑みてなされたものであって、より効果的に利用者のサービス利用に関するベクトルを分析することを目的とする。
本願に係る情報処理装置は、各利用者のサービス利用の遷移について、利用されるサービスの遷移順序に沿って並べたシーケンスデータから、利用されるサービス遷移順序が有する特徴に基づいて、前記シーケンスデータをベクトル表現化方式の深層学習により学習し、サービス毎のベクトルを生成する生成部と、サービス毎のベクトルを可視化する可視化部とを備え、前記サービスは、ウェブコンテンツ、アプリケーション、プログラムの機能、データ及び分析したいユーザの行動を任意の粒度でサービスとみなしたもののうち少なくとも1つを含むことを特徴とする。
実施形態の一態様によれば、より効果的に利用者のサービス利用に関するベクトルを分析することができる。
図1は、実施形態に係る情報処理方法の概要を示す説明図である。 図2Aは、初年度の一時期におけるサービス利用目的の定量化の一例を示す図である。 図2Bは、次年度の同時期におけるサービス利用目的の定量化の一例を示す図である。 図2Cは、調査対象サービスとそれに近い利用目的のサービスとのグルーピングの一例を示す図である。 図3は、実施形態に係る情報処理システムの構成例を示す図である。 図4は、実施形態に係る情報処理装置の構成例を示す図である。 図5は、利用者データベースの一例を示す図である。 図6は、シーケンスデータベースの一例を示す図である。 図7は、サービス利用目的データベースの一例を示す図である。 図8は、実施形態に係る処理手順を示すフローチャートである。 図9は、ハードウェア構成の一例を示す図である。
以下に、本願に係る情報処理装置、情報処理方法、および情報処理プログラムを実施するための形態(以下、「実施形態」と記載する)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、および情報処理プログラムが限定されるものではない。また、以下の実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
〔1.情報処理方法の概要〕
まず、図1を参照し、実施形態に係る情報処理装置が行う情報処理方法の概要について説明する。図1は、実施形態に係る情報処理方法の概要を示す説明図である。なお、図1では、サービス利用目的(利用のされ方)を定量的に分析し、サービス毎のベクトルを生成する場合を例に挙げて説明する。
図1に示すように、情報処理システム1は、端末装置10と情報処理装置100と情報提供装置200とを含む。端末装置10と情報処理装置100と情報提供装置200とは、それぞれネットワークN(図3参照)を介して有線又は無線で互いに通信可能に接続される。
端末装置10は、利用者Uによって使用される情報処理装置である。情報処理装置100は、各利用者Uのサービス利用目的を分析する情報処理装置である。情報提供装置200は、各利用者Uの端末装置10に対して、各種サービスを提供する情報処理装置である。情報提供装置200は、複数台であってもよい。
なお、情報処理装置100は、情報提供装置200の1つであってもよい。すなわち、情報処理装置100も、サービスを提供する情報処理装置であってもよい。また、情報提供装置200は、中継サーバ(Proxy)やリダイレクタ(redirector)等であってもよい。
例えば、利用者Uは、端末装置10を用いて、各情報提供装置200により提供される各種サービスを利用する(ステップS1)。
各情報提供装置200は、各利用者Uの端末装置10からのアクセスを集計して、各利用者Uのアクセスログを生成する(ステップS2)。
情報処理装置100は、各情報提供装置200から、各利用者Uのアクセスログを取得する(ステップS3)。
このとき、情報処理装置100は、アクセスログの利用に予め同意した利用者Uのアクセスログのみを取得するようにしてもよい。例えば、情報処理装置100は、予め登録された利用者Uのアクセスログのみを取得するようにしてもよい。
なお、情報処理装置100は、自身が各利用者Uの端末装置10に対してサービスを提供している場合には、自身が提供するサービスに関する各利用者Uのアクセスログを生成することができる。
情報処理装置100は、各利用者Uのアクセスログから、同一セッションでのサービスの利用に関するサービス利用遷移シーケンスデータを作成する(ステップS4)。
なお、実際には、所定の期間内における利用者Uの一連のアクセスを、同一セッションでのサービスの利用としてもよい。また、所定の期間内に行われたアクセス以外にも、例えばリンクを辿った場合なども同一セッションでのサービスの利用としてもよい。
また、同一ブラウザや同一アプリケーションからのアクセス以外にも、異なるブラウザや異なるアプリケーションからの同一時間帯のアクセスを、同一セッションでのサービスの利用としてもよい。すなわち、同一ブラウザ等から連続してアクセスした場合以外にも、所定の期間内に連続して行われたアクセスを、同一セッションでのサービスの利用としてもよい。
また、サービスは、任意のサービスであってもよい。例えば、サービスは、ウェブコンテンツであってもよいし、アプリケーション(以下、アプリ)であってもよい。また、サービスは、API(Application Programming Interface)を介して端末装置10に提供されるプログラムの機能やデータ等であってもよい。また、サービスの単位は、ウェブコンテンツごと、アプリごと、ドメインごと、サブドメインごと等でもよい。また、情報処理装置100は、分析したい利用者の行動を任意の粒度でサービスとみなし、サービスごとの遷移を示すサービス利用遷移シーケンスデータを作成してもよい。
ここで、情報処理装置100は、例えばアクセスしたドメインの順番、アクセスしたアプリの順番、あるいはアクセスしたウェブコンテンツの順番等、任意の粒度でアクセスログをまとめ、利用者Uが利用したサービスの内容やその順序を示すサービス利用遷移シーケンスデータを作成する。
図1に示す例では、このサービス利用遷移シーケンスデータは、「第1検索サイト」、「ローカルまとめサイト」、「第1マップWEB」、「第1マップアプリ」、「第1検索サイト」、「トラベルサイト」および「宿泊予約サイト」を含み、これらの順にサービスの利用が遷移していることを示す。
「第1検索サイト」は、Webブラウザを介して提供される検索サービス(検索エンジン)を示す。また、「ローカルまとめサイト」は、Webブラウザを用いてアクセスした地域発の情報や観光情報等のまとめサイトを示す。また、「第1マップWEB」は、Webブラウザを介して提供されるマップサービスを示す。また、「第1マップアプリ」は、マップ専用アプリを介して提供されるマップサービスを示す。また、「トラベルサイト」は、Webブラウザを用いてアクセスした旅行関連サイトを示す。また、「宿泊予約サイト」は、Webブラウザを用いてアクセスした宿泊施設等の予約サイトを示す。
なお、このようなサービス利用遷移シーケンスデータの生成においては、各サービスを跨いで利用者Uが共通して用いる利用者IDを利用してもよい。例えば、各サービスにおいて利用者Uが個別に用いる利用者IDを共通する利用者IDへと変換するテーブルを用いてもよい。また、この利用者IDは、例えば端末装置10の識別情報であってもよい。
情報処理装置100は、サービス利用の遷移態様が有する特徴(サービス利用遷移シーケンスデータが示す特徴)であって、利用されるサービスの遷移順序が有する特徴をモデルに学習させることで、サービス毎のベクトルを生成する(ステップS5)。
例えば、情報処理装置100は、ベクトル表現化方式(例えば、Word2Vec)等の学習手法や同様の手法を用いて、モデルにサービス利用遷移シーケンスデータが有する特徴を学習させる。そして、情報処理装置100は、学習済のモデルを用いて、サービス毎のベクトルを生成する。
モデルは、任意の種別のモデルが採用可能である。例えば、情報処理装置100は、SVM(Support Vector Machine)やDNN(Deep Neural Network)をモデルとして採用してもよい。ここで、DNNは、CNN(Convolutional Neural Network)やRNN(Recurrent Neural Network)であってもよい。また、RNNは、LSTM(Long short-term memory)等であってもよい。すなわち、モデルは、任意の形式のモデルが採用可能である。また、モデルは、例えば、CNNとRNNとを組み合わせたモデル等、複数のモデルを組み合わせることで実現されるモデルであってもよい。
また、情報処理装置100は、分析したい利用者の行動を任意の粒度でサービスとみなし、サービスごとの遷移を示すサービス利用遷移シーケンスデータを作成し、作成した遷移シーケンスデータにおけるサービス利用の遷移の特徴から、モデルの生成を行ってもよい。
また、ベクトル表現化方式等の学習手法では、モデルに学習データの特徴を学習させる学習フェーズと、学習済モデルを用いてベクトル化を行う測定フェーズとが存在する。学習フェーズにおいては、モデルに対して類似する複数の学習データが入力された場合には、学習データごとに類似するベクトル(例えば、コサイン距離が小さくなるベクトル)を生成するように、モデルの修正を行う。反対に、モデルに対して類似しない複数の学習データが入力された場合には、学習データごとに類似しないベクトルを生成するように、モデルの学習を行う。
具体的には、ベクトル表現化方式では、文章の中の単語のそれぞれをベクトル化する場合、以下の(a)~(c)などのようにベクトル化する。なお、学習方式はこれだけに限定されない。
(a)ベクトル化対象の単語の前後の単語(前後いくつの単語にするかは任意)をモデルに入力し、モデルの出力を対象の単語を正解データとして学習させる(Word2VecのCBOW方式)。
(b)ベクトル化対象の単語をモデルに入力し、モデルの出力をその前後の単語(前後いくつの単語にするかは任意)を正解データとして学習させる(Word2VecのSkipGram方式)。
(c)単語のシーケンスをモデルに入力し、各単語の次の1文字を正解データとして学習させたり、入力したシーケンス全体の次の1文字を正解データとして学習させたりして、モデルに学習させる(RNNやLSTMモデル)。
そして、単語のそれぞれをベクトル化して得られたスコアが高ければ高い程、類似するベクトルを生成するように学習を行う。スコアは、類似度/関連度を示す数値である。例えば、スコアは、各サービスと対応するベクトルのコサイン類似度である。
本実施形態においても、上記の方式を利用する。例えば、情報処理装置100は、各利用者Uが利用した(アクセスした)サービスをベクトル表現化方式における「単語」とみなし、アクセスログから生成したサービス利用遷移シーケンスデータを、「文章」とみなす。
そして、情報処理装置100は、サービス利用遷移シーケンスデータにおいて、以下の(A)~(C)のような概念で、ベクトル化を行うモデルを生成する。なお、学習方式はこれだけに限定されない。
(A)ベクトル化対象のサービスの前後のシーケンスのサービス(前後いくつのサービスにするかは任意)をモデルに入力し、モデルの出力を対象のサービスを正解データとして学習させる(Word2VecのCBOW方式)。
(B)ベクトル化対象のサービスをモデルに入力し、モデルの出力をその前後のシーケンスのサービス(前後いくつの単語にするかは任意)を正解データとして学習させる(Word2VecのSkipGram方式)。
(C)サービスのシーケンスをモデルに入力し、各サービスの次のサービスを正解データとして学習させたり、入力したシーケンス全体の次のサービスを正解データとして学習させたりして、モデルに学習させる(RNNやLSTMモデル)。
なお、サービス毎のベクトルは、密ベクトルであってもよいし、スパースなベクトル(疎ベクトル)であってもよい。すなわち、各種任意のベクトルであってもよい。また、情報処理装置100は、スパースなベクトルを生成した後で、スパースを解消した密ベクトルを生成してもよい。
また、サービス毎のベクトルはそれぞれ多次元のベクトルである。ここでは、情報処理装置100は、128次元ベクトルを生成する。なお、ベクトルの次元数は、任意の次元数であってもよい。
情報処理装置100は、サービス毎のベクトルを2次元に次元圧縮し可視化する(ステップS6)。
これにより、サービスジャンル毎(利用目的が違うもの毎)におよそ分類される。このように、サービス利用遷移シーケンスを学習することで、サービス利用目的の分析が可能となる。
〔1-1.活用事例1〕
情報処理装置100は、サービス利用遷移シーケンスにおいて、調査対象サービスに近い利用目的(利用のされ方)のサービスを列挙し、調査対象サービスの利用目的の把握と、グルーピングを行う。
ここでは、調査対象サービスとして「第1マップ」(第1マップアプリ)を挙げ、その競合サービスとして「第2マップ」を挙げる。
例えば、情報処理装置100は、図2A、図2Bに示すように、調査対象サービスの利用目的を定量化し、変化を可視化する。図2Aは、初年度の一時期におけるサービス利用目的の定量化の一例を示す図である。図2Bは、次年度の同時期におけるサービス利用目的の定量化の一例を示す図である。
ここでは、図2Aは、「2018年4-6月」における「第1マップ」と「第2マップ」とのそれぞれに近いサービスをベクトル化して得られたスコアを示したものである。スコアは、類似度/関連度を示す数値である。例えば、スコアは、各サービスと対応するベクトルのコサイン類似度である。
図2Aに示す例では、「第1マップ」の近くに「ニュースサイト」や「天気サイト」が示されている。「第1マップ」に対する「ニュースサイト」のスコアは「0.37」である。「第1マップ」に対する「天気サイト」のスコアは「0.35」である。
また、図2Aに示す例では、「第2マップ」の近くに「グルメレビューサイト」や「旅行口コミサイト」が示されている。「第2マップ」に対する「グルメレビューサイト」のスコアは「0.44」である。「第2マップ」に対する「旅行口コミサイト」のスコアは「0.43」である。
さらに、「第1マップ」に対する「第2マップ」のスコアは「0.07」である。「第1マップ」に対する「グルメレビューサイト」のスコアは「-0.05」である。
このように、「第1マップ」に近いのは、「ニュースサイト」や「天気サイト」などであり、雨雲レーダのような天気予報確認目的や、ニュースのようにPUSH通知で気になる情報(防犯マップなど)が送付されてきた際にその現場確認目的で利用していると推定される。
一方、「第2マップ」に近いのは、「グルメレビューサイト」や「旅行口コミサイト」などであり、ローカル情報調査や予約機能などの目的で利用していると推定される。
図2Bは、図2Aに示す例の次年度同時期の「2019年4-6月」における「第1マップ」と「第2マップ」とのそれぞれに近いサービスをベクトル化して得られたスコアを示したものである。
ここで、図2Aに示す例と、図2Bに示す例とで、学習済モデルが異なる。例えば、図2Aに示す例のように「2018年4-6月」のデータを用いて学習を行った場合と、図2Bに示す例のように「2019年4-6月」のデータを用いて学習を行った場合とで、同一サービスでも、出てくるベクトルが変化するため、図2Aと図2Bとで表示が異なる。
図2Bに示す例では、「第1マップ」の近くに「ニュースサイト」や「天気サイト」が示されている。「第1マップ」に対する「ニュースサイト」のスコアは「0.40」である。「第1マップ」に対する「天気サイト」のスコアは「0.37」である。すなわち、図2Aに示す例と比べて、値が向上していると推定される。
また、図2Bに示す例では、「第2マップ」の近くに「グルメレビューサイト」や「旅行口コミサイト」が示されている。「第2マップ」に対する「グルメレビューサイト」のスコアは「0.47」である。「第2マップ」に対する「旅行口コミサイト」のスコアは「0.45」である。すなわち、図2Aに示す例と比べて、値が向上していると推定される。
さらに、「第1マップ」に対する「第2マップ」のスコアは「0.03」である。「第1マップ」に対する「グルメレビューサイト」のスコアは「-0.07」である。すなわち、図2Aに示す例と比べて、値が低下していると推定される。
そして、情報処理装置100は、図2Cに示すように、調査対象サービスとそれに近い利用目的(利用のされ方)のサービスとのグルーピングを行い、調査対象サービスの利用目的(利用のされ方)に基づいて、今後の伸び代(市場ポテンシャル)を分析する。図2Cは、調査対象サービスとそれに近い利用目的のサービスとのグルーピングの一例を示す図である。
例えば、「第1マップ」の現在の使われ方は、「天気サイト」と「ニュースサイト」であるため、伸び代はこれらの市場の規模と成長性に依存すると推定される。また、さらなる成長を望む場合、大きな市場、成長市場へのシフトを行う必要があると推定される。
〔1-2.活用事例2〕
ベクトル表現化方式のように、ある観点(例えば、文献や論文)から類似する対象(例えば、単語)をベクトル化した際に類似するベクトルを生成し、類似しない対象をベクトル化した際に類似しないベクトルを生成した場合、モデルは、その観点における対象の概念を学習することができると考えられることが知られている。例えば、2つの単語について、出現頻度や出現順序、文章中における共起性等に基づいた類似性を用いて、モデルの学習を行うことで、モデルに各単語の概念を学習させることができると推定される。
上記のような概念を学習させた場合、単語が有する概念同士の加算あるいは減算を行うことができることが知られている。例えば、各種単語の概念を学習させたモデルを用いて、「王」、「女王」、「男」、「女」という単語をベクトル化した際に、「王」のベクトルから「男」のベクトルを減算し、さらに「女」のベクトルを加算すると、「女王」のベクトルと類似するベクトルが得られることが知られている。
一方、上述したように、同一セッションで利用した複数のサービス(換言すると、利用者が共通する意図のもとで利用した複数のサービス)の共起性をモデルに学習させた場合、利用者がどのような意図の元で各サービスを利用したかという概念をモデルに学習させることができる。その結果、各サービスのベクトルの加減算を実現できると考えられる。
そこで、情報処理装置100は、調査対象サービスと競合サービスとのベクトルの引き算をすることにより、調査対象サービスになくて、競合サービスにあるもの(=差分)を分析する。
例えば、「第1マップ」と「第2マップ」とのベクトルの引き算をした結果、「第2マップ」にあり、「第1マップ」にないサービス利用目的(利用のされ方)として、「ナビゲーション」、「飲食店情報(予約)」、「グルメ、旅行記事コンテンツ」、「旅行/宿泊(予約)」があるとする。
この場合、各利用者Uは「第2マップ」を出先の調査や予約、ナビゲーションに使っていると解釈できる。また、「第1マップ」を「第2マップ」側の市場にシフトしたい場合には、これらを強化する必要があると推測できる。
〔2.情報処理システムの構成例〕
次に、図3を用いて、実施形態に係る情報処理装置100が含まれる情報処理システム1の構成について説明する。図3は、実施形態に係る情報処理システム1の構成例を示す図である。図3に示すように、実施形態に係る情報処理システム1は、端末装置10と情報処理装置100と情報提供装置200とを含む。これらの各種装置は、ネットワークNを介して、有線又は無線により通信可能に接続される。ネットワークNは、例えば、LAN(Local Area Network)や、インターネット等のWAN(Wide Area Network)である。
また、図3に示す情報処理システム1に含まれる各装置の数は図示したものに限られない。例えば、図3では、図示の簡略化のため、端末装置10や情報提供装置200をそれぞれ1台のみ示したが、これはあくまでも例示であって限定されるものではなく、2台以上であってもよい。
端末装置10は、利用者Uによって使用される情報処理装置である。例えば、端末装置10は、スマートフォンやタブレット端末等のスマートデバイス、フィーチャーフォン、PC(Personal Computer)、PDA(Personal Digital Assistant)、カーナビゲーションシステム、スマートウォッチやヘッドマウントディスプレイ等のウェアラブルデバイス(Wearable Device)、スマートグラス等である。
また、かかる端末装置10は、LTE(Long Term Evolution)、4G(4th Generation)、5G(5th Generation:第5世代移動通信システム)等の無線通信網や、Bluetooth(登録商標)、無線LAN(Local Area Network)等の近距離無線通信を介してネットワークNに接続し、情報処理装置100や情報提供装置200と通信することができる。
情報処理装置100や情報提供装置200は、例えばPCやサーバ、あるいはメインフレーム又はワークステーション等である。なお、情報処理装置100および情報提供装置200は、クラウドコンピューティングにより実現されてもよい。
〔3.情報処理装置の構成例〕
次に、図4を用いて、実施形態に係る情報処理装置100の構成について説明する。図4は、実施形態に係る情報処理装置100の構成例を示す図である。図4に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。また、通信部110は、ネットワークN(図3参照)と有線又は無線で接続される。
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、又は、ハードディスク、光ディスク等の記憶装置によって実現される。図4に示すように、記憶部120は、利用者データベース121と、シーケンスデータベース122と、サービス利用目的データベース123とを有する。
(利用者データベース121)
利用者データベース121は、利用者Uに関する各種情報を記憶する。例えば、利用者データベース121は、利用者Uの属性等の種々の情報を記憶する。図5は、利用者データベース121の一例を示す図である。図5に示した例では、利用者データベース121は、「利用者ID(Identifier)」、「年齢」、「性別」、「自宅」、「勤務地」、「サービス」、「アクセスログ」といった項目を有する。
「利用者ID」は、利用者Uを識別するための識別情報を示す。また、「年齢」は、利用者IDにより識別される利用者Uの年齢を示す。なお、「年齢」は、例えば35歳など、利用者IDにより識別される利用者Uの具体的な年齢であってもよい。また、「性別」は、利用者IDにより識別される利用者Uの性別を示す。
また、「自宅」は、利用者IDにより識別される利用者Uの自宅の位置情報を示す。なお、図5に示す例では、「自宅」は、「LC11」といった抽象的な符号を図示するが、緯度経度情報等であってもよい。また、例えば、「自宅」は、地域名や住所であってもよい。
また、「勤務地」は、利用者IDにより識別される利用者Uの勤務地(学生の場合は学校)の位置情報を示す。なお、図5に示す例では、「勤務地」は、「LC12」といった抽象的な符号を図示するが、緯度経度情報等であってもよい。また、例えば、「勤務地」は、地域名や住所であってもよい。
また、「サービス」は、利用者IDにより識別される利用者Uが現在利用しているサービスを示す。なお、「サービス」は、複数であってもよい。すなわち、1人の利用者Uが複数のサービスを同時に利用してもよい。
また、「アクセスログ」は、利用者IDにより識別される利用者Uのアクセスログであって、各情報提供装置200から取得した利用者Uのアクセスログを示す。
例えば、図5に示す例において、利用者ID「U1」により識別される利用者Uの年齢は、「20代」であり、性別は、「男性」であることを示す。また、例えば、利用者ID「U1」により識別される利用者Uは、自宅が「LC11」であることを示す。また、例えば、利用者ID「U1」により識別される利用者Uは、勤務地が「LC12」であることを示す。また、例えば、利用者ID「U1」により識別される利用者Uは「サービス#11」を利用しており、そのアクセスログが「ログ#1」に記録されていることを示す。
ここで、図5に示す例では、「U1」、「LC11」、「LC12」、「サービス#11」および「ログ#1」といった抽象的な値を用いて図示するが、「U1」、「LC11」、「LC12」、「サービス#11」および「ログ#1」には、具体的な文字列や数値等の情報が記憶されるものとする。以下、他の情報に関する図においても、抽象的な値を図示する場合がある。
なお、利用者データベース121は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、利用者データベース121は、利用者Uの端末装置10に関する各種情報を記憶してもよい。また、利用者データベース121は、利用者Uのデモグラフィック(人口統計学的属性)、サイコグラフィック(心理学的属性)、ジオグラフィック(地理学的属性)、ベヘイビオラル(行動学的属性)等の属性に関する情報を記憶してもよい。例えば、利用者データベース121は、氏名、家族構成、職業、職位、収入、資格、居住形態(戸建、マンション等)、車の有無、通学・通勤時間、通学・通勤経路、定期券区間(駅、路線等)、利用頻度の高い駅(自宅・勤務地の最寄駅以外)、行動履歴(利用頻度の高い位置情報)、習い事(場所、時間帯等)、趣味、興味、ライフスタイル等の情報を記憶してもよい。また、利用者データベース121は、利用者Uが検索エンジン等に入力した検索クエリ(検索キーワード)に関する情報を記憶してもよい。
(シーケンスデータベース122)
シーケンスデータベース122は、利用者Uの同一セッションでのサービスの利用に関するアクセスログから作成したサービス利用遷移シーケンスデータに関する各種情報を記憶する。図6は、シーケンスデータベース122の一例を示す図である。図6に示した例では、シーケンスデータベース122は、「利用者ID」、「シーケンスID」、「サービス利用遷移シーケンス」といった項目を有する。
「利用者ID」は、利用者Uを識別するための識別情報を示す。また、「シーケンスID」は、サービス利用遷移シーケンスデータを識別するための識別情報を示す。また、「サービス利用遷移シーケンス」は、サービス利用遷移シーケンスデータに含まれる各サービスとその利用順序を示す。なお、各サービスを示す情報は、各サービスを識別するための識別情報であってもよい。
さらに、「サービス利用遷移シーケンス」は、「サービス」、「利用日時」といった項目を含む。「サービス」は、利用者Uにより利用されたサービスを示す。「利用日時」は、利用者Uがそのサービスを利用した日時を示す。なお、「利用日時」は、利用者Uがそのサービスを利用した順番を示す情報(例えば、「1,2,3,・・・」、「A,B,C,・・・」など)であってもよい。
例えば、図6に示す例において、利用者ID「U1」により識別される利用者Uの同一セッションでのサービスの利用に関するアクセスログから、シーケンスID「SQ1」により識別されるサービス利用遷移シーケンスデータが作成されたことを示す。また、シーケンスID「SQ1」により識別されるサービス利用遷移シーケンスデータにおいて、利用者Uにより利用されたサービスが、「第1検索サイト」、「ローカルまとめサイト」、「第1マップWEB」、「第1マップアプリ」、「第1検索サイト」、「トラベルサイト」および「宿泊予約サイト」の順に遷移していることを示す。
なお、シーケンスデータベース122は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、シーケンスデータベース122は、サービス利用遷移シーケンスデータに含まれる各サービスの利用日時に関する情報を記憶してもよい。また、シーケンスデータベース122は、サービス利用遷移シーケンスデータに含まれる各サービスの利用場所に関する情報を記憶してもよい。
(サービス利用目的データベース123)
サービス利用目的データベース123は、調査対象サービスに関する各種情報を記憶する。図7は、サービス利用目的データベース123の一例を示す図である。図7に示した例では、サービス利用目的データベース123は、「対象サービス」、「近傍サービス」、「スコア」といった項目を有する。
「対象サービス」は、サービス利用目的分析の調査対象サービスを示す。「近傍サービス」は、調査対象サービスに近い利用目的(利用のされ方)のサービスを示す。「スコア」は、調査対象サービスに対して、調査対象サービスに近い利用目的のサービスをベクトル化して得られたスコアを示す。
例えば、図7に示す例において、調査対象サービス「第1マップ」に対し、利用目的「ニュースサイト」のスコアは、2018年4-6月において「0.37」、2019年4-6月において「0.40」であることを示す。また、調査対象サービス「第1マップ」に対し、利用目的「天気サイト」のスコアは、2018年4-6月において「0.35」、2019年4-6月において「0.37」であることを示す。
また、調査対象サービス「第2マップ」に対し、利用目的「グルメレビューサイト」のスコアは、2018年4-6月において「0.44」、2019年4-6月において「0.47」であることを示す。また、調査対象サービス「第2マップ」に対し、利用目的「旅行口コミサイト」のスコアは、2018年4-6月において「0.43」、2019年4-6月において「0.45」であることを示す。
なお、サービス利用目的データベース123は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、サービス利用目的データベース123は、調査対象サービスと、調査対象サービスに近い利用目的のサービスとの位置座標やベクトルの向きに関する情報を記憶してもよい。
(制御部130)
図4に戻り、説明を続ける。制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等によって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAM等の記憶領域を作業領域として実行されることにより実現される。図4に示す例では、制御部130は、受付部131と、取得部132と、作成部133と、学習部134と、可視化部135と、分析部136と、提供部137とを有する。
(受付部131)
受付部131は、通信部110を介して、各利用者Uの端末装置10から、各利用者Uに関する各種情報の登録を受付け、利用者データベース121に記憶する。
(取得部132)
取得部132は、通信部110を介して、各情報提供装置200から、各利用者Uのアクセスログを取得する。
(作成部133)
作成部133は、取得された各利用者Uのアクセスログから、同一セッションでのサービスの利用に関するサービス利用遷移シーケンスデータを作成する。
例えば、作成部133は、アクセスしたドメインの順番、アクセスしたサービスの順番、あるいはアクセスしたウェブコンテンツの順番等、任意の粒度で各利用者Uのアクセスログをまとめ、利用者Uが利用したサービスの内容やその順序を示すサービス利用遷移シーケンスデータを作成する。
また、作成部133は、各利用者Uの端末装置10が情報処理装置100により提供されるサービスを利用している場合には、情報処理装置100により提供されるサービスに関するアクセスログを自動的に生成してもよい。
(学習部134)
学習部134は、ベクトル表現化方式等の学習手法や同様の手法を用いて、モデルにサービス利用遷移シーケンスデータが有する特徴を学習させる。そして、学習部134は、学習済のモデルを用いて、サービス毎のベクトルを生成する。なお、モデルは、任意の種別のモデルが採用可能である。
学習は、例えばディープニューラルネットワーク(DNN:Deep Neural Network)を利用したディープラーニング(深層学習)等である。また、データマイニングやその他の機械学習アルゴリズムを利用してもよい。学習部134は、上述した各種の学習手法により、モデルの学習を行う。
例えば、学習部134は、ベクトル化対象のサービスの前後のシーケンスのサービス(前後いくつのサービスにするかは任意)をモデルに入力し、モデルの出力を対象のサービスを正解データとして学習させる(Word2VecのCBOW方式)。
もしくは、学習部134は、ベクトル化対象のサービスをモデルに入力し、モデルの出力をその前後のシーケンスのサービス(前後いくつの単語にするかは任意)を正解データとして学習させる(Word2VecのSkipGram方式)。
もしくは、学習部134は、サービスのシーケンスをモデルに入力し、各サービスの次のサービスを正解データとして学習させたり、入力したシーケンス全体の次のサービスを正解データとして学習させたりして、モデルに学習させる(RNNやLSTMモデル)。
(可視化部135)
可視化部135は、サービス毎のベクトルを2次元に次元圧縮し可視化する。
可視化とは、人の目には見えない現象・事象・関係性を、視認可能なもの(画像・グラフ・図・表など)にすることをいう。なお、2次元は一例に過ぎない。実際には3次元であってもよい。
例えば、可視化部135は、サービス毎のベクトルに関する情報を、ディスプレイ等の表示装置に表示させる表示制御部として機能してもよい。
また、可視化部135は、可視化されたサービス毎のベクトルに関する情報を生成してもよい。可視化されたサービス毎のベクトルに関する情報は、ファイル形式でもよいし、レポート形式でもよい。
(分析部136)
分析部136は、可視化されたサービス毎のベクトルに関する情報に基づいて、サービス利用目的を分析する。
また、分析部136は、調査対象サービスと、その調査対象サービスに近い利用目的(利用のされ方)のサービスとについてグルーピングを行う。例えば、調査対象サービスを「第1マップ」とした場合、分析部136は、「第1マップ」に近いのは、「ニュース系アプリ」、「天気系アプリ」等であるといった分析結果を出力してもよい。
また、分析部136は、調査対象サービスの利用目的に基づいて、調査対象サービスの今後の伸び代を分析する。
また、分析部136は、調査対象サービスと競合サービスとのベクトルの引き算をすることにより、調査対象サービスになくて、競合サービスにあるもの(=差分)を分析する。例えば、調査対象サービスを「第1マップ」とし、競合サービスを「第2マップ」とした場合、分析部136は、「第2マップ」にあり、「第1マップ」にはない利用目的(利用のされ方)として、「ナビゲーション」、「飲食店情報(予約)」、「グルメ、旅行記事コンテンツ」、「旅行/宿泊(予約)」等があるといった分析結果を出力してもよい。
(提供部137)
提供部137は、通信部110を介して、サービス利用目的の分析結果に関する情報を外部に提供する。例えば、提供部137は、外部からの要求に応じて、サービス利用目的の分析結果に関するレポートを提供してもよい。なお、提供部137は、サービス利用目的の分析結果に関する情報を、ディスプレイ等の表示装置に表示させる表示制御部として機能してもよい。
また、提供部137は、通信部110を介して、可視化されたサービス毎のベクトルに関する情報を外部に提供してもよい。例えば、提供部137は、外部からの要求に応じて、可視化されたサービス毎のベクトルに関する情報を外部に提供してもよい。
また、提供部137は、通信部110を介して、各利用者Uの端末装置10に対して、各種サービスを提供してもよい。
〔4.処理手順〕
次に、図8を用いて実施形態に係る情報処理装置100による処理手順について説明する。図8は、実施形態に係る処理手順を示すフローチャートである。なお、以下に示す処理手順は、情報処理装置100の制御部130によって繰り返し実行される。
情報処理装置100の制御部130は、通信部110を介して、各情報提供装置200から、各利用者Uのアクセスログを取得する(ステップS101)。
制御部130は、各利用者Uのアクセスログから、同一セッションでのサービスの利用に関するサービス利用遷移シーケンスデータを作成する(ステップS102)。
制御部130は、モデルに、サービス利用遷移シーケンスデータを入力し、同一セッションにおいて利用者Uがサービスを利用した意図(利用目的)を学習させ、その学習結果に基づいて、サービス毎のベクトルを生成する(ステップS103)。
制御部130は、サービス毎のベクトルを2次元に次元圧縮し可視化する(ステップS104)。
制御部130は、可視化されたサービス毎のベクトルに関する情報に基づいて、サービス利用目的を分析する(ステップS105)。
制御部130は、通信部110を介して、サービス利用目的の分析結果を外部に提供する(ステップS106)。
なお、実際には、制御部130は、通信部110を介して、可視化されたサービス毎のベクトルに関する情報を外部に提供してもよい。これにより、外部の機器に、可視化されたサービス毎のベクトルに関する情報が表示され、外部でサービス利用目的を分析することができる。
〔5.変形例〕
上述した端末装置10および情報処理装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、実施形態の変形例について説明する。
上記の実施形態において、同じ属性を持つ利用者Uの同一セッションでのサービスの利用に関するアクセスログから、サービス利用遷移シーケンスデータを作成してもよい。例えば、サービス利用遷移シーケンスは利用者Uの属性(性別/年齢層/居住地域/家族構成/趣味等)によっても異なると考えられるため、利用者Uの属性に応じて分類したサービス利用遷移シーケンスデータを作成してもよい。
また、属性ごとに、モデルを生成してもよい。例えば、モデルと対応する属性の利用者のサービス利用遷移シーケンスデータを抽出し、抽出したサービス利用遷移シーケンスデータから、モデルを生成する。
また、属性ごとに生成したモデルを用いて、属性ごとの提案を行ってもよい。例えば、分析の結果、男性においては、マップサービスがニュースと関連するが、女性においては、マップサービスが天気と関連する場合、サービス改善の提案の際に、男性に対するサービス改善と、女性に対するサービス改善とについて、別々の提案を行ってもよい。また、図2A~図2Cに示す例において、男性について、第1マップを第2マップに近づけるならば、男性の場合は、旅行口コミに近づけるべきだが、女性の場合は、レビューサイトに近づけるべきである等の提案を行ってもよい。
また、上記の実施形態において、利用者Uのサービス利用時の状況(コンテキスト)に応じて、同一セッションでのサービスの利用に関するアクセスログから、サービス利用遷移シーケンスデータを作成してもよい。例えば、サービス利用遷移シーケンスは利用者Uの置かれた状況や環境の変化(転居、車購入、進学・就職、転職、結婚、出産・育児など)によっても変化すると考えられるため、利用者Uの置かれた状況で分類したサービス利用遷移シーケンスデータを作成してもよい。
また、利用者Uのサービス利用時の状況として、利用者Uのサービス利用時の所在(在宅/外出中、商業施設内/屋外など)や移動態様(停止中/徒歩移動中/車両移動中/鉄道移動中など)によっても変化すると考えられるため、例えばサービス利用時の位置情報に基づく所在確認(自宅内/店舗内/道路上/鉄道路線上など)、移動速度判定(時速30km以上か否か等)、および/又は各種センサの出力結果等に応じて、利用者Uの置かれた状況で分類したサービス利用遷移シーケンスデータを作成してもよい。
また、サービス利用時の状況ごとに、モデルを生成してもよい。例えば、モデルと対応する状況の利用者のサービス利用遷移シーケンスデータを抽出し、抽出したサービス利用遷移シーケンスデータから、モデルを生成する。また、サービス利用時の状況ごとに生成したモデルを用いて、属性ごとの提案を行ってもよい。
〔6.効果〕
上述してきたように、本願に係る情報処理装置100は、生成部(学習部134)と、可視化部135とを備える。生成部は、各利用者Uのサービス利用の遷移を示すシーケンスデータから、サービス利用の遷移態様が有する特徴に基づいて、サービス毎のベクトルを生成する。例えば、生成部は、「サービスの遷移順序」、「同一セッションで利用されているか」等、サービス利用の遷移態様が有する特徴をモデルに学習させ、学習結果から、各サービスをベクトル化する。可視化部135は、サービス毎のベクトルを可視化する。これにより、より効果的に利用者のサービス利用に関するベクトルを分析することができる。
生成部は、シーケンスデータにおいて同一セッション内で出現するサービスについては類似するベクトルを生成する。また、生成部は、シーケンスデータにおいて近しいタイミングで利用されるサービスについては類似するベクトルを生成する。また、生成部は、シーケンスデータにおいて連続して利用されるサービスについては類似するベクトルを生成する。これにより、シーケンスデータにおいて同一セッション内でのサービス同士の近さに応じて、類似するベクトルを生成することができる。
生成部は、シーケンスデータをベクトル表現化方式の深層学習により学習し、サービス毎のベクトルを生成する。これにより、各サービスをベクトル表現化し、サービス毎のベクトルを生成することができる。
また、本願に係る情報処理装置100は、取得部132をさらに備える。取得部132は、各サービスの提供元から、各利用者Uのサービス利用を示すアクセスログを取得する。これにより、各利用者Uのアクセスログを入手し、各利用者Uのサービス利用の遷移を示すシーケンスデータを作成することができる。
また、本願に係る情報処理装置100は、作成部133をさらに備える。作成部133は、アクセスログから同一セッションでのサービス利用の遷移を示すシーケンスデータを作成する。これにより、情報処理装置100側で、アクセスログを収集して、同一セッションでのサービス利用遷移シーケンスデータを作成することができる。
可視化部135は、調査対象サービスの利用目的を定量化し、変化を可視化する。これにより、調査対象サービスの利用目的(利用のされ方)を定量的に分析することができる。
また、本願に係る情報処理装置100は、列挙部(制御部130)と、分析部136とをさらに備える。列挙部は、調査対象サービスに近い利用のされ方のサービスを列挙する。分析部136は、調査対象サービスと列挙されたサービスとから調査対象サービスの利用目的を分析する。これにより、調査対象サービスに近い利用のされ方のサービスから、調査対象サービスの利用目的を分析することができる。
分析部136は、調査対象サービスと列挙されたサービスとについてグルーピングを行う。これにより、サービスジャンル毎(利用目的が違うもの毎)に分類することができる。また、あるカテゴリに属する複数のサービスの類似性を判断できる。
分析部136は、調査対象サービスの利用目的に基づいて、調査対象サービスの今後の伸び代を分析する。これにより、調査対象サービスの利用目的に応じた市場ポテンシャル(潜在的成長性)を分析することができる
可視化部135は、調査対象サービスのベクトルと、競合サービスのベクトルとを可視化する。分析部136は、調査対象サービスと競合サービスとのベクトルの引き算をすることにより、調査対象サービスになくて、競合サービスにあるものを分析する。これにより、調査対象サービスと競合サービスとを相対比較することができる。
生成部は、多次元のベクトルを生成する。可視化部135は、多次元のベクトルを2次元に次元圧縮して可視化する。これにより、サービス毎のベクトルを視認し易くすることができる。
また、本願に係る情報処理装置100は、提供部137をさらに備える。提供部137は、可視化されたサービス毎のベクトルに関する情報を提供する。これにより、外部でのサービス毎のベクトルに関する分析を可能にする。また、外部に、分析結果を報告することができる。
生成部は、各利用者の属性に応じたサービス利用の遷移を示すシーケンスデータから、サービス利用の遷移態様が有する特徴に基づいて、サービス毎のベクトルを生成する。これにより、利用者Uの属性に応じて分類したサービス利用遷移シーケンスデータを作成することができ、利用者Uの属性(性別/年齢層/居住地域/免許証・車の有無/趣味等)によるサービスの利用目的の違いに対応することができる。
生成部は、各利用者のサービス利用時の状況に応じたサービス利用の遷移を示すシーケンスデータから、サービス利用の遷移態様が有する特徴に基づいて、サービス毎のベクトルを生成する。これにより、利用者Uの置かれた状況に応じて分類したサービス利用遷移シーケンスデータを作成することができ、利用者Uの置かれた状況(コンテキスト)によるサービスの利用目的の違いに対応することができる。
〔7.ハードウェア構成〕
また、上述した実施形態に係る端末装置10や情報処理装置100は、例えば図9に示すような構成のコンピュータ1000によって実現される。以下、情報処理装置100を例に挙げて説明する。図9は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力I/F(Interface)1060、入力I/F1070、ネットワークI/F1080がバス1090により接続された形態を有する。
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。演算装置1030は、例えばCPU(Central Processing Unit)、MPU(Micro Processing Unit)、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等により実現される。
一次記憶装置1040は、RAM(Random Access Memory)等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等により実現される。二次記憶装置1050は、内蔵ストレージであってもよいし、外付けストレージであってもよい。また、二次記憶装置1050は、USBメモリやSD(Secure Digital)メモリカード等の取り外し可能な記憶媒体であってもよい。また、二次記憶装置1050は、クラウドストレージ(オンラインストレージ)やNAS(Network Attached Storage)、ファイルサーバ等であってもよい。
出力I/F1060は、ディスプレイ、プロジェクタ、およびプリンタ等といった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインターフェイスであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力I/F1070は、マウス、キーボード、キーパッド、ボタン、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインターフェイスであり、例えば、USB等により実現される。
また、出力I/F1060および入力I/F1070はそれぞれ出力装置1010および入力装置1020と無線で接続してもよい。すなわち、出力装置1010および入力装置1020は、ワイヤレス機器であってもよい。
また、出力装置1010および入力装置1020は、タッチパネルのように一体化していてもよい。この場合、出力I/F1060および入力I/F1070も、入出力I/Fとして一体化していてもよい。
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、又は半導体メモリ等から情報を読み出す装置であってもよい。
ネットワークI/F1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
演算装置1030は、出力I/F1060や入力I/F1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
例えば、コンピュータ1000が情報処理装置100として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、コンピュータ1000の演算装置1030は、ネットワークI/F1080を介して他の機器から取得したプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行してもよい。また、コンピュータ1000の演算装置1030は、ネットワークI/F1080を介して他の機器と連携し、プログラムの機能やデータ等を他の機器の他のプログラムから呼び出して利用してもよい。
〔8.その他〕
以上、本願の実施形態を説明したが、これら実施形態の内容により本発明が限定されるものではない。また、前述した構成要素には、当業者が容易に想定できるもの、実質的に同一のもの、いわゆる均等の範囲のものが含まれる。さらに、前述した構成要素は適宜組み合わせることが可能である。さらに、前述した実施形態の要旨を逸脱しない範囲で構成要素の種々の省略、置換又は変更を行うことができる。
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。
例えば、上述した情報処理装置100は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットホーム等をAPI(Application Programming Interface)やネットワークコンピューティング等で呼び出して実現するなど、構成は柔軟に変更できる。
また、上述してきた実施形態および変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。
1 情報処理システム
10 端末装置
100 情報処理装置
110 通信部
120 記憶部
121 利用者データベース
122 シーケンスデータベース
123 サービス利用目的データベース
130 制御部
131 受付部
132 取得部
133 作成部
134 学習部
135 可視化部
136 分析部
137 提供部
200 情報提供装置

Claims (18)

  1. 各利用者のサービス利用の遷移について、利用されるサービスの遷移順序に沿って並べたシーケンスデータから、利用されるサービス遷移順序が有する特徴に基づいて、前記シーケンスデータをベクトル表現化方式の深層学習により学習し、サービス毎のベクトルを生成する生成部と、
    サービス毎のベクトルを可視化する可視化部と
    を備え
    前記サービスは、ウェブコンテンツ、アプリケーション、プログラムの機能、データ及び分析したいユーザの行動を任意の粒度でサービスとみなしたもののうち少なくとも1つを含む
    ことを特徴とする情報処理装置。
  2. 前記生成部は、前記シーケンスデータにおいて同一セッション内で出現するサービスについては類似するベクトルを生成する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記生成部は、前記シーケンスデータにおいて近しいタイミングで利用されるサービスについては類似するベクトルを生成する
    ことを特徴とする請求項1又は2に記載の情報処理装置。
  4. 前記生成部は、前記シーケンスデータにおいて連続して利用されるサービスについては類似するベクトルを生成する
    ことを特徴とする請求項1~3のうちいずれか1つに記載の情報処理装置。
  5. 前記シーケンスデータは、同一セッションでのサービスの利用に関するサービス利用遷移シーケンスデータであり、
    同一セッションでのサービスの単位は、ウェブコンテンツごと、アプリごと、ドメインごと、又はサブドメインごとである
    ことを特徴とする請求項1~4のうちいずれか1つに記載の情報処理装置。
  6. 各サービスの提供元から、各利用者のサービス利用を示すアクセスログを取得する取得部と
    をさらに備えることを特徴とする請求項1~5のうちいずれか1つに記載の情報処理装置。
  7. 前記アクセスログから同一セッションでのサービス利用の遷移を示すシーケンスデータを作成する作成部と
    をさらに備えることを特徴とする請求項6に記載の情報処理装置。
  8. 前記可視化部は、調査対象サービスの利用目的を定量化し、変化を可視化する
    ことを特徴とする請求項1~7のうちいずれか1つに記載の情報処理装置。
  9. 調査対象サービスに近い利用のされ方のサービスを列挙する列挙部と、
    前記調査対象サービスと前記列挙されたサービスとから前記調査対象サービスの利用目的を分析する分析部と
    をさらに備えることを特徴とする請求項1~8のうちいずれか1つに記載の情報処理装置。
  10. 前記分析部は、前記調査対象サービスと前記列挙されたサービスとについてグルーピングを行う
    ことを特徴とする請求項9に記載の情報処理装置。
  11. 前記分析部は、前記調査対象サービスの利用目的に基づいて、前記調査対象サービスの今後の伸び代を分析する
    ことを特徴とする請求項9又は10に記載の情報処理装置。
  12. 前記可視化部は、前記調査対象サービスのベクトルと、競合サービスのベクトルとを可視化し、
    前記分析部は、前記調査対象サービスと前記競合サービスとのベクトルの引き算をすることにより、前記調査対象サービスになくて、前記競合サービスにあるものを分析する
    ことを特徴とする請求項9~11のうちいずれか1つに記載の情報処理装置。
  13. 前記生成部は、多次元のベクトルを生成し、
    前記可視化部は、前記多次元のベクトルを2次元に次元圧縮して可視化する
    ことを特徴とする請求項1~12のうちいずれか1つに記載の情報処理装置。
  14. 可視化されたサービス毎のベクトルに関する情報を提供する提供部と
    をさらに備えることを特徴とする請求項1~13のうちいずれか1つに記載の情報処理装置。
  15. 前記生成部は、各利用者の属性に応じたサービス利用の遷移について、利用されるサービスの遷移順序に沿って並べたシーケンスデータから、利用されるサービス遷移順序が有する特徴に基づいて、サービス毎のベクトルを生成する
    ことを特徴とする請求項1~14のうちいずれか1つに記載の情報処理装置。
  16. 前記生成部は、各利用者のサービス利用時の状況に応じたサービス利用の遷移について、利用されるサービスの遷移順序に沿って並べたシーケンスデータから、利用されるサービス遷移順序が有する特徴に基づいて、サービス毎のベクトルを生成する
    ことを特徴とする請求項1~15のうちいずれか1つに記載の情報処理装置。
  17. 情報処理装置が実行する情報処理方法であって、
    各利用者のサービス利用の遷移について、利用されるサービスの遷移順序に沿って並べたシーケンスデータから、利用されるサービス遷移順序が有する特徴に基づいて、前記シーケンスデータをベクトル表現化方式の深層学習により学習し、サービス毎のベクトルを生成する生成工程と、
    サービス毎のベクトルを可視化する可視化工程と
    を含み、
    前記サービスは、ウェブコンテンツ、アプリケーション、プログラムの機能、データ及び分析したいユーザの行動を任意の粒度でサービスとみなしたもののうち少なくとも1つを含む
    ことを特徴とする情報処理方法。
  18. 各利用者のサービス利用の遷移について、利用されるサービスの遷移順序に沿って並べたシーケンスデータから、利用されるサービス遷移順序が有する特徴に基づいて、前記シーケンスデータをベクトル表現化方式の深層学習により学習し、サービス毎のベクトルを生成する生成手順と、
    サービス毎のベクトルを可視化する可視化手順と
    をコンピュータに実行させ
    前記サービスは、ウェブコンテンツ、アプリケーション、プログラムの機能、データ及び分析したいユーザの行動を任意の粒度でサービスとみなしたもののうち少なくとも1つを含む
    ことを特徴とする情報処理プログラム。
JP2020019975A 2020-02-07 2020-02-07 情報処理装置、情報処理方法および情報処理プログラム Active JP7177107B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020019975A JP7177107B2 (ja) 2020-02-07 2020-02-07 情報処理装置、情報処理方法および情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020019975A JP7177107B2 (ja) 2020-02-07 2020-02-07 情報処理装置、情報処理方法および情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2021125128A JP2021125128A (ja) 2021-08-30
JP7177107B2 true JP7177107B2 (ja) 2022-11-22

Family

ID=77460113

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020019975A Active JP7177107B2 (ja) 2020-02-07 2020-02-07 情報処理装置、情報処理方法および情報処理プログラム

Country Status (1)

Country Link
JP (1) JP7177107B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023238318A1 (ja) * 2022-06-09 2023-12-14 日本電信電話株式会社 学習装置、代替系列データ抽出装置、学習方法、代替系列データ抽出方法、及びコンピュータプログラム
JP7499397B1 (ja) 2023-11-16 2024-06-13 株式会社ビデオリサーチ 行動予測モデル作成方法および当該行動予測モデル作成方法を用いた集団行動予測方法
JP7509506B1 (ja) 2023-11-16 2024-07-02 株式会社ビデオリサーチ 行動モデル作成方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004030088A (ja) 2002-06-25 2004-01-29 Mitsubishi Electric Corp 工期管理システム及びそれに用いる記録媒体
JP2004126975A (ja) 2002-10-03 2004-04-22 Nippon Telegr & Teleph Corp <Ntt> 選好傾向類似ユーザ抽出方法及び装置、並びに選好傾向類似ユーザ抽出プログラム及びそれを記録した記録媒体
JP2007034945A (ja) 2005-07-29 2007-02-08 Ntt Data Corp サービス関係分析装置、サービス関係分析方法、およびサービス関係分析プログラム
JP2009128937A (ja) 2007-11-19 2009-06-11 Nippon Telegr & Teleph Corp <Ntt> Web閲覧行動特徴抽出装置及びプログラム
JP2016062411A (ja) 2014-09-19 2016-04-25 ヤフー株式会社 情報分析装置、情報分析方法および情報分析プログラム
JP2019109788A (ja) 2017-12-19 2019-07-04 ヤフー株式会社 提供装置、提供方法および提供プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004030088A (ja) 2002-06-25 2004-01-29 Mitsubishi Electric Corp 工期管理システム及びそれに用いる記録媒体
JP2004126975A (ja) 2002-10-03 2004-04-22 Nippon Telegr & Teleph Corp <Ntt> 選好傾向類似ユーザ抽出方法及び装置、並びに選好傾向類似ユーザ抽出プログラム及びそれを記録した記録媒体
JP2007034945A (ja) 2005-07-29 2007-02-08 Ntt Data Corp サービス関係分析装置、サービス関係分析方法、およびサービス関係分析プログラム
JP2009128937A (ja) 2007-11-19 2009-06-11 Nippon Telegr & Teleph Corp <Ntt> Web閲覧行動特徴抽出装置及びプログラム
JP2016062411A (ja) 2014-09-19 2016-04-25 ヤフー株式会社 情報分析装置、情報分析方法および情報分析プログラム
JP2019109788A (ja) 2017-12-19 2019-07-04 ヤフー株式会社 提供装置、提供方法および提供プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
保坂 大樹,意味空間上の分布表現に基づくWebサイトと閲覧ユーザの統合分析モデル,情報処理学会 論文誌(ジャーナル)[online],日本,情報処理学会,2019年08月15日,第60巻 第8号,pp.1338-1349

Also Published As

Publication number Publication date
JP2021125128A (ja) 2021-08-30

Similar Documents

Publication Publication Date Title
JP7177107B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
TWI570583B (zh) 於搜尋結果頁內提供已標定應用程式之系統與方法
JP2019125145A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
US20180239790A1 (en) Provision device, provision method and non-transitory computer readable storage medium
Mata-Rivera et al. A collaborative learning approach for geographic information retrieval based on social networks
US11556547B2 (en) Determination apparatus, determination method, and non-transitory computer readable storage medium
JP2019125317A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP7174782B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
US20210397623A1 (en) Learning apparatus, learning method, and non-transitory computer readable storage medium
JP6043840B1 (ja) 分類装置、分類方法、及び分類プログラム
JP2022178650A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
Liu et al. Social-Transportation Analytic Toolbox (STAT) for Transit Networks
JP7145901B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP7145247B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP7144468B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP7321977B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP6948425B2 (ja) 判定装置、判定方法及び判定プログラム
JP7427634B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP2019125146A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP7459026B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP2023043762A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP6342027B1 (ja) 提供装置、提供方法および提供プログラム
JP2023043779A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP2024012834A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP2022126427A (ja) 情報処理装置、情報処理方法、情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210916

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220801

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220809

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220916

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221101

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221110

R150 Certificate of patent or registration of utility model

Ref document number: 7177107

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350