JP2021039735A - 情報処理装置、及びプログラム - Google Patents

情報処理装置、及びプログラム Download PDF

Info

Publication number
JP2021039735A
JP2021039735A JP2020120716A JP2020120716A JP2021039735A JP 2021039735 A JP2021039735 A JP 2021039735A JP 2020120716 A JP2020120716 A JP 2020120716A JP 2020120716 A JP2020120716 A JP 2020120716A JP 2021039735 A JP2021039735 A JP 2021039735A
Authority
JP
Japan
Prior art keywords
target
user
recommendation
information processing
recommended
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020120716A
Other languages
English (en)
Inventor
政寛 佐藤
Masahiro Sato
政寛 佐藤
シン ジャンマジェイ
Shin Jammajei
シン ジャンマジェイ
翔 竹森
Sho Takemori
翔 竹森
園田 隆志
Takashi Sonoda
隆志 園田
セイ 張
Xing Zhang
セイ 張
大熊 智子
Tomoko Okuma
智子 大熊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of JP2021039735A publication Critical patent/JP2021039735A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0225Avoiding frauds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】推薦することにより利用者に選択される可能性が向上すると推定される対象の情報を得る。【解決手段】情報処理装置1において、制御部11のプロセッサ111は、記憶部12から履歴DB121を読み出し、利用者が選択するか否かについて判断した対象を、選択の有無と推薦の有無との組合せにより分類して、この分類の結果をメモリ112の特徴情報1121に記憶する。プロセッサ111は、特徴情報1121に基づき、対象に対する推薦の効果を推定する機械学習を行って、その結果を記憶部12に学習データ122として記憶する。プロセッサ111は、学習データ122を用いて、複数の対象の中から、推薦することにより利用者に選択される可能性が決められた水準以上で向上すると推定される対象を、利用者ごとに抽出して出力する。【選択図】図2

Description

本発明は、情報処理装置、及びプログラムに関する。
複数の対象の中から、1以上の対象を抽出して利用者に推薦する情報処理装置がある。例えば、インターネット上の仮想店舗や動画配信サイト等は、利用者に購入や視聴等を促すため商品やコンテンツ等を推薦する場合がある。また、小売店等の実在の店舗で用いられるPOSシステム(Point of sale system)等は、利用者の消費動向に基づいて、取り扱い商品の中から折込チラシ等で広告する商品を抽出する場合がある。
特許文献1には、或る商品が、推薦された場合に購入された商品と購入されなかった商品のどちらに近いかによって、その商品を推薦するか否かを決定する手法が記載されている。
特許文献2には、推薦ありの購入数と推薦なしの購入数の差が大きい商品を推薦する手法が記載されている。
特許5277307号 特開2017−211699号公報
ところで、推薦の効果は商品によって異なることが知られている。例えば、商品によっては、推薦することによって却って利用者の購入意欲が削がれることがある。また、推薦をしてもしなくても利用者が必ず購入する商品もある。
本発明の目的の一つは、取り扱い商品等の対象のうち、推薦することにより利用者に選択される可能性が向上すると推定される対象の情報を得ることである。
本発明の請求項1に係る情報処理装置は、利用者が選択するか否かを判断した対象ごとに、該利用者が該対象を選択したか否か示す選択履歴と、該利用者に該対象を推薦したか否かを示す推薦履歴と、を記憶したメモリと、前記メモリから情報を読み出すプロセッサと、を有し、前記プロセッサは、前記選択履歴及び前記推薦履歴から、対象に対する推薦の効果を推定する機械学習を行い、前記機械学習の結果に基づいて、推薦することにより利用者に選択される可能性が決められた水準以上で向上すると推定される対象の情報を出力する情報処理装置である。
本発明の請求項2に係る情報処理装置は、請求項1に記載の態様において、前記機械学習は、対象を、利用者に推薦して選択された第1対象群と、利用者に推薦せずに選択された第2対象群と、を含む複数の対象群に分類し、前記第1対象群を正例として、前記第2対象群を負例として、それぞれ評価する情報処理装置である。
本発明の請求項3に係る情報処理装置は、請求項2に記載の態様において、前記機械学習は、対象を、利用者に推薦して選択されなかった第3対象群を含む、前記複数の対象群に分類し、前記第3対象群を負例として評価する情報処理装置である。
本発明の請求項4に係る情報処理装置は、請求項2又は3に記載の態様において、前記機械学習は、対象を、利用者に推薦せずに選択されなかった第4対象群を含む、前記複数の対象群に分類し、前記第4対象群を前記第1対象群よりも重みが小さい正例として評価する情報処理装置である。
本発明の請求項5に係る情報処理装置は、請求項2から4のいずれか1項に記載の態様において、前記機械学習は、前記複数の対象群のうち利用者に推薦した対象群を、該推薦の種類に応じて異なる重みで評価する情報処理装置である。
本発明の請求項6に係る情報処理装置は、請求項2から5のいずれか1項に記載の態様において、前記機械学習は、前記複数の対象群のうち利用者に選択された対象群を、該選択の種類に応じて異なる重みで評価する情報処理装置である。
本発明の請求項7に係る情報処理装置は、請求項2から6のいずれか1項に記載の態様において、前記機械学習は、前記第1対象群を、推薦してから選択されるまでの時間に応じて異なる重みで評価する情報処理装置である。
本発明の請求項8に係る情報処理装置は、請求項1に記載の態様において、前記機械学習は、対象を、複数の対象群に分類し、或る期間に利用者に推薦して選択され、かつ、前記或る期間と異なる期間に前記利用者に推薦せずに選択されなかった対象群を正例として評価する情報処理装置である。
本発明の請求項9に係る情報処理装置は、請求項7に記載の態様において、前記機械学習は、或る期間に利用者に推薦して選択されず、かつ、前記或る期間と異なる期間に前記利用者に推薦せずに選択された対象群を負例として評価する情報処理装置である。
本発明の請求項10に係る情報処理装置は、請求項2から7のいずれか1項に記載の態様において、前記機械学習は、前記第1対象群を、該第1対象群が推薦される第1確率が大きいほど小さくなる第1重みで評価し、前記第2対象群を、該第2対象群が推薦されない第2確率が大きいほど小さくなる第2重みで評価する情報処理装置である。
本発明の請求項11に係る情報処理装置は、請求項10に記載の態様において、前記第1重みは、前記第1確率の逆数に比例し、前記第2重みは、前記第2確率の逆数に比例する情報処理装置である。
本発明の請求項12に係る情報処理装置は、請求項10又は11に記載の態様において、前記第1重み又は前記第2重みは、予め定めた上限を超えないように決定される情報処理装置である。
本発明の請求項13に係るプログラムは、利用者が選択するか否かを判断した対象ごとに、該利用者が該対象を選択したか否か示す選択履歴と、該利用者に該対象を推薦したか否かを示す推薦履歴と、を記憶したメモリから情報を読み出すプロセッサに、前記選択履歴及び前記推薦履歴から、対象に対する推薦の効果を推定する機械学習を行うステップと、前記機械学習の結果に基づいて、推薦することにより利用者に選択される可能性が決められた水準以上で向上すると推定される対象の情報を出力するステップと、を実行させるためのプログラムである。
請求項1、13に係る発明によれば、推薦することにより利用者に選択される可能性が向上すると推定される対象の情報を得ることができる。
請求項2に係る発明によれば、利用者に推薦して選択された対象を、その利用者に推薦すると選択される可能性が向上するものと評価し、利用者に推薦せずに選択された対象を、その可能性が向上しないものと評価する。
請求項3に係る発明によれば、利用者に推薦して選択されなかった対象を、その利用者に推薦すると選択される可能性が向上しないものと評価する。
請求項4に係る発明によれば、利用者に推薦せずに選択されなかった対象を、推薦して選択された対象に比べて小さいが、その利用者に推薦すると選択される可能性が向上するものと評価する。
請求項5に係る発明によれば、推薦の種類の違いが推薦した対象の評価に反映される。
請求項6に係る発明によれば、選択の種類の違いが選択された対象の評価に反映される。
請求項7に係る発明によれば、推薦してから選択されるまでの時間が、利用者に推薦して選択された対象に対する評価に反映される。
請求項8に係る発明によれば、利用者に推薦した期間に選択され、その利用者に推薦しなかった期間に選択されなかった対象を、その利用者に推薦すると選択される可能性が向上するものと評価する。
請求項9に係る発明によれば、利用者に推薦した期間に選択されず、その利用者に推薦しなかった期間に選択された対象を、その利用者に推薦すると選択される可能性が低下するものと評価する。
請求項10に係る発明によれば、利用者に推薦して選択された対象を、その利用者にその対象が推薦される確率が大きいほど、選択される可能性が向上しなくなると評価し、利用者に推薦せずに選択された対象を、その利用者にその対象が推薦されない確率が大きいほど、その可能性が向上しなくなると評価する。
請求項11に係る発明によれば、利用者に推薦して選択された対象を、その利用者にその対象が推薦される確率の逆数に比例して、選択される可能性が向上するものと評価し、利用者に推薦せずに選択された対象を、その利用者にその対象が推薦されない確率の逆数に比例して、その可能性が向上するものと評価する。
請求項12に係る発明によれば、利用者に対象が推薦される確率を用いた重みは、予め定められた上限を超えない。
情報処理システム9の全体構成の一例を示す図。 情報処理装置1の構成の一例を示す図。 履歴DB121の例を示す図。 対象の分類先である対象群を説明するための図。 特徴情報1121の例を示す図。 情報処理装置1が対象を分類する動作の流れの一例を示すフロー図。 情報処理装置1が、学習の動作の流れの一例を示すフロー図。 情報処理装置1が、推定の動作の流れの一例を示すフロー図。 履歴DB121aの例を示す図。 異なる期間における履歴表1212aの例を示す図。 特徴情報1121aの例を示す図。 利用者が異なる期間に判断した対象を分類した結果を示す図。 分類された対象群の組合せ、及びその評価を説明するための図。
<実施形態>
<情報処理システムの構成>
図1は、情報処理システム9の全体構成の一例を示す図である。情報処理システム9は、情報処理装置1と、端末2と、これらを通信可能に接続する通信回線3と、を有する。
通信回線3は、例えばLAN(Local Area Network)のほか、WAN(Wide Area Network)であってもよいし、インターネットであってもよいし、これらの組合せであってもよい。
端末2は、パーソナルコンピューター、スマートフォン、スレートPC、タブレットPC等と呼ばれる情報処理端末である。端末2は、例えば、通信回線3に接続されたサーバ装置(図示せず)と情報をやり取りする。このサーバ装置は、インターネット上の仮想店舗を運営する情報処理装置であり、端末2の利用者の操作に応じて商品の画像や価格等のデータをその端末2に送信し、その利用者から商品を購入する指示を受付ける。
さらに、サーバ装置は、取り扱う商品の中から、1以上の商品を抽出して、その商品の画像等を端末2に送信することで、端末2の利用者のその商品を広告する。
この場合、上述した商品は、利用者が選択するか否かを判断する対象の一例である。また、利用者に商品を広告することは、対象としての商品を利用者に推薦することの一例である。そして、利用者が商品を購入することは、対象としての商品を利用者が選択することの一例である。
なお、上述した商品は、商品名や型番で示される個別の商品であってもよいし、例えば、牛乳、生鮮食品、文房具、等といった商品のカテゴリであってもよい。
情報処理装置1は、サーバ装置による商品の提示や広告、端末2による商品の閲覧や購入を監視しており、それらの履歴を記憶する。利用者は、サーバ装置から送信される商品の画像や価格等のデータを閲覧する。この商品のデータには、利用者が端末2を自ら操作してサーバ装置に対し商品の検索を要求し、その要求にサーバ装置が応答して送信したものが含まれる。また、この商品のデータには、利用者の意図と無関係にサーバ装置が推薦して送信したものが含まれる。
情報処理装置1は、利用者が商品のデータを閲覧した後、決められた時間が経過するまでに、購入の操作をした場合、この商品が選択された、と判定する。また、この時間が経過するまでに利用者が購入の操作をしなかった場合、情報処理装置1は、この商品が選択されなかった(非選択ともいう)、と判定する。
なお、端末2による商品の閲覧や購入は、情報処理装置1以外の装置によって監視されてもよい。情報処理装置1は、上述した監視の結果を取得可能であればよい。
なお、情報処理システム9が有する情報処理装置1、端末2、及び通信回線3のそれぞれの数は図1に示すものに限られず1つであってもよいし複数であってもよい。
<情報処理装置の構成>
図2は、情報処理装置1の構成の一例を示す図である。図2に示す情報処理装置1は、制御部11、記憶部12、通信部13、操作部14、及び表示部15を有する。これらの構成は、例えばバスで、互いに通信可能に接続されている。
制御部11は、プロセッサ111、及びメモリ112を有する。また、制御部11は、ROM(Read Only Memory)を有してもよい。プロセッサ111は、ROMや記憶部12に記憶されているコンピュータプログラム(以下、単にプログラムという)をメモリ112に読み出して実行することにより情報処理装置1の各部を制御する。プロセッサ111は、例えばCPU(Central Processing Unit)である。また、メモリ112は、例えばRAM(Random Access Memory)である。
通信部13は、有線又は無線により通信回線3に接続する通信回路である。情報処理装置1は、通信部13により、通信回線3に接続された端末2やサーバ装置、その他の外部装置(図示せず)と情報をやり取りする。
操作部14は、各種の指示をするための操作ボタン、キーボード、タッチパネル、マウス等の操作子を備えており、操作を受付けてその操作内容に応じた信号を制御部11に送る。この操作は、例えば、キーボードに対する押下やタッチパネルに対するジェスチャー等である。
表示部15は、液晶ディスプレイ等の表示画面を有しており、制御部11の制御の下、画像を表示する。表示画面の上には、操作部14の透明のタッチパネルが重ねて配置されてもよい。なお、情報処理装置1は、操作部14及び表示部15を有しなくてもよい。
記憶部12は、ソリッドステートドライブ、ハードディスクドライブ等の記憶手段であり、制御部11のプロセッサ111に読み込まれるオペレーティングシステム、各種のプログラム、データ等を記憶する。
また、記憶部12は、履歴DB121、及び学習データ122を記憶する。履歴DB121は、端末2の利用者が選択するか否かを判断した対象ごとに、選択履歴と、推薦履歴と、を記憶したデータベースである。選択履歴とは、利用者が対象を選択したか否かを示す履歴である。また、推薦履歴とは、利用者に対象を推薦したか否かを示す履歴である。
図3は、履歴DB121の例を示す図である。図3に示す履歴DB121は、利用者リスト1211、及び履歴表1212を有する。利用者リスト1211は、利用者を識別する識別情報である利用者IDを記憶したリストである。履歴表1212は、利用者リスト1211に記憶された利用者IDごとに、その利用者IDで識別される利用者が閲覧等して選択するか否かを判断した対象の推薦履歴及び選択履歴を記憶した表である。
例えば、図3に示す履歴表1212は、利用者IDが「U01」の利用者が閲覧した対象について記憶した表である。この履歴表1212において、「対象ID」とは、商品等の対象を識別する識別情報である。
また、この履歴表1212において「推薦あり」とは、対応する対象IDで識別される対象がサーバ装置等により利用者ID「U01」の利用者に推薦されたか否かを示す情報である。この「推薦あり」が「Y」である場合、これに対応する対象IDで識別される対象は、サーバ装置により推薦されており、「N」である場合、推薦されていない。
そして、この履歴表1212において「選択あり」とは、対応する対象IDで識別される対象が利用者ID「U01」の利用者により選択されたか否かを示す情報である。この「選択あり」が「Y」である場合、これに対応する対象IDで識別される対象は、利用者ID「U01」の利用者により選択されており、「N」である場合、選択されていない。
プロセッサ111は、履歴DB121を記憶部12から読み出してその一部又は全部をメモリ112に複製する。また、プロセッサ111は、メモリ112に複製された履歴DB121に含まれる選択履歴及び推薦履歴を読み出して、これらに基づき特徴情報1121を生成する。特徴情報1121は、利用者が対象を選択することにより現れるその利用者の特徴を示す情報である。
したがって、記憶部12、及びメモリ112は、いずれも利用者が選択するか否かを判断した対象ごとに、その利用者がその対象を選択したか否か示す選択履歴と、その利用者にその対象を推薦したか否かを示す推薦履歴と、を記憶したメモリの一例である。そして、プロセッサ111は、上述したメモリから情報を読み出すプロセッサの一例である。
プロセッサ111がメモリ112において生成する特徴情報1121は、履歴DB121から読み出した利用者の選択履歴及び推薦履歴に基づいて生成される。プロセッサ111は、利用者の選択履歴及び推薦履歴に基づき、その利用者が判断した対象を、選択の有無と推薦の有無との組合せにより分類する。
図4は、対象の分類先である対象群を説明するための図である。利用者が閲覧等により認知し、選択・非選択を判断した対象は、上述したとおり、選択の有無と推薦の有無との組合せにより、第1対象群、第2対象群、第3対象群、及び第4対象群の4つの対象群に分類される。
第1対象群は、推薦あり・選択あり、の対象群である。利用者に推薦され、その利用者に選択された対象は、この第1対象群に分類される。
第2対象群は、推薦なし・選択あり、の対象群である。利用者に推薦されず、その利用者に選択された対象は、この第2対象群に分類される。
第3対象群は、推薦あり・選択なし、の対象群である。利用者に推薦され、その利用者に選択されなかった対象は、この第3対象群に分類される。
第4対象群は、推薦なし・選択なし、の対象群である。利用者に推薦されず、その利用者に選択されなかった対象は、この第4対象群に分類される。
ここで、利用者に推薦しないと選択されないが、推薦すると選択される、という対象(対象αという)は、推薦により利用者の選択が促されている対象である。つまり、対象αは「推薦することにより利用者に選択される可能性が向上すると推定される対象」である。
第1対象群(推薦あり・選択あり)は、推薦しないときの選択の有無が不明であるが、少なくとも対象αを含む可能性がある。したがって、プロセッサ111は、第1対象群に分類される対象を正例として評価する。
また、第4対象群(推薦なし・選択なし)は、推薦したときの選択の有無が不明であるが、少なくとも対象αを含む可能性がある。したがって、プロセッサ111は、第4対象群に分類される対象を正例として評価する。ただし、例えば、数ある対象のうち推薦されたものは推薦されないものに比べて一般的に少ない。つまり、第1対象群の総数は、第4対象群の総数に比べると少ないと考えられる。そこで、第4対象群に分類される対象を正例として評価する際に、これに適用する重み係数は、第1対象群に分類される対象よりも小さくするとよい。
一方、利用者に推薦しないときに選択されるのに、推薦すると却って選択されなくなる、という対象(対象βという)は、推薦により利用者の選択が妨げられている対象である。つまり、対象βは「推薦することにより利用者に選択される可能性が低下すると推定される対象」である。
第2対象群(推薦なし・選択あり)は、推薦したときの選択の有無が不明であるが、少なくとも対象βを含む可能性がある。したがって、プロセッサ111は、第2対象群に分類される対象を負例として評価する。
また、第3対象群(推薦あり・選択なし)は、推薦しないときの選択の有無が不明であるが、少なくとも対象βを含む可能性がある。したがって、プロセッサ111は、第3対象群に分類される対象を負例として評価する。
図5は、特徴情報1121の例を示す図である。プロセッサ111は、メモリ112に複製した履歴DB121を読み出し、利用者ごとにその利用者が閲覧等した対象を上述した4つの対象群のいずれかに分類して、図5に示す特徴情報1121を生成する。
例えば、この特徴情報1121において、利用者ID「U01」には、第1対象群として対象ID「J2」、第2対象群として対象ID「J4」、第3対象群として対象ID「J5」、「J7」、第4対象群として対象ID「J1」、「J3」、「J6」がそれぞれ対応付けられている。
プロセッサ111は、いわゆる協調フィルタリングの手法を用いて、特徴情報1121を解析し、対象の分類され方の特徴が互いに類似している利用者を共通のグループに振り分ける。例えば、利用者ID「U01」及び利用者ID「U03」でそれぞれ識別される利用者は、いずれも対応する第2対象群に対象ID「J4」が分類され、かつ、第4対象群に対象ID「J1」、「J3」、「J6」が分類されている点で共通している。したがって、これらの利用者IDで識別される利用者は、プロセッサ111により類似している、と認定される。
また、プロセッサ111は、特徴情報1121を解析する際に、4つの対象群を区別するのではなく、その対象群が正例、負例のいずれとして評価されるかによって区別してもよい。例えば、プロセッサ111は、負例として評価される第2対象群及び第3対象群に共通の対象が分類される2以上の利用者を、互いに類似するとして、共通のグループに振り分けてもよい。この場合、プロセッサ111は、それら共通の対象が第2対象群と第3対象群のどちらに分類されているかを問わない。
記憶部12に記憶される学習データ122は、例えば対象の特徴量、及び利用者の特徴量を含むデータである。特徴量とは、複数の要素を有するベクトルや行列で表される。プロセッサ111は、例えば、対象、及び利用者の特徴量を乱数等により初期化し、特徴情報1121に基づいて、これらの特徴量を更新して、更新による差が閾値未満になったときに、これらの特徴量を、学習データ122として記憶部12に記憶する。プロセッサ111が、学習データ122を更新する処理は、対象に対する推薦の効果を推定する機械学習である。つまり、このプロセッサ111は、選択履歴及び前記推薦履歴から、対象に対する推薦の効果を推定する機械学習を行うプロセッサの一例である。
そして、プロセッサ111は、記憶部12に記憶された学習データ122を読み出し、機械学習の結果に基づいて、利用者に推薦すべき対象を推定して、その対象の情報を出力する。この「利用者に推薦すべき対象」とは、推薦することにより利用者に選択される可能性が決められた水準以上で向上すると推定される対象である。この水準とは、上位の3つまで、といった順位に基づく相対的なものであってもよいし、可能性の指標となる数値が閾値以上、といった絶対的なものであってもよい。したがって、このプロセッサ111は、機械学習の結果に基づいて、推薦することにより利用者に選択される可能性が決められた水準以上で向上すると推定される対象の情報を出力するプロセッサの一例である。
<画像処理装置の動作>
<分類>
図6は、情報処理装置1が対象を分類する動作の流れの一例を示すフロー図である。情報処理装置1において、制御部11のプロセッサ111は、例えば、記憶部12から履歴DB121の利用者リスト1211を読み出し、これに記載された利用者IDを選択する(ステップS101)。
次に、プロセッサ111は、ステップS101で選択したその利用者IDで識別される利用者の履歴表1212を、記憶部12に記憶された履歴DB121から取得し(ステップS102)、この履歴表1212に記載された対象IDにより識別される対象を、上述した4つの対象群に分類する(ステップS103)。この分類の結果は、メモリ112の特徴情報1121に記憶される。
そして、プロセッサ111は、利用者リスト1211に未選択の利用者がいるか否かを判断し(ステップS104)、未選択の利用者がいると判断する場合(ステップS104;YES)、処理をステップS101に戻す。一方、未選択の利用者がいないと判断する場合(ステップS104;NO)、プロセッサ111は、処理を終了する。これらのステップにより、メモリ112には、特徴情報1121が生成される。
<学習>
図7は、情報処理装置1が、学習の動作の流れの一例を示すフロー図である。情報処理装置1において、制御部11のプロセッサ111は、対象に対する推薦の効果を推定する機械学習を行う。プロセッサ111は、複数の利用者の中から一人の利用者をランダムに選択し(ステップS201)、4つの対象群の中から1つの対象群をランダムに選択する(ステップS202)。
そして、プロセッサ111は、選択した対象群に応じて、その対象群から選択する1つの対象を正例・負例のいずれとして評価するかを決める(ステップS203)。
例えば、選択した対象群が第1対象群であった場合、プロセッサ111は、予め決められている通り、第1対象群からランダムに選択される1つの対象を正例として評価することを決定する。
また、選択した対象群が第2対象群であった場合、プロセッサ111は、予め決められている通り、第2対象群からランダムに選択される1つの対象を負例として評価することを決定する。
すなわち、このプロセッサ111は、対象に対する推薦の効果を推定する機械学習として、対象を、利用者に推薦して選択された第1対象群と、利用者に推薦せずに選択された第2対象群と、を含む複数の対象群に分類し、第1対象群を正例として、第2対象群を負例として、それぞれ評価する機械学習を行うプロセッサの一例である。この動作をすることにより、このプロセッサ111は、推薦せずとも利用者に選択される、いわゆる「必需品」等の可能性がある対象を推薦枠から除外する。
また、例えば、選択した対象群が第3対象群であった場合、プロセッサ111は、予め決められている通り、第3対象群からランダムに選択される1つの対象を負例として評価することを決定する。
すなわち、このプロセッサ111は、対象に対する推薦の効果を推定する機械学習として、対象を、利用者に推薦して選択されなかった第3対象群を含む、複数の対象群に分類し、第3対象群を負例として評価する機械学習を行うプロセッサの一例である。この動作をすることにより、このプロセッサ111は、推薦することで却って利用者に選択されなくなる可能性がある対象を推薦枠から除外する。
また、例えば、選択した対象群が第4対象群であった場合、プロセッサ111は、予め決められている通り、第4対象群からランダムに選択される1つの対象を、第1対象群に含まれる対象よりも重みが小さい正例として評価することを決定する。
すなわち、このプロセッサ111は、対象に対する推薦の効果を推定する機械学習として、対象を、利用者に推薦せずに選択されなかった第4対象群を含む、複数の対象群に分類し、第4対象群を第1対象群よりも重みが小さい正例として評価する機械学習を行うプロセッサの一例である。
プロセッサ111は、対象と利用者とをそれぞれ評価するための特徴量をメモリ112に記憶する。対象の特徴量q、及び利用者の特徴量pは、いずれも、例えばn個の要素を有するベクトルで表される。そして、この対象及び利用者の組合せに対する評価値vuiは、これらの内積で算出される。つまり、評価値vuiは、対象の特徴量q、及び利用者の特徴量pによって次の式(1)で表される。
プロセッサ111は、ステップS201でランダムに選択した利用者と、ステップS204でランダムに選択した対象との組合せに対する評価値vuiを算出する。そして、プロセッサ111は、ステップS203でこの対象を正例として評価すると決めた場合には、この評価値vuiが大きくなるように、負例として評価すると決めた場合には、小さくなるように、特徴量q、及び特徴量pをそれぞれ更新する。この学習は、例えば、ポイントワイズ手法によるランキング学習等と呼ばれる。
プロセッサ111は、ステップS202で選択した対象群の中から、1つの対象をランダムに選択し(ステップS204)、選択したその対象の重み係数を算出する(ステップS205)。そして、プロセッサ111は、決定した正例・負例の別、及び算出した重み係数を使って、ステップS201でランダムに選択した利用者と、ステップS204で選択した1つの対象と、の組合せに対応する評価値を更新する(ステップS206)。特徴量q、及び特徴量pは、例えば、以下の式(2)に従って更新される。
ここで、式(2)におけるηは学習レートであり、wuiはuで示す利用者(すなわち、ステップS201で選択した利用者)と、iで示す対象(すなわち、ステップS204で選択した対象)との組合せに対する重みである。
そして、プロセッサ111は、ステップS206において評価値を更新すると、この学習が収束の条件を満たしたか否かを判定する(ステップS207)。プロセッサ111は、例えば、全ての利用者及び対象の組合せについて一巡して更新した前後で評価値の差の絶対値を合計し、この合計値が閾値未満であった場合に、この学習が収束の条件を満たしたと判定する。
なお、収束の条件は、例えば、以下の(条件1)と(条件2)が挙げられる。
(条件1)情報処理装置1は、予め履歴データを学習用データと評価用データに分割している。そして、プロセッサ111は、学習用データで学習したモデルで、評価用データを用いて評価を行う。つまり、プロセッサ111は、学習のステップごとではなく、一定回数置きに、例えば1000回更新するごとに評価を行う。そして、プロセッサ111は評価値の向上が一定以下になった場合、または、評価値が低下を始めた場合、学習が収束したと判定する。
(条件2)プロセッサ111は、学習のステップごとにパラメータの変化をモニタリングし、その変化量が一定以下になったら学習が収束した、と判定する。例えば、学習が1000回のステップを経るごとにプロセッサ111は、pの変化量の差分をモニタリングし、その差分の絶対値が一定以下になったときに、学習が収束したと判定する。
学習が収束の条件を満たしていないと判定する場合(ステップS207;NO)、プロセッサ111は、処理をステップS201に戻す。一方、学習が収束の条件を満たしたと判定する場合(ステップS207;YES)、プロセッサ111は、メモリ112で更新した評価値の行列を、学習データ122として記憶部12に記憶し(ステップS208)、処理を終了する。
<推定>
図8は、情報処理装置1が、推定の動作の流れの一例を示すフロー図である。情報処理装置1において、制御部11のプロセッサ111は、例えば、上述した利用者リスト1211に基づいて利用者を選択する(ステップS301)。そして、プロセッサ111は、記憶部12から、上述した学習で生成された評価値等を含む学習データ122を読み出し、選択した利用者の学習データを使って、複数の対象を「推薦することにより利用者に選択される可能性が向上する程度」という観点でそれぞれ評価する(ステップS302)。
プロセッサ111は、ステップS302の評価に基づいて複数の対象を、例えばそれぞれ順位付けし、順位付けされたそれらの対象の中から、上述した「可能性が向上する程度」が決められた水準以上であると推定される対象を抽出する。そして、プロセッサ111は、抽出したその対象の情報を出力する(ステップS303)。
そして、プロセッサ111は、利用者リスト1211に未選択の利用者がいるか否かを判断し(ステップS304)、未選択の利用者がいると判断する場合(ステップS304;YES)、処理をステップS301に戻す。一方、未選択の利用者がいないと判断する場合(ステップS304;NO)、プロセッサ111は、処理を終了する。
上述した分類、学習、及び推定を行うことによってプロセッサ111は、利用者ごとに、推薦することによりその利用者に選択される可能性が決められた水準以上に向上すると推定される対象を、それぞれ出力する。そして、情報処理装置1は出力した対象を利用者に推薦すればよい。これにより、情報処理装置1は、利用者ごとに、推薦の効果が高いと推定される対象をそれぞれその利用者に推薦するので、利用者が対象を選択する可能性が向上する。
<変形例>
以上が実施形態の説明であるが、この実施形態の内容は以下のように変形し得る。また、以下の変形例は、組合されてもよい。
<1>
上述した実施形態において、対象の一例として商品が、対象を推薦することの一例として広告が、対象を選択することの一例として購入が、それぞれ挙げられていたが、対象、推薦、選択の例はこれらに限られない。例えば、情報処理装置1は、カートに入れる行為や、欲しい物リストに登録する行為を、上述した対象の選択に含めてよい。なお、「カートに入れる」とは、利用者が商品を購入する予定の商品として、自分の識別情報に対応付けて仮想店舗に記憶させることであり、「欲しい物リストに登録する」とは、利用者が、プレゼント等により商品の入手を希望する商品として記憶させることである。
また、例えば、情報処理装置1は、SNS(Social Networking Service)の利用者に対して、他の利用者を友人として推薦してもよい。この場合、情報処理装置1が推薦する「他の利用者」は、上述した対象の一例である。そして、利用者が、情報処理装置1に推薦された他の利用者を友人として登録することは、上述した対象の選択の一例である。
また、例えば、情報処理装置1は、ニュースサイトが公開する記事の保管場所を示すURI(Uniform Resource Identifier)等を、上述した対象として利用者に推薦してもよい。この場合、利用者が推薦されたURIをクリック等して、そのURIで示される記事を閲覧することや、そのURIをブックマークに登録すること等は、上述した対象の選択の一例である。
<2>
上述した実施形態において、プロセッサ111は、複数の対象のそれぞれが分類された対象群ごとに、正例又は負例として評価していたが、その対象を利用者に推薦したときの推薦の種類に応じて、その対象を異なる重みで評価してもよい。ここで推薦の種類とは、対象を推薦する際の規模、回数、方法等である。
例えば、プロセッサ111は、端末2の表示画面のうち20%を使用して、対象としての商品を広告した場合には、表示画面の10%を使用して広告した場合と比べて重み係数を大きくしてもよい。
また、プロセッサ111は、商品を値引きして広告する場合に、その値引率に応じて重み係数を決定してもよい。
また、プロセッサ111は、例えば一日あたりの広告回数や、同時に広告した商品の数、動画や音声で広告する場合にあってはその広告の視聴にかかる時間等に応じて、その商品についての重み係数を決定してもよい。
また、プロセッサ111は、広告が、文字のみで構成されているか否か、明滅やアニメーション等、時間の経過に伴って変化する演出を含むか否か、画像や動画を含むか、といった区別に応じて異なる重み係数を決定してもよい。
すなわち、このプロセッサ111により行われる機械学習は、複数の対象群のうち利用者に推薦した対象群を、その推薦の種類に応じて異なる重みで評価する機械学習の一例である。
<3>
また、プロセッサ111は、利用者が対象を選択したときの選択の種類に応じて、その対象を異なる重みで評価してもよい。ここで選択の種類とは、対象を選択する際の規模、回数、方法等である。
例えば、プロセッサ111は、商品を3つ購入した場合には、1つ購入した場合と比べて重み係数を大きくしてもよい。
また、例えば、プロセッサ111は、商品を実際に購入した場合と、カートに入れた場合、欲しい物リストに登録した場合で、それぞれ異なる重み係数を決定してもよい。
すなわち、このプロセッサ111により行われる機械学習は、複数の対象群のうち利用者に選択された対象群を、その選択の種類に応じて異なる重みで評価する機械学習の一例である。
<4>
上述した実施形態において、利用者に推薦され、その利用者に選択された対象は、第1対象群に分類され、プロセッサ111は、第1対象群に分類される対象を正例として評価していたが、この対象を推薦してから選択されるまでの時間に応じて異なる重みで評価してもよい。
例えば、プロセッサ111は、利用者に広告してから30分以内にその利用者によって購入された商品を、広告の8時間後に購入された商品よりも大きい重み係数を使って評価してもよい。
すなわち、このプロセッサ111により行われる機械学習は、第1対象群を、推薦してから選択されるまでの時間に応じて異なる重みで評価する機械学習の一例である。
<5>
上述した実施形態において、履歴DB121に記憶された推薦履歴及び選択履歴には期間の区別が設けられていなかったが、情報処理装置1の記憶部12は、複数の期間ごとにこれらの履歴を記憶してもよい。
この変形例において、記憶部12は、履歴DB121aを記憶し、メモリ112は、特徴情報1121aを記憶する。図9は、履歴DB121aの例を示す図である。図9に示す履歴DB121aは、利用者リスト1211、履歴表1212a、及び期間リスト1213を有する。
利用者リスト1211は、図3に示すリストと共通の構成であり、利用者IDが記憶されている。期間リスト1213は、利用者に対して決められた対象を推薦する期間を列挙したリストである。期間リスト1213に示される各期間には、それぞれ利用者ごとに推薦される対象が決められており、各期間中にこれらの対象が変更されることがない。図9に示す期間リスト1213は、例えば、「5月」、「6月」等の期間を示す文字列が記憶されている。
サーバ装置は、利用者リストに示される利用者ごと、かつ、期間リスト1213に示される期間ごとに、対象を決めてその対象を利用者に推薦する。履歴表1212aは、利用者リスト1211に記憶された利用者IDと、期間リスト1213に記憶された期間を示す文字列と、の組合せごとに生成される。履歴表1212aは、利用者リスト1211に記憶された利用者IDごとに、その利用者IDで識別される利用者が、期間リスト1213に示す期間中に、選択するか否かを判断した対象の推薦履歴及び選択履歴を記憶する。図9に示す履歴表1212aは、利用者ID「U01」で識別される利用者が、「5月」に判断した対象の推薦履歴及び選択履歴を記憶している。
図10は、異なる期間における履歴表1212aの例を示す図である。図10に示す履歴表1212aは、利用者ID「U01」で識別される利用者が、「6月」に判断した対象の推薦履歴及び選択履歴を記憶する。図10に示す履歴表1212aは、図9に示す履歴表1212aと異なっている。
プロセッサ111は、これら異なる期間の推薦履歴及び選択履歴を基に、対象を分類する。図11は、特徴情報1121aの例を示す図である。図11に示す特徴情報1121aは、上述した期間リスト1213に示される期間ごとに生成される点が図5に示す特徴情報1121と異なる。
プロセッサ111は、メモリ112に複製した履歴DB121aを読み出し、利用者ごと、期間ごとに、その利用者がその期間に閲覧等した対象を上述した4つの対象群のいずれかに分類して、図11に示す特徴情報1121aを生成する。
例えば、図11(a)に示す特徴情報1121aは、「5月」に収集された推薦履歴及び選択履歴に基づいて生成された情報である。図11(a)に示す特徴情報1121aにおいて、利用者ID「U01」には、図5に示す特徴情報1121と共通の対象が対応付けられている。
一方、図11(b)に示す特徴情報1121aは、「6月」に収集された推薦履歴及び選択履歴に基づいて生成された情報である。図11(b)に示す特徴情報1121aにおいて、利用者ID「U01」には、第1対象群として対象ID「J1」、「J5」、第2対象群として対象ID「J2」、第3対象群として対象ID「J3」、第4対象群として対象ID「J4」、「J6」がそれぞれ対応付けられている。
プロセッサ111は、図10に示す2つの期間における特徴情報1121aを解析し、各対象に対する推薦の有無と選択の有無の組合せを特定する。図12は、利用者が異なる期間に判断した対象を分類した結果を示す図である。図12に示す通り、各対象は、2つこの期間にそれぞれ記憶された履歴に基づいて、それぞれ2回、いずれかの対象群に分類されるので、分類される2つの対象群が異なる場合がある。
例えば、図12に示す通り、対象ID「J1」は、5月及び6月にかけて、第1対象群及び第4対象群に分類されている。また、対象ID「J2」は、5月及び6月にかけて、第1対象群及び第2対象群に分類されている。
図13は、分類された対象群の組合せ、及びその評価を説明するための図である。2つの異なる期間のそれぞれにおいて、対象が4つの対象群に分類される場合、その対象が分類される対象群の組合せは図12に示した10通りとなる。この組合せは、繰り返しを許した組合せである。
この10通りのうち、1つの対象が2つの期間のそれぞれで共通の対象群に分類されるケースは4通りである。これらのケースは他のケースに比べて得られる情報が少ないので除外すると、組合せは、図13に示す6通りとなる。この組合せは、繰り返しを許さない組合せである。
2つの異なる期間で、対象が第1対象群及び第2対象群に分類される場合、その対象は「推薦しても、しなくても選択される」という性質を持つ可能性がある。この対象は、推薦により選択される可能性が向上するとも低下するとも言えない。したがって、情報処理装置1のプロセッサ111は、この対象の評価を0とする。
また、2つの異なる期間で、対象が第3対象群及び第4対象群に分類される場合、その対象は「推薦しても、しなくても選択されない」という性質を持つ可能性がある。この対象は、推薦により選択される可能性が向上するとも低下するとも言えない。したがって、情報処理装置1のプロセッサ111は、この対象の評価を0とする。
また、2つの異なる期間で、対象が第1対象群及び第3対象群に分類される場合、その対象は「推薦したとき、選択されることもあれば、選択されないこともある」という性質を持つ可能性がある。この対象は、推薦により選択される可能性が向上するとも低下するとも言えない。したがって、情報処理装置1のプロセッサ111は、この対象の評価を0とする。
また、2つの異なる期間で、対象が第2対象群及び第4対象群に分類される場合、その対象は「推薦しないとき、選択されることもあれば、選択されないこともある」という性質を持つ可能性がある。この対象は、推薦により選択される可能性が向上するとも低下するとも言えない。したがって、情報処理装置1のプロセッサ111は、この対象の評価を0とする。
しかし、2つの異なる期間で、対象が第1対象群及び第4対象群に分類される場合、その対象は「推薦すると選択され、推薦しないと選択さない」という性質を持つ可能性がある。この対象は、上述した対象αであるから、推薦により選択される可能性が向上すると言える。したがって、情報処理装置1のプロセッサ111は、この対象の評価を+1とする。
すなわち、このプロセッサ111により行われる機械学習は、対象を、複数の対象群に分類し、或る期間に利用者に推薦して選択され、かつ、その期間と異なる期間にその利用者に推薦せずに選択されなかった対象群を正例として評価する前記機械学習の一例である。
他方、2つの異なる期間で、対象が第2対象群及び第3対象群に分類される場合、その対象は「推薦すると選択されず、推薦しないと選択される」という性質を持つ可能性がある。この対象は、上述した対象βであるから、推薦により選択される可能性が低下すると言える。したがって、情報処理装置1のプロセッサ111は、この対象の評価を−1とする。
すなわち、このプロセッサ111により行われる機械学習は、或る期間に利用者に推薦して選択されず、かつ、その期間と異なる期間にその利用者に推薦せずに選択された対象群を負例として評価する機械学習の一例である。
この構成で、プロセッサ111は、2つの異なる期間のそれぞれで選択履歴及び推薦履歴に基づき、対象を分類する。そして、このプロセッサ111は、分類したその対象が対象αであると推定される場合に、その対象を正例として評価する。これにより、この構成の情報処理装置1は、「推薦することにより利用者に選択される可能性が向上すると推定される対象」を出力し易くなる。
一方、この構成で、プロセッサ111は、分類した対象が対象βであると推定される場合に、その対象を負例として評価することが望ましい。これにより、情報処理装置1は、「推薦することにより利用者に選択される可能性が低下すると推定される対象」を出力し難くなる。
<6>
上述した変形例において、プロセッサ111は、複数の異なる期間の推薦履歴及び選択履歴を基に対象を分類し、各対象の分類先である対象群の組合せごとに、その対象を評価していたが、異なる期間の履歴を統合(マージするともいう)してもよい。この場合、プロセッサ111は、対象が或る対象群に分類される頻度に応じて、その対象群の重み係数を決定してもよい。
また、プロセッサ111は、メモリ112から複数の異なる期間の推薦履歴及び選択履歴を読み出す場合、その期間ごとに、各対象を評価してもよい。この場合、情報処理装置1は、対象に対する推薦の効果が期間ごとに変動しても、現時点で推薦すべき対象の情報を出力する。
<7>
上述した実施形態において、プロセッサ111は、それぞれランダムに選択した対象及び利用者の組合せに対する評価値vuiを上述した式(1)に沿って算出していたが、利用者や対象が時間の経過に沿って変化する場合、次の式(3)に沿って算出してもよい。
ここでS(static)は、時間依存しない特徴成分であり、D(dynamic)は時間によって変化する特徴成分である。
<8>
上述した実施形態において、プロセッサ111は、ポイントワイズ手法によるランキング学習を行ったが、他の手法による機械学習を行ってもよい。例えば、プロセッサ111は、ペアワイズ手法によるランキング学習を行ってもよい。この場合、プロセッサ111は、次の式(4)に示す差分xuijが大きくなるように、対象及び利用者の特徴量を更新すればよい。
ここで、添字iは、正例として評価される対象及び利用者の組合せであり、添字jは、負例として評価される対象及び利用者の組合せである。つまり、式(4)の差分xuijは、正例及び負例の各評価値の差分を示している。この変形例に示す更新により、推薦することにより選択される可能性が向上する対象はより出力され易く、その可能性が低下する対象は、より出力され難くなる。
<9>
上述した情報処理装置1は、プロセッサ111、メモリ112を有して各部を制御する制御部11を有していたが、情報処理装置1を制御する制御手段は他の構成であってもよい。例えば、情報処理装置1は、CPU以外にも各種のプロセッサ等を有してもよい。
ここでプロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ(例えば上述したCPU等)や、専用のプロセッサ(例えばGPU: Graphics Processing Unit、ASIC: Application Specific Integrated Circuit、FPGA: Field Programmable Gate Array、プログラマブル論理デバイス、等)を含むものである。
<10>
上記各実施形態におけるプロセッサ111の動作は、1つのプロセッサ111によって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は上記各実施形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。
<11>
上述した情報処理装置1の制御部11のプロセッサ111によって実行されるプログラムは、利用者が選択するか否かを判断した対象ごとに、この利用者がその対象を選択したか否か示す選択履歴と、この利用者にその対象を推薦したか否かを示す推薦履歴と、を記憶したメモリから情報を読み出すプロセッサに、この選択履歴及び推薦履歴から、対象に対する推薦の効果を推定する機械学習を行うステップと、この学習の結果に基づいて、推薦することにより利用者に選択される可能性が決められた水準以上で向上すると推定される対象の情報を出力するステップと、を実行させるためのプログラムの一例である。このプログラムは、磁気テープ及び磁気ディスク等の磁気記録媒体、光ディスク等の光記録媒体、光磁気記録媒体、半導体メモリ等の、コンピュータ装置が読取り可能な記録媒体に記憶された状態で提供し得る。また、このプログラムは、インターネット等の通信回線経由でダウンロードされてもよい。
<12>
上述した実施形態又は変形例において、プロセッサ111が実行する機械学習は、対象群の重み係数を各種の条件に沿って決定していたが、この決定の条件は上述したものに限らない。例えば、この機械学習は、推薦して選択された第1対象群を、この第1対象群が推薦される確率(第1確率という)が大きいほど小さくなる重み(第1重みという)で評価してもよい。また、この機械学習は、推薦せずに選択された第2対象群を、この第2対象群が推薦されない確率(第2確率という)が大きいほど小さくなる重み(第2重みという)で評価してもよい。
なお、上述した推薦が、例えば、乱数や擬似乱数等により、決められた総数の集団から決められた個数だけ選択されたものに対して行われる場合、推薦される確率とは、この選択される個数を、上述した総数で除算して得られる。そして、推薦されない確率は、1から推薦される確率を減算して得られる。
上述した第1重みは、第1確率が大きいほど小さくなる重みであれば、どのようにして求められてもよい。また、上述した第2重みは、第2確率が大きいほど小さくなる重みであれば、どのようにして求められてもよい。例えば、第1重みは、前記第1確率の逆数に比例し、前記第2重みは、前記第2確率の逆数に比例してもよい。
例えば、プロセッサ111は、以下の式(5)に沿ってu−iのペアがランキング順となるように機械学習してもよい。ここで、τuiIPSは、対象iを利用者uに推薦することによる因果効果の推定値である。この式(5)において、Zuiは、利用者uに対象iが推薦されたか否かを示す指標変数である。推薦されたときはZui=1で第一項が残り、推薦されなかったときはZui=0で第二項が残る。Yuiは、利用者uが対象iを選択したか否かの指標変数である。Puiは、利用者uに対象iが推薦される確率である。
これによりτuiIPSは、推薦したときに0以上となるため正例となり、推薦していないときに0未満となるため負例となる。
さらに、τuiは、ランク順位r(s_ui)に応じた重みλ_uiに従って重みを付けられてもよい。λ_uiはランク順位が下に行くほど小さくなる重みであればよく、ランキング評価指標に応じて、例えば、以下の式(6)のように定められる。
なお、λは対象のランキングによって決まり、ランキングは対象のスコアによって決まる。スコアsuiは、例えば、以下の式(7)によって表現されてもよい。
ここでqiは対象iが持つ特徴、puは利用者uが持つ特徴、両者のベクトルの内積がスコアsuiである。
また、第1重み又は第2重みは、予め定めた上限を超えないように決定されてもよい。
例えば、上述した式(5)から式(7)までの計算は、以下の式(8)に沿って、スコアsuiからランクruiへの変換、その際に生じる指示関数(suj>sui)の近似や上限等が用いられてもよい。
1…情報処理装置、11…制御部、111…プロセッサ、112…メモリ、1121…特徴情報、1121a…特徴情報、12…記憶部、121…履歴DB、121a…履歴DB、1211…利用者リスト、1212…履歴表、1212a…履歴表、1213…期間リスト、122…学習データ、13…通信部、14…操作部、15…表示部、2…端末、3…通信回線、9…情報処理システム。

Claims (13)

  1. 利用者が選択するか否かを判断した対象ごとに、該利用者が該対象を選択したか否か示す選択履歴と、該利用者に該対象を推薦したか否かを示す推薦履歴と、を記憶したメモリと、
    前記メモリから情報を読み出すプロセッサと、を有し、前記プロセッサは、
    前記選択履歴及び前記推薦履歴から、対象に対する推薦の効果を推定する機械学習を行い、
    前記機械学習の結果に基づいて、推薦することにより利用者に選択される可能性が決められた水準以上で向上すると推定される対象の情報を出力する
    情報処理装置。
  2. 前記機械学習は、対象を、利用者に推薦して選択された第1対象群と、利用者に推薦せずに選択された第2対象群と、を含む複数の対象群に分類し、前記第1対象群を正例として、前記第2対象群を負例として、それぞれ評価する
    請求項1に記載の情報処理装置。
  3. 前記機械学習は、対象を、利用者に推薦して選択されなかった第3対象群を含む、前記複数の対象群に分類し、前記第3対象群を負例として評価する
    請求項2に記載の情報処理装置。
  4. 前記機械学習は、対象を、利用者に推薦せずに選択されなかった第4対象群を含む、前記複数の対象群に分類し、前記第4対象群を前記第1対象群よりも重みが小さい正例として評価する
    請求項2又は3に記載の情報処理装置。
  5. 前記機械学習は、前記複数の対象群のうち利用者に推薦した対象群を、該推薦の種類に応じて異なる重みで評価する
    請求項2から4のいずれか1項に記載の情報処理装置。
  6. 前記機械学習は、前記複数の対象群のうち利用者に選択された対象群を、該選択の種類に応じて異なる重みで評価する
    請求項2から5のいずれか1項に記載の情報処理装置。
  7. 前記機械学習は、前記第1対象群を、推薦してから選択されるまでの時間に応じて異なる重みで評価する
    請求項2から6のいずれか1項に記載の情報処理装置。
  8. 前記機械学習は、対象を、複数の対象群に分類し、或る期間に利用者に推薦して選択され、かつ、前記或る期間と異なる期間に前記利用者に推薦せずに選択されなかった対象群を正例として評価する
    請求項1に記載の情報処理装置。
  9. 前記機械学習は、或る期間に利用者に推薦して選択されず、かつ、前記或る期間と異なる期間に前記利用者に推薦せずに選択された対象群を負例として評価する
    請求項1又は8に記載の情報処理装置。
  10. 前記機械学習は、前記第1対象群を、該第1対象群が推薦される第1確率が大きいほど小さくなる第1重みで評価し、前記第2対象群を、該第2対象群が推薦されない第2確率が大きいほど小さくなる第2重みで評価する
    請求項2から7のいずれか1項に記載の情報処理装置。
  11. 前記第1重みは、前記第1確率の逆数に比例し、前記第2重みは、前記第2確率の逆数に比例する
    請求項10に記載の情報処理装置。
  12. 前記第1重み又は前記第2重みは、予め定めた上限を超えないように決定される
    請求項10又は11に記載の情報処理装置。
  13. 利用者が選択するか否かを判断した対象ごとに、該利用者が該対象を選択したか否か示す選択履歴と、該利用者に該対象を推薦したか否かを示す推薦履歴と、を記憶したメモリから情報を読み出すプロセッサに、
    前記選択履歴及び前記推薦履歴から、対象に対する推薦の効果を推定する機械学習を行うステップと、
    前記機械学習の結果に基づいて、推薦することにより利用者に選択される可能性が決められた水準以上で向上すると推定される対象の情報を出力するステップと、
    を実行させるためのプログラム。
JP2020120716A 2019-08-28 2020-07-14 情報処理装置、及びプログラム Pending JP2021039735A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019156045 2019-08-28
JP2019156045 2019-08-28

Publications (1)

Publication Number Publication Date
JP2021039735A true JP2021039735A (ja) 2021-03-11

Family

ID=74680542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020120716A Pending JP2021039735A (ja) 2019-08-28 2020-07-14 情報処理装置、及びプログラム

Country Status (3)

Country Link
US (1) US20210065276A1 (ja)
JP (1) JP2021039735A (ja)
CN (1) CN112446730A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102476700B1 (ko) * 2021-05-13 2022-12-12 서울대학교산학협력단 비정상 단말을 포함하는 무선 분산 학습 시스템 및 그의 동작 방법

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009122781A (ja) * 2007-11-12 2009-06-04 Yahoo Japan Corp リコメンドシステム、およびリコメンド方法
JP5277307B2 (ja) * 2009-02-18 2013-08-28 株式会社日立製作所 情報推薦方法、そのシステム、及びサーバ
KR100961783B1 (ko) * 2009-06-29 2010-06-07 주식회사 모임 인공지능에 기반한 제품 및 제품 벤더 추천 장치 및 방법, 그 기록 매체
JP2011242999A (ja) * 2010-05-18 2011-12-01 Dainippon Printing Co Ltd 情報収集記録システム用サーバ装置、情報収集記録プログラム及び広告媒体
US20120303412A1 (en) * 2010-11-24 2012-11-29 Oren Etzioni Price and model prediction system and method
CA2825498C (en) * 2012-08-31 2017-05-16 Accenture Global Services Limited Hybrid recommendation system
US20140358828A1 (en) * 2013-05-29 2014-12-04 Purepredictive, Inc. Machine learning generated action plan
JP2016009229A (ja) * 2014-06-23 2016-01-18 日本ユニシス株式会社 広告効果確認装置、販促システムおよび広告効果確認用プログラム
US10102559B1 (en) * 2014-09-30 2018-10-16 Amazon Technologies, Inc. Diversification of recommendations
CN106776660A (zh) * 2015-11-25 2017-05-31 阿里巴巴集团控股有限公司 一种信息推荐方法及装置
JP6728972B2 (ja) * 2016-05-23 2020-07-22 富士ゼロックス株式会社 プログラム、商品推薦システム及び商品推薦方法
JP2019527874A (ja) * 2016-06-21 2019-10-03 ピンポイント プレディクティヴ,インコーポレイテッド ユーザー匿名性を維持しつつ機械学習を使って行動データから心理測定プロファイルを予測すること
CN106228386B (zh) * 2016-07-12 2018-09-25 腾讯科技(深圳)有限公司 一种信息推送方法及装置
JP6405343B2 (ja) * 2016-07-20 2018-10-17 Necパーソナルコンピュータ株式会社 情報処理装置、情報処理方法、およびプログラム
CN106780052A (zh) * 2017-01-10 2017-05-31 上海诺悦智能科技有限公司 基于分类客户行为分析的保险服务推荐方法及系统
JP6683638B2 (ja) * 2017-02-14 2020-04-22 Kddi株式会社 通知装置、通知方法、及び通知プログラム
US11481644B2 (en) * 2017-02-17 2022-10-25 Nike, Inc. Event prediction
CN107423335B (zh) * 2017-04-27 2020-06-05 电子科技大学 一种针对单类协同过滤问题的负样本选择方法
FR3071087A1 (fr) * 2017-09-14 2019-03-15 Amadeus S.A.S. Une methode et un systeme pour la segmentation de voyageurs en ligne en temps reel a l'aide de l'apprentissage automatique
CN107943449A (zh) * 2017-12-23 2018-04-20 河南智盈电子技术有限公司 一种基于面部表情识别的智能音响系统
CN108563663A (zh) * 2018-01-04 2018-09-21 出门问问信息科技有限公司 图片推荐方法、装置、设备及存储介质
JP7035600B2 (ja) * 2018-02-16 2022-03-15 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
CN108959655B (zh) * 2018-08-07 2020-04-03 南京大学 一种面向动态环境的自适应在线推荐方法
CN109659007A (zh) * 2018-11-13 2019-04-19 平安科技(深圳)有限公司 食堂用餐服务方法、装置、计算机设备及存储介质
CN109961351B (zh) * 2019-02-13 2023-02-07 平安科技(深圳)有限公司 信息推荐方法、装置、存储介质及计算机设备
US20210042708A1 (en) * 2019-03-19 2021-02-11 Service Concierge Securitized and encrypted data for vehicle service concierge (sc) devices and systems that provide and predict improved operations and outcomes
CN110162706B (zh) * 2019-05-22 2021-10-26 南京邮电大学 一种基于交互数据聚类的个性化推荐方法及系统

Also Published As

Publication number Publication date
CN112446730A (zh) 2021-03-05
US20210065276A1 (en) 2021-03-04

Similar Documents

Publication Publication Date Title
Jamshidi et al. Brand commitment role in the relationship between brand loyalty and brand satisfaction: phone industry in Malaysia
Liu et al. Unveiling user-generated content: Designing websites to best present customer reviews
CA2901454C (en) System architecture for customer genome construction and analysis
JP6352798B2 (ja) マーケティング施策最適化装置、方法、及びプログラム
US11580586B2 (en) Real-time recommendation monitoring dashboard
US20170011421A1 (en) Preference analyzing system
JPWO2005024689A1 (ja) 消費者の購買行動分析方法及び装置
Płonka et al. Conjoint analysis models of digital packaging information features in customer decision-making
Choi et al. Accessing tourists’ unconscious associations about international destinations: Data fuzzification of reaction times in the implicit association test
JP2021039735A (ja) 情報処理装置、及びプログラム
JP2016081199A (ja) 広告配信システム
JP2019109787A (ja) 予測装置、予測方法、及び予測プログラム
JP7042787B2 (ja) 判定装置、判定方法、および判定プログラム
CN103455566B (zh) 信息展示方法及装置
JP6809148B2 (ja) プログラムおよび組み合わせ抽出システム
CN111626776A (zh) 训练策略模型的方法、确定广告投放策略的方法和装置
JP2011081451A (ja) 表示データ生成装置及びプログラム
Kawengian DETERMINANTS OF CONSUMERS’ BRAND SWITCHING BEHAVIOR IN THE PURCHASE OF MINERAL WATER PRODUCTS IN MANADO CITY
Izang et al. Scalable Data Analytics Market Basket Model for Transactional Data Streams
US20220108193A1 (en) Information processing apparatus and non-transitory computer readable medium
WO2023080215A1 (ja) プログラム、商品推薦装置、商品推薦方法、および商品推薦システム
Luo et al. Who will be affected by supermarket health programs? Tracking customer behavior changes via preference modeling
Ceylan et al. Probability to buy agricultural products from different sales points during COVID-19: An exemplary scenario analysis
JP6958014B2 (ja) 推薦システム、情報処理装置及びプログラム
JP2024092163A (ja) 情報処理装置、情報処理方法、およびプログラム