JP6158464B1 - 予測システム - Google Patents

予測システム Download PDF

Info

Publication number
JP6158464B1
JP6158464B1 JP2017516189A JP2017516189A JP6158464B1 JP 6158464 B1 JP6158464 B1 JP 6158464B1 JP 2017516189 A JP2017516189 A JP 2017516189A JP 2017516189 A JP2017516189 A JP 2017516189A JP 6158464 B1 JP6158464 B1 JP 6158464B1
Authority
JP
Japan
Prior art keywords
data
target specifying
objects
specifying data
targets
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017516189A
Other languages
English (en)
Other versions
JPWO2017141439A1 (ja
Inventor
智康 大場
智康 大場
晴正 佐藤
晴正 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
I'S FACTORY CO., LTD.
Original Assignee
I'S FACTORY CO., LTD.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by I'S FACTORY CO., LTD. filed Critical I'S FACTORY CO., LTD.
Application granted granted Critical
Publication of JP6158464B1 publication Critical patent/JP6158464B1/ja
Publication of JPWO2017141439A1 publication Critical patent/JPWO2017141439A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N99/00Subject matter not provided for in other groups of this subclass
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

予測システムは、第1の複数の対象のそれぞれについて、第1の対象特定データと属性データとを第1の主体から受付ける。予測システムは、第2の複数の対象のそれぞれについて、第2の対象特定データと評価データとを第2の主体から受付ける。予測システムは、前記第1の複数の対象に含まれ且つ前記第2の複数の対象に含まれる第3の複数の対象を抽出する。予測システムは、前記第3の複数の対象それぞれの前記属性データと前記評価データとに基づいて、所定事象を予測するための関数のパラメータを算出する。予測システムは、前記第1の複数の対象に含まれ且つ前記第2の複数の対象に含まれない第4の複数の対象それぞれについての前記所定事象を予測する。

Description

本発明は予測システムに関する。
既知の入力データとその入力データに対する既知の応答との組み合わせを教師データとして収集しておき、この教師データに基づいて機械学習を行い、新しい入力データに対する応答を予測するシステムが研究されている。このような予測システムは、医療や検索エンジンなど幅広い技術分野での利用が期待されている。
本発明の1つの観点に係る予測システムは、
第1の複数の対象をそれぞれ特定する第1の対象特定データと、前記第1の複数の対象それぞれの属性を示す属性データと、を対応付けた第1のリストの入力を第1の主体から受付け、
第2の複数の対象をそれぞれ特定する第2の対象特定データと、前記第2の複数の対象それぞれについての所定事象の評価値を示す評価データと、を対応付けた第2のリストの入力を第2の主体から受付ける
第1のモジュールと、
前記第1の対象特定データと前記第2の対象特定データとに基づいて、前記第1の複数の対象に含まれ且つ前記第2の複数の対象に含まれる第3の複数の対象を抽出する第2のモジュールと、
前記第1のリストに含まれる前記第3の複数の対象それぞれの前記属性データと、前記第2のリストに含まれる前記第3の複数の対象それぞれについての前記評価データと、に基づいて、前記評価データが未知である対象について前記属性データから前記所定事象を予測するための関数のパラメータを算出する第3のモジュールと、
前記第1の複数の対象に含まれ且つ前記第2の複数の対象に含まれない第4の複数の対象それぞれの前記属性データと、前記パラメータと、に基づいて、前記第4の複数の対象それぞれについての前記所定事象を予測する第4のモジュールと、
を含む。
本発明の実施形態に係る予測システム3と、予測システム3に接続される装置とを示す。 第1の主体が持っているデータの例を示す。 第2の主体が持っているデータの例を示す。 図2A及び図2Bに示されるデータから生成可能な教師データの例を示す。 図2A及び図2Bに示されるデータから生成可能な予測用データの例を示す。 図1に示される予測システム3による処理手順を示すフローチャートである。 図3に示される名寄せの処理のために予測システム3が受付けるデータの第1の例を示す。 図3に示される名寄せの処理において予測システム3が生成するデータの第1の例を示す。 図3に示される名寄せの処理のために予測システム3が受付けるデータの第2の例を示す。 図3に示される名寄せの処理において予測システム3が生成するデータの第2の例を示す。 図3に示されるカテゴリー分割ルールの生成の処理のために予測システム3が受付けるデータの例を示す。 図3に示されるカテゴリー分割ルールの生成の処理において予測システム3が生成するデータの例を示す。 図3に示されるカテゴリー分割の処理においてコンピュータ1に入力されるデータの例を示す。 図3に示されるカテゴリー分割の処理においてコンピュータ1が生成するデータの例を示す。 図3に示されるランダム化の処理においてコンピュータ1に設定される第1のデータの例を示す。 図3に示されるランダム化の処理においてコンピュータ1が生成する第1のデータの例を示す。 図3に示されるランダム化の処理においてコンピュータ1に設定される第2のデータの例を示す。 図3に示されるランダム化の処理においてコンピュータ1が生成する第2のデータの例を示す。 図3に示される教師データ及び予測用データの生成処理のために予測システム3がコンピュータ1から受付けるデータの例を示す。 図3に示される教師データ及び予測用データの生成処理のために予測システム3がコンピュータ2から受付けるデータの例を示す。 図3に示される教師データの生成処理において予測システム3が生成する教師データの例を示す。 図3に示される予測用データの生成処理において予測システム3が生成する予測用データの第1の例を示す。 図3に示される予測用データの生成処理において予測システム3が生成する予測用データの第2の例を示す。 図3に示される予測モデルの構築の処理において予測システム3が生成するデータの例を示す。 図3に示される予測結果の算出処理において予測システム3が生成するデータの第1の例を示す。 図3に示される予測結果の算出処理において予測システム3が生成するデータの第2の例を示す。
以下、本発明の実施形態を、図面を参照しながら詳細に説明する。以下に説明される各実施形態は、本発明の一例を示すものであって、本発明の内容を限定するものではない。また、各実施形態で説明される構成及び動作のすべてが本発明の構成及び動作として必須であるとは限らない。なお、同一の構成要素には同一の参照符号を付して、重複する説明を省略する。
<1.構成>
図1に、本発明の実施形態に係る予測システム3と、予測システム3に接続される装置とを示す。予測システム3は、インターネット等のネットワークを介して、コンピュータ1及びコンピュータ2に対して接続されている。
コンピュータ1は、第1の主体によって管理される。以下の説明において、第1の主体を、A社、A機関などと称することがある。
コンピュータ2は、第1の主体とは異なる第2の主体によって管理される。以下の説明において、第2の主体を、B社、B病院などと称することがある。
予測システム3も、コンピュータで構成される。予測システム3は、第1の主体とも第2の主体とも異なる第3の主体によって管理される。以下の説明において、第3の主体を、C社と称することがある。
コンピュータ1、コンピュータ2、及び予測システム3を構成するコンピュータは、いずれも、図示しないプロセッサ、メモリ、ストレージ、入力装置、出力装置、通信装置等を備えている。各々のコンピュータは、1台の装置で構成されていてもよいし、各々のコンピュータが、複数の装置で構成されていてもよい。
<2.解析のためのデータ>
図2Aに、第1の主体が持っているデータの例を示す。
第1の主体は、第1の複数の対象Aについての生データRDaを持っている。生データRDaは、対象特定情報D(A,P)と、属性データD(A,E)と、を対応付けたものである。
対象特定情報D(A,P)は、第1の複数の対象Aの各々を特定するデータである。
属性データD(A,E)は、第1の複数の対象Aの各々の属性を示すデータである。
図2Bに、第2の主体が持っているデータの例を示す。
第2の主体は、第2の複数の対象Bについての生データRDbを持っている。生データRDbは、対象特定情報D(B,P)と、評価データD(B,L)と、を対応付けたものである。
対象特定情報D(B,P)は、第2の複数の対象Bの各々を特定するデータである。
評価データD(B,L)は、第2の複数の対象Bの各々についての所定事象の評価値を示すデータである。
対象特定情報D(A,P)は、第1の複数の対象Aの各々の電子メールアドレスでもよいし(図2A参照)、第1の複数の対象Aの各々の住所と氏名との組み合わせでもよい。対象特定情報D(A,P)は、個人を特定する情報であればよい。
対象特定情報D(B,P)は、第2の複数の対象Bの各々の電子メールアドレスでもよいし(図2B参照)、第2の複数の対象Bの各々の住所と氏名との組み合わせでもよい。対象特定情報D(B,P)は、個人を特定する情報であればよい。
図2Cに、図2A及び図2Bに示されるデータから生成可能な教師データの例を示す。
図2Dに、図2A及び図2Bに示されるデータから生成可能な予測用データの例を示す。
対象特定情報D(A,P)と対象特定情報D(B,P)とを照合することにより、次の(1)〜(3)が可能である。
(1)第1の複数の対象Aに含まれ、且つ第2の複数の対象Bに含まれる第3の複数の対象A∩Bを抽出し得る。図2Cに示されるように、第3の複数の対象A∩Bの各々について、属性データD(A∩B,E)と評価データD(A∩B,L)とを対応付けることもできる。
(2)第1の複数の対象Aに含まれ、且つ第2の複数の対象Bに含まれない第4の複数の対象A−A∩Bを抽出し得る。図2Dに示されるように、第4の複数の対象A−A∩Bの各々については、属性データD(A−A∩B,E)を抽出することもできる。但し、第4の複数の対象A−A∩Bについて、評価データは存在しない。
(3)第2の複数の対象Bに含まれ、且つ第1の複数の対象Aに含まれない第5の複数の対象B−A∩Bも抽出し得る。
本発明の第1の形態において、第1の主体は、営利企業であるA社であり得る。第1の複数の対象Aは、A社の複数の顧客であり得る。属性データD(A,E)は、第1の複数の対象Aそれぞれの消費行動に関係するデータであり得る。消費行動に関係するデータとして、例えば、性別、年齢、会員区分(例えば、有料会員(有)か無料会員(無)か)、利用回数などを挙げることができる。第1の形態において、図2AのカテゴリーXaの欄に記載されたものが性別に相当し、カテゴリーXbの欄に記載されたものが年齢に相当し、カテゴリーXcの欄に記載されたものが会員区分に相当し、カテゴリーXdの欄に記載されたものが利用回数に相当する。
この第1の形態において、第2の主体は、A社とは別の営利企業であるB社であり得る。第2の複数の対象Bは、B社の複数の顧客であり得る。評価データD(B,L)は、第2の複数の対象Bの各々がB社の特定商品を購入したか否かを示す情報であり得る(図2B参照)。
第1の形態においては、A社の複数の顧客とB社の複数の顧客とに共通する第3の複数の対象A∩Bのそれぞれについて、属性データD(A∩B,E)と評価データD(A∩B,L)との組み合わせを、教師データとして抽出し得る(図2C参照)。この教師データを用いれば、どのような属性の顧客がB社の上記特定商品を購入しやすい傾向にあるかを示す予測モデルを構築できる。
この予測モデルを、A社の複数の顧客に含まれ且つB社の複数の顧客に含まれない第4の複数の対象A−A∩Bの各々についての属性データD(A−A∩B,E)に適用する(図2D参照)。これにより、第4の複数の対象A−A∩Bの各々がB社の上記特定商品を購入しそうか否かを予測し得る。従って、A社はB社と提携し、A社の顧客の内の購入可能性の高い顧客のみを対象にしてB社の上記特定商品を勧めるようにすれば、A社及びB社の双方にとって新たなビジネスチャンスが生まれ得る。
本発明の第2の形態において、第1の主体は、健康保険組合などのA機関であり得る。第1の複数の対象Aは、A機関の複数の加入者であり得る。属性データD(A,E)は、第1の複数の対象Aそれぞれの健康に関係するデータであり得る。健康に関係するデータとして、性別、年齢、アレルギーの有無、薬の投与回数などを挙げることができる。第2の形態において、図2AのカテゴリーXaの欄に記載されたものが性別に相当し、カテゴリーXbの欄に記載されたものが年齢に相当し、カテゴリーXcの欄に記載されたものがアレルギーの有無に相当し、カテゴリーXdの欄に記載されたものが薬の投与回数に相当する。
この第2の形態において、第2の主体は、B病院であり得る。第2の複数の対象Bは、B病院の複数の患者であり得る。評価データD(B,L)は、第2の複数の対象Bそれぞれに対して特定薬品が薬効を有したか否かを示す情報であり得る(図2B参照)。
この第2の形態においては、A機関の複数の加入者とB病院の複数の患者とに共通する第3の複数の対象A∩Bのそれぞれについて、属性データD(A∩B,E)と評価データD(A∩B,L)との組み合わせを、教師データとして抽出し得る(図2C参照)。この教師データを用いれば、どのような属性の加入者に対して上記特定薬品が薬効を有するかを示す予測モデルを構築できる。
この予測モデルを、A機関の複数の加入者に含まれ且つB病院の複数の患者に含まれない第4の複数の対象A−A∩Bそれぞれについての属性データD(A−A∩B,E)に適用する(図2D参照)。これにより、第4の複数の対象A−A∩Bの各々に対して、上記特定薬品が薬効を有するか否かを予測し得る。従って、A機関は、A機関の加入者の内の薬効を有する可能性の高い加入者のみを対象にして上記特定薬品を勧めることができ、治療効果の向上及び健康の増進に寄与し得る。
しかしながら、以上のように第1の主体と第2の主体とが提供する情報を組み合わせて予測を行うためには、第1の主体と第2の主体とが、それぞれ自分が持っている情報を誰かに開示しなければならない。
例えば、上述の第3の複数の対象A∩Bを特定し、抽出するためには、対象特定情報D(A,P)と対象特定情報D(B,P)とを照合する作業が必要である。少なくともこの作業をする者は、対象特定情報D(A,P)と対象特定情報D(B,P)との両方を知ってしまうことになる。
また、例えば、上述の予測モデルを構築するためには、共通する第3の複数の対象A∩Bのそれぞれについて、属性データD(A∩B,E)と評価データD(A∩B,L)との組み合わせを教師データとして用いる必要がある。少なくとも予測モデルを構築する者は、属性データD(A∩B,E)と評価データD(A∩B,L)との組み合わせを知るだけでなく、第1の複数の対象Aに含まれ且つ第2の複数の対象Bに含まれる第3の複数の対象A∩Bがどれなのかも知ってしまう。
以下では、情報を既に持っている者以外の者には、なるべく情報を知られないようにしつつ、第1の主体と第2の主体とが提供する情報を組み合わせて、予測を行うシステムについて説明する。
<3.手順の概要>
図3は、図1に示される予測システム3による処理手順を示すフローチャートである。
S1において、第3の主体によって管理される予測システム3は、第1の主体によって管理されるコンピュータ1から、対象特定情報D(A,P)を受付ける。予測システム3は、第2の主体によって管理されるコンピュータ2から、対象特定情報D(B,P)を受付ける。S1の処理を行うモジュールは、本開示の第5のモジュールに相当し得る。
S2において、予測システム3は、対象特定情報D(A,P)及び対象特定情報D(B,P)に基づいて名寄せの処理を行う。S2の処理を行うモジュールは、本開示の第6のモジュールに相当し得る。
S3において、予測システム3は、名寄せの結果を、それぞれコンピュータ1とコンピュータ2とに送信する。S3の処理を行うモジュールは、本開示の第7のモジュールに相当し得る。
S4において、予測システム3は、コンピュータ1から属性データD(A,E)を受付ける。
S5において、予測システム3は、属性データD(A,E)に基づいて、カテゴリー分割ルールFcatを生成する。
S6において、予測システム3は、カテゴリー分割ルールFcatをコンピュータ1に送信する。
S7は予測システム3による処理ではないが、予測システム3による処理と密接に関係するためここで説明する。
S7において、第1の主体が、コンピュータ1を用いて、属性データD(A,E)をカテゴリー分割及びランダム化する。カテゴリー分割及びランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A,E)])は、後述のように、属性が具体的にわからないように数値化されたデータである。以下の説明において、カテゴリー分割及びランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A,E)])のことを、列配置ランダム化した属性データと称することがある。
S8において、予測システム3は、コンピュータ1から、カテゴリー分割及びランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A,E)])を受付ける。予測システム3は、コンピュータ2から、評価データD(B,L)を受付ける。S8の処理を行うモジュールは、本開示の第1のモジュールに相当し得る。
S9において、予測システム3は、S8で受付けたデータをマージして、教師データ及び予測用データを生成する。S9の処理を行うモジュールは、本開示の第2のモジュールに相当し得る。
S10において、予測システム3は、教師データに基づいて予測モデルを構築する。S10の処理を行うモジュールは、本開示の第3のモジュールに相当し得る。
S11において、予測システム3は、この予測モデルを予測用データに適用することによって、予測結果を算出する。S11の処理を行うモジュールは、本開示の第4のモジュールに相当し得る。
S12において、予測システム3は、予測結果をコンピュータ1に送信する。
以下、それぞれの処理について詳細に説明する。
<4.S1−S3:名寄せの処理>
<4−1.第1の例>
図4Aは、図3に示される名寄せの処理のために予測システム3が受付けるデータの第1の例を示す。第1の例においては、名寄せのためのデータとして、氏名と住所との組み合わせが用いられる。氏名同一の別人は存在し得るので氏名だけでは名寄せできないが、氏名と住所との組み合わせなら名寄せが可能である。但し、住所の表記にはしばしば表記ゆれがみられるので、表記ゆれを考慮して名寄せの処理をするのが望ましい。
図4Aに示されるように、予測システム3は、第1の主体によって管理されるコンピュータ1から、第1の複数の対象Aについての対象特定情報D(A,P)を受付ける。第1の例において受信する対象特定情報D(A,P)は、本開示における第3の対象特定データの一例に相当し得る。
予測システム3は、第2の主体によって管理されるコンピュータ2から、第2の複数の対象Bについての対象特定情報D(B,P)を受付ける。第1の例において受信する対象特定情報D(B,P)は、本開示における第4の対象特定データの一例に相当し得る。
第1の例において、対象特定情報D(A,P)は、例えば、住所氏名a1から住所氏名a5までの5名の住所氏名を含んでいる。対象特定情報D(B,P)は、例えば、住所氏名b1から住所氏名b4までの4名の住所氏名を含んでいる。
図4Bは、図3に示される名寄せの処理において予測システム3が生成するデータの第1の例を示す。予測システム3は、図4Aに示される住所氏名を照合し、名寄せを行う。その結果、住所氏名a1と住所氏名b1とが一致し、住所氏名a2と住所氏名b2とが一致し、住所氏名a3と住所氏名b3とが一致したとする。住所氏名a4、住所氏名a5、及び住所氏名b4は、いずれも他の住所氏名と一致しなかったとする。
その場合、予測システム3は、住所氏名a1及び住所氏名b1で特定される対象に第1の共通ID(C001)を付与し、住所氏名a2及び住所氏名b2で特定される対象に第2の共通ID(C002)を付与し、住所氏名a3及び住所氏名b3で特定される対象に第3の共通ID(C003)を付与する。住所氏名a4、住所氏名a5、及び住所氏名b4の各々で特定される対象には、別々のID(C004〜C006)を付与する。
第1の複数の対象Aの各々について予測システム3が付与したID(C001〜C005)を、Dc(A,I)とする。Dc(A,I)は、第3の複数の対象A∩Bの各々について予測システム3が付与した共通ID(C001〜C003)と、第4の複数の対象A−A∩Bの各々について予測システム3が付与したID(C004、C005)とを含む。
第2の複数の対象Bの各々について予測システム3が付与したID(C001〜C003、C006)を、Dc(B,I)とする。Dc(B,I)は、第3の複数の対象A∩Bの各々について予測システム3が付与した共通ID(C001〜C003)と、第5の複数の対象B−A∩Bの各々について予測システム3が付与したID(C006)とを含む。
第3の複数の対象A∩Bの各々について付与した共通ID(C001〜C003)を、Dc(A∩B,I)とする。Dc(A∩B,I)は、本開示における第5の対象特定データの一例に相当し得る。
第4の複数の対象A−A∩Bの各々について付与したID(C004、C005)を、Dc(A−A∩B,I)とする。Dc(A−A∩B,I)は、本開示における第6の対象特定データの一例に相当し得る。
第5の複数の対象B−A∩Bの各々について付与したID(C006)を、Dc(B−A∩B,I)とする。Dc(B−A∩B,I)は、本開示における第7の対象特定データの一例に相当し得る。
名寄せ結果の送信は、以下のように行う。
予測システム3は、第1の複数の対象Aの各々について付与したDc(A,I)を、対象特定情報D(A,P)と対応付けて、第1の主体によって管理されるコンピュータ1に送信する。
予測システム3は、第2の複数の対象Bの各々について付与したDc(B,I)を、対象特定情報D(B,P)と対応付けて、第2の主体によって管理されるコンピュータ2に送信する。
第1の主体は、対象特定情報D(A,P)と対応付けて、Dc(A,I)を受信することになる。しかしながら、第1の主体は、第1の複数の対象Aの内のどれが第3の複数の対象A∩Bで、どれが第4の複数の対象A−A∩Bであるかを知ることができないようになっている。
第2の主体は、対象特定情報D(B,P)と対応付けて、Dc(B,I)を受信することになる。しかしながら、第2の主体は、第2の複数の対象Bの内のどれが第3の複数の対象A∩Bで、どれが第5の複数の対象B−A∩Bであるかを知ることができないようになっている。
第3の主体は、対象特定情報D(A,P)及び対象特定情報D(B,P)の両方を知ることになる。しかしながら、第3の主体は、名寄せの処理においては属性データD(A,E)及び評価データD(B,L)を知ることができない。このように、第3の主体が知り得る情報も、わずかで済むようになっている。
<4−2.第2の例>
図5Aは、図3に示される名寄せの処理のために予測システム3が受付けるデータの第2の例を示す。第2の例においては、名寄せのためのデータとして、電子メールアドレスが用いられる。電子メールアドレスは、表現が正規化されており、大文字と小文字の表記ゆれ以外には表記ゆれが許されていないため、名寄せの処理を行うためのユニークキーとなり得る。従って、名寄せのために、大文字と小文字の表記ゆれ以外の表記ゆれを考慮する必要はない。
このようなユニークキーがある場合にも、図4A及び図4Bを参照しながら説明した方法と同様の方法で名寄せの処理を行うことが可能である。さらに、ユニークキーがある場合には、以下のような処理を行うことにより、第3の主体が対象特定情報D(A,P)及び対象特定情報D(B,P)を知ることのないようにすることができる。
予測システム3は、第1の主体によって管理されるコンピュータ1から第3の複数のハッシュ値Hash2(D(A,P))を受付ける。第3の複数のハッシュ値Hash2(D(A,P))は、第1の複数の対象Aの電子メールアドレス(図2A参照)を、それぞれ第2のハッシュ関数Hash2でハッシュ化した値である。第2の例において受信する第3の複数のハッシュ値Hash2(D(A,P))は、本開示における第3の対象特定データの一例に相当し得る。
予測システム3は、第2の主体によって管理されるコンピュータ2から第4の複数のハッシュ値Hash2(D(B,P))を受付ける。第4の複数のハッシュ値Hash2(D(B,P))は、第2の複数の対象Bの電子メールアドレス(図2B参照)を、それぞれ上記第2のハッシュ関数Hash2でハッシュ化した値である。第2の例において受信する第4の複数のハッシュ値Hash2(D(B,P))は、本開示における第4の対象特定データの一例に相当し得る。
なお、第1のハッシュ関数、第1及び第2のハッシュ値については後述する。
図5Bは、図3に示される名寄せの処理において予測システム3が生成するデータの第2の例を示す。第2のハッシュ関数Hash2としては、異なる電子メールアドレスに対しては異なるハッシュ値が得られるように、1対1の写像を生成するハッシュ関数が選択されることが望ましい。これによれば、対象特定情報D(A,P)に含まれる電子メールアドレスの1つと、対象特定情報D(B,P)に含まれる電子メールアドレスの1つとが一致する場合、これらを同じ第2のハッシュ関数Hash2でハッシュ化した第3のハッシュ値Hash2(D(A,P))及び第4のハッシュ値Hash2(D(B,P))は互いに一致する。
また、第2のハッシュ関数Hash2としては、ハッシュ値に基づいて元の値を復元することが困難なハッシュ関数が選択されることが望ましい。
予測システム3は、第3の複数のハッシュ値Hash2(D(A,P))と第4の複数のハッシュ値Hash2(D(B,P))とを照合し、名寄せを行う。これにより、予測システム3は、第3の複数の対象A∩B、第4の複数の対象A−A∩B、及び第5の複数の対象B−A∩Bを特定することができる。
他の処理については、図4A及び図4Bを参照しながら説明したものと同様である。
第1の主体は、第3の複数のハッシュ値Hash2(D(A,P))と対応付けて、Dc(A,I)を受信することになる。しかしながら、第1の主体は、第1の複数の対象Aの内のどれが第3の複数の対象A∩Bで、どれが第4の複数の対象A−A∩Bであるかを知ることができないようになっている。
第2の主体は、第4の複数のハッシュ値Hash2(D(B,P))と対応付けて、Dc(B,I)を受信することになる。しかしながら、第2の主体は、第2の複数の対象Bの内のどれが第3の複数の対象A∩Bで、どれが第5の複数の対象B−A∩Bであるかを知ることができないようになっている。
第3の主体は、第3の複数のハッシュ値Hash2(D(A,P))及び第4の複数のハッシュ値Hash2(D(B,P))の両方を知ることになる。しかしながら、第3の主体は、これらのハッシュ値から対象特定情報D(A,P)及び対象特定情報D(B,P)を知ることができない。また、名寄せの処理においては属性データD(A,E)及び評価データD(B,L)を知ることもできない。
<5.S4−S6:カテゴリー分割ルールの生成>
図6Aは、図3に示されるカテゴリー分割ルールの生成の処理のために予測システム3が受付けるデータの例を示す。予測システム3は、第1の主体によって管理されるコンピュータ1から属性データD(A,E)を受付ける。
図6Bは、図3に示されるカテゴリー分割ルールの生成の処理において予測システム3が生成するデータの例を示す。予測システム3は、属性データに基づいて、カテゴリー分割ルールFcatを生成する。カテゴリー分割ルールFcatは、以下のように設定されることができる。
カテゴリーXaについては、男(Xa1)と女(Xa2)に分ける。
カテゴリーXbについては、20才代(Xb1)、30才代(Xb2)、40才代(Xb3)に分ける。
カテゴリーXcについては、有(Xc1)と無(Xc2)に分ける。
カテゴリーXdについては、0回以上(Xd1)、10回以上(Xd2)、100回以上(Xd3)に分ける。
予測システム3は、生成されたカテゴリー分割ルールFcatを、第1の主体によって管理されるコンピュータ1に送信する。
カテゴリー分割ルールの生成処理において、第3の主体は、属性データD(A,E)を知ることになる。しかしながら、第3の主体は、対象特定情報D(A,P)と属性データD(A,E)との対応関係を知ることができない。このように、第3の主体が知り得る情報は、わずかで済むようになっている。
カテゴリー分割ルールFcatの生成は、第1の主体が行ってもよい。カテゴリー分割ルールFcatの生成を第1の主体が行う場合には、第3の主体が属性データD(A,E)を知ることもなくなる。
但し、データ分布の偏りに応じて、適切なカテゴリー分割ルールが異なる場合がある。適切なカテゴリー分割ルールを生成できるような専門的知見を、第1の主体が有しない場合もあることを想定し、本開示ではカテゴリー分割ルールの生成を第3の主体が行う場合でも、第3の主体が知り得る情報がわずかで済むようにしている。
<6.S7:カテゴリー分割及びランダム化>
<6−1.カテゴリー分割>
図7Aは、図3に示されるカテゴリー分割の処理においてコンピュータ1に入力されるデータの例を示す。第1の主体は、対象特定情報D(A,P)と属性データD(A,E)とを対応付けた生データRDaを持っている(図2A参照)。また第1の主体は、名寄せの処理により、Dc(A,I)と対象特定情報D(A,P)との対応付けが可能となっている(図4B、図5B参照)。そこで、第1の主体は、対象特定情報D(A,P)をキーとして、Dc(A,I)と、属性データD(A,E)と、を対応付けて、コンピュータ1に入力する。
図7Bは、図3に示されるカテゴリー分割の処理においてコンピュータ1が生成するデータの例を示す。コンピュータ1は、属性データD(A,E)にカテゴリー分割ルールFcatを適用することにより、カテゴリー分割した属性データFcat[D(A,E)]を生成する。この処理のために、一般的に普及している表計算プログラムが用いられてもよいし、専用のプログラムが用いられてもよい。
<6−2.数値ランダム化>
図8Aは、図3に示されるランダム化の処理においてコンピュータ1に設定される第1のデータの例を示す。第1の主体は、コンピュータ1において数値ランダム化ルールTnr(j)を設定する。
数値ランダム化ルールTnr(j)は、カテゴリー分割ルールFcatで定義された上述のXa1、Xa2、Xb1、Xb2等に対し、ランダムに選ばれた数値を割り当てるルールである。図8Aに示される例においては、Xa1に数値5が割り当てられ、Xa2に数値8が割り当てられている。他のXb1、Xb2等に割り当てられた数値は図示の通りである。
図8Bは、図3に示されるランダム化の処理においてコンピュータ1が生成する第1のデータの例を示す。コンピュータ1は、図7Bに示されるカテゴリー分割した属性データFcat[D(A,E)]に、図8Aに示される数値ランダム化ルールTnr(j)を適用する。これにより、コンピュータ1は、図8Bに示される数値ランダム化した属性データTnr(j)(Fcat[D(A,E)])を生成する。この処理のために、一般的に普及している表計算プログラムが用いられてもよいし、専用のプログラムが用いられてもよい。
<6−3.列配置ランダム化>
図9Aは、図3に示されるランダム化の処理においてコンピュータ1に設定される第2のデータの例を示す。第1の主体は、コンピュータ1において列配置ランダム化ルールTcr(j)を設定する。
列配置ランダム化ルールTcr(j)は、属性データD(A,E)に含まれるカテゴリーXa、Xb等を、ランダムに並び替えるルールである。図9Aに示される例においては、カテゴリーXaは3番目のカテゴリーX3に割り当てられ、カテゴリーXbは1番目のカテゴリーX1に割り当てられ、カテゴリーXcは4番目のカテゴリーX4に割り当てられ、カテゴリーXdは2番目のカテゴリーX2に割り当てられている。
図9Bは、図3に示されるランダム化の処理においてコンピュータ1が生成する第2のデータの例を示す。コンピュータ1は、図8Bに示される数値ランダム化した属性データTnr(j)(Fcat[D(A,E)])に、図9Aに示される列配置ランダム化ルールTcr(j)を適用する。これにより、コンピュータ1は、図9Bに示される列配置ランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A,E)])を生成する。この処理のために、一般的に普及している表計算プログラムが用いられてもよいし、専用のプログラムが用いられてもよい。なお、数値ランダム化ルールTnr(j)及び列配置ランダム化ルールTcr(j)におけるjは、ルールを識別するための番号である。1回の解析において、教師データの生成時と予測用データの生成時とでは同一のjで特定される数値ランダム化ルールTnr(j)及び列配置ランダム化ルールTcr(j)が適用される。しかし、その次に解析を行うときには、別のjで特定される数値ランダム化ルールTnr(j)及び列配置ランダム化ルールTcr(j)が適用されてもよい。
<7.S8−S9:教師データ及び予測用データの生成>
<7−1.受付けるデータ>
図10Aは、図3に示される教師データ及び予測用データの生成処理のために予測システム3がコンピュータ1から受付けるデータの例を示す。
予測システム3は、第1の主体によって管理されるコンピュータ1から、第1のリストを受付ける。第1のリストは、第1の複数のハッシュ値Hash1(Dc(A,I))の各々と、列配置ランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A,E)])の各々と、が対応付けられたリストである。
第1の複数のハッシュ値Hash1(Dc(A,I))は、名寄せの処理においてコンピュータ1が受信したDc(A,I)を、第1のハッシュ関数Hash1でハッシュ化した値である。第1の複数のハッシュ値Hash1(Dc(A,I))は、本開示における第1の対象特定データの一例に相当し得る。また、第1のハッシュ関数Hash1は、本開示における第1のルールの一例に相当し得る。
図10Bは、図3に示される教師データ及び予測用データの生成処理のために予測システム3がコンピュータ2から受付けるデータの例を示す。
予測システム3は、第2の主体によって管理されるコンピュータ2から、第2のリストを受付ける。第2のリストは、第2の複数のハッシュ値Hash1(Dc(B,I))の各々と、評価データD(B,L)の各々と、が対応付けられたリストである。
第2の複数のハッシュ値Hash1(Dc(B,I))は、名寄せの処理においてコンピュータ2が受信したDc(B,I)を、上記第1のハッシュ関数Hash1でハッシュ化した値である。第2の複数のハッシュ値Hash1(Dc(B,I))は、本開示における第2の対象特定データの一例に相当し得る。
第1のハッシュ関数Hash1としては、Dc(A,I)及びDc(B,I)のうち異なるものに対しては異なるハッシュ値が得られるように、1対1の写像を生成するハッシュ関数が選択されることが望ましい。これによれば、Dc(A,I)及びDc(B,I)のうち、これらに共通するDc(A∩B,I)の各々については、第1のハッシュ値Hash1(Dc(A,I))及び第2のハッシュ値Hash1(Dc(B,I))は互いに一致する。
また、第1のハッシュ関数Hash1としては、ハッシュ値に基づいて元の値を復元することが困難なハッシュ関数が選択されることが望ましい。
上述のように第3の主体が名寄せの処理をした場合には、第3の主体がDc(A,I)及びDc(B,I)を知っていることになる。仮に、第3の主体が第1のハッシュ関数Hash1を知っている場合には、第3の主体は、既知のDc(A,I)及びDc(B,I)をハッシュ化することにより、第1の複数のハッシュ値Hash1(Dc(A,I))及び第2の複数のハッシュ値Hash1(Dc(B,I))を生成できることになる。その場合、第3の主体は、第1のリストに含まれる第1の複数のハッシュ値Hash1(Dc(A,I))及び第2のリストに含まれる第2の複数のハッシュ値Hash1(Dc(B,I))から、逆にDc(A,I)及びDc(B,I)を特定できてしまう。Dc(A,I)及びDc(B,I)を特定できてしまうと、名寄せに用いられたD(A,P)及びD(B,P)、或いは、Hash2(D(A,P))及びHash2(D(B,P))を特定できてしまう。そして、第1のリストに含まれる列配置ランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A,E)])との対応関係や、第2のリストに含まれる評価データD(B,L)との対応関係も特定できてしまう。このように、第3の主体が知り得る情報が増えてしまうのは、好ましいとは言えない。
そこで、上記第1のハッシュ関数Hash1は、第1の主体と第2の主体との間で予め取り決めた、第3の主体にとって不知のハッシュ関数であることが望ましい。
あるいは、第1のハッシュ値Hash1(Dc(A,I))及び第2のハッシュ値Hash1(Dc(B,I))は、Dc(A,I)及びDc(B,I)のそれぞれに文字列wを付加して、上記第2のハッシュ関数Hash2でハッシュ化した値であってもよい。文字列wは、第1の主体と第2の主体との間で予め取り決めた、第3の主体にとって不知である共通の文字列である。第3の主体が上記第2のハッシュ関数Hash2を知っている場合でも、第3の主体が文字列wを知らない限り、第1の複数のハッシュ値Hash1(Dc(A,I))及び第2の複数のハッシュ値Hash1(Dc(B,I))からDc(A,I)及びDc(B,I)を特定することは困難となる。
また、Dc(A,I)及びDc(B,I)が数値部分を有する場合に、その数値部分に、第3の主体にとって不知である共通の数値を加算してもよい。第1のハッシュ値Hash1(Dc(A,I))及び第2のハッシュ値Hash1(Dc(B,I))は、上記共通の数値が加算されたDc(A,I)及びDc(B,I)を、上記第2のハッシュ関数Hash2でハッシュ化した値であってもよい。
<7−2.教師データの生成>
予測システム3は、第1のリスト(図10A参照)に含まれる第1の複数のハッシュ値Hash1(Dc(A,I))と、第2のリスト(図10B参照)に含まれる第2の複数のハッシュ値Hash1(Dc(B,I))とを照合する。これにより、第3の複数の対象A∩Bと、第4の複数の対象A−A∩Bと、を特定する。
図11Aは、図3に示される教師データの生成処理において予測システム3が生成する教師データの例を示す。
予測システム3は、第3の複数の対象A∩Bについて、列配置ランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A∩B,E)])と、評価データD(A∩B,L)とを対応付けた教師データを生成する。
なお、第3の主体が、カテゴリー分割ルールFcatを生成する処理を行ったために属性データD(A,E)を知っていたとしても、列配置ランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A∩B,E)])から属性データD(A∩B,E)を再現することは困難となっている。従って、第3の主体は、第3の複数の対象A∩Bの具体的な属性を知ることが困難である。また、第2の複数の対象Bがどのような傾向を有するかを推定することも困難となっている。
<7−3.予測用データの生成>
図11Bは、図3に示される予測用データの生成処理において予測システム3が生成する予測用データの第1の例を示す。
予測システム3は、第4の複数の対象A−A∩Bについて、第1の複数のハッシュ値Hash1(Dc(A,I))と、列配置ランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A−A∩B,E)])とを抽出し、予測用データ(1)として生成する。
図11Cは、図3に示される予測用データの生成処理において予測システム3が生成する予測用データの第2の例を示す。
予測システム3は、第3の複数の対象A∩B及び第4の複数の対象A−A∩Bの両方について、第1の複数のハッシュ値Hash1(Dc(A,I))と、列配置ランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A,E)])とを抽出し、予測用データ(2)として生成する。
<8.S10:予測モデルの構築>
図12は、図3に示される予測モデルの構築の処理において予測システム3が生成するデータの例を示す。予測モデルの構築は、図11Aを参照しながら説明した教師データに基づいて行われる。予測モデルは、列配置ランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A∩B,E)])を変数xkとしたとき、関数f(xk)の値が評価データD(A∩B,L)と対応するような関数f(xk)として与えられる。
説明を単純化するため、関数f(xk)が以下の式で表されるものとする。
f(xk)=(p(X1)+p(X2)+p(X3)+p(X4))/4
p(X1)は、列配置ランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A∩B,E)])の内のカテゴリーX1に関して付与されるパラメータである。このパラメータの具体例が図12に示されており、例えば、p(X11)=0.9、p(X12)=0.3、p(X13)=0.8のように設定される。
p(X2)は、カテゴリーX2に関して付与されるパラメータである。p(X3)は、カテゴリーX3に関して付与されるパラメータである。p(X4)は、カテゴリーX4に関して付与されるパラメータである。これらのパラメータの具体例も図12に示されている。
適切なパラメータを付与することにより、関数f(xk)の値を評価データD(A∩B,L)に対応させることができる。例えば、第3の複数の対象A∩Bの内、評価データD(A∩B,L)が「○」である対象については、関数f(xk)の値が大きくなるようにパラメータが設定される。また、第3の複数の対象A∩Bの内、評価データD(A∩B,L)が「×」である対象については、関数f(xk)の値が小さくなるようにパラメータが設定される。
<9.S11−S12:予測結果の算出>
図13Aは、図3に示される予測結果の算出処理において予測システム3が生成するデータの第1の例を示す。予測システム3は、図11Bを参照しながら説明した予測用データ(1)を用いて、予測スコアを算出する。すなわち、予測システム3は、第4の複数の対象A−A∩Bについて、上述の関数f(xk)を予測スコアとして算出する。予測スコアの値は、所定事象の発生確率に対応する。例えば、予測スコアの値が大きいほど、所定事象の発生確率が大きいことを示す。予測システム3は、算出された予測スコアを、第1の複数のハッシュ値Hash1(Dc(A−A∩B,I))と対応付けて、第1の主体によって管理されるコンピュータ1に送信する。
第3の複数の対象A∩Bについては、既にコンピュータ2から評価データD(A∩B,L)が提供されている。従って、未知の事項を予測するという目的だけを考えた場合には、第3の複数の対象A∩Bについて予測スコアを算出する必要はない場合がある。
予測システム3は、第4の複数の対象A−A∩Bの内の予測スコアが高いものを抽出し、あるいは予測スコアが低いものを抽出して、コンピュータ1に送信するようにしてもよい。すなわち、予測スコアの使用目的を達するのであれば、算出された予測スコアのすべてを漏れなくコンピュータ1に送信する必要はない場合がある。
図13Bは、図3に示される予測結果の算出処理において予測システム3が生成するデータの第2の例を示す。予測システム3は、図11Cを参照しながら説明した予測用データ(2)を用いて、予測スコアを算出する。すなわち、予測システム3は、第3の複数の対象A∩B及び第4の複数の対象A−A∩Bの両方について、上述の関数f(xk)を算出する。予測システム3は、算出された予測スコアを、第1の複数のハッシュ値Hash1(Dc(A,I))と対応付けて、第1の主体によって管理されるコンピュータ1に送信する。
第3の複数の対象A∩Bについては、既にコンピュータ2から評価データD(A∩B,L)が提供されている。しかしながら、予測システム3が、第4の複数の対象A−A∩Bについてだけ、予測スコアをコンピュータ1に送信する場合には、第1の主体が、第1の複数の対象Aの内のどれが第3の複数の対象A∩Bであるかを知ることになってしまう。そこで、第2の主体が第3の複数の対象A∩Bを第1の主体に知られることを望まない場合には、予測システム3は、第3の複数の対象A∩B及び第4の複数の対象A−A∩Bの両方について、予測スコアをコンピュータ1に送信する。
<10.効果>
上述の処理によれば、第1の主体は、対象特定情報D(A,P)を第3の主体に開示する場合があり(S1)、属性データD(A,E)も第3の主体に開示する場合がある(S4、S8)。しかし、上述のように、対象特定情報D(A,P)と属性データD(A,E)との対応関係は第3の主体にもわからないようになっている。また、これらのデータは、いずれも第2の主体にはわからないようになっている。
また、第2の主体は、対象特定情報D(B,P)を第3の主体に開示する場合があり(S1)、評価データD(B,L)も第3の主体に開示する場合がある(S8)。しかし、上述のように、対象特定情報D(B,P)と評価データD(B,L)との対応関係は第3の主体にもわからないようになっている。また、これらのデータは、いずれも第1の主体にはわからないようになっている。
予測システム3は、第1の主体が持っている属性データD(A,E)と、第2の主体が持っている評価データD(B,L)とを組み合わせて、所定事象を予測することができる。このとき、情報を既に持っている者以外の者には、なるべく情報を知られないようにすることができる。
<11.その他>
第1の主体は、生データRDaの中に、第1の複数の対象Aとして架空の対象を加えておいてもよい。第2の主体は、生データRDbの中に、第2の複数の対象Bとして架空の対象を加えておいてもよい。これにより、第3の主体が第1の複数の対象Aの数及び第2の複数の対象Bの数も知らないようにすることができる。なお、このような架空の対象は、第3の複数の対象A∩Bの中に入ったり、教師データに加わったりすることはないと考えられる。従って、このような架空の対象が予測モデルに影響する可能性は低い。
第1の主体又は第2の主体の少なくとも一方が第3の複数の対象A∩Bを既に知っている場合には、S1からS3までの名寄せの処理は行わなくてもよい。この場合に、S8において第1の主体が第3の主体に送信する第1の対象特定データは、第1の主体によって識別可能なIDであり、S8において第2の主体が第3の主体に送信する第2の対象特定データは、第2の主体によって識別可能なIDであってもよい。
第1の主体が第3の複数の対象A∩Bを知っている場合に、第1の主体は、第1の複数の対象Aの内の第3の複数の対象A∩Bについて、第2の複数の対象Bとの対応関係を記述した対応データを作成してもよい。この対応データは、S8において第1の主体が第3の主体に送信する第1の対象特定データに含まれてもよい。これにより、第3の主体は、第1の対象特定データと第2の対象特定データとに基づいて、第3の複数の対象A∩Bを抽出することができる。
第2の主体が第3の複数の対象A∩Bを知っている場合に、第2の主体は、第2の複数の対象Bの内の第3の複数の対象A∩Bについて、第1の複数の対象Aとの対応関係を記述した対応データを作成してもよい。この対応データは、S8において第2の主体が第3の主体に送信する第2の対象特定データに含まれてもよい。これにより、第3の主体は、第1の対象特定データと第2の対象特定データとに基づいて、第3の複数の対象A∩Bを抽出することができる。
1…第1の主体によって管理されるコンピュータ、
2…第2の主体によって管理されるコンピュータ、
3…第3の主体によって管理される予測システム、
A…第1の複数の対象、
B…第2の複数の対象、
A∩B…第3の複数の対象、
A−A∩B…第4の複数の対象、
B−A∩B…第5の複数の対象、
D(A,P)…第1の複数の対象Aについての対象特定情報(第3の対象特定データの一例)、
D(B,P)…第2の複数の対象Bについての対象特定情報(第4の対象特定データの一例)、
D(A,E)…第1の複数の対象Aについての属性データ、
D(B,L)…第2の複数の対象Bについての評価データ、
Dc(A,I)…第1の複数の対象Aの各々について予測システム3が付与したID、
Dc(B,I)…第2の複数の対象Bの各々について予測システム3が付与したID、
Hash2(D(A,P))…第3の複数のハッシュ値(第3の対象特定データの一例)、
Hash2(D(B,P))…第4の複数のハッシュ値(第4の対象特定データの一例)、
Dc(A∩B,I)…第3の複数の対象A∩Bの各々について付与した共通ID(第5の対象特定データの一例)、
Dc(A−A∩B,I)…第4の複数の対象A−A∩Bの各々について付与したID(第6の対象特定データの一例)、
Dc(B−A∩B,I)…第5の複数の対象B−A∩Bの各々について付与したID(第7の対象特定データの一例)、
Fcat[D(A,E)]…カテゴリー分割した属性データ、
Tnr(j)(Fcat[D(A,E)])…数値ランダム化した属性データ、
Tcr(j)*Tnr(j)(Fcat[D(A,E)])…列配置ランダム化した属性データ(カテゴリー分割及びランダム化した属性データ)、
Hash1(Dc(A,I))…第1の複数のハッシュ値(第1の対象特定データの一例)、
Hash1(Dc(B,I))…第2の複数のハッシュ値(第2の対象特定データの一例)

Claims (5)

  1. 第1の複数の対象をそれぞれ特定する第1の対象特定データと、前記第1の複数の対象それぞれの属性を示す属性データと、を対応付けた第1のリストの入力を第1の主体から受付け、
    第2の複数の対象をそれぞれ特定する第2の対象特定データと、前記第2の複数の対象それぞれについての所定事象の評価値を示す評価データと、を対応付けた第2のリストの入力を第2の主体から受付ける
    第1のモジュールと、
    前記第1の対象特定データと前記第2の対象特定データとに基づいて、前記第1の複数の対象に含まれ且つ前記第2の複数の対象に含まれる第3の複数の対象を抽出する第2のモジュールと、
    前記第1のリストに含まれる前記第3の複数の対象それぞれの前記属性データと、前記第2のリストに含まれる前記第3の複数の対象それぞれについての前記評価データと、に基づいて、前記評価データが未知である対象について前記属性データから前記所定事象を予測するための関数のパラメータを算出する第3のモジュールと、
    前記第1の複数の対象に含まれ且つ前記第2の複数の対象に含まれない第4の複数の対象それぞれの前記属性データと、前記パラメータと、に基づいて、前記第4の複数の対象それぞれについての前記所定事象を予測する第4のモジュールと、
    を含む、予測システム。
  2. 請求項1に記載された予測システムであって、
    前記第1の複数の対象を前記第1の対象特定データと異なる形式でそれぞれ特定する第3の対象特定データの入力を前記第1の主体から受付け、
    前記第2の複数の対象を前記第2の対象特定データと異なる形式でそれぞれ特定する第4の対象特定データの入力を前記第2の主体から受付ける
    第5のモジュールと、
    前記第3の対象特定データと前記第4の対象特定データとに基づいて、
    前記第3の複数の対象を前記第3の対象特定データと異なる形式で且つ前記第4の対象特定データと異なる形式でそれぞれ特定する第5の対象特定データと、
    前記第4の複数の対象を前記第3の対象特定データと異なる形式でそれぞれ特定する第6の対象特定データと、
    前記第2の複数の対象に含まれ且つ前記第1の複数の対象に含まれない第5の複数の対象を前記第4の対象特定データと異なる形式でそれぞれ特定する第7の対象特定データと、
    を生成する第6のモジュールと、
    前記第5の対象特定データと、前記第6の対象特定データとを、前記第3の対象特定データと対応付けて前記第1の主体に送信し、
    前記第5の対象特定データと、前記第7の対象特定データとを、前記第4の対象特定データと対応付けて前記第2の主体に送信する
    第7のモジュールと、
    をさらに含み、
    前記第1のリストが、前記第5の対象特定データと前記第6の対象特定データとのそれぞれに基づいて第1のルールで生成された前記第1の対象特定データを含み、
    前記第2のリストが、前記第5の対象特定データと前記第7の対象特定データとのそれぞれに基づいて前記第1のルールで生成された前記第2の対象特定データを含む、
    予測システム。
  3. 請求項2に記載された予測システムであって、
    前記第1の対象特定データが、前記第5の対象特定データと前記第6の対象特定データとのそれぞれを第1のハッシュ関数で処理した第1の複数のハッシュ値を含み、
    前記第2の対象特定データが、前記第5の対象特定データと前記第7の対象特定データとのそれぞれを前記第1のハッシュ関数で処理した第2の複数のハッシュ値を含む、
    予測システム。
  4. 請求項3に記載された予測システムであって、
    前記第3の対象特定データは、前記第1の複数の対象それぞれを特定するための表現が正規化されたデータを第2のハッシュ関数で処理した第3の複数のハッシュ値を含み、
    前記第4の対象特定データは、前記第2の複数の対象それぞれを特定するための表現が正規化されたデータを前記第2のハッシュ関数で処理した第4の複数のハッシュ値を含む、
    予測システム。
  5. 請求項1に記載された予測システムであって、
    前記第4のモジュールが、前記第3の複数の対象及び前記第4の複数の対象それぞれの前記属性データと、前記パラメータと、に基づいて、前記第3の複数の対象及び前記第4の複数の対象それぞれについての前記所定事象を予測し、予測結果を前記第1の主体に送信する、
    予測システム。
JP2017516189A 2016-02-19 2016-02-19 予測システム Active JP6158464B1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/054935 WO2017141439A1 (ja) 2016-02-19 2016-02-19 予測システム

Publications (2)

Publication Number Publication Date
JP6158464B1 true JP6158464B1 (ja) 2017-07-05
JPWO2017141439A1 JPWO2017141439A1 (ja) 2018-02-22

Family

ID=59272900

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017516189A Active JP6158464B1 (ja) 2016-02-19 2016-02-19 予測システム

Country Status (2)

Country Link
JP (1) JP6158464B1 (ja)
WO (1) WO2017141439A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062970A (zh) * 2017-12-15 2018-05-22 泰康保险集团股份有限公司 药品推荐方法及装置
JP6934040B2 (ja) * 2019-12-27 2021-09-08 株式会社ビデオリサーチ 顧客推定装置及び顧客推定方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001216369A (ja) * 2000-01-31 2001-08-10 Sony Corp 商品購入データ処理システム及び商品購入データ処理方法
JP2015079331A (ja) * 2013-10-16 2015-04-23 カルチュア・コンビニエンス・クラブ株式会社 顧客データ分析・検証システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001216369A (ja) * 2000-01-31 2001-08-10 Sony Corp 商品購入データ処理システム及び商品購入データ処理方法
JP2015079331A (ja) * 2013-10-16 2015-04-23 カルチュア・コンビニエンス・クラブ株式会社 顧客データ分析・検証システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
伊藤 淳 外4名: "「TwitterとBlogの共通ユーザプロフィールを利用したTwitterユーザ属性推定」", 情報処理学会研究報告 2012(平成24)年度(5)[CD−ROM], JPN6017019635, 2013, pages 1 - 8, ISSN: 0003567803 *

Also Published As

Publication number Publication date
WO2017141439A1 (ja) 2017-08-24
JPWO2017141439A1 (ja) 2018-02-22

Similar Documents

Publication Publication Date Title
DeGregory et al. A review of machine learning in obesity
US11615288B2 (en) Secure broker-mediated data analysis and prediction
CN109036545B (zh) 医疗信息处理方法、装置、计算机设备和存储介质
Hussain et al. Predicting treatment outcome of drug-susceptible tuberculosis patients using machine-learning models
US9965519B2 (en) Document linkage and forwarding
Bean et al. Network analysis of patient flow in two UK acute care hospitals identifies key sub-networks for A&E performance
US20150081676A1 (en) Biological data structure having multi-lateral, multi-scalar, and multi-dimensional relationships between molecular features and other data
JPWO2020039871A1 (ja) 探索システムおよび探索方法
Lin et al. Feature selection with modified lion’s algorithms and support vector machine for high-dimensional data
Stark et al. Betterchoice: A migraine drug recommendation system based on neo4j
JP6158464B1 (ja) 予測システム
Komarova et al. Estimation of treatment effects from combined data: Identification versus data security
Pinol et al. Rare disease discovery: An optimized disease ranking system
Guo et al. Using electronic health records and claims data to identify high-risk patients likely to benefit from palliative care.
Saadat et al. Knowledge graph-based convolutional network coupled with sentiment analysis towards enhanced drug recommendation
Pearce et al. Polar diversion: using general practice data to calculate risk of emergency department presentation at the time of consultation
Shams et al. REM: An integrative rule extraction methodology for explainable data analysis in healthcare
Larabi-Marie-Sainte et al. Forecasting COVID19 parameters using time-series: KSA, USA, Spain, and Brazil comparative case study
JP2024041946A (ja) クラスタ解析方法、クラスタ解析システム、及びクラスタ解析プログラム
Gräßer et al. Application of recommender system methods for therapy decision support
US20110137670A1 (en) Methods, apparatuses, and computer program products for facilitating development and execution of a clinical care plan
Lai The social influence on the behavioral intention to use mobile electronic medical records
US20180285438A1 (en) Database system and method for identifying a subset of related reports
Valmianski et al. SmartTriage: A system for personalized patient data capture, documentation generation, and decision support
Yesha et al. A graph-based method for analyzing electronic medical records

Legal Events

Date Code Title Description
A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20170424

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20170509

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170607

R150 Certificate of patent or registration of utility model

Ref document number: 6158464

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350