JP6158464B1 - 予測システム - Google Patents
予測システム Download PDFInfo
- Publication number
- JP6158464B1 JP6158464B1 JP2017516189A JP2017516189A JP6158464B1 JP 6158464 B1 JP6158464 B1 JP 6158464B1 JP 2017516189 A JP2017516189 A JP 2017516189A JP 2017516189 A JP2017516189 A JP 2017516189A JP 6158464 B1 JP6158464 B1 JP 6158464B1
- Authority
- JP
- Japan
- Prior art keywords
- data
- target specifying
- objects
- specifying data
- targets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 claims abstract description 37
- 238000012545 processing Methods 0.000 claims description 19
- 230000014509 gene expression Effects 0.000 claims description 2
- 239000000284 extract Substances 0.000 abstract description 6
- 238000000034 method Methods 0.000 description 61
- 230000008569 process Effects 0.000 description 57
- 230000006870 function Effects 0.000 description 31
- 238000004519 manufacturing process Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 230000036541 health Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000007721 medicinal effect Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000001647 drug administration Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N99/00—Subject matter not provided for in other groups of this subclass
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Software Systems (AREA)
- Game Theory and Decision Science (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
第1の複数の対象をそれぞれ特定する第1の対象特定データと、前記第1の複数の対象それぞれの属性を示す属性データと、を対応付けた第1のリストの入力を第1の主体から受付け、
第2の複数の対象をそれぞれ特定する第2の対象特定データと、前記第2の複数の対象それぞれについての所定事象の評価値を示す評価データと、を対応付けた第2のリストの入力を第2の主体から受付ける
第1のモジュールと、
前記第1の対象特定データと前記第2の対象特定データとに基づいて、前記第1の複数の対象に含まれ且つ前記第2の複数の対象に含まれる第3の複数の対象を抽出する第2のモジュールと、
前記第1のリストに含まれる前記第3の複数の対象それぞれの前記属性データと、前記第2のリストに含まれる前記第3の複数の対象それぞれについての前記評価データと、に基づいて、前記評価データが未知である対象について前記属性データから前記所定事象を予測するための関数のパラメータを算出する第3のモジュールと、
前記第1の複数の対象に含まれ且つ前記第2の複数の対象に含まれない第4の複数の対象それぞれの前記属性データと、前記パラメータと、に基づいて、前記第4の複数の対象それぞれについての前記所定事象を予測する第4のモジュールと、
を含む。
図1に、本発明の実施形態に係る予測システム3と、予測システム3に接続される装置とを示す。予測システム3は、インターネット等のネットワークを介して、コンピュータ1及びコンピュータ2に対して接続されている。
コンピュータ1は、第1の主体によって管理される。以下の説明において、第1の主体を、A社、A機関などと称することがある。
コンピュータ2は、第1の主体とは異なる第2の主体によって管理される。以下の説明において、第2の主体を、B社、B病院などと称することがある。
予測システム3も、コンピュータで構成される。予測システム3は、第1の主体とも第2の主体とも異なる第3の主体によって管理される。以下の説明において、第3の主体を、C社と称することがある。
図2Aに、第1の主体が持っているデータの例を示す。
第1の主体は、第1の複数の対象Aについての生データRDaを持っている。生データRDaは、対象特定情報D(A,P)と、属性データD(A,E)と、を対応付けたものである。
対象特定情報D(A,P)は、第1の複数の対象Aの各々を特定するデータである。
属性データD(A,E)は、第1の複数の対象Aの各々の属性を示すデータである。
第2の主体は、第2の複数の対象Bについての生データRDbを持っている。生データRDbは、対象特定情報D(B,P)と、評価データD(B,L)と、を対応付けたものである。
対象特定情報D(B,P)は、第2の複数の対象Bの各々を特定するデータである。
評価データD(B,L)は、第2の複数の対象Bの各々についての所定事象の評価値を示すデータである。
対象特定情報D(B,P)は、第2の複数の対象Bの各々の電子メールアドレスでもよいし(図2B参照)、第2の複数の対象Bの各々の住所と氏名との組み合わせでもよい。対象特定情報D(B,P)は、個人を特定する情報であればよい。
図2Dに、図2A及び図2Bに示されるデータから生成可能な予測用データの例を示す。
(1)第1の複数の対象Aに含まれ、且つ第2の複数の対象Bに含まれる第3の複数の対象A∩Bを抽出し得る。図2Cに示されるように、第3の複数の対象A∩Bの各々について、属性データD(A∩B,E)と評価データD(A∩B,L)とを対応付けることもできる。
(2)第1の複数の対象Aに含まれ、且つ第2の複数の対象Bに含まれない第4の複数の対象A−A∩Bを抽出し得る。図2Dに示されるように、第4の複数の対象A−A∩Bの各々については、属性データD(A−A∩B,E)を抽出することもできる。但し、第4の複数の対象A−A∩Bについて、評価データは存在しない。
(3)第2の複数の対象Bに含まれ、且つ第1の複数の対象Aに含まれない第5の複数の対象B−A∩Bも抽出し得る。
この第1の形態において、第2の主体は、A社とは別の営利企業であるB社であり得る。第2の複数の対象Bは、B社の複数の顧客であり得る。評価データD(B,L)は、第2の複数の対象Bの各々がB社の特定商品を購入したか否かを示す情報であり得る(図2B参照)。
この予測モデルを、A社の複数の顧客に含まれ且つB社の複数の顧客に含まれない第4の複数の対象A−A∩Bの各々についての属性データD(A−A∩B,E)に適用する(図2D参照)。これにより、第4の複数の対象A−A∩Bの各々がB社の上記特定商品を購入しそうか否かを予測し得る。従って、A社はB社と提携し、A社の顧客の内の購入可能性の高い顧客のみを対象にしてB社の上記特定商品を勧めるようにすれば、A社及びB社の双方にとって新たなビジネスチャンスが生まれ得る。
この第2の形態において、第2の主体は、B病院であり得る。第2の複数の対象Bは、B病院の複数の患者であり得る。評価データD(B,L)は、第2の複数の対象Bそれぞれに対して特定薬品が薬効を有したか否かを示す情報であり得る(図2B参照)。
この予測モデルを、A機関の複数の加入者に含まれ且つB病院の複数の患者に含まれない第4の複数の対象A−A∩Bそれぞれについての属性データD(A−A∩B,E)に適用する(図2D参照)。これにより、第4の複数の対象A−A∩Bの各々に対して、上記特定薬品が薬効を有するか否かを予測し得る。従って、A機関は、A機関の加入者の内の薬効を有する可能性の高い加入者のみを対象にして上記特定薬品を勧めることができ、治療効果の向上及び健康の増進に寄与し得る。
例えば、上述の第3の複数の対象A∩Bを特定し、抽出するためには、対象特定情報D(A,P)と対象特定情報D(B,P)とを照合する作業が必要である。少なくともこの作業をする者は、対象特定情報D(A,P)と対象特定情報D(B,P)との両方を知ってしまうことになる。
また、例えば、上述の予測モデルを構築するためには、共通する第3の複数の対象A∩Bのそれぞれについて、属性データD(A∩B,E)と評価データD(A∩B,L)との組み合わせを教師データとして用いる必要がある。少なくとも予測モデルを構築する者は、属性データD(A∩B,E)と評価データD(A∩B,L)との組み合わせを知るだけでなく、第1の複数の対象Aに含まれ且つ第2の複数の対象Bに含まれる第3の複数の対象A∩Bがどれなのかも知ってしまう。
図3は、図1に示される予測システム3による処理手順を示すフローチャートである。
S1において、第3の主体によって管理される予測システム3は、第1の主体によって管理されるコンピュータ1から、対象特定情報D(A,P)を受付ける。予測システム3は、第2の主体によって管理されるコンピュータ2から、対象特定情報D(B,P)を受付ける。S1の処理を行うモジュールは、本開示の第5のモジュールに相当し得る。
S2において、予測システム3は、対象特定情報D(A,P)及び対象特定情報D(B,P)に基づいて名寄せの処理を行う。S2の処理を行うモジュールは、本開示の第6のモジュールに相当し得る。
S3において、予測システム3は、名寄せの結果を、それぞれコンピュータ1とコンピュータ2とに送信する。S3の処理を行うモジュールは、本開示の第7のモジュールに相当し得る。
S5において、予測システム3は、属性データD(A,E)に基づいて、カテゴリー分割ルールFcatを生成する。
S6において、予測システム3は、カテゴリー分割ルールFcatをコンピュータ1に送信する。
S7において、第1の主体が、コンピュータ1を用いて、属性データD(A,E)をカテゴリー分割及びランダム化する。カテゴリー分割及びランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A,E)])は、後述のように、属性が具体的にわからないように数値化されたデータである。以下の説明において、カテゴリー分割及びランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A,E)])のことを、列配置ランダム化した属性データと称することがある。
S9において、予測システム3は、S8で受付けたデータをマージして、教師データ及び予測用データを生成する。S9の処理を行うモジュールは、本開示の第2のモジュールに相当し得る。
S11において、予測システム3は、この予測モデルを予測用データに適用することによって、予測結果を算出する。S11の処理を行うモジュールは、本開示の第4のモジュールに相当し得る。
S12において、予測システム3は、予測結果をコンピュータ1に送信する。
以下、それぞれの処理について詳細に説明する。
<4−1.第1の例>
図4Aは、図3に示される名寄せの処理のために予測システム3が受付けるデータの第1の例を示す。第1の例においては、名寄せのためのデータとして、氏名と住所との組み合わせが用いられる。氏名同一の別人は存在し得るので氏名だけでは名寄せできないが、氏名と住所との組み合わせなら名寄せが可能である。但し、住所の表記にはしばしば表記ゆれがみられるので、表記ゆれを考慮して名寄せの処理をするのが望ましい。
予測システム3は、第2の主体によって管理されるコンピュータ2から、第2の複数の対象Bについての対象特定情報D(B,P)を受付ける。第1の例において受信する対象特定情報D(B,P)は、本開示における第4の対象特定データの一例に相当し得る。
第1の例において、対象特定情報D(A,P)は、例えば、住所氏名a1から住所氏名a5までの5名の住所氏名を含んでいる。対象特定情報D(B,P)は、例えば、住所氏名b1から住所氏名b4までの4名の住所氏名を含んでいる。
第2の複数の対象Bの各々について予測システム3が付与したID(C001〜C003、C006)を、Dc(B,I)とする。Dc(B,I)は、第3の複数の対象A∩Bの各々について予測システム3が付与した共通ID(C001〜C003)と、第5の複数の対象B−A∩Bの各々について予測システム3が付与したID(C006)とを含む。
第4の複数の対象A−A∩Bの各々について付与したID(C004、C005)を、Dc(A−A∩B,I)とする。Dc(A−A∩B,I)は、本開示における第6の対象特定データの一例に相当し得る。
第5の複数の対象B−A∩Bの各々について付与したID(C006)を、Dc(B−A∩B,I)とする。Dc(B−A∩B,I)は、本開示における第7の対象特定データの一例に相当し得る。
予測システム3は、第1の複数の対象Aの各々について付与したDc(A,I)を、対象特定情報D(A,P)と対応付けて、第1の主体によって管理されるコンピュータ1に送信する。
予測システム3は、第2の複数の対象Bの各々について付与したDc(B,I)を、対象特定情報D(B,P)と対応付けて、第2の主体によって管理されるコンピュータ2に送信する。
第2の主体は、対象特定情報D(B,P)と対応付けて、Dc(B,I)を受信することになる。しかしながら、第2の主体は、第2の複数の対象Bの内のどれが第3の複数の対象A∩Bで、どれが第5の複数の対象B−A∩Bであるかを知ることができないようになっている。
第3の主体は、対象特定情報D(A,P)及び対象特定情報D(B,P)の両方を知ることになる。しかしながら、第3の主体は、名寄せの処理においては属性データD(A,E)及び評価データD(B,L)を知ることができない。このように、第3の主体が知り得る情報も、わずかで済むようになっている。
図5Aは、図3に示される名寄せの処理のために予測システム3が受付けるデータの第2の例を示す。第2の例においては、名寄せのためのデータとして、電子メールアドレスが用いられる。電子メールアドレスは、表現が正規化されており、大文字と小文字の表記ゆれ以外には表記ゆれが許されていないため、名寄せの処理を行うためのユニークキーとなり得る。従って、名寄せのために、大文字と小文字の表記ゆれ以外の表記ゆれを考慮する必要はない。
予測システム3は、第2の主体によって管理されるコンピュータ2から第4の複数のハッシュ値Hash2(D(B,P))を受付ける。第4の複数のハッシュ値Hash2(D(B,P))は、第2の複数の対象Bの電子メールアドレス(図2B参照)を、それぞれ上記第2のハッシュ関数Hash2でハッシュ化した値である。第2の例において受信する第4の複数のハッシュ値Hash2(D(B,P))は、本開示における第4の対象特定データの一例に相当し得る。
なお、第1のハッシュ関数、第1及び第2のハッシュ値については後述する。
また、第2のハッシュ関数Hash2としては、ハッシュ値に基づいて元の値を復元することが困難なハッシュ関数が選択されることが望ましい。
他の処理については、図4A及び図4Bを参照しながら説明したものと同様である。
第2の主体は、第4の複数のハッシュ値Hash2(D(B,P))と対応付けて、Dc(B,I)を受信することになる。しかしながら、第2の主体は、第2の複数の対象Bの内のどれが第3の複数の対象A∩Bで、どれが第5の複数の対象B−A∩Bであるかを知ることができないようになっている。
第3の主体は、第3の複数のハッシュ値Hash2(D(A,P))及び第4の複数のハッシュ値Hash2(D(B,P))の両方を知ることになる。しかしながら、第3の主体は、これらのハッシュ値から対象特定情報D(A,P)及び対象特定情報D(B,P)を知ることができない。また、名寄せの処理においては属性データD(A,E)及び評価データD(B,L)を知ることもできない。
図6Aは、図3に示されるカテゴリー分割ルールの生成の処理のために予測システム3が受付けるデータの例を示す。予測システム3は、第1の主体によって管理されるコンピュータ1から属性データD(A,E)を受付ける。
カテゴリーXaについては、男(Xa1)と女(Xa2)に分ける。
カテゴリーXbについては、20才代(Xb1)、30才代(Xb2)、40才代(Xb3)に分ける。
カテゴリーXcについては、有(Xc1)と無(Xc2)に分ける。
カテゴリーXdについては、0回以上(Xd1)、10回以上(Xd2)、100回以上(Xd3)に分ける。
予測システム3は、生成されたカテゴリー分割ルールFcatを、第1の主体によって管理されるコンピュータ1に送信する。
但し、データ分布の偏りに応じて、適切なカテゴリー分割ルールが異なる場合がある。適切なカテゴリー分割ルールを生成できるような専門的知見を、第1の主体が有しない場合もあることを想定し、本開示ではカテゴリー分割ルールの生成を第3の主体が行う場合でも、第3の主体が知り得る情報がわずかで済むようにしている。
<6−1.カテゴリー分割>
図7Aは、図3に示されるカテゴリー分割の処理においてコンピュータ1に入力されるデータの例を示す。第1の主体は、対象特定情報D(A,P)と属性データD(A,E)とを対応付けた生データRDaを持っている(図2A参照)。また第1の主体は、名寄せの処理により、Dc(A,I)と対象特定情報D(A,P)との対応付けが可能となっている(図4B、図5B参照)。そこで、第1の主体は、対象特定情報D(A,P)をキーとして、Dc(A,I)と、属性データD(A,E)と、を対応付けて、コンピュータ1に入力する。
図8Aは、図3に示されるランダム化の処理においてコンピュータ1に設定される第1のデータの例を示す。第1の主体は、コンピュータ1において数値ランダム化ルールTnr(j)を設定する。
図9Aは、図3に示されるランダム化の処理においてコンピュータ1に設定される第2のデータの例を示す。第1の主体は、コンピュータ1において列配置ランダム化ルールTcr(j)を設定する。
<7−1.受付けるデータ>
図10Aは、図3に示される教師データ及び予測用データの生成処理のために予測システム3がコンピュータ1から受付けるデータの例を示す。
第1の複数のハッシュ値Hash1(Dc(A,I))は、名寄せの処理においてコンピュータ1が受信したDc(A,I)を、第1のハッシュ関数Hash1でハッシュ化した値である。第1の複数のハッシュ値Hash1(Dc(A,I))は、本開示における第1の対象特定データの一例に相当し得る。また、第1のハッシュ関数Hash1は、本開示における第1のルールの一例に相当し得る。
第2の複数のハッシュ値Hash1(Dc(B,I))は、名寄せの処理においてコンピュータ2が受信したDc(B,I)を、上記第1のハッシュ関数Hash1でハッシュ化した値である。第2の複数のハッシュ値Hash1(Dc(B,I))は、本開示における第2の対象特定データの一例に相当し得る。
また、第1のハッシュ関数Hash1としては、ハッシュ値に基づいて元の値を復元することが困難なハッシュ関数が選択されることが望ましい。
あるいは、第1のハッシュ値Hash1(Dc(A,I))及び第2のハッシュ値Hash1(Dc(B,I))は、Dc(A,I)及びDc(B,I)のそれぞれに文字列wを付加して、上記第2のハッシュ関数Hash2でハッシュ化した値であってもよい。文字列wは、第1の主体と第2の主体との間で予め取り決めた、第3の主体にとって不知である共通の文字列である。第3の主体が上記第2のハッシュ関数Hash2を知っている場合でも、第3の主体が文字列wを知らない限り、第1の複数のハッシュ値Hash1(Dc(A,I))及び第2の複数のハッシュ値Hash1(Dc(B,I))からDc(A,I)及びDc(B,I)を特定することは困難となる。
また、Dc(A,I)及びDc(B,I)が数値部分を有する場合に、その数値部分に、第3の主体にとって不知である共通の数値を加算してもよい。第1のハッシュ値Hash1(Dc(A,I))及び第2のハッシュ値Hash1(Dc(B,I))は、上記共通の数値が加算されたDc(A,I)及びDc(B,I)を、上記第2のハッシュ関数Hash2でハッシュ化した値であってもよい。
予測システム3は、第1のリスト(図10A参照)に含まれる第1の複数のハッシュ値Hash1(Dc(A,I))と、第2のリスト(図10B参照)に含まれる第2の複数のハッシュ値Hash1(Dc(B,I))とを照合する。これにより、第3の複数の対象A∩Bと、第4の複数の対象A−A∩Bと、を特定する。
予測システム3は、第3の複数の対象A∩Bについて、列配置ランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A∩B,E)])と、評価データD(A∩B,L)とを対応付けた教師データを生成する。
図11Bは、図3に示される予測用データの生成処理において予測システム3が生成する予測用データの第1の例を示す。
予測システム3は、第4の複数の対象A−A∩Bについて、第1の複数のハッシュ値Hash1(Dc(A,I))と、列配置ランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A−A∩B,E)])とを抽出し、予測用データ(1)として生成する。
予測システム3は、第3の複数の対象A∩B及び第4の複数の対象A−A∩Bの両方について、第1の複数のハッシュ値Hash1(Dc(A,I))と、列配置ランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A,E)])とを抽出し、予測用データ(2)として生成する。
図12は、図3に示される予測モデルの構築の処理において予測システム3が生成するデータの例を示す。予測モデルの構築は、図11Aを参照しながら説明した教師データに基づいて行われる。予測モデルは、列配置ランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A∩B,E)])を変数xkとしたとき、関数f(xk)の値が評価データD(A∩B,L)と対応するような関数f(xk)として与えられる。
f(xk)=(p(X1)+p(X2)+p(X3)+p(X4))/4
p(X1)は、列配置ランダム化した属性データTcr(j)*Tnr(j)(Fcat[D(A∩B,E)])の内のカテゴリーX1に関して付与されるパラメータである。このパラメータの具体例が図12に示されており、例えば、p(X11)=0.9、p(X12)=0.3、p(X13)=0.8のように設定される。
p(X2)は、カテゴリーX2に関して付与されるパラメータである。p(X3)は、カテゴリーX3に関して付与されるパラメータである。p(X4)は、カテゴリーX4に関して付与されるパラメータである。これらのパラメータの具体例も図12に示されている。
図13Aは、図3に示される予測結果の算出処理において予測システム3が生成するデータの第1の例を示す。予測システム3は、図11Bを参照しながら説明した予測用データ(1)を用いて、予測スコアを算出する。すなわち、予測システム3は、第4の複数の対象A−A∩Bについて、上述の関数f(xk)を予測スコアとして算出する。予測スコアの値は、所定事象の発生確率に対応する。例えば、予測スコアの値が大きいほど、所定事象の発生確率が大きいことを示す。予測システム3は、算出された予測スコアを、第1の複数のハッシュ値Hash1(Dc(A−A∩B,I))と対応付けて、第1の主体によって管理されるコンピュータ1に送信する。
上述の処理によれば、第1の主体は、対象特定情報D(A,P)を第3の主体に開示する場合があり(S1)、属性データD(A,E)も第3の主体に開示する場合がある(S4、S8)。しかし、上述のように、対象特定情報D(A,P)と属性データD(A,E)との対応関係は第3の主体にもわからないようになっている。また、これらのデータは、いずれも第2の主体にはわからないようになっている。
第1の主体は、生データRDaの中に、第1の複数の対象Aとして架空の対象を加えておいてもよい。第2の主体は、生データRDbの中に、第2の複数の対象Bとして架空の対象を加えておいてもよい。これにより、第3の主体が第1の複数の対象Aの数及び第2の複数の対象Bの数も知らないようにすることができる。なお、このような架空の対象は、第3の複数の対象A∩Bの中に入ったり、教師データに加わったりすることはないと考えられる。従って、このような架空の対象が予測モデルに影響する可能性は低い。
第1の主体が第3の複数の対象A∩Bを知っている場合に、第1の主体は、第1の複数の対象Aの内の第3の複数の対象A∩Bについて、第2の複数の対象Bとの対応関係を記述した対応データを作成してもよい。この対応データは、S8において第1の主体が第3の主体に送信する第1の対象特定データに含まれてもよい。これにより、第3の主体は、第1の対象特定データと第2の対象特定データとに基づいて、第3の複数の対象A∩Bを抽出することができる。
第2の主体が第3の複数の対象A∩Bを知っている場合に、第2の主体は、第2の複数の対象Bの内の第3の複数の対象A∩Bについて、第1の複数の対象Aとの対応関係を記述した対応データを作成してもよい。この対応データは、S8において第2の主体が第3の主体に送信する第2の対象特定データに含まれてもよい。これにより、第3の主体は、第1の対象特定データと第2の対象特定データとに基づいて、第3の複数の対象A∩Bを抽出することができる。
2…第2の主体によって管理されるコンピュータ、
3…第3の主体によって管理される予測システム、
A…第1の複数の対象、
B…第2の複数の対象、
A∩B…第3の複数の対象、
A−A∩B…第4の複数の対象、
B−A∩B…第5の複数の対象、
D(A,P)…第1の複数の対象Aについての対象特定情報(第3の対象特定データの一例)、
D(B,P)…第2の複数の対象Bについての対象特定情報(第4の対象特定データの一例)、
D(A,E)…第1の複数の対象Aについての属性データ、
D(B,L)…第2の複数の対象Bについての評価データ、
Dc(A,I)…第1の複数の対象Aの各々について予測システム3が付与したID、
Dc(B,I)…第2の複数の対象Bの各々について予測システム3が付与したID、
Hash2(D(A,P))…第3の複数のハッシュ値(第3の対象特定データの一例)、
Hash2(D(B,P))…第4の複数のハッシュ値(第4の対象特定データの一例)、
Dc(A∩B,I)…第3の複数の対象A∩Bの各々について付与した共通ID(第5の対象特定データの一例)、
Dc(A−A∩B,I)…第4の複数の対象A−A∩Bの各々について付与したID(第6の対象特定データの一例)、
Dc(B−A∩B,I)…第5の複数の対象B−A∩Bの各々について付与したID(第7の対象特定データの一例)、
Fcat[D(A,E)]…カテゴリー分割した属性データ、
Tnr(j)(Fcat[D(A,E)])…数値ランダム化した属性データ、
Tcr(j)*Tnr(j)(Fcat[D(A,E)])…列配置ランダム化した属性データ(カテゴリー分割及びランダム化した属性データ)、
Hash1(Dc(A,I))…第1の複数のハッシュ値(第1の対象特定データの一例)、
Hash1(Dc(B,I))…第2の複数のハッシュ値(第2の対象特定データの一例)
Claims (5)
- 第1の複数の対象をそれぞれ特定する第1の対象特定データと、前記第1の複数の対象それぞれの属性を示す属性データと、を対応付けた第1のリストの入力を第1の主体から受付け、
第2の複数の対象をそれぞれ特定する第2の対象特定データと、前記第2の複数の対象それぞれについての所定事象の評価値を示す評価データと、を対応付けた第2のリストの入力を第2の主体から受付ける
第1のモジュールと、
前記第1の対象特定データと前記第2の対象特定データとに基づいて、前記第1の複数の対象に含まれ且つ前記第2の複数の対象に含まれる第3の複数の対象を抽出する第2のモジュールと、
前記第1のリストに含まれる前記第3の複数の対象それぞれの前記属性データと、前記第2のリストに含まれる前記第3の複数の対象それぞれについての前記評価データと、に基づいて、前記評価データが未知である対象について前記属性データから前記所定事象を予測するための関数のパラメータを算出する第3のモジュールと、
前記第1の複数の対象に含まれ且つ前記第2の複数の対象に含まれない第4の複数の対象それぞれの前記属性データと、前記パラメータと、に基づいて、前記第4の複数の対象それぞれについての前記所定事象を予測する第4のモジュールと、
を含む、予測システム。 - 請求項1に記載された予測システムであって、
前記第1の複数の対象を前記第1の対象特定データと異なる形式でそれぞれ特定する第3の対象特定データの入力を前記第1の主体から受付け、
前記第2の複数の対象を前記第2の対象特定データと異なる形式でそれぞれ特定する第4の対象特定データの入力を前記第2の主体から受付ける
第5のモジュールと、
前記第3の対象特定データと前記第4の対象特定データとに基づいて、
前記第3の複数の対象を前記第3の対象特定データと異なる形式で且つ前記第4の対象特定データと異なる形式でそれぞれ特定する第5の対象特定データと、
前記第4の複数の対象を前記第3の対象特定データと異なる形式でそれぞれ特定する第6の対象特定データと、
前記第2の複数の対象に含まれ且つ前記第1の複数の対象に含まれない第5の複数の対象を前記第4の対象特定データと異なる形式でそれぞれ特定する第7の対象特定データと、
を生成する第6のモジュールと、
前記第5の対象特定データと、前記第6の対象特定データとを、前記第3の対象特定データと対応付けて前記第1の主体に送信し、
前記第5の対象特定データと、前記第7の対象特定データとを、前記第4の対象特定データと対応付けて前記第2の主体に送信する
第7のモジュールと、
をさらに含み、
前記第1のリストが、前記第5の対象特定データと前記第6の対象特定データとのそれぞれに基づいて第1のルールで生成された前記第1の対象特定データを含み、
前記第2のリストが、前記第5の対象特定データと前記第7の対象特定データとのそれぞれに基づいて前記第1のルールで生成された前記第2の対象特定データを含む、
予測システム。 - 請求項2に記載された予測システムであって、
前記第1の対象特定データが、前記第5の対象特定データと前記第6の対象特定データとのそれぞれを第1のハッシュ関数で処理した第1の複数のハッシュ値を含み、
前記第2の対象特定データが、前記第5の対象特定データと前記第7の対象特定データとのそれぞれを前記第1のハッシュ関数で処理した第2の複数のハッシュ値を含む、
予測システム。 - 請求項3に記載された予測システムであって、
前記第3の対象特定データは、前記第1の複数の対象それぞれを特定するための表現が正規化されたデータを第2のハッシュ関数で処理した第3の複数のハッシュ値を含み、
前記第4の対象特定データは、前記第2の複数の対象それぞれを特定するための表現が正規化されたデータを前記第2のハッシュ関数で処理した第4の複数のハッシュ値を含む、
予測システム。 - 請求項1に記載された予測システムであって、
前記第4のモジュールが、前記第3の複数の対象及び前記第4の複数の対象それぞれの前記属性データと、前記パラメータと、に基づいて、前記第3の複数の対象及び前記第4の複数の対象それぞれについての前記所定事象を予測し、予測結果を前記第1の主体に送信する、
予測システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2016/054935 WO2017141439A1 (ja) | 2016-02-19 | 2016-02-19 | 予測システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6158464B1 true JP6158464B1 (ja) | 2017-07-05 |
JPWO2017141439A1 JPWO2017141439A1 (ja) | 2018-02-22 |
Family
ID=59272900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017516189A Active JP6158464B1 (ja) | 2016-02-19 | 2016-02-19 | 予測システム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6158464B1 (ja) |
WO (1) | WO2017141439A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108062970A (zh) * | 2017-12-15 | 2018-05-22 | 泰康保险集团股份有限公司 | 药品推荐方法及装置 |
JP6934040B2 (ja) * | 2019-12-27 | 2021-09-08 | 株式会社ビデオリサーチ | 顧客推定装置及び顧客推定方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001216369A (ja) * | 2000-01-31 | 2001-08-10 | Sony Corp | 商品購入データ処理システム及び商品購入データ処理方法 |
JP2015079331A (ja) * | 2013-10-16 | 2015-04-23 | カルチュア・コンビニエンス・クラブ株式会社 | 顧客データ分析・検証システム |
-
2016
- 2016-02-19 JP JP2017516189A patent/JP6158464B1/ja active Active
- 2016-02-19 WO PCT/JP2016/054935 patent/WO2017141439A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001216369A (ja) * | 2000-01-31 | 2001-08-10 | Sony Corp | 商品購入データ処理システム及び商品購入データ処理方法 |
JP2015079331A (ja) * | 2013-10-16 | 2015-04-23 | カルチュア・コンビニエンス・クラブ株式会社 | 顧客データ分析・検証システム |
Non-Patent Citations (1)
Title |
---|
伊藤 淳 外4名: "「TwitterとBlogの共通ユーザプロフィールを利用したTwitterユーザ属性推定」", 情報処理学会研究報告 2012(平成24)年度(5)[CD−ROM], JPN6017019635, 2013, pages 1 - 8, ISSN: 0003567803 * |
Also Published As
Publication number | Publication date |
---|---|
WO2017141439A1 (ja) | 2017-08-24 |
JPWO2017141439A1 (ja) | 2018-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DeGregory et al. | A review of machine learning in obesity | |
US11615288B2 (en) | Secure broker-mediated data analysis and prediction | |
CN109036545B (zh) | 医疗信息处理方法、装置、计算机设备和存储介质 | |
Hussain et al. | Predicting treatment outcome of drug-susceptible tuberculosis patients using machine-learning models | |
US9965519B2 (en) | Document linkage and forwarding | |
Bean et al. | Network analysis of patient flow in two UK acute care hospitals identifies key sub-networks for A&E performance | |
US20150081676A1 (en) | Biological data structure having multi-lateral, multi-scalar, and multi-dimensional relationships between molecular features and other data | |
JPWO2020039871A1 (ja) | 探索システムおよび探索方法 | |
Lin et al. | Feature selection with modified lion’s algorithms and support vector machine for high-dimensional data | |
Stark et al. | Betterchoice: A migraine drug recommendation system based on neo4j | |
JP6158464B1 (ja) | 予測システム | |
Komarova et al. | Estimation of treatment effects from combined data: Identification versus data security | |
Pinol et al. | Rare disease discovery: An optimized disease ranking system | |
Guo et al. | Using electronic health records and claims data to identify high-risk patients likely to benefit from palliative care. | |
Saadat et al. | Knowledge graph-based convolutional network coupled with sentiment analysis towards enhanced drug recommendation | |
Pearce et al. | Polar diversion: using general practice data to calculate risk of emergency department presentation at the time of consultation | |
Shams et al. | REM: An integrative rule extraction methodology for explainable data analysis in healthcare | |
Larabi-Marie-Sainte et al. | Forecasting COVID19 parameters using time-series: KSA, USA, Spain, and Brazil comparative case study | |
JP2024041946A (ja) | クラスタ解析方法、クラスタ解析システム、及びクラスタ解析プログラム | |
Gräßer et al. | Application of recommender system methods for therapy decision support | |
US20110137670A1 (en) | Methods, apparatuses, and computer program products for facilitating development and execution of a clinical care plan | |
Lai | The social influence on the behavioral intention to use mobile electronic medical records | |
US20180285438A1 (en) | Database system and method for identifying a subset of related reports | |
Valmianski et al. | SmartTriage: A system for personalized patient data capture, documentation generation, and decision support | |
Yesha et al. | A graph-based method for analyzing electronic medical records |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20170424 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20170509 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170606 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170607 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6158464 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |