WO2023119578A1

WO2023119578A1 - 情報処理システム、情報処理方法及びプログラム

Info

Publication number: WO2023119578A1
Application number: PCT/JP2021/047950
Authority: WO
Inventors: 勇宇平手; マノゥチコンダパカ; サティアンアブロール
Original assignee: 楽天グループ株式会社
Priority date: 2021-12-23
Filing date: 2021-12-23
Publication date: 2023-06-29
Also published as: TW202341054A; JP7345689B1; JPWO2023119578A1

Abstract

ユーザの属する世帯の状況をより詳細に把握する。　情報処理システム（１）に含まれる世帯特定手段（３３）は、それぞれ同居する１または複数のユーザを含む第１の世帯および第２の世帯を示す世帯情報を取得し、前記情報処理システム１に含まれる世帯関係推定手段（３８）は、前記第１の世帯に属するユーザの属性と前記第２世帯に属するユーザの属性とに基づいて、前記第１の世帯と、前記第２の世帯との関係性の種類を推定する。

Description

情報処理システム、情報処理方法及びプログラム

　本発明は、情報処理システム、情報処理方法及びプログラムに関する。

　何らかの方法で収集された情報から、各ユーザに配偶者や子どもがいるか推定する技術がある。

　特開２０１９－０８７２１２号公報には、金融取引サービスにおいて、取引情報に基づいてユーザの家族構成に関する情報を特定することが開示されている（第００４８段落および第００９９段落参照）。

　特開２０２１－１４４４５１号公報には、ユーザの収入額および支出額を特定し、それらとユーザの家族構成とに基づいて負債の補償の内容を決定する情報処理装置が開示されている（第００３８段落参照）。

　これまでは単にユーザの属性として配偶者や子どもの有無を推定しているに過ぎず、そのユーザの属する世帯の状況、例えばそのユーザの属する世帯の詳細については十分に把握できていなかった。

　本発明は上記課題を鑑みてなされたものであって、その目的は、ユーザの属する世帯の状況をより詳細に把握することを可能にする技術を提供することにある。

　本発明にかかる情報処理システムは、それぞれ同居する１または複数のユーザを含む第１の世帯および第２の世帯を示す世帯情報を取得する世帯特定手段と、前記第１の世帯に属するユーザの属性と前記第２の世帯に属するユーザの属性とに基づいて、前記第１の世帯と、前記第２の世帯との関係性の種類を推定する世帯関係推定手段と、を含む。

　本発明にかかる情報処理方法は、それぞれ同居する１または複数のユーザを含む第１の世帯および第２の世帯を取得するステップと、前記第１の世帯に属するユーザの属性と前記第２の世帯に属するユーザの属性とに基づいて、前記第１の世帯と、前記第２の世帯との関係性の種類を推定するステップと、を含む。

　本発明にかかるプログラムは、それぞれ同居する１または複数のユーザを含む第１の世帯および第２の世帯を示す世帯情報を取得する世帯特定手段、および、前記第１の世帯に属するユーザの属性と前記第２の世帯に属するユーザの属性とに基づいて、前記第１の世帯と、前記第２の世帯との関係性の種類を推定する世帯関係推定手段、としてコンピュータを機能させる。

　本発明の一態様では、前記世帯特定手段は、ユーザデータベースに格納される複数のユーザの名字および住所に基づいて、前記複数のユーザからそれぞれ同居する１または複数のユーザを含む第１の世帯および第２の世帯を取得してよい。

　本発明の一態様では、前記世帯関係推定手段は、前記第１の世帯に含まれる第１のユーザと前記第２の世帯に含まれる第２のユーザとの関係性の種類に関する複数のパラメータに基づいて、前記第１の世帯と、前記第２の世帯との関係性の種類を推定してよい。

　本発明の一態様では、前記複数のパラメータは、名字の同一性、電話連絡の頻度、特定の日に関するギフトの有無、互いのギフトの頻度、年齢差、共通の友人、性が同じか否か、住所の類似性のうち少なくとも一部を含んでよい。

　本発明の一態様では、前記世帯関係推定手段は、前記第１の世帯に含まれる第１のユーザと、前記第２の世帯に含まれる第２のユーザとの関係性の種類が、親子、きょうだい、隣人の少なくとも一部のうちいずれであるか否かに応じた、前記第１の世帯と前記第２の世帯との関係性の種類を推定してよい。

　本発明によれば、ユーザの属する世帯の状況をより詳細に把握することができる。

本発明の一実施形態に係る情報処理システムの全体構成の一例を示す図である。本発明の一実施形態に係る情報処理システムの機能の一例を示す機能ブロック図である。ＩＰアドレスデータの値が共通していることの一例を模式的に示す図である。グラフデータの一例を示す図である。住所データの値が共通していることの一例を模式的に示す図である。グラフデータの一例を示す図である。クレジットカード番号データの値が共通していることの一例を模式的に示す図である。グラフデータの一例を示す図である。グラフデータの一例を示す図である。クラスタの一例を示す図である。分類の可視化の一例を示す図である。本発明の一実施形態に係る情報処理システムで行われる、ソーシャルグラフの作成にかかる処理の一例を示すフロー図である。世帯内のユーザの家族関係の特定にかかわる処理の一例を示すフロー図である。存否特定部で用いる機械学習モデルの一例を説明する図である。家族特定部、年齢推定部、関係記録部の処理の一例を示すフロー図である。世帯内のユーザ等の関係を説明する図である。世帯メンバテーブルに格納される情報の一例を示す図である。ユーザ関係テーブルに格納される情報の一例を示す図である。メンバ属性テーブルに格納される情報の一例を示す図である。世帯間の関係の推定にかかる処理の一例を示すフロー図である。世帯間の関係の一例を説明する図である。ユーザ関係特定部の機能的な構成の一例を示す機能ブロック図である。

　以下、本発明の一実施形態について図面に基づき詳細に説明する。この実施形態では、ユーザに関する情報から、それぞれ１または複数のユーザを含む複数の世帯を特定し、その特定された世帯に関するより詳細な情報を推定する情報処理システム１について説明する。

　図１は、本発明の一実施形態に係る情報処理システム１の全体構成の一例を示す図である。図１に示すように、本実施形態に係る情報処理システム１は、例えば、サーバコンピュータやパーソナルコンピュータなどのコンピュータであり、プロセッサ１０、記憶部１２、通信部１４、操作部１６、及び、出力部１８を含む。なお、本実施形態に係る情報処理システム１に、複数台のコンピュータが含まれていてもよい。

　プロセッサ１０は、例えば、情報処理システム１にインストールされるプログラムに従って動作するマイクロプロセッサ等のプログラム制御デバイスである。情報処理システム１は、１または複数のプロセッサ１０を含んでよい。記憶部１２は、例えばＲＯＭやＲＡＭ等の記憶素子や、ハードディスクドライブ（ＨＤＤ）、フラッシュメモリを含むソリッドステートドライブ（ＳＳＤ）などである。記憶部１２には、プロセッサ１０によって実行されるプログラムなどが記憶される。通信部１４は、例えばネットワークインタフェースカードのような、有線通信又は無線通信用の通信インタフェースであり、インターネット等のコンピュータネットワークを介して、他のコンピュータや端末との間でデータを授受する。

　操作部１６は、入力デバイスであり、例えば、タッチパネルやマウス等のポインティングデバイスやキーボード等を含む。操作部１６は、操作内容をプロセッサ１０に伝達する。出力部１８は、例えば、液晶表示部又は有機ＥＬ表示部等のディスプレイや、スピーカ等の音声出力デバイス等の出力デバイスである。

　なお、記憶部１２に記憶されるものとして説明するプログラム及びデータは、ネットワークを介して他のコンピュータから供給されるようにしてもよい。また、情報処理システム１のハードウェア構成は、上記の例に限られず、種々のハードウェアを適用可能である。例えば、情報処理システム１に、コンピュータ読み取り可能な情報記憶媒体を読み取る読取部（例えば、光ディスクドライブやメモリカードスロット）や外部機器とデータの入出力をするための入出力部（例えば、ＵＳＢポート）が含まれていてもよい。例えば、情報記憶媒体に記憶されたプログラムやデータが読取部や入出力部を介して情報処理システム１に供給されるようにしてもよい。

　本実施形態に係る情報処理システム１は、複数のユーザを含む世帯を特定する。情報処理システム１は、世帯内の状況をより詳細に取得する処理と、世帯間の関係を特定する処理とを実行する。前者の処理として、情報処理システム１は、ユーザ間の関係性の種類を特定し、ユーザに関する情報からそのユーザが配偶者、子どもなどを含むか否か推定し、世帯内にその推定された配偶者、子どもなどに対応するユーザが居るかチェックし、いない場合には新たなユーザを登録する。前者の処理のために、情報処理システム１はその処理の対象となるユーザ（以下では注目人物とも記載する）と、そのユーザと関係を有するユーザ（以下では参照人物とも記載する）との関係性の種類を利用する。

　以下、本実施形態に係る情報処理システム１の機能、及び、情報処理システム１で実行される処理についてさらに説明する。

　図２は、本実施形態に係る情報処理システム１で実装される機能の一例を示す機能ブロック図である。なお、本実施形態に係る情報処理システム１に、図２に示す機能のすべてが実装される必要はなく、また、図２に示す機能以外の機能が実装されていても構わない。

　図２に示すように、本実施形態に係る情報処理システム１は、機能的に、ユーザ関係特定部３０、存否特定部３２、世帯特定部３３、家族特定部３４、年齢推定部３５、関係記録部３６、世帯関係推定部３８を含む。

　ユーザ関係特定部３０は、主にプロセッサ１０、記憶部１２および通信部１４により実装される。存否特定部３２、世帯特定部３３、家族特定部３４、年齢推定部３５、関係記録部３６、世帯関係推定部３８は、主にプロセッサ１０及び記憶部１２により実装される。

　以上の機能は、コンピュータである情報処理システム１にインストールされた、以上の機能に対応する実行命令を含むプログラムをプロセッサ１０で実行することにより実装されてよい。また、このプログラムは、例えば、光学的ディスク、磁気ディスク、フラッシュメモリ等のコンピュータ読み取り可能な情報記憶媒体を介して、あるいは、インターネットなどを介して情報処理システム１に供給されてもよい。

　ユーザ関係特定部３０は、主に、ユーザのペアにおけるユーザ間の関係性の種類を示す関係情報を特定する。ユーザ関係特定部３０は、ペアに含まれるユーザと関連付けられた、名字、ＩＰアドレス、住所、年齢差、および性別のうちの少なくとも１つに基づいて、関係情報を出力してよい。なお、ユーザ関係特定部３０は、情報処理システム１の外で作成された関係情報を取得してもよい。ここで、ユーザ関係特定部３０は、関係特定部とも呼称され得る。

　存否特定部３２は、対象ユーザと関連付けて格納される情報であって他のユーザと関連付けずに格納される情報に基づいて、対象ユーザの配偶者、子ども、または、親の存否を示す存否情報を取得する。また存否特定部３２は、機械学習モデルに対象ユーザに関する入力パラメータの値を入力した際の出力に基づいて、対象ユーザの配偶者、対象ユーザの子ども、または、対象ユーザの親の存否を推定し、推定結果を示す存否情報を取得する。入力パラメータはユーザに関するあらかじめ定められた情報の項目であり、その機械学習モデルはその入力パラメータの値を含む学習データにより学習されてよい。

　世帯特定部３３は、それぞれ同居する１または複数のユーザを含む１または複数の世帯を示す世帯情報を取得する。ここで、この１または複数の世帯の少なくとも１つは、対象ユーザおよび１または複数の家族ユーザを含んでよい。世帯特定部３３は、ユーザデータベースに登録された複数のユーザから、対象ユーザを含む世帯に含まれその対象ユーザと同居する１または複数の家族ユーザを特定してよい。

　家族特定部３４は、関係情報に基づいて、世帯情報が示す世帯に含まれる家族ユーザから、配偶者、子ども、および親のうち存否情報が存在を示す家族ユーザを特定する。

　年齢推定部３５は、対象ユーザに関する情報に基づいて、対象ユーザにおいて存在が推定された配偶者、子ども、または親のうち、対応する家族ユーザが特定されなかった配偶者、子ども、または、親の年齢を推定する。なお、さらに、年齢推定部３５は、存在が推定された配偶者、子ども、または、親に対応するユーザが特定され、かつ、そのユーザの年齢が登録されていない場合に、そのユーザを年齢推定の対象としてもよい。このとき、年齢推定部３５は、推定された年齢をその対応するユーザに係る情報として記憶させてもよいし、推定された年齢はその他の処理に利用されてもよい。

　関係記録部３６は、対象ユーザの、存在が推定された配偶者、子ども、および／または親のうち、対応する家族ユーザが特定されなかった配偶者、子ども、または、親を、世帯に属する新たな関連ユーザとして、関連ユーザと対象ユーザとの関係性の種類を示す関係情報に関連付けて記憶部１２に記憶させる。

　世帯関係推定部３８は、第１の世帯に属するユーザの属性と第２世帯に属するユーザの属性とに基づいて、第１の世帯と、第２の世帯との関係性の種類を推定する。ここで、第１の世帯および第２の世帯は、世帯特定部３３により特定される１または複数の世帯に含まれる。世帯関係推定部３８は、第１の世帯に含まれる第１のユーザと、第２の世帯に含まれる第２のユーザとの関係性の種類が、親子、きょうだい（Ｓｉｂｌｉｎｇ）、隣人の少なくとも一部のうちいずれであるか否かに応じた、第１の世帯と第２の世帯との関係性の種類を推定してよい。

　ユーザ関係特定部３０の詳細について説明する。図２２は、ユーザ関係特定部３０の機能的な構成の一例を示す機能ブロック図である。ユーザ関係特定部３０は、人物属性データ取得部２０、グラフデータ生成部２２、参照人物特定部２４、関係性特定部２６、を含む。

　人物属性データ取得部２０は、複数のコンピュータシステムと通信し、人物の属性を示す人物属性データを取得する。ここで、本実施形態に係る情報処理システム１は、例えば、電子商取引システム４０、ゴルフ場予約システム４２、旅行予約システム４４、カード管理システム４６、などといった各種コンピュータシステムと通信可能になっている（図３、図５、及び、図７参照）。これらのコンピュータシステムのそれぞれには、当該コンピュータシステムを利用するユーザに関する情報であるアカウントデータが登録されている。そして、情報処理システム１は、これらのコンピュータシステムにアクセスして、当該コンピュータシステムに登録されているアカウントデータを取得できるようになっている。なお、本実施の形態における各種コンピュータシステムは、例として、ペイメント管理システム、ネットバンキング管理システム、金融商品管理システム、保険商品管理システム、モバイルサービス管理システムなどを含んでもよく、インターネットを介して商品または役務を提供し得る分野であれば、その種別に制限はない。

　アカウントデータには、例えば、ユーザＩＤ、氏名データ、住所データ、年齢データ、性別データ、電話番号データ、携帯電話番号データ、クレジットカード番号データ、ＩＰアドレスデータ、などが含まれる。

　ユーザＩＤは、例えば、当該コンピュータシステムにおける当該ユーザの識別情報である。氏名データは、例えば、当該ユーザの氏名（姓（名字）及び名）を示すデータである。住所データは、例えば、当該ユーザの住所を示すデータである。当該コンピュータシステムが電子商取引システム４０である場合に、住所データが、当該ユーザが購入した商品の送付先の住所を示していてもよい。年齢データは、例えば、当該ユーザの年齢を示すデータである。性別データは、例えば、当該ユーザの性別を示すデータである。電話番号データは、例えば、当該ユーザの電話番号を示すデータである。携帯電話番号データは、例えば、当該ユーザの携帯電話番号を示すデータである。クレジットカード番号データは、例えば、当該ユーザが当該コンピュータシステムでの決済において利用するクレジットカードのカード番号を示すデータである。ＩＰアドレスデータは、例えば、当該ユーザが使用するコンピュータのＩＰアドレス（例えば、送信元のＩＰアドレス）を示すデータである。

　人物属性データ取得部２０は、本実施形態では例えば、注目人物を含む複数の人物についての、当該人物の属性を示す人物属性データを取得する。ここで人物属性データの一例としては、上述のアカウントデータが挙げられる。人物属性データ取得部２０は、例えば、上述の複数のシステムのそれぞれから、当該人物のアカウントデータを取得する。

　グラフデータ生成部２２は、本実施形態では例えば、複数の人物のそれぞれの属性に基づいて、互いに関係がある人物のペアを特定する。グラフデータ生成部２２は、複数の人物の人物属性データに基づいて、互いに関係がある人物のペアを特定してもよい。なお、本実施形態に係るグラフデータ生成部２２は、複数の人物のそれぞれの属性に基づいて、互いに関係がある人物のペアを特定するペア特定手段の一例に相当する。

　グラフデータ生成部２２は、例えば、注目人物を含む複数の人物にそれぞれ対応付けられるノードデータ５０と、互いに関係がある人物のペアに対応付けられるリンクデータ５２と、を含むグラフデータを生成する（図４、図６、図８、及び、図９参照）。またグラフデータ生成部２２は、生成されたグラフデータを記憶部１２に格納する。

　例えば、図３に示すように、電子商取引システム４０に、ユーザＡのアカウントデータが登録されていることとする。また、ゴルフ場予約システム４２に、ユーザＢのアカウントデータが登録されていることとする。また、旅行予約システム４４に、ユーザＣのアカウントデータが登録されていることとする。

　そして、電子商取引システム４０に登録されているユーザＡのＩＰアドレスデータの値、ゴルフ場予約システム４２に登録されているユーザＢのＩＰアドレスデータの値、及び、旅行予約システム４４に登録されているユーザＣのＩＰアドレスデータの値が同じであるとする。

　この場合、グラフデータ生成部２２は、図４に示すように、ユーザＡに対応付けられるノードデータ５０ａ、ユーザＢに対応付けられるノードデータ５０ｂ、ユーザＣに対応付けられるノードデータ５０ｃ、ユーザＡがユーザＢと関係があることを示すリンクデータ５２ａ、ユーザＡがユーザＣと関係があることを示すリンクデータ５２ｂ、ユーザＢがユーザＣと関係があることを示すリンクデータ５２ｃ、を含むグラフデータを生成する。

　ＩＰアドレスが同じであるユーザは同じコンピュータを利用しているものと推察される。そのため、本実施形態ではこのようなユーザは互いに関連付けられるようになっている。

　また、例えば、図５に示すように、電子商取引システム４０に、ユーザＤ、ユーザＥ、及び、ユーザＦのアカウントデータが登録されていることとする。

　そして、電子商取引システム４０に登録されているユーザＤの住所データの値、ユーザＥの住所データの値、及び、ユーザＦの住所データの値が同じであるとする。

　この場合、グラフデータ生成部２２は、図６に示すように、ユーザＤに対応付けられるノードデータ５０ｄ、ユーザＥに対応付けられるノードデータ５０ｅ、ユーザＦに対応付けられるノードデータ５０ｆ、ユーザＤがユーザＥと関係があることを示すリンクデータ５２ｄ、ユーザＤがユーザＦと関係があることを示すリンクデータ５２ｅ、ユーザＥがユーザＦと関係があることを示すリンクデータ５２ｆ、を含むグラフデータを生成する。

　住所が同じであるユーザは同居しているものと推察される。そのため、本実施形態ではこのようなユーザは互いに関連付けられるようになっている。

　また、例えば、図７に示すように、電子商取引システム４０に、ユーザＧのアカウントデータが登録されていることとする。また、ゴルフ場予約システム４２に、ユーザＨのアカウントデータが登録されていることとする。また、旅行予約システム４４に、ユーザＩのアカウントデータが登録されていることとする。

　そして、電子商取引システム４０に登録されているユーザＧのクレジットカード番号データの値、ゴルフ場予約システム４２に登録されているユーザＨのクレジットカード番号データの値、及び、旅行予約システム４４に登録されているユーザＩのクレジットカード番号データの値が同じであるとする。

　この場合、グラフデータ生成部２２は、図８に示すように、ユーザＧに対応付けられるノードデータ５０ｇ、ユーザＨに対応付けられるノードデータ５０ｈ、ユーザＩに対応付けられるノードデータ５０ｉ、ユーザＧがユーザＨと関係があることを示すリンクデータ５２ｇ、ユーザＧがユーザＩと関係があることを示すリンクデータ５２ｈ、ユーザＨがユーザＩと関係があることを示すリンクデータ５２ｉ、を含むグラフデータを生成する。

　クレジットカード番号が同じであるユーザは親子等の家族であるものと推察される。そのため、本実施形態ではこのようなユーザは互いに関連付けられるようになっている。

　なお、互いに関係がある人物のペアに該当するか否かの判断基準は、以上で説明したものには限定されない。

　また、以上で説明した、互いに関係があると特定された人物を関連付けるリンクデータ５２が示すリンクを明示的リンクと呼ぶこととする。

　ここで例えば、第１の人物と明示的リンクで接続されている人物と、第２の人物と明示的リンクで接続されている人物と、が所定数以上（例えば、３人以上）共通しているとする。この場合、本実施形態では例えば、グラフデータ生成部２２は、当該第１の人物が当該第２の人物と関係があることを示すリンクデータ５２を生成する。このようにして生成されるリンクデータ５２が示すリンクを黙示的リンクと呼ぶこととする。

　例えば、図９に示すように、明示的リンクを示すリンクデータ５２ｊによって、ユーザＪに対応付けられるノードデータ５０ｊとユーザＫに対応付けられるノードデータ５０ｋとが接続されていることとする。また、明示的リンクを示すリンクデータ５２ｋによって、ユーザＪに対応付けられるノードデータ５０ｊとユーザＬに対応付けられるノードデータ５０ｌとが接続されていることとする。また、明示的リンクを示すリンクデータ５２ｌによって、ユーザＪに対応付けられるノードデータ５０ｊとユーザＭに対応付けられるノードデータ５０ｍとが接続されていることとする。

　また、明示的リンクを示すリンクデータ５２ｍによって、ユーザＫに対応付けられるノードデータ５０ｋとユーザＮに対応付けられるノードデータ５０ｎとが接続されていることとする。また、明示的リンクを示すリンクデータ５２ｎによって、ユーザＬに対応付けられるノードデータ５０ｌとユーザＮに対応付けられるノードデータ５０ｎとが接続されていることとする。また、明示的リンクを示すリンクデータ５２ｏによって、ユーザＭに対応付けられるノードデータ５０ｍとユーザＮに対応付けられるノードデータ５０ｎとが接続されていることとする。

　この場合、グラフデータ生成部２２は、ユーザＪがユーザＮと関係があることを示すリンクデータ５２ｐ（黙示的リンクを示すリンクデータ５２ｐ）を生成する。このようにして、ユーザＮが、ユーザＪと関係がある人物として特定されることとなる。

　また、例えば、第１の人物と明示的リンク又は黙示的リンクで接続されている人物と、第２の人物と明示的リンク又は黙示的リンクで接続されている人物と、が所定数以上（例えば、３人以上）共通しているとする。この場合、グラフデータ生成部２２が、当該第１の人物が当該第２の人物と関係があることを示すリンクデータ５２（黙示的リンクを示すリンクデータ５２）を生成してもよい。

　なお、グラフデータ生成部２２は、アカウントデータとは異なる人物属性データに基づいて、グラフデータを生成してもよい。

　参照人物特定部２４は、処理対象人物（例えば注目人物を含む）と関係がある人物である参照人物を特定する。ここで、参照人物特定部２４は、処理対象人物と関係がある人物として特定される人物（例えば友人として電子商取引システム４０等に登録される人物）、及び、関係がある人物として特定される人物（例えば登録された友人）が所定数以上、処理対象人物と共通する人物を、参照人物として特定してもよい。また、参照人物特定部２４は、処理対象人物の属性と、複数の人物の属性と、に基づいて、当該複数の人物のうちから、参照人物を特定してもよい。

　参照人物特定部２４は、例えば、処理対象人物に対応付けられるノードデータ５０と、明示的リンク又は黙示的リンクを示すリンクデータ５２によって接続されるノードデータ５０に対応付けられる人物を、当該処理対象人物に対する参照人物として特定してもよい。

　関係性特定部２６は、処理対象人物（例えば注目人物を含む）と参照人物との関係性を特定する。ここで、関係性特定部２６が、処理対象人物のアカウントデータと、参照人物のアカウントデータと、に基づいて、処理対象人物と参照人物との関係性を特定してもよい。ここで、処理対象人物のアカウントデータが登録されているコンピュータシステムと参照人物のアカウントデータが登録されているコンピュータシステムとは異なっていてもよい。例えば、電子商取引システム４０に登録されている、処理対象人物のアカウントデータと、ゴルフ場予約システム４２に登録されている、参照人物のアカウントデータと、に基づいて、処理対象人物と参照人物との関係性（より具体的には関係性の種類）を特定してもよい。関係性特定部２６は、特定された関係性の種類を、処理対象人物および参照人物のペアと関連付けて記憶部１２に格納してよい。

　また、関係性特定部２６は、処理対象人物と参照人物との家族としての関係（例えば親子、配偶者、きょうだい）を特定してよい。さらに、関係性特定部２６は、特定される関係性の種類として、親子、配偶者、きょうだい、同僚、隣人、友人のうち少なくとも一部を含む候補のうちいずれかを選択してよい。

　次に関係性特定部２６の処理についてより詳細に説明する。関係性特定部２６は、例えば、リンクデータ５２で接続されているノードデータ５０のペアを特定する。そして、関係性特定部２６は、当該ペアに対応付けられる２人の人物の人物属性データに基づいて、当該ペアに対応付けられるペア属性データを生成する。

　ペア属性データには、例えば、ＩＰ共通フラグ、住所共通フラグ、クレジットカード番号共通フラグ、名字同一フラグ、年齢差データ、ペア性別データ、などが含まれる。

　ＩＰ共通フラグは、例えば、当該ペアのうちの一方のアカウントデータに含まれるＩＰアドレスデータの値と他方のアカウントデータに含まれるＩＰアドレスデータの値とが同じであるか否かを示すフラグである。例えば、所与の日においてＩＰアドレスデータの値が同じである場合はＩＰ共通フラグの値に１が設定され、ＩＰアドレスデータの値が異なる場合はＩＰ共通フラグの値に０が設定されてもよい。

　住所共通フラグは、例えば、当該ペアのうちの一方のアカウントデータに含まれる住所データの値と他方のアカウントデータに含まれる住所データの値とが同じであるか否かを示すフラグである。例えば、住所データの値が同じである場合は住所共通フラグの値に１が設定され、住所データの値が異なる場合は住所共通フラグの値に０が設定されてもよい。また住所共通フラグとして、住所どうしの類似性が用いられてもよい。例えば、住所共通フラグに、住所のうち町名および番地までも異なる場合には０、番地の後にある建物名および部屋番号が異なる場合には１、建物名および部屋番号が同じである場合は２が設定されてよい。

　クレジットカード番号共通フラグは、例えば、当該ペアのうちの一方のアカウントデータに含まれるクレジットカード番号データの値と他方のアカウントデータに含まれるクレジットカード番号データの値とが同じであるか否かを示すフラグである。例えば、クレジットカード番号データの値が同じである場合はクレジットカード番号共通フラグの値に１が設定され、クレジットカード番号データの値が異なる場合はクレジットカード番号共通フラグの値に０が設定されてもよい。

　名字同一フラグは、例えば、当該ペアのうちの一方のアカウントデータに含まれる氏名データが示す名字と他方のアカウントデータに含まれる氏名データが示す名字とが同じであるか否かを示すフラグである。例えば、氏名データが示す名字が同じである場合は名字同一フラグの値に１が設定され、氏名データが示す名字が異なる場合は名字同一フラグの値に０が設定されてもよい。

　年齢差データは、例えば、当該ペアのうちの一方のアカウントデータに含まれる年齢データの値と他方のアカウントデータに含まれる年齢データの値との差を示すデータである。

　ペア性別データは、例えば、当該ペアのうちの一方のアカウントデータに含まれる性別データの値と他方のアカウントデータに含まれる性別データの値との組合せを示すデータである。

　そして、関係性特定部２６は、複数のペアのそれぞれに対応付けられるペア属性データの値に基づいて、一般的なクラスタリング手法を用いたクラスタリングを実行することで、当該複数のペアを、図１０に示すような複数のクラスタ５４に分類する。

　図１０は、複数のペアが、５つのクラスタ５４（５４ａ、５４ｂ、５４ｃ、５４ｄ、及び、５４ｅ）に分類された様子の一例を模式的に示す図である。図１０に示されているバツ印は、ペアに対応付けられる。そして、複数のバツ印のそれぞれは、当該バツ印に対応するペアのペア属性データの値に対応付けられる位置に配置されている。

　図１０の例では、複数のペアが５つのクラスタ５４に分類されているが、複数のペアが分類されるクラスタ５４の数は５つには限定されず、例えば、複数のペアが４つのクラスタ５４に分類されてもよい。

　図１１は、複数のペアが４つのクラスタ５４に分類された場合における、当該分類の可視化の一例を示す図である。

　図１１に示すように、住所が同じであり、性別が同じであり、年齢差がＸ歳より大きく、名字が同じペアは、第１クラスタに分類されてもよい。また、住所が同じであり、性別が同じであり、年齢差がＸ歳以下であり、名字が同じペアは、第２クラスタに分類されてもよい。また、住所が同じであり、性別が異なり、年齢差がＹ歳より大きく、名字が同じペアは、第３クラスタに分類されてもよい。また、住所が同じであり、性別が異なり、年齢差がＹ歳以下であり、名字が同じペアは、第４クラスタに分類されてもよい。

　この場合、第１クラスタは、例えば同性の親子に対応付けられるクラスタ５４であるものと推察される。また、第２クラスタは、例えば同性の兄弟に対応付けられるクラスタ５４であるものと推察される。また、第３クラスタは、例えば異性の親子に対応付けられるクラスタ５４であるものと推察される。また、第４クラスタは、例えば夫婦、または異性の兄弟に対応付けられるクラスタ５４であるものと推察される。

　なお、処理対象人物と参照人物との関係性の種類を特定に、さらにペアのうちの一方と他方とにおける共通の友人の数を用いてもよい。

　以上で説明したようにして、関係性特定部２６が、人物間の関係に対応付けられる値に基づくクラスタリングの結果に基づいて、処理対象人物と参照人物との関係性の種類を特定してもよい。また、関係性特定部２６が、名字、ＩＰアドレス、住所、クレジットカード番号、年齢差、又は、性別のうちの少なくとも１つに基づくクラスタリングの結果に基づいて、処理対象人物と参照人物との関係性の種類を特定してもよい。

　関係性特定部２６は、処理対象人物と参照人物との間で行われる情報または物のやりとりの記録にさらに基づいて、処理対象人物と参照人物との関係性の種類を特定してもよい。情報または物のやりとりの記録は、例えば、父の日、母の日、またはクリスマスのような特定の日付におけるギフトの送付履歴や、その特定の日付におけるメッセージの送受信ログであってよい。

　ここで、本実施形態に係る情報処理システム１で行われる、ソーシャルグラフにかかる情報の作成についての処理の一例を、図１２に例示するフロー図を参照しながら説明する。図１２は、主に参照人物特定部２４、関係性特定部２６の処理について説明する。

　図１２に記載される処理は、グラフデータが生成された人物のそれぞれについて繰り返し実行される。グラフデータが生成された人物は注目人物を含み、図１２の処理の対象となる人物を以下では処理対象人物と記載する。図１２の処理例では、注目人物を含む複数の人物についてのグラフデータが既に生成されており、複数のペアについて、当該ペアに対応付けられるクラスタ５４が特定されていることとする。また、各クラスタ５４に対応付けられる近さ機械学習モデルが既に学習済であることとする。

　まず、参照人物特定部２４は、処理対象人物に対応するノードデータ５０と明示的リンク又は黙示的リンクで接続されているノードデータ５０に対応する人物を、参照人物として特定する（Ｓ１０１）。ここでは例えば、少なくとも１人の参照人物が特定されるとする。

　そして、関係性特定部２６が、Ｓ１０１に示す処理で特定された参照人物のうちから、Ｓ１０４～Ｓ１０８に示す処理がまだ実行されていない参照人物を１人選択する（Ｓ１０３）。

　そして、関係性特定部２６が、処理対象人物とＳ１０２に示す処理で選択された参照人物とのペアに対応するクラスタ５４をそのペアの関係性の種類として特定する（Ｓ１０４）。

　関係性特定部２６は処理対象人物と参照人物との関係性の種類を記憶部１２に格納する（Ｓ１０８）。

　そして、関係性特定部２６が、Ｓ１０１に示す処理で特定された参照人物のすべてについてＳ１０４，Ｓ１０８に示す処理が実行されたか否かを確認する（Ｓ１１０）。

　Ｓ１０１に示す処理で特定された参照人物のすべてについてＳ１０４，Ｓ１０８に示す処理が実行されていない場合は（Ｓ１１０：Ｎ）、Ｓ１０３に示す処理に戻る。

　Ｓ１０１に示す処理で特定された参照人物のすべてについてＳ１０４，Ｓ１０８に示す処理が実行された場合は（Ｓ１１０：Ｙ）、図１２に示される処理は終了する。

　次に、世帯内の状況をより詳細に取得するための処理についてより詳細に説明する。図１３は、世帯内のユーザの家族関係の特定にかかわる処理の一例を示すフロー図である。図１３に示される処理は、存否特定部３２、世帯特定部３３、家族特定部３４、年齢推定部３５、関係記録部３６において実行される。

　はじめに、世帯特定部３３は、ユーザの住所及び名字に基づいて、同居する１または複数のユーザを含む世帯の世帯情報を取得する（Ｓ２０１）。より具体的には、世帯特定部３３は、複数のコンピュータシステムのユーザデータベースに登録されている複数のユーザのアカウントデータを取得する。そして世帯特定部３３は、アカウントデータに含まれる住所および名字が同じ複数のユーザを、世帯に含まれ同居するユーザとして選択し、その選択されたユーザを含む世帯の世帯情報を生成する。また世帯特定部３３は、住所および名字が同じユーザが存在しないユーザからなる世帯の世帯情報を生成してよい。世帯に含まれ同居するユーザを選択する条件は、住所および名字が同じだけでなく、例えば、住所のうち建物名を除く部分が一致し類似性が高いことおよび名字が一致することであってもよい。世帯特定部３３は、予め処理の対象として設定される対象ユーザ群に含まれるユーザを含む世帯について世帯情報を取得してもよいし、対象ユーザ群を設けず対象ユーザと関係なく複数の世帯について世帯情報を取得してもよい。なおユーザデータベースは、予め複数のコンピュータシステムから取得され記憶部１２に格納されたものであってもよいし、別途生成され記憶部１２に格納されるものであってもよい。

　世帯情報が取得されると、家族特定部３４は、家族ユーザを特定する処理の対象となる１人の対象ユーザを選択する（Ｓ２０２）。この処理において、家族特定部３４は、世帯特定部３３の処理の対象となる対象ユーザ群に含まれるユーザから対象ユーザを選択してもよいし、家族特定部３４は世帯特定部３３により取得された複数の世帯に含まれる任意のユーザを選択してもよい。

　つぎに、存否特定部３２は、対象ユーザと関連付けて格納される情報であって他のユーザと関連付けずに格納される情報に基づいて、対象ユーザの配偶者の存否を示す存否情報を取得する（Ｓ２０３）。ここで、存否特定部３２は、機械学習モデルである配偶者存否推定モデルに対象ユーザに関する入力パラメータの値を入力した際の出力に基づいて、対象ユーザの配偶者の存否を推定し、その推定結果を示す存否情報を取得する。ここで入力パラメータはユーザに関するあらかじめ定められた情報の項目であり、配偶者存否推定モデルは、予め、その入力パラメータの値を含む学習データにより学習されてよい。配偶者存否推定モデルの詳細については後述する。

　そして、家族特定部３４は配偶者の存否情報と世帯内のユーザとの対応を確認し、また、その対応に応じて、年齢推定部３５は年齢を推定し、関係記録部３６は関連ユーザの情報を登録する（Ｓ２０４）。Ｓ２０４の処理の詳細については後述する。

　Ｓ２０３と同様に、存否特定部３２は、対象ユーザと関連付けて格納される情報であって他のユーザと関連付けずに格納される情報に基づいて、対象ユーザの子どもの存否を示す存否情報を取得する（Ｓ２０５）。存否特定部３２は、予め学習された機械学習モデルである子存否推定モデルに対象ユーザに関する入力パラメータの値を入力した際の出力に基づいて、対象ユーザの子どもの存否、より具体的には子どもの人数を推定し、その推定結果を示す存否情報を取得する。

　Ｓ２０４と同様に、家族特定部３４は子どもの存否情報と世帯内のユーザとの対応を確認し、また、その対応に応じて、年齢推定部３５は年齢を推定し、関係記録部３６は関連ユーザの情報を登録する（Ｓ２０６）。

　Ｓ２０３と同様に、存否特定部３２は、対象ユーザと関連付けて格納される情報であって他のユーザと関連付けずに格納される情報に基づいて、対象ユーザの親の存否を示す存否情報を取得する（Ｓ２０７）。存否特定部３２は、予め学習された機械学習モデルである親存否推定モデルに対象ユーザに関する入力パラメータの値を入力した際の出力に基づいて、対象ユーザの親の存否、より具体的には親の人数を推定し、その推定結果を示す存否情報を取得する。

　Ｓ２０４と同様に、家族特定部３４は親の存否情報と世帯内のユーザとの対応を確認し、また、その対応に応じて、年齢推定部３５は年齢を推定し、関係記録部３６は関連ユーザの情報を登録する（Ｓ２０８）。

　そして、家族特定部３４は、まだ選択されていないユーザが存在するか判定する（Ｓ２１０）。ユーザが存在する場合は（Ｓ２１０：Ｙ）、Ｓ２０２の処理から繰り返す。ユーザが存在しない場合は（Ｓ２１０：Ｎ）、図１３の処理を終了する。

　次に存否特定部３２に含まれる、配偶者存否推定モデルと、子存否推定モデルと、親存否推定モデルとについて説明する。配偶者存否推定モデル、子存否推定モデル、親存否推定モデルは構造を存否推定モデルと総称する。本実施の形態において、存否推定モデルに係る入力パラメータは、例として、各種コンピュータシステムに係る取引履歴などの利用履歴を含んでよく、対象ユーザに係る人物属性データの少なくとも一部を含んでよい。図１４は、存否特定部３２で用いる機械学習モデルである存否推定モデルの一例を説明する図である。存否推定モデルは、弱教師あり学習により学習される。存否推定モデルは複数のラベル関数６１ａ～６１ｃ（特に区別しない場合はラベル関数６１と記載する）および生成モデル６４を含む。ラベル関数６１ａ～６１ｃの出力６２ａ～６２ｃ（特に区別しない場合は出力６２と記載する）は生成モデル６４に入力され、生成モデル６４は存否の推定結果を示すラベル６５を出力する。ここで、ラベル関数（ラベリング関数に相当）の数に特に制限はない。図１４に示される機械学習モデルは、例えばSnorkelという名称で提供される公知のものであってよい。存否推定モデルにおいて決定されるラベル６５は、各ラベル関数６１の出力であってもよいし、その出力が所定の手法で統計処理された統計情報に基づいて推定された情報であってもよいし、各ラベル関数６１の出力に基づく統計情報に応じ多数決等のルールベースで決定された情報であってもよい。

　配偶者存否推定モデルに含まれる複数のラベル関数６１のそれぞれは、ユーザに関する１または複数の入力パラメータに基づいて対象ユーザの配偶者が存在するか否かに関するスコアを出力する。子存否推定モデルに含まれる複数のラベル関数６１のそれぞれは、ユーザに関する１または複数の入力パラメータに基づいて対象ユーザの子どもが存在するか否かに関するスコアを出力する。親存否推定モデルに含まれる複数のラベル関数６１のそれぞれは、ユーザに関する１または複数の入力パラメータに基づいて対象ユーザの親が存在するか否かに関するスコアを出力する。なお、入力パラメータはユーザに関連付けられ、かつ他のユーザと関連付けられていない情報からなる。

　生成モデル６４は、ラベル関数６１のそれぞれの重みに応じて、出力６２からラベル６５のスコアを算出する。生成モデル６４は、複数のラベル関数６１の出力および学習により決定される複数の関数の重みに基づいて、対象ユーザの配偶者（子ども、親）の存否を推定し、推定結果を示す存否情報を決定する。

　ラベル関数６１は、入力パラメータに対して仮のラベルとなる出力６２を生成する関数であり、管理者等により決定されてよい。出力６２の値は、例えば、negative(0)，positive(1)，skipの３つのうちいずれかであってよいし、何らかの値とskipであってもよい。ラベル関数６１が生成する出力６２の精度は必ずしも高くなくてよい。生成モデル６４は、複数のラベル関数６１の複数の出力６２について算出されるラベルの確率に基づいて、損失が最小になるように学習される。学習においては、例えばラベル関数６１の出力６２ごとの重みが決定されてよい。また、この機械学習モデルは正解としてのラベルが存在しなくても学習することができる。

　配偶者存否推定モデルにおいて、例えば以下に示すラベル関数６１が設けられてよい。ラベル関数６１の１つは、旅行予約システム４４に、ユーザによる大人２人の旅行予約の履歴が存在する場合にpositiveを出力し、存在しない場合にnegativeを出力してよい。ラベル関数６１の他の１つは、電子商取引システム４０の会員情報に、ユーザの子どもに関する情報が登録されている場合にpositiveを出力し、登録されていない場合にnegativeを出力してよい。ラベル関数６１の他の１つは、カード管理システム４６の登録情報に、既婚かつ子どもありまたは既婚と登録されている場合にpositiveを出力し、登録されていない場合にnegativeを出力してよい。

　子存否推定モデルにおいて、例えば以下に示すラベル関数６１が設けられてよい。ラベル関数６１の１つは、旅行予約システム４４に存在する履歴において、最も予約の頻度の多い子どもの人数を出力してよい。ラベル関数６１の他の１つは、電子商取引システム４０の会員情報に登録される、ユーザの子どもの人数を出力してよい。ラベル関数６１の他の１つは、カード管理システム４６の登録情報に格納される子どもの人数を出力してよい。なお、子どもの人数として、「０」，「１」，「２」，「３以上」のうちいずれかが出力されてよい。

　親存否推定モデルにおいて、例えば以下に示すラベル関数６１が設けられてよい。ラベル関数６１の１つは、コンピュータシステムに登録される連絡先において、ユーザと同じ住所を有する者の人数を出力してよい。ラベル関数６１の他の１つは、カード管理システム４６の登録情報に格納される親の人数を出力してよい。なお、親の人数として、「０」，「１」，「２」のうちいずれかが出力されてよい。

　次にステップＳ２０４の処理についてさらに詳細に説明する。図１５は家族特定部３４、年齢推定部３５、関係記録部３６の処理の一例を示すフロー図であり、特に配偶者の存否に関する処理の一例を示すフロー図である。なお、年齢推定部３５に含まれる配偶者年齢推定モデル、子年齢推定モデル、親年齢推定モデルなどの年齢推定モデルは、存否推定モデルと同様の構成、例えばSnorkelという名称で提供される公知のものであってよい。年齢推定モデルは、各入力パラメータが与えられたラベル関数（ラベリング関数に相当）の出力を利用し年齢推定を行うモデルであってよい。

　はじめに家族特定部３４は、存否特定部３２により対象ユーザに配偶者が存在すると推定された否かを判定する（Ｓ３０１）。配偶者が存在しないと推定された場合には（Ｓ３０１：Ｎ）、図１５の処理を終了する。一方、配偶者が存在すると推定された場合には（Ｓ３０１：Ｙ）、家族特定部３４は、世帯情報が示すユーザであって、対象ユーザが属する世帯の家族のユーザから、配偶者に対応するユーザを検索する（Ｓ３０２）。より具体的には、家族特定部３４は、世帯情報が示すユーザであって、対象ユーザと同一の世帯に含まれるユーザ（家族のユーザ）から、対象ユーザとの関係性の種類が配偶者であるユーザを探す。ここで、対象ユーザと家族のユーザとの関係性の種類は、予めユーザ関係特定部３０により特定されていてよい。そして家族特定部３４は、対応するユーザが存在するか判定する（Ｓ３０３）。

　対応するユーザが存在しない場合には（Ｓ３０３：Ｎ）、年齢推定部３５は、存否特定部３２により存在が推定され対応するユーザが存在しない配偶者の年齢を推定する（Ｓ３０４）。

　年齢推定部３５は、機械学習モデルである配偶者年齢推定モデルにユーザに関する入力パラメータを入力することにより存在が推定された配偶者の年齢を推定する。配偶者年齢推定モデルには、例として、対象ユーザの年齢および性別、電子商取引システム４０の購入および閲覧履歴などの各種コンピュータシステムの利用履歴を含む入力データが入力され、配偶者年齢推定モデルは配偶者の推定された年齢を出力してよい。なお、配偶者年齢推定モデルは、ユーザ関係特定部３０により互いに配偶者であると推定されたユーザのうち一方の年齢および性別、電子商取引システム４０の購入および閲覧履歴などの各種コンピュータシステムの利用履歴を含む入力データと、他方の年齢の階層を正解データとする学習データにより学習されてよい。年齢の階層は、例えば各階層が５歳の範囲を含むように設定されてよい。

　年齢が推定されると、関係記録部３６は、存否特定部３２により存在が推定される配偶者の情報（年齢を含む）を、新たな関連ユーザの情報として登録する（Ｓ３０５）。なお、存否特定部３２において存在すると推定された配偶者に対応するユーザが既に存在する場合には（Ｓ３０３のＹ）、関係記録部３６はそのユーザに関する情報を記憶部１２に格納する（Ｓ３０６）。なお、Ｓ３０５において既存のユーザデータベースに情報を追加する場合には、Ｓ３０６は実行されなくてもよい。

　Ｓ２０６の処理は、図１５に示される処理に類似し、配偶者の代わりに子どもが対象になる。以下では処理上の大きな相違点について説明する。Ｓ３０１において、家族特定部３４は、存否特定部３２により対象ユーザに子どもが存在すると推定された否かを判定する。子どもが存在すると推定された場合には（Ｓ３０１：Ｙ）、家族特定部３４は、世帯情報が示すユーザであって、対象ユーザが属する世帯の家族のユーザから、（推定された人数の）子どもに対応するユーザを検索する。対応しないユーザが存在する場合には（Ｓ３０３：Ｎ）、年齢推定部３５は、存否特定部３２により存在が推定され対応するユーザが存在しない子どもの年齢を推定する（Ｓ３０４）。

　年齢推定部３５は、機械学習モデルである子年齢推定モデルにユーザに関する入力パラメータを入力することにより存在が推定された子どもの年齢を推定する。子年齢推定モデルは、図１４に示されるような弱教師ありの機械学習モデルであってよい。子年齢推定モデルに含まれるラベル関数６１の１つは、例えば電子商取引システム４０の会員情報に含まれる子どもに情報に基づいて、年齢の階層を出力してよい。他の１つのラベル関数は、旅行予約システム４４に存在する宿泊予約に存在する子どもの食事、寝具の情報に基づいて年齢の階層を出力してよい。他の１つのラベル関数は、電子商取引システム４０の購入履歴に含まれる商品の種類に基づいて年齢の階層を出力してよい。ここで、ラベル６５は、年齢の推定された子どもの年齢の階層を示す情報であってよい。なお、子年齢推定モデルは、ユーザ関係特定部３０により親子であると推定されたユーザのうち親の年齢および性別、電子商取引システム４０の購入および閲覧履歴などの各種コンピュータシステムの利用履歴を含む入力データと、子どもの年齢の階層を正解データとする学習データにより学習されてもよい。

　年齢が推定されると、関係記録部３６は、存否特定部３２により存在が推定される子どもの情報（年齢を含む）を、新たな関連ユーザの情報として登録する（Ｓ３０５）。

　Ｓ２０８の処理は、図１５に示される処理に類似し、配偶者の代わりに親が対象になる。以下では処理上の大きな相違点について説明する。Ｓ３０１において、家族特定部３４は、存否特定部３２により対象ユーザに親が存在すると推定された否かを判定する。親が存在すると推定された場合には（Ｓ３０１：Ｙ）、家族特定部３４は、世帯情報が示すユーザであって、対象ユーザが属する世帯の家族のユーザから、（推定された人数の）親に対応するユーザを検索する。対応しないユーザが存在する場合には（Ｓ３０３：Ｎ）、年齢推定部３５は、存否特定部３２により存在が推定され対応するユーザが存在しない親の年齢を推定する（Ｓ３０４）。

　年齢推定部３５は、機械学習モデルである親年齢推定モデルにユーザに関する入力パラメータを入力することにより存在が推定された親の年齢を推定する。親年齢推定モデルは、図１４に示されるような弱教師ありの機械学習モデルであってよい。親年齢推定モデルに含まれるラベル関数６１の１つは、対象ユーザの年齢に基づいて親の年齢の階層を出力してよい。ラベル関数６１の他の１つは、電子商取引システム４０の購入履歴に含まれる商品の種類に基づいて年齢の階層を出力してよい。ここで、ラベル６５は、年齢の推定された親の年齢の階層を示す情報であってよい。なお、親年齢推定モデルは、ユーザ関係特定部３０により親子であると推定されたユーザのうち子どものユーザの年齢および性別、電子商取引システム４０の購入および閲覧履歴などの各種コンピュータシステムの利用履歴を含む入力データと、親の年齢の階層を正解データとする学習データにより学習されてもよい。

　年齢が推定されると、関係記録部３６は、存否特定部３２により存在が推定される親の情報（年齢を含む）を、新たな関連ユーザの情報として登録する（Ｓ３０５）。

　これまでに説明された処理により、世帯に含まれる複数のユーザ間の関係が明確になるだけでなく、世帯内に存在する人物であるがユーザ登録されていない人物を検出することが可能になる。

　図１６は、世帯内のユーザ等の関係を説明する図である。この例では、破線の矩形で囲まれた範囲が世帯を示し、その世帯がユーザ７０ａ，７０ｂ、関連ユーザ７０ｅを含むことが図示されている。ユーザ７０ａ，７０ｂの楕円中に記載された文字列はユーザＩＤを示し、関連ユーザ７０ｅの楕円中に記載された文字列は関係記録部３６が関連ユーザを記録する際に付与されたユーザＩＤを示す。また横線のみで接続されるユーザ（または関連ユーザ）は互いに配偶者であることを示し、その横線から下に延びる縦線に接続されるユーザ（または関連ユーザ）は子どもを示す。

　さらに関係記録部３６により出力されるデータの構造について説明する。図１７は世帯メンバテーブルに格納される情報の一例を示す図である。図１８はユーザ関係テーブルに格納される情報の一例を示す図である。図１９はメンバ属性テーブルに格納される情報の一例を示す図である。世帯メンバテーブル、ユーザ関係テーブル、メンバ属性テーブルは記憶部１２に格納されてよい。また記憶部１２の代わりに、他の会員管理システム内のデータベースに格納されてもよい。

　世帯メンバテーブルには、世帯ごとに、世帯を識別するための世帯ＩＤと、その世帯に属する１または複数のユーザのユーザＩＤとが格納される。またユーザＩＤとして、関係記録部３６により登録される関連ユーザのユーザＩＤ（図１７の例ではsocial_456）も登録される。

　ユーザ関係テーブルには、ユーザのペアごとに、そのペアに蔵するユーザのユーザＩＤ１，ユーザＩＤ２と、そのペアにおける関係性の種類とが格納される。ユーザのペアは、ユーザ関係特定部３０により特定されたペアであってもよいし、対象ユーザと関連ユーザとのペア（図１８ではユーザＩＤ１：social_456とユーザＩＤ２：123とのペア）であってもよい。

　メンバ属性テーブルには、ユーザまたは関連ユーザごとに、そのユーザの属性が格納されている。ユーザの属性は、会員であるか否かのフラグ、性別、年齢を含む。関連ユーザの場合、会員であるか否かのフラグがFalseとなる。また関連ユーザの場合、年齢として、年齢推定部３５により推定された年齢の階層が格納される。

　このように関連ユーザの存在を推定し、その情報を出力することで、既存のアカウントデータとして存在するユーザだけでなく、既存のユーザから推定される世帯内の関連ユーザについても管理を可能にしている。またこの情報処理システム１、電子商取引システム４０を含むコンピュータシステムのそれぞれは、各世帯におけるユーザおよび関連ユーザの情報に基づいて、商品やサービスなどをレコメンドしてよい。

　以下では、世帯間の関係を特定するための処理についてより詳細に説明する。図２０は、世帯間の関係の推定にかかる処理の一例を示すフロー図である。図２０に示される処理は、世帯関係推定部３８において実行される。図２０に示される処理は、世帯特定部３３の処理、言い換えると図１３のＳ２０１の処理が実行された後に実行される。図２０に示される処理は、世帯特定部３３により特定された複数の世帯のそれぞれのペアについて繰り返し行われてもよいし、複数の世帯のペアについて一度に実行されてもよい。

　はじめに世帯関係推定部３８は、関係の推定の対象となる、第１の世帯および第２の世帯のペアを選択する（Ｓ２５１）。

　そして、世帯関係推定部３８は、第１の世帯に属する第１のユーザおよび第２の世帯の属する第２のユーザについて、それらの関係性の種類に関するパラメータを取得する（Ｓ２５２）。このパラメータは、第１のユーザの属性および第２のユーザの属性に基づく情報、および第１のユーザと第２のユーザとのやりとりに基づく情報、のうち少なくとも一部を含んでよい。第１のユーザの属性および第２のユーザの属性に基づく情報は、例えば、名字の同一性、年齢差、性が同じか否か、住所の類似性（例えば市区町村および町丁字名が同じか否か）を含む。第１のユーザと第２のユーザとのやりとりに基づく情報は、例えば、特定の日（父の日、母の日、クリスマス）に関するギフトの有無、特定の日付におけるメッセージの送受信の有無、互いのギフトの頻度、共通の友人の数、を含む。関係性の種類に関するパラメータは、上記の情報から予め選択された情報であってよい。

　世帯関係推定部３８は、その関係性の種類に関するパラメータに基づいて、第１の世帯と第２の世帯のペアの関係性の種類を推定する（Ｓ２５４）。世帯関係推定部３８は、推定される関係性の種類として、親子、きょうだい、友人、同僚、隣人の少なくとも一部を含む候補からいずれかを選択してよい。

　世帯関係推定部３８は、関係性特定部２６と同様の手法を用いて世帯の関係を推定してよい。より具体的には、世帯関係推定部３８は、複数の世帯のペアのそれぞれについて取得されるパラメータの値に基づいて、一般的なクラスタリング手法を用いたクラスタリングを実行することで、当該複数の世帯のペアを、例えば図１０に示すような複数のクラスタ５４に分類してよい。そして、世帯関係推定部３８は、第１の世帯および第２の世帯が属するクラスタ５４に対応する関係性の種類を、第１の世帯および第２の世帯の間の関係性の種類として選択してよい。

　ここで、世帯関係推定部３８の関係性の種類に用いるパラメータは、第１の世帯に属する１つの第１のユーザと第２の世帯の属する１つの第２のユーザとに関する情報だけでなく、第１の世帯に属する他の第１のユーザや第２の世帯に属する他の第２のユーザに関する情報も含んでよい。パラメータが、第１のユーザのうち１つと第２のユーザのうち１つとの属性に基づく情報（例えば年齢差）と、他の第１のユーザから他の第２のユーザへのやり取りに関する情報（例えば特定の日のギフトの送付の有無）との組み合わせを含んでよい。

　また、世帯関係推定部３８は、機械学習モデルである世帯関係推定モデルを用いて第１の世帯と第２の世帯の関係性の種類を推定してもよい。世帯関係推定モデルは、世帯のペアについて取得されるパラメータの値を含む入力データと、正解となる関係性の種類を示す正解データとを含む学習データによって学習されてよい。

　世帯関係推定部３８は、ユーザ関係特定部３０により特定されたユーザのペアにおける関係性の種類に基づいて世帯間の関係を推定してよい。例えば、ユーザ関係特定部３０により、第１の世帯に含まれる第１のユーザと、第２の世帯に含まれる第２のユーザとが親子関係があると特定された場合に、世帯関係推定部３８は、世帯間の関係性の種類として親子関係を推定してよい。

　これまでに説明した処理により世帯間の関係を把握することが可能になる。図２１は、世帯間の関係の一例を説明する図である。図２１の例では、世帯２はユーザ７０ｃと関連ユーザ７０ｆとを含み、世帯３はユーザ７０ｇと関連ユーザ７０ｈを含む。

　図２１の例では、世帯２と世帯１との関係性の種類として親子が推定され、世帯１と世帯３との関係性の種類としてきょうだいがス一定される。この関係は世帯２に属するユーザ７０ｃと世帯１に属するユーザ７０ａとの関係性の種類が親子であることと対応している。一方、世帯関係推定部３８では、その処理の方法によっては、直接の親子関係のないユーザ７０ｂとユーザ７０ｃと間でのギフトの送付などを考慮して世帯間の関係性の種類を推定することも可能である。

　なお、本実施の形態における各種コンピュータシステムの利用履歴は、例えば、電子商取引システム４２において対象ユーザにより行われた購入および閲覧に係る履歴であってよく、ゴルフ場予約システム４４において対象ユーザにより予約されたゴルフ場の種別や地理的位置であってよく、旅行予約システム４６において対象ユーザによる予約された宿泊先や部屋の種別や地理的位置であってよく、カード管理システム５０における対象ユーザの限度額等を含む契約内容や購入履歴であってよく、ペイメント管理システムにおいて対象ユーザによる決済がなされた店舗等の地理的位置や購入履歴であってよく、ネットバンキング管理システムにおける対象ユーザの預金残高や入出金先を示す履歴であってよく、金融商品管理システムにおいて対象ユーザが購入または契約した金融商品の種別であってよく、保険商品管理システムにおいて対象ユーザが購入または契約した保険商品の種別であってよく、モバイルサービス管理システムにおいて取得され得る対象ユーザの位置情報や通話先やメッセージ送信先等を含む履歴であってよい。利用履歴は、対象ユーザによる各種コンピュータシステムの利用にかかる履歴であればその態様に制限はない。

　なお、本発明は上述の実施形態に限定されるものではなく、様々な変形が行われてよい。また、特許請求の範囲の記載は、本発明の要旨および範囲内にあるようなすべての変更を網羅することが意図されている。また、上記の具体的な文字列や数値及び図面中の具体的な文字列や数値は例示であり、これらの文字列や数値には限定されない。

Claims

　それぞれ同居する１または複数のユーザを含む第１の世帯および第２の世帯を示す世帯情報を取得する世帯特定手段と、
　前記第１の世帯に属するユーザの属性と前記第２の世帯に属するユーザの属性とに基づいて、前記第１の世帯と、前記第２の世帯との関係性の種類を推定する世帯関係推定手段と、
　を含む情報処理システム。
　請求項１に記載の情報処理システムにおいて、
　前記世帯特定手段は、ユーザデータベースに格納される複数のユーザの名字および住所に基づいて、前記複数のユーザからそれぞれ同居する１または複数のユーザを含む第１の世帯および第２の世帯を取得する、
　情報処理システム。
　請求項１または２に記載の情報処理システムにおいて、
　前記世帯関係推定手段は、前記第１の世帯に含まれる第１のユーザと前記第２の世帯に含まれる第２のユーザとの関係性の種類に関する複数のパラメータに基づいて、前記第１の世帯と、前記第２の世帯との関係性の種類を推定する、
　情報処理システム。
　請求項３に記載の情報処理システムにおいて、
　前記複数のパラメータは、名字の同一性、電話連絡の頻度、特定の日に関するギフトの有無、互いのギフトの頻度、年齢差、共通の友人、性が同じか否か、住所の類似性のうち少なくとも一部を含む、
　情報処理システム。
　請求項１から４のいずれかに記載の情報処理システムにおいて、
　前記世帯関係推定手段は、前記第１の世帯に含まれる第１のユーザと、前記第２の世帯に含まれる第２のユーザとの関係性の種類が、親子、きょうだい、隣人の少なくとも一部のうちいずれであるか否かに応じた、前記第１の世帯と前記第２の世帯との関係性の種類を推定する、
　情報処理システム。
　それぞれ同居する１または複数のユーザを含む第１の世帯および第２の世帯を取得するステップと、
　前記第１の世帯に属するユーザの属性と前記第２の世帯に属するユーザの属性とに基づいて、前記第１の世帯と、前記第２の世帯との関係性の種類を推定するステップと、
　を含む情報処理方法。
　それぞれ同居する１または複数のユーザを含む第１の世帯および第２の世帯を示す世帯情報を取得する世帯特定手段、および、
　前記第１の世帯に属するユーザの属性と前記第２の世帯に属するユーザの属性とに基づいて、前記第１の世帯と、前記第２の世帯との関係性の種類を推定する世帯関係推定手段、
　としてコンピュータを機能させるためのプログラム。