JP2023159664A - Information processing device, information processing method, and information processing program - Google Patents

Information processing device, information processing method, and information processing program Download PDF

Info

Publication number
JP2023159664A
JP2023159664A JP2022069509A JP2022069509A JP2023159664A JP 2023159664 A JP2023159664 A JP 2023159664A JP 2022069509 A JP2022069509 A JP 2022069509A JP 2022069509 A JP2022069509 A JP 2022069509A JP 2023159664 A JP2023159664 A JP 2023159664A
Authority
JP
Japan
Prior art keywords
information
history information
attribute
condition
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022069509A
Other languages
Japanese (ja)
Other versions
JP7354341B1 (en
Inventor
浩司 塚本
Koji Tsukamoto
康貴 田中
Yasutaka Tanaka
朋史 市丸
Tomofumi Ichimaru
慎一 兼平
Shinichi Kanehira
隼士 伊佐次
Junji Isaji
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2022069509A priority Critical patent/JP7354341B1/en
Application granted granted Critical
Publication of JP7354341B1 publication Critical patent/JP7354341B1/en
Publication of JP2023159664A publication Critical patent/JP2023159664A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

To allow for appropriately generating a learning model that is created using a user's history information.SOLUTION: An information processing device comprises an exclusion unit and a learning unit. The exclusion unit excludes history information satisfying a second condition from a user's history information narrowed down by a first condition. The learning unit generates a learning model using the user's history information obtained by having the exclusion unit exclude the history information satisfying the second condition.SELECTED DRAWING: Figure 1

Description

本発明は、情報処理装置、情報処理方法、および情報処理プログラムに関する。 The present invention relates to an information processing device, an information processing method, and an information processing program.

従来、利用者の履歴情報を含む利用者情報を用いた機械学習によって学習モデルを生成する技術が知られている。例えば、特許文献1には、利用者の履歴情報から利用者が債務不履行を起こすか否かに関する指標値を算出する学習モデルを生成する技術が開示されている。 BACKGROUND ART Conventionally, a technique for generating a learning model by machine learning using user information including user history information is known. For example, Patent Document 1 discloses a technique for generating a learning model that calculates an index value regarding whether or not a user will default on a debt based on the user's history information.

特開2019-185595号公報JP 2019-185595 Publication

しかしながら、利用者の履歴情報には、種々の情報が含まれており、利用者の履歴情報をそのまま用いて学習モデルを生成すると、差別的な判断などが行われる場合があり、改善の余地がある。 However, the user's historical information includes various types of information, and if a learning model is generated using the user's historical information as is, discriminatory judgments may be made, and there is still room for improvement. be.

本願は、上記に鑑みてなされたものであって、利用者の履歴情報を用いて生成される学習モデルを適切に生成することができる情報処理装置、情報処理方法、および情報処理プログラムを提供することを目的とする。 The present application has been made in view of the above, and provides an information processing device, an information processing method, and an information processing program that can appropriately generate a learning model generated using history information of a user. The purpose is to

本願に係る情報処理装置は、除外部と、学習部とを備える。除外部は、第1の条件で絞り込まれた利用者の履歴情報から第2の条件を満たす履歴情報を除外する。学習部は、除外部によって第2の条件を満たす履歴情報が除外された利用者の履歴情報を用いて、学習モデルを生成する。 The information processing device according to the present application includes an exclusion section and a learning section. The exclusion unit excludes history information that satisfies the second condition from the history information of the users narrowed down based on the first condition. The learning unit generates a learning model using the user's history information from which the history information satisfying the second condition has been excluded by the exclusion unit.

実施形態の一態様によれば、利用者の履歴情報を用いて生成される学習モデルを適切に生成することができるという効果を奏する。 According to one aspect of the embodiment, it is possible to appropriately generate a learning model using history information of a user.

図1は、実施形態に係る情報処理装置が行う情報処理方法を説明するための図である。FIG. 1 is a diagram for explaining an information processing method performed by an information processing apparatus according to an embodiment. 図2は、実施形態に係る情報処理システムの構成の一例を示す図である。FIG. 2 is a diagram illustrating an example of the configuration of the information processing system according to the embodiment. 図3は、実施形態に係る情報処理装置の構成の一例を示す図である。FIG. 3 is a diagram illustrating an example of the configuration of the information processing device according to the embodiment. 図4は、実施形態に係る利用者情報記憶部に記憶される利用者情報テーブルの一例を示す図である。FIG. 4 is a diagram illustrating an example of a user information table stored in the user information storage unit according to the embodiment. 図5は、実施形態に係る情報処理装置の処理部による情報処理の一例を示すフローチャートである。FIG. 5 is a flowchart illustrating an example of information processing by the processing unit of the information processing device according to the embodiment. 図6は、実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。FIG. 6 is a hardware configuration diagram showing an example of a computer that implements the functions of the information processing device according to the embodiment.

以下に、本願に係る情報処理装置、情報処理方法、および情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、および情報処理プログラムが限定されるものではない。また、各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 DESCRIPTION OF THE PREFERRED EMBODIMENTS Below, an information processing apparatus, an information processing method, and a form for implementing an information processing program (hereinafter referred to as an "embodiment") according to the present application will be described in detail with reference to the drawings. Note that the information processing apparatus, information processing method, and information processing program according to the present application are not limited to this embodiment. Moreover, each embodiment can be combined as appropriate within the range that does not conflict with the processing contents. Further, in each of the embodiments below, the same parts are given the same reference numerals, and redundant explanations will be omitted.

〔1.情報処理の一例〕
まず、図1を参照し、実施形態に係る情報処理装置が行う情報処理方法について説明する。図1は、実施形態に係る情報処理装置が行う情報処理方法を説明するための図である。
[1. An example of information processing]
First, with reference to FIG. 1, an information processing method performed by an information processing apparatus according to an embodiment will be described. FIG. 1 is a diagram for explaining an information processing method performed by an information processing apparatus according to an embodiment.

図1に示す情報処理装置1は、各利用者U,U,・・・,Uの端末装置と連携し、オンラインで各種のサービスを各利用者U,U,・・・,Uに提供する情報処理装置であり、1以上のサーバまたはクラウドシステムなどにより実現される。以下において、利用者U,U,・・・,Uの各々を個別に区別に示す場合、利用者Uと記載する場合がある。 The information processing device 1 shown in FIG. 1 cooperates with the terminal devices of each user U 1 , U 2 , . . . , Un , and provides various services online to each user U 1 , U 2 , . , Un , and is realized by one or more servers or a cloud system. In the following, when each of the users U 1 , U 2 , .

例えば、情報処理装置1が提供するサービスは、検索サービス、決済サービス、インターネット接続、SNS(Social Networking Service)、電子商取引(EC:Electronic Commerce)、オンラインゲーム、オンラインバンキング、オンライントレーディング、宿泊・チケット予約、動画・音楽配信、ニュース、地図、ルート検索、経路案内、路線情報、運行情報、天気予報などのサービスを提供してもよい。情報処理装置1は、上記のようなサービスを提供する各種サーバと連携し、サービスを仲介してもよいし、サービスの処理を担当してもよい。 For example, the services provided by the information processing device 1 include search service, payment service, Internet connection, SNS (Social Networking Service), electronic commerce (EC), online games, online banking, online trading, accommodation and ticket reservations. , video/music distribution, news, maps, route searches, route guidance, route information, operation information, weather forecasts, and other services may be provided. The information processing device 1 may cooperate with various servers that provide the above-mentioned services, and may mediate the services or may be in charge of processing the services.

情報処理装置1は、各利用者Uの情報である利用者情報を記憶する記憶部を有しており、各利用者Uの利用者情報に基づいて、学習モデルを生成する。利用者情報には、利用者Uによる上述したサービスの利用履歴などの情報を含む履歴情報、利用者Uの属性情報などが含まれる。 The information processing device 1 has a storage unit that stores user information that is information about each user U, and generates a learning model based on the user information of each user U. The user information includes history information including information such as the usage history of the above-mentioned services by the user U, attribute information of the user U, and the like.

利用者Uの属性情報は、例えば、利用者Uの年齢、性別、職業、居住地などのデモグラフィック属性の情報である。利用者Uの履歴情報は、利用者Uの検索クエリの履歴情報である検索履歴情報、利用者Uの決済サービスの利用履歴情報である決済履歴情報、および利用者Uがアクセスしたウェブページの履歴情報である閲覧履歴情報などを含むが、これらの情報以外を含んでいてもよい。 The attribute information of the user U is, for example, information on demographic attributes such as the user U's age, gender, occupation, and place of residence. User U's history information includes search history information that is history information of user U's search queries, payment history information that is usage history information of user U's payment services, and history of web pages accessed by user U. It includes information such as browsing history information, but may also include other information.

情報処理装置1によって生成される学習モデルは、例えば、利用者Uの利用者情報などを入力とし、利用者Uの特定の行動に関する予測スコアを出力とする予測モデルであり、例えば、利用者情報から決済サービスにおける貸し倒れリスクに関するスコアである貸し倒れスコアを出力とする貸し倒れ予測モデルである。以下において、情報処理装置1によって生成される学習モデルが貸し倒れ予測モデルであるものとして説明するが、情報処理装置1によって生成される学習モデルは、検索履歴情報に基づいて生成される学習モデルであればよく、貸し倒れ予測モデルに限定されない。 The learning model generated by the information processing device 1 is, for example, a prediction model that inputs user information of user U and outputs a predicted score regarding a specific behavior of user U. This is a loan loss prediction model that outputs a loan loss score, which is a score related to loan loss risk in payment services. Although the following description assumes that the learning model generated by the information processing device 1 is a bad debt prediction model, the learning model generated by the information processing device 1 may be a learning model generated based on search history information. However, the present invention is not limited to bad debt prediction models.

図1に示すように、情報処理装置1は、記憶部に記憶された利用者情報に含まれる履歴情報から抽出する履歴情報を第1の条件で属性毎に絞り込む絞り込み処理を行う(ステップS1)。属性は、例えば、サイコグラフィック属性であり、例えば、ゴルフ、野球、サッカー、ファッション、旅行、政治、経済、テクノロジーなどといった利用者Uの興味関心の対象となり得る対象である。なお、以下において、情報処理装置1が第1の条件で絞り込んだ履歴情報を第1履歴情報と記載する場合がある。 As shown in FIG. 1, the information processing device 1 performs a narrowing process of narrowing down history information to be extracted from history information included in user information stored in a storage unit for each attribute based on a first condition (step S1). . The attributes are, for example, psychographic attributes, and are objects that may be of interest to the user U, such as golf, baseball, soccer, fashion, travel, politics, economy, technology, and the like. Note that in the following, the history information narrowed down by the information processing device 1 based on the first condition may be referred to as first history information.

第1の条件は、例えば、特定の属性を有する複数の利用者Uで共通性の高い検索クエリの履歴情報であるといった条件である。例えば、情報処理装置1は、属性がゴルフである場合、ゴルフ場で決済したり、ゴルフ用品を購入したりした利用者Uを、ゴルフに興味関心を有する利用者U、すなわち属性「ゴルフ」を有する利用者Uとして特定する。そして、情報処理装置1は、属性「ゴルフ」を有する複数の利用者Uで共通性の高い検索クエリの履歴情報を抽出する。 The first condition is, for example, the history information of a search query that is highly common to a plurality of users U having a specific attribute. For example, when the attribute is golf, the information processing device 1 treats the user U who has made a payment at a golf course or purchased golf equipment as a user U who has an interest in golf, that is, the attribute "golf". Identified as user U who has. Then, the information processing device 1 extracts history information of search queries that are highly common among a plurality of users U having the attribute "golf".

属性「ゴルフ」を有する複数の利用者Uで共通性の高い検索クエリは、例えば、検索ワードとして「ゴルフ場予約」、「ゴルフボール」、「ゴルフウェア」、「アイアン」、または「ドライバー」などを含む検索クエリである。情報処理装置1は、複数の利用者Uでの共通性が高い順に予め設定された数の検索ワードを抽出し、抽出した複数の検索ワードを第1履歴情報とする。 A search query that has a high degree of commonality among multiple users U having the attribute "golf" is, for example, a search word such as "golf course reservation," "golf ball," "golf wear," "iron," or "driver." is a search query containing . The information processing device 1 extracts a preset number of search words in descending order of commonality among the users U, and sets the extracted search words as first history information.

情報処理装置1は、例えば、同一の検索ワードを検索した利用者Uの数、および同一の検索ワードを含む検索クエリの数などに基づいて、複数の利用者Uでの共通性を検索ワード毎に判定する。 The information processing device 1 calculates commonality among a plurality of users U for each search word based on, for example, the number of users U who have searched for the same search word and the number of search queries that include the same search word. Judgment is made.

例えば、情報処理装置1は、同一の検索ワードを検索した利用者Uの数、および同一の検索ワードを含む検索クエリの数などを重み付けして加算して得られる値を、複数の利用者Uでの共通性を示す値として算出する。情報処理装置1は、共通性を示す値が高い順に予め設定された数の検索ワードを抽出し、抽出した複数の検索ワードを第1履歴情報とする。 For example, the information processing device 1 calculates a value obtained by weighting and adding the number of users U who searched the same search word, the number of search queries including the same search word, etc. Calculated as a value indicating the commonality in The information processing device 1 extracts a preset number of search words in descending order of the value indicating commonality, and sets the extracted plurality of search words as first history information.

次に、情報処理装置1は、第1履歴情報から第2の条件を満たす履歴情報を除外する処理を属性毎に行う除外処理を行う(ステップS2)。第2の条件は、例えば、除外対象の情報をリスト化した拒否リストに含まれるといった条件、または非除外対象の情報をリスト化した許可リストに含まれないといった条件である。なお、以下において、情報処理装置1が第2の条件を満たす履歴情報を除外した履歴情報を第2履歴情報と記載する場合がある。 Next, the information processing device 1 performs an exclusion process of excluding history information that satisfies the second condition from the first history information for each attribute (step S2). The second condition is, for example, a condition that the information is included in a rejection list that lists information to be excluded, or a condition that it is not included in a permission list that lists information that is not to be excluded. Note that, hereinafter, history information obtained by the information processing device 1 excluding history information that satisfies the second condition may be referred to as second history information.

第2の条件を満たす履歴情報は、例えば、利用者Uに対して配慮が必要な情報である要配慮個人情報である。拒否リストには、除外対象の情報として、例えば、要配慮個人情報が含まれる。また、許可リストには、非除外対象の情報として、例えば、要配慮個人情報に該当しない情報が含まれる。要配慮個人情報は、例えば、個人情報保護法に定義される情報、またはセンシティブな情報である。 The history information that satisfies the second condition is, for example, consideration-required personal information that is information that requires consideration for the user U. The rejection list includes, for example, sensitive personal information as information to be excluded. Further, the permission list includes, for example, information that does not correspond to special consideration personal information as information that is not to be excluded. The sensitive personal information is, for example, information defined in the Personal Information Protection Law or sensitive information.

拒否リストや許可リストにおいて、除外対象の情報や非除外対象の情報は、ベクトル化されていてもよい。この場合、第2の条件は、例えば、拒否リストに含まれる除外対象の情報とベクトルが類似するといった条件、または許可リストに含まれる非除外対象の情報とベクトルが類似しないといった条件である。 In the denial list and the permission list, information on exclusion targets and information on non-exclusion targets may be vectorized. In this case, the second condition is, for example, a condition that the vector is similar to exclusion target information included in the rejection list, or a condition that the vector is not similar to non-exclusion target information included in the permission list.

次に、情報処理装置1は、ステップS2で第2の条件を満たす履歴情報を除外した履歴情報である第2履歴情報および決済サービスを過去に利用した複数の利用者Uの利用者情報などを用いて、貸し倒れ予測モデルを生成する学習モデル生成処理を行う(ステップS3)。 Next, the information processing device 1 collects second history information that is history information excluding history information that satisfies the second condition in step S2, user information of a plurality of users U who used the payment service in the past, etc. A learning model generation process for generating a bad debt prediction model is performed using the learning model (step S3).

ステップS3の処理において、情報処理装置1は、属性推定モデル生成処理(ステップS3-1)と予測モデル生成処理(S3-2)を行う。情報処理装置1は、ステップS3-1の属性推定モデル生成処理において、第2履歴情報に含まれる複数の検索ワードを素性に含み且つ属性毎の属性スコアを出力する属性推定モデルを生成する。属性スコアは、属性推定モデルでの推定対象となる属性を利用者Uが有する可能性が高いほど高くなるが、かかる例に限定されない。 In the process of step S3, the information processing device 1 performs an attribute estimation model generation process (step S3-1) and a predictive model generation process (S3-2). In the attribute estimation model generation process of step S3-1, the information processing device 1 generates an attribute estimation model that includes a plurality of search words included in the second history information in its features and outputs an attribute score for each attribute. The attribute score increases as the possibility that the user U has the attribute to be estimated by the attribute estimation model increases, but the attribute score is not limited to this example.

属性毎の属性推定モデルは、例えば、属性「ゴルフ」の属性推定モデル、属性「野球」の属性推定モデル、属性「サッカー」の属性推定モデル、属性「ファッション」の属性推定モデル、属性「旅行」の属性推定モデルなどである。属性推定モデルの素性には、例えば、属性情報なども含まれるが、かかる例に限定されない。 The attribute estimation model for each attribute is, for example, an attribute estimation model for the attribute "golf", an attribute estimation model for the attribute "baseball", an attribute estimation model for the attribute "soccer", an attribute estimation model for the attribute "fashion", and an attribute estimation model for the attribute "travel". attribute estimation models, etc. The features of the attribute estimation model include, for example, attribute information, but are not limited to such examples.

情報処理装置1は、ステップS3-2の予測モデル生成処理において、決済サービスを過去に利用した利用者Uの利用者情報と属性推定モデルで得られる属性毎の属性スコアとを含む情報を学習用情報として、属性推定モデルで属性スコアが得られる各属性を素性に含む貸し倒れ予測モデルを生成する。 In the predictive model generation process of step S3-2, the information processing device 1 uses information for learning including the user information of the user U who used the payment service in the past and the attribute score for each attribute obtained by the attribute estimation model. As information, a bad debt prediction model is generated that includes in its features each attribute for which an attribute score can be obtained using the attribute estimation model.

過去に利用した利用者Uの利用者情報は、例えば、利用者Uの属性情報、利用者Uの閲覧履歴情報、および利用者Uの決済サービスの履歴情報などを含む。決済サービスの履歴情報は、貸し倒れの有無を示す情報を含む。貸し倒れの有無を示す情報は、ステップS3-2の予測モデル生成処理において、ラベルデータ(正解データ)として用いられる。 The user information of the user U who used the service in the past includes, for example, attribute information of the user U, browsing history information of the user U, history information of the payment service of the user U, and the like. The history information of the payment service includes information indicating the presence or absence of bad debts. Information indicating the presence or absence of bad debt is used as label data (correct data) in the predictive model generation process of step S3-2.

情報処理装置1は、第2の条件を満たす履歴情報を除外した後の履歴情報である第2履歴情報に含まれる情報を素性とする属性推定モデルで得られる属性スコアと第2の条件を満たす履歴情報を除外する前の履歴情報に含まれる情報を素性とする属性推定モデルで得られる属性スコアと差であるスコア差を属性毎に算出する。 The information processing device 1 satisfies the second condition with an attribute score obtained by an attribute estimation model whose feature is information included in second history information that is history information after excluding history information that satisfies the second condition. A score difference is calculated for each attribute, which is the difference from the attribute score obtained by the attribute estimation model whose background is information included in the history information before excluding the history information.

そして、情報処理装置1は、上述したスコア差が予め定められた値以上である属性の属性スコアを用いずに貸し倒れ予測モデルを生成することもできる。これにより、要配慮個人情報などを除外することによって、属性スコアの精度が悪くなる属性推定モデルが出力する属性スコアが考慮されないことから、貸し倒れスコアの精度が悪化することを抑制することができる。 The information processing device 1 can also generate a bad debt prediction model without using the attribute scores of the attributes for which the score difference described above is greater than or equal to a predetermined value. As a result, since the attribute score output by the attribute estimation model, which deteriorates the accuracy of the attribute score by excluding personal information requiring special consideration, is not taken into account, it is possible to prevent the accuracy of the bad debt score from deteriorating.

このように、実施形態に係る情報処理装置1では、第1の条件で絞り込まれた利用者Uの履歴情報から第2の条件を満たす履歴情報を除外し、第2の条件を満たす履歴情報が除外された利用者Uの履歴情報を用いて、属性推定モデルや貸し倒れ予測モデルなどの学習モデルを生成する。これにより、情報処理装置1は、利用者Uの履歴情報を用いて生成される学習モデルを適切に生成することができる。 In this way, the information processing device 1 according to the embodiment excludes the history information that satisfies the second condition from the history information of the user U narrowed down based on the first condition, and excludes the history information that satisfies the second condition. Using the history information of the excluded user U, learning models such as an attribute estimation model and a bad debt prediction model are generated. Thereby, the information processing device 1 can appropriately generate a learning model generated using the user U's history information.

以下、このような処理を行う情報処理装置1を含む情報処理システムの構成などについて、詳細に説明する。 Hereinafter, the configuration of an information processing system including the information processing apparatus 1 that performs such processing will be described in detail.

〔2.情報処理システムの構成〕
図2は、実施形態に係る情報処理システムの構成の一例を示す図である。図2に示すように、実施形態に係る情報処理システム100は、情報処理装置1と、端末装置2,2,・・・,2とを含む。
[2. Information processing system configuration]
FIG. 2 is a diagram illustrating an example of the configuration of the information processing system according to the embodiment. As shown in FIG. 2, the information processing system 100 according to the embodiment includes an information processing device 1 and terminal devices 2 1 , 2 2 , . . . , 2 n .

端末装置2は、利用者Uによって用いられ、端末装置2は、利用者Uによって用いられ、端末装置2は、利用者Uによって用いられる。以下において、端末装置2,2,・・・,2の各々を個別に区別せずに示す場合、端末装置2と記載する場合がある。 Terminal device 2 1 is used by user U 1 , terminal device 2 2 is used by user U 2 , and terminal device 2 n is used by user U n . In the following, when each of the terminal devices 2 1 , 2 2 , .

情報処理装置1および端末装置2は、ネットワークNを介して、有線または無線により互いに通信可能に接続される。なお、図2に示す情報処理システム100には、情報処理装置1が複数含まれてもよい。 The information processing device 1 and the terminal device 2 are connected to each other via a network N so that they can communicate with each other by wire or wirelessly. Note that the information processing system 100 shown in FIG. 2 may include a plurality of information processing apparatuses 1.

端末装置2は、例えば、デスクトップ型PC(Personal Computer)、ノート型PC、タブレット端末、携帯電話機、またはPDA(Personal Digital Assistant)などである。なお、端末装置2は、上記例に限定されなくともよく、例えば、スマートウォッチまたはウェアラブルデバイス(Wearable Device)などであってもよい。 The terminal device 2 is, for example, a desktop PC (Personal Computer), a notebook PC, a tablet terminal, a mobile phone, a PDA (Personal Digital Assistant), or the like. Note that the terminal device 2 is not limited to the above example, and may be, for example, a smart watch or a wearable device.

〔3.情報処理装置1の構成〕
図3は、実施形態に係る情報処理装置1の構成の一例を示す図である。図3に示すように、情報処理装置1は、通信部10と、記憶部11と、処理部12とを有する。
[3. Configuration of information processing device 1]
FIG. 3 is a diagram showing an example of the configuration of the information processing device 1 according to the embodiment. As shown in FIG. 3, the information processing device 1 includes a communication section 10, a storage section 11, and a processing section 12.

〔3.1.通信部10〕
通信部10は、例えば、NIC(Network Interface Card)などによって実現される。そして、通信部10は、ネットワークNと有線または無線で接続され、他の各種装置との間で情報の送受信を行う。例えば、通信部10は、端末装置2との間でネットワークNを介して情報の送受信を行う。
[3.1. Communication department 10]
The communication unit 10 is realized by, for example, a NIC (Network Interface Card). The communication unit 10 is connected to the network N by wire or wirelessly, and transmits and receives information to and from various other devices. For example, the communication unit 10 transmits and receives information to and from the terminal device 2 via the network N.

〔3.2.記憶部11〕
記憶部11は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子、または、ハードディスク、光ディスクなどの記憶装置によって実現される。記憶部11は、利用者情報記憶部20を有する。
[3.2. Storage unit 11]
The storage unit 11 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory, or a storage device such as a hard disk or an optical disk. The storage unit 11 includes a user information storage unit 20.

〔3.2.1.利用者情報記憶部20〕
利用者情報記憶部20は、利用者Uに関する各種利用者情報を記憶する。図4は、実施形態に係る利用者情報記憶部20に記憶される利用者情報テーブルの一例を示す図である。図4に示す例では、利用者情報記憶部20に記憶される利用者情報テーブルは、「利用者ID」、「利用者名」、「属性情報」、および「履歴情報」といった項目の情報を含む。
[3.2.1. User information storage unit 20]
The user information storage unit 20 stores various types of user information regarding the user U. FIG. 4 is a diagram showing an example of a user information table stored in the user information storage unit 20 according to the embodiment. In the example shown in FIG. 4, the user information table stored in the user information storage unit 20 includes information on items such as "user ID", "user name", "attribute information", and "history information". include.

「利用者ID」は、利用者Uを識別する識別子である。「利用者名」は、利用者Uの名称を示す情報である。「属性情報」は、「利用者ID」に対応付けられた利用者Uの属性に関する属性情報である。例えば、属性情報は、利用者Uの性別、年齢、職業、居住地などのデモグラフィック属性の情報である。なお、上述した属性情報は、一例に過ぎず、例えば、興味・関心、ライフスタイルなどのサイコグラフィック属性の情報などの様々な情報が含まれてもよい。 “User ID” is an identifier that identifies user U. “User name” is information indicating the name of user U. "Attribute information" is attribute information regarding the attributes of the user U associated with the "user ID." For example, the attribute information is information on demographic attributes such as the user U's gender, age, occupation, and place of residence. Note that the above-mentioned attribute information is only an example, and may include various information such as information on psychographic attributes such as interest, lifestyle, and the like.

「履歴情報」は、サービスの利用履歴などの情報を含む履歴情報であり、例えば、利用者Uの決済履歴情報、利用者Uの検索履歴情報、および利用者Uの閲覧履歴情報などを含む。 "History information" is history information including information such as service usage history, and includes, for example, user U's payment history information, user U's search history information, user U's browsing history information, and the like.

利用者Uの決済履歴情報は、例えば、決済サービスを用いた利用者Uの決済履歴の情報である。決済サービスは、後払い決済サービスであり、例えば、クレジットカードを用いた決済サービス、後払い電子マネーを用いた決済サービス、請求書後払いサービス、後払いアプリを用いた決済サービス、キャリア決済サービスなどであるが、かかる例に限定されない。 The user U's payment history information is, for example, information about the user U's payment history using a payment service. The payment service is a deferred payment payment service, such as a payment service using a credit card, a payment service using deferred payment electronic money, a bill payment service, a payment service using a deferred payment application, a carrier payment service, etc. The examples are not limited to such examples.

利用者Uの決済履歴情報には、利用者Uへの貸し出し日時、貸し出し額、および貸し倒れの有無などを示す情報が含まれる。貸し出し額の情報は、利用者Uに貸し出された金額を示す情報である。決済サービスにおいて、決済期限を徒過しても返済されない場合に貸し倒れがあると判定されて、貸し倒れありとする情報が利用者Uの決済履歴情報に設定され、決済期限までに返済された場合に貸し倒れがないと判定されて、貸し倒れなしとする情報が利用者Uの決済履歴情報に設定される。 The payment history information of the user U includes information indicating the date and time of lending to the user U, the loan amount, and whether or not there is a default on the loan. The loan amount information is information indicating the amount lent to user U. In a payment service, if a loan is not repaid even after the payment deadline has passed, it is determined that there is a default on the loan, information indicating that there is a default on the loan is set in the payment history information of user U, and if the loan is repaid by the payment deadline, It is determined that there is no bad debt, and information indicating that there is no bad debt is set in the payment history information of user U.

利用者Uの決済履歴情報には、利用者Uが決済サービスを用いてオンライン、実店舗、または実施設などにおいて購入した商品に関する購入履歴情報、および利用者Uが決済サービスを用いてオンライン、実店舗、または実施設などにおいて有料で利用したサービスに関するサービス利用履歴情報などが含まれる。 User U's payment history information includes purchase history information regarding products that User U purchased online, at a physical store, or at a physical facility using a payment service; This includes service usage history information regarding services used for a fee at stores or actual facilities.

購入履歴情報には、利用者Uが購入した商品の情報、購入費用の情報、購入日時、購入店舗の情報などが含まれる。サービス利用履歴情報には、利用者Uが利用したサービスの情報、利用費用の情報、利用日時、利用店舗の情報などが含まれる。 The purchase history information includes information on products purchased by user U, purchase cost information, purchase date and time, purchase store information, and the like. The service usage history information includes information on services used by user U, information on usage fees, date and time of usage, information on stores used, and the like.

利用者Uの検索履歴情報は、例えば、検索サイトでのウェブコンテンツの検索履歴の情報、各種のウェブサイトでの検索履歴の情報などである。利用者Uの検索履歴情報は、例えば、検索サイトやポータルサイトでのウェブコンテンツの検索履歴の情報などである。 The search history information of the user U is, for example, information on the search history of web content on search sites, information on the search history on various websites, and the like. The user U's search history information is, for example, information on the search history of web content on search sites and portal sites.

利用者Uの閲覧履歴情報は、利用者Uのウェブコンテンツの閲覧履歴の情報であり、例えば、利用者Uの物件情報の閲覧履歴、コンビニエンスストアやスーパーマーケットなどの店舗のチラシの閲覧情報などの種々の情報を含む。 User U's browsing history information is information on user U's browsing history of web content, and includes various information such as user U's browsing history of property information, browsing information on leaflets of stores such as convenience stores and supermarkets, etc. Contains information.

なお、利用者情報には、利用者Uの移動履歴情報も含まれていてもよい。利用者Uの移動履歴情報は、利用者Uの移動履歴の情報であり、例えば、単位時間毎の利用者Uの位置の情報を含む。なお、利用者Uの移動履歴情報は、訪問した店舗や施設などの情報であってもよい。 Note that the user information may also include movement history information of the user U. The movement history information of the user U is information on the movement history of the user U, and includes, for example, information on the position of the user U for each unit time. Note that the movement history information of the user U may be information on visited stores, facilities, and the like.

〔3.3.処理部12〕
処理部12は、コントローラ(Controller)であり、例えば、CPU(Central Processing Unit)またはMPU(Micro Processing Unit)などのプロセッサによって、情報処理装置1内部の記憶装置(例えば、記憶部11)に記憶されている各種プログラム(情報処理プログラムの一例)がRAMを作業領域として実行されることにより実現される。また、処理部12は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により一部または全部が実現されてもよい。
[3.3. Processing unit 12]
The processing unit 12 is a controller, and is stored in a storage device (for example, the storage unit 11) inside the information processing device 1 by a processor such as a CPU (Central Processing Unit) or an MPU (Micro Processing Unit). This is realized by executing various programs (an example of an information processing program) using the RAM as a work area. Furthermore, the processing unit 12 may be partially or entirely realized by an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).

図3に示すように、処理部12は、取得部30と、表示処理部31と、絞り込み部32と、除外部33と、学習部34とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、処理部12の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。 As shown in FIG. 3, the processing unit 12 includes an acquisition unit 30, a display processing unit 31, a narrowing down unit 32, an exclusion unit 33, and a learning unit 34, and has information processing functions described below. accomplish or carry out an action. Note that the internal configuration of the processing unit 12 is not limited to the configuration shown in FIG. 3, and may be any other configuration as long as it performs information processing to be described later.

〔3.3.1.取得部30〕
取得部30は、各種情報を取得する。取得部30は、記憶部11から各種の情報を取得する。取得部30は、利用者情報記憶部20から各種の情報を取得する。
[3.3.1. Acquisition unit 30]
The acquisition unit 30 acquires various information. The acquisition unit 30 acquires various information from the storage unit 11. The acquisition unit 30 acquires various types of information from the user information storage unit 20.

また、取得部30は、例えば、外部装置3から利用者Uの情報である利用者情報を取得し、取得した利用者情報を利用者情報記憶部20に記憶することもできる。 Further, the acquisition unit 30 can also acquire user information, which is information about the user U, from the external device 3 and store the acquired user information in the user information storage unit 20, for example.

〔3.3.2.表示処理部31〕
表示処理部31は、各種情報を表示部14に表示する。例えば、表示処理部31は、入力部13への操作者による入力操作に応じた情報を表示部14に表示させることができる。
[3.3.2. Display processing unit 31]
The display processing section 31 displays various information on the display section 14. For example, the display processing unit 31 can cause the display unit 14 to display information according to an input operation by an operator to the input unit 13.

また、表示処理部31は、絞り込み部32によって処理された情報、除外部33によって処理された情報、および学習部34によって処理された情報を表示部14に表示させることができる。なお、図1に示す例では、表示部14は、情報処理装置1と別体で設けられるが、情報処理装置1に含まれる構成であってもよい。 Further, the display processing unit 31 can display the information processed by the narrowing down unit 32, the information processed by the exclusion unit 33, and the information processed by the learning unit 34 on the display unit 14. In the example shown in FIG. 1, the display unit 14 is provided separately from the information processing device 1, but may be included in the information processing device 1.

〔3.3.3.絞り込み部32〕
絞り込み部32は、利用者情報記憶部20に記憶された利用者情報に含まれる履歴情報から抽出する履歴情報を第1の条件で属性毎に絞り込む絞り込み処理を行う。絞り込み対象となる属性は、例えば、サイコグラフィック属性であり、例えば、ゴルフ、野球、サッカー、ファッション、旅行、政治、経済、テクノロジーなどといった利用者Uの興味関心の対象となり得る対象である。
[3.3.3. Narrowing down section 32]
The narrowing down section 32 performs a narrowing down process of narrowing down history information to be extracted from the history information included in the user information stored in the user information storage section 20 for each attribute based on a first condition. The attributes to be narrowed down are, for example, psychographic attributes, and are objects that may be of interest to the user U, such as golf, baseball, soccer, fashion, travel, politics, economy, technology, and the like.

第1の条件は、例えば、絞り込み対象となる属性を有する複数の利用者Uで共通性の高い履歴情報であるといった条件である。ここで、共通性の高い履歴情報とは、例えば、共通性の高い検索クエリの履歴情報である。 The first condition is, for example, that history information has a high degree of commonality among a plurality of users U who have attributes to be narrowed down. Here, history information with high commonality is, for example, history information of search queries with high commonality.

絞り込み部32は、例えば、履歴情報に含まれる検索履歴情報に基づいて、絞り込み対象となる属性を有する複数の利用者Uを属性毎に判定する。例えば、絞り込み部32は、絞り込み対象となる属性がゴルフである場合、ゴルフ場で決済したり、ゴルフ用品を購入したりした利用者Uを、ゴルフに興味関心を有する利用者U、すなわち属性「ゴルフ」を有する利用者Uとして特定する。 The narrowing down unit 32 determines, for each attribute, a plurality of users U having attributes to be narrowed down, based on search history information included in the history information, for example. For example, if the attribute to be narrowed down is golf, the narrowing down unit 32 may classify the user U who has made a payment at a golf course or purchased golf equipment from a user U who has an interest in golf, that is, the attribute " Identified as user U who has "Golf".

また、絞り込み部32は、例えば、履歴情報に含まれる決済履歴情報に代えてまたは加えて、履歴情報に含まれる閲覧履歴情報に基づいて、絞り込み対象となる属性を有する複数の利用者Uを属性毎に判定することもできる。例えば、絞り込み部32は、絞り込み対象となる属性がゴルフである場合、ゴルフに関するウェブコンテンツを頻繁に閲覧する利用者Uを、属性「ゴルフ」を有する利用者Uとして特定することができる。 In addition, for example, instead of or in addition to the payment history information included in the history information, the narrowing down unit 32 selects a plurality of users U having the attributes to be narrowed down based on the viewing history information included in the history information. It is also possible to judge each time. For example, when the attribute to be narrowed down is golf, the narrowing down unit 32 can identify a user U who frequently views web content related to golf as a user U having the attribute "golf."

そして、絞り込み部32は、属性「ゴルフ」を有する複数の利用者Uで共通性の高い検索クエリの履歴情報を抽出する。属性「ゴルフ」を有する複数の利用者Uで共通性の高い検索クエリは、例えば、検索ワードとして「ゴルフ場予約」、「ゴルフボール」、「ゴルフウェア」、「アイアン」、または「ドライバー」などを含む検索クエリである。絞り込み部32は、複数の利用者Uでの共通性が高い順に予め設定された数の検索ワードを抽出し、抽出した複数の検索ワードを第1履歴情報とする。 Then, the narrowing down unit 32 extracts history information of search queries that are highly common among a plurality of users U having the attribute "golf". A search query that has a high degree of commonality among multiple users U having the attribute "golf" is, for example, a search word such as "golf course reservation," "golf ball," "golf wear," "iron," or "driver." is a search query containing . The narrowing down unit 32 extracts a preset number of search words in descending order of commonality among a plurality of users U, and sets the extracted plurality of search words as first history information.

絞り込み部32は、例えば、同一の検索ワードを検索した利用者Uの数である第1の数、および同一の検索ワードを含む検索クエリの数である第2の数などに基づいて、複数の利用者Uでの共通性を検索ワード毎に判定する。第1の数は、絞り込み対象となる属性を有する複数の利用者Uのうち同一の検索ワードを検索した利用者Uの数である。また、第2の数は、絞り込み対象となる属性を有する複数の利用者Uの検索クエリのうち同一の検索ワードを含む検索クエリの数である。 The narrowing-down unit 32 selects a plurality of results based on, for example, a first number that is the number of users U who have searched for the same search word, and a second number that is the number of search queries that include the same search word. Commonality among users U is determined for each search word. The first number is the number of users U who have searched for the same search word among a plurality of users U who have attributes to be narrowed down. Moreover, the second number is the number of search queries that include the same search word among the search queries of a plurality of users U who have attributes to be narrowed down.

例えば、絞り込み部32は、第1の数および第2の数などを重み付けして加算して得られる値を、複数の利用者Uでの共通性を示す値として算出する。絞り込み部32は、共通性を示す値が高い順に予め設定された数の検索ワードを抽出し、抽出した複数の検索ワードを第1履歴情報とする。 For example, the narrowing down unit 32 calculates a value obtained by weighting and adding the first number, the second number, etc. as a value indicating the commonality among the plurality of users U. The narrowing down unit 32 extracts a preset number of search words in descending order of the value indicating commonality, and sets the extracted plurality of search words as first history information.

なお、絞り込み部32は、例えば、履歴情報に含まれる検索履歴情報に代えてまたは加えて、履歴情報に含まれる閲覧履歴情報などを絞り込み対象とすることもでき、その他の履歴情報を絞り込み対象とすることもできる。絞り込み対象が閲覧履歴情報の場合、絞り込み部32は、例えば、ウェブコンテンツまたはウェブコンテンツに含まれるワードを絞り込み対象とすることができる。 Note that the narrowing down section 32 can, for example, narrow down browsing history information included in the history information instead of or in addition to the search history information included in the history information, and may narrow down other history information. You can also. When the narrowing down target is browsing history information, the narrowing down unit 32 can narrow down web content or words included in the web content, for example.

〔3.3.4.除外部33〕
除外部33は、絞り込み部32によって第1の条件で絞り込まれた利用者の履歴情報から第2の条件を満たす履歴情報を除外して第2履歴情報を得る。
[3.3.4. Exclusion part 33]
The exclusion unit 33 obtains second history information by excluding history information that satisfies the second condition from the history information of the users narrowed down by the first condition by the narrowing down unit 32.

第2の条件は、例えば、除外対象の情報をリスト化した拒否リストに含まれるといった条件、または非除外対象の情報をリスト化した許可リストに含まれないといった条件である。第2の条件は、属性毎に設定される。すなわち、拒否リストや許可リストは属性毎に設定される。 The second condition is, for example, a condition that the information is included in a rejection list that lists information to be excluded, or a condition that it is not included in a permission list that lists information that is not to be excluded. The second condition is set for each attribute. That is, a deny list and a permit list are set for each attribute.

第2の条件を満たす履歴情報は、例えば、利用者Uに対して配慮が必要な情報である要配慮個人情報である。拒否リストには、除外対象の情報として、例えば、要配慮個人情報が含まれる。また、許可リストには、非除外対象の情報として、例えば、要配慮個人情報に該当しない情報が含まれる。 The history information that satisfies the second condition is, for example, consideration-required personal information that is information that requires consideration for the user U. The rejection list includes, for example, sensitive personal information as information to be excluded. Further, the permission list includes, for example, information that does not correspond to special consideration personal information as information that is not to be excluded.

要配慮個人情報は、例えば、個人情報保護法に定義される情報を含む履歴情報、またはセンシティブな履歴情報である。個人情報保護法に定義される要配慮個人情報は、本人の人種、信条、社会的身分、病歴、犯罪の経歴、犯罪により害を被った事実その他本人に対する不当な差別、偏見その他の不利益が生じないようにその取扱いに特に配慮を要する記述などが含まれる個人情報である。例えば、要配慮個人情報は、特定の病衣着に関する検索履歴である。また、センシティブな情報は、例えば、貧困などの経済状況に関する検索などである。 The sensitive personal information is, for example, historical information that includes information defined in the Personal Information Protection Act, or sensitive historical information. Personal information that requires special consideration as defined in the Personal Information Protection Act includes the person's race, creed, social status, medical history, criminal history, the fact that he or she has been harmed by a crime, and any other information that may cause unfair discrimination, prejudice, or other disadvantages to the person. This is personal information that includes descriptions that require special consideration when handling to prevent this from occurring. For example, the sensitive personal information is a search history regarding a specific hospital gown. In addition, sensitive information includes, for example, searches related to economic conditions such as poverty.

なお、除外部33は、センシティブな情報であっても、例えば、年収などといった経済状況に関する情報であり与信審査に必要とされる記述が含まれる情報は、貸し倒れと特定の関係を有する情報として、第2の条件を満たす履歴情報に含めないことができる。これにより、貸し倒れ予測モデルから出力される貸し倒れスコアの精度が悪化することを抑制することができる。 Note that even if the information is sensitive, the exclusion unit 33 treats it as information that has a specific relationship with bad debts, such as information related to economic conditions such as annual income and including descriptions required for credit screening. It may not be included in the history information that satisfies the second condition. Thereby, it is possible to suppress deterioration in the accuracy of the bad debt score output from the bad debt prediction model.

拒否リストや許可リストにおいて、除外対象の情報や非除外対象の情報は、ベクトル化されていてもよい。この場合、第2の条件は、例えば、拒否リストに含まれる除外対象の情報とベクトルが類似するといった条件、または許可リストに含まれる非除外対象の情報とベクトルが類似しないといった条件である。この場合、除外部33は、第1履歴情報に含まれる各検索ワードをベクトル化し、ベクトル化した検索ワードと拒否リストや許可リストと比較する。 In the denial list and the permission list, information on exclusion targets and information on non-exclusion targets may be vectorized. In this case, the second condition is, for example, a condition that the vector is similar to exclusion target information included in the rejection list, or a condition that the vector is not similar to non-exclusion target information included in the permission list. In this case, the exclusion unit 33 vectorizes each search word included in the first history information, and compares the vectorized search word with the rejection list and the permission list.

除外対象の情報や非除外対象の情報は、例えば、Word2Vecなどの自然言語処理方法によってベクトル化される。例えば、除外対象の情報や非除外対象の情報は、興味関心モデルを用いてベクトル化される。興味関心モデルは、予め定められた条件を満たす2以上の検索ワードを類似する特徴を有するものとして複数の検索ワードの各々が有する特徴を学習することによって学習済みモデルである。 Information on exclusion targets and information on non-exclusion targets are vectorized using a natural language processing method such as Word2Vec, for example. For example, information on excluded targets and information on non-excluded targets is vectorized using an interest model. The interest model is a model that has been trained by learning the features of each of a plurality of search words, assuming that two or more search words that meet predetermined conditions have similar features.

予め定められた条件を満たす2以上の検索ワードは、同一検索クエリに含まれる複数の検索ワード、または同一の利用者Uによって予め定められた時間内に端末装置2から送信される複数の検索クエリに含まれる検索ワードである。学習済みモデルは、例えば、再帰的ニューラルネットワークとも呼ばれるRNN(Recurrent Neural Network)の一種であるLSTM(Long Short-Term Memory)をベクトル生成(例えば、分散表現生成)に用いたDSSM(Deep Structured Semantic Model)の技術を用いて生成されるが、かかる例に限定されない。 Two or more search words that satisfy predetermined conditions are multiple search words included in the same search query, or multiple search queries sent from the terminal device 2 by the same user U within a predetermined time. is a search word included in . The trained model is, for example, a DSSM (Deep Structured Semantic Model) that uses LSTM (Long Short-Term Memory), which is a type of RNN (Recurrent Neural Network), also called a recurrent neural network, for vector generation (for example, distributed representation generation). ), but is not limited to this example.

なお、除外部33は、例えば、履歴情報に含まれる検索履歴情報に代えてまたは加えて、履歴情報に含まれる閲覧履歴情報などを除外処理の対象とすることもでき、その他の履歴情報を除外処理の対象とすることもできる。絞り込み対象が閲覧履歴情報の場合、除外部33は、例えば、ウェブコンテンツまたはウェブコンテンツに含まれるワードを除外処理の対象とすることができる。 Note that the exclusion unit 33 can, for example, target browsing history information included in the history information instead of or in addition to the search history information included in the history information, and exclude other history information. It can also be used as a processing target. When the narrowing-down target is browsing history information, the exclusion unit 33 can target web content or words included in the web content, for example.

〔3.3.5.学習部34〕
学習部34は、第1の条件で絞り込まれた利用者Uの履歴情報から第2の条件を満たす履歴情報が除外された履歴情報および決済サービスを過去に利用した複数の利用者Uの利用者情報などの情報を用いて、属性毎の属性スコアを出力する属性推定モデルおよび貸し倒れ予測モデルを生成する。
[3.3.5. Learning Department 34]
The learning unit 34 acquires history information from which history information that satisfies the second condition is excluded from the history information of the user U narrowed down based on the first condition and users of the plurality of users U who have used the payment service in the past. An attribute estimation model and a bad debt prediction model that output an attribute score for each attribute are generated using information such as information.

学習部34は、推定モデル生成部40と、予測モデル生成部41とを備える。以下において、推定モデル生成部40および予測モデル生成部41の各々について説明する。 The learning section 34 includes an estimated model generation section 40 and a predictive model generation section 41. Each of the estimated model generation section 40 and the prediction model generation section 41 will be explained below.

〔3.3.5.1.推定モデル生成部40〕
推定モデル生成部40は、第1の条件で絞り込まれた利用者Uの履歴情報から第2の条件を満たす履歴情報が除外された履歴情報である第2履歴情報を用いて、属性毎の属性スコアを出力する属性推定モデルを生成する。
[3.3.5.1. Estimated model generation unit 40]
The estimation model generation unit 40 generates attributes for each attribute using second history information that is history information obtained by excluding history information that satisfies the second condition from the history information of the user U narrowed down based on the first condition. Generate an attribute estimation model that outputs a score.

属性毎の属性スコアを出力する属性推定モデルは、属性毎の属性推定モデルを含む構成であるが、複数の属性の属性スコアを出力する単一の属性推定モデルであってもよく、その他の構成であってもよい。属性毎の属性推定モデルは、属性毎に互いに異なる第2履歴情報を用いて生成される。 The attribute estimation model that outputs attribute scores for each attribute has a configuration that includes an attribute estimation model for each attribute, but it may also be a single attribute estimation model that outputs attribute scores for multiple attributes, and other configurations may also be used. It may be. The attribute estimation model for each attribute is generated using different second history information for each attribute.

属性毎の属性推定モデルは、例えば、属性「ゴルフ」の属性推定モデル、属性「野球」の属性推定モデル、属性「サッカー」の属性推定モデル、属性「ファッション」の属性推定モデル、属性「旅行」の属性推定モデルなどである。 The attribute estimation model for each attribute is, for example, an attribute estimation model for the attribute "golf", an attribute estimation model for the attribute "baseball", an attribute estimation model for the attribute "soccer", an attribute estimation model for the attribute "fashion", and an attribute estimation model for the attribute "travel". attribute estimation models, etc.

推定モデル生成部40は、属性推定モデルの対象となる属性の第2履歴情報に含まれる複数の検索ワードを含む複数の情報を各々素性として含む属性推定モデルを属性毎に生成する。属性スコアは、属性推定モデルでの推定対象となる属性を利用者Uが有する可能性が高いほど高くなるが、かかる例に限定されない。属性毎の属性推定モデルは、属性毎に抽出された互いに異なる第2履歴情報に含まれる検索ワードを素性とするモデルである。 The estimated model generation unit 40 generates an attribute estimation model for each attribute, each of which includes, as features, a plurality of pieces of information including a plurality of search words included in the second history information of the attribute that is the target of the attribute estimation model. The attribute score increases as the possibility that the user U has the attribute to be estimated by the attribute estimation model increases, but the attribute score is not limited to this example. The attribute estimation model for each attribute is a model whose feature is a search word included in mutually different second history information extracted for each attribute.

推定モデル生成部40は、推定対象となる属性を有する複数の利用者Uの利用者情報を含む学習用情報に基づいて、例えば、推定対象となる属性を有する利用者Uの検索履歴に検索履歴が類似する利用者Uの属性スコアが高くなるように、属性推定モデルを機械学習によって生成する処理を属性毎に行う。 Based on learning information including user information of a plurality of users U who have attributes to be estimated, the estimation model generation unit 40 generates, for example, a search history in the search history of users U who have attributes to be estimated. A process of generating an attribute estimation model by machine learning is performed for each attribute so that the attribute score of the user U who is similar to the user U is high.

例えば、推定モデル生成部40は、属性「ゴルフ」を有する複数の利用者Uの利用者情報を含む学習用情報に基づいて、属性「ゴルフ」を有する利用者Uの検索履歴に検索履歴が類似する利用者Uの属性スコアが高くなるように、属性「ゴルフ」の属性推定モデルを生成する。 For example, the estimation model generation unit 40 generates a model whose search history is similar to the search history of the user U who has the attribute "golf" based on learning information including user information of a plurality of users U who has the attribute "golf". An attribute estimation model for the attribute "golf" is generated such that the attribute score of the user U becomes high.

学習用情報に含まれる利用者情報は、例えば、利用者Uの検索クエリの履歴情報、利用者Uの属性情報、および利用者Uの閲覧履歴情報などを含み、属性推定モデルの素性には、第2履歴情報に加えて、利用者Uの属性情報および閲覧履歴情報などが含まれるが、かかる例に限定されない。例えば、学習用情報に含まれる利用者情報は、利用者Uの属性情報および利用者Uの閲覧履歴情報の一方または両方を含まない情報であってもよく、その他の情報が含まれていてもよい。 The user information included in the learning information includes, for example, user U's search query history information, user U's attribute information, and user U's browsing history information, and the background of the attribute estimation model includes: In addition to the second history information, user U's attribute information and browsing history information are included, but the information is not limited to such examples. For example, the user information included in the learning information may be information that does not include one or both of user U's attribute information and user U's browsing history information, or may include other information. good.

〔3.3.5.2.予測モデル生成部41〕
予測モデル生成部41は、属性推定モデルから出力される属性毎の属性スコアを含む情報を入力とし、利用者Uの特定の行動に関する予測スコアを出力とする予測モデルを生成する。
[3.3.5.2. Prediction model generation unit 41]
The prediction model generation unit 41 receives information including the attribute score for each attribute output from the attribute estimation model, and generates a prediction model that outputs a prediction score regarding a specific behavior of the user U.

予測モデルは、例えば、属性推定モデルから出力される属性毎の属性スコアを含む情報を入力とし、貸し倒れリスクに関するスコアを出力とする貸し倒れ予測モデルであるが、かかる例に限定されない。例えば、予測モデルは、広告をクリックする可能性を示すスコアを出力するモデルや商品を購入する可能性を示すスコアを出力するモデルであってもよい。 The prediction model is, for example, a loan loss prediction model that inputs information including an attribute score for each attribute output from an attribute estimation model and outputs a score related to loan loss risk, but is not limited to such an example. For example, the prediction model may be a model that outputs a score indicating the possibility of clicking on an advertisement or a model that outputs a score indicating the possibility of purchasing a product.

予測モデル生成部41は、例えば、決済サービスを過去に利用した複数の利用者Uの利用者情報と属性推定モデルから出力される属性毎の属性スコアとを含む学習用情報を用いて、貸し倒れ予測モデルを生成する。貸し倒れ予測モデルの素性は、例えば、利用者Uの属性情報、利用者Uの閲覧履歴情報、および属性推定モデルで属性スコアが得られる各属性を含む。 The predictive model generation unit 41 uses learning information including, for example, user information of multiple users U who have used the payment service in the past and attribute scores for each attribute output from the attribute estimation model to predict bad debts. Generate the model. The background of the bad debt prediction model includes, for example, user U's attribute information, user U's browsing history information, and each attribute from which an attribute score is obtained by the attribute estimation model.

過去に利用した利用者Uの利用者情報であって学習用情報に含まれる利用者情報は、例えば、利用者Uの属性情報、利用者Uの閲覧履歴情報、および利用者Uの決済サービスの履歴情報などを含む。決済サービスの履歴情報は、貸し倒れの有無を示す情報を含む。貸し倒れの有無を示す情報は、ラベルデータ(正解データ)として用いられる。なお、貸し倒れ予測モデルの素性には、属性推定モデルで属性スコアが得られる属性が含まれていればよく上述した例に限定されない。 The user information of the user U who used the service in the past and is included in the learning information includes, for example, the attribute information of the user U, the browsing history information of the user U, and the information of the payment service of the user U. Contains history information, etc. The history information of the payment service includes information indicating the presence or absence of bad debts. Information indicating the presence or absence of bad debt is used as label data (correct data). Note that the background of the bad debt prediction model is not limited to the above example as long as it includes an attribute for which an attribute score can be obtained by the attribute estimation model.

予測モデル生成部41は、決済サービスを過去に利用した複数の利用者Uの利用者情報を属性毎の属性推定モデルに入力し、属性毎の属性推定モデルから出力される属性毎の属性スコアを取得する。 The predictive model generation unit 41 inputs the user information of a plurality of users U who used the payment service in the past into the attribute estimation model for each attribute, and calculates the attribute score for each attribute output from the attribute estimation model for each attribute. get.

そして、予測モデル生成部41は、決済サービスを過去に利用した各利用者Uの属性毎の属性スコアを含む情報と、決済サービスを過去に利用した各利用者Uの貸し倒れの有無を示す情報とに基づいて、利用者Uの属性毎の属性スコアを含む情報を入力とし貸し倒れスコアを出力とする貸し倒れ予測モデルを生成する。 Then, the predictive model generation unit 41 generates information including attribute scores for each attribute of each user U who used the payment service in the past, and information indicating whether or not each user U who used the payment service in the past had bad debts. Based on this, a bad debt prediction model is generated which takes as input information including the attribute score for each attribute of user U and outputs the bad debt score.

予測モデル生成部41は、第2の条件を満たす履歴情報を除外した後の履歴情報である第2履歴情報に含まれる情報を素性とする属性推定モデルで得られる属性スコアと第2の条件を満たす履歴情報を除外する前の履歴情報含まれる情報を素性とする属性推定モデルで得られる属性スコアと差であるスコア差を属性毎に算出する。 The predictive model generation unit 41 calculates the second condition and the attribute score obtained by the attribute estimation model whose feature is information included in the second history information, which is the history information after excluding the history information that satisfies the second condition. A score difference is calculated for each attribute, which is the difference between the attribute score and the attribute estimation model whose feature is the information included in the history information before excluding the history information that satisfies the requirement.

そして、予測モデル生成部41は、上述したスコア差が予め定められた値以上である属性の属性スコアを用いずに貸し倒れ予測モデルを生成することもできる。これにより、要配慮個人情報などを除外することによって、属性スコアの精度が悪くなる属性推定モデルが出力する属性スコアが考慮されないことから、貸し倒れスコアの精度が悪化することを抑制することができる。 The prediction model generation unit 41 can also generate a bad debt prediction model without using the attribute scores of the attributes for which the score difference is greater than or equal to a predetermined value. As a result, since the attribute score output by the attribute estimation model, which deteriorates the accuracy of the attribute score by excluding personal information requiring special consideration, is not taken into account, it is possible to prevent the accuracy of the bad debt score from deteriorating.

〔4.処理手順〕
次に、実施形態に係る情報処理装置1の処理部12による情報処理の手順について説明する。図5は、実施形態に係る情報処理装置1の処理部12による情報処理の一例を示すフローチャートである。
[4. Processing procedure]
Next, a procedure of information processing by the processing unit 12 of the information processing device 1 according to the embodiment will be described. FIG. 5 is a flowchart illustrating an example of information processing by the processing unit 12 of the information processing device 1 according to the embodiment.

図5に示すように、情報処理装置1の処理部12は、対象となる複数の属性のうち1つの属性を選択する(ステップS10)。次に、処理部12は、ステップS10で選択した属性について、履歴情報から抽出する履歴情報を第1の条件で絞り込む絞り込み処理を行う(ステップS11)。第1の条件は、ステップS10で選択した属性を有する複数の利用者Uで共通性の高い検索クエリの履歴情報が含まれるといった条件である。 As shown in FIG. 5, the processing unit 12 of the information processing device 1 selects one attribute from a plurality of target attributes (step S10). Next, for the attribute selected in step S10, the processing unit 12 performs a narrowing process to narrow down the history information to be extracted from the history information using a first condition (step S11). The first condition is that history information of search queries that are highly common to a plurality of users U having the attribute selected in step S10 is included.

次に、処理部12は、ステップS11において第1の条件で絞り込まれた利用者の履歴情報から第2の条件を満たす履歴情報を除外する除外処理を行う(ステップS12)。第2の条件は、例えば、除外対象の情報をリスト化した拒否リストに含まれるといった条件、または除外対象の情報をリスト化した許可リストに含まれないといった条件である。 Next, the processing unit 12 performs an exclusion process to exclude history information that satisfies the second condition from the history information of the users narrowed down based on the first condition in step S11 (step S12). The second condition is, for example, a condition that the information is included in a rejection list that lists information to be excluded, or a condition that it is not included in a permission list that lists information that is an exclusion target.

次に、処理部12は、未選択の属性があるか否かを判定する(ステップS13)。処理部12は、未選択の属性があると判定した場合(ステップS13:Yes)、処理をステップS10に移行する。 Next, the processing unit 12 determines whether there are any unselected attributes (step S13). When the processing unit 12 determines that there is an unselected attribute (step S13: Yes), the process proceeds to step S10.

処理部12は、未選択の属性がないと判定した場合(ステップS13:No)、属性毎に第2の条件を満たす履歴情報が除外された利用者Uの履歴情報を用いて、属性毎の属性スコアを出力する属性推定モデルを生成する(ステップS14)。 When the processing unit 12 determines that there is no unselected attribute (step S13: No), the processing unit 12 uses the history information of the user U from which the history information that satisfies the second condition for each attribute has been excluded, to select the An attribute estimation model that outputs an attribute score is generated (step S14).

そして、処理部12は、属性推定モデルから出力される属性毎の属性スコアを含む情報を入力とし、利用者Uの特定の行動に関する予測スコアを出力とする予測モデルを生成する(ステップS15)。処理部12は、ステップS14の処理が終了した場合、図5に示す処理を終了する。 Then, the processing unit 12 receives information including the attribute score for each attribute outputted from the attribute estimation model, and generates a prediction model that outputs a prediction score regarding a specific behavior of the user U (step S15). When the processing of step S14 is completed, the processing unit 12 ends the processing shown in FIG. 5.

〔5.変形例〕
処理部12は、第2履歴情報に含まれる複数の検索ワードをベクトル化して、属性毎に属性スコアを出力する属性推定モデルを生成することもできる。この場合、利用者Uの検索履歴に含まれる複数の検索ワードはベクトル化されて属性推定モデルに入力される。
[5. Modified example]
The processing unit 12 can also generate an attribute estimation model that outputs an attribute score for each attribute by vectorizing a plurality of search words included in the second history information. In this case, a plurality of search words included in the search history of user U are vectorized and input into the attribute estimation model.

上述した例では、処理部12は、属性毎の属性スコアを出力する属性推定モデルを生成し、かかる属性推定モデルによって出力される属性毎の属性スコアを用いて予測モデルを生成するが、属性推定モデルを生成せずに、第2履歴情報を素性とする予測モデルを生成することもできる。 In the above example, the processing unit 12 generates an attribute estimation model that outputs an attribute score for each attribute, and generates a prediction model using the attribute score for each attribute outputted by the attribute estimation model. It is also possible to generate a predictive model using the second history information as a feature without generating a model.

〔6.ハードウェア構成〕
上述してきた実施形態に係る情報処理装置1は、例えば図6に示すような構成のコンピュータ80によって実現される。図6は、実施形態に係る情報処理装置1の機能を実現するコンピュータ80の一例を示すハードウェア構成図である。コンピュータ80は、CPU81、RAM82、ROM(Read Only Memory)83、HDD(Hard Disk Drive)84、通信インターフェイス(I/F)85、入出力インターフェイス(I/F)86、およびメディアインターフェイス(I/F)87を有する。
[6. Hardware configuration]
The information processing apparatus 1 according to the embodiments described above is realized, for example, by a computer 80 having a configuration as shown in FIG. FIG. 6 is a hardware configuration diagram showing an example of a computer 80 that implements the functions of the information processing device 1 according to the embodiment. The computer 80 includes a CPU 81, a RAM 82, a ROM (Read Only Memory) 83, an HDD (Hard Disk Drive) 84, a communication interface (I/F) 85, an input/output interface (I/F) 86, and a media interface (I/F). )87.

CPU81は、ROM83またはHDD84に記憶されたプログラムに基づいて動作し、各部の制御を行う。ROM83は、コンピュータ80の起動時にCPU81によって実行されるブートプログラムや、コンピュータ80のハードウェアに依存するプログラムなどを記憶する。 The CPU 81 operates based on a program stored in the ROM 83 or HDD 84 and controls each part. The ROM 83 stores a boot program executed by the CPU 81 when the computer 80 is started, programs depending on the hardware of the computer 80, and the like.

HDD84は、CPU81によって実行されるプログラム、および、かかるプログラムによって使用されるデータなどを記憶する。通信インターフェイス85は、ネットワークN(図2参照)を介して他の機器からデータを受信してCPU81へ送り、CPU81が生成したデータを、ネットワークNを介して他の機器へ送信する。 The HDD 84 stores programs executed by the CPU 81 and data used by the programs. The communication interface 85 receives data from other devices via the network N (see FIG. 2) and sends it to the CPU 81, and sends data generated by the CPU 81 to the other devices via the network N.

CPU81は、入出力インターフェイス86を介して、ディスプレイやプリンタなどの出力装置、および、キーボードまたはマウスなどの入力装置を制御する。CPU81は、入出力インターフェイス86を介して、入力装置からデータを取得する。また、CPU81は、入出力インターフェイス86を介して生成したデータを出力装置へ出力する。 The CPU 81 controls output devices such as a display and a printer, and input devices such as a keyboard and a mouse via an input/output interface 86. The CPU 81 obtains data from an input device via the input/output interface 86. Further, the CPU 81 outputs the generated data to an output device via the input/output interface 86.

メディアインターフェイス87は、記録媒体88に記憶されたプログラムまたはデータを読み取り、RAM82を介してCPU81に提供する。CPU81は、かかるプログラムを、メディアインターフェイス87を介して記録媒体88からRAM82上にロードし、ロードしたプログラムを実行する。記録媒体88は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)などの光学記録媒体、MO(Magneto-Optical disk)などの光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリなどである。 Media interface 87 reads programs or data stored in recording medium 88 and provides them to CPU 81 via RAM 82. The CPU 81 loads this program from the recording medium 88 onto the RAM 82 via the media interface 87, and executes the loaded program. The recording medium 88 is, for example, an optical recording medium such as a DVD (Digital Versatile Disc) or a PD (Phase change rewritable disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory. etc.

例えば、コンピュータ80が実施形態に係る情報処理装置1として機能する場合、コンピュータ80のCPU81は、RAM82上にロードされたプログラムを実行することにより、処理部12の機能を実現する。また、HDD84には、記憶部11内のデータが記憶される。コンピュータ80のCPU81は、これらのプログラムを記録媒体88から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。 For example, when the computer 80 functions as the information processing device 1 according to the embodiment, the CPU 81 of the computer 80 realizes the functions of the processing unit 12 by executing a program loaded onto the RAM 82. Furthermore, data in the storage unit 11 is stored in the HDD 84 . The CPU 81 of the computer 80 reads these programs from the recording medium 88 and executes them, but as another example, these programs may be acquired from another device via the network N.

〔7.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[7. others〕
Furthermore, among the processes described in the above embodiments, all or part of the processes described as being performed automatically can be performed manually, or the processes described as being performed manually can be performed manually. All or part of the process can also be performed automatically using known methods. In addition, information including the processing procedures, specific names, and various data and parameters shown in the above documents and drawings may be changed arbitrarily, unless otherwise specified. For example, the various information shown in each figure is not limited to the illustrated information.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Furthermore, each component of each device shown in the drawings is functionally conceptual, and does not necessarily need to be physically configured as shown in the drawings. In other words, the specific form of distributing and integrating each device is not limited to what is shown in the diagram, and all or part of the devices can be functionally or physically distributed or integrated in arbitrary units depending on various loads and usage conditions. Can be integrated and configured.

例えば、上述した情報処理装置1は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットホームなどをAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。 For example, the information processing device 1 described above may be realized by a plurality of server computers, or depending on the function, it may be realized by calling an external platform using an API (Application Programming Interface) or network computing. can be changed flexibly.

また、上述してきた実施形態および変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 Furthermore, the embodiments and modifications described above can be combined as appropriate within a range that does not conflict with the processing contents.

〔8.効果〕
上述してきたように、実施形態に係る情報処理装置1は、除外部33と、学習部34とを備える。除外部33は、第1の条件で絞り込まれた利用者Uの履歴情報から第2の条件を満たす履歴情報を除外する。学習部34は、除外部33によって第2の条件を満たす履歴情報が除外された利用者Uの履歴情報を用いて、学習モデルを生成する。これにより、情報処理装置1は、利用者Uの履歴情報を用いて生成される学習モデルを適切に生成することができる。
[8. effect〕
As described above, the information processing device 1 according to the embodiment includes the exclusion section 33 and the learning section 34. The exclusion unit 33 excludes history information that satisfies the second condition from the history information of the user U narrowed down based on the first condition. The learning unit 34 generates a learning model using the history information of the user U from which the history information satisfying the second condition has been excluded by the exclusion unit 33. Thereby, the information processing device 1 can appropriately generate a learning model generated using the user U's history information.

また、履歴情報は、検索クエリの履歴情報である。これにより、情報処理装置1は、利用者Uの検索クエリの履歴情報を用いて生成される学習モデルを適切に生成することができる。 Further, the history information is history information of a search query. Thereby, the information processing device 1 can appropriately generate a learning model generated using the history information of the user U's search query.

また、情報処理装置1は、特定の属性を有する複数の利用者Uで共通性の高い検索クエリを第1の条件を満たす利用者Uの履歴情報として絞り込む絞り込み部32を備える。これにより、情報処理装置1は、利用者Uの検索クエリの履歴情報を用いて生成される学習モデルを適切に生成することができる。 The information processing device 1 also includes a narrowing down unit 32 that narrows down a search query that is highly common among a plurality of users U having a specific attribute as history information of the users U who satisfy the first condition. Thereby, the information processing device 1 can appropriately generate a learning model generated using the history information of the user U's search query.

また、学習部34は、除外部33によって第2の条件を満たす履歴情報が除外された利用者Uの履歴情報を用いて、利用者Uの履歴情報を含む情報を入力とし属性スコアを出力する属性推定モデルを生成する推定モデル生成部40を備える。これにより、情報処理装置1は、利用者Uの検索クエリの履歴情報を用いて生成される学習モデルをさらに適切に生成することができる。 Further, the learning unit 34 uses the history information of the user U from which the history information satisfying the second condition has been excluded by the exclusion unit 33, inputs information including the history information of the user U, and outputs an attribute score. It includes an estimated model generation unit 40 that generates an attribute estimation model. Thereby, the information processing device 1 can more appropriately generate a learning model generated using the history information of the user U's search query.

また、除外部33は、属性毎に異なる第1の条件で絞り込まれた利用者Uの履歴情報から属性毎に異なる第2の条件を満たす履歴情報を除外する。推定モデル生成部40は、属性毎に除外部33によって第2の条件を満たす履歴情報が除外された利用者Uの履歴情報を用いて、属性毎の属性スコアを出力する属性推定モデルを生成する。学習部34は、属性推定モデルから出力される属性毎の属性スコアを含む情報を入力とし、利用者Uの特定の行動に関する予測スコアを出力とする予測モデルを生成する予測モデル生成部41を備える。これにより、情報処理装置1は、利用者Uの検索クエリの履歴情報を用いて生成される予測モデルをさらに適切に生成することができる。 Furthermore, the exclusion unit 33 excludes history information that satisfies a second condition that differs for each attribute from the history information of the user U that has been narrowed down using a first condition that differs for each attribute. The estimation model generation unit 40 generates an attribute estimation model that outputs an attribute score for each attribute using the history information of the user U from which the history information that satisfies the second condition has been excluded by the exclusion unit 33 for each attribute. . The learning unit 34 includes a predictive model generating unit 41 that receives information including the attribute score for each attribute output from the attribute estimation model and generates a predictive model that outputs a predictive score regarding a specific behavior of the user U. . Thereby, the information processing device 1 can more appropriately generate a prediction model generated using the history information of the user U's search query.

また、予測モデルは、属性推定モデルから出力される属性スコアを入力とし、貸し倒れリスクに関するスコアを出力とする貸し倒れ予測モデルである。これにより、情報処理装置1は、利用者Uの検索クエリの履歴情報を用いて生成される貸し倒れ予測モデルを適切に生成することができる。 Further, the prediction model is a loan loss prediction model that takes as input the attribute score output from the attribute estimation model and outputs the score related to loan loss risk. Thereby, the information processing device 1 can appropriately generate a bad debt prediction model that is generated using the history information of the user U's search query.

また、学習部34は、第2の条件を満たす履歴情報を除外した後の履歴情報に含まれる情報を素性とする属性推定モデルで得られる属性スコアと第2の条件を満たす履歴情報を除外する前の履歴情報に含まれる情報を素性とする属性推定モデルで得られる属性スコアとの差を属性毎に算出し、差が予め定められた値以上である属性スコアを用いずに予測モデルを生成する。これにより、情報処理装置1は、利用者Uの検索クエリの履歴情報を用いて生成される学習モデルを適切に生成することができる。 Furthermore, the learning unit 34 excludes the attribute score obtained by the attribute estimation model whose feature is information included in the history information after excluding the history information that satisfies the second condition, and the history information that satisfies the second condition. Calculates the difference for each attribute from the attribute score obtained by an attribute estimation model whose feature is information contained in previous history information, and generates a prediction model without using attribute scores for which the difference is greater than a predetermined value. do. Thereby, the information processing device 1 can appropriately generate a learning model generated using the history information of the user U's search query.

また、除外部33は、除外対象の情報をリスト化した拒否リストを用いて、第1の条件で絞り込まれた利用者Uの履歴情報から第2の条件を満たす履歴情報を除外する。これにより、情報処理装置1は、第2の条件を満たす履歴情報を容易に除外することができる。 Furthermore, the exclusion unit 33 excludes history information that satisfies the second condition from the history information of the user U narrowed down based on the first condition, using a rejection list that lists information to be excluded. Thereby, the information processing device 1 can easily exclude history information that satisfies the second condition.

また、除外部33は、非除外対象の情報をリスト化した許可リストを用いて、第1の条件で絞り込まれた利用者Uの履歴情報から第2の条件を満たす履歴情報を除外する。これにより、情報処理装置1は、第2の条件を満たす履歴情報を容易に除外することができる。 Furthermore, the exclusion unit 33 excludes history information that satisfies the second condition from the history information of the user U narrowed down based on the first condition, using a permission list that lists non-exclusion target information. Thereby, the information processing device 1 can easily exclude history information that satisfies the second condition.

また、拒否リストにおいて、除外対象の情報はベクトル化されており、除外部33は、除外対象の情報とベクトルが類似する情報を第2の条件を満たす履歴情報として除外する。これにより、情報処理装置1は、第2の条件を満たす履歴情報を容易に除外することができる。 Further, in the rejection list, the information to be excluded is vectorized, and the exclusion unit 33 excludes information whose vector is similar to the information to be excluded as history information that satisfies the second condition. Thereby, the information processing device 1 can easily exclude history information that satisfies the second condition.

また、許可リストにおいて、非除外対象の情報はベクトル化されており、除外部33は、非除外対象の情報とベクトルが類似しない情報以外の情報を第2の条件を満たす履歴情報として除外する。これにより、情報処理装置1は、第2の条件を満たす履歴情報を容易に除外することができる。 Further, in the permission list, non-exclusion target information is vectorized, and the exclusion unit 33 excludes information other than information whose vector is not similar to the non-exclusion target information as history information that satisfies the second condition. Thereby, the information processing device 1 can easily exclude history information that satisfies the second condition.

また、第2の条件を満たすとして除外部によって除外される情報は、利用者Uに対して配慮が必要な情報である要配慮個人情報である。これにより、情報処理装置1は、差別的な判断を抑制した学習モデルを適切に生成することができる。 Further, the information that is excluded by the exclusion unit as satisfying the second condition is consideration-required personal information that is information that requires consideration for the user U. Thereby, the information processing device 1 can appropriately generate a learning model that suppresses discriminatory judgments.

また、第2の条件を満たすとして除外部によって除外される情報は、貸し倒れと特定の関係を有しておらず且つ利用者Uに対して配慮が必要な情報である要配慮個人情報である。これにより、情報処理装置1は、差別的な判断を抑制した学習モデルを適切に生成することができる。 Further, the information that is excluded by the exclusion unit as satisfying the second condition is consideration-required personal information that does not have a specific relationship with bad debt and that requires consideration for user U. Thereby, the information processing device 1 can appropriately generate a learning model that suppresses discriminatory judgments.

以上、本願の実施形態を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 Although the embodiments of the present application have been described above in detail based on the drawings, this is merely an example, and various modifications and improvements can be made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure section of the invention. It is possible to implement the invention in other forms.

また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。 Further, the above-mentioned "section, module, unit" can be read as "means", "circuit", etc. For example, the acquisition unit can be read as an acquisition means or an acquisition circuit.

1 情報処理装置
2,2,2,・・・,2 端末装置
3 外部装置
10 通信部
11 記憶部
12 処理部
13 入力部
14 表示部
20 利用者情報記憶部
30 取得部
31 表示処理部
32 絞り込み部
33 除外部
34 学習部
40 推定モデル生成部
41 予測モデル生成部
100 情報処理システム
N ネットワーク
1 Information processing device 2, 2 1 , 2 2 ,..., 2 n terminal device 3 External device 10 Communication section 11 Storage section 12 Processing section 13 Input section 14 Display section 20 User information storage section 30 Acquisition section 31 Display processing Section 32 Narrowing down section 33 Exclusion section 34 Learning section 40 Estimated model generation section 41 Prediction model generation section 100 Information processing system N network

Claims (15)

第1の条件で絞り込まれた利用者の履歴情報から第2の条件を満たす履歴情報を除外する除外部と、
前記除外部によって前記第2の条件を満たす履歴情報が除外された前記利用者の履歴情報を用いて、学習モデルを生成する学習部と、を備える
ことを特徴とする情報処理装置。
an exclusion unit that excludes history information that satisfies a second condition from the history information of users narrowed down by the first condition;
An information processing device comprising: a learning unit that generates a learning model using history information of the user from which history information that satisfies the second condition has been excluded by the exclusion unit.
前記履歴情報は、
検索クエリの履歴情報である
ことを特徴とする請求項1に記載の情報処理装置。
The history information is
The information processing device according to claim 1, wherein the information is history information of a search query.
特定の属性を有する複数の利用者で共通性の高い検索クエリを前記第1の条件を満たす利用者の履歴情報として絞り込む絞り込み部を備える
ことを特徴とする請求項2に記載の情報処理装置。
The information processing apparatus according to claim 2, further comprising a narrowing-down unit that narrows down search queries that are highly common among a plurality of users having a specific attribute as history information of users who satisfy the first condition.
前記学習部は、
前記除外部によって前記第2の条件を満たす履歴情報が除外された前記利用者の履歴情報を用いて、利用者の履歴情報を含む情報を入力とし属性スコアを出力する属性推定モデルを生成する推定モデル生成部を備える
ことを特徴とする請求項3に記載の情報処理装置。
The learning department is
Estimation that uses the user's history information from which history information that satisfies the second condition has been excluded by the exclusion unit to generate an attribute estimation model that receives information including the user's history information as input and outputs an attribute score. The information processing device according to claim 3, further comprising a model generation section.
前記除外部は、
前記属性毎に異なる前記第1の条件で絞り込まれた利用者の履歴情報から前記属性毎に異なる前記第2の条件を満たす履歴情報を除外し、
前記推定モデル生成部は、
前記属性毎に前記除外部によって前記第2の条件を満たす履歴情報が除外された前記利用者の履歴情報を用いて、前記属性毎の属性スコアを出力する前記属性推定モデルを生成し、
前記学習部は、
前記属性推定モデルから出力される前記属性毎の属性スコアを含む情報を入力とし、前記利用者の特定の行動に関する予測スコアを出力とする予測モデルを生成する予測モデル生成部を備える
ことを特徴とする請求項4に記載の情報処理装置。
The exclusion part is
Excluding history information that satisfies the second condition, which differs for each attribute, from the user's history information narrowed down by the first condition, which differs for each attribute;
The estimated model generation unit includes:
generating the attribute estimation model that outputs an attribute score for each attribute using the history information of the user from which history information that satisfies the second condition has been excluded by the exclusion unit for each attribute;
The learning department is
It is characterized by comprising a prediction model generation unit that receives information including an attribute score for each attribute output from the attribute estimation model and generates a prediction model that outputs a prediction score regarding a specific behavior of the user. The information processing device according to claim 4.
前記予測モデルは、
前記属性推定モデルから出力される属性スコアを入力とし、貸し倒れリスクに関するスコアを出力とする貸し倒れ予測モデルである
ことを特徴とする請求項5に記載の情報処理装置。
The prediction model is
The information processing device according to claim 5, wherein the information processing device is a loan loss prediction model that receives an attribute score output from the attribute estimation model as an input and outputs a score related to loan loss risk.
前記学習部は、
前記第2の条件を満たす履歴情報を除外した後の履歴情報に含まれる情報を素性とする前記属性推定モデルで得られる属性スコアと前記第2の条件を満たす履歴情報を除外する前の履歴情報に含まれる情報を素性とする前記属性推定モデルで得られる属性スコアとの差を前記属性毎に算出し、前記差が予め定められた値以上である属性スコアを用いずに前記予測モデルを生成する
ことを特徴とする請求項5または6に記載の情報処理装置。
The learning department is
An attribute score obtained by the attribute estimation model whose feature is information included in the history information after excluding the history information that satisfies the second condition, and history information before excluding the history information that satisfies the second condition. For each attribute, calculate the difference between the attribute score obtained by the attribute estimation model whose feature is information included in the attribute, and generate the prediction model without using the attribute score for which the difference is a predetermined value or more. The information processing device according to claim 5 or 6, characterized in that:
前記除外部は、
除外対象の情報をリスト化した拒否リストを用いて、前記第1の条件で絞り込まれた利用者の履歴情報から前記第2の条件を満たす履歴情報を除外する
ことを特徴とする請求項1に記載の情報処理装置。
The exclusion part is
According to claim 1, the history information that satisfies the second condition is excluded from the history information of the users narrowed down by the first condition using a rejection list that lists information to be excluded. The information processing device described.
前記除外部は、
非除外対象の情報をリスト化した許可リストを用いて、前記第1の条件で絞り込まれた利用者の履歴情報から前記第2の条件を満たす履歴情報を除外する
ことを特徴とする請求項1に記載の情報処理装置。
The exclusion part is
Claim 1 characterized in that history information that satisfies the second condition is excluded from the history information of users narrowed down by the first condition using a permission list that lists information that is not to be excluded. The information processing device described in .
前記拒否リストにおいて、
前記除外対象の情報はベクトル化されており、
前記除外部は、
前記除外対象の情報とベクトルが類似する情報を前記第2の条件を満たす履歴情報として除外する
ことを特徴とする請求項8に記載の情報処理装置。
In the rejection list,
The information to be excluded is vectorized,
The exclusion part is
The information processing apparatus according to claim 8, wherein information whose vector is similar to the information to be excluded is excluded as history information that satisfies the second condition.
前記許可リストにおいて、
前記非除外対象の情報はベクトル化されており、
前記除外部は、
前記非除外対象の情報とベクトルが類似しない情報以外の情報を前記第2の条件を満たす履歴情報として除外する
ことを特徴とする請求項9に記載の情報処理装置。
In the permission list,
The information on the non-excluded items is vectorized,
The exclusion part is
The information processing apparatus according to claim 9, wherein information other than information whose vector is not similar to the non-exclusion target information is excluded as history information that satisfies the second condition.
前記第2の条件を満たすとして前記除外部によって除外される情報は、
前記利用者に対して配慮が必要な情報である要配慮個人情報である
ことを特徴とする請求項8~11のいずれか1つに記載の情報処理装置。
Information excluded by the exclusion unit as satisfying the second condition is:
The information processing device according to any one of claims 8 to 11, characterized in that the information is consideration-required personal information that is information that requires consideration for the user.
前記第2の条件を満たすとして前記除外部によって除外される情報は、
貸し倒れと特定の関係を有しておらず且つ前記利用者に対して配慮が必要な情報である要配慮個人情報である
ことを特徴とする請求項6に記載の情報処理装置。
Information excluded by the exclusion unit as satisfying the second condition is:
The information processing device according to claim 6, wherein the information processing device is consideration-required personal information that does not have a specific relationship with bad debt and requires consideration for the user.
コンピュータが実行する情報処理方法であって、
第1の条件で絞り込まれた利用者の履歴情報から第2の条件を満たす履歴情報を除外する除外工程と、
前記除外工程によって前記第2の条件を満たす履歴情報が除外された前記利用者の履歴情報を用いて、学習モデルを生成する学習工程と、を含む
ことを特徴とする情報処理方法。
An information processing method performed by a computer, the method comprising:
an exclusion step of excluding history information that satisfies a second condition from the user's history information narrowed down by the first condition;
An information processing method comprising: a learning step of generating a learning model using history information of the user from which history information satisfying the second condition has been excluded in the exclusion step.
第1の条件で絞り込まれた利用者の履歴情報から第2の条件を満たす履歴情報を除外する除外手順と、
前記除外手順によって前記第2の条件を満たす履歴情報が除外された前記利用者の履歴情報を用いて、学習モデルを生成する学習手順と、をコンピュータに実行させる
ことを特徴とする情報処理プログラム。
an exclusion procedure for excluding history information that satisfies a second condition from the history information of users narrowed down by the first condition;
An information processing program that causes a computer to execute a learning procedure for generating a learning model using history information of the user from which history information satisfying the second condition has been excluded by the exclusion procedure.
JP2022069509A 2022-04-20 2022-04-20 Information processing device, information processing method, and information processing program Active JP7354341B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022069509A JP7354341B1 (en) 2022-04-20 2022-04-20 Information processing device, information processing method, and information processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022069509A JP7354341B1 (en) 2022-04-20 2022-04-20 Information processing device, information processing method, and information processing program

Publications (2)

Publication Number Publication Date
JP7354341B1 JP7354341B1 (en) 2023-10-02
JP2023159664A true JP2023159664A (en) 2023-11-01

Family

ID=88198140

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022069509A Active JP7354341B1 (en) 2022-04-20 2022-04-20 Information processing device, information processing method, and information processing program

Country Status (1)

Country Link
JP (1) JP7354341B1 (en)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014080678A1 (en) * 2012-11-22 2014-05-30 ソニー株式会社 Information processing device, system, information processing method and program
JP2016038822A (en) * 2014-08-08 2016-03-22 ヤフー株式会社 Extraction device, extraction method, and extraction program
JP2016062475A (en) * 2014-09-19 2016-04-25 ヤフー株式会社 Retrieval control program, retrieval device, retrieval control method, and retrieval system
JP2018045573A (en) * 2016-09-16 2018-03-22 ヤフー株式会社 Determination device, determination method, determination program, generation device, generation method, and generation program
JP2019020882A (en) * 2017-07-13 2019-02-07 本田技研工業株式会社 Life log utilization system, method and program
JP2020071680A (en) * 2018-10-31 2020-05-07 ヤフー株式会社 Prediction device, prediction method, and prediction program

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014080678A1 (en) * 2012-11-22 2014-05-30 ソニー株式会社 Information processing device, system, information processing method and program
JP2016038822A (en) * 2014-08-08 2016-03-22 ヤフー株式会社 Extraction device, extraction method, and extraction program
JP2016062475A (en) * 2014-09-19 2016-04-25 ヤフー株式会社 Retrieval control program, retrieval device, retrieval control method, and retrieval system
JP2018045573A (en) * 2016-09-16 2018-03-22 ヤフー株式会社 Determination device, determination method, determination program, generation device, generation method, and generation program
JP2019020882A (en) * 2017-07-13 2019-02-07 本田技研工業株式会社 Life log utilization system, method and program
JP2020071680A (en) * 2018-10-31 2020-05-07 ヤフー株式会社 Prediction device, prediction method, and prediction program

Also Published As

Publication number Publication date
JP7354341B1 (en) 2023-10-02

Similar Documents

Publication Publication Date Title
Hasan et al. Fischer linear discrimination and quadratic discrimination analysis–based data mining technique for internet of things framework for Healthcare
Li et al. A bibliometric analysis of topic modelling studies (2000–2017)
Andrews et al. Studying consideration effects in empirical choice models using scanner panel data
US7805431B2 (en) System and method for generating a display of tags
US20120041849A1 (en) Method, Device, and System for Analyzing and Ranking Web-Accessible Data Targets
JP2019091355A (en) Determination device, determination method and determination program
Law et al. Knowledge-driven decision analytics for commercial banking
Loukili et al. Machine learning based recommender system for e-commerce
US20150227987A1 (en) Method and system for determining level of influence in a social e-commerce environment
Li et al. The more you ask, the less you get: When additional questions hurt external validity
McCarthy et al. Introduction to predictive analytics
Azu et al. Evaluating the effect of digital transformation on improvement of service trade in West Africa
Krishnan et al. RFM-based customer analysis and product recommendation system
JP7354341B1 (en) Information processing device, information processing method, and information processing program
Valliyammai et al. An intelligent personalized recommendation for travel group planning based on reviews
Chen et al. Vector space model for patent documents with hierarchical class labels
Amirian et al. A hybrid differential evolution for general multi-objective flow shop problem with a modified learning effect
Banduka et al. The prioritization of failures within the automotive industry: the two-step failure mode and effect analysis integrated approach
US11392851B2 (en) Social network navigation based on content relationships
Ekinci et al. Development of a hybrid model to plan segment based optimal promotion strategy
Tegetmeier et al. Artificial Intelligence Algorithms for Collaborative Book Recommender Systems
US20200226159A1 (en) System and method of generating reading lists
Sharma et al. Ranking of E-Commerce Sites in India Using Decision-Making Approach
Liu et al. Statistical learning of domain-specific quality-of-service features from user reviews
Robinson et al. A cyber-based behavioral model

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230711

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230912

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230920

R150 Certificate of patent or registration of utility model

Ref document number: 7354341

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350