JP2014048801A - Statistic model generation device, statistic model generation method, and computer program - Google Patents

Statistic model generation device, statistic model generation method, and computer program Download PDF

Info

Publication number
JP2014048801A
JP2014048801A JP2012189989A JP2012189989A JP2014048801A JP 2014048801 A JP2014048801 A JP 2014048801A JP 2012189989 A JP2012189989 A JP 2012189989A JP 2012189989 A JP2012189989 A JP 2012189989A JP 2014048801 A JP2014048801 A JP 2014048801A
Authority
JP
Japan
Prior art keywords
person
connection degree
connection
degree
statistical model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012189989A
Other languages
Japanese (ja)
Other versions
JP5854355B2 (en
Inventor
Miyuki Imada
美幸 今田
Manabu Yoshida
学 吉田
Junei Kin
順暎 金
Hiroshi Kano
裕 狩野
Satoshi Hirose
慧 廣瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Osaka University NUC
Original Assignee
Nippon Telegraph and Telephone Corp
Osaka University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, Osaka University NUC filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012189989A priority Critical patent/JP5854355B2/en
Publication of JP2014048801A publication Critical patent/JP2014048801A/en
Application granted granted Critical
Publication of JP5854355B2 publication Critical patent/JP5854355B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To efficiently create a statistic model capable of estimating what a degree of association he/she has toward others using a life log data of another person.SOLUTION: A statistic model used when estimating a degree of association is created by using teacher data representing the information of a person or the attribute of an object and a degree of association representing the strength of association with the person or the object. The degree of association is calculated by using verification data representing the information of the preset attribute and the degree of association, and the statistic model created in the creation step. The estimation accuracy which is a value representing a matched ratio of the degrees of association is calculated by comparing the degree of association set in the verification data and the degree of association calculated in the calculation step, and the accuracy of the statistic model is determined based on the estimation accuracy calculated in the estimation accuracy calculation step.

Description

本発明は、人又は物のつながりの強さを推定する技術に関する。   The present invention relates to a technique for estimating the strength of connection between people or things.

人に対するコミュニケーション支援を行う場合、人と人との関係を把握する技術が重要になる。
従来、人と人との関係を把握する技術には、センサやGPS(Global Positioning System)などの外部観測可能な情報やウェブ上の参照関係から本人と他人との関係を見つけ出す技術がある。1つ目の技術として、タグを用いてコミュニケーション頻度を計測し、多くのコミュニケーションが行われていると良好な関係であると判断する技術がある(例えば、非特許文献1参照)。2つ目の技術として、メールの送受信頻度にある関数を組み合わせて親密さを評価する技術がある(例えば、非特許文献2参照)。
When providing communication support to people, technology to understand the relationship between people is important.
2. Description of the Related Art Conventionally, as a technique for grasping the relationship between people, there is a technology for finding a relationship between a person and another person from externally observable information such as sensors and GPS (Global Positioning System) and a reference relationship on the web. As a first technique, there is a technique in which a communication frequency is measured using a tag and a good relationship is determined when a lot of communication is performed (for example, see Non-Patent Document 1). As a second technique, there is a technique for evaluating intimacy by combining a function in the frequency of mail transmission / reception (see, for example, Non-Patent Document 2).

また、ウェブサービスにおいては、セマンティック技術を使いウェブ上から人と人との関係を見つけ出すSpyseeがある(例えば、非特許文献3参照)。Spyseeは、ブログや論文の共著関係などのウェブ上に公開された情報を自動で収集して整理することによって人と人とのつながりを見つけることができるサービスである。
しかし、上記の技術で特定できる人と人との関係は、参照関係から特定できる人と人とのつながりや、コミュニケーション量の多さから親しいといったような表面的な関係に限定される。そのため、上記の技術は、職場の人間関係向上やコミュニケーションが苦手な高齢者や子供への適用が困難であった。
In addition, in web services, there is Spysee that uses semantic technology to find out the relationship between people on the web (see, for example, Non-Patent Document 3). Spysee is a service that can find connections between people by automatically collecting and organizing information published on the web, such as blogs and paper co-authorship relationships.
However, the person-to-person relationship that can be specified by the above technique is limited to a superficial relationship such as the relationship between the person and the person that can be specified from the reference relationship and the closeness of communication. For this reason, it has been difficult to apply the above technique to elderly people and children who are not good at improving human relations and communication in the workplace.

そこで上記問題を解決するために、表面的な観測情報からでは分かりにくい人の内面的な情報を把握する技術が必要となる。内面的な情報は、古くから心理の分野で研究されている。しかし、工学で使うためにはウェブ上の情報やセンサやGPSなどで採取できるような外部観測できるデータと、内面的な情報とをつなぐ技術が必要となる。本発明では、人が人をどう思っているのかという内面的な情報を“つながり度”と呼ぶ。つながり度をブログやツイッター(登録商標)などに記載されているウェブ上の情報やセンサやGPSから採取される情報と、ユーザの性別や年齢などの個人情報とを使って、予測(推定)するための技術について説明する。   Therefore, in order to solve the above problem, a technique for grasping the inner information of a person who is difficult to understand from the superficial observation information is required. Inner information has long been studied in the field of psychology. However, in order to use it in engineering, technology that connects information on the web, externally observable data that can be collected with sensors, GPS, etc., and internal information is required. In the present invention, internal information on how a person thinks of a person is called “degree of connection”. Estimate (estimate) the degree of connection using information on the web, information collected from sensors or GPS, and personal information such as the user's gender and age, as described in blogs and Twitter (registered trademark) The technique for this is demonstrated.

人が人をどう思っているのかを表すつながり度は、人の主観に依存するところが大きい。そのため、つながり度をできるだけ正確に推定するためには、個人差をできるだけ少なくするための人毎のカスタマイズが必要となる。
本発明では、統計的手法によるカスタマイズを前提としているため、つながり度の推定に使う教師データのカスタマイズ方法は、2つの方法が考えられる。1つ目の方法は、自分のライフログデータだけを使ってカスタマイズする方法である。2つ目の方法は、一定レベルまで他人のデータを使い、差分を個別にカスタマイズする方法である。
The degree of connection that expresses what a person thinks of a person depends largely on the subjectivity of the person. Therefore, in order to estimate the connection degree as accurately as possible, customization for each person is required to minimize individual differences.
Since the present invention is premised on customization by a statistical method, there are two methods for customizing the teacher data used for estimating the connection degree. The first method is a customization method using only one's own life log data. The second method uses another person's data up to a certain level and customizes the differences individually.

まず、1つ目の方法について説明する。ライフログデータは、個人の行動履歴や関わった人、嗜好などの個人情報を蓄積した情報である。ライフログデータは、個人毎の蓄積情報であるので、個人が関わった相手をどう思っているかを判定することができる。1つ目の方法は、ライフログデータを長期間蓄積している場合、分析データが膨大な上、雑多な情報が多く含まれる。そのため、必要なつながり度の情報を分析するための前処理や情報整理に非常に手間がかかる。それに対して、ライフログデータを短期間蓄積している場合、個人が関わった相手が限定されるため、十分な教師データを得ることができない。そのため、個人が出会ったことのない未知の相手に対してはつながり度の推定を精度よく行うことができない。このように、個人毎のライフログデータをカスタマイズするための教師データとして使うには、手間と時間がかかってしまう。そのため、1つ目方法は、古くからアイデアとしては存在するものの利便性に問題があることから利用している人は少ない。   First, the first method will be described. The life log data is information obtained by accumulating personal information such as an individual's behavior history, persons involved, and preferences. Since life log data is stored information for each individual, it is possible to determine how the individual is concerned about the other party. In the first method, when life log data is accumulated for a long time, analysis data is enormous and a lot of miscellaneous information is included. Therefore, it takes a lot of work for pre-processing and information organization for analyzing information of necessary connection degree. On the other hand, when life log data is accumulated for a short period of time, since the partner with whom the individual is involved is limited, sufficient teacher data cannot be obtained. For this reason, it is impossible to accurately estimate the degree of connection for an unknown partner who has never met an individual. Thus, it takes time and labor to use the life log data for each individual as the teacher data for customizing. Therefore, although the first method has existed as an idea for a long time, there are few people using it because there is a problem in convenience.

次に、2つ目の方法について説明する。2つ目の方法は、自分のライフログデータを用いたカスタマイズではなく、自分と似たような境遇や嗜好の他人のライフログデータを教師データとして用いる方法である。2つ目の方法は、完全に一般化するのは不可能であっても、人の性質や特徴に関する属性を用いて個人をある程度グルーピングすることで、つながり度の推定が可能ではないかという仮定の上に成り立った方法である。そのため、ライフログのように、個人のライフログデータを大量に揃える必要がないという利点がある。しかし、2つ目の方法は、他人のライフログデータを自分のライフログデータのカスタマイズのための教師データとする。そのため、自分がどのようなタイプの人が同じつながり度を持つのかのタイプ分けが非常に困難である。また、タイプ分けを失敗すると、つながり度の推定精度も低い値にしかならない。   Next, the second method will be described. The second method is not a customization using one's own life log data, but a method using other person's life log data having similar circumstances and preferences as teacher data. The second method assumes that even if it is impossible to generalize completely, it is possible to estimate the degree of connection by grouping individuals to some extent using attributes related to human characteristics and characteristics. It is a method that is based on. Therefore, unlike the life log, there is an advantage that it is not necessary to arrange a large amount of personal life log data. However, the second method uses other person's life log data as teacher data for customizing his / her life log data. For this reason, it is very difficult to classify what type of person he / she has the same degree of connection. Further, if the typing is failed, the estimation accuracy of the connection degree is only a low value.

つまり2つ目の方法では、教師データから如何にして自分と同じタイプのグループを作り(クラスタリング)、つながり度を推定できる統計モデルを作るかが課題となる。
性別や年齢層といった心理の分野でクラスタリングに有効と言われる属性を用いる方法も考えられるが、その属性だけからのクラスタリングでは低い精度の推定しか行えない。
That is, in the second method, the problem is how to create a group of the same type as that of the teacher data (clustering) and create a statistical model that can estimate the degree of connection.
Although it is possible to use an attribute that is said to be effective for clustering in the psychological field such as gender and age group, clustering from only that attribute can only estimate with low accuracy.

“「NK3−人間関係向上計画」〜Android OS搭載スマートフォンアプリ”、[online]、[平成24年8月9日検索]、インターネット(URL:http://nk3.nii.ac.jp/content/intro.html)"" NK3-Human Relations Improvement Plan-Android OS-equipped smartphone app ", [online], [Search August 9, 2012], Internet (URL: http://nk3.nii.ac.jp/content/ intro.html) 金ナレ、外2名、「知人同士のインフォーマルコミュニケーションを支援するプレゼンスサービスシステムの検討」、情報処理学会研究報告、2009年3月18日、第2009巻、第33号、p.1-6Kim Nare and two others, “Examination of Presence Service System to Support Informal Communication Between Acquaintances”, IPSJ Research Report, March 18, 2009, Vol. 33, p. 1-6 “SPYSEE”、[online]、[平成24年8月13日検索]、インターネット(URL: http://spysee.jp/help/index/)“SPYSEE”, [online], [Search August 13, 2012], Internet (URL: http://spysee.jp/help/index/)

上記事情に鑑み、本発明では、他人のライフログデータを使って自分が相手に対してどのようなつながり度を抱いているかを推定できる統計モデルを効率よく作成する技術の提供を目的としている。   In view of the above circumstances, an object of the present invention is to provide a technique for efficiently creating a statistical model that can estimate what degree of connection a person has with another person using other person's life log data.

本発明の一態様は、人物又は物の属性の情報と、前記人物又は物のつながりの強さを表すつながり度とを表す教師データを用いて、つながり度を推定する際に用いる統計モデルを作成する作成部と、予め設定された前記属性の情報及び前記つながり度を表す検証データと、前記作成部が作成した前記統計モデルとを用いてつながり度を算出する算出部と、前記検証データに設定されているつながり度と、前記算出部が算出したつながり度とを比較してつながり度の一致する割合を表す値である推定精度を算出する推定精度算出部と、前記推定精度算出部が算出した推定精度に基づいて、前記作成部が作成した前記統計モデルの精度を判断する判断部と、を備える統計モデル生成装置である。   One aspect of the present invention is to create a statistical model used for estimating a connection degree using teacher data representing attribute information of a person or a thing and a connection degree representing the strength of the connection of the person or the thing. Set in the verification data, a calculation unit for calculating the connection degree using the preset attribute information and the verification data representing the connection degree, and the statistical model generated by the preparation part An estimated accuracy calculation unit that compares the connection degree calculated with the connection degree calculated by the calculation unit and calculates an estimation accuracy that is a value representing a proportion of connection degrees, and the estimation accuracy calculation unit calculates And a determination unit that determines the accuracy of the statistical model created by the creation unit based on the estimation accuracy.

本発明の一態様は、上記の統計モデル生成装置であって、前記作成部は、前記教師データに予め設定されている複数種の属性のうち、つながり度と相関の高い属性を選択し、選択された属性の情報に基づいて前記統計モデルを生成する。   One aspect of the present invention is the statistical model generation device described above, wherein the creation unit selects and selects an attribute having a high correlation with the connection degree from among a plurality of types of attributes set in advance in the teacher data. The statistical model is generated based on the attribute information.

本発明の一態様は、人物又は物の属性の情報と、前記人物又は物のつながりの強さを表すつながり度とを表す教師データを用いて、つながり度を推定する際に用いる統計モデルを作成する作成ステップと、予め設定された前記属性の情報及び前記つながり度を表す検証データと、前記作成ステップにおいて作成された前記統計モデルとを用いてつながり度を算出する算出ステップと、前記検証データに設定されているつながり度と、前記算出ステップにおいて算出されたつながり度とを比較してつながり度の一致する割合を表す値である推定精度を算出する推定精度算出ステップと、前記推定精度算出ステップにおいて算出された推定精度に基づいて、前記統計モデルの精度を判断する判断ステップと、を有する統計モデル生成方法である。   One aspect of the present invention is to create a statistical model used for estimating a connection degree using teacher data representing attribute information of a person or a thing and a connection degree representing the strength of the connection of the person or the thing. A creation step for calculating the connection degree using the attribute information set in advance and the verification data representing the connection degree, and the statistical model created in the preparation step, and the verification data In the estimation accuracy calculation step that compares the set connection degree and the connection degree calculated in the calculation step to calculate an estimation accuracy that is a value representing a proportion of the connection degree, and in the estimation accuracy calculation step And a determination step of determining the accuracy of the statistical model based on the calculated estimation accuracy.

本発明の一態様は、人物又は物の属性の情報と、前記人物又は物のつながりの強さを表すつながり度とを表す教師データを用いて、つながり度を推定する際に用いる統計モデルを作成する作成ステップと、予め設定された前記属性の情報及び前記つながり度を表す検証データと、前記作成ステップにおいて作成された前記統計モデルとを用いてつながり度を算出する算出ステップと、前記検証データに設定されているつながり度と、前記算出ステップにおいて算出されたつながり度とを比較してつながり度の一致する割合を表す値である推定精度を算出する推定精度算出ステップと、前記推定精度算出ステップにおいて算出された推定精度に基づいて、前記統計モデルの精度を判断する判断ステップと、をコンピュータに実行させるためのコンピュータプログラムである。   One aspect of the present invention is to create a statistical model used for estimating a connection degree using teacher data representing attribute information of a person or a thing and a connection degree representing the strength of the connection of the person or the thing. A creation step for calculating the connection degree using the attribute information set in advance and the verification data representing the connection degree, and the statistical model created in the preparation step, and the verification data In the estimation accuracy calculation step that compares the set connection degree and the connection degree calculated in the calculation step to calculate an estimation accuracy that is a value representing a proportion of the connection degree, and in the estimation accuracy calculation step A determination step of determining the accuracy of the statistical model based on the calculated estimation accuracy; Is a computer program.

本発明により、他人のライフログデータを使って自分が相手に対してどのようなつながり度を抱いているかを推定できる統計モデルを効率よく作成することが可能となる。   According to the present invention, it is possible to efficiently create a statistical model that can estimate what degree of connection a person has with a partner using life log data of another person.

本発明におけるつながり度推定システムのシステム構成を示す図である。It is a figure which shows the system configuration | structure of the connection degree estimation system in this invention. つながり度推定装置30の機能構成を表す概略ブロック図である。3 is a schematic block diagram illustrating a functional configuration of a connection degree estimation device 30. FIG. 属性情報DBの構成図である。It is a block diagram of attribute information DB. 統計モデル作成準備の処理の流れを示すフローチャートである。It is a flowchart which shows the flow of a process of statistical model preparation. つながり度算出処理の流れを示すフローチャートである。It is a flowchart which shows the flow of a connection degree calculation process. AIC計算処理の流れを示すフローチャートである。It is a flowchart which shows the flow of AIC calculation processing. 相関係数を算出する処理の流れを示すフローチャートである。It is a flowchart which shows the flow of the process which calculates a correlation coefficient. 統計モデル作成処理の流れを示すフローチャートである。It is a flowchart which shows the flow of a statistical model creation process. 人と物に関する属性情報DBの構成図である。It is a block diagram of attribute information DB regarding a person and a thing.

以下、本発明の一実施形態を、図面を参照しながら説明する。以後の説明では、ユーザ自身のことを認知者、ユーザ以外の人のことを被認知者とする。また、属性とは一般的に世の中に存在するものに備わっている性質や特徴を表す。例えば、属性は、物体の色や形、人の能力、人の素性、社会的関係などである。
図1は、本発明におけるつながり度推定システムのシステム構成を示す図である。
本発明のつながり度推定システムは、情報入力端末10、センシングデバイス20、つながり度推定装置30及び表示端末40を備える。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings. In the following description, it is assumed that the user itself is a cognitive person and a person other than the user is a recognized person. In addition, the attribute generally represents the nature and characteristics of what exists in the world. For example, attributes are the color and shape of an object, human ability, human identity, social relationships, and the like.
FIG. 1 is a diagram showing a system configuration of a connection degree estimation system according to the present invention.
The connection degree estimation system of the present invention includes an information input terminal 10, a sensing device 20, a connection degree estimation apparatus 30, and a display terminal 40.

情報入力端末10は、パーソナルコンピュータなどの情報処理装置を用いて構成される。情報入力端末10は、ユーザ(認知者)によって操作され、認知者属性と、被認知者属性と、つながり度とをつながり度推定装置30に送信する。認知者属性とは、認知者に関する情報であり、例えば、認知者の性別や職業などを表す。被認知者属性とは、被認知者に関する情報であり、例えば、被認知者の性別や認知者との関係などを表す。つながり度とは、人(認知者)と人(被認知者)とのつながりの強さを表す情報である。
センシングデバイス20は、センサを利用して認知者や被認知者の行動を検知して、認知者や被認知者の感情に関する情報を計測する。センシングデバイス20は、例えば、RFID(Radio Frequency IDentification)タグ、人感センサ、映像や音声記憶装置、生理センサ等であっても良い。センシングデバイス20は、認知者と被認知者との間で起こった行動に関する情報をライフログ属性として計測する。具体的には、例えば、ライフログ属性は認知者と被認知者とが共有した体験や体験をしたときに認知者が抱いた感情、被認知者の忙しさや体調不良などの情報である。
The information input terminal 10 is configured using an information processing apparatus such as a personal computer. The information input terminal 10 is operated by a user (recognition person), and transmits a recognizer attribute, a recognized person attribute, and a connection degree to the connection degree estimation device 30. The cognitive attribute is information about the cognitive person and represents, for example, the gender and occupation of the cognitive person. The perceived person attribute is information about the perceived person, and represents, for example, the gender of the perceived person or the relationship with the perceived person. The degree of connection is information indicating the strength of connection between a person (recognition person) and a person (recognized person).
The sensing device 20 detects the behavior of the cognitive person or the cognitive person using the sensor, and measures information related to the emotions of the cognitive person or the cognitive person. The sensing device 20 may be, for example, an RFID (Radio Frequency IDentification) tag, a human sensor, a video or audio storage device, a physiological sensor, or the like. The sensing device 20 measures information regarding the behavior that has occurred between the cognitive person and the cognitive person as a life log attribute. Specifically, for example, the life log attribute is information such as experiences shared by the cognitive person and the cognitive person, emotions held by the cognitive person when experiencing the experience, busyness of the cognitive person, and poor physical condition.

つながり度推定装置30は、人と人とのつながりの強さを表すつながり度を推定する。つながり度推定装置30は、情報入力端末10やセンシングデバイス20から送信される認知者属性と被認知者属性とつながり度とを蓄積して管理する。
表示端末40は、パーソナルコンピュータなどの情報処理装置を用いて構成される。表示端末40は、つながり度推定装置30から出力されるつながり度の推定結果を表示する。
The connection degree estimation device 30 estimates a connection degree representing the strength of connection between people. The connection degree estimation device 30 accumulates and manages the cognitive person attribute, the recognized person attribute, and the connection degree transmitted from the information input terminal 10 or the sensing device 20.
The display terminal 40 is configured using an information processing device such as a personal computer. The display terminal 40 displays the connection degree estimation result output from the connection degree estimation device 30.

図2は、つながり度推定装置30の機能構成を表す概略ブロック図である。
つながり度推定装置30は、バスで接続されたCPU(Central Processing Unit)やメモリや補助記憶装置などを備え、つながり度推定プログラムを実行する。つながり度推定プログラムの実行によって、つながり度推定装置30は、情報管理部100、情報記憶部110、抽出部120、作成部130、つながり度算出部140、決定係数算出部150、推定精度算出部160、判断部170、出力部180を備える装置として機能する。また、作成部130は、分析処理部131、AIC選択部132、相関係数算出部133及び生成処理部134として機能する。なお、つながり度推定装置30の各機能の全て又は一部は、ASIC(Application Specific Integrated Circuit)やPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されても良い。また、つながり度推定プログラムは、コンピュータ読み取り可能な記録媒体に記録されても良い。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。また、つながり度推定プログラムは、電気通信回線を介して送受信されても良い。
FIG. 2 is a schematic block diagram illustrating a functional configuration of the connection degree estimation device 30.
The connection degree estimation device 30 includes a CPU (Central Processing Unit), a memory, an auxiliary storage device, and the like connected by a bus, and executes a connection degree estimation program. By executing the connection degree estimation program, the connection degree estimation device 30 is configured to include the information management unit 100, the information storage unit 110, the extraction unit 120, the creation unit 130, the connection degree calculation unit 140, the determination coefficient calculation unit 150, and the estimation accuracy calculation unit 160. , Functioning as a device including a determination unit 170 and an output unit 180. Further, the creation unit 130 functions as an analysis processing unit 131, an AIC selection unit 132, a correlation coefficient calculation unit 133, and a generation processing unit 134. Note that all or part of each function of the connection degree estimation device 30 may be realized using hardware such as an application specific integrated circuit (ASIC), a programmable logic device (PLD), or a field programmable gate array (FPGA). good. Further, the connection degree estimation program may be recorded on a computer-readable recording medium. The computer-readable recording medium is, for example, a portable medium such as a flexible disk, a magneto-optical disk, a ROM, a CD-ROM, or a storage device such as a hard disk built in the computer system. The connection degree estimation program may be transmitted / received via a telecommunication line.

情報管理部100は、情報入力端末10から送信された認知者属性及び被認知者属性の情報と、センシングデバイス20から送信されたライフログ属性の情報とを情報記憶部110に記録する。
情報記憶部110は、磁気ハードディスク装置や半導体記憶装置などの記憶装置を用いて構成される。情報記憶部110は、情報管理部100から出力された認知者属性、被認知者属性、ライフログ属性及びつながり度の情報(以下、「属性情報」という。)を有する属性情報DBを記憶する。なお、認知者属性、被認知者属性及びライフログ属性は、それぞれ属性の一態様である。
The information management unit 100 records the information on the cognitive person attribute and the person to be recognized attribute transmitted from the information input terminal 10 and the information on the life log attribute transmitted from the sensing device 20 in the information storage unit 110.
The information storage unit 110 is configured using a storage device such as a magnetic hard disk device or a semiconductor storage device. The information storage unit 110 stores an attribute information DB having information on a cognitive person attribute, a recognized person attribute, a life log attribute, and a connection degree (hereinafter referred to as “attribute information”) output from the information management unit 100. In addition, a cognitive person attribute, a to-be-recognized person attribute, and a life log attribute are each one aspect | mode of an attribute.

抽出部120は、情報記憶部110に記憶されている属性情報DBから必要な情報を抽出し、教師データ及び検証データを生成する。
作成部130は、つながり度を推定する際に使用される統計モデルを作成する。以下、作成部130の具体的な構成について説明する。
分析処理部131は、抽出部120が抽出した教師データを用いて、1又は複数の属性の組み合わせ(以下、「属性群」という。)毎に分散分析を行う。分析処理部131は、F検定表を用いて、予め定めた有意水準を超えた属性群を抽出する。
The extraction unit 120 extracts necessary information from the attribute information DB stored in the information storage unit 110, and generates teacher data and verification data.
The creating unit 130 creates a statistical model used when estimating the connection degree. Hereinafter, a specific configuration of the creation unit 130 will be described.
The analysis processing unit 131 performs analysis of variance for each combination of one or more attributes (hereinafter referred to as “attribute group”) using the teacher data extracted by the extraction unit 120. The analysis processing unit 131 extracts an attribute group exceeding a predetermined significance level using the F test table.

AIC選択部132は、情報記憶部110に記憶されている属性情報又は教師データの属性情報毎に、AIC(Akaike’s Information Criterion)を用いてAIC値を算出する。AIC値は、AICを用いて算出された値である。AIC選択部132は、算出した複数のAIC値の中からつながり度を推定するのに有効な1つのAIC値を選択する。AIC選択部132は、例えば、複数のAIC値の中から最小のAIC値を選択する。   The AIC selection unit 132 calculates an AIC value using AIC (Akaike's Information Criterion) for each piece of attribute information stored in the information storage unit 110 or attribute information of teacher data. The AIC value is a value calculated using the AIC. The AIC selection unit 132 selects one AIC value effective for estimating the connection degree from the plurality of calculated AIC values. For example, the AIC selection unit 132 selects a minimum AIC value from a plurality of AIC values.

相関係数算出部133は、分析処理部131が抽出した属性群でデータをクラスタリングし、クラスタリングしたデータ毎に、AIC選択部132が選択したAIC値の最小の属性群とクラスタリングしたデータのつながり度との相関係数を算出する。
生成処理部134は、相関係数算出部133が算出した相関係数が閾値以上の属性群に対して回帰分析を行うことによって統計モデルを作成する。
The correlation coefficient calculation unit 133 clusters data with the attribute group extracted by the analysis processing unit 131, and the degree of connection between the clustered data and the attribute group with the minimum AIC value selected by the AIC selection unit 132 for each clustered data The correlation coefficient is calculated.
The generation processing unit 134 creates a statistical model by performing regression analysis on an attribute group in which the correlation coefficient calculated by the correlation coefficient calculation unit 133 is greater than or equal to a threshold value.

つながり度算出部140は、抽出部120が抽出した検証データを用いて、生成処理部134が作成した統計モデルに基づいてつながり度の値を算出する。
決定係数算出部150は、生成処理部134が作成した統計モデルの決定係数R^2を算出する(「^」は、べき乗を表す)。決定係数とは、回帰分析によって生成された統計モデルの精度の高さを示す指標である。例えば、決定係数R^2は、“0”から“1”の範囲で算出され、以下のように定義されても良い。決定係数R^2は、“0.8”以上で精度が非常に良いことを表す。決定係数R^2は、“0.5”以上で精度が良いことを表す。決定係数R^2は、“0.25”以上で精度がふつうであることを表す。決定係数R^2は、“0.25”未満で精度が良くないことを表す。
The connection degree calculation unit 140 calculates a connection degree value based on the statistical model created by the generation processing unit 134 using the verification data extracted by the extraction unit 120.
The determination coefficient calculation unit 150 calculates the determination coefficient R ^ 2 of the statistical model created by the generation processing unit 134 ("^" represents a power). The determination coefficient is an index indicating the high accuracy of the statistical model generated by the regression analysis. For example, the determination coefficient R ^ 2 may be calculated in the range of “0” to “1” and defined as follows. The determination coefficient R ^ 2 is “0.8” or more and represents that the accuracy is very good. The determination coefficient R ^ 2 is “0.5” or more, indicating that the accuracy is good. The determination coefficient R ^ 2 indicates that the accuracy is normal at "0.25" or more. The determination coefficient R ^ 2 is less than “0.25” and indicates that the accuracy is not good.

推定精度算出部160は、つながり度算出部140が算出したつながり度の値と、検証データのつながり度の値との一致する割合を表す推定精度の平均値EAavを算出する。例えば、推定精度の平均値EAavは、以下のように定義されても良い。推定精度の平均値EAavは、“0.8”以上で一致する割合がとても良いことを表す。推定精度の平均値EAavは、“0.5”以上で一致する割合が良いことを表す。
判断部170は、決定係数算出部150が算出した決定係数R^2と、推定精度算出部160が算出した推定精度の平均値EAavとが閾値以上か否かを判断する。
出力部180は、つながり度の推定結果を表示端末40に出力する。
The estimation accuracy calculation unit 160 calculates an average value EAav of estimation accuracy that represents a ratio between the connection degree value calculated by the connection degree calculation unit 140 and the connection degree value of the verification data. For example, the average value EAav of the estimation accuracy may be defined as follows. The average value EAav of the estimation accuracy indicates that the rate of coincidence at “0.8” or higher is very good. The average value EAav of the estimation accuracy indicates that the ratio of matching is good at “0.5” or more.
The determination unit 170 determines whether the determination coefficient R ^ 2 calculated by the determination coefficient calculation unit 150 and the average value EAav of the estimation accuracy calculated by the estimation accuracy calculation unit 160 are equal to or greater than a threshold value.
The output unit 180 outputs the connection degree estimation result to the display terminal 40.

図3は、属性情報DBの構成図である。
属性情報DBは、レコード50を複数有する。1つのレコード50には、1つの属性情報が定義される。レコード50に定義される属性情報は、データ番号、認知者属性、被認知者属性、その他の属性、つながり度の各値を有する。
データ番号は、レコード50毎に割り当てられる識別番号を表す。
FIG. 3 is a configuration diagram of the attribute information DB.
The attribute information DB has a plurality of records 50. One attribute information is defined in one record 50. The attribute information defined in the record 50 has values of data number, cognitive person attribute, cognitive person attribute, other attributes, and connection degree.
The data number represents an identification number assigned to each record 50.

レコード50に定義される認知者属性の具体例として、本人ID、本人性別、本人職業などの各属性がある。本人IDは、レコード50によって表される認知者の識別番号を表す。本人性別は、レコード50によって表される認知者の性別を表す。本人職業は、レコード50によって表される認知者の職業を表す。   Specific examples of the cognitive attributes defined in the record 50 include attributes such as a principal ID, a principal sex, and a principal occupation. The principal ID represents the identification number of the cognitive person represented by the record 50. The identity gender represents the gender of the cognitive person represented by the record 50. The principal occupation represents the occupation of the cognitive person represented by the record 50.

レコード50に定義される被認知者属性の具体例として、相手ID、相手性別、認知者との関係などの各属性がある。
相手IDは、レコード50によって表される被認知者の識別番号を表す。相手性別は、レコード50によって表される被認知者の性別を表す。認知者との関係の値は、レコード50によって表される認知者と被認知者との関係を表す。
その他の属性は、認知者属性及び被認知者属性以外の属性情報を表す。その他の属性は、例えば、ライフログ属性であっても良い。
Specific examples of the recognized person attributes defined in the record 50 include attributes such as a partner ID, a partner sex, and a relationship with the recognizer.
The partner ID represents the identification number of the recognized person represented by the record 50. The opponent gender represents the gender of the recognized person represented by the record 50. The value of the relationship with the cognitive person represents the relation between the cognitive person represented by the record 50 and the recognized person.
The other attributes represent attribute information other than the recognizer attribute and the recognized person attribute. The other attribute may be a life log attribute, for example.

つながり度の値は、レコード50によって表される認知者と被認知者とのつながりの強さを表す。レコード50に定義されるつながり度の値は、ユーザによって任意に決定されても良い。つながり度の値は、正の値が大きいほど認知者と被認知者とのつながり度が高いことを表す。
例えば、図3では、つながり度の値を“−3“から“+3“までの7段階で表している。すなわち、“−3“から“−1“までのつながり度の値は、絶対値の大きい負の値が大きいほど認知者と被認知者との関係が険悪であることを表している。“0”のつながり度の値は、認知者と被認知者とが他人のような関係であることを表している。“1“から“3“までのつながり度の値は、正の値が大きいほど認知者と被認知者との関係が良好であることを表している。
The connection degree value represents the strength of the connection between the cognitive person and the person to be recognized represented by the record 50. The connection degree value defined in the record 50 may be arbitrarily determined by the user. The value of the connection degree indicates that the larger the positive value, the higher the connection degree between the cognitive person and the recognized person.
For example, in FIG. 3, the value of the connection degree is represented in seven stages from “−3” to “+3”. That is, the value of the degree of connection from “−3” to “−1” represents that the larger the negative value having the larger absolute value, the worse the relationship between the cognitive person and the recognized person. A connection degree value of “0” indicates that the cognitive person and the cognitive person have a relationship like others. The value of the degree of connection from “1” to “3” indicates that the larger the positive value, the better the relationship between the cognitive person and the recognized person.

図4は、統計モデル作成準備の処理の流れを示すフローチャートである。
まず、情報管理部100は、ユーザによって送信された属性情報を入力する(ステップS101)。情報管理部100は、入力した属性情報を属性情報DBに格納する(ステップS102)。判断部170は、情報記憶部110が記憶している属性情報DBに所定の数以上の属性情報が存在するか否か判断する(ステップS103)。
FIG. 4 is a flowchart showing the flow of processing for preparing a statistical model.
First, the information management unit 100 inputs attribute information transmitted by the user (step S101). The information management unit 100 stores the input attribute information in the attribute information DB (step S102). The determination unit 170 determines whether there is a predetermined number or more of attribute information in the attribute information DB stored in the information storage unit 110 (step S103).

属性情報DBに所定の数以上の属性情報が存在する場合(ステップS103−YES)、抽出部120は属性情報DBから予め決められた割合でランダムに属性情報を抽出し、教師データ及び検証データを生成する(ステップS104)。判断部170は、所定の回数以上抽出処理を繰り返したか否かを判断する(ステップS105)。所定の回数以上ステップS104の処理を繰り返した場合(ステップS105−YES)、処理を終了する。   When attribute information more than a predetermined number exists in attribute information DB (step S103-YES), the extraction part 120 extracts attribute information at a predetermined ratio from attribute information DB at random, and supervises teacher data and verification data. Generate (step S104). The determination unit 170 determines whether or not the extraction process has been repeated a predetermined number of times (step S105). When the process of step S104 is repeated a predetermined number of times (step S105-YES), the process ends.

一方、ステップS103の処理において、属性情報DBに所定の数以上の属性情報が存在しない場合(ステップS103−NO)、つながり度推定装置30は属性情報が入力されるまで待機する。つながり度推定装置30は、属性情報が入力されるとステップS101以降の処理を実行する(ステップS106)。
ステップS105の処理において、ステップS104の処理が所定の回数未満である場合(ステップS105−NO)、抽出部120はステップS104の処理を繰り返し実行する。
On the other hand, in the process of step S103, when attribute information more than a predetermined number does not exist in the attribute information DB (step S103-NO), the connection degree estimation device 30 stands by until the attribute information is input. When the attribute information is input, the connection degree estimation device 30 executes the processes after step S101 (step S106).
In the process of step S105, when the process of step S104 is less than the predetermined number of times (step S105-NO), the extraction unit 120 repeatedly executes the process of step S104.

図5は、つながり度算出処理の流れを示すフローチャートである。
まず、抽出部120が抽出した教師データにおいて、つながり度の値を目的変数とし、各属性の値を説明変数とする。分析処理部131は、説明変数の属性群毎に分散分析を行う(ステップS201)。分析処理部131は、F検定表を用いて、あらかじめ定めた有意水準を超えた属性群を抽出する。(ステップS202)。
FIG. 5 is a flowchart showing the flow of the connection degree calculation process.
First, in the teacher data extracted by the extraction unit 120, the value of the connection degree is set as the objective variable, and the value of each attribute is set as the explanatory variable. The analysis processing unit 131 performs an analysis of variance for each attribute group of explanatory variables (step S201). The analysis processing unit 131 uses the F test table to extract an attribute group that exceeds a predetermined significance level. (Step S202).

図6は、AIC計算処理の流れを示すフローチャートである。
AIC選択部132は、情報記憶部110に記憶されている属性情報DBの属性群毎に、AICを用いてAIC値を算出する。(ステップS301)。AIC選択部132は、算出した複数のAIC値の中から最小のAIC値を選択する(ステップS302)。
FIG. 6 is a flowchart showing the flow of AIC calculation processing.
The AIC selection unit 132 calculates an AIC value using the AIC for each attribute group of the attribute information DB stored in the information storage unit 110. (Step S301). The AIC selection unit 132 selects the minimum AIC value from the calculated plurality of AIC values (step S302).

図7は、相関係数を算出する処理の流れを示すフローチャートである。
相関係数算出部133は、分析処理部131が抽出した属性群でデータをクラスタリングし、クラスタリングしたデータ毎に、AIC選択部132が選択したAIC値の最小の属性群とクラスタリングしたデータのつながり度との相関係数を算出する。(ステップS401)。判断部170は、算出された相関係数が閾値以上か否かを判断する(ステップS402)。相関係数が閾値以上である場合(ステップS402−YES)、判断部170は相関があると判断し、相関がある属性群を属性情報DBに格納する(ステップS403)。
FIG. 7 is a flowchart showing a flow of processing for calculating a correlation coefficient.
The correlation coefficient calculation unit 133 clusters data with the attribute group extracted by the analysis processing unit 131, and the degree of connection between the clustered data and the attribute group with the minimum AIC value selected by the AIC selection unit 132 for each clustered data The correlation coefficient is calculated. (Step S401). The determination unit 170 determines whether the calculated correlation coefficient is greater than or equal to a threshold value (step S402). If the correlation coefficient is equal to or greater than the threshold (step S402—YES), the determination unit 170 determines that there is a correlation, and stores an attribute group having the correlation in the attribute information DB (step S403).

判断部170は、分析処理部131が抽出した属性群全てに対して相関係数を算出したか否か判断する(ステップS404)。属性群全てに対して相関係数を算出した場合(ステップS404−YES)、処理を終了する。
ステップS402の処理において、相関係数が閾値未満である場合(ステップS402−NO)、判断部170は相関がないと判断し、ステップS404の処理に進む。
ステップS404の処理において、属性群全てに対して相関係数を算出していない場合(ステップS404−NO)、相関係数算出部133はステップS401に戻り、相関係数が算出されていない属性群に対して相関係数を算出する。
The determination unit 170 determines whether correlation coefficients have been calculated for all attribute groups extracted by the analysis processing unit 131 (step S404). When the correlation coefficient is calculated for all the attribute groups (step S404—YES), the process ends.
In the process of step S402, when the correlation coefficient is less than the threshold (step S402-NO), the determination unit 170 determines that there is no correlation, and proceeds to the process of step S404.
When the correlation coefficient is not calculated for all the attribute groups in the process of step S404 (step S404-NO), the correlation coefficient calculation unit 133 returns to step S401, and the attribute group for which the correlation coefficient has not been calculated. A correlation coefficient is calculated for.

図8は、統計モデル作成処理の流れを示すフローチャートである。
生成処理部134は、判断部170に相関があると判断された属性群を属性情報DBから全て読み出す(ステップS501)。生成処理部134は、属性情報DBから読み出した属性群毎に線形重回帰分析を行い、統計モデルを作成する(ステップS502)。つながり度算出部140は、抽出部120が抽出した各検証データを用いて、生成処理部134が作成した統計モデル毎につながり度を算出する(ステップS503)。
推定精度算出部160は、つながり度算出部140が算出したつながり度の値と、つながり度算出部140がつながり度を算出するのに用いた検証データに予め定義されているつながり度の値との一致する割合を表す推定精度EAを算出する(ステップS504)。推定精度算出部160は、ステップS504の処理を抽出部120が抽出した各検証データを用いて行う。推定精度算出部160は、式1に基づいて推定精度の平均値EAavを算出する(ステップS505)。なお、式1において、xは検証データの数を表す。また、式1に表されている各値(EA1、EA2、…、EAx)は、各検証データに基づいて算出された推定精度EAの値を表す。例えば、n番目(n=1〜xの整数)の検証データに基づいて算出された推定精度を“EAn”と表す。

Figure 2014048801
FIG. 8 is a flowchart showing the flow of statistical model creation processing.
The generation processing unit 134 reads all the attribute groups determined to have a correlation in the determination unit 170 from the attribute information DB (step S501). The generation processing unit 134 performs a linear multiple regression analysis for each attribute group read from the attribute information DB, and creates a statistical model (step S502). The connection degree calculation unit 140 calculates the connection degree for each statistical model created by the generation processing unit 134 using each verification data extracted by the extraction unit 120 (step S503).
The estimation accuracy calculation unit 160 calculates the connection degree value calculated by the connection degree calculation unit 140 and the connection degree value defined in advance in the verification data used by the connection degree calculation unit 140 to calculate the connection degree. An estimation accuracy EA representing the matching ratio is calculated (step S504). The estimation accuracy calculation unit 160 performs the process of step S504 using each verification data extracted by the extraction unit 120. The estimation accuracy calculation unit 160 calculates an average value EAav of estimation accuracy based on Equation 1 (step S505). In Equation 1, x represents the number of verification data. Further, each value (EA1, EA2,..., EAx) represented in Expression 1 represents a value of the estimated accuracy EA calculated based on each verification data. For example, the estimation accuracy calculated based on the nth (n = 1 to x) integer verification data is represented as “EAn”.
Figure 2014048801

また、決定係数算出部150は、式2に基づいて統計モデル毎に決定係数R^2を算出する(ステップS506)。

Figure 2014048801
Further, the determination coefficient calculation unit 150 calculates the determination coefficient R ^ 2 for each statistical model based on Expression 2 (step S506).
Figure 2014048801

なお、S1は式3に基づいて算出される。なお、S2は式4に基づいて算出される。

Figure 2014048801
Figure 2014048801
S1 is calculated based on Equation 3. S2 is calculated based on Equation 4.
Figure 2014048801
Figure 2014048801

式3のy1は、検証データのつながり度の値である。式4のy2は、検証データを用いて統計モデルによって算出されたつながり度の値である。yavは、抽出部120によって抽出された検証データのつながり度の平均値である。
判断部170は、決定係数算出部150が算出した統計モデルの決定係数R^2と、推定精度算出部160が算出した推定精度の平均値EAavとの両方の値が閾値以上であるか否かを判断する(ステップS507)。
Y1 of Formula 3 is a value of the connection degree of verification data. Y2 in Equation 4 is a connection degree value calculated by the statistical model using the verification data. yav is the average value of the connection degrees of the verification data extracted by the extraction unit 120.
The determination unit 170 determines whether or not both of the statistical model determination coefficient R ^ 2 calculated by the determination coefficient calculation unit 150 and the average value EAav of the estimation accuracy calculated by the estimation accuracy calculation unit 160 are equal to or greater than a threshold value. Is determined (step S507).

決定係数R^2と推定精度の平均値EAavとの両方の値が閾値以上である場合(ステップS507−YES)、判断部170は生成処理部134が作成した統計モデルを一次方程式で表せる統計モデル(適切な統計モデル)と判断する。判断部170は、ステップS507で適切と判断された統計モデルと、統計モデルの決定係数R^2と、統計モデルの推定精度の平均値EAavとを属性情報DBに格納する(ステップS508)。   When both of the determination coefficient R ^ 2 and the average value EAav of the estimation accuracy are equal to or greater than the threshold (step S507-YES), the determination unit 170 can represent the statistical model created by the generation processing unit 134 by a linear equation. (Appropriate statistical model). The determination unit 170 stores the statistical model determined to be appropriate in step S507, the statistical model determination coefficient R ^ 2, and the statistical model estimation accuracy average value EAav in the attribute information DB (step S508).

一方、ステップS507の処理において、決定係数R^2と推定精度の平均値EAavとのいずれか一方の値、あるいは両方の値が閾値未満である場合(ステップS507−NO)、判断部170は生成処理部134が作成した統計モデルを一次方程式で表せない統計モデル(不適切な統計モデル)と判断する。なお、決定係数R^2と推定精度の平均値EAavとには、それぞれ異なる閾値が設定される。   On the other hand, in the process of step S507, when one or both of the determination coefficient R ^ 2 and the average value EAav of the estimation accuracy are less than the threshold (step S507-NO), the determination unit 170 generates The statistical model created by the processing unit 134 is determined as a statistical model that cannot be expressed by a linear equation (an inappropriate statistical model). Note that different thresholds are set for the determination coefficient R 2 and the average value EAav of the estimation accuracy.

以上のように構成されたつながり度推定装置30は、計算量の重みが異なる3段階の処理によって主観的なつながり度を算出できる統計モデルを作成する。つながり度推定装置30は、計算量の重みが軽い処理から順番に処理を行い、その都度統計モデルに適用される属性の候補の数を減少させる。つながり度推定装置30は、このような処理を行うことによって、つながり度と相関がある属性情報を選別する。そのため、つながり度推定装置30は、主観的なつながり度を算出できる統計モデルを効率よく作成することが可能となる。   The connection degree estimation device 30 configured as described above creates a statistical model that can calculate the subjective connection degree by three-stage processing with different calculation amount weights. The connection degree estimation device 30 performs processing in order from processing with a lighter weight of calculation amount, and reduces the number of attribute candidates applied to the statistical model each time. The connection degree estimation device 30 selects attribute information correlated with the connection degree by performing such processing. Therefore, the connection degree estimation device 30 can efficiently create a statistical model that can calculate the subjective connection degree.

具体的な処理として、例えば、以下のような3段階の処理が行なわれる。1つ目の段階として、つながり度推定装置30は、F検定表を用いて有意水準の属性群を抽出する。2つ目の段階として、つながり度推定装置30は、AICを用いてつながり度と相関がある属性群を選択する。3つ目の段階として、つながり度推定装置30は、決定係数R^2及び推定精度の平均値EAavを用いて、適切な統計モデルを選択する。上述した3段階の処理によって、つながり度推定装置30は、主観的なつながり度を推定するために用いる統計モデルを効率よく作成することができる。   As specific processing, for example, the following three-stage processing is performed. As a first step, the connection degree estimation device 30 extracts an attribute group at a significant level using the F test table. As a second stage, the connection degree estimation device 30 selects an attribute group having a correlation with the connection degree using the AIC. As a third stage, the connection degree estimation device 30 selects an appropriate statistical model using the determination coefficient R 2 and the average value EAav of the estimation accuracy. Through the above-described three-stage processing, the connection degree estimation device 30 can efficiently create a statistical model used for estimating the subjective connection degree.

つながり度推定装置30は、作成した統計モデルに対して決定係数R^2及び推定精度の平均値EAavをつながり度推定装置30は、統計モデルを作成する際に個人毎のカスタマイズが必要ない。そのため、つながり度推定装置30は、効率よく主観的なつながり度を算出できる統計モデルを作成することができる。   The connection degree estimation device 30 uses the determination coefficient R ^ 2 and the average value EAav of the estimation accuracy for the created statistical model, and the connection degree estimation device 30 does not require customization for each individual when creating the statistical model. Therefore, the connection degree estimation device 30 can create a statistical model that can efficiently calculate the subjective connection degree.

つながり度推定装置30は、つながり度に相関の高い属性を選択する。そのため、つながり度推定装置30は、より少ない数の属性で統計モデルを作成することができる。したがって、つながり度の推定精度を維持しつつ、認知者に提供してもらう属性の数を制限し、プライバシーの保護を実現することが可能となる。
なお、以上のように構成されたつながり度推定装置30によって生成される統計モデルは、一次関数で表現される。そのため、ベイズやマルコフモデルのような状態遷移確率を用いる手法に比べて、つながり度を推定する時間を短縮できる。
The connection degree estimation device 30 selects an attribute having a high correlation with the connection degree. Therefore, the connection degree estimation device 30 can create a statistical model with a smaller number of attributes. Therefore, while maintaining the estimation accuracy of the connection degree, it is possible to limit the number of attributes provided to the cognitive person and realize privacy protection.
The statistical model generated by the connection degree estimation device 30 configured as described above is expressed by a linear function. Therefore, it is possible to shorten the time for estimating the connection degree as compared with a method using state transition probabilities such as Bayes and Markov models.

<変形例>
情報入力端末10がつながり度の推定結果を表示するように構成されても良い。
認知者属性は、本実施形態の属性に限定される必要はなく、認知者に関する情報であればどのような情報であってもよい。また、被認知者属性は、本実施形態の属性に限定される必要はなく、被認知者に関する情報であればどのような情報であってもよい。
ステップS202の処理は、有意水準以上の属性群を抽出できる方法であれば、F検定以外の方法が用いられても良い。例えば、T検定を用いて有意水準以上の属性群が抽出されても良い。また、その他の方法が採用されても良い。
<Modification>
The information input terminal 10 may be configured to display the connection degree estimation result.
A cognitive person attribute does not need to be limited to the attribute of this embodiment, and may be any information as long as it is information about the cognitive person. The perceived person attribute need not be limited to the attribute of the present embodiment, and may be any information as long as it is information about the perceived person.
As long as the process of step S202 is a method which can extract the attribute group more than a significance level, methods other than F test may be used. For example, an attribute group having a significance level or higher may be extracted using a T test. Other methods may also be adopted.

属性情報DBに登録されているレコード50には、必ずしも全ての属性について値が登録されていなくても良い。例えば、いくつかの属性について値が登録されていないレコード50が存在しても良い。このような状況において、分析処理部131は、値が属性情報DBに所定個数以上登録されていない属性を含む属性群については、分散分析等の選別の処理の対象としないように構成されても良い。登録されている値の数が少ない属性を用いて統計モデルを作成すると、その精度が低下してしまうおそれがある。したがって、上述した構成が採用されることにより、統計モデルの精度を維持することができる。さらに、分散分析等の選別の処理の対象となる属性群の数が減るため、より効率よく統計モデルを生成することが可能となる。   In the record 50 registered in the attribute information DB, it is not always necessary to register values for all attributes. For example, there may be a record 50 in which values are not registered for some attributes. In such a situation, the analysis processing unit 131 may be configured not to select an attribute group including attributes whose values are not registered in the attribute information DB by a predetermined number or more, such as analysis of variance. good. If a statistical model is created using an attribute with a small number of registered values, the accuracy may be reduced. Therefore, the accuracy of the statistical model can be maintained by adopting the above-described configuration. Furthermore, since the number of attribute groups to be subjected to selection processing such as analysis of variance is reduced, a statistical model can be generated more efficiently.

つながり度推定装置30が推定するつながり度は、人と人とのつながりの強さに限定される必要はない。つながり度推定装置30は、人と物とのつながりの強さや物と物とのつながりの強さを推定するように構成されても良い。   The degree of connection estimated by the connection degree estimation device 30 need not be limited to the strength of the connection between people. The connection degree estimation device 30 may be configured to estimate the strength of connection between a person and a thing or the strength of connection between a thing and a thing.

本実施形態において、被認知者属性を“職場関係の人”に限定するように構成されても良い。その場合、つながり度の値は、認知者が被認知者に対する“和み−イライラ”の感情を“−3“から”+3“までの7段階で表している。“−3“から”−1”までのつながり度の値は、絶対値が大きいほど認知者が被認知者に対して怒っていること表している。“0”のつながり度の値は、認知者と被認知者とが他人のような関係であることを表している。“1“から”3“までのつながり度の値は、値が大きいほど認知者が被認知者に対してやすらいでいることを表している。   In the present embodiment, the perceived person attribute may be limited to “a person related to the workplace”. In this case, the value of the degree of connection represents the feeling of “comfort-irritated” by the cognitive person to the perceived person in seven levels from “−3” to “+3”. The value of the degree of connection from “−3” to “−1” indicates that the greater the absolute value, the more angry the cognitive person is with respect to the person being recognized. A connection degree value of “0” indicates that the cognitive person and the cognitive person have a relationship like others. The value of the degree of connection from “1” to “3” represents that the larger the value, the easier the cognitive person is with respect to the perceived person.

このようなつながり度は、例えば以下の4つの属性のみを用いて生成された統計モデルに基づいて推定されても良い。被認知者との間の過去の体験によって抱いた感情(回帰係数:−0.41〜0.49)、体験の種類(回帰係数:0〜0.78)、電子メールの頻度(回帰係数:0.22)、認知者の年齢層(回帰係数:−0.29)の属性。その結果、職場関係の人の“和み−イライラ”というつながり度は、4つの属性を用いるだけで約60%程度の推定が可能となる。回帰係数とは、目的変数(つながり度)と説明変数との関係を数値化して表している指標である。   Such a degree of connection may be estimated based on, for example, a statistical model generated using only the following four attributes. Emotions (regression coefficient: -0.41 to 0.49) held by past experiences with the recognized person, type of experience (regression coefficient: 0 to 0.78), frequency of e-mail (regression coefficient: 0.22), attributes of the cognitive age group (regression coefficient: -0.29). As a result, it is possible to estimate about 60% of the degree of connection between the people related to the workplace as “smooth-irritated” by using only four attributes. The regression coefficient is an index that represents the relationship between the objective variable (degree of connection) and the explanatory variable in numerical form.

本実施形態において、被認知者属性を“職場関係の人”に限定するように構成されても良い。その場合、つながり度の値は、認知者が被認知者に対する“尊敬−軽蔑”の感情を“−3“から”+3”までの7段階で表している。”−3”から”−1”までのつながり度の値は、絶対値の大きい負の値が大きいほど認知者が被認知者を軽蔑していること表している。“0”のつながり度の値は、認知者と被認知者とが他人のような関係であることを表している。”1”から”3”までのつながり度の値は、正の値が大きいほど認知者が被認知者を尊敬していることを表している。   In the present embodiment, the perceived person attribute may be limited to “a person related to the workplace”. In this case, the value of the degree of connection represents the feeling of “respect-contempt” for the cognitive person in seven levels from “−3” to “+3”. The value of the degree of connection from “−3” to “−1” represents that the cognitive person despises the recognized person as the negative value having a large absolute value increases. A connection degree value of “0” indicates that the cognitive person and the cognitive person have a relationship like others. The value of the connection degree from “1” to “3” represents that the greater the positive value, the more the recognizer respects the person to be recognized.

このようなつながり度は、例えば以下の5つの属性のみを用いて生成された統計モデルに基づいて推定されても良い。被認知者との間の過去の体験によって抱いた感情(回帰係数:−0.34〜0.38)、体験の種類(回帰係数:0〜0.68)、体験をしたときの認知者の状況(回帰係数:−0.37〜0.07)、電子メールの頻度(回帰係数:0.14)、電話頻度(回帰係数:−0.18)の属性。その結果、職場関係の人の“尊敬−軽蔑”というつながり度は、5つの属性を用いるだけで約70%程度の推定が可能となる。   Such a degree of connection may be estimated based on, for example, a statistical model generated using only the following five attributes. Emotions held by past experiences with the perceived person (regression coefficient: -0.34 to 0.38), type of experience (regression coefficient: 0 to 0.68), and recognition person's experience when experiencing Attributes of status (regression coefficient: -0.37 to 0.07), e-mail frequency (regression coefficient: 0.14), and telephone frequency (regression coefficient: -0.18). As a result, it is possible to estimate the degree of connection of “respect-contempt” for people in the workplace by about 70% by using only five attributes.

図9は、人と物に関する属性情報DBの構成図である。
属性情報DBは、レコード60を複数有する。レコード60に定義される属性情報は、データ番号、認知者属性、被認知者属性、つながり度の各値を有する。
データ番号は、レコード60によって表される属性情報の識別番号を表す。
レコード60に定義される認知者属性の具体例として、本人ID、本人性別、本人職業などの各属性がある。
FIG. 9 is a configuration diagram of an attribute information DB related to people and things.
The attribute information DB has a plurality of records 60. The attribute information defined in the record 60 has values of data number, cognitive person attribute, cognitive person attribute, and connection degree.
The data number represents the identification number of the attribute information represented by the record 60.
Specific examples of the cognitive attributes defined in the record 60 include attributes such as a principal ID, a principal sex, and a principal occupation.

本人IDは、レコード60によって表される認知者の識別番号を表す。本人性別は、レコード60によって表される認知者の性別を表す。本人職業は、レコード60によって表される認知者の職業を表す。
レコード60に定義される被認知者属性の具体例として、物ID、物のジャンル(名前)、認知者との関係など各属性がある。
The principal ID represents the identification number of the cognitive person represented by the record 60. The identity gender represents the gender of the cognitive person represented by the record 60. The principal occupation represents the occupation of the cognitive person represented by the record 60.
Specific examples of the recognized person attributes defined in the record 60 include each attribute such as an object ID, an object genre (name), and a relationship with the recognizer.

物IDは、レコード60によって表される被認知者の識別番号を表す。物のジャンル(名前)は、レコード60によって表される物の名前を表す。認知者との関係の値は、レコード60によって表される認知者と被認知者との関係を表す。
つながり度の値は、レコード60によって表される認知者と被認知者とのつながりの強さを表す。つながり度の値は、ユーザによって任意に決定されても良い。つながり度の値は、正の値が大きいほど認知者と被認知者との関係が良好であることを表す。
The object ID represents the identification number of the recognized person represented by the record 60. The genre (name) of the object represents the name of the object represented by the record 60. The value of the relationship with the cognitive person represents the relation between the cognitive person represented by the record 60 and the recognized person.
The connection degree value represents the strength of the connection between the cognitive person and the person to be recognized represented by the record 60. The connection degree value may be arbitrarily determined by the user. The connection degree value indicates that the larger the positive value, the better the relationship between the cognitive person and the cognitive person.

以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。   The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes designs and the like that do not depart from the gist of the present invention.

10…情報入力端末, 20…センシングデバイス, 30…つながり度推定装置, 40…表示端末, 100…情報管理部, 110…情報記憶部, 120…抽出部, 130…作成部, 131…分析処理部, 132…AIC選択部, 133…相関係数算出部, 134…生成処理部, 140…つながり度算出部, 150…決定係数算出部(算出部), 160…推定精度算出部, 170…判断部, 180…出力部 DESCRIPTION OF SYMBOLS 10 ... Information input terminal, 20 ... Sensing device, 30 ... Connection degree estimation apparatus, 40 ... Display terminal, 100 ... Information management part, 110 ... Information storage part, 120 ... Extraction part, 130 ... Creation part, 131 ... Analysis processing part , 132 ... AIC selection unit, 133 ... correlation coefficient calculation unit, 134 ... generation processing unit, 140 ... connection degree calculation unit, 150 ... determination coefficient calculation unit (calculation unit), 160 ... estimation accuracy calculation unit, 170 ... determination unit , 180 ... output section

Claims (4)

人物又は物の属性の情報と、前記人物又は物のつながりの強さを表すつながり度とを表す教師データを用いて、つながり度を推定する際に用いる統計モデルを作成する作成部と、
予め設定された前記属性の情報及び前記つながり度を表す検証データと、前記作成部が作成した前記統計モデルとを用いてつながり度を算出する算出部と、
前記検証データに設定されているつながり度と、前記算出部が算出したつながり度とを比較してつながり度の一致する割合を表す値である推定精度を算出する推定精度算出部と、
前記推定精度算出部が算出した推定精度に基づいて、前記作成部が作成した前記統計モデルの精度を判断する判断部と、
を備える統計モデル生成装置。
A creation unit that creates a statistical model to be used when estimating the connection degree using teacher data representing the attribute information of the person or the object and the connection degree indicating the strength of the connection of the person or the object,
A calculation unit for calculating a connection degree using the preset attribute information and the verification data representing the connection degree, and the statistical model created by the creation unit;
An estimation accuracy calculation unit that calculates an estimation accuracy that is a value representing a proportion of matching degrees by comparing the connection degree set in the verification data and the connection degree calculated by the calculation unit;
A determination unit that determines the accuracy of the statistical model created by the creation unit based on the estimation accuracy calculated by the estimation accuracy calculation unit;
A statistical model generation apparatus comprising:
前記作成部は、前記教師データに予め設定されている複数種の属性のうち、つながり度と相関の高い属性を選択し、選択された属性の情報に基づいて前記統計モデルを生成する、請求項1に記載の統計モデル生成装置。   The creation unit selects an attribute having a high correlation with a connection degree among a plurality of types of attributes preset in the teacher data, and generates the statistical model based on information on the selected attribute. 1. The statistical model generation device according to 1. 人物又は物の属性の情報と、前記人物又は物のつながりの強さを表すつながり度とを表す教師データを用いて、つながり度を推定する際に用いる統計モデルを作成する作成ステップと、
予め設定された前記属性の情報及び前記つながり度を表す検証データと、前記作成ステップにおいて作成された前記統計モデルとを用いてつながり度を算出する算出ステップと、
前記検証データに設定されているつながり度と、前記算出ステップにおいて算出されたつながり度とを比較してつながり度の一致する割合を表す値である推定精度を算出する推定精度算出ステップと、
前記推定精度算出ステップにおいて算出された推定精度に基づいて、前記統計モデルの精度を判断する判断ステップと、
を有する統計モデル生成方法。
A creation step of creating a statistical model for use in estimating the connection degree using teacher data representing the attribute information of the person or the object and the connection degree representing the strength of the connection of the person or the object,
A calculation step for calculating a connection degree using the preset attribute information and the verification data indicating the connection degree, and the statistical model created in the creation step;
An estimation accuracy calculation step of calculating an estimation accuracy which is a value representing a proportion of connection degrees by comparing the connection degree set in the verification data and the connection degree calculated in the calculation step;
A determination step of determining the accuracy of the statistical model based on the estimation accuracy calculated in the estimation accuracy calculation step;
A statistical model generation method comprising:
人物又は物の属性の情報と、前記人物又は物のつながりの強さを表すつながり度とを表す教師データを用いて、つながり度を推定する際に用いる統計モデルを作成する作成ステップと、
予め設定された前記属性の情報及び前記つながり度を表す検証データと、前記作成ステップにおいて作成された前記統計モデルとを用いてつながり度を算出する算出ステップと、
前記検証データに設定されているつながり度と、前記算出ステップにおいて算出されたつながり度とを比較してつながり度の一致する割合を表す値である推定精度を算出する推定精度算出ステップと、
前記推定精度算出ステップにおいて算出された推定精度に基づいて、前記統計モデルの精度を判断する判断ステップと、
をコンピュータに実行させるためのコンピュータプログラム。
A creation step of creating a statistical model for use in estimating the connection degree using teacher data representing the attribute information of the person or the object and the connection degree representing the strength of the connection of the person or the object,
A calculation step for calculating a connection degree using the preset attribute information and the verification data indicating the connection degree, and the statistical model created in the creation step;
An estimation accuracy calculation step of calculating an estimation accuracy which is a value representing a proportion of connection degrees by comparing the connection degree set in the verification data and the connection degree calculated in the calculation step;
A determination step of determining the accuracy of the statistical model based on the estimation accuracy calculated in the estimation accuracy calculation step;
A computer program for causing a computer to execute.
JP2012189989A 2012-08-30 2012-08-30 Statistical model generation apparatus, statistical model generation method, and statistical model generation program Active JP5854355B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012189989A JP5854355B2 (en) 2012-08-30 2012-08-30 Statistical model generation apparatus, statistical model generation method, and statistical model generation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012189989A JP5854355B2 (en) 2012-08-30 2012-08-30 Statistical model generation apparatus, statistical model generation method, and statistical model generation program

Publications (2)

Publication Number Publication Date
JP2014048801A true JP2014048801A (en) 2014-03-17
JP5854355B2 JP5854355B2 (en) 2016-02-09

Family

ID=50608443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012189989A Active JP5854355B2 (en) 2012-08-30 2012-08-30 Statistical model generation apparatus, statistical model generation method, and statistical model generation program

Country Status (1)

Country Link
JP (1) JP5854355B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006260099A (en) * 2005-03-16 2006-09-28 Fuji Xerox Co Ltd Inter-user relation calculating device and method
JP2009193396A (en) * 2008-02-15 2009-08-27 Nagoya Institute Of Technology System for predicting relationship with friends
JP2012043284A (en) * 2010-08-20 2012-03-01 Nippon Telegr & Teleph Corp <Ntt> Presence information management device, presence information management method, and presence information management program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006260099A (en) * 2005-03-16 2006-09-28 Fuji Xerox Co Ltd Inter-user relation calculating device and method
JP2009193396A (en) * 2008-02-15 2009-08-27 Nagoya Institute Of Technology System for predicting relationship with friends
JP2012043284A (en) * 2010-08-20 2012-03-01 Nippon Telegr & Teleph Corp <Ntt> Presence information management device, presence information management method, and presence information management program

Also Published As

Publication number Publication date
JP5854355B2 (en) 2016-02-09

Similar Documents

Publication Publication Date Title
Bogomolov et al. Pervasive stress recognition for sustainable living
Lauw et al. Homophily in the digital world: A LiveJournal case study
US8880600B2 (en) Creating groups of users in a social networking system
US20190261863A1 (en) System and method for providing an indication of the well-being of an individual
Stanley et al. The potential of sensor-based monitoring as a tool for health care, health promotion, and research
JP2019063027A (en) Menstrual type identification system and program
EP3726453A1 (en) Information processing device, information processing method, and program
EP3879539A1 (en) System and method of determining personalized wellness measures associated with plurality of dimensions
US20240086641A1 (en) Modeling analysis of team behavior and communication
Martin et al. Growth mixture models outperform simpler clustering algorithms when detecting longitudinal heterogeneity, even with small sample sizes
Cesare et al. Demographics in social media data for public health research: does it matter?
Purohit et al. On understanding the divergence of online social group discussion
Vu et al. Generic multilayer network data analysis with the fusion of content and structure
US10629225B2 (en) Information processing method, information processing device, and recording medium recording information processing program
JP2014106943A (en) Group extraction device, group extraction method, and program
He et al. Modeling online user behaviors with competitive interactions
US20160174889A1 (en) Smartphone text analyses
JP5854355B2 (en) Statistical model generation apparatus, statistical model generation method, and statistical model generation program
Rivest et al. Capture-recapture methods for estimating the size of a population: dealing with variable capture probabilities
US20170091623A1 (en) Computer readable recording medium, specifying method, specifying apparatus, and method of analyzing provided information
JPWO2014118975A1 (en) Recommendation creation system
JP2020021226A (en) QOL analysis device and program
WO2019187107A1 (en) Information processing device, control method, and program
Sadeghian et al. Happiness recognition from smartphone usage data considering users’ estimated personality traits
US11721415B2 (en) Medical information system, information processing terminal, medical information server and medical information providing method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140618

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20140618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150303

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150501

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151127

R150 Certificate of patent or registration of utility model

Ref document number: 5854355

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250