JP6414966B2 - Health data analysis auxiliary device - Google Patents

Health data analysis auxiliary device Download PDF

Info

Publication number
JP6414966B2
JP6414966B2 JP2014218600A JP2014218600A JP6414966B2 JP 6414966 B2 JP6414966 B2 JP 6414966B2 JP 2014218600 A JP2014218600 A JP 2014218600A JP 2014218600 A JP2014218600 A JP 2014218600A JP 6414966 B2 JP6414966 B2 JP 6414966B2
Authority
JP
Japan
Prior art keywords
item
representative
health data
item group
data analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014218600A
Other languages
Japanese (ja)
Other versions
JP2016085635A (en
Inventor
圭介 小川
圭介 小川
橋本 真幸
真幸 橋本
一則 松本
一則 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2014218600A priority Critical patent/JP6414966B2/en
Publication of JP2016085635A publication Critical patent/JP2016085635A/en
Application granted granted Critical
Publication of JP6414966B2 publication Critical patent/JP6414966B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Description

本発明は、効率的な健康データ取得を可能とする健康データ分析補助装置に関する。   The present invention relates to a health data analysis auxiliary device that enables efficient health data acquisition.

非特許文献1に指摘されているように、社員(従業員)の健康管理は企業経営にとって重要事項である。従って、社員その他の一定集団を対象として健康管理を行うシステムが数多く提案されている。例えば、特許文献1では社員認証を行い、健康データを取得する仕組みを提案している。一方で、特許文献2や非特許文献1のFitBit(登録商標)に代表されるウェアラブルデバイスが浸透しており、このような簡易なデバイスを用いて、従業員や健保組合員の健康状態を取得することができる。   As pointed out in Non-Patent Document 1, the health management of employees (employees) is an important matter for corporate management. Therefore, many systems for managing health for employees and other fixed groups have been proposed. For example, Patent Document 1 proposes a mechanism for performing employee authentication and acquiring health data. On the other hand, wearable devices represented by FitBit (registered trademark) in Patent Document 2 and Non-Patent Document 1 have permeated, and using such simple devices, the health status of employees and health insurance members is acquired. can do.

また、全国的に健保主導で健康診断(以下、健診とする)が行われており、1年に一度、全ての組合員の健診データを取得し、ハイリスク者を抽出している。   In addition, health checkups (hereinafter referred to as health checkups) are conducted nationwide, and health checkup data for all members is acquired once a year to extract high-risk individuals.

特開2008-305050号公報JP 2008-305050 A 特許5489105号Patent No. 5489105

http://www.jmsc.co.jp/word/column/no83.htmlhttp://www.jmsc.co.jp/word/column/no83.html http://www.fitbit.com/jphttp://www.fitbit.com/jp

しかし、一般的な健診は健診項目が限られているため、既に疾病を発症する寸前の極めてハイリスクな人や既に発症している人を抽出することはできても、大部分の潜在的なハイリスク者を見逃してしまうことが多い。つまり、既に予防が難しい人だけを抽出できても、予防ができる人を抽出することが難しいという問題があった。つまり、健診データだけで十分にスクリーニングできる人もいれば、できない人もおり、できない人の中に潜在的に予防可能なハイリスク者が多く潜んでいる。   However, since general health examinations have limited health examination items, it is possible to extract very high-risk people who have already developed a disease or those who have already developed disease, but most potential Often overlook high-risk people. That is, there is a problem that it is difficult to extract a person who can be prevented even if only a person who is already difficult to prevent can be extracted. In other words, there are some people who can be adequately screened using only medical examination data, and there are some who cannot, and there are many high-risk people who can potentially be prevented among those who cannot.

こういったデータを補完する方法として、例えば健診項目を増やしたり、ウェアラブルデバイスを配ったりすることが考えられるが、一方で、一般に数万人に及ぶ大企業において、従業員の健康状態を把握するために、ウェアラブルデバイスを配ることは現実的ではない。また、健診項目も全ての従業員の分を増やすとコストが大幅に増加してしまう。   As a method of supplementing such data, for example, it is possible to increase the number of medical examination items or distribute wearable devices, but on the other hand, generally grasp the health status of employees in tens of thousands of large companies. In order to do this, it is not practical to distribute wearable devices. In addition, as for the medical examination items, if the amount of all employees is increased, the cost will be greatly increased.

本発明は、上記従来技術の課題に鑑み、効率的な健康データ取得を可能とする健康データ分析補助装置を提供することを目的とする。   An object of the present invention is to provide a health data analysis auxiliary device that enables efficient health data acquisition in view of the above-described problems of the prior art.

上記目的を達成するため、本発明は、第一項目群からなる健康データの各項目の評価値を複数対象者について取得する第一取得部と、前記第一項目群の各項目と、健康データの第二項目群の各項目と、の関係性を表す所定の数値を、関係性行列として記憶する関係性行列保存部と、前記取得した第一項目群の各項目の評価値に、前記関係性行列において対応する前記第二項目群の各項目の数値を重みとして付与したものを、当該第二項目群の各項目に関して特化した各対象者の特徴ベクトルとして生成し、当該第二項目群の各項目ごとに、当該特徴ベクトルに基づいて前記複数対象者をクラスタリングするクラスタリング部と、前記第二項目群の各項目ごとにクラスタリングした結果の各クラスタより、当該第二項目群の各項目を評価する対象としての代表者を決定する代表決定部と、を備えることを特徴とする。   In order to achieve the above object, the present invention provides a first acquisition unit that acquires an evaluation value of each item of health data consisting of a first item group for a plurality of subjects, each item of the first item group, and health data A relationship matrix storage unit that stores a predetermined numerical value representing a relationship between each item of the second item group and a relationship matrix, and the evaluation value of each item of the acquired first item group, the relationship In the sex matrix, a value given as a weight for each item of the corresponding second item group is generated as a feature vector of each subject specialized for each item of the second item group, and the second item group For each item, a clustering unit that clusters the plurality of subjects based on the feature vector, and each cluster of the result of clustering for each item of the second item group, each item of the second item group VS to evaluate , A representative determination unit that determines a representative as characterized in that it comprises a.

本発明によれば、第一項目群からなる健康データと、第一項目群の各項目と健康データの第二項目群の各項目と、の関係性を数値化した関係性行列と、を入力として、複数対象者を第二項目群の各項目ごとに特化した形でクラスタリングすることができ、各クラスタより二項目群の各項目を評価する対象としての代表者を決定することができる。従って、第二項目群の健康データを入力として用いずに、第二項目群の健康データを実際に評価する際の効果的なスクリーニングが、当該決定された代表者により達成されることとなり、効果的な健康データの取得が可能となる。   According to the present invention, the health data consisting of the first item group, and the relationship matrix that quantifies the relationship between each item of the first item group and each item of the second item group of the health data are input. As described above, a plurality of subjects can be clustered in a form specialized for each item of the second item group, and a representative as an object for evaluating each item of the two item group can be determined from each cluster. Therefore, effective screening when actually evaluating the health data of the second item group without using the health data of the second item group as an input will be achieved by the determined representative. Health data can be acquired.

特に、第一項目群の健康データが容易に取得可能なものであり、第二項目群の健康データが取得困難なものである場合に、第二項目群の健康データに関して、効果的な取得が可能となる。   In particular, when the health data of the first item group is easily obtainable and the health data of the second item group is difficult to obtain, effective acquisition of the health data of the second item group is possible. It becomes possible.

一実施形態に係る健康データ分析補助装置の機能ブロック図である。It is a functional block diagram of the health data analysis auxiliary device concerning one embodiment. 一実施形態に係る健康データ分析補助装置の動作のフローチャートである。It is a flowchart of operation | movement of the health data analysis assistance apparatus which concerns on one Embodiment. 第一項目群の健康データとして利用することのできる、健診データにおける項目の例を示す図である。It is a figure which shows the example of the item in medical examination data which can be utilized as health data of a 1st item group. 第二項目群の健康データとして利用することのできる、ウェアラブルデバイスで取得される健康データにおける項目の例を示す図である。It is a figure which shows the example of the item in the health data acquired with the wearable device which can be utilized as health data of a 2nd item group. 関係性行列の値の模式的な例を示す図である。It is a figure which shows the typical example of the value of a relationship matrix. クロス集計表の概念的な例を示す図である。It is a figure which shows the conceptual example of a cross tabulation table. 潜在トピック分析によるクラスタリングを説明するための図である。It is a figure for demonstrating the clustering by a latent topic analysis. クラスタリング部の分類結果を模式的に示す図である。It is a figure which shows typically the classification result of a clustering part. 再分析判断部が、関係性行列を修正する際の具体的な計算を例を用いて説明するための図である。It is a figure for demonstrating the specific calculation when a reanalysis judgment part corrects a relationship matrix using an example. 相互に貸し出しが可能な人の関係マトリクスの例を示す図である。It is a figure which shows the example of the relationship matrix of the person who can lend mutually. 関係マトリクスとそのマルコフクラスタリングの結果との例を示す図である。It is a figure which shows the example of a relationship matrix and the result of the Markov clustering.

図1は、一実施形態に係る健康データ分析補助装置の機能ブロック図である。健康データ分析補助装置10は、第一取得部1、クラスタリング部2、関係性行列保存部3、代表決定部4、第二取得部5、推定部6、再分析判断部7、第一数値化部11及び第二数値化部15を備える。   FIG. 1 is a functional block diagram of a health data analysis auxiliary device according to an embodiment. The health data analysis auxiliary device 10 includes a first acquisition unit 1, a clustering unit 2, a relationship matrix storage unit 3, a representative determination unit 4, a second acquisition unit 5, an estimation unit 6, a reanalysis determination unit 7, and a first quantification A unit 11 and a second digitizing unit 15.

図2は、一実施形態に係る健康データ分析装置の動作のフローチャートである。以下、図2の各ステップを説明しながら、図1の各部を説明する。   FIG. 2 is a flowchart of the operation of the health data analysis apparatus according to the embodiment. Hereinafter, each part of FIG. 1 will be described while explaining each step of FIG. 2.

ステップS1では、第一取得部1が、複数の対象者についての第一項目群の健康データを取得する。第一項目群の各々をE1(i)(i=1, 2, …, n)とする。各項目E1(i)は健康を評価する項目であり、当該取得される健康データにおいて対象者の各々にその評価値が与えられている。複数の対象者の中の任意の一人の対象者aの項目E1(i)の評価値をe1[i, a]とすると、当該取得される健康データにより、第一取得部1において複数の対象者のそれぞれの対象者aの健康状態を表すベクトル(e1[1, a], e1[2, a], …, e1[n, a])が得られることとなる。 In step S1, the first acquisition unit 1 acquires health data of the first item group for a plurality of subjects. Let each of the first item group be E1 (i) (i = 1, 2,..., N). Each item E1 (i) is an item for evaluating health, and the evaluation value is given to each target person in the acquired health data. If the evaluation value of item E1 (i) of any one subject a among a plurality of subjects is e1 [i, a] , the first obtaining unit 1 uses the obtained health data to obtain a plurality of subjects. Thus, a vector (e1 [1, a] , e1 [2, a] ,..., E1 [n, a] ) representing the health state of each of the subjects a is obtained.

当該ステップS1で取得される第一項目群の健康データは具体的には例えば、健診データを利用することができる。なお、健診は年に一度行われ、実施率も高いため、健診データは多数の対象者について容易に取得できるという特徴がある。   Specifically, for example, health check data can be used as the health data of the first item group acquired in step S1. In addition, since the medical examination is performed once a year and the implementation rate is high, the medical examination data can be easily acquired for a large number of subjects.

図3に、健診データの項目の例を示す。ここでは、健診データにおける諸項目を大きく3つに分けてそれぞれ「身体データ」、「血液データ」及び「問診票」に関連する各項目を[1],[2],[3]に示している。   FIG. 3 shows an example of items of medical examination data. Here, the items in the medical examination data are roughly divided into three, and the items related to “Body data”, “Blood data” and “Questionnaire” are shown in [1], [2], [3], respectively. ing.

なお、ステップS1にて第一取得部1が第一項目群の健康データを取得して各対象者aの健康状態を表すベクトル(e1[1, a], e1[2, a], …, e1[n, a])を得るに際して、当該ベクトルを後述するステップS2におけるクラスタリングが可能な形式として得ておく必要がある。ステップS1にて当該形式の変換を担うのが第一数値化部11である。 In step S1, the first acquisition unit 1 acquires the health data of the first item group and represents the health state of each subject a (e1 [1, a] , e1 [2, a] , ..., When obtaining e1 [n, a] ), it is necessary to obtain the vector in a format that can be clustered in step S2 described later. The first digitizing unit 11 is responsible for the conversion of the format in step S1.

すなわち、第一項目群の健康データとしては図3のような健診データを利用できるが、一般にその各項目E1(i)(i=1, 2, …, n)の評価値は量的データで与えられている場合もあれば、質的データで与えられている場合もある。例えば、図3の[3]の問診票の項目「保健指導の希望」の評価値は質的データとして「あり」又は「なし」等となる。また、量的データであっても項目によってはその単位が異なる。例えば、図3の[1]の身体データの項目において「身長」の単位は「長さ」であり、「体重」の単位は「重さ」である。   That is, as the health data of the first item group, the medical examination data as shown in FIG. 3 can be used, but generally, the evaluation value of each item E1 (i) (i = 1, 2,..., N) is quantitative data. In some cases, it may be given as qualitative data. For example, the evaluation value of the item “hope for health guidance” in the questionnaire [3] in FIG. 3 is “Yes” or “No” as qualitative data. Moreover, even if it is quantitative data, the unit changes with items. For example, in the body data item of [1] in FIG. 3, the unit of “height” is “length”, and the unit of “weight” is “weight”.

従って、いわば「生データ」の状態においては上記のように各項目E1(i)(i=1, 2, …, n)の評価値が種々の形式を取っているのを、統一的な数値形式に変換することで、前述のクラスタリング可能な各対象者aの健康状態を表すベクトル(e1[1, a], e1[2, a], …, e1[n, a])を生成するのが、第一数値化部11である。 Therefore, in the “raw data” state, the evaluation values of each item E1 (i) (i = 1, 2,…, n) take various forms as described above. By converting to the format, the above-mentioned vector (e1 [1, a] , e1 [2, a] ,…, e1 [n, a] ) representing the health status of each subject a that can be clustered is generated. Is the first numerical unit 11.

第一数値化部11による当該変換には、各項目E1(i)(i=1, 2, …, n)ごとに所定の変換式を予め用意しておいて当該変換式を適用するようにしてもよいし、本出願人による特願2013-159323号(数値データ解析装置及びプログラム)、特願2013-163207号(数値データ解析装置及びプログラム)、特願2013-217817号(数値データ文書化装置及びプログラム)などを利用してもよい。なお、第一項目群の健康データが予め、上記のように各項目の評価値が統一的な数値形式で与えられているものである場合には、第一数値化部11による変換処理は省略してよい。   For the conversion by the first digitizing unit 11, a predetermined conversion formula is prepared in advance for each item E1 (i) (i = 1, 2,..., N), and the conversion formula is applied. Alternatively, Japanese Patent Application No. 2013-159323 (numerical data analysis apparatus and program), Japanese Patent Application No. 2013-163207 (numerical data analysis apparatus and program), Japanese Patent Application No. 2013-217817 (numerical data documentation) Device and program) may be used. If the health data of the first item group is preliminarily given in the unified numerical format as described above, the conversion process by the first digitizing unit 11 is omitted. You can do it.

ステップS2では、クラスタリング部2が、上記ステップS1で第一取得部1が取得した第一項目群の健康データを構成している複数の対象者をクラスタリングする。ここで、各対象者aの健康状態を表すベクトル(e1[1, a], e1[2, a], …, e1[n, a])(=V(a)とする)を当該対象者aを表す特徴ベクトルV(a)とすることで、クラスタリングが実施される。 In step S2, the clustering unit 2 clusters a plurality of subjects constituting the health data of the first item group acquired by the first acquisition unit 1 in step S1. Here, a vector (e1 [1, a] , e1 [2, a] ,…, e1 [n, a] ) (= V (a)) (= V (a)) representing the health status of each subject a Clustering is performed by using the feature vector V (a) representing a.

ただしこの際、V(a)をそのままクラスタリングするのではなく、第二項目群の健康データの各項目E2(i)(i=1, 2, …, m)の影響度合いを特徴ベクトルV(a)において予め加味させることで、対象者aの項目E2(i)に特化した特徴ベクトルV(a)[E2(i)]へと変換し、当該特徴ベクトルV(a)[E2(i)]を対象としてクラスタリングが実施される。 However, in this case, V (a) is not clustered as it is, but the degree of influence of each item E2 (i) (i = 1, 2,…, m) of the health data of the second item group is represented by the feature vector V (a ) In advance, the feature vector V (a) [E2 (i)] specialized for the item E2 (i) of the subject a is converted into the feature vector V (a) [E2 (i) ] clustering is implemented as target.

従って、クラスタリング結果は第二項目群の各項目E2(i)(i=1, 2, …, m)ごとにそれぞれ得られることとなる。なお、項目E2(i)についてのクラスタリング結果の各クラスタをC(i, k)(k=1, 2, …, K(i))と表記する。尚、K(i)は、i番目の項目E2(i)のクラスタ数である。ここで、クラスタ数は各項目E2(i)につき任意(所定数)としてもよいし、AIC(赤池情報量基準)等で最適な数を決定してもよいし、無限次元のLDAや混合ディリクレ過程等を使うことで自動で決定するようにしてもよい。   Accordingly, a clustering result is obtained for each item E2 (i) (i = 1, 2,..., M) of the second item group. Each cluster of the clustering result for the item E2 (i) is denoted as C (i, k) (k = 1, 2,..., K (i)). K (i) is the number of clusters of the i-th item E2 (i). Here, the number of clusters may be arbitrary (predetermined number) for each item E2 (i), an optimal number may be determined by AIC (Akaike Information Criterion), or an infinite dimensional LDA or mixed dirichlet. You may make it determine automatically by using a process etc.

当該第二項目群の健康データの各項目は具体的には例えば、種々のウェアラブルデバイスによって取得される健康データを利用することができる。図4に、ウェアラブルデバイスで取得される健康データの項目例を示す。   Specifically, each item of the health data of the second item group can use, for example, health data acquired by various wearable devices. FIG. 4 shows an example of items of health data acquired by the wearable device.

ここで、第二項目群の健康データは、第一項目群の健康データよりも取得に困難が伴うものであるが、その代わりに、健康データとしてはより詳細な情報を与えるものであることを想定している。例えば、第一項目群の健康データの例としての健診データは、健診が広く定期的に実施されることから多数の対象者について容易に取得可能であるが、大雑把な健康状態しか把握できないものであることを想定している。   Here, the health data of the second item group is more difficult to obtain than the health data of the first item group, but instead, the health data gives more detailed information. Assumed. For example, the medical examination data as an example of the health data of the first item group can be easily acquired for a large number of subjects because the medical examination is widely performed regularly, but only a rough health condition can be grasped. It is assumed that it is a thing.

これに対して、第二項目群の健康データの例としてのウェアラブルデバイスの健康データは、健診と同じような多数の対象者に特殊な機器であるウェアラブルデバイスを配布することが困難であることから、また、実際にウェアラブルデバイスを装着してデータを取得する際に発生する手間等から、取得が困難であるが、その代わりに図4で例示したような、健康状態に関して詳細な情報を与えるものであることを想定している。   On the other hand, the health data of the wearable device as an example of the health data of the second item group is difficult to distribute the wearable device, which is a special device, to a large number of subjects similar to the medical examination. In addition, although it is difficult to acquire the data due to the trouble of actually acquiring the data by wearing the wearable device, the detailed information on the health condition as shown in FIG. 4 is given instead. It is assumed that it is a thing.

従って例えば、第一項目群の健康データとしての健診データが「標準」健診のものである場合に、第二項目群の健康データを、当該標準健診では(費用負担等の観点から)省略されている詳細な健診項目について実施される「特別」健診のものとしてもよい。   Therefore, for example, when the health examination data as the health data of the first item group is that of the “standard” health examination, the health data of the second item group is changed to the standard health examination (from the viewpoint of cost burden). It is good also as a thing of the "special" medical examination implemented about the detailed medical examination item abbreviate | omitted.

ステップS2におけるクラスタリング部2によるクラスタリングの前処理としての、前述した対象者aを表す特徴ベクトルV(a)の第二項目群の各項目E2(i)に特化した特徴ベクトルV(a)[E2(i)]への変換については、関係性行列保存部3に予め保存されている関係性行列を参照して、ベクトルの各要素に当該行列の各要素を重みとして積算するようにすればよい。 Feature vector V (a) specialized for each item E2 (i) of the second item group of feature vector V (a) representing target person a described above as preprocessing of clustering by clustering unit 2 in step S2 [ For conversion to E2 (i)] , if the relationship matrix stored in advance in the relationship matrix storage unit 3 is referred to, each element of the matrix is added to each element of the vector as a weight. Good.

関係性行列Mとは、そのi行j列要素の値Mi,jを、第二項目群における項目E2(i)と第一項目群における項目E1(j)との関係性を表す数値(関係性が強いほど大きく、関係性が弱いほど小さい数値)で与えたものである。(なお、この転置で定義してもよいが、意味合いは同じであるため、以下、当該定義で関係性行列Mに言及する。) The relationship matrix M is a numerical value representing the relationship between the value M i, j of the i row and j column element of the item E2 (i) in the second item group and the item E1 (j) in the first item group ( The larger the relationship, the larger the value, and the weaker the relationship, the smaller the value. (Although it may be defined by this transposition, since the meaning is the same, hereinafter, the relationship matrix M is referred to in the definition.)

当該関係性行列M=(Mij)を用いることで、特徴ベクトルV(a)= (e1[1, a], e1[2, a], …, e1[n, a])を、第二項目群の各項目E2(i)に特化した特徴ベクトルV(a)[E2(i)]= (Mi,1*e1[1, a], Mi,2*e1[2, a], …, Mi,n*e1[n, a])へと変換することができる。すなわち、特徴ベクトルV(a)においては第一項目群の各項目E1(j)(j=1, 2, …, n)の評価値「e1[j,a]」が要素として列挙されているので、これらにつきそれぞれ、第二項目群の項目E2(i)と当該項目E1(j)との関係性の値Mi,jを重みとして積算することで、重み付与された評価値「Mi,j* e1[j,a]」へと変換し、特徴ベクトルV(a)[E2(i)]を生成すればよい。 By using the relationship matrix M = (M ij ), the feature vector V (a) = (e1 [1, a] , e1 [2, a] ,…, e1 [n, a] ) Feature vector V (a) [E2 (i)] specialized for each item E2 (i) in the item group = (M i, 1 * e1 [1, a] , M i, 2 * e1 [2, a] ,…, M i, n * e1 [n, a] ). That is, in the feature vector V (a), the evaluation value “e1 [j, a] ” of each item E1 (j) (j = 1, 2,..., N) of the first item group is listed as an element. Therefore, for each of these, the weighted evaluation value “M i is obtained by integrating the values M i, j of the relationship between the item E2 (i) of the second item group and the item E1 (j) as weights. , j * e1 [j, a] ”to generate a feature vector V (a) [E2 (i)] .

図5に、関係性行列の値の模式的な例を示す。図5の例では、関係性行列の一部分の値の例が表として示され、行方向の第二項目群の項目E2(1),E2(2)と、列方向の第一項目群の項目E1(1),E1(2),E1(3),E1(4),E1(5)と、に具体例としてそれぞれ図中に記すような項目が設定されている。例えば、第二項目群の項目E2(2)「活動量」と第一項目群の項目E1(5)「30分以上の運動習慣」と、の関係性の数値は、当該表中の2行5列の位置(項目表示部分を除いた位置)を参照することで、「0.9」であることがわかる。   FIG. 5 shows a schematic example of the value of the relationship matrix. In the example of FIG. 5, an example of values of a part of the relationship matrix is shown as a table, items E2 (1) and E2 (2) in the second item group in the row direction, and items in the first item group in the column direction. E1 (1), E1 (2), E1 (3), E1 (4), and E1 (5) are set with items as shown in the figure as specific examples. For example, the numerical value of the relationship between item E2 (2) `` activity amount '' in the second item group and item E1 (5) `` exercise habits of 30 minutes or more '' in the first item group is the two rows in the table. By referring to the position of 5 columns (position excluding the item display part), it can be seen that it is “0.9”.

当該関係性行列Mについては、予め算出して関係性行列保存部3に保存しておき、クラスタリング部2から参照するようにすればよい。なお、具体的に当該関係性行列Mを算出する手法としては、以下の[手法1]〜[手法3]を挙げることができる。   The relationship matrix M may be calculated in advance and stored in the relationship matrix storage unit 3 and referenced from the clustering unit 2. Specific methods for calculating the relationship matrix M include [Method 1] to [Method 3] below.

[手法1] 一般的知識を利用することで、関係性行列M=(Mi,j)の各要素に所定値を設定する。 [Method 1] By using general knowledge, a predetermined value is set for each element of the relationship matrix M = (M i, j ).

[手法2] 項目E2(i)と項目E1(j)との双方のデータが存在する人のデータを集約し、周知の多変量解析等で相関を求め、当該相関値によって関係性行列M=(Mi,j)とする。 [Method 2] Aggregating the data of people who have both data of item E2 (i) and item E1 (j), obtaining correlation by well-known multivariate analysis etc., and using the correlation value, the relationship matrix M = Let (M i, j ).

また、[手法2]では多変量解析の代わりに、周知のクロス集計表の独立性検定を行うようにしてもよい。図6に、項目E2(i)の一例としての「歩数」と、項目E1(j)の一例としての「BMI」(body mass index;肥満指数)と、に関するクロス集計表の概念的な例(各欄の具体的な数値は省略している)を示す。この場合例えば、関連があると判定された項目においては「1」、関連無しの場合には「0」と離散的に設定してもよいし、統計量を算出して当該統計量の関数として連続的に設定してもよい。   In [Method 2], a well-known cross tabulation table independence test may be performed instead of the multivariate analysis. FIG. 6 shows a conceptual example of a cross tabulation table regarding “step count” as an example of item E2 (i) and “BMI” (body mass index) as an example of item E1 (j). Specific numerical values in each column are omitted). In this case, for example, “1” may be set for items determined to be related, and “0” may be set for non-related items, or a statistic may be calculated and used as a function of the statistic. It may be set continuously.

[手法3] インターネット上のウェブ文書等を取得し、周知のテキスト解析技術を適用することによって当該文書を解析することにより、単語同士の共起性、距離等から関係性を計算する。単語としては項目E2(i)と項目E1(j)とをそのまま用いてもよいし、関連する単語を用いてもよい。   [Method 3] Obtain a web document on the Internet, analyze the document by applying a well-known text analysis technique, and calculate the relationship from the co-occurrence and distance between words. As the word, the item E2 (i) and the item E1 (j) may be used as they are, or related words may be used.

以上、ステップS2にてクラスタリング部2は、関係性行列Mi,jを重みとして付与することで、各対象者aを表す特徴ベクトルV(a)を第二項目群の各項目E2(i)に特化した特徴ベクトルV(a)[E2(i)]へと変換してから、特徴ベクトルV(a)[E2(i)]を対象とすることで項目E2(i)に特化したクラスタリングを実施する。当該クラスタリングには、k-meansや潜在トピック分析の一種であるLDA(潜在ディリクレ配分法)等の周知手法を利用することができる。 As described above, in Step S2, the clustering unit 2 assigns the feature matrix V (a) representing each subject a to each item E2 (i) of the second item group by assigning the relationship matrix M i, j as a weight. after converted into a feature vector V specialized (a) [E2 (i) ] to, specialized in the feature vector V (a) [E2 (i) ] item E2 (i) by targeting Perform clustering. For the clustering, a known method such as LDA (latent Dirichlet allocation method) which is a kind of k-means or latent topic analysis can be used.

ここで、後述する事項の説明における前提となるため、LDA等の潜在トピック分析によるクラスタリングを簡単に説明する。図7は、当該潜在トピック分析によるクラスタリングの結果及びその意味合いを説明するための図である。   Here, since it is a premise in the description of the items described later, clustering by latent topic analysis such as LDA will be briefly described. FIG. 7 is a diagram for explaining the result of clustering by the latent topic analysis and its meaning.

図7にて、第一取得部1より得られるクラスタリング対象の全データがDであり、各対象者aの特徴ベクトルV(a)[E2(i)]を行ベクトルとして列挙した行列形式のデータである。潜在トピック分析においては、行列Dの各行はバグオブワーズとしての「文書u」であり、その列方向に並ぶ要素は各単語i1, i2, …, inの頻度数である。 In FIG. 7, all data to be clustered obtained from the first acquisition unit 1 is D, and data in a matrix format in which the feature vectors V (a) [E2 (i)] of each subject a are listed as row vectors It is. In latent topic analysis, each row of the matrix D is a "document u" as Baguobuwazu, elements aligned in the column direction each word i 1, i 2, ..., is the frequency number of the i n.

本発明においては、各「文書u」が各「対象者a」に相当し、各単語i1, i2, …, inは、第一項目群の各項目E1(1), E1(2), …, E1(n)に対応する単語となる。そして、各単語i1, i2, …, inの具体的な頻度数については特徴ベクトルV(a)[E2(i)]として計算した通りの値となる。 In the present invention, each “document u” corresponds to each “subject a”, and each word i 1 , i 2 ,..., I n corresponds to each item E1 (1), E1 (2 ), ..., E1 (n). Then, the specific frequency numbers of the respective words i 1 , i 2 ,..., I n are values as calculated as the feature vector V (a) [E2 (i)] .

LDA等の潜在トピック分析では、文書u(本発明においては各対象者a)をこのようにバグオブワーズ、つまり単語とその出現頻度として取り扱い、文書においてそのトピックを推定する。例えば、「経済」トピックからは、「株価」、「増収増益」・・・といった単語が出現するだろうし、「スポーツ」トピックからは「野球」、「サッカー」といった単語が出現することになる。   In latent topic analysis such as LDA, the document u (each target person a in the present invention) is treated as a bug of words, that is, a word and its appearance frequency, and the topic is estimated in the document. For example, words such as “stock price”, “increased sales and profits” will appear from the “economy” topic, and words such as “baseball” and “soccer” will appear from the “sports” topic.

これは、観測されたバグオブワーズ表現、つまり単語i(列成分)と文書u(行成分)との関係行列Dを、図7に示すように、単語i(列成分)とトピックk(行成分)の関係行列Φと、文書u(行成分)とトピックk(列成分)の関係行列θとの積に分解することを意味している。このトピックkを推定するのがLDA等の潜在トピック分析であり、当該分析の結果として図7に示すような「D=θ×Φ」の分解結果が得られる。   This is because the observed bug-of-words expression, that is, the relationship matrix D between the word i (column component) and the document u (row component), as shown in FIG. 7, the word i (column component) and the topic k (row component). , And the product of the relationship matrix θ of the document u (row component) and the topic k (column component). This topic k is estimated by latent topic analysis such as LDA, and as a result of the analysis, a decomposition result of “D = θ × Φ” as shown in FIG. 7 is obtained.

このようにLDAに代表されるトピックモデルでは、各文書が固有のトピック比率を持ち、単語はこのトピック比率に従いトピックを選択したあと、そのトピックに固有の比率で生成されるという仮定をおいている。   Thus, the topic model represented by LDA assumes that each document has a unique topic ratio, and words are generated at a ratio specific to the topic after selecting the topic according to this topic ratio. .

なお、各文書u(=対象者a)のクラスタリング結果として解釈する場合には、例えば、関係行列θにおける当該文書uの行(行ベクトル)が、当該文書uの各トピックkへの所属確率を与えたものとなっているので、例えば、当該所属確率が最も高いトピックkに対応するクラスタに所属するものとして解釈することができる。   When interpreting the clustering result of each document u (= target person a), for example, the row (row vector) of the document u in the relationship matrix θ represents the affiliation probability of the document u to each topic k. Therefore, for example, it can be interpreted as belonging to the cluster corresponding to the topic k having the highest membership probability.

図2の各ステップの説明に戻り、ステップS3では、代表決定部4が、第二項目群の各項目E2(i) (i=1, 2, …, m)の各々に関してクラスタリング部2の分類した各クラスタC(i, k)(k=1, 2, …, K(i))より、項目E2(i)を実際に評価する対象となる代表者を決定する。   Returning to the description of each step in FIG. 2, in step S3, the representative determining unit 4 classifies the clustering unit 2 for each item E2 (i) (i = 1, 2,..., M) of the second item group. From each of the clusters C (i, k) (k = 1, 2,..., K (i)), a representative to be actually evaluated for the item E2 (i) is determined.

当該決定される代表者の本発明における意義は、以下の通りである。   The significance of the representative to be determined in the present invention is as follows.

本発明においては特に、適切な値が設定された関係性行列Mを重みとして予め付与することによって、クラスタリング部2の分類結果が、健康状態のうち特に項目E2(i)に注目して分類した結果となっている。すなわち、各クラスタC(i, k)に属する対象者同士の間では、項目E2(i)の評価結果は概ね似ていることとなる。従って、各クラスタC(i, k)から決定した少数の代表者のみを対象として当該項目E2(i)を評価することで、項目E2(i)に関して当該クラスタC(i, k)に属する全ての対象者の傾向を知ることができる。   Particularly in the present invention, the classification result of the clustering unit 2 is classified by paying attention to the item E2 (i) in the health state in particular by assigning the relationship matrix M in which appropriate values are set in advance as weights. It is the result. That is, the evaluation results of the item E2 (i) are generally similar between the subjects belonging to each cluster C (i, k). Therefore, by evaluating the item E2 (i) only for a small number of representatives determined from each cluster C (i, k), all items belonging to the cluster C (i, k) with respect to the item E2 (i) You can know the tendency of the target audience.

このため、第二項目群の項目E2(i)が図4で説明したようなウェアラブルデバイスによって取得されるものであり、コスト等の観点から取得が困難なものである場合であっても、第一項目群の健康データの取得対象となった全対象者につき、高いコストを負担して項目E2(i)を評価することなく、各クラスタC(i, k)の代表者のみにおいて項目E2(i)を評価することで、全対象者の項目E2(i)についての傾向を知ることができるようになる。   For this reason, even if the item E2 (i) of the second item group is acquired by the wearable device as described in FIG. 4 and is difficult to acquire from the viewpoint of cost or the like, For all subjects for whom health data for a group of items was acquired, item E2 () was only available for representatives of each cluster C (i, k) without incurring high costs and evaluating item E2 (i). By evaluating i), it becomes possible to know the tendency of item E2 (i) of all subjects.

従って、クラスタC(i, k)の代表者において調査した結果、項目E2(i)に関して危険(あるいは潜在的に危険)な結果となっていれば、当該クラスタC(i, k)内の全員が当該項目E2(i)に関して危険(あるいは潜在的に危険)な結果である可能性が高いので、当該クラスタC(i, k)に属する対象者につき、重点的に項目E2(i)を評価するようにすればよい。   Therefore, if the result of investigation by the representative of cluster C (i, k) shows a dangerous (or potentially dangerous) result for item E2 (i), all members in cluster C (i, k) Is likely to be a dangerous (or potentially dangerous) result for item E2 (i), so item E2 (i) will be evaluated for each subject belonging to cluster C (i, k). You just have to do it.

すなわち、本発明によれば、高コストな評価項目である項目E2(i)に関して、クラスタC(i, k)の代表者のみを予め評価することによって、全対象者の中から重点的に調査すべき対象者を適切にスクリーニング(選別)することが可能となる。これにより、従来の通常の健診データのみでは見落としてしまっていたような、潜在的に予防可能なハイリスク者を、低コストで見つけ出すことが可能となる。   That is, according to the present invention, with respect to the item E2 (i), which is a high-cost evaluation item, only the representatives of the cluster C (i, k) are preliminarily evaluated, so that the survey is focused on among all the subjects. It becomes possible to appropriately screen (select) the subjects to be used. As a result, it is possible to find a potentially preventable high-risk person who has been overlooked only by conventional normal medical examination data at a low cost.

図8は、クラスタリング部2の分類結果を模式的に示す図であり、各クラスタには第一項目群の健康データの取得対象となった全対象者のうちの一部分の例として、対象者a,b,c,d,eが描かれている。[1]では、項目E2(1)の例として「歩数」に特化したクラスタリング結果がC(1,1),C(1,2),…として示されている。[2]では項目E2(2)の例として「心拍」に特化したクラスタリング結果がC(2,1),C(2,2),…として示されている。[3]では、項目E2(3)の例として「活動量」に特化したクラスタリング結果がC(3,1),C(3,2),…として示されている。   FIG. 8 is a diagram schematically illustrating the classification result of the clustering unit 2, and each cluster includes a target a as an example of a part of all the target persons from which health data of the first item group is acquired. , b, c, d, e are drawn. In [1], as an example of the item E2 (1), a clustering result specialized for “step count” is shown as C (1,1), C (1,2),. In [2], as an example of item E2 (2), the clustering result specialized for “heartbeat” is shown as C (2,1), C (2,2),. In [3], as an example of the item E2 (3), the clustering result specialized in “activity” is shown as C (3,1), C (3,2),.

適切な関係性行列Mが利用されてクラスタリングがなされたことを前提として、例えば[1]のクラスタC(1,1)に属している対象者a,b同士では「歩数」に関して概ね共通の評価値が得られることなり、クラスタC(1,2)に属している対象者c,d,e同士でも「歩数」に関して概ね共通の評価値が得られることなる。また、異なるクラスタC(1,1),C(1,2)間では、対象者同士の「歩数」に関する評価値は異なるものが得られることとなる。   On the premise that clustering was performed using an appropriate relationship matrix M, for example, a common evaluation regarding the “step count” between subjects a and b belonging to cluster C (1,1) in [1] As a result, a substantially common evaluation value regarding the “step count” can be obtained among the subjects c, d, e belonging to the cluster C (1, 2). Further, different evaluation values related to the “number of steps” between the target persons are obtained between different clusters C (1,1) and C (1,2).

以上のような意義を有する代表者をステップS3にて代表決定部4が具体的に決定するには、まず、各クラスタにつき代表者数を決定する必要があるが、当該決定に関しては、例えば、次の[手法11]又は[手法12]を利用することができる。   In order for the representative determining unit 4 to specifically determine the representative having the above significance in step S3, first, it is necessary to determine the number of representatives for each cluster. The following [Method 11] or [Method 12] can be used.

なお、第二項目群の各項目E2(i)(i=1, 2, …, m)ごとにそれぞれクラスタリング結果C(i, k)(k=1, 2, …, K(i))が存在するのと同様に、各項目E2(i)について決定する代表者の総数N(i)は、所定値を与えておくものとする。当該総数N(i)は、項目E2(i)を実際に評価する際に払いうるコスト等(予算の関係等)を考慮して予め設定しておけばよい。   The clustering result C (i, k) (k = 1, 2,…, K (i)) is obtained for each item E2 (i) (i = 1, 2,…, m) of the second item group. Similarly to the existence, the total number N (i) of representatives determined for each item E2 (i) is given a predetermined value. The total number N (i) may be set in advance in consideration of the cost that can be paid when the item E2 (i) is actually evaluated (budget relationship, etc.).

[手法11] 各クラスタC(i, k)の代表者数は、各クラスタC(i, k)に属する対象者の評価値のばらつき(分散)に応じた数に比例するように定める。ここで、ばらつきが大きいほど、当該クラスタ内の対象者の健康特性が一定していない(すなわち、不正確なクラスタである)ことを意味しているので、ばらつきに所定の単調増加関数を適用して定まる数に比例するように定めることが好ましい。   [Method 11] The number of representatives of each cluster C (i, k) is determined so as to be proportional to the number corresponding to the variation (variance) of the evaluation values of the subjects belonging to each cluster C (i, k). Here, the larger the variation, the more the health characteristics of the subjects in the cluster are not constant (that is, an inaccurate cluster), so a predetermined monotonically increasing function is applied to the variation. It is preferable that the number is determined so as to be proportional to the number determined.

この際、ばらつきを算出する対象とする評価値については、各対象者aに対する前述の特徴ベクトルV(a)[E2(i)]を用いてもよいし、クラスタリングがLDA等の潜在トピック分析によってなされた場合であれば、各対象者aのトピック所属確率を用いてもよい。なお、トピック所属確率は、図7の文書u(=対象者a)とトピックkとの関係行列θにおける各行ベクトルとして与えられている。 At this time, for the evaluation value as a target for calculating variation, the above-described feature vector V (a) [E2 (i)] for each target person a may be used, or clustering is performed by latent topic analysis such as LDA. If so, the topic affiliation probability of each target person a may be used. The topic affiliation probability is given as each row vector in the relationship matrix θ between the document u (= target person a) and the topic k in FIG.

[手法12] 各クラスタC(i, k)の代表者数は、当該クラスタに所属する対象者数に比例するように定める。   [Method 12] The number of representatives of each cluster C (i, k) is determined to be proportional to the number of subjects belonging to the cluster.

以上のようにして各クラスタC(i, k)の代表者数を定めた後、実際にクラスタに所属する対象者の誰を代表者とするかの決定については、次の[手法13]又は[手法14]を利用することができる。   After determining the number of representatives of each cluster C (i, k) as described above, the following [Method 13] or [Method 14] can be used.

[手法13] 乱数等を用いてランダムに選出することによって決定する。   [Method 13] Random selection using random numbers or the like.

[手法14] 予め、自分自身が当該項目E2(i)を評価される対象となりたい旨の希望を有する対象者(希望者)より、当該希望する旨の情報を受信しておき、当該希望者をまず代表者として決定した後、残りの対象者を上記[手法13]で決定する。なお、希望者が当該クラスタの代表者数に到達した場合は、希望する旨の情報の受信が早かった者を優先する等の所定基準で決定すればよい。   [Method 14] In advance, from the target person (applicant) who wishes to be subject to the evaluation of the item E2 (i), information on the request is received. Is first determined as a representative, and the remaining target persons are determined by the above [Method 13]. In addition, when the applicant has reached the number of representatives of the cluster, the determination may be made based on a predetermined criterion such as giving priority to a person who has received the information indicating that the request is desired.

また、以上のようにして代表者を決定する際に、次のような[制約1]又は[制約2]を課すようにしてもよい。なお、いずれの制約を課すかは、運用ポリシー等による。   Further, when the representative is determined as described above, the following [Constraint 1] or [Constraint 2] may be imposed. Which restrictions are imposed depends on the operation policy and the like.

[制約1] ある所定の項目E2(i)のあるクラスタC(i, k)の代表者として決定された対象者は、別の所定の項目E2(j)のクラスタの代表者には決定しない、あるいは決定される優先度を下げるようにする。   [Restriction 1] A subject who is determined as a representative of a cluster C (i, k) with a certain predetermined item E2 (i) is not determined as a representative of a cluster with another predetermined item E2 (j) Or lower the priority to be determined.

[制約2] 上記とは逆に、ある所定の項目E2(i)のあるクラスタC(i, k)の代表者として決定された対象者は、別の所定の項目E2(j)のクラスタの代表者としても決定する、あるいは決定される優先度を上げるようにする。   [Restriction 2] Contrary to the above, the target person determined as the representative of a certain cluster C (i, k) of a certain predetermined item E2 (i) is the target of the cluster of another predetermined item E2 (j). Decide as a representative or raise the priority of the decision.

以上のようにして、ステップS3で代表決定部4が各項目E2(i)のクラスタリング結果に対する代表者を決定すると、代表決定部4は当該決定結果を該当する代表者に通知することで、通知を受けた代表者の各々において、実際に項目E2(i)の評価が実施され、ステップS4において第二取得部5が、当該実施して得られた一連の第二項目群の健康データの評価値を取得する。なお、第一項目群の評価値をe1[i, a]と同様の記法により、代表者rについての第二項目群の項目E2(i)の評価値をe2[i,r]と表記する。 As described above, when the representative determination unit 4 determines a representative for the clustering result of each item E2 (i) in step S3, the representative determination unit 4 notifies the corresponding representative of the determination result, thereby notifying. In each of the representatives who received the evaluation, the evaluation of the item E2 (i) is actually performed, and in step S4, the second acquisition unit 5 evaluates the health data of the series of the second item group obtained by the execution. Get the value. The evaluation value of the first item group is expressed in the same notation as e1 [i, a], and the evaluation value of the item E2 (i) in the second item group for the representative r is expressed as e2 [i, r] . .

なお、ステップS4で各評価値e2(i)を取得するに際して、予め第二数値化部15で数値化してから、第二取得部5において取得するようにしてもよい。第二数値化部15の当該数値化する機能は、第一数値化部11と同様である。   Note that, when each evaluation value e2 (i) is acquired in step S4, it may be converted into a numerical value by the second numerical conversion unit 15 and then acquired by the second acquisition unit 5. The function of the second digitizing unit 15 for digitizing is the same as that of the first digitizing unit 11.

また、ステップS3における代表者への通知に関しては、周知の電子メール等によって実施すればよい。なお、通知を受けた代表者の各々において実際に項目E2(i)の評価を実施するのは、健康データ分析補助装置10の外部における人為的な作業となり、当該作業がステップS3とステップS4との間で実施される。これは、第一取得部1において取得される第一項目群の健康データの評価の実施(健診の実施等)についても同様である。   Further, the notification to the representative in step S3 may be performed by a well-known e-mail or the like. It is to be noted that the actual evaluation of item E2 (i) in each of the representatives who received the notification is an artificial work outside the health data analysis auxiliary device 10, and the work is performed in steps S3 and S4. Between. The same applies to the evaluation of the health data of the first item group acquired by the first acquisition unit 1 (execution of medical examination, etc.).

なお、ステップS4以降は、ステップS3で決定された代表者によって実際にスクリーニング等を行う際の、運用等に関するステップであり、健康データ分析補助装置10を利用するユーザ(健康データの分析者を想定している)は、当該各ステップにおいて、健康分析に関する種々の知見を得ることができる。以下、当該運用等に関して代表的なものを説明するが、この他にも運用ポリシーに応じて種々の運用が可能である。   Steps S4 and subsequent steps are steps related to operations and the like when actually performing screening and the like by the representative determined in step S3. A user who uses the health data analysis assisting device 10 (assuming an analyst of health data) Can obtain various knowledge about health analysis in each step. In the following, typical operations will be described, but various operations can be performed according to the operation policy.

ステップS5では、ステップS4で第二取得部5が取得した一連の第二項目群の健康データの利用が実施される。当該利用とはすなわち、第二項目群の健康データから種々の有益な情報を抽出することであり、一実施形態では推定部6が推定を行い、一実施形態では再分析判断部7が再分析すべきか否かの判断と、すべき旨の判断が下された場合には再分析と、を行うことができる。以下、当該各部6,7による各実施形態を説明する。   In step S5, the use of the health data of the series of second item groups acquired by the second acquisition unit 5 in step S4 is performed. In other words, the use is to extract various useful information from the health data of the second item group. In one embodiment, the estimation unit 6 performs estimation, and in one embodiment, the reanalysis determination unit 7 performs reanalysis. It is possible to perform a determination as to whether or not to perform a reanalysis if a determination is made. Hereinafter, each embodiment by the respective units 6 and 7 will be described.

推定部6は、代表者としては決定されず第二項目群の項目E2(i)の健康データが取得されていない対象者aに関しての、当該項目E2(i)の評価値e2[i,a]を推定する。当該推定に際して、実際にE2(i)の健康データが取得された一連の代表者rにおける評価値e2[i,r]を利用する。 The estimation unit 6 determines the evaluation value e2 (i, a ) of the item E2 (i) regarding the subject a for which the health data of the item E2 (i) of the second item group has not been acquired as a representative. ] Is estimated. In the estimation, evaluation values e2 [i, r] in a series of representatives r from which the health data of E2 (i) are actually acquired are used.

クラスタリング部2においてk-means等の単一トピックを前提としたクラスタリングを行った場合であれば、推定される対象となる対象者aと代表者rとが同一のクラスタに属していることを条件として「e2[i,a]=e2[i,r]」として推定することができる。なお、当該クラスタ内に代表者rが複数存在すれば、当該クラスタ内の代表者ではない対象者aの評価値e2[i,a]は、当該複数の代表者rにおける評価値e2[i,r]と同様の統計分布で与えられるものとして推定することができる。例えば、評価値e2[i,a]は当該分布における平均値として推定するようにしてよい。 If the clustering unit 2 performs clustering on the premise of a single topic such as k-means, it is necessary that the target person a and the representative r to be estimated belong to the same cluster. As “e2 [i, a] = e2 [i, r] ”. If there are a plurality of representatives r in the cluster, the evaluation value e2 [i, a] of the target person a who is not the representative in the cluster is the evaluation value e2 [i, It can be estimated as given by a statistical distribution similar to r] . For example, the evaluation value e2 [i, a] may be estimated as an average value in the distribution.

一方、クラスタリング部2においてLDAその他の潜在トピック分析のような複数トピックを前提としたクラスタリングを行った場合であれば、上記k-means等の場合と同様の手法で推定する他にも、各クラスタの代表者の平均値と、トピックへの所属確率の重み付け和で値を推定するようにしてもよい。   On the other hand, if clustering unit 2 performs clustering on the premise of multiple topics such as LDA and other latent topic analysis, in addition to estimation by the same method as in the above k-means etc., each cluster The value may be estimated by the average value of the representatives and the weighted sum of the membership probabilities.

すなわち、ある項目E2(i)のクラスタリング結果C(i, k)(k=1, 2, …, K(i))に対し、クラスタC(i,k)内の代表者における項目E2(i)の評価値の平均値をe2m(i,k)とする。また、推定対象となる対象者aの各トピックk(=1, 2, …, K(i))への所属確率をw(a,k)とする。なお、前述のように当該所属確率w(a,k)は、図7で説明した文書u(=対象者a)とトピックkとの関係行列θにおいて、当該対象者aに該当する行及び当該トピックkに該当する列で指定される位置における要素の値である。(なお、各対象者aの所属確率w(a,k)が全トピックkで総和して1となるように、関係行列θは予め正規化しておく必要がある。)   That is, for the clustering result C (i, k) (k = 1, 2,..., K (i)) of an item E2 (i), the item E2 (i in the representative in the cluster C (i, k) ) Is the average of the evaluation values of e2m (i, k). In addition, the affiliation probability of the target person a to be estimated to each topic k (= 1, 2,..., K (i)) is assumed to be w (a, k). Note that, as described above, the affiliation probability w (a, k) is the row corresponding to the target person a in the relation matrix θ between the document u (= target person a) and the topic k described in FIG. The value of the element at the position specified in the column corresponding to topic k. (Note that the relationship matrix θ needs to be normalized in advance so that the affiliation probability w (a, k) of each subject person a is summed to 1 for all topics k.)

以上より、対象者aの項目E2(i)の評価値の推定値e2[i,a]は、以下の式(1)で求めることができる。 As described above, the estimated value e2 [i, a] of the evaluation value of the item E2 (i) of the subject person a can be obtained by the following equation (1).

なお、当該所属確率w(a,k)とはすなわち、各対象者aの各トピックkすなわち各クラスタC(i,k)への所属確率のことである。   Note that the affiliation probability w (a, k) is the affiliation probability of each subject a belonging to each topic k, that is, each cluster C (i, k).

再分析判断部7は、まず、クラスタリング部2におけるクラスタリング結果が項目E2(i)に特化したものとして適切であったか否かを判断する。当該判断には、まず、クラスタリング結果の各クラスタC(i, k)(k=1, 2, …, K(i))において、代表決定部4で決定された代表者rから取得された項目E2(i)の評価値e2[i,r]の平均m(i,k) (k=1, 2, …, K(i))を計算し、当該平均の分散が所定閾値以下である場合には、不適切であったものと判断する。(逆に所定閾値を超えるのであれば、適切であったと判断する。) The reanalysis determination unit 7 first determines whether or not the clustering result in the clustering unit 2 is appropriate as a specialized item E2 (i). For the determination, first, in each cluster C (i, k) (k = 1, 2,..., K (i)) of the clustering result, items acquired from the representative r determined by the representative determination unit 4 When the average m (i, k) (k = 1, 2,…, K (i)) of the evaluation value e2 [i, r] of E2 (i) is calculated, and the variance of the average is less than or equal to a predetermined threshold It is judged that it was inappropriate. (Conversely, if it exceeds a predetermined threshold value, it is determined to be appropriate.)

なおここで、平均m(i,k)の分散が所定閾値以下である場合、異なるクラスタC(i,k1)及びC(i,k2)間で代表者の評価値に特に差が見られない結果となっているので、クラスタリング結果が不適切であったと判断している。   Here, when the variance of the average m (i, k) is less than or equal to the predetermined threshold, there is no particular difference in the representative evaluation values between the different clusters C (i, k1) and C (i, k2). As a result, it is determined that the clustering result was inappropriate.

さらに、項目E2(i)のクラスタリング結果を不適切と判断した場合、再分析判断部7は、関係性行列保存部3に保存された当初の関係性行列のうち、当該不適切なクラスタリング結果を与えることとなったi行の各列の値を修正する。   Furthermore, when the re-analysis determination unit 7 determines that the clustering result of the item E2 (i) is inappropriate, the re-analysis determination unit 7 selects the inappropriate clustering result from the initial relationship matrix stored in the relationship matrix storage unit 3. Modify the value of each column of i row that was given.

図9は、当該修正する際の具体的な計算を例を用いて説明するための図である。   FIG. 9 is a diagram for explaining a specific calculation when the correction is performed using an example.

図9にて[1]は、項目E2(i)として例えば「睡眠」に特化したクラスタリングをクラスタリング部2にて行った際に、結果として生成されたΦ行列(図6で説明したようにトピックkと単語iとの関係行列)と、これに応じて代表決定部4で決定された代表者から第二取得部5で実際に取得された項目E2(i)の評価値の各クラスタ1,2,3における平均及び分散と、を示している。(なお、分散は標準化分散である。)   In FIG. 9, [1] indicates that the Φ matrix (as described in FIG. 6) generated when the clustering unit 2 performs clustering specialized for “sleep” as the item E2 (i), for example. A relationship matrix between the topic k and the word i), and each cluster 1 of the evaluation value of the item E2 (i) actually acquired by the second acquisition unit 5 from the representative determined by the representative determination unit 4 according to this , 2 and 3 mean and variance. (The variance is a standardized variance.)

なお、前述のように「単語」とは第一項目群の各項目E1(i)に対応するものであるが、LDA等の潜在トピック分析における用語として「単語」を用いている。図9の例では3つの「単語」として「BMI」、「腹囲」、「HbA1c」が示さている。   As described above, the “word” corresponds to each item E1 (i) of the first item group, but “word” is used as a term in potential topic analysis such as LDA. In the example of FIG. 9, “BMI”, “abdominal circumference”, and “HbA1c” are shown as three “words”.

当該[1]の例では、クラスタ1,2,3間で平均値にほとんど差がないため、クラスタリング結果が不適切であったと判断され、関係性行列を修正する。ここで、当該修正の際の「考え方」は次の通りである。すなわち、分散が大きいクラスタの方が元々のクラスタリングがうまくできていないと考えられるため、そのようなクラスタの生成に寄与する単語の関係性行列での重みを減らすべきである、という考え方である。   In the example [1], since there is almost no difference in the average value between the clusters 1, 2, and 3, it is determined that the clustering result is inappropriate, and the relationship matrix is corrected. Here, the “concept” at the time of the correction is as follows. That is, it is considered that a cluster with a large variance is not able to perform the original clustering well, so the weight in the relationship matrix of words that contribute to the generation of such a cluster should be reduced.

上記「考え方」により、具体的な計算としては、各クラスタにおいて、分散(標準化分散)を重みとして、各Φ行列の単語発生確率に乗算して足し合わせればよい。   Based on the above “concept”, as a specific calculation, in each cluster, the variance (standardized variance) may be weighted and multiplied by the word occurrence probability of each Φ matrix.

図9にて[2]に、各クラスタ1,2,3における当該重みと各Φ行列の単語発生確率との乗算の例が示されている。そして[3]の上段に、単語ごとに各クラスタ1,2,3の重みを足し合わせることで、単語ごとの重みを計算する例が示されている。[3]の下段ではさらに、当該単語ごとの重みを正規化する計算の例が示さている。   [2] in FIG. 9 shows an example of multiplication of the weight in each cluster 1, 2, and 3 and the word occurrence probability of each Φ matrix. The upper part of [3] shows an example of calculating the weight for each word by adding the weights of the clusters 1, 2, and 3 for each word. The lower part of [3] further shows an example of calculation for normalizing the weight for each word.

こうして、項目E2(i)における各項目E1(j)(=図9では単語「BMI」、「腹囲」、「HbA1c」)ごとに正規化された重みWi,jを求めることができる。関係性行列M=(Mi,j)を修正する際は、当該求めた重みの分だけ対応する要素の値を減らすようにすればよい。例えば、以下の式(2)や(3)等でMi,jをM'i,jへと修正すればよい。式(3)にてcは定数であり、M'i,j >0となるような範囲で定める。
M'i,j = Mi,j /Wi,j …(2)
M'i,j = Mi,j -c*Wi,j …(3)
In this way, the weight W i, j normalized for each item E1 (j) in the item E2 (i) (= words “BMI”, “abdomen”, “HbA1c” in FIG. 9) can be obtained. When correcting the relationship matrix M = (M i, j ), the value of the corresponding element may be reduced by the calculated weight. For example, M i, j may be corrected to M ′ i, j by the following equations (2) and (3). In Expression (3), c is a constant and is determined within a range such that M ′ i, j > 0.
M ' i, j = M i, j / W i, j (2)
M ' i, j = M i, j -c * W i, j (3)

なお、以上のようにして関係性行列Mを修正した場合には、修正された関係性行列M'を関係性行列保存部3において更新して保存したうえで、修正された項目E2(i)に関して再度、図2のステップS2以降を実施することができる。当該再度実施した結果が不適切であれば同様にして、適切な結果が得られるまで繰り返すことができる。   When the relationship matrix M is corrected as described above, the corrected relationship matrix M ′ is updated and stored in the relationship matrix storage unit 3, and then the corrected item E2 (i) Again, step S2 and subsequent steps in FIG. 2 can be performed. If the re-executed result is inappropriate, it can be repeated in the same manner until an appropriate result is obtained.

また、上記適切な結果が得られるまで繰り返すことの応用として、次も可能である。すなわち、当初、関係性行列保存部3に保存する関係性行列は値をランダムとする、あるいは全ての要素を1としておき、適切な結果が得られるまで繰り返すことで、事前知識なしで関係性行列を自動生成することも可能である。前述のように、関係性行列を算出する手法として[手法1]〜[手法3]を説明したが、さらに[手法4]として当該手法も利用可能である。   As an application of repeating until the appropriate result is obtained, the following is also possible. In other words, the relationship matrix stored in the relationship matrix storage unit 3 is initially set to a random value, or all elements are set to 1, and the relationship matrix is repeated without prior knowledge by repeating until an appropriate result is obtained. Can be automatically generated. As described above, [Method 1] to [Method 3] have been described as methods for calculating the relationship matrix, but this method can also be used as [Method 4].

ここで、ステップS3における代表決定部4による代表者決定において、企業などにおける実運用上の制約をさらに考慮することが可能な実施形態を説明する。具体的な状況として、第二項目群の各項目E2(i)はウェアラブルデバイスによって取得されるものであり、ウェアラブルデバイスを代表者に貸し出すことによって評価値の取得を行うようにする場合を想定する。そして、この際の制約として、評価値を取得させたい代表者の総数よりも、実際に貸し出し可能なウェアラブルデバイスが少ないという場合を想定する。   Here, an embodiment will be described in which restrictions on actual operation in a company or the like can be further considered in representative determination by the representative determination unit 4 in step S3. As a specific situation, each item E2 (i) of the second item group is acquired by a wearable device, and the evaluation value is acquired by lending the wearable device to a representative. . As a constraint at this time, it is assumed that there are fewer wearable devices that can actually be lent than the total number of representatives whose evaluation values are to be acquired.

このような場合、期間を区切って順次、貸し出しを行うしかない。従って、代表決定部4では代表者のみでなく、当該貸し出しのスケジュールも決定して通知するようにしてもよい。   In such a case, there is no choice but to lend in sequence at intervals. Therefore, the representative determining unit 4 may determine and notify not only the representative but also the lending schedule.

ここで、一実施形態では、貸し出し期間(貸し出しが許容される総期間)とデータ取得に必要な期間、及び相互に貸し出しが可能な人の情報を代表決定部4に事前知識として入力することで、自動で貸し出し順序(スケジュール)を決定することが可能である。(この相互に貸し出しが可能な人は、企業組織であれば部署情報から判定することも可能である。すなわち、同一組織内や隣り合う組織内では機器の貸し出しが可能と判定し、それ以外では貸し出し不可能と判定する。)   Here, in one embodiment, the lending period (the total period during which lending is allowed), the period necessary for data acquisition, and information on persons who can lend each other are input to the representative determination unit 4 as prior knowledge. The lending order (schedule) can be automatically determined. (This person who can lend to each other can also be determined from the department information if it is a corporate organization. That is, it is determined that the device can be rented in the same organization or in an adjacent organization, and otherwise. (Determining that the loan is impossible)

以下、貸し出し順序を自動決定する例を説明する。まず、入力する事前知識は以下に掲げる通りである。
・決定された代表者:a,b,c
・貸し出し期間:2週間
・データ取得に必要な期間:1週間
・a,b,c間で相互に貸し出しが可能な人の関係マトリクス(図10)
Hereinafter, an example in which the lending order is automatically determined will be described. First, the prior knowledge to be entered is as follows.
・ Determined representative: a, b, c
・ Lending period: 2 weeks ・ Necessary period for data acquisition: 1 week ・ Relationship matrix of people who can lend each other between a, b, and c (Figure 10)

ここで、図10では、代表者a,b,cに関して、所属部署同士が近接している等で、直接の貸し出しが可能(測定終了した代表者から次に測定する代表者へのデバイスの受け渡しにおいて、タイムラグを発生させずに貸し出しが可能)な場合を1、そうでない場合を0とすることで、また、対角成分は意味がないため0とすることで、関係マトリクスが与えられている。   Here, in FIG. 10, for the representatives a, b, and c, direct lending is possible, for example, because the departments to which they belong are close to each other (delivery of the device from the representative who has finished the measurement to the next representative to be measured) In the case of lending without generating a time lag, the relationship matrix is given by setting 1 to 0, otherwise 0, and since the diagonal component is meaningless to 0 .

このとき、図10の関係マトリクスから到達可能なパスの内、貸し出し期間/データ取得に必要な期間=2のステップ以内で到達可能なパスのみが許容されることになる。以下は、各ステップ数にて可能な到達パスを列挙したものである。   At this time, only paths that can be reached within the steps of lending period / period necessary for data acquisition = 2 steps among the paths that can be reached from the relationship matrix of FIG. 10 are allowed. The following is a list of reachable paths for each number of steps.

・1ステップ
a, b, c
・2ステップ
b→a
b→c
・3ステップ
a→b→c
c→b→a
・ 1 step
a, b, c
・ 2 steps
b → a
b → c
・ 3 steps
a → b → c
c → b → a

この内、2ステップまでが許容されることになるので、特定のデバイスをa,b,cに貸し出す場合には、デバイスを2つ用意し、b→aとcと貸し出すか、b→cとaと貸し出せば良い。   Of these, up to two steps are allowed, so when lending a specific device to a, b, c, prepare two devices and lend b → a and c, or b → c. You can rent a.

すなわち、当該実施形態においては、貸し出し期間とデータ取得に必要な期間、及び相互に貸し出しが可能な人の情報という制約のもと、当該制約を満たすために必要となるデバイス数と貸し出し順序とを自動決定することができる。   That is, in this embodiment, under the constraints of the lending period, the period required for data acquisition, and information on persons who can lend each other, the number of devices and lending order required to satisfy the restrictions are determined. Can be determined automatically.

一方、別の一実施形態においては、相互に貸し出しが可能な人の情報とデバイス数(当該デバイス数は代表者数より少ない所定数)とを制約として、実際の貸し出しの進行に応じて、可能な限り短い期間でデータ取得を完了する貸し出し順序を自動決定することも可能である。なお、この場合、データ取得に必要な期間は一定としてもよいし、貸し出しが行われた代表者ごとに変動してもよい。   On the other hand, in another embodiment, it is possible depending on the progress of the actual lending, with restrictions on the information of people who can lend each other and the number of devices (the number of devices is a predetermined number less than the number of representatives). It is also possible to automatically determine the lending order for completing data acquisition in as short a period as possible. In this case, the period required for data acquisition may be fixed, or may vary for each representative for whom lending has been performed.

当該実施形態では具体的には、以下の[事前計算1]及び[事前計算2]で代表者間の関係等を求めたうえで、[方針1]〜[方針3]に従って自動で貸し出し順序(貸し出しスケジュール)を決定することができる。   Specifically, in the embodiment, after obtaining the relationship between representatives in the following [Precalculation 1] and [Precalculation 2], the lending order (in accordance with [Policy 1] to [Policy 3] automatically ( Lending schedule).

[事前計算1] 相互に貸し出しが可能な人の情報を表す関係マトリクスに対してマルコフクラスタリングを行う。ここで、マルコフクラスタリングは以下のURL等で紹介されているように周知である。マルコフクラスタリングにより、関係マトリクスにおける人をノードとし相互に貸し出し可能な人の間にエッジを設けたグラフにおいて、相互に移動が容易なノード同士(エッジが密なノード同士)をグループ化することができる。すなわち、デバイス貸し出しにおいては、相互に貸し出しが容易な人同士をクラスタリングすることができる。
(URL)http://rishida.hatenablog.com/entry/2013/09/24/011423
[Preliminary calculation 1] Markov clustering is performed on the relationship matrix that represents the information of people who can lend each other. Here, Markov clustering is well known as introduced in the following URL and the like. With Markov clustering, nodes that are easy to move to each other (nodes with dense edges) can be grouped in a graph in which edges are provided between people who can lend each other as nodes in the relationship matrix. . That is, in device lending, it is possible to cluster together people who are easy to lend each other.
(URL) http://rishida.hatenablog.com/entry/2013/09/24/011423

図11に、関係マトリクス(図10のものとは別の例)とそのマルコフクラスタリングの結果との例を示す。[1]は関係マトリクスの例を7人の人A〜Gについて示しており、対応するグラフが[2]に示されている。当該[1],[2]のマルコフクラスタリングの結果がそれぞれ[3],[4]に示すように、A,B,C,Dからなるクラスタと、E,F,Gからなるクラスタと、に分けられている。   FIG. 11 shows an example of a relationship matrix (an example different from that of FIG. 10) and the result of the Markov clustering. [1] shows an example of a relationship matrix for seven people A to G, and the corresponding graph is shown in [2]. As the results of the Markov clustering of [1] and [2] are shown in [3] and [4], respectively, the cluster consisting of A, B, C, D and the cluster consisting of E, F, G It is divided.

[事前計算2] 関係マトリクスが表すグラフの各ノード(すなわち各人)に関して、以下のURL等で周知のページランクを計算する。
(URL)http://deta.hateblo.jp/entry/2013/05/19/060609
[Pre-calculation 2] For each node (that is, each person) of the graph represented by the relationship matrix, a well-known page rank is calculated with the following URL or the like.
(URL) http://deta.hateblo.jp/entry/2013/05/19/060609

例えば図11の各ノードA〜Gについては以下のようにページランクの値が計算される。A,B,C,DからなるクラスタにおいてはBが、また、E,F,GからなるクラスタにおいてはEが、接続関係が多いことにより他ノードよりも高いページランクの値を示している。
[A]0.09060 [B]0.10125 [C]0.09060 [D]0.09060 [E]0.09770 [F]0.08918 [G]0.08918
For example, the page rank value is calculated for each of the nodes A to G in FIG. B is higher in the cluster composed of A, B, C, and D, and E is larger in the cluster composed of E, F, and G because of the higher connection rank than other nodes.
[A] 0.09060 [B] 0.10125 [C] 0.09060 [D] 0.09060 [E] 0.09770 [F] 0.08918 [G] 0.08918

[方針1] 貸し出しは、[事前計算1]にて求めたクラスタ毎に実施する。各クラスタでの貸し出しデバイス数は例えば、デバイス総数をクラスタに属する人数比で分けたものとすればよい。   [Policy 1] Lending is performed for each cluster obtained in [Preliminary calculation 1]. The number of lending devices in each cluster may be, for example, the total number of devices divided by the ratio of the number of people belonging to the cluster.

[方針2] 各クラスタ内の貸し出しにおいては、最初にページランクの低い人にデバイスの貸し出しを行う。すなわち、当該クラスタがN人で構成され、当該クラスタにn個(n<N)のデバイスが貸し出し用に割り当てられている場合、最初の貸し出し対象となるのは、ページランクの大きさが最下位のN位となる人から、N-1位、N-2位、…N-n+1位となる人までのn人となる。   [Policy 2] For lending within each cluster, first lend devices to people with low page rank. In other words, if the cluster is composed of N people and n devices (n <N) are allocated for lending, the first lending target is the page rank of the lowest N people from Nth place to N-1 place, N-2 place, ... N-n + 1 place.

[方針3] デバイスの貸し出しを受け、自身において測定完了した完了者Xに関しては、次に当該クラスタ内でデバイスを貸し出す対象となる対象者Yを決定する必要がある。当該決定に関しては、完了者Xの当該測定終了した時点(日時)を基準として、以下の(条件1)及び(条件2)を満たす人の中から(決定方針)によって自動決定し、測定終了した完了者X及び次の貸し出し対象者Yに自動通知してデバイスの受け渡しを行わせるようにすればよい。   [Policy 3] Regarding the complete person X who has received the device lending and has completed the measurement by himself, it is necessary to determine the target person Y who is to lend the device in the cluster next. Regarding the decision, based on the time (date and time) when the measurement was completed by the completed person X, the decision was automatically made from those who satisfy the following (Condition 1) and (Condition 2), and the measurement was completed. It is only necessary to automatically notify the completion person X and the next rental target person Y so that the device is delivered.

(条件1) 対象者Yは完了者Xとの間で直ちにデバイス受け渡しが可能な関係にある、すなわち、関係マトリクスにおいて対象者Y及び完了者Xの関係を表す値は0ではなく1である。
(条件2) 対象者Yはまだデバイスの貸し出しを受けていない。
(決定方針) 上記の(条件1)及び(条件2)を満たす一連の対象者Yの中で、そのページランクの値PR(Y)が完了者Xにおけるページランクの値PR(X)以上である(PR(Y)≧PR(X))が、その差分PR(Y)-PR(X)の値が最小となるような人を、実際に次にデバイスを貸し出すべき対象者Yとして決定する。
(Condition 1) The target person Y is in a relationship that allows immediate device transfer with the complete person X, that is, the value representing the relationship between the target person Y and the complete person X in the relationship matrix is 1.
(Condition 2) Target Y has not yet rented a device.
(Decision policy) Among the series of target persons Y that satisfy the above (Condition 1) and (Condition 2), the page rank value PR (Y) is greater than or equal to the page rank value PR (X) of the complete person X A person (PR (Y) ≧ PR (X)) whose difference PR (Y) -PR (X) is the smallest is determined as the target person Y who should actually lend the device next. .

以上、当該クラスタの全対象者につきデバイスを貸し出して測定が完了するまで[方針3]による逐次的な次の貸し出し対象者の決定を継続して行うことで、次のように効率的に当該クラスタ内の全員への貸し出し及び測定が可能となる。すなわち、ページランクが低い(相互の貸し出し可能なノードが少ない)ノードに優先的に貸し出しを行い、相互の貸し出しが容易なページランクが高いノードを後回しにすることで、デバイス受け渡しに伴う遅滞を可能な限り避けつつ効率的に全員への貸し出しを行うことができる。   As described above, by continually determining the next lending target according to [Policy 3] until the measurement is completed after lending a device to all the target persons in the cluster, the cluster can be efficiently used as follows. It is possible to lend and measure to everyone in the company. In other words, lending is given priority to nodes with low page rank (the number of nodes that can lend each other is low), and delays associated with device delivery are possible by postponing nodes with high page rank that are easy to lend to each other. Lending to everyone can be done efficiently while avoiding as much as possible.

なお、当該クラスタ内の全対象者につき測定が未完了の時点で、[方針3]では次の対象者Yを決定できなくなった場合は、[方針3]に代えて次の[方針3-1]又は[方針3-2]のようにすればよい。[方針3-1]はページランクの値が低い側から高い側へ順次貸し出しを継続するものであり、[方針3-2]は逆に方針を切り替えて、ページランクの値が高い側から低い側へと貸し出しを継続するものである。なお、[方針3-2]で次の対象者が決定できなくなった場合は再度[方針3-1]に戻り、以降、決定できなくなるごとに同様にして[方針3-1]と[方針3-2]とをスイッチングするようにしてもよい。   Note that when [Measure 3] is unable to determine the next Target Y when measurement has not been completed for all subjects in the cluster, [Policy 3-1] will be used instead of [Policy 3]. ] Or [Policy 3-2]. [Policy 3-1] continues to lend out from the low page rank value to the high one, and [Policy 3-2] reverses the policy and reverses the page rank value from the high Lending to the side will continue. If it is impossible to determine the next target person in [Policy 3-2], the process returns to [Policy 3-1] again. After that, [Policy 3-1] and [Policy 3] -2] may be switched.

[方針3-1] 当該クラスタ内のデバイス貸し出し前の対象者Zのうち、ページランクの値PR(Z)が最小となるような対象者Zを次の貸し出し対象者としてもよい。なお、この場合、(条件1)を満たす対象者Zが存在すれば、(条件1)を満たす対象者Zの中でページランクの値PR(Z)が最小となるような対象者Zを次の貸し出し対象者とする。当該決定された対象者Z以降については、再度[方針3]の適用を試みる。   [Policy 3-1] Among the target persons Z before the device rental in the cluster, the target person Z having the smallest page rank value PR (Z) may be set as the next rental target person. In this case, if there is a subject Z that satisfies (Condition 1), the subject Z that has the smallest page rank value PR (Z) among the subject Z that satisfies (Condition 1) is It is assumed to be lent out. The policy 3 will be re-applied for the target person Z and later.

[方針3-2] 当該クラスタ内のデバイス貸し出し前の対象者Zのうち、ページランクの値PR(Z)が最大となるような対象者Zを次の貸し出し対象者とする。なお、この場合、(条件1)を満たす対象者Zが存在すれば、(条件1)を満たす対象者Zの中でページランクの値PR(Z)が最大となるような対象者Zを次の貸し出し対象者としてもよい。当該決定された対象者Z以降については、再度[方針3]の適用を試みるが、(決定方針)を以下の(決定方針2)に変更する。   [Policy 3-2] Among the target persons Z before the device rental in the cluster, the target person Z having the maximum page rank value PR (Z) is set as the next rental target person. In this case, if there is a subject Z that satisfies (Condition 1), the subject Z that has the highest page rank value PR (Z) among the subject Z that satisfies (Condition 1) is It is good also as a loan object person. For the target person Z and later, [Policy 3] will be tried again, but (Decision Policy) will be changed to the following (Decision Policy 2).

(決定方針2) 上記の(条件1)及び(条件2)を満たす一連の対象者Yの中で、そのページランクの値PR(Y)が完了者Xにおけるページランクの値PR(X)以下である(PR(Y)≦PR(X))が、その差分PR(X)-PR(Y)の値が最小となるような人を、実際に次にデバイスを貸し出すべき対象者Yとして決定する。   (Decision policy 2) Among the series of target persons Y that satisfy the above (Condition 1) and (Condition 2), the page rank value PR (Y) is less than or equal to the page rank value PR (X) of the complete person X (PR (Y) ≤ PR (X)), the person whose difference PR (X)-PR (Y) is the smallest is determined as the target person Y who should actually lend the device next To do.

以上、本発明によれば、容易に取得可能な第一項目群の各項目の健康データを元に、取得に困難を伴うが精密な情報が得られる第二項目群の各項目の健康データを取得する際に、効果的なスクリーニングが可能となる。   As described above, according to the present invention, based on the health data of each item of the first item group that can be easily acquired, the health data of each item of the second item group that is difficult to acquire but can obtain precise information is obtained. When obtaining, effective screening becomes possible.

発明は、コンピュータを健康データ分析補助装置10として機能させるプログラムとしても提供可能である。当該コンピュータは、CPU(中央演算装置)、メモリ及び各種I/Fといった周知のハードウェアで構成することができ、当該プログラムを読み込んで実行するCPUが健康データ分析補助装置10の各部として機能することとなる。   The present invention can also be provided as a program that causes a computer to function as the health data analysis auxiliary device 10. The computer can be configured with well-known hardware such as a CPU (Central Processing Unit), a memory, and various I / Fs, and the CPU that reads and executes the program functions as each part of the health data analysis auxiliary device 10. It becomes.

10…健康データ分析補助装置、1…第一取得部、2…クラスタリング部、3…関係性行列保存部、4…代表決定部、5…第二取得部、6…推定部、7…再分析判断部、11…第一数値化部、15…第二数値化部   10 ... health data analysis auxiliary device, 1 ... first acquisition unit, 2 ... clustering unit, 3 ... relationship matrix storage unit, 4 ... representative determination unit, 5 ... second acquisition unit, 6 ... estimation unit, 7 ... reanalysis Judgment unit, 11 ... first numerical unit, 15 ... second numerical unit

Claims (13)

第一項目群からなる健康データの各項目の評価値を複数対象者について取得する第一取得部と、
前記第一項目群の各項目と、健康データの第二項目群の各項目と、の関係性を表す所定の数値を、関係性行列として記憶する関係性行列保存部と、
前記取得した第一項目群の各項目の評価値に、前記関係性行列において対応する前記第二項目群の各項目の数値を重みとして付与したものを、当該第二項目群の各項目に関して特化した各対象者の特徴ベクトルとして生成し、当該第二項目群の各項目ごとに、当該特徴ベクトルに基づいて前記複数対象者をクラスタリングするクラスタリング部と、
前記第二項目群の各項目ごとにクラスタリングした結果の各クラスタより、当該第二項目群の各項目を評価する対象としての代表者を決定する代表決定部と、を備えることを特徴とする健康データ分析補助装置。
A first acquisition unit that acquires an evaluation value of each item of health data consisting of a first item group for a plurality of subjects;
A relationship matrix storage unit that stores a predetermined numerical value representing a relationship between each item of the first item group and each item of the second item group of health data as a relationship matrix;
A value obtained by assigning a numerical value of each item of the corresponding second item group in the relationship matrix as a weight to the evaluation value of each item of the acquired first item group is specified for each item of the second item group. A clustering unit that generates the feature vectors of each target person and clusters the plurality of target persons based on the feature vectors for each item of the second item group,
A representative determining unit that determines a representative as a target for evaluating each item of the second item group from each cluster obtained by clustering each item of the second item group. Data analysis auxiliary device.
前記代表決定部は、各クラスタの代表者の数を、各クラスタに属する対象者の前記特徴ベクトルのばらつきに応じて決定することを特徴とする請求項1に記載の健康データ分析補助装置。   The health data analysis auxiliary device according to claim 1, wherein the representative determining unit determines the number of representatives of each cluster according to variations in the feature vectors of subjects belonging to each cluster. 前記クラスタリング部は、潜在トピック分析によって前記クラスタリングすることを特徴とする請求項1または2に記載の健康データ分析補助装置。   The health data analysis auxiliary device according to claim 1, wherein the clustering unit performs the clustering by latent topic analysis. 前記決定された代表者における前記第二項目群の各項目の評価値を取得する第二取得部をさらに備えることを特徴とする請求項1に記載の健康データ分析補助装置。   The health data analysis auxiliary device according to claim 1, further comprising a second acquisition unit that acquires an evaluation value of each item of the second item group in the determined representative. 前記取得された代表者における前記第二項目群の各項目の評価値に基づいて、前記代表者として決定されなかった対象者における前記第二項目群の各項目の評価値を推定する推定部をさらに備えることを特徴とする請求項4に記載の健康データ分析補助装置。   Based on the evaluation value of each item of the second item group in the acquired representative, an estimation unit that estimates the evaluation value of each item of the second item group in the subject not determined as the representative The health data analysis auxiliary device according to claim 4, further comprising: 前記クラスタリング部は、潜在トピック分析によって前記クラスタリングすることで、クラスタリング結果として、各対象者の各クラスタへの所属確率を求め、
前記推定部は、各クラスタにおける前記取得された代表者の前記第二項目群の各項目の評価値の平均に対する、前記各対象者における所属確率による重みづけ和として、前記代表者として決定されなかった対象者における前記第二項目群の各項目の評価値を推定することを特徴とする請求項5に記載の健康データ分析補助装置
The clustering unit obtains a probability of belonging to each cluster of each subject as a clustering result by performing the clustering by latent topic analysis,
The estimation unit is not determined as the representative as a weighted sum based on an affiliation probability in each target person with respect to an average evaluation value of each item of the second item group of the acquired representative in each cluster. The health data analysis auxiliary device according to claim 5, wherein an evaluation value of each item of the second item group in the subject is estimated.
前記第二項目群がウェアラブルデバイスから取得される健康データの各項目からなることを特徴とする請求項1ないし6のいずれかに記載の健康データ分析補助装置。   The health data analysis auxiliary device according to any one of claims 1 to 6, wherein the second item group includes items of health data acquired from a wearable device. 前記代表決定部にて決定される代表者は、前記第二項目群の各項目の評価値を取得するためのウェアラブルデバイスを貸し出す対象として決定される代表者であることを特徴とする請求項7に記載の健康データ分析補助装置。   8. The representative determined by the representative determination unit is a representative determined as a target for renting a wearable device for acquiring an evaluation value of each item of the second item group. Health data analysis auxiliary device described in 1. 前記決定される代表者の数は前記貸し出すウェアラブルデバイスの数よりも多く、当該ウェアラブルデバイスは期間を区切って貸し出されることを特徴とする請求項8に記載の健康データ分析補助装置。   9. The health data analysis assisting apparatus according to claim 8, wherein the number of representatives determined is larger than the number of wearable devices to be lent, and the wearable devices are lent for a period. 前記代表決定部はさらに、
貸し出しが許容される総期間と、前記評価値を取得するのに必要な期間と、代表者間におけるタイムラグを発生させずにウェアラブルデバイスを受け渡し可能な関係と、を入力として、前記総期間で貸し出しを完了するのに必要なウェアラブルデバイスの数と当該貸し出すスケジュールと、を出力する、または、
代表者間におけるタイムラグを発生させずにウェアラブルデバイスを受け渡し可能な関係と、前記貸し出すウェアラブルデバイスの所定数と、を入力として、当該貸し出しの進行に応じて短期間で当該貸し出しを完了するためのスケジュールを出力することを特徴とする請求項9に記載の健康データ分析補助装置。
The representative determining unit further includes:
Lending in the total period, using as input the total period for which lending is allowed, the period necessary to obtain the evaluation value, and the relationship in which wearable devices can be delivered without causing a time lag between representatives Output the number of wearable devices necessary to complete the process and the rental schedule, or
A schedule for completing the lending in a short period of time according to the progress of the lending, with the relationship between the representatives being able to deliver wearable devices without causing a time lag and the predetermined number of wearable devices to be lent The health data analysis auxiliary device according to claim 9, wherein:
前記代表決定部はさらに、
代表者間におけるタイムラグを発生させずにウェアラブルデバイスを受け渡し可能な関係と、前記貸し出すウェアラブルデバイスの所定数と、を入力として、当該受け渡し可能な関係より算出されるページランクの低い代表者から高い代表者へと順次貸し出すようにすることで、当該貸し出しの進行に応じて短期間で当該貸し出しを完了するためのスケジュールを出力することを特徴とする請求項9に記載の健康データ分析補助装置。
The representative determining unit further includes:
A representative from a representative with a low page rank calculated from the relation that can be delivered by inputting the relation that can deliver the wearable device without causing a time lag between representatives and the predetermined number of wearable devices to be lent. The health data analysis auxiliary device according to claim 9, wherein a schedule for completing the lending in a short period of time according to the progress of the lending is output by sequentially lending to the person.
前記第一項目群が健診データの各項目からなることを特徴とする請求項1ないし11のいずれかに記載の健康データ分析補助装置。   The health data analysis auxiliary device according to any one of claims 1 to 11, wherein the first item group includes items of medical examination data. 前記第一項目群が、標準の健診データの各項目からなり、前記第二項目群が、前記標準の健診データの各項目以外の項目を対象とする特別の健診データの各項目からなることを特徴とする請求項1ないし6のいずれかに記載の健康データ分析補助装置。   The first item group includes items of standard medical examination data, and the second item group includes items of special medical examination data for items other than the items of the standard medical examination data. The health data analysis auxiliary device according to any one of claims 1 to 6, wherein
JP2014218600A 2014-10-27 2014-10-27 Health data analysis auxiliary device Active JP6414966B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014218600A JP6414966B2 (en) 2014-10-27 2014-10-27 Health data analysis auxiliary device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014218600A JP6414966B2 (en) 2014-10-27 2014-10-27 Health data analysis auxiliary device

Publications (2)

Publication Number Publication Date
JP2016085635A JP2016085635A (en) 2016-05-19
JP6414966B2 true JP6414966B2 (en) 2018-10-31

Family

ID=55972979

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014218600A Active JP6414966B2 (en) 2014-10-27 2014-10-27 Health data analysis auxiliary device

Country Status (1)

Country Link
JP (1) JP6414966B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6842700B2 (en) * 2017-08-30 2021-03-17 株式会社サイキンソー Information processing system and program
JP7505560B2 (en) 2020-07-27 2024-06-25 日本電信電話株式会社 Information processing device, information processing method, and program
JP2021072851A (en) * 2021-02-05 2021-05-13 株式会社サイキンソー Information processing system and program
CN116304595B (en) * 2023-05-11 2023-08-04 中南大学湘雅医院 Intelligent motion analysis system and method based on shared cloud platform

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009273558A (en) * 2008-05-13 2009-11-26 Toshiba Corp Medical checkup supporting apparatus and program
JP5220705B2 (en) * 2009-07-23 2013-06-26 オリンパス株式会社 Image processing apparatus, image processing program, and image processing method
JP5466713B2 (en) * 2009-12-11 2014-04-09 株式会社日立製作所 Life pattern classification device and life pattern classification system

Also Published As

Publication number Publication date
JP2016085635A (en) 2016-05-19

Similar Documents

Publication Publication Date Title
Fong et al. Composite Monte Carlo decision making under high uncertainty of novel coronavirus epidemic using hybridized deep learning and fuzzy rule induction
Jørgensen Top-down and bottom-up expert estimation of software development effort
Hahn Decision making with uncertain judgments: A stochastic formulation of the analytic hierarchy process
Harris et al. Predictive analytics model for healthcare planning and scheduling
Jalal et al. A Gaussian approximation approach for value of information analysis
Heath et al. Calculating the expected value of sample information in practice: considerations from 3 case studies
Wang et al. Propensity score-integrated composite likelihood approach for incorporating real-world evidence in single-arm clinical studies
JP6414966B2 (en) Health data analysis auxiliary device
Bojke et al. Informing reimbursement decisions using cost-effectiveness modelling: a guide to the process of generating elicited priors to capture model uncertainties
Rao et al. Improved multiple attribute decision making methods
Dittrich et al. Network autocorrelation modeling: Bayesian techniques for estimating and testing multiple network autocorrelations
JP6278517B2 (en) Data analysis apparatus and program
Marbac et al. Model-based clustering for conditionally correlated categorical data
Chatterjee Development of uncertainty-based work injury model using Bayesian structural equation modelling
Moreno et al. Combining economic forecasts by using a maximum entropy econometric approach
Cui et al. Bayesian approach to personalized benefit-risk assessment
Steele et al. Random effects dynamic panel models for unequally spaced multivariate categorical repeated measures: an application to child–parent exchanges of support
Xu et al. Predictors of employment among individuals with disabilities: A Bayesian analysis of the Longitudinal Study of the Vocational Rehabilitation Services Program
Musal et al. Estimating the population utility function: A parametric Bayesian approach
Valle-Mercado et al. Cost-effectiveness of biological therapy compared with methotrexate in the treatment for rheumatoid arthritis in Colombia
Nielsen et al. Clustered mixed nonhomogeneous Poisson process spline models for the analysis of recurrent event panel data
Liu et al. Physician performance assessment using a composite quality index
Hao et al. Modeling social learning on consumers’ long-term usage of a mobile technology: a Bayesian estimation of a Bayesian learning model
Sun et al. Semiparametric copula method for semi-competing risks data subject to interval censoring and left truncation: Application to disability in elderly
Preedalikit et al. Joint modeling of survival and longitudinal ordered data using a semiparametric approach

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20160823

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170906

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180926

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181001

R150 Certificate of patent or registration of utility model

Ref document number: 6414966

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150