WO2013161191A1 - 保健指導対象者選定条件作成支援装置 - Google Patents

保健指導対象者選定条件作成支援装置 Download PDF

Info

Publication number
WO2013161191A1
WO2013161191A1 PCT/JP2013/002301 JP2013002301W WO2013161191A1 WO 2013161191 A1 WO2013161191 A1 WO 2013161191A1 JP 2013002301 W JP2013002301 W JP 2013002301W WO 2013161191 A1 WO2013161191 A1 WO 2013161191A1
Authority
WO
WIPO (PCT)
Prior art keywords
health
health guidance
data
guidance target
target person
Prior art date
Application number
PCT/JP2013/002301
Other languages
English (en)
French (fr)
Inventor
勇気 小阪
正貴 安東
遼平 藤巻
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to US14/002,550 priority Critical patent/US20150074019A1/en
Priority to SG11201406704RA priority patent/SG11201406704RA/en
Priority to JP2013534517A priority patent/JP5392444B1/ja
Publication of WO2013161191A1 publication Critical patent/WO2013161191A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Definitions

  • the present invention relates to a health guidance business for an insurer, and more particularly to a device that supports the work of an insurer that determines conditions for selecting a health guidance target person.
  • the insurer is providing health guidance for health promotion of the insured.
  • a certain standard is set for the health check result of the insured person, and health guidance is given to a person (applicable person) that satisfies the standard.
  • the standard is set so that a person who needs to improve his / her habits or a person who has a high risk of future sickness is applicable.
  • non-applicable people it is determined that there is no need to improve their lifestyle habits and health guidance is not provided.
  • the problem is dealing with new people who meet the health guidance standards.
  • those who do not meet the health guidance standards for the year there are those who meet the health guidance standards in the following year and become eligible persons. Therefore, even if the insurer gives health guidance to the relevant person in the relevant year and realizes the health promotion of the relevant person, if the number of new persons increases every year, the insured as a whole Cannot achieve health promotion.
  • the insurer In order for the insured to improve the health of the insured, it is desirable for the insurer to take measures to promote the health of all the insured. However, since it costs enormous costs, the insurer is independent from the health guidance standards. In this year, select the insured person corresponding to the next year from the insured person of the current year, and for the selected limited group, the relevant year Wants to provide health guidance.
  • Patent Document 1 An example of a technique for selecting a health guidance subject is described in Patent Document 1.
  • the technique described in Patent Document 1 is a function for outputting a predicted value of a medical cost reduction effect when an insurer sets a selection condition for a target person and gives guidance to a health guidance target group that satisfies the condition. Is provided. By using this support system, the insurer can know the medical cost reduction effect when a specific selection condition is set.
  • the object of the present invention is the problem as described above, that is, it is difficult to create a condition for selecting a health guidance target person from the viewpoint of whether or not there is a possibility of meeting the health guidance standard in the next year. It is to provide a health guidance target person selection condition creation support device that solves the problem.
  • the health guidance target person selection condition creation support device Health guidance criteria predetermined by first health check data which is personal check data of the first period and health check data of the second period which is the next period after the first period.
  • a plurality of health examination items of the health examination data are defined as a plurality of explanatory variables, expressed by a polynomial composed of the explanatory variables and a coefficient for each explanatory variable, and the individual is the health examination data of the second period.
  • the health guidance target person selection condition creation support method is: Health guidance criteria predetermined by first health check data which is personal check data of the first period and health check data of the second period which is the next period after the first period.
  • a health guidance target person selection condition creation support method executed by a device that includes a memory that stores a label value that indicates whether or not the condition is satisfied, and a processor connected to the memory,
  • the processor is
  • a plurality of health examination items of the health examination data are defined as a plurality of explanatory variables, expressed by a polynomial composed of the explanatory variables and a coefficient for each explanatory variable, and the individual is the health examination data of the second period.
  • a discrimination model for discriminating whether or not the health guidance standard is met is learned using the first health examination data and the label value, Generating a combination of the plurality of health diagnosis items as the plurality of explanatory variables and the value of the coefficient as the plurality of explanatory variables in the discrimination model after the learning as a health guidance target person selection condition; The structure is adopted.
  • the insurer can create a condition for selecting a health guidance target person from the viewpoint of whether or not there is a possibility of meeting the health guidance standard in the next period.
  • the health guidance target person selection condition creation support device 1 is a condition for selecting a health guidance target person from the viewpoint of whether or not there is a possibility that the health guidance standard is met. Has the function to create.
  • the health guidance target person selection condition creation support apparatus 1 includes a communication interface unit (communication I / F unit) 11, an operation input unit 12, a screen display unit 13, a storage unit 14, and a processor 15 as hardware.
  • the communication I / F unit 11 includes a dedicated data communication circuit and has a function of performing data communication with various devices (not shown) connected via a communication line (not shown).
  • the operation input unit 12 includes an operation input device such as a keyboard and a mouse, and has a function of detecting an operator operation and outputting the operation to the processor 15.
  • the screen display unit 13 includes a screen display device such as an LCD or a PDP, and has a function of displaying various information such as operation menus and selection conditions on the screen in accordance with instructions from the processor 15.
  • the storage unit 14 includes a storage device such as a hard disk or a semiconductor memory, and has a function of storing processing information and a program 14P necessary for various processes in the processor 15.
  • the program 14P is a program that realizes various processing units by being read and executed by the processor 15, and is read by an external device (not shown) or a computer via a data input / output function such as the communication I / F unit 11. It is read in advance from a possible storage medium (not shown) and stored in the storage unit 14.
  • Main processing information stored in the storage unit 14 includes health check data 14A, a flag 14B, an insurer's desired condition 14C, a discrimination model 14D, and a selection condition 14E.
  • Health checkup data 14A is personal checkup data for a certain past year (hereinafter referred to as a reference year).
  • the medical checkup data 14A is divided by individual.
  • the health check-up data for one individual for one year consists of a personal ID that uniquely identifies the individual, personal information such as the year of medical examination, age of medical examination, sex, etc., height, weight, waist circumference, BMI value, minimum blood pressure, maximum blood pressure, It has various test values such as blood glucose level and neutral fat, and various inquiry results such as whether or not “the amount of drinking is 500 ml or more per day”.
  • one year is one period, but the period is arbitrary as long as it is less than one year.
  • the flag 14B is a label value for each individual indicating whether or not a predetermined health guidance standard is met in the medical examination in the year following the base year.
  • the predetermined health guidance standard is, for example, a health guidance standard focusing on built-in fat type obesity.
  • the present invention is not limited to such an example.
  • the insurer's desired condition 14C is a condition regarding an individual that the insurer wants to actively participate in health guidance. For example, a condition that an individual in their 40s wants to actively participate in health guidance, or an individual who satisfies the result of a test item in a specific health examination meets a certain condition actively participates in health guidance. It is a condition that wants.
  • the discriminant model 14D is a model that shows the relationship between the personal health check data and whether or not the individual meets a predetermined health guidance standard in the next year of the base year.
  • the discriminant model 14D may be a linear regression model, a logistic regression model, or the like.
  • the discrimination model 14D is generally a polynomial composed of a plurality of explanatory variables and their coefficients (parameters). As individual explanatory variables, individual health check items in the health check data are used. All health check items in the health check data may be explanatory variables, or some health check items in the health check data may be set as explanatory variables.
  • the health checkup data corresponds to age of visit, sex, height, weight, waist circumference, BMI value, diastolic blood pressure, diastolic blood pressure, blood sugar level, triglyceride, “drinking amount is 500 ml or more per day” If there are a total of 11 health checkup items with the results of the interviews, all 11 may be used as explanatory variables. For example, only 8 health checkup items excluding age, sex and height may be used as explanatory variables. good.
  • the selection condition 14E is a condition for selecting a health guidance target person created from the discriminant model 14C after learning.
  • the selection condition 14E includes a combination of health check items and their coefficients, and a determination threshold value.
  • the combination of the health check item and its coefficient means a combination of a coefficient whose value is not 0 and a health check item as an explanatory variable corresponding to the coefficient among a plurality of coefficients in the discriminant model 14D after learning.
  • the determination threshold value can be determined in the discriminant model 14D after learning that a certain individual has a probability that the person corresponds to the health guidance standard in the next year of the reference year is equal to or greater than a preset threshold value (for example, 1/2). , Means the minimum value of the total value of the coefficients included in the combination.
  • the processor 15 has a microprocessor such as a CPU and its peripheral circuits, and reads and executes the program 14P from the storage unit 14, thereby causing the hardware and the program 14P to cooperate to implement various processing units. have.
  • main processing units realized by the processor 15 there are an input unit 15A, a discriminant model learning unit 15B, and a condition creating unit 15C.
  • the input unit 15A inputs the health check data 14A, the flag 14B, the insurer's desired condition 14C, and the discrimination model 14D before learning from the communication I / F unit 11 or the operation input unit 12, and stores them in the storage unit 14. It has the function to do.
  • the discrimination model learning unit 15B reads the health check data 14A, the flag 14B, the insurer's desired condition 14C, and the discriminant model 14D before learning from the storage unit 14, and the health check data 14A, the flag 14B, and the insurer's desired condition 14C. Is used to learn the discriminant model 14D and to store the discriminated model 14D after learning in the storage unit 14.
  • the discriminant model learning unit 15B uses, as a positive example, the individual's health diagnosis data corresponding to the health guidance standard in the next fiscal year in the health diagnosis data 14A, and corresponds to the health guidance standard in the next year.
  • the medical examination data of the individuals who did not exist are used as negative examples.
  • the discriminant model learning unit 15B determines whether a term that represents the likelihood of the discriminant model, a penalty term that depends on the number of coefficients whose values are not 0, and an individual who does not satisfy the insurer's desired conditions.
  • the coefficient of the discriminant model 14D is learned so as to optimize an objective function having a penalty term depending on meeting the health guidance standard in the year.
  • the condition creating unit 15C reads the discriminant model 14D after learning from the storage unit 14, the combination of a coefficient whose value in the discriminated model 14D after learning is not 0 and the health check item as an explanatory variable corresponding to the coefficient,
  • the determination threshold value is generated as the selection condition 14E and stored in the storage unit 14.
  • the condition creating unit 15 ⁇ / b> C has a function of reading the selection condition 14 ⁇ / b> D from the storage unit 14 and outputting it to the screen display unit 13 or outputting it to the outside through the communication I / F unit 11.
  • the input unit 15A inputs the health check data 14A, the flag 14B, the insurer's desired condition 14C, and the discrimination model 14D before learning from the communication I / F unit 11 or the operation input unit 12, and stores them in the storage unit 14. (Step S1).
  • the discrimination model learning unit 15B reads the health diagnosis data 14A, the flag 14B, the insurer's desired condition 14C, and the discrimination model 14D before learning from the storage unit 14, and the health diagnosis data 14A, the flag 14B, and the insurer.
  • the discriminant model 14D is learned using the desired condition 14C (step S2). That is, the discriminant model learning unit 15B uses, as a positive example, the health check data of the individual who met the health guidance standard in the next fiscal year in the health check data 14A, and the health of the individual who did not meet the health guidance standard in the next year.
  • the coefficient value of each explanatory variable in the discriminant model 14D for appropriately relating the individual's health diagnosis data and whether or not the individual meets the predetermined health guidance standard in the next year The insurer's desired condition 14C is learned as much as possible.
  • the discriminant model 14D after learning is stored in the storage unit 14.
  • condition creation unit 15C reads the discriminant model 14D after learning from the storage unit 14, and among the plurality of explanatory variables of the discriminant model 14D after learning, determines that the coefficient value is a combination of explanatory variables other than zero.
  • the threshold value is stored in the storage unit 14 as the selection condition 14E, is output to the screen display unit 13, or is output to the outside through the communication I / F unit 11 (step S3).
  • a B is expressed as A_B.
  • the superscript is expressed with a hat.
  • a B is written as A ⁇ B.
  • Step S1 The input unit 15A inputs the health diagnosis data 14A, the flag 14B, the insurer's desired condition 14C, and the discrimination model 14D before learning.
  • N represents the number of individuals who are candidates for health guidance.
  • X_n is health check data for the reference year of individual n.
  • M is the number of health examination items.
  • the input unit 15A binarizes the health check data as preprocessing.
  • the threshold value of each inspection item may use the health guidance criteria set by the Ministry of Health, Labor and Welfare. For example, the BMI value is binarized to 1 if 25 or more, and to 0 otherwise. Note that this process is not necessary when the input health checkup data is already binarized.
  • Step S2 The value obtained by the discrimination model 14D is the following P.
  • the discriminant model learning unit 15B learns the parameter using the discriminant model 14D for calculating this value.
  • a logistic regression model that can output a probability that a certain X_n is a positive example or a negative example may be used.
  • the mathematical structure of logistic regression will be described.
  • X is an M-dimensional explanatory variable corresponding to the health examination data of the base year
  • W is an M-dimensional weight vector
  • the logistic regression model is expressed by the following equation.
  • P (Y 1
  • X; W) 1 / (1 + exp (W ⁇ ⁇ T ⁇ X))... (1)
  • P (Y 0
  • ⁇ ; ⁇ ) represents the conditional probability of ⁇ when ⁇ is given as a parameter and ⁇ is given.
  • a superscript T represents transposition of a vector.
  • L (W) can be maximized by a method according to the gradient method.
  • the value of the parameter W that maximizes L (W) is W *.
  • Figure 3 shows an example of health check items corresponding to the value of W * that maximizes the objective function given by Equation 3 above.
  • the example shown in FIG. 3 shows the result of obtaining the coefficient value of each explanatory variable that maximizes the objective function with the five health check items, ie, waist circumference, BMI, blood sugar, lipid, and not drinking, as explanatory variables. It is an example.
  • the coefficients of all five explanatory variables have values other than zero.
  • the number of condition items of the selection condition is 5 items.
  • the insurer in order for an insured person to participate in health guidance, it is necessary for the insurer to disclose the reason for selection to the insured person and to gain an understanding of the insured person. If a complicated selection reason with a large number of condition items is set, it becomes difficult to obtain the insured's understanding. Therefore, it is desirable that the number of condition items as selection conditions is as small as possible. Further, the objective function of the above three equations cannot be optimized along the insurer's desired condition 14C.
  • the discriminant model learning unit 15B learns W * that optimizes the objective function according to the following four expressions instead of the objective function according to the above three expressions.
  • is the norm of W, and norm 1 is used.
  • F is an N-dimensional vector, and the nth element is W ⁇ ⁇ T ⁇ X_n.
  • L ′ is a normalized graph Laplacian. ⁇ and ⁇ are parameters for adjusting the balance of the first term, the second term, and the third term on the right side.
  • Equation 4 The first term on the right side of Equation 4 above is the same as the right side of Equation 3 above and represents the likelihood of the discriminant model.
  • the second term on the right side of the above four formulas is a penalty term that depends on the number of coefficients whose values are not zero.
  • the second term on the right side has an effect of reducing the number of explanatory variables in which the coefficient of each explanatory variable of the discriminant model, that is, the element of W * is not zero.
  • the third term on the right side of the above four formulas is a penalty term that depends on an individual who does not meet the insurer's desired conditions falling under the health guidance standards.
  • the third term on the right side has the effect of adjusting the weight of each element of W * so as to meet the conditions desired by the insurer.
  • W * is learned so that the insurer's desired condition is satisfied as much as possible. Therefore, the non-zero component of W * after learning is extracted and the condition is extracted. Then, it is possible to generate health guidance target person selection conditions that are less in the number of condition items and that meet the conditions desired by the insurer.
  • the graph Laplacian is an N ⁇ N matrix.
  • N represents the number of individuals who are candidates for health guidance.
  • the normalized graph Laplacian is the same as the graph Laplacian in this example.
  • Each row and column in the graph Laplacian and normalized graph Laplacian in FIG. 4 represents an individual.
  • the first line in FIG. 4 indicates that there is a link between person 1 and person 2.
  • the second line in FIG. 4 indicates that there is a link between person 1 and person 2.
  • the third line in FIG. 4 indicates that there is no link.
  • the insurer's desired condition 14C is a condition that an individual in their 40s wants to actively participate in health guidance, for example, there is a link that satisfies the condition desired by the insurer. Indicates. In the example of FIG. 4, individuals 1 and 2 meet the conditions desired by the insurer (individuals in their 40s), and individual 3 does not meet the conditions desired by the insurer (individuals in their 40s) Is shown.
  • the normalized graph Laplacian L ′ itself may be stored in the storage unit 14 as the insurer's desired condition 14C and applied to the objective function of Equation 4.
  • the condition itself that an individual in their 40s wants to actively participate in health guidance is stored in the storage unit 14 as an insurer's desired condition 14C, and the normalized graph Laplacian L ′ is calculated from the condition. It may be generated and applied to the objective function of Equation 4.
  • W * is an M-dimensional vector, and among the elements of the M-dimensional vector, the value of the non-zero element and the health check item corresponding to the element are stored as a selection condition 14E in the storage unit 14. That is, (W * _j, health examination item j) ⁇ j
  • Figure 5 shows an example of health check items corresponding to the value of W * that maximizes the objective function given by Equation 4 above.
  • the coefficient value of each explanatory variable that maximizes the objective function according to the equation 4 having five health check items such as abdominal circumference, BMI, blood glucose, lipid, and no drinking as explanatory variables is obtained. It is a result.
  • the value of the coefficient of BMI and blood glucose level is zero.
  • FIG. 6 shows an example of the selection condition 14E generated by extracting the health check item corresponding to the non-zero element and the coefficient value corresponding to the health check item from FIG.
  • the number of condition items of the selection condition is reduced from 5 items to 3 items.
  • the coefficient value is treated as a score.
  • the value of W ⁇ ⁇ T ⁇ X when P (Y 1
  • TH is 0.5, but other values may be used.
  • the condition creating unit 15C includes the selection condition 14E generated as described above, the condition (W * _j, health diagnosis item j) ⁇ j
  • the insurer can create a condition for selecting a health guidance target person from the viewpoint of whether or not there is a possibility that the health guidance standard will be met in the next period.
  • the reason is that a plurality of health check items of the health check data are set as a plurality of explanatory variables, expressed by a polynomial composed of this explanatory variable and a coefficient for each explanatory variable.
  • the discrimination model 14D for discriminating whether or not the data meets the health guidance standards is determined based on the health check data 14A in the reference year and whether each individual meets the health guidance standards in the health check data in the next year of the reference year. This is because the learning is performed using the flag 14B indicating such, and a combination of a plurality of health check items and coefficient values as a plurality of explanatory variables in the discriminant model 14D after learning is generated as the selection condition 14E.
  • the learning of the discriminant model 14D learns the value of the coefficient of the discriminant model 14D so as to optimize the objective function according to Equation 4 having a penalty term that depends on the number of coefficients whose values are not zero.
  • the discriminant model 14D is optimized so as to optimize the objective function according to Equation 4 having a penalty term that depends on a person who does not satisfy the condition desired by the insurer being in compliance with the health guidance standard. This is because the value of the coefficient is learned.
  • a threshold value for determining whether or not an individual meets a predetermined standard in the next year can be generated as a part of the selection condition 14E.
  • X; W) TH in the above equation 1 is calculated and stored in the storage unit 14 as part of the selection condition 14E. It is to do.
  • the health guidance target person selection condition creation support device 2 is a condition for selecting a health guidance target person from the viewpoint of whether or not there is a possibility that it meets the health guidance standards. And a function of selecting a health guidance subject according to the created selection conditions.
  • the health guidance target person selection condition creation support device 2 includes a communication interface unit (communication I / F unit) 21, an operation input unit 22, a screen display unit 23, a storage unit 24, and a processor 25 as hardware.
  • the communication I / F unit 21, the operation input unit 22, and the screen display unit 23 have the same functions as the communication I / F unit 11, the operation input unit 12, and the screen display unit 13 in the first embodiment. Yes.
  • the storage unit 24 includes a storage device such as a hard disk or a semiconductor memory, and has a function of storing processing information and programs 24P necessary for various processes in the processor 25.
  • the program 24P is a program that realizes various processing units by being read and executed by the processor 25, and can be read by an external device (not shown) or a computer via a data input / output function such as the communication I / F unit 21. It is read in advance from a possible storage medium (not shown) and stored in the storage unit 24.
  • health diagnosis data 24A, a flag 24B, an insurer's desired condition 24C, a discrimination model 24D, a selection condition 24E, and a selection health diagnosis data 24F There is a selector 24G.
  • the health diagnosis data 24A, the flag 24B, the insurer's desired condition 24C, the discrimination model 24D, and the selection condition 24E are the health diagnosis data 14A, the flag 14B, the insurer's desired condition 14C, the discrimination model 14D in the first embodiment. The same as the selection condition 14E.
  • the health check data 24F for selection is personal health check data in a year (hereinafter referred to as a selection year) in which a health instructor is selected.
  • the medical checkup data 24F is divided by individual.
  • the health check data for one individual in the current year has the same items as the health check data 24A of the reference year. That is, the health check data 24F of one individual includes personal ID that uniquely identifies the individual, personal information such as the year of medical examination, age of medical examination, sex, etc., height, weight, waist circumference, minimum blood pressure, maximum blood pressure, blood sugar level, medium It has various test values such as sex fat, and various inquiry results such as whether or not “the amount of drinking is 500 ml or more per day”.
  • the health check data 24F for selection may consist only of health check data of individuals not corresponding to the prescribed health guidance standards, or health check data of individuals who do not meet the prescribed health guidance standards and individuals who do not meet the criteria. Data may be mixed.
  • the selector 24G is information for identifying an individual selected as a health guidance target person, for example, a list of personal IDs.
  • the processor 25 includes a microprocessor such as a CPU and its peripheral circuits, and reads and executes the program 24P from the storage unit 24, thereby realizing the various processing units in cooperation with the hardware and the program 24P. have.
  • main processing units realized by the processor 25 there are an input unit 25A, a discriminant model learning unit 25B, a condition creating unit 25C, and a health guidance target person selecting unit 25D.
  • the input unit 25A, the discrimination model learning unit 25B, and the condition creation unit 25C have the same functions as the input unit 15A, the discrimination model learning unit 15B, and the condition creation unit 15C in the first embodiment.
  • the health guidance target person selecting unit 25D reads the selection condition 24E and the health check data 24F for selection from the storage unit 24, and selects individuals who have health check data suitable for the selection condition 24E from the health check data 24F. And has a function of storing in the storage unit 24 as the selector 24G. In addition, the health guidance target person selecting unit 25D has a function of reading the selecting person 24G from the storage unit 24 and outputting the selected person 24G to the screen display unit 23 or outputting it to the outside through the communication I / F unit 21.
  • the input unit 25A inputs the health check data 24A, the flag 24B, the insurer's desired condition 24C, the discrimination model 24D before learning, and the health check data 24F for selection from the communication I / F unit 21 or the operation input unit 22. And stored in the storage unit 24 (step S11).
  • the discrimination model learning unit 25B reads the health diagnosis data 24A, the flag 24B, the insurer's desired condition 24C, and the discrimination model 24D before learning from the storage unit 24, and the health diagnosis data 24A, the flag 24B, and the insurer.
  • the discriminant model 24D is learned using the desired condition 24C in the same manner as the discriminant model learning unit 15B in the first embodiment (step S12).
  • the learned discrimination model 24 ⁇ / b> D is stored in the storage unit 24.
  • condition creating unit 25C reads the learned discrimination model 24D from the storage unit 24, and among the plurality of explanatory variables of the learned discrimination model 24D, similarly to the condition creating unit 15C in the first embodiment, A combination of the health check item whose coefficient value is other than 0 and the coefficient value, and a determination threshold value are created as the selection condition 24E, stored in the storage unit 24, and output to the screen display unit 23. Alternatively, it is output to the outside through the communication I / F unit 21 (step S13).
  • the health guidance target person selecting unit 25D reads the selection condition 24E and the health checkup data 24F for selection from the storage unit 24, and the health check data 24F from the health checkup data 24F is used to treat individuals who have health checkup data that meets the selection condition 24E.
  • the person to be instructed is determined, stored in the storage unit 24 as the selector 24G, and output to the screen display unit 23 or output to the outside through the communication I / F unit 21 (step S14).
  • the same effect as that of the first embodiment can be obtained, and the health guidance target person can be selected from the viewpoint of whether or not there is a possibility that the health guidance standard will be met in the next year. It becomes possible.
  • the selection condition for the health guidance target person that meets the insurer's desired condition is generated.
  • the selection condition may be generated without considering the insurer's desired condition.
  • an objective function in which the third term on the right side in the above four formulas is omitted may be used.
  • the number of health check items as selection conditions is reduced as much as possible.
  • the determination threshold value is calculated, and an individual having a score equal to or higher than the determination threshold value is selected as the health guidance target person.
  • the health guidance target person is used without using the judgment threshold value. May be selected. For example, it is possible to calculate the probability corresponding to the health guidance target person in the next fiscal year for each individual using the above formula 1, and select the top N persons with the probability as the health guidance target person.

Abstract

 個人の健康診断データと、個人が次の期間に保健指導基準に該当したか否かを表すラベル値とを記憶するメモリと、このメモリに接続されたプロセッサとを備える。プロセッサは、健康診断データの複数の健康診断項目を複数の説明変数とし、この説明変数とこの説明変数毎の係数とから構成される多項式で表現され、個人が次の期間に保健指導基準に該当するか否かを判別するための判別モデルを、各個人の健康診断データと上記ラベル値とを用いて学習し、学習後の判別モデルにおける複数の説明変数としての複数の健康診断項目と係数の値との組み合わせを選定条件として生成する。

Description

保健指導対象者選定条件作成支援装置
 本発明は、保険者の保健指導事業に関し、特に保健指導対象者を選定する条件を決定する保険者の作業を支援する装置に関する。
 近年、保険者が被保険者に対して負担する医療費の増加が保険者の財政を圧迫しており、医療費削減に向けた施策作りが急務である。その施策の一つとして、保険者は被保険者の健康増進に向けた保健指導を実施している。具体的には、被保険者の健康診断結果に対して一定の基準を設定し、基準を満たす人(該当者)に対して保健指導を行う。例えば、生活習慣の改善が必要な人や、将来の傷病リスクが高い人などが該当するように基準が設定される。一方、基準を満たさない人(非該当者)に対しては、生活習慣を改善する必要なしと判断して、保健指導は行わない。
 平成20年4月から保険者(国保・被用者保険)には、40歳以上の被保険者・被扶養者を対象として、内臓脂肪型肥満に着目した健診及び保健指導の事業実施が義務づけられている。この事業で用いられている保健指導基準は厚生労働省が定めている。
 しかし、保険者ごとに非保険者の特徴が異なるため、一律の条件で保健指導対象者を絞り込んだ場合には、効果に大きな差が生じると考えられる。そのため、国が定めた保健指導対象者とは別に、保険者独自の基準を設けてその基準に当てはまる非保険者を対象にした保健指導を行うことが望ましいと考えられている。
 特に、問題になっているのは、新規に保健指導基準に該当する人への対応である。当該年度の保健指導の基準を満たさない人(非該当者)の中には、次年度に保健指導の基準を満たして該当者になる人もいる。そのため、保険者が当該年度の該当者に対して保健指導を行い、該当者の健康増進を実現しても、毎年度、新規に該当者が増えてしまうと、被保険者全体では被保険者の健康増進を達成できない。
 被保険者全体の健康増進のために、保険者が被保険者全員に健康増進対策を行うのが望ましいが、膨大なコストがかかるため、保険者は、保健指導基準とは別に、保険者独自の基準を設定して、当該年度の被保険者の中から、次年度に該当する被保険者を選定し、選定した限られた群に対して、次年度に基準に該当しないように当該年度に保健指導を実施したいと考えている。
 保健指導対象者を選定する技術の一例が、特許文献1に記載されている。特許文献1に記載の技術は、保険者が対象者の選定条件を設定することで、その条件を満たす保健指導対象群に対して指導をした場合の医療費削減効果の予測値を出力する機能を提供している。保険者は、この支援システムを使うことで、ある特定の選定条件を設定した場合の医療費の削減効果を知ることができる。
特開2007‐257565号公報
 しかし、特許文献1に記載の技術のように、保健指導によって医療費削減効果がある群を選定する方法では、非該当者の中から、次年度に該当しないにもかかわらず、保健指導による医療費削減効果が高いということで選定してしまう可能性があり、必ずしも、次年度に該当する人を選ぶとは限らない。
 本発明の目的は、上述したような課題、すなわち、次年度に保健指導基準に該当する見込みがあるかないかの観点から保健指導対象者を選定する条件を作成することが困難である、という課題を解決する保健指導対象者選定条件作成支援装置を提供することにある。
 本発明の第1の観点にかかる保健指導対象者選定条件作成支援装置は、
 第1の期間における個人の健康診断データである第1の健康診断データと、前記個人が前記第1の期間の次の期間である第2の期間の健康診断データで予め定められた保健指導基準に該当したか否かを表すラベル値とを記憶するメモリと、前記メモリに接続されたプロセッサとを備え、
 前記プロセッサは、
 前記健康診断データの複数の健康診断項目を複数の説明変数とし、前記説明変数と前記説明変数毎の係数とから構成される多項式で表現され、前記個人が前記第2の期間の健康診断データで前記保健指導基準に該当するか否かを判別するための判別モデルを、前記第1の健康診断データと前記ラベル値とを用いて学習し、
 前記学習後の前記判別モデルにおける前記複数の説明変数としての前記複数の健康診断項目と前記係数の値との組み合わせを保健指導対象者選定条件として生成する
ようにプログラムされている、といった構成を採る。
 また本発明の第2の観点にかかる保健指導対象者選定条件作成支援方法は、
 第1の期間における個人の健康診断データである第1の健康診断データと、前記個人が前記第1の期間の次の期間である第2の期間の健康診断データで予め定められた保健指導基準に該当したか否かを表すラベル値とを記憶するメモリと、前記メモリに接続されたプロセッサとを備えた装置が実行する保健指導対象者選定条件作成支援方法であって、
 前記プロセッサが、
 前記健康診断データの複数の健康診断項目を複数の説明変数とし、前記説明変数と前記説明変数毎の係数とから構成される多項式で表現され、前記個人が前記第2の期間の健康診断データで前記保健指導基準に該当するか否かを判別するための判別モデルを、前記第1の健康診断データと前記ラベル値とを用いて学習し、
 前記学習後の前記判別モデルにおける前記複数の説明変数としての前記複数の健康診断項目と前記係数の値との組み合わせを保健指導対象者選定条件として生成する、
といった構成を採る。
 本発明は上述したような構成を有するため、保険者は、次期間に保健指導基準に該当する見込みがあるかないかの観点から保健指導対象者を選定する条件を作成することが可能になる。
本発明の第1の実施形態のブロック図である。 本発明の第1の実施形態の動作を示すフローチャートである。 本発明の第1の実施形態における式3で与えられる目的関数を最大化するW*の値と対応する健康診断項目の例を示す図である。 本発明の第1の実施形態における動作説明用のグラフラプラシアンおよび正規化グラフラプラシアンを示す図である。 本発明の第1の実施形態における式4で与えられる目的関数を最大化するW*の値と対応する健康診断項目の例を示す図である。 本発明の第1の実施形態において生成された選定条件の例を示す図である。 本発明の第2の実施形態のブロック図である。 本発明の第2の実施形態の動作を示すフローチャートである。
 次に本発明の実施の形態について図面を参照して詳細に説明する。
[第1の実施形態]
 図1を参照すると、本発明の第1の実施形態にかかる保健指導対象者選定条件作成支援装置1は、保健指導基準に該当する見込みがあるかないかの観点から保健指導対象者を選定する条件を作成する機能を有している。
 保健指導対象者選定条件作成支援装置1は、ハードウェアとして、通信インターフェース部(通信I/F部)11、操作入力部12、画面表示部13、記憶部14、およびプロセッサ15を有する。
 通信I/F部11は、専用のデータ通信回路からなり、通信回線(図示せず)を介して接続された図示しない各種装置との間でデータ通信を行う機能を有している。操作入力部12は、キーボードやマウスなどの操作入力装置からなり、オペレータの操作を検出してプロセッサ15に出力する機能を有している。画面表示部13は、LCDやPDPなどの画面表示装置からなり、プロセッサ15からの指示に応じて、操作メニューや選定条件などの各種情報を画面表示する機能を有している。
 記憶部14は、ハードディスクや半導体メモリなどの記憶装置からなり、プロセッサ15での各種処理に必要な処理情報やプログラム14Pを記憶する機能を有している。プログラム14Pは、プロセッサ15に読み込まれて実行されることにより各種処理部を実現するプログラムであり、通信I/F部11などのデータ入出力機能を介して外部装置(図示せず)やコンピュータ読取可能な記憶媒体(図示せず)から予め読み込まれて記憶部14に保存される。記憶部14に記憶される主な処理情報として、健康診断データ14Aと、フラグ14Bと、保険者の希望条件14Cと、判別モデル14Dと、選定条件14Eとがある。
 健康診断データ14Aは、過去の或る年度(以下、基準年度と記す)における個人の健康診断データである。健康診断データ14Aは、個人別に分けられている。1個人の1年度分の健康診断データは、その個人を一意に識別する個人ID、受診年度、受診年齢、性別等の個人情報と、身長、体重、腹囲、BMI値、最低血圧、最高血圧、血糖値、中性脂肪などの各種検査値と、「飲酒量が1日あたり500ml以上」に該当するか否か等の各種問診結果とを有している。ここでは、1年を1期間としているが、期間は、1年未満であれば任意である。
 フラグ14Bは、基準年度の次の年度における健康診断において所定の保健指導基準に該当したか否かを示す個人別のラベル値である。所定の保健指導基準とは、例えば内蔵脂肪型肥満に着目した保健指導基準のことである。但し、本発明はそのような例に限定されない。
 保険者の希望条件14Cは、保険者が積極的に保健指導に参加させたい個人に関する条件である。例えば、年齢が40歳代の個人を積極的に保健指導に参加させたいという条件や、或る特定の健康診断の検査項目の結果が或る条件を満たす個人を積極的に保健指導に参加させたいという条件などである。
 判別モデル14Dは、個人の健康診断データと個人が基準年度の次年度に所定の保健指導基準に該当するか否かとの関係を示すモデルである。判別モデル14Dは、線形回帰モデル、ロジスティック回帰モデルなどが考えられる。判別モデル14Dは、一般に、複数の説明変数とその係数(パラメータ)とからなる多項式である。個々の説明変数として、健康診断データにおける個々の健康診断項目が使用される。健康診断データにおける全ての健康診断項目を説明変数としても良いし、健康診断データにおける一部の健康診断項目を説明変数としても良い。例えば、健康診断データが、受診年齢、性別、身長、体重、腹囲、BMI値、最低血圧、最高血圧、血糖値、中性脂肪、「飲酒量が1日あたり500ml以上」に該当するか否かの問診結果との合計11個の健康診断項目を有する場合、この11個すべてを説明変数としても良いし、例えば、受診年齢と性別と身長を除く8個の健康診断項目だけを説明変数としても良い。
 選定条件14Eは、学習後の判別モデル14Cから作成される保健指導対象者選定条件である。選定条件14Eは、本実施形態の場合、健康診断項目とその係数の組み合わせと、判定しきい値とから構成される。健康診断項目とその係数の組み合わせは、学習後の判別モデル14Dにおける複数の係数のうち、値が0でない係数と当該係数に対応する説明変数としての健康診断項目との組み合わせを意味する。また、判定しきい値は、学習後の判別モデル14Dにおいて或る個人が基準年度の次年度に保健指導基準に該当する確率が予め設定された閾値(例えば1/2)以上であると判定できる、上記組み合わせに含まれる係数の値の合計値の最小値を意味する。
 プロセッサ15は、CPUなどのマイクロプロセッサとその周辺回路を有し、記憶部14からプログラム14Pを読み込んで実行することにより、上記ハードウェアとプログラム14Pとを協働させて各種処理部を実現する機能を有している。プロセッサ15で実現される主な処理部として、入力部15A、判別モデル学習部15B、および条件作成部15Cがある。
 入力部15Aは、通信I/F部11または操作入力部12から、健康診断データ14A、フラグ14B、保険者の希望条件14C、および学習前の判別モデル14Dを入力して、記憶部14に格納する機能を有する。
 判別モデル学習部15Bは、健康診断データ14Aとフラグ14Bと保険者の希望条件14Cと学習前の判別モデル14Dを記憶部14から読み込み、健康診断データ14Aとフラグ14Bと保険者の希望条件14Cとを用いて、判別モデル14Dを学習し、学習後の判別モデル14Dを記憶部14に保存する機能を有する。
 判別モデル14Dの学習では、判別モデル学習部15Bは、健康診断データ14Aのうち、次年度に保健指導基準に該当した個人の健康診断データを正例として用い、次年度に保健指導基準に該当しなかった個人の健康診断データを負例として用いる。
 また判別モデル14Dの学習では、判別モデル学習部15Bは、判別モデルの尤度を表す項と、値が0でない係数の個数に依存する罰則項と、保険者の希望条件を満たさない個人が次年度に保健指導基準に該当することに依存する罰則項とを有する目的関数を最適化するように判別モデル14Dの上記係数を学習する。
 条件作成部15Cは、学習後の判別モデル14Dを記憶部14から読み込み、学習後の判別モデル14Dにおける値が0でない係数と当該係数に対応する説明変数としての健康診断項目との組み合わせと、上述した判定しきい値とを、選定条件14Eとして生成して記憶部14に保存する機能を有する。また条件作成部15Cは、記憶部14から選定条件14Dを読み込み、画面表示部13に出力し、あるいは通信I/F部11を通じて外部に出力する機能を有する。
 次に、図2を参照して、本実施形態にかかる保健指導対象者選定支援装置1の動作について説明する。
 まず入力部15Aは、健康診断データ14A、フラグ14B、保険者の希望条件14C、および学習前の判別モデル14Dを、通信I/F部11または操作入力部12から入力し、記憶部14に格納する(ステップS1)。
 次に、判別モデル学習部15Bは、記憶部14から健康診断データ14A、フラグ14B、保険者の希望条件14C、および学習前の判別モデル14Dを読み出し、健康診断データ14A、フラグ14B、および保険者の希望条件14Cを用いて、判別モデル14Dを学習する(ステップS2)。すなわち、判別モデル学習部15Bは、健康診断データ14Aのうち、次年度に保健指導基準に該当した個人の健康診断データを正例として用い、次年度に保健指導基準に該当しなかった個人の健康診断データを負例として用いて、個人の健康診断データと個人が次年度に所定の保健指導基準に該当するか否かとを適切に関係付けるための判別モデル14Dにおける各説明変数の係数の値を、保険者の希望条件14Cが極力満たされるように学習する。学習後の判別モデル14Dは、記憶部14に保存される。
 次に、条件作成部15Cは、記憶部14から学習後の判別モデル14Dを読み出し、学習後の判別モデル14Dの複数の説明変数のうち、その係数の値が0以外の説明変数の組み合わせと判定しきい値とを、選定条件14Eとして記憶部14に保存し、また、画面表示部13に出力し、あるいは通信I/F部11を通じて外部に出力する(ステップS3)。
 続いて、本実施形態の動作をより詳細に説明する。なお、以下では、下付きの添え字は、アンダーラインを付して表現する。例えば、ABはA_Bと表記する。また、上付きの添え字は、ハットを付して表現する。例えば、ABはA^Bと表記する。
(1-1)ステップS1の詳細
 入力部15Aは、健康診断データ14Aと、フラグ14Bと、保険者の希望条件14Cと、学習前の判別モデル14Dとを入力する。
 入力された健康診断データをX_n(n=1,2,..,N)とする。Nは、保健指導対象者候補となる個人の数を表す。X_nは、個人nの基準年度の健康診断データとする。X_nj(j=1,…,M)は、個人nの健康診断項目jの測定結果を表す(健康診断項目は、問診結果をも含む)。Mは健康診断項目数である。
 さらに、入力されたフラグを、Y_n(n=1,…,N)とする。すなわち、Y_nは、個人nが基準年度の次年度の健康診断で所定の保健指導基準に該当したか(Y_n=1)、しなかったか(Y_n=0)を表すフラグである。
 入力部15Aは、前処理として、健康診断データの2値化を行う。2値化のための閾値を健康診断項目ごとに設定し、その閾値をもとにX_nj(j=1,…,M)を0か1に2値化する。各検査項目の閾値は、厚生労働省が定める保健指導判定基準を使用してもよい。例えば、BMI値を、25以上ならば1に、それ以外は0に2値化する。なお、入力された健康診断データが既に2値化されている場合には、この処理は不要である。
(1-2)ステップS2の詳細
 判別モデル14Dで求める値は、以下のPである。判別モデル学習部15Bは、この値を算出するための判別モデル14Dを用いて、そのパラメータを学習する。
 P(Y_n=1)は、個人nが所定の保健指導基準に該当する確率を表す。個人nが所定の保健指導基準に該当しない確率は、1-P(Y_n=1)で求められる。これを、P(Y_n=0)とする。
 ここで、Y_n=1のX_nのことを正例、Y_n=0のX_nのことを負例と呼ぶ。例えば、あるX_nが正例または負例である確率を出力可能なロジスティック回帰モデルを用いると良い。ロジスティック回帰モデルは、X_nからY_n=1かY_n=0かを判別する二値判別問題によく適用されるモデルである。以下、ロジスティック回帰の数理的構造について説明する。
 Xを基準年の健康診断データに対応するM次元の説明変数とし、Yを基準年の次年度における健康診断データで所定の保健指導基準に該当したか、しなかったかを表す確率変数とする(Y=1は該当、Y=0は非該当を表す)。WをM次元の重みベクトルとすると、ロジスティック回帰モデルは、次式で表される。
P(Y=1|X;W)=1/(1+exp(W^{T}X))   …(1)
P(Y=0|X;W)=1-P(Y=1|X;W)   …(2)
 ただし、P(●|○;★)は★をパラメータとし、○が与えられた場合の●の条件付確率を表す。また、上付きのTはベクトルの転置を表す。
 学習データとして正例と負例{X_n,Y_n}(n=1,…,N)が与えられた場合に、ロジスティック回帰では、以下の目的関数を最適化することによって、パラメータWの値を算出する。ただし、X_nとY_nはそれぞれXとYの実現値とする。
L(W)=\sum^{N}_{n=1}logP(Y_n|X_n,W)   …(3)
 ここで、\sum^{N}_{n=1}は、n=1からNまでの総和を表す。
 L(W)は勾配法に準じた方法によって最大化することが可能である。L(W)を最大化するパラメータWの値をW*とする。
 上記式3で与えられる目的関数を最大化するW*の値と対応する健康診断項目の例を図3に示す。図3に示す例は、腹囲、BMI、血糖、脂質、飲酒しない、という5つの健康診断項目を説明変数とする上記目的関数について、それを最大化する各説明変数の係数の値を求めた結果の一例である。
 ここで、図3を参照すると、5つ全ての説明変数の係数が0以外の値となっている。これは、選定条件の条件項目数が5項目であることを意味している。一般に被保険者を保健指導に参加させるには、保険者から被保険者に対して、選定理由を開示し、被保険者の理解を得る必要がある。条件項目数が多い複雑な選定理由を設定してしまうと、被保険者の理解を得ることが困難になる。そのため、選定条件となる条件項目数はできるだけ少ない方が望ましい。また、上記3式の目的関数では、保険者の希望条件14Cに沿う最適化が行えない。
 そこで、判別モデル学習部15Bは、上記3式による目的関数に代えて、下記4式による目的関数を最適化するW*を学習する。
L(W)=\sum^{N}_{n=1}logP(Y_n|X_n,W)-(λ/2)*||W||-(α/2)F^{T}L’F   …(4)
ここで、||W||はWのノルムであり、ノルム1を用いる。Fは、N次元ベクトルで、n番目の要素はW^{T}X_nである。またL’は、正規化グラフラプラシアンである。λとαは、右辺の第1項と第2項と第3項のバランスを調整するパラメータである。
 上記4式の右辺の第一項は、上記3式の右辺と同じであり、判別モデルの尤度を表す。
 上記4式の右辺の第二項は、値が0でない係数の個数に依存する罰則項である。この右辺の第二項は、判別モデルの個々の説明変数の係数、つまりW*の要素が0でない説明変数の個数を減らす効果がある。
 上記4式の右辺の第三項は、保険者の希望条件を満たさない個人が保健指導基準に該当することに依存する罰則項である。この右辺の第三項は、保険者が希望する条件に沿うように、W*の各要素の重みを調整する効果がある。この右辺の第3項を入れることによって、保険者が希望する条件を出来る限り満たすように、W*を学習することになるため、学習後のW*の非ゼロの成分を抽出して、条件にすると、条件項目数のより少なく、保険者が希望する条件に沿うような、保健指導対象者選定条件が生成できるようになる。
 以下、正規化グラフラプラシアンL’について説明する。
 まず初めに、グラフラプラシアンについて説明する。グラフラプラシアンは、N×Nの行列である。Nは、保健指導対象者候補となる個人の数を表す。説明の便宜上、個人の数をN=3(個人1,個人2,個人3)として、グラフラプラシアンの例を図4に示す。また正規化グラフラプラシアンは、この例ではグラフラプラシアンと同じになる。
 図4のグラフラプラシアンおよび正規化グラフラプラシアンにおける各行と列は、個人を表す。図4の一行目は、個人1と個人2にリンクがあるということを表す。図4の二行目は、個人1と個人2にリンクがあるということを表す。図4の三行目は、リンクがないことを表す。
 保険者の希望条件14Cが、40歳代の個人を積極的に保健指導に参加させたいという条件であった場合を例にすると、リンクがあるというのは、保険者が希望する条件を満たすことを示す。図4の例では、個人1と個人2は、保険者が希望する条件(40歳代の個人)を満たし、個人3は、保険者が希望する条件(40歳代の個人)を満たさないことを示している。ここで、上記の正規化グラフラプラシアンL’自体を保険者の希望条件14Cとして記憶部14に記憶しておいて、式4の目的関数に適用するようにしても良い。或いは、40歳代の個人を積極的に保健指導に参加させたいという条件自体を保険者の希望条件14Cとして記憶部14に記憶しておいて、その条件から上記の正規化グラフラプラシアンL’を生成して式4の目的関数に適用するようにしても良い。
 因みに、図4の正規化グラフラプラシアンを使用した場合、上記4式の右辺の第三項は次式と等価である。
-(α/2){(W^{T}X_1 - W^{T}X_2)^2 + (W^{T}X_3)^2}   …(5)
上記4式の目的関数を最大化するためには、保険者の希望する条件を満たさない個人3に係る(W^{T}X_3)^2の値が小さくなるようにW*を学習する必要がある。また、保険者の希望する条件を満足する個人1,2については、それら個人間でW^{T}Xの値が等しくなるようにW*を学習する必要がある。
 W*は、M次元ベクトルであるが、M次元ベクトルの各要素の内、非ゼロの要素の値とその要素に対応する健康診断項目をセットで、選定条件14Eとして記憶部14に保存する。つまり、(W*_j ,健康診断項目j){j|W*_j ≠0}を選定条件14Eとして記憶部14に保存する。
 上記式4で与えられる目的関数を最大化するW*の値と対応する健康診断項目の例を図5に示す。図5に示す例は、腹囲、BMI、血糖、脂質、飲酒しない、という5つの健康診断項目を説明変数とする式4による目的関数について、それを最大化する各説明変数の係数の値を求めた結果である。図5を参照すると、図3と相違し、BMIと血糖値の係数の値が0になっている。
 図6は、図5から非ゼロの要素に対応する健康診断項目と当該健康診断項目に対応する係数の値とを抽出して生成した選定条件14Eの一例を示す。図6を参照すると、図3と相違し、選定条件の条件項目数が5項目から3項目に削減されている。なお、図6の例では、係数の値はスコアとして扱っている。
 さらに、上記1式においてP(Y=1|X;W)=THになるときの、W^{T}Xの値を、『次年度に所定の基準に該当』か、或いは『次年度に所定の基準に非該当』かを決める判定しきい値として算出し、選定条件14Eの一部として記憶部14に保存する。THは例えば0.5であるが、他の値であってもよい。
 条件作成部15Cは、上述のようにして生成した選定条件14Eを構成する、(W*_j ,健康診断項目j){j|W*_j ≠0}の条件と、判定しきい値とを、画面表示部13に出力し、或いは通信I/F部11から外部に出力する。
 このように本実施形態によれば、保険者は、次期間に保健指導基準に該当する見込みがあるかないかの観点から保健指導対象者を選定する条件を作成することが可能になる。その理由は、健康診断データの複数の健康診断項目を複数の説明変数とし、この説明変数とこの説明変数毎の係数とから構成される多項式で表現され、個人が基準年度の次年度の健康診断データで保健指導基準に該当するか否かを判別するための判別モデル14Dを、基準年度の健康診断データ14Aと各個人が基準年度の次年度の健康診断データで保健指導基準に該当したか否かを表すフラグ14Bとを用いて学習し、学習後の判別モデル14Dにおける複数の説明変数としての複数の健康診断項目と係数の値との組み合わせを選定条件14Eとして生成するためである。
 また本実施形態によれば、選定条件としての健康診断項目の数を削減することが可能になる。その理由は、判別モデル14Dの学習では、値が0でない係数の個数に依存する罰則項を有する式4による目的関数を最適化するように判別モデル14Dの係数の値を学習するためである。
 また本実施形態によれば、保険者が希望する条件に沿うような選定条件を生成することが可能になる。その理由は、判別モデル14Dの学習では、保険者の希望する条件を満たさない個人が保健指導基準に該当することに依存する罰則項を有する式4による目的関数を最適化するように判別モデル14Dの係数の値を学習するためである。
 また本実施形態によれば、個人が次年度に所定の基準に該当するか否かを判定するためのしきい値を、選定条件14Eの一部として生成することができる。その理由は、上記1式においてP(Y=1|X;W)=THになるときの、W^{T}Xの値を算出して、選定条件14Eの一部として記憶部14に保存するためである。
[第2の実施形態]
 図7を参照すると、本発明の第2の実施形態にかかる保健指導対象者選定条件作成支援装置2は、保健指導基準に該当する見込みがあるかないかの観点から保健指導対象者を選定する条件を作成する機能と、作成された選定条件に従って保健指導対象者を選定する機能とを有している。
 保健指導対象者選定条件作成支援装置2は、ハードウェアとして、通信インターフェース部(通信I/F部)21、操作入力部22、画面表示部23、記憶部24、およびプロセッサ25を有する。
 通信I/F部21、操作入力部22、および画面表示部23は、第1の実施形態における通信I/F部11、操作入力部12、および画面表示部13と同様の機能を有している。
 記憶部24は、ハードディスクや半導体メモリなどの記憶装置からなり、プロセッサ25での各種処理に必要な処理情報やプログラム24Pを記憶する機能を有している。プログラム24Pは、プロセッサ25に読み込まれて実行されることにより各種処理部を実現するプログラムであり、通信I/F部21などのデータ入出力機能を介して外部装置(図示せず)やコンピュータ読取可能な記憶媒体(図示せず)から予め読み込まれて記憶部24に保存される。記憶部24に記憶される主な処理情報として、健康診断データ24Aと、フラグ24Bと、保険者の希望条件24Cと、判別モデル24Dと、選定条件24Eと、選定用の健康診断データ24Fと、選定者24Gとがある。
 健康診断データ24A、フラグ24B、保険者の希望条件24C、判別モデル24D、および選定条件24Eは、第1の実施形態における健康診断データ14A、フラグ14B、保険者の希望条件14C、判別モデル14D、および選定条件14Eと同じである。
 選定用の健康診断データ24Fは、保健指導者を選定する年度(以下、選定年度と記す)における個人の健康診断データである。健康診断データ24Fは、個人別に分けられている。1個人の当該年度分の健康診断データは、基準年の健康診断データ24Aと同じ項目を有する。すなわち、1個人の健康診断データ24Fは、その個人を一意に識別する個人ID、受診年度、受診年齢、性別等の個人情報と、身長、体重、腹囲、最低血圧、最高血圧、血糖値、中性脂肪などの各種検査値と、「飲酒量が1日あたり500ml以上」に該当するか否か等の各種問診結果とを有している。なお、選定用の健康診断データ24Fは、所定の保健指導基準に該当しない個人の健康診断データのみで構成されていても良いし、所定の保健指導基準に該当する個人および該当しない個人の健康診断データが混在していても良い。
 選定者24Gは、保健指導対象者として選定された個人を特定する情報、例えば個人IDのリストである。
 プロセッサ25は、CPUなどのマイクロプロセッサとその周辺回路を有し、記憶部24からプログラム24Pを読み込んで実行することにより、上記ハードウェアとプログラム24Pとを協働させて各種処理部を実現する機能を有している。プロセッサ25で実現される主な処理部として、入力部25A、判別モデル学習部25B、条件作成部25C、および保健指導対象者選定部25Dがある。
 入力部25A、判別モデル学習部25B、および条件作成部25Cは、第1の実施形態における入力部15A、判別モデル学習部15B、および条件作成部15Cと同様の機能を有する。
 保健指導対象者選定部25Dは、選定条件24Eと選定用の健康診断データ24Fを記憶部24から読み込み、健康診断データ24Fから、選定条件24Eに適合する健康診断データを有する個人を保健指導対象者として決定し、選定者24Gとして記憶部24に記憶する機能を有する。また、保健指導対象者選定部25Dは、記憶部24から選定者24Gを読み込み、画面表示部23に出力し、あるいは通信I/F部21を通じて外部に出力する機能を有する。
 次に、図8を参照して、本実施形態にかかる保健指導対象者選定支援装置2の動作について説明する。
 まず入力部25Aは、健康診断データ24A、フラグ24B、保険者の希望条件24C、学習前の判別モデル24D、選定用の健康診断データ24Fを、通信I/F部21または操作入力部22から入力し、記憶部24に格納する(ステップS11)。
 次に、判別モデル学習部25Bは、記憶部24から健康診断データ24A、フラグ24B、保険者の希望条件24C、および学習前の判別モデル24Dを読み出し、健康診断データ24A、フラグ24B、および保険者の希望条件24Cを用いて、第1の実施形態における判別モデル学習部15Bと同様に、判別モデル24Dを学習する(ステップS12)。学習後の判別モデル24Dは、記憶部24に保存される。
 次に、条件作成部25Cは、記憶部24から学習後の判別モデル24Dを読み出し、第1の実施形態における条件作成部15Cと同様に、学習後の判別モデル24Dの複数の説明変数のうち、その係数の値が0以外の健康診断項目とその係数値との組み合わせ、および判定しきい値を、選定条件24Eとして作成して記憶部24に保存し、また、画面表示部23に出力し、あるいは通信I/F部21を通じて外部に出力する(ステップS13)。
 次に、保健指導対象者選定部25Dは、選定条件24Eと選定用の健康診断データ24Fを記憶部24から読み込み、健康診断データ24Fから、選定条件24Eに適合する健康診断データを有する個人を保健指導対象者として決定し、選定者24Gとして記憶部24に記憶すると共に、画面表示部23に出力し、あるいは通信I/F部21を通じて外部に出力する(ステップS14)。
 より具体的には、保健指導対象者選定部25Dは、選定用の健康診断データ24Fに含まれる各個人の健康診断データ毎に、選定条件24E中の各健康診断項目のうちの該当する項目に対するスコアの総和を計算する。例えば、選定条件24Eが図7に示すものであり、或る個人が、「腹囲」と「脂質」の項目に該当し、「飲酒しない」の項目に該当しないならば、3+3=6を当該個人のスコアとする。そして、保健指導対象者選定部25Dは、個人の上記スコアを選定条件24中の判定しきい値と比較し、個人のスコア>判定しきい値であれば、当該個人を保健指導対象者に選定する。
 このように本実施形態によれば、第1の実施形態と同様の効果が得られると共に、次年度に保健指導基準に該当する見込みがあるかないかの観点から保健指導対象者を選定することが可能になる。
[その他の実施形態]
 以上、本発明を幾つかの実施形態を挙げて説明したが、本発明は以上の実施形態のみに限定されず、その他各種の付加変更が可能である。例えば、以下のような実施形態も本発明に含まれる。
 前述した実施形態では、保険者の希望条件に沿うような保健指導対象者の選定条件を生成したが、保険者の希望条件を考慮せずに選定条件を生成するようにしてもよい。この場合、上記4式における右辺の第三項を省略した目的関数を使用すれば良い。
 前述した実施形態では、選定条件としての健康診断項目の数が極力少なくなるようにしたが、その必要性がない場合には、上記4式における右辺の第二項を省略した目的関数を使用すれば良い。
 前述した第2の実施形態では、判定しきい値を算出し、判定しきい値以上のスコアを有する個人を保健指導対象者に選定したが、判定しきい値を使用せずに保健指導対象者を選定するようにしても良い。例えば、上記1式を用いて各個人毎に次年度に保健指導対象者に該当する確率を計算し、その確率の上位N人を保健指導対象者に選定しても良い。
 なお、本発明は、日本国にて2012年4月26日に特許出願された特願2012-100937の特許出願に基づく優先権主張の利益を享受するものであり、当該特許出願に記載された内容は、全て本明細書に含まれるものとする。
1、2…保健指導対象者選定条件作成支援装置
11、21…通信I/F部
12、22…操作入力部
13、23…画面表示部
14、24…記憶部
15、25…プロセッサ

Claims (9)

  1.  第1の期間における個人の健康診断データである第1の健康診断データと、前記個人が前記第1の期間の次の期間である第2の期間の健康診断データで予め定められた保健指導基準に該当したか否かを表すラベル値とを記憶するメモリと、前記メモリに接続されたプロセッサとを備え、
     前記プロセッサは、
     前記健康診断データの複数の健康診断項目を複数の説明変数とし、前記説明変数と前記説明変数毎の係数とから構成される多項式で表現され、前記個人が前記第2の期間の健康診断データで前記保健指導基準に該当するか否かを判別するための判別モデルを、前記第1の健康診断データと前記ラベル値とを用いて学習し、
     前記学習後の前記判別モデルにおける前記複数の説明変数としての前記複数の健康診断項目と前記係数の値との組み合わせを保健指導対象者選定条件として生成する
    ようにプログラムされている保健指導対象者選定条件作成支援装置。
  2.  前記プロセッサは、
     前記判別モデルの学習では、前記判別モデルの尤度を表す項と、値が0でない前記係数の個数に依存する罰則項とを有する目的関数を最適化するように前記判別モデルの前記係数の値を学習する
    請求項1に記載の保健指導対象者選定条件作成支援装置。
  3.  前記メモリは、さらに、保険者の希望する条件を記憶し、
     前記プロセッサは、
     前記判別モデルの学習では、前記判別モデルの尤度を表す項と、値が0でない前記係数の個数に依存する罰則項と、前記保険者の希望する条件を満たさない前記個人が前記保健指導基準に該当することに依存する罰則項とを有する目的関数を最適化するように前記判別モデルの前記係数の値を学習する
    請求項1に記載の保健指導対象者選定条件作成支援装置。
  4.  前記プロセッサは、
     前記保健指導対象者選定条件の生成では、前記学習後の判別モデルにおける前記複数の係数のうち、値が0でない係数と当該係数に対応する説明変数としての前記健康診断項目との組み合わせを、前記保健指導対象者選定条件として生成する
    請求項2または3に記載の保健指導対象者選定条件作成支援装置。
  5.  前記プロセッサは、
     前記保健指導対象者選定条件の生成では、前記学習後の判別モデルにおける前記複数の係数のうち、値が0でない係数と当該係数に対応する説明変数としての前記健康診断項目との組み合わせと、前記学習後の判別モデルにおいて前記個人が前記第2の期間の健康診断データで前記保健指導基準に該当する確率が所定値以上であると判定できる、前記組み合わせに含まれる前記係数の値の合計値の最小値である判定しきい値とを、前記保健指導対象者選定条件として生成する
    請求項2または3に記載の保健指導対象者選定条件作成支援装置。
  6.  前記メモリは、さらに、保健指導対象者候補である個人の健康診断データである第2の健康診断データを記憶し、
     前記プロセッサは、さらに、
     前記第2の健康診断データから、前記保健指導対象者選定条件に適合する前記個人を決定する
    請求項1乃至5に記載の保健指導対象者選定条件作成支援装置。
  7.  前記メモリは、さらに、保健指導対象者候補である個人の健康診断データである第2の健康診断データを記憶し、
     前記プロセッサは、さらに、
     前記第2の健康診断データから、前記保健指導対象者選定条件に適合する前記個人を決定し、前記保健指導対象者選定条件に適合する前記個人の決定では、前記個人の前記第2の健康診断データ毎に、前記保健指導対象者選定条件中の前記健康診断項目のうちの該当する項目に対するスコアの総和を計算して前記判定しきい値と比較する
    請求項5に記載の保健指導対象者選定条件作成支援装置。
  8.  第1の期間における個人の健康診断データである第1の健康診断データと、前記個人が前記第1の期間の次の期間である第2の期間の健康診断データで予め定められた保健指導基準に該当したか否かを表すラベル値とを記憶するメモリと、前記メモリに接続されたプロセッサとを備えた装置が実行する保健指導対象者選定条件作成支援方法であって、
     前記プロセッサが、
     前記健康診断データの複数の健康診断項目を複数の説明変数とし、前記説明変数と前記説明変数毎の係数とから構成される多項式で表現され、前記個人が前記第2の期間の健康診断データで前記保健指導基準に該当するか否かを判別するための判別モデルを、前記第1の健康診断データと前記ラベル値とを用いて学習し、
     前記学習後の前記判別モデルにおける前記複数の説明変数としての前記複数の健康診断項目と前記係数の値との組み合わせを保健指導対象者選定条件として生成する
    保健指導対象者選定条件作成支援方法。
  9.  第1の期間における個人の健康診断データである第1の健康診断データと、前記個人が前記第1の期間の次の期間である第2の期間の健康診断データで予め定められた保健指導基準に該当したか否かを表すラベル値とを記憶するメモリに接続されたプロセッサに、
     前記健康診断データの複数の健康診断項目を複数の説明変数とし、前記説明変数と前記説明変数毎の係数とから構成される多項式で表現され、前記個人が前記第2の期間の健康診断データで前記保健指導基準に該当するか否かを判別するための判別モデルを、前記第1の健康診断データと前記ラベル値とを用いて学習するステップと、
     前記学習後の前記判別モデルにおける前記複数の説明変数としての前記複数の健康診断項目と前記係数の値との組み合わせを保健指導対象者選定条件として生成するステップと、
    を行わせるためのプログラム。
PCT/JP2013/002301 2012-04-26 2013-04-03 保健指導対象者選定条件作成支援装置 WO2013161191A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US14/002,550 US20150074019A1 (en) 2012-04-26 2013-04-03 Health guidance receiver selection condition generation support device
SG11201406704RA SG11201406704RA (en) 2012-04-26 2013-04-03 Health guidance receiver selection condition generation support device
JP2013534517A JP5392444B1 (ja) 2012-04-26 2013-04-03 保健指導対象者選定条件作成支援装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012100937 2012-04-26
JP2012-100937 2012-04-26

Publications (1)

Publication Number Publication Date
WO2013161191A1 true WO2013161191A1 (ja) 2013-10-31

Family

ID=49482546

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/002301 WO2013161191A1 (ja) 2012-04-26 2013-04-03 保健指導対象者選定条件作成支援装置

Country Status (4)

Country Link
US (1) US20150074019A1 (ja)
JP (1) JP5392444B1 (ja)
SG (1) SG11201406704RA (ja)
WO (1) WO2013161191A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105808906A (zh) * 2014-10-27 2016-07-27 三星Sds株式会社 患者个人特性的分析方法及其装置
JP2016218966A (ja) * 2015-05-26 2016-12-22 株式会社日立製作所 分析システム、及び、分析方法
JP2017117469A (ja) * 2015-12-22 2017-06-29 国立研究開発法人理化学研究所 リスク評価方法、リスク評価装置及びリスク評価プログラム
JP2020071562A (ja) * 2018-10-30 2020-05-07 株式会社キャンサースキャン 健康診断受診確率計算方法及び健診勧奨通知支援システム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102037573B1 (ko) * 2017-03-09 2019-10-29 주식회사 파트너스앤코 문진 데이터 및 카메라 데이터에 기반한 진단용 데이터 처리 장치 및 그 시스템
JP7140410B2 (ja) * 2018-03-30 2022-09-21 Necソリューションイノベータ株式会社 予測システム、予測方法および予測プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006301893A (ja) * 2005-04-20 2006-11-02 Hitachi Ltd 保健事業支援システム
JP2007257565A (ja) * 2006-03-27 2007-10-04 Hitachi Ltd 保健事業支援システム
JP2009151404A (ja) * 2007-12-19 2009-07-09 Hitachi Ltd 保健指導対象者選定支援システム
JP2009151423A (ja) * 2007-12-19 2009-07-09 Katsuzo Kawanishi 保健指導支援装置
JP2011065579A (ja) * 2009-09-18 2011-03-31 Nec Corp 標準パタン学習装置、ラベル付与基準算出装置、標準パタン学習方法およびプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002063279A (ja) * 2000-08-23 2002-02-28 Nec Corp 健康管理のためのシステム及び方法並びに健康管理用プログラムを記憶した記憶媒体
JP4062910B2 (ja) * 2001-11-29 2008-03-19 株式会社日立製作所 健康管理支援方法及び装置と健康余命予測データ生成方法及び装置
JP4470679B2 (ja) * 2004-10-07 2010-06-02 株式会社日立製作所 健康指導支援システム
US20070259377A1 (en) * 2005-10-11 2007-11-08 Mickey Urdea Diabetes-associated markers and methods of use thereof
AU2007308078A1 (en) * 2006-10-13 2008-04-17 PeraHealth, Inc System and method for providing a health score for a patient
WO2009001862A1 (ja) * 2007-06-25 2008-12-31 Ajinomoto Co., Inc. 内臓脂肪蓄積の評価方法
WO2010048282A1 (en) * 2008-10-21 2010-04-29 Rothman Healthcare Research, Llc Methods of assessing risk based on medical data and uses thereof
US8346688B2 (en) * 2009-11-25 2013-01-01 International Business Machines Corporation Predicting states of subjects

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006301893A (ja) * 2005-04-20 2006-11-02 Hitachi Ltd 保健事業支援システム
JP2007257565A (ja) * 2006-03-27 2007-10-04 Hitachi Ltd 保健事業支援システム
JP2009151404A (ja) * 2007-12-19 2009-07-09 Hitachi Ltd 保健指導対象者選定支援システム
JP2009151423A (ja) * 2007-12-19 2009-07-09 Katsuzo Kawanishi 保健指導支援装置
JP2011065579A (ja) * 2009-09-18 2011-03-31 Nec Corp 標準パタン学習装置、ラベル付与基準算出装置、標準パタン学習方法およびプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105808906A (zh) * 2014-10-27 2016-07-27 三星Sds株式会社 患者个人特性的分析方法及其装置
JP2016218966A (ja) * 2015-05-26 2016-12-22 株式会社日立製作所 分析システム、及び、分析方法
JP2017117469A (ja) * 2015-12-22 2017-06-29 国立研究開発法人理化学研究所 リスク評価方法、リスク評価装置及びリスク評価プログラム
JP2020071562A (ja) * 2018-10-30 2020-05-07 株式会社キャンサースキャン 健康診断受診確率計算方法及び健診勧奨通知支援システム

Also Published As

Publication number Publication date
JPWO2013161191A1 (ja) 2015-12-21
SG11201406704RA (en) 2014-11-27
US20150074019A1 (en) 2015-03-12
JP5392444B1 (ja) 2014-01-22

Similar Documents

Publication Publication Date Title
Cutler et al. Physician beliefs and patient preferences: a new look at regional variation in health care spending
Swaminathan et al. A machine learning approach to triaging patients with chronic obstructive pulmonary disease
KR101855117B1 (ko) 질병에 대한 발병 확률 예측 방법 및 장치
JP5392444B1 (ja) 保健指導対象者選定条件作成支援装置
Chao et al. Principal component-based weighted indices and a framework to evaluate indices: Results from the Medical Expenditure Panel Survey 1996 to 2011
Laacke et al. Artificial intelligence, social media and depression. A new concept of health-related digital autonomy
Hamilton et al. Designed to fit: The development and validation of the STRONG-R recidivism risk assessment
Robinson et al. Participants and study decliners’ perspectives about the risks of participating in a clinical trial of whole genome sequencing
KR101885111B1 (ko) 질환 발병 예측 방법 및 장치
Wilson et al. Literacy, cognitive ability, and the retention of health-related information about colorectal cancer screening
Dalakleidi et al. Comparative assessment of statistical and machine learning techniques towards estimating the risk of developing type 2 diabetes and cardiovascular complications
Campbell et al. Statistical innovations in the medical device world sparked by the FDA
Klest et al. Trauma, socioeconomic resources, and self-rated health in an ethnically diverse adult cohort
Barbeira et al. Widespread dose-dependent effects of RNA expression and splicing on complex diseases and traits
Chan et al. Harmonizing measures of cognitive performance across international surveys of aging using item response theory
Choudhury et al. Evaluating patient readmission risk: a predictive analytics approach
Davis et al. Addressing geographic confounding through spatial propensity scores: a study of racial disparities in diabetes
Chapman et al. Health risk prediction models incorporating personality data: Motivation, challenges, and illustration.
Roberts et al. Genetic duties
Whiteman et al. Transforming mental health services to address gender disparities in depression risk factors
Salmina Social attitudes towards welfare policies in Russia and other European countries
Pirracchio et al. Collaborative targeted maximum likelihood estimation for variable importance measure: Illustration for functional outcome prediction in mild traumatic brain injuries
Kundi et al. Artificial Intelligence and Bias: A scoping review
Hans et al. Boosting distributional copula regression
Usmani et al. Artificial Intelligence Applications in Healthcare

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2013534517

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 14002550

Country of ref document: US

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13781005

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13781005

Country of ref document: EP

Kind code of ref document: A1