WO2022249480A1 - ソフトウェア、データ処理装置及びデータ処理方法 - Google Patents
ソフトウェア、データ処理装置及びデータ処理方法 Download PDFInfo
- Publication number
- WO2022249480A1 WO2022249480A1 PCT/JP2021/020525 JP2021020525W WO2022249480A1 WO 2022249480 A1 WO2022249480 A1 WO 2022249480A1 JP 2021020525 W JP2021020525 W JP 2021020525W WO 2022249480 A1 WO2022249480 A1 WO 2022249480A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- data
- information
- event
- individual
- date
- Prior art date
Links
- 238000012545 processing Methods 0.000 title claims description 23
- 238000003672 processing method Methods 0.000 title claims description 19
- 238000005259 measurement Methods 0.000 claims description 269
- 230000036760 body temperature Effects 0.000 claims description 75
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 56
- 201000010099 disease Diseases 0.000 claims description 55
- 238000001422 normality test Methods 0.000 claims description 33
- 238000013075 data extraction Methods 0.000 claims description 29
- 208000024891 symptom Diseases 0.000 claims description 19
- 239000000284 extract Substances 0.000 claims description 16
- 230000010365 information processing Effects 0.000 claims description 13
- 230000035485 pulse pressure Effects 0.000 claims description 11
- 230000036387 respiratory rate Effects 0.000 claims description 9
- 230000036772 blood pressure Effects 0.000 claims description 4
- 238000012360 testing method Methods 0.000 description 59
- 238000004458 analytical method Methods 0.000 description 54
- 238000000605 extraction Methods 0.000 description 31
- 238000000034 method Methods 0.000 description 19
- 238000007405 data analysis Methods 0.000 description 17
- 238000004364 calculation method Methods 0.000 description 15
- 208000025721 COVID-19 Diseases 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 10
- 230000035487 diastolic blood pressure Effects 0.000 description 10
- 230000035488 systolic blood pressure Effects 0.000 description 10
- 230000002159 abnormal effect Effects 0.000 description 9
- 206010037660 Pyrexia Diseases 0.000 description 8
- 206010020843 Hyperthermia Diseases 0.000 description 7
- 238000011869 Shapiro-Wilk test Methods 0.000 description 7
- 238000013480 data collection Methods 0.000 description 7
- 206010012601 diabetes mellitus Diseases 0.000 description 7
- 238000003745 diagnosis Methods 0.000 description 7
- 230000036031 hyperthermia Effects 0.000 description 7
- 238000001276 Kolmogorov–Smirnov test Methods 0.000 description 5
- 238000001430 Omnibus test Methods 0.000 description 5
- 238000007418 data mining Methods 0.000 description 5
- 238000009528 vital sign measurement Methods 0.000 description 5
- 206010019280 Heart failures Diseases 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 206010020772 Hypertension Diseases 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 231100000517 death Toxicity 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 206010022000 influenza Diseases 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 230000000474 nursing effect Effects 0.000 description 2
- 238000002640 oxygen therapy Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000029058 respiratory gaseous exchange Effects 0.000 description 2
- 230000008961 swelling Effects 0.000 description 2
- 238000010998 test method Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 206010003210 Arteriosclerosis Diseases 0.000 description 1
- 241000711573 Coronaviridae Species 0.000 description 1
- 206010011224 Cough Diseases 0.000 description 1
- 206010011703 Cyanosis Diseases 0.000 description 1
- 206010016326 Feeling cold Diseases 0.000 description 1
- 206010019233 Headaches Diseases 0.000 description 1
- 208000004044 Hypesthesia Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 206010028813 Nausea Diseases 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 206010030113 Oedema Diseases 0.000 description 1
- 208000002193 Pain Diseases 0.000 description 1
- 206010033557 Palpitations Diseases 0.000 description 1
- 206010033799 Paralysis Diseases 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 208000004756 Respiratory Insufficiency Diseases 0.000 description 1
- 208000025371 Taste disease Diseases 0.000 description 1
- 206010044565 Tremor Diseases 0.000 description 1
- 206010047700 Vomiting Diseases 0.000 description 1
- 208000011775 arteriosclerosis disease Diseases 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000009534 blood test Methods 0.000 description 1
- 238000009529 body temperature measurement Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 208000002173 dizziness Diseases 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000005713 exacerbation Effects 0.000 description 1
- 230000005281 excited state Effects 0.000 description 1
- 231100000869 headache Toxicity 0.000 description 1
- 208000034783 hypoesthesia Diseases 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 206010025482 malaise Diseases 0.000 description 1
- 230000008693 nausea Effects 0.000 description 1
- 231100000862 numbness Toxicity 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 201000004193 respiratory failure Diseases 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 235000019669 taste disorders Nutrition 0.000 description 1
- 230000008673 vomiting Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Definitions
- the present invention relates to software, a data processing device and a data processing method. Specifically, based on the Gaussian-distributed vital sign measurement data obtained from the subject, a high-quality dataset with high credibility as a data analysis target is selected from a collection of data with unknown accuracy or disparate data obtained from multiple individuals.
- the present invention relates to software, a data processing device, and a data processing method that enable easy data mining of data.
- vital signs and other data obtained from individuals may be acquired under various conditions.
- the following viewpoints are necessary as measurement biases and erroneous inputs.
- Operator bias Accuracy of measured data affected by the skill of the operator performing the measurement.
- Instrument bias Accuracy of measurement data affected by the type and measurement precision of instruments or methods that measure the same parameter.
- Bias of measurement state Accuracy of measurement data affected by measurement state such as measurement in an unstable individual state such as excited state or tense state, or the individual's posture at the time of measurement.
- Bias in the measurement environment Depending on the condition of the individual and the environment in which it is placed, the measured value may temporarily deviate from the normal state.
- the normality is tested for the group data that summarizes the data for all the people acquired, without distinguishing individual data. It is judged to be valid when indicated. That is, for example, the average body temperature data of 10,000 people are collected, and whether or not the group data of 10,000 people show normality is confirmed to determine the effectiveness.
- the inventor of the present invention focused on the difference between the distribution of vital signs of a group seen in many documents and the distribution of vital signs of individuals not found in the documents, and the former is "more than 3,000 healthy men and women between the ages of 10 and 50.
- the average body temperature of 36.8°C ⁇ 0.3°C” (see Fig. 11).
- Distribution) is the distribution of individual body temperature, blood pressure, and pulse chronological vital data. has confirmed that the measured data of has the property of following a Gaussian distribution, and has published a paper (see FIG. 12).
- the present inventors have found that the distribution of general individual vital signs shows the property that the distribution when data is acquired for a long period follows a Gaussian distribution, but the measurement is performed once a day for a month. In a predetermined number of times, it is confirmed that there are individual vital data indicating normality and individual vital data not indicating normality. This is thought to be caused by measurement bias or input errors, except when the Gaussian distribution is not followed due to a specific disease (also mentioned in Patent Documents 1, 2 and 3).
- the purpose prior to the purpose, for example, data is collected with a wearable terminal, etc., the purpose is decided at a later timing, and the collected data is classified, processed, and analyzed according to the purpose. It was practically difficult to make secondary use of the data for such purposes.
- the present invention has been invented in view of the above points, and based on the measurement data of vital signs according to the Gaussian distribution obtained from the subject, a collection of data with unknown accuracy or disjointed obtained from a plurality of individuals It is an object of the present invention to provide software, a data processing device, and a data processing method that enable easy data mining of only quality data sets with high reliability as data analysis targets.
- the software of the present invention comprises individual-derived data including individual identification information, predetermined measurement data that is measured from an individual, is a single type of data, and has the property of following a Gaussian distribution, and software for collecting event data, which is information about an event that occurred in an individual, from a plurality of individuals and extracting group data containing information on a specific event from the aggregate of the collected data, , the information processing device containing the individual-derived data, the predetermined measurement data measured from the same individual and information on the date and time of measurement, information on the content of an event that occurred in the same individual, and information on the date of occurrence of the event.
- event data which is information about an event that occurred in an individual, from a plurality of individuals and extracting group data containing information on a specific event from the aggregate of the collected data
- the information processing device containing the individual-derived data, the predetermined measurement data measured from the same individual and information on the date and time of measurement, information on the content of an event that occurred in the same individual, and information on the date of occurrence
- information input means for receiving input of the event data; information recording means for recording the input predetermined measurement data and measurement date and time information and the event data in association with the identification information; and the information recording means.
- the predetermined measurement data measured in a predetermined period based on the date of occurrence of the recorded event is extracted as reference-related measurement data, and the event A linked data set generating means for generating an event linked data set by combining the event data related to and the reference related measurement data, and recording the data in the information recording means; of the group, including information on the content of the specific event from among the data collection of the data derived from the individual, the predetermined measurement data and measurement date and time information, and the data of the event-linked data set; and collective data extracting means for extracting specific event collective data, which is data.
- software means a program related to computer operations.
- a program is defined as an ordered sequence of instructions suitable for processing by a computer.
- the information input means can acquire the identification information of the individual from which the measurement data and the event data are derived by receiving the input of the individual-derived data including the identification information of the individual. This makes it possible to identify individuals from which measurement data and event data are derived when using the collected population data.
- the information input means receives predetermined measurement data that is measured from the same individual, is a single type of data, and has the property of following a Gaussian distribution, and receives input of information on the date and time of measurement, thereby inputting the predetermined measurement data individually. individuals, resulting in aggregated data from multiple individuals.
- (predetermined measurement data) has the property of following a Gaussian distribution
- the distribution of data derived from the same individual follows a Gaussian distribution, not the distribution of well-known general population data. do.
- it is a single type of data obtained from the same individual, and means that the distribution of the data exhibits normality when a certain number of data are collected.
- the "property following Gaussian distribution” includes measured values that have a valid reason not to show normality, that is, (1) measured values when an individual has a specific disease (e.g., hyperthermia due to influenza), ( 2) The distribution of data has the property of not showing normality when measurement values are included with measurement bias.
- the "individual” here refers to a single organism (human or animal). In addition, the same individual refers to the same person, for example, in the case of humans.
- the "predetermined measurement data measured from the same individual” here means that it is possible to distinguish between individuals at the stage of input by the information input means. For example, when one subject inputs his or her own predetermined measurement data, or when handling information on a plurality of subjects, a specific personal input screen is displayed and predetermined measurement data is input. It is conceivable to distinguish between individuals by varying the input format, such as the manner in which each individual inputs predetermined measurement data from their own smartphone terminal or the like via dedicated application software.
- single type of data means, for example, in the case of measurement data related to body temperature, only body temperature data measured from the same individual, and multiple measurements related to body temperature from the same individual. Taking the data will show that it follows a Gaussian distribution.
- the information input means acquires the identification information as well as the information of the event occurring in the individual by receiving input of event data including information on the content of the event occurring in the same individual and information on the date of occurrence of the event. be able to. As a result, when using the collected group data, it becomes possible to classify and process the group data according to the information on the event content and the information on the date of occurrence of the event.
- the information input means receives the input of the individual-derived data, the predetermined measurement data measured from the same individual, the measurement date and time information, and the event data
- the information recording means receives the input predetermined measurement data and the measurement data.
- the linked data set generation means records predetermined measurement data of the same individual measured in a predetermined period based on the date of occurrence of the recorded event as a reference. By extracting related measurement data, it becomes possible to extract, as reference related measurement data, a group of data related to event data from all data recorded in association with the same individual.
- the linked data set generation means records predetermined measurement data for the same individual measured during a predetermined period based on the date of occurrence of the recorded event.
- the event data related to the event and the reference-related measurement data are combined to generate an event-linked data set, which is recorded in the information recording means to obtain the details of the event that occurred in the same individual. Then, the data group related to the event data can be stored as one data set.
- the group data extraction means collects the aggregate data of the individual-derived data, the predetermined measurement data and measurement date and time information, and the event-linked data set for the plurality of individuals recorded in the information recording means.
- specific event group data which is group data that includes specific event content information
- part of the data is extracted from the entire data collection based on the specific event content information. It is possible to extract and use the data for analysis. That is, for example, an event-linked data set having information on specific event contents is extracted, and this event-linked data set derived from a plurality of individuals and reference-related measurements measured from a certain individual to be judged. It becomes possible to perform comparison and analysis with data.
- the "collection of data” that is the extraction source here means, for example, not only all recorded data, but also age, gender, or various information that constitutes event data, etc., as extraction conditions, in advance
- the range of data may be a collection of data that is primarily extracted.
- the group data extraction means performs a predetermined normality test on the reference-related measurement data, and determines the reference-related measurement data having a P value of P ⁇ 0.01 or P ⁇ 0.05 as quality data. In this case, it is possible to confirm whether or not a data group related to a specific event content derived from one individual exhibits normality. That is, individual reference-related measurement data collected from a plurality of individuals are each classified into a data group showing normality and a data group not showing normality, and quality data with maintained quality and garbage data. can be handled separately.
- the "predetermined normality test” used herein may be, for example, the Kolmogorov-Smirnov test, the Lillifors test, the Shapiro-Wilk test, the Dagostino test, the Omnibus test, and their P-values.
- the group data extraction means performs a predetermined normality test on the reference-related measurement data, and determines the reference-related measurement data having a P value of P ⁇ 0.01 or P ⁇ 0.05 as quality data.
- specific event group data consisting only of individuals with quality data and including specific event content information, based on the specific event content information, from the entire data aggregate It is possible to extract data of a population composed only of data derived from individuals whose reference-related measurement data is quality data whose quality is maintained, and to use the data for analysis.
- the predetermined period related to the reference-related measurement data includes a first period that is a certain period preceding the period of influence of the event and retroactive to the period of influence
- the content of the event occurring in the individual is Reference-related measurement data can be obtained from predetermined measurement data measured from the individual during a period of time when the effect is considered low. That is, for example, if the information of the content of the event is a medical examination at a medical institution, the event occurs after the individual's physical condition is abnormal or some kind of symptom is observed.
- the first period which is a certain period retroactively from the influence period in which the event influences, the predetermined measurement data during the same period is not affected by the occurrence of abnormal physical condition or symptoms.
- the impact is considered to be small.
- it is difficult to include measured values that have a valid reason not to show normality for example, hyperthermia due to influenza
- normality for example, hyperthermia due to influenza
- the reference-related measurement data is quality data.
- the first period is at least a period from about two months before the event occurrence date to about one month before the event occurrence date, and is a fixed period based on the event occurrence date.
- Reference-related measurement data will be acquired from the specified period. That is, for a plurality of individuals, it is possible to determine whether or not the data group is quality data for a group of measurement data during a period extracted under the same conditions.
- the period from about two months before the event occurrence date to about one month before the event occurrence date is a period that is close to the event occurrence date to some extent, but the effect of the event content on the individual is small. Therefore, the reference-related measurement data can be made more appropriate as a quality data determination target.
- the event content information includes at least information on the name and/or symptoms of the disease that the individual has developed, and information on disease-related events that have occurred in the individual
- Predetermined measurement data measured from individuals can be accumulated together with information on events that have occurred, and can be used for analysis and the like.
- the information on disease-related events referred to here includes, for example, consultation at a medical institution, hospitalization, diagnosis, onset of disease, death, discharge, transfer, transfer within a hospital, discharge from a facility, observation level Changes, admission to and exit from the intensive care unit (ICU), etc.
- ICU intensive care unit
- subdivided items such as medication, drip, oxygen therapy, follow-up, etc. can be adopted.
- the predetermined measurement data is a single type of data in vital information measured from an individual and is the value of at least one vital sign of body temperature, pulse, blood pressure, pulse pressure, or respiratory rate can accumulate values of various vital signs.
- various vital sign values can be stored together with information on the details of events occurring in individuals as an event-linked data set.
- the predetermined period related to the reference-related measurement data includes a second period of 7 days consisting of the date of occurrence of the event, 3 days before the date of occurrence, and 3 days after the date of occurrence is a group of data related to events, especially data that may be fluctuating depending on the content of the event, as reference-related measurement data, together with the content of the event, as a set of data can be accumulated.
- the predetermined measurement data is the value of vital signs
- the abnormal value of the vital signs that occurred in relation to the event will occur not at the time of the event (for example, at the time of hospitalization) but several days before the event. . Therefore, by extracting the measurement data in the second period, fluctuations and abnormal values in the measurement data related to the event can be captured and used for data analysis and the like.
- the individual-derived data includes at least one information of the individual's age, sex, or medical history
- the specific event group data extracted by the group data extraction means contains the individual's age, gender, or medical history. and information on predetermined measurement data and measurement date and time, and data in the event-linked data set, does not include information that identifies an individual (individual identification information)
- the specific event group data does not include information that identifies an individual (individual identification information)
- the extracted specific event group data can be analyzed and processed using at least one of the individual's age, sex, and medical history.
- Vital data measured from an individual is, in principle, information that requires the consent of the individual (personal information requiring special care) when using the data (data acquisition) in a form linked to the identification information of the individual. ), which cannot be easily used unless it is processed anonymously so that individuals cannot be identified.
- consent even if consent is obtained from the individual, if the purpose of use of the data is not clearly indicated, the consent itself will be invalidated. Therefore, when the specific event group data does not include individual identification information, it becomes easier to analyze vital data.
- the software of the present invention comprises individual identification information, individual-derived data including at least one of age, medical history, or gender information of the individual, and Predetermined measurement data, which is measured, is a single type of data, and has the property of following a Gaussian distribution, is collected from a plurality of individuals, and population data containing specific information is extracted from the collection of collected data.
- the information processing device comprises information input means for receiving input of the individual-derived data, the predetermined measurement data measured from the same individual and information on the date and time of measurement, and the input predetermined measurement Information recording means for recording data and information on the date and time of measurement in association with the identification information; simple reference-related measurement data generating means for extracting predetermined measurement data as simple reference-related measurement data and recording it in the information recording means; and the individual-derived data for a plurality of individuals recorded in the information recording means. and group data extracting means for extracting specific group data, which is group data including the specific information, from the group of the predetermined measurement data and measurement date and time information, and the simple reference-related measurement data. and is configured as software for functioning as a means including
- the information input means receives the input of individual-derived data including at least one of the identification information of the individual and the age, medical history, or gender information of the individual, thereby becoming the origin of the measurement data.
- identifying information, age, medical history, and/or gender information can be obtained for the individual.
- the information input means receives predetermined measurement data that is measured from the same individual, is a single type of data, and has the property of following a Gaussian distribution, and receives input of information on the date and time of measurement, thereby inputting the predetermined measurement data individually. individuals, resulting in aggregated data from multiple individuals.
- the simple reference-related measurement data generating means extracts, as simple reference-related measurement data, predetermined measurement data recorded in the information recording means for the same individual and measured during a predetermined period based on a predetermined reference date. By doing so, it is possible to extract, as simple reference-related measurement data, a group of data measured during a predetermined period based on a predetermined reference date from all the data recorded in association with the same individual. It becomes possible.
- the group data extracting means selects from the collection of the individual-derived data, the predetermined measurement data and information on the measurement date and time, and the simple reference-related measurement data for the plurality of individuals recorded in the information recording means ,
- specific group data which is group data that includes specific information
- the "collection of data” that is the extraction source here means, for example, not only all recorded data, but also age, gender, or some kind of information as extraction conditions, and the range of data is set in advance. It may be an aggregate of data that has been primarily extracted.
- the group data extraction means performs a predetermined normality test on the simple criterion-related measurement data, and the simple criterion-related measurement data showing a P value of P ⁇ 0.01 or P ⁇ 0.05 is regarded as quality data.
- the simple criterion-related measurement data showing a P value of P ⁇ 0.01 or P ⁇ 0.05 is regarded as quality data.
- the "predetermined normality test” used herein may be, for example, the Kolmogorov-Smirnov test, the Lillifors test, the Shapiro-Wilk test, the Dagostino test, the Omnibus test, and their P-values.
- the predetermined reference date is the date when the input of the predetermined measurement data and the measurement date and time information is started by the information input means, or an arbitrary designated date, and the predetermined period starts from the predetermined reference date. If the period is about one month, the date when the measurement data started to be input or any date specified by the user is used as the reference date, and the period is about one month in the past. Measurement data during the period can be extracted as simple reference-related measurement data. Alternatively, an arbitrary date specified by the user can be set as a reference date, and measurement data for a period of about one month after that date can be extracted as simple reference-related measurement data.
- the data processing apparatus of the present invention includes data derived from an individual including identification information of an individual, and predetermined and event data, which is information about events occurring in individuals, are collected from multiple individuals, and group data containing specific event information is extracted from the aggregated data collected.
- a data processing device that stores the individual-derived data, the predetermined measurement data measured from the same individual, information on the date and time of measurement, information on the content of an event that occurred in the same individual, and information on the date of occurrence of the event.
- information input means for receiving an input of the event data including the event data, information recording means for recording the input predetermined measurement data and measurement date and time information, and the event data in association with the identification information; After recording the event data, the recording means extracts, as reference-related measurement data, the predetermined measurement data measured in a predetermined period based on the date of occurrence of the recorded event for the same individual, and A linked data set generating means for generating an event linked data set by combining the event data related to the event and the reference-related measurement data and recording the data in the information recording means, and recorded in the information recording means, Information on the specific event content from among the individual-derived data, the predetermined measurement data and measurement date and time information, and the data collection of the event-linked data set for a plurality of individuals, and a group data extraction means for extracting specific event group data, which is group data.
- the data processing method of the present invention includes individual-derived data including individual identification information, and predetermined and event data, which is information on events that occurred in individuals, are collected from multiple individuals, and group data containing information on specific events is extracted from the aggregated data collected.
- a data processing method wherein the individual-derived data, the predetermined measurement data measured from the same individual and information on the date and time of measurement, information on the content of an event that occurred in the same individual, and information on the date of occurrence of the event an information input step of receiving input of the event data including the event data, an information recording step of recording the input predetermined measurement data and measurement date and time information, and the event data in association with the identification information; After recording the event data, the recording means extracts, as reference-related measurement data, the predetermined measurement data measured in a predetermined period based on the date of occurrence of the recorded event for the same individual, and A linked data set generation step of combining the event data related to the event and the reference-related measurement data to generate an event linked data set and recording it in the information recording means; Information on the specific event content from among the individual-derived data, the predetermined measurement data and measurement date and time information, and the data collection of the event-linked data set for a plurality of individuals, and a group data extraction step of extracting specific event group data, which is group
- the group data extraction step performs a predetermined normality test on the reference-related measurement data, and determines the reference-related measurement data having a P value of P ⁇ 0.01 or P ⁇ 0.05 as quality data.
- specific event group data consisting only of individuals with quality data and containing information on specific event details
- data related to a specific event content derived from one individual For groups it is possible to check whether this indicates normality. That is, individual reference-related measurement data collected from a plurality of individuals are each classified into a data group showing normality and a data group not showing normality, and quality data with maintained quality and garbage data. can be handled separately.
- the "predetermined normality test” used herein may be, for example, the Kolmogorov-Smirnov test, the Lillifors test, the Shapiro-Wilk test, the Dagostino test, the Omnibus test, and their P-values.
- the data processing method of the present invention includes individual identification information, individual-derived data including at least one of information on the age, medical history, or sex of the individual, Predetermined measurement data that is measured from an individual, is a single type of data, and has the property of following a Gaussian distribution is collected from a plurality of individuals, and data of a population containing specific information is obtained from the collection of collected data.
- a data processing method for extraction comprising: an information input step of receiving inputs of the individual-derived data, the predetermined measurement data measured from the same individual, and information on the date and time of measurement; and the input predetermined measurement data.
- the group data extraction step performs a predetermined normality test on the simple criterion-related measurement data, and the simple criterion-related measurement data showing P ⁇ 0.01 or P ⁇ 0.05 is regarded as quality data.
- the simple criterion-related measurement data showing P ⁇ 0.01 or P ⁇ 0.05 is regarded as quality data.
- specific group data consisting only of individuals with quality data and containing specific information
- For a data group related to specific information derived from one individual It becomes possible to check whether this indicates normality. That is, for individual simple reference-related measurement data collected from a plurality of individuals, each is classified into a data group that shows normality and a data group that does not show normality, and quality data that maintains quality and garbage Data can be handled separately.
- the "predetermined normality test” used herein may be, for example, the Kolmogorov-Smirnov test, the Lillifors test, the Shapiro-Wilk test, the Dagostino test, the Omnibus test, and their P-values.
- the software, data processing device, and data processing method according to the present invention are based on measurement data of vital signs that follow a Gaussian distribution and are obtained from a plurality of individuals. , it is possible to easily perform data mining only on quality data sets with high credibility as data analysis targets.
- FIG. 1 is a diagram showing a schematic configuration of a terminal into which software to which the present invention is applied is installed (first system configuration);
- FIG. FIG. 4 is a schematic diagram showing a second system configuration having software to which the present invention is applied;
- FIG. 3 is a schematic diagram showing a third system configuration having software to which the present invention is applied;
- 3 is a block diagram showing the configuration of an arithmetic section, an information transmission/reception section, and an information recording section;
- FIG. FIG. 2 is a schematic image diagram showing classifying quality data and garbage data based on a normality test;
- FIG. 4 is a schematic diagram showing an example of narrowing down data using the present invention
- (a) is a schematic diagram showing an example of a device used when the software to which the present invention is applied functions
- (b) is a schematic diagram showing another example of the device.
- 1A and 1B are a schematic diagram showing an example of data input and recording in the present invention, and a simple flow diagram showing utilization of data
- FIG. FIG. 10 is a flow chart showing the flow of event data set preparation
- FIG. 4 is a flow chart showing the flow of data utilization
- 1 is a graph showing the distribution of average body temperature of a Japanese population in the age range of 10 to 50 years old.
- Fig. 3 is a graph showing the distribution of body temperature for individual men A and individual women B;
- FIG. 1 is a diagram showing a schematic configuration of a terminal into which software to which the present invention is applied is introduced as a first embodiment of the present invention.
- the structure shown below is an example of the present invention, and the content of the present invention is not limited to this.
- Software to which the present invention is applied can be installed in a general-purpose information processing device, and provides each information processing function necessary for carrying out the present invention to the incorporated information processing device.
- the subject's measurement data is input via a smartphone terminal or the like, values such as vital signs are collected from a plurality of subjects, and population data is constructed at the analysis terminal 3 that collected the information. Data can be extracted according to the purpose from the data collected and used for various analyses.
- the information processing equipment includes a computing unit such as a CPU, a storage unit such as RAM and ROM, a display screen such as a liquid crystal screen, an input unit such as a keyboard, and a communication unit that controls communication with the Internet, etc. It is prepared. For example, it is a general-purpose personal computer, a tablet terminal, a smart phone, or the like.
- Information processing equipment includes, for example, various health care equipment, medical systems and nursing care systems installed in hospitals and other facilities, and the software to which the present invention is applied is incorporated in these and used. It's okay.
- the analysis device 1 (analysis terminal 3) includes a calculation unit 2.
- the calculation unit 2 is a processing unit that executes each information processing function of the analysis device 1 . That is, in the software to which the present invention is applied, the calculation unit 2 of the analysis terminal 3 is combined with the information input means 23, the information recording means 24, the extraction condition setting means 100, the data set generation means 101, the group data extraction means 102, the judgment processing means 6 , significance test means 5 and the like.
- analysis terminal 3 can access external servers, terminals, etc. via the Internet, and can also transmit and receive information to and from external servers, terminals, etc.
- the analysis terminal 3 has an information recording unit 4, an information transmission/reception unit 3c, an input unit 3a, and a display screen 3b.
- the information transmission/reception unit 3c is a part responsible for transmission/reception of information among the calculation unit 2, the information recording unit 4, the input unit 3a, the display screen 3b, and the like. Also. Information may be transmitted and received between the analysis terminal 3 and an external terminal.
- each piece of information handled by the software to which the present invention is applied does not necessarily need to be recorded in the information recording unit 4 of the analysis terminal 3.
- various types of information are transmitted to and recorded by an external server or an external terminal via the information transmission/reception unit 3c of the analysis terminal 3, and necessary information is received from the external server or the like during information processing. good too.
- the analysis terminal 3 only displays the display information such as the extraction result of the data of the group having the event information designated from the population data, and the recording of various information and the judgment processing are performed by an external server or the like. may be
- the analysis terminal 3 shown in FIG. 1 introduces software to which the present invention is applied into the terminal, and the terminal alone can input information (including input of input measurement data received from an external terminal), record, extract, extract It is possible to display results, set standards for various types of information processing, and so on.
- FIG. 2 As a second system configuration, a configuration in which an external server has the functions of the software 1a to which the present invention is applied can also be adopted.
- the user terminal 50a and the external terminal 50b can access the information management server 32a via the Internet 30a.
- the information management server 32a is, for example, an external server provided in a cloud format, and functions of the software 1a to which the present invention is applied can be used on the information management server 32a.
- the information management server 2a has an information recording unit 4a, an information transmission/reception unit 3c, and a calculation unit 2a. Further, the calculation unit 2a has a significance test means 5a, an extraction condition setting means 100a, a data set generation means 101a, a group data extraction means 102a, and a judgment processing means 6a. Input of measurement data is performed via the user terminal 50a and the external terminal 50b, and the measurement data input from each terminal is transmitted to the information management server 32a, and the information management server 32a records the information and performs the reference-related measurement. Extraction of data, creation of an event-linked data set, extraction of a quality data information group, significance test of the quality data information group, extraction of group data having designated event information, etc.
- the extraction result and recorded information are transmitted to the user terminal 50a and the external terminal 50b, and can be checked at each terminal. In this way, it is also possible to employ a system configuration in which the functions of the software 1a are provided on an external server.
- FIG. 3 shows, as a third system configuration, a configuration of a management terminal 70b including a module A having a plurality of software 32c, 32d, etc. in addition to the functions of the software 32b to which the present invention is applied.
- the software 32b to which the present invention is applied constitutes one module A together with other software that causes the management terminal 70b to perform various functions different from this. That is, it is possible to install the software 32b into the module A of the management terminal 70b into which a plurality of softwares 32c, 32d, etc., have been installed in advance and make it function.
- software to which the present invention is applied can be incorporated into a module provided in a management terminal of a medical system such as an electronic chart.
- measurement data is input to the management terminal 70b, information is recorded, quality data is judged, quality data information group is extracted, and the resulting information can be confirmed on the management terminal 70b.
- the user terminal 60a or the external terminal 60b is connected to the management terminal 70b, measurement data is input from the user terminal 60a or the external terminal 60b, and is transmitted to the management terminal 70b. Extraction of standard-related measurement data, creation of event-linked data sets, extraction of quality data information groups, significance test of quality data information groups, extraction of group data with specified event information, etc. from population data, etc.
- the user terminal 60a or the external terminal 60b can receive and check the resulting information.
- the software to which the present invention is applied may employ a configuration in which it functions as part of a module composed of a plurality of pieces of software.
- the information recording unit 4 individual unit information 7 about a plurality of subjects is recorded in association with identification information that can identify the subjects.
- the information recording section 4 also serves as a section for recording the "population data information group" to be analyzed by the analysis terminal 3, which originates from a plurality of subjects. Also, individual unit information 7 derived from each individual is recorded so as to be identifiable via identification information.
- information recording unit 4 information of a group of tens to millions of people including information of each individual is recorded.
- the number of people listed here is not particularly limited, and several tens to millions of people are just examples.
- the individual unit information 7 recorded in the information recording unit 4 includes the subject's date of birth and personal information including gender information.
- Personal information may include the name of the subject, but from the perspective of protecting personal information, including the name of the subject and other direct information that can identify the subject. It is also possible to adopt a mode in which data constituting personal information of each individual is collected without having to do so.
- the personal information may consist of only the date of birth and gender information.
- personal information may include address, residential area (for example, the name of the prefecture or region where the address is located), family structure, hobbies, preferences, health habits, smoking, drinking, etc.
- address for example, the name of the prefecture or region where the address is located
- family structure for example, the name of the prefecture or region where the address is located
- hobbies preferences, health habits, smoking, drinking, etc.
- personal information may be recorded in the information recording unit 4 for each individual.
- the information recording unit 4 records vital information 8 composed of various vital signs measured from the subject with a vital meter and information on the date and time of measurement or the date and time of acquisition. That is, information on the measurement result of vital signs for each individual is recorded together with information on the date and time of measurement or the date and time of acquisition.
- identification information for identifying an individual linked to the individual unit information 7 and the vital information 8 is recorded.
- identification information for example, identification code information or the like in which numbers, symbols, and the like are combined can be adopted.
- various types of information recorded in the information recording unit 4 can receive input of information via dedicated application software using smartphone terminals owned by individual users. Further, it is possible to input and correct information through the input section 3a, the information transmission/reception section 3c and the information input means 24 (not shown) which the analysis terminal 3 has.
- the measured values of vital signs measured by oneself, etc. are sent to the information transmission and reception unit 3c of the analysis terminal 3 together with the individual identification information, It is recorded in the information recording section 4 .
- the measurement data is transmitted from a terminal or the like owned by the object to be measured, the transmitted data (vital information 8) is collected for each individual, and the analysis terminal 3 performs information processing. becomes possible.
- the vital information 8 includes measurements of body temperature, pulse, systolic blood pressure, diastolic blood pressure, pulse pressure, and respiratory rate.
- the vital information 8 is an example of measurement data that can be processed in the present invention.
- the date and time of measurement or the date and time of acquisition included in the vital information 8 is information indicating the date and time when the vital measurement was performed by the user for each individual. is to be entered.
- the vital measuring instrument is of a format that indicates the date and time of measurement, it is also possible to adopt time information actually displayed or recorded by the vital measuring instrument or the like.
- the vitals measuring device is a wearable measuring device that can be worn on the subject's body, it may be the acquisition date and time of the vital signs that are continuously acquired.
- the measurement date and time or the acquisition date and time included in the vital information 8 may not necessarily be information on the exact date and time of measurement, but may be information on the time that the user confirms and adopts.
- the vital information 8 is information that has the property of following a Gaussian distribution.
- This Gaussian distribution property is a single type of data obtained from the same subject, and a certain number of data is collected (for example, a number of days consisting only of body temperature obtained from Mr. A collection of data for minutes) and the property that the distribution of data shows normality. In other words, it means showing normality with one type of data derived from one individual, not the normality of group data (normality regarding data of multiple people) seen in conventional data accuracy management.
- the ⁇ property of following a Gaussian distribution'' includes the following: (1) measured values when an individual has a specific disease, (2) measured values with biases to be removed as much as possible at the time of measurement, and (3) In each case where there is a reason for the data value to become an abnormal value (e.g., hyperthermia due to fever), the aggregate of the data includes the property that may not show normality. I'm in. That is, when the values of vital signs acquired in each of the states (1) to (3) are included, the set of data including the measured values has the property that it may no longer exhibit normality.
- the vital measuring instrument for measuring vital information is not particularly limited, and it is sufficient if each vital sign can be measured.
- the vitals may be measured using a home-use vitals measuring instrument.
- vital information is available, it is not essential to use a vital meter.
- the vital information 8 may adopt a configuration in which measured values measured at irregular times are recorded instead of measured at regular intervals.
- this irregular measurement for example, a plurality of vital information 8 is acquired in one minute, a plurality of vital information 8 is acquired in 30 minutes, a plurality of vital information 8 is acquired in an hour, several hours a plurality of vital information 8 are obtained in a day, a plurality of vital information 8 are obtained in a few days, a plurality of vital information 8 are obtained in a week, a few weeks
- a plurality of pieces of vital information 8 may be recorded during a certain period of time, for example, a plurality of pieces of vital information 8 may be acquired during one month.
- the vital information 8 is configured to record a plurality of measurement data regardless of the length of time and the regularity of measurement intervals.
- the vital information 8 may be recorded, for example, as vital information measured once a day at a fixed time period, and this may be used as a representative value for the day.
- the vital information 8 for example, calculates the average value from the measured values measured twice a day, in the morning and in the afternoon, and uses this average value as the representative value for that day. , may be collected.
- measurements may be taken at regular intervals, for example, every hour, and the average value calculated from the measured values may be used as the representative value for the day. Alternatively, the highest value or lowest value in a certain period of time may be used.
- the vital information 8 does not necessarily have to be configured so that vital information measured once a day at a fixed time period can be recorded.
- the vital information may be measured once every few days.
- the number of times the vital information is recorded is limited. not something.
- the information recording unit 4 also records event data 9 derived from each individual subject whose vital signs are to be measured.
- the event data 9 is created for each event occurring in the same subject. Therefore, event data 9 of a plurality of events are recorded even for the same target person.
- event data 9 about a plurality of subjects is recorded in association with identification information that can identify the subjects.
- the event data 9 is also recorded with individual information and group information collected from tens to millions of individuals.
- the event data 9 recorded in the information recording unit 4 specifically includes information on the details of the event that occurred to the same subject and information on the date of occurrence of each event. Further, the information on the content of these events and the information on the date of occurrence of each event are recorded in association with the identification information of each target person.
- the information on the event content that occurred in the same subject includes "information on illness-related events” that occurred in the subject.
- the event content information may include the "name of the disease” and "symptom information” that the subject has developed.
- the "information on disease-related events” referred to here includes visits to medical institutions, hospitalizations, diagnoses, onset of diseases, deaths, discharges, hospital transfers, transfers within hospitals, discharges from facilities, observations, etc. Changes in level, entering/leaving the intensive care unit (ICU), etc.
- “consultation” here may further include subdivided items such as medication, drip, oxygen therapy, and follow-up.
- disease-related event information if there is information to be recorded in relation to the event when the event occurs. This is information to be recorded together.
- event content information For example, when an event such as a visit to a medical institution, hospitalization, or diagnosis occurs, if the target person has been diagnosed with a "specific disease" by a doctor, the name of the disease is the type of event ( medical examination, hospitalization, diagnosis, etc.) are recorded as event content information.
- the "name of the disease” is recorded in the information recording unit 4 as the information of the event content together with the information of the disease-related event such as admission to the medical institution, diagnosis, and onset of the disease, It will be treated as information on the "previous history" of the subject's onset.
- the name of the disease that the subject has developed is recorded, and the information is recorded and accumulated as information on the disease that the subject has suffered in the past.
- the same subject develops the same disease after a certain period of time for a disease that has developed in the past, and the name of the disease is recorded, information on the number of times (for example, the second time) etc. Together, the content is recorded and accumulated again as information on the disease that the subject has developed.
- an event such as a visit to a medical institution, hospitalization, or diagnosis occurs
- the information on the content of the symptom may be used as the type of event (consultation, hospitalization, etc.). hospitalization, diagnosis, etc.) are recorded as event content information.
- Symptoms include, for example, malaise, cough, sputum, headache, taste disorder, olfactory disorder, respiratory failure, edema, cyanosis, pain, palpitation, dizziness, numbness, tremor, paralysis, fever, coldness, nausea, vomiting, There is swelling, swelling, etc.
- an event-linked data set 10 is recorded in the information recording section 4 .
- This event-linked data set 10 includes event data 9 related to an event that occurred in a subject, and "reference-related measurement data" measured during a predetermined period based on the date of occurrence of the event. A combined data set.
- the event-linked data set 10 is extracted and generated from each data of the event data 9 and the vital information 8 recorded in the information recording unit 4 by the data set generation means 101 .
- the reference-related measurement data includes vital information 8 measured during the "first reference-related period", which is a period from about two months before the event occurrence date to about one month before the event occurrence date. include. This makes it possible to obtain vital information that is not affected by events such as the onset of disease.
- the reference-related measurement data includes a "second reference-related period" that is seven days consisting of the date of occurrence of the event, three days before the date of occurrence of the event, and three days after the date of occurrence of the event. ” contains the measured vital information 8 . This makes it possible to obtain vital information that has changed due to the influence of the event.
- the vital information 8 measured in the "first reference-related period" is, for example, an event in which a subject develops COVID-19 and is hospitalized in a medical institution.
- the day of hospitalization is the date of occurrence of the event.
- Measured vital information 8 is obtained.
- Body temperature for 30 days from 2 months before the date of admission to 1 month before the date of admission is vital information unaffected by the content of the event that the subject developed COVID-19 shall be treated as 8. In other words, it can be treated as information that indicates the body temperature of the subject in a state that is not affected by the event, rather than the body temperature that has changed due to the onset of COVID-19 (body temperature that has been affected).
- the measured body temperature for 30 days from 2 months before the date of admission to 1 month before the date of admission is obtained by measuring the body temperature once a day by the subject. It is assumed that the measurement data has been recorded in the information recording section 4 .
- the origin of body temperature is not necessarily limited to one measurement per day, and other acquisition methods may be used as long as 30 or more data or data for 30 days can be collected.
- the date of admission can be retroactively counted from one month before the date of admission.
- the vital information 8 measured during the first reference-related period can also be body temperature for 30 times in 60 days recorded in the period up to about 3 months before.
- the number of data here is not strictly limited to "30 days" of body temperature, but it is also possible to obtain data for about one month.
- the number of data may be set around 30 days, such as 29 days or 31 days. However, it is preferable that data for at least 30 days are available in order to facilitate confirmation of the properties that follow the Gaussian distribution.
- the vital information 8 measured during the "first reference-related period" includes not only body temperature, but also measured values of pulse, systolic blood pressure, diastolic blood pressure, pulse pressure, and respiratory rate for each type of vital sign. is configured to be extracted to
- the vital information 8 measured in the “second reference-related period” here is an event in which a subject develops COVID-19 and is hospitalized in a medical institution.
- the day of hospitalization as the reference date
- Vital information 8 measured during the second reference-related period in this event That is, it is the measured value of the body temperature for one week with the date of hospitalization in the middle.
- the body temperature for one week with the day of hospitalization in the middle shall be treated as vital information 8 affected by the event content, indicating that the subject developed COVID-19.
- vital information 8 affected by the event content, indicating that the subject developed COVID-19.
- due to the onset of COVID-19 it can be treated as information that includes fluctuating body temperature instead of the subject's normal body temperature.
- the measured body temperature for a total of 7 days, the past 3 days not including the day of hospitalization, the day of hospitalization (the day of the event), and the 3 days from the day after the day of hospitalization is subject to It is assumed that the person measures the body temperature once a day and the measurement data is recorded in the information recording section 4 .
- the origin of the body temperature is not necessarily limited to the measurement once a day. If the data for the three days before and after the occurrence of the event is included, vital signs for seven days are necessarily required. It is not something to become.
- the body temperature on the day of admission and the past three days before the day of admission Body temperature recorded in either and temperature recorded in any of the 3 days after the date of admission, i.e., body temperature that includes information for 3 days before and after the date of admission, but not for 7 days, It can also be vital information 8 measured during a second reference-related period. It is also possible, for example, to use only the body temperature recorded on the day of admission.
- the number of pieces of data in the second reference-related period is not limited to body temperatures for "seven days including three days before and after the date of occurrence of the event".
- 7 days including the three days before and after the date of occurrence of the event Data should be complete.
- the vital information 8 measured during the "second reference-related period" includes not only body temperature, but also measured values of pulse, systolic blood pressure, diastolic blood pressure, pulse pressure, and respiratory rate for each type of vital signs. is configured to be extracted to
- the information recording unit 4 can store the vital information 8 over a long period of time.
- vital information 8 in a specific period arbitrarily set from among all collected data according to the purpose of analysis can also be extracted.
- the vital information 8 for a period of one year prior to the date of occurrence of a specific event in a subject, based on the date of occurrence of the event.
- the period shown here is an example, and the period can be arbitrarily set according to other contents.
- the group data extracting means 102 of the present invention tests the normality of the data of the vital information 8 measured in the first reference-related period, which is included in the event-linked data set 10, with respect to the data in the same period. and determine whether or not it corresponds to quality data.
- a normality test is performed on a single type of vital information 8 measured during the "first reference-related period", which is a period approximately one month prior to .
- the subject's "measured body temperature for 30 days" becomes the vital information 8 measured during the first reference-related period in this event.
- the body temperature for these 30 days is tested for normality.
- the Shapiro-Wilk test can be used in the normality test by the group data extraction means 102.
- the measured values of body temperature, pulse, systolic blood pressure, diastolic blood pressure, pulse pressure, and respiration rate included in the vital information 8 are information that follows the Gaussian distribution, as described above.
- the body temperature for 30 days is (1) the measured value when the individual has a specific disease, (2) the measured value after the bias that we want to remove as much as possible at the time of measurement, and (3) the data If it does not correspond to each case where there is a reason for the value to become an abnormal value (for example, hyperthermia due to fever), it is data that follows a normal distribution as stable vital data.
- test methods can be used for the "normality test" here.
- the Kolmogorov-Smirnov test the Lillifors test, the Dagostino test, the Omnibus test, and the P value determined based on each test can be used.
- the normality test in the present invention is performed based on the following concept.
- the first reference-related period for one event is based on the event occurrence date, starting approximately two months before the event occurrence date. This is a period of about one month before the date of occurrence, during which the vital information 8 that is not affected by the contents of the event that has occurred is obtained. For this reason, it is necessary to minimize the possibility of including vital sign measurements when the above (3) data values are abnormal values (for example, hyperthermia due to fever). can.
- each type of vital signs such as body temperature, pulse, systolic blood pressure, diastolic blood pressure, pulse pressure, and respiratory rate, which constitute the vital information 8
- the value of each type of vital signs may be changed when (1) the individual has a specific disease (disease "Stable vital data" has the property of following a Gaussian distribution, except for patients with specific diseases who are not normally distributed due to
- stable vital data here corresponds to (2) above, and even if data based on measurement errors or incorrect inputs is included to some extent, if the vital sign measurement period is long (for example, Data for several months to one year), the data group in the measurement period has the property of being normally distributed eventually.
- the P value was calculated based on the Shapiro-Wilk test, P ⁇ 0.01 (or P ⁇ 0.05), it is assumed that the data set group has few measurement errors and erroneous inputs, and is determined to be quality data (see FIG. 5).
- the acquired data is tested for normality (eg, P ⁇ 0.01) within a certain period of time (eg, 30 days). If so, the acquired data is determined to be “quality data”.
- the acquired data here is assumed to be data in which measured values of vital signs affected by an event (measured values before and after the date of occurrence of the event) are excluded.
- the vital information 8 measured during the first reference-related period in the specific event is body temperature, pulse, systolic blood pressure, diastolic blood pressure, pulse pressure, and A normality test is performed for each type of respiratory rate. Further, if another event data 9 is recorded for the same subject, the data group of the vital information 8 is also tested for normality with respect to the other event.
- event data 9 for each subject is recorded for each of a plurality of subjects.
- event data 9 for each subject there is a data group of measured values of various types of vital signs measured during the first reference-related period for each individual event that occurred in that subject.
- data groups are recorded for a plurality of persons.
- each type of vital information 8 is quality data (see FIG. 5).
- the range of target data can be appropriately set via the extraction condition setting means 100. That is, not only can all the data recorded in the information recording unit 4 be targeted, but also the conditions for extracting data can be set, and the range of data to be tested for normality can be appropriately changed in advance.
- each information recorded in the information recording unit 4 such as age, gender, presence or absence of information on specific event content, presence or absence of past history of specific disease, presence or absence of specific symptoms, etc. You can also set the conditions for extraction and determine the range of data to test for normality. Further, the conditions for extracting data are not limited to those described above, and conditions can be set based on various information that can constitute the individual unit information 7 and the event data 9 .
- the group data extraction means 102 By performing the normality test by the group data extraction means 102, the collected data for a plurality of people, for example, the event linked data set 10 (event data 9 and the reference Each data group is classified into “quality data” and “garbage data,” and only subjects from whom quality data can be extracted are selected for analysis. can do.
- the data for 100 million people is assumed to be all the starting point data (all the data accumulated in the cloud) recorded in the information recording unit 4, and the event content information of the event data 9 , the data of the subjects in which the information of the event content of "a patient with heart failure (diagnosed or hospitalized)" is extracted and narrowed down to 10 million.
- the data group of vital information measured in the first reference-related period is tested for normality by the group data extraction means 102.
- the data group of vital information is distinguished from garbage data, and the data group of vital information of 2 million people is distinguished from quality data.
- the individual unit information 7 and each information constituting the event data 9 are used to classify and extract the collected data step by step, and a normality test step by the group data extraction means 102 is included.
- a target group for which quality data can be obtained among subjects (here, subjects in their 50s who have heart failure and diabetes) according to the purpose.
- the contents of narrowing down shown in FIG. 6 are merely an example, and in the present invention, it is possible to classify/extract and narrow down information with other contents.
- the personal information 7 does not include information on the name of the individual, but uses information on gender and date of birth, thereby avoiding the risk of personal information being leaked directly and analyzing the collected data. becomes possible
- the extraction condition setting means 100 is one of the functions that the software to which the present invention is applied causes the calculation unit 2 to execute, and is a part that sets various conditions and extracts data from various collected data.
- the extraction condition can be used if various information serving as the grounds for extraction is recorded in the information recording unit 4 in association with personal identification information.
- the contents of the extraction conditions can be appropriately set according to the intended use of the analysis data.
- the types of data to be acquired as individual unit information 7, event data 9, and vital information 8 are added as appropriate, data is collected, and extraction conditions are set based on the types of added data. , it is also possible to extract data from the population data.
- the significance test means 5 is one of the functions that the software to which the present invention is applied causes the calculation unit 2 to execute, and the normality test by the group data extraction means 102 can identify a target group from which quality data can be obtained. After that, the data derived from the subject group are tested to see if they are useful as sample data selected from the population.
- the mean value and variance of each data group of quality data and dust data are compared with the mean value and variance of population data to prove that the conditions are the same.
- This significant difference test means 5 when the group data extraction means 102 performs the normality test, the data group of the first reference-related period in the subject group for which quality data can be obtained (hereinafter referred to as "quality data information A significant difference is tested between the data group of the first reference-related period in the subject group from which garbage data that is not quality data was acquired (hereinafter referred to as the "comparison data group"). do.
- the quality data information group is a collection of data in the first reference-related period for a plurality of subjects for whom quality data could be acquired.
- the comparison target data group is a collection of data in the first reference-related period for a plurality of subjects for whom quality data could not be obtained.
- the sum of the quality data information group and the comparison target data group is the test population data information group.
- the test population data information group is a collection of data of the first reference-related period for all subjects within the data range of the subject for which the normality test was performed.
- the collection of data of the first reference-related period for all subjects is the test population data information become a group.
- the subjects for which the normality test is performed are some of all the subjects recorded in the information recording unit 4, the first criterion relation of all the subjects A set of period data constitutes a test population data information group.
- the software to which the present invention is applied causes the calculation unit 2 to function as the mean value calculation means 14 and the standard deviation calculation means 15 that constitute the significance test means 5 .
- the average value calculating means 14 and the standard deviation calculating means 15 are used to calculate the vital information 8 recorded in the information recording unit 4 (body temperature, pulse, systolic blood pressure, diastolic blood pressure, pulse pressure, respiratory rate and oxygen saturation). value), the population data extraction means 102 extracts the quality data information group for each type of vital sign (for example, body temperature) when the normality test is performed. Calculate the "average value of vital information" and the "standard deviation of vital information” in the statistical distribution of the vital information of the same data group.
- the vital mean value and the standard deviation based on the distribution of vital information are calculated by the mean value calculating means 14 and the standard deviation calculating means 15 using the following formulas (1) and (2).
- ⁇ (1/N) ⁇ Si Expression (1)
- ⁇ ⁇ ((1/N) ⁇ (Si ⁇ ) 2 ) Equation (2)
- ⁇ is the average value of vital information
- Si is the measured value of each vital information
- N is the number of all vital information data
- ⁇ is the standard deviation.
- ⁇ Si indicates the sum of measured values of all vital information.
- the average value of the vital information and the standard deviation of the vital information are the types of vital information 8 (body temperature, pulse, systolic blood pressure, diastolic blood pressure, pulse pressure, respiratory rate and oxygen saturation). Each can be calculated.
- the average body temperature and the standard deviation of the body temperature are calculated for the data group that constitutes the quality data information group.
- the mean body temperature and the standard deviation of body temperature are calculated for the data group that constitutes the data group to be compared.
- the average body temperature and the standard deviation of the body temperature are calculated for the data group that constitutes the test population data information group.
- the significance test means 5 compares the "average body temperature” in the quality data information group with the "average body temperature” in the comparison data information group for that body temperature. to determine which one is closer to the value of the “average body temperature” in the test population data information group.
- the significance test means 5 compares the "standard deviation of body temperature" in the quality data information group with the "standard deviation of body temperature” in the comparative data information group for that body temperature. to determine which is closer to the value of the "standard deviation of body temperature” in the test population data information group.
- the "average body temperature” and the “standard deviation of body temperature” of the quality data information group are closer to the values of the test population data information group than the values of the comparison data information group. If they are close, it is possible to test that there is a significant difference between the quality data information group and the comparison data information group.
- the vital information 8 of the subject group for which quality data can be obtained is selected from the population in the subsequent analysis. It can be used as a prepared specimen.
- the significance test is performed based on the body temperature, but it is also possible to perform the significance test with other types of vital information 8 than the body temperature.
- the significance test can be appropriately used when the vital information 8 of a subject group for which quality data can be obtained is required to be used as a sample according to the purpose of data analysis.
- acquisition of vital information is performed by a wearable vital measuring device 21a, a thermometer 21b, or the like, and the measured values measured by these, together with information on the time of measurement, are collected by the individual.
- Input via an external terminal such as a smartphone terminal.
- the input information is transmitted to the analysis terminal 3 via the Internet.
- vital information is sent from the smartphone terminal 22a or the personal computer terminal 22b (hereinafter referred to as "PC terminal 22") to information management, which is the external server described in the above second system configuration. It is also possible to access the server 32a and input vital information from the smart phone terminal 22a or the PC terminal 22b.
- the first embodiment of the present invention it is configured to use information about events derived from each individual subject, but the content of the present invention is not limited to this. That is, unlike the above-described first embodiment of the present invention, the second embodiment of the present invention can also be adopted in a form that does not use event data.
- the second embodiment of the present invention will be described below, focusing on the differences from the above-described first embodiment of the present invention. Further, the basic configuration of the second embodiment of the present invention is similar to that of the first embodiment of the present invention.
- individual unit information 7 is recorded in the information recording section 4 .
- the individual unit information 7 includes at least one of individual identification information and individual age, medical history, or gender information.
- the event data 9 is not recorded in the information recording unit 4 . Further, along with this, the event-linked data set 10 is also not recorded in the information recording unit 4 .
- the information recording unit 4 records "simple reference-related measurement data" measured during a predetermined period based on the "predetermined reference date".
- This simple reference-related measurement data is information used instead of the reference-related measurement data in the first embodiment of the present invention.
- this simple reference-related measurement data can be set with the following contents.
- the predetermined reference date is set as (1) the date when the input of vital signs or the like is disclosed to the information recording unit 4 via the information input means, or (2) the date arbitrarily set by the user. be able to.
- the predetermined period is, for example, when the predetermined reference date is (1) the date on which the input of vital signs and the like is disclosed in the information recording unit 4 via the information input means, the input of information A period of approximately one month from the date of commencement of the period can be adopted.
- the one month here can adopt both a period including the date when the input of information is started and a period not including the date when the input of information is started.
- the predetermined reference date is (2) a date arbitrarily set by the user
- the predetermined period is approximately one month past the arbitrarily set date and the arbitrarily set date
- a period of approximately one month from the beginning can be employed. That is, it is possible to adopt both the past period and the future period when viewed from an arbitrary date.
- one month here can adopt both a period including an arbitrary date and a period not including an arbitrary date.
- the simple reference-related measurement data set as described above is a set of data on vital signs values measured from individuals. It is configured to determine whether or not it applies. That is, like the vital information 8 measured in the first reference-related period in the first embodiment of the present invention, it is subject to determination as to whether or not it corresponds to quality data.
- the normality test quality data determination
- the normality test can be performed by adopting the same technique as in the first embodiment of the present invention.
- the simple reference-related measurement data derived from each individual is subject to determination as to whether or not it corresponds to quality data.
- Data groups can be classified into "quality data” and “garbage data”, and only subjects from whom quality data can be extracted can be analyzed.
- data analysis is performed based on the information contained in the individual unit information 7 and the vital information 8 for a collection of collected group data derived from a plurality of individuals. It can be performed.
- information such as age, medical history, or gender included in the individual unit information 7 is used as "specific information" for classifying and distinguishing data.
- FIG. 8 shows an example flow for using the present invention.
- a plurality of users using the present invention measure vital signs such as body temperature over time, and enter vital information via their own smartphone terminals or the like. I do.
- the input data is recorded in an information recording unit (for example, it may be recorded not only inside the terminal but also in the cloud).
- the event data of the events that occurred in each user are also recorded.
- an event As data, the date of examination, the disease that is the basis for the examination, or the name of the disease in the diagnosis result (diabetes), and the information of the opportunity (consultation) as the information of the event content are recorded.
- the vital information of the first reference-related period and the vital information of the second reference-related period are extracted, and together with the event data at the time of admission, as one event data set, cloud recorded in
- the extracted vital information is similarly recorded in the cloud as one event data set together with the event data in the above-described diabetes consultation event.
- the event-attached vital data of a certain user (Mr. A) is accumulated in the cloud, and similarly, the event-attached vital data groups of many users are accumulated.
- the data of the group with the specified event information (including “hospitalization due to corona” in the event content information) is collected. can be extracted.
- each event data set includes vital information in the first reference-related period and vital information in the second reference-related period, based on the date of hospitalization. Contains information. The information may also include symptoms at the time of hospitalization, the user's medical history, and the like.
- Fig. 8 The flow shown in Fig. 8 is shown in a little more detail by dividing it into event data set preparation (see Fig. 9) and data utilization (see Fig. 12).
- steps 1 to 4 are as described in FIG.
- step 5 a group of subjects for whom quality data can be obtained is extracted by testing the normality of the vital information of the "first reference related period" based on the event occurrence date.
- step 6 from the data accumulated in the cloud, the data group (vital information, symptoms, medical history, etc.) of the subject group for which quality data can be obtained is analyzed at the time of event occurrence (corona hospitalization), and calculate the degree of influence of factors (types of vital signs, symptoms, medical history) on disease (corona).
- step 2 for the data group of the subject group for which quality data can be obtained, including "hospitalization due to corona" in the event data, the data group of the same gender, age group, and past history as Mr. B is collected from the cloud. are extracted, and the factors (vital items, symptoms, medical history) for corona and the degree of their influence are found.
- Mr. B's "high risk coefficient (previous history)", “vital factor”, and “symptom factor” can be used to determine the degree of risk at the time of data acquisition. That is, Mr. B can confirm the degree of risk regarding whether or not to be hospitalized due to corona at the time when the vital information is input.
- Step 4 Mr. B's vital information and symptom data (even if he has not contracted coronavirus in the past), for example, from his home care status, the timing for hospitalization can be determined.
- the target event content information is "medical intervention” or "hospitalization”. These are included in the event data, and the data group of the same gender, age group, and past history as the user to be judged is extracted from the cloud for the data group of the target group for whom quality data can be obtained.
- the types of vital information (vital factors) related to heart failure are pulse, systolic blood pressure, and diastolic blood pressure.
- hypertension, diabetes, obesity, or arteriosclerosis can be derived as factors of the past history. In this way, by data analysis, it is possible to identify highly relevant factors in vital information, symptoms, medical history, etc. according to the type of disease.
- Patent Document 1 Patent Document 1
- Patent Document 2 Patent Document 3
- the software, data processing device, or data processing method to which the present invention is applied is an example, but the following various data units can be tested.
- Each data unit For example, the blood pressure data of Mr. A's corona hospitalization is a test that is reliable.
- (3) Group-by-group eg facility-by-facility). A test that the data of the group of patients measured at the C site are reliable.
- Software, a data processing device, or a data processing method to which the present invention is applied accumulates vital information following a Gaussian distribution acquired from users and event data relating to events occurring in users, and collects data obtained from a plurality of users. From among them, it is possible to easily extract a group of user data from which quality data with high credibility can be extracted as an analysis target during data analysis.
- the software, data processing device, or data processing method to which the present invention is applied can be applied to various uses in the fields related to medical care and health care.
- the software of the present invention based on the measurement data of vital signs according to the Gaussian distribution obtained from the subject, selects data analysis targets from a collection of data with unknown accuracy or disjointed data obtained from a plurality of individuals. It is possible to easily data mine only quality datasets with high credibility as.
- the data processing apparatus of the present invention based on the measurement data of vital signs according to the Gaussian distribution obtained from the subject, selects from a collection of data with unknown accuracy or disjointed data obtained from a plurality of individuals as a data analysis target Only high-quality datasets with high credibility can be easily data mined.
- the data processing method of the present invention based on the measurement data of vital signs according to the Gaussian distribution obtained from the subject, from a collection of data with unknown accuracy or disjointed obtained from a plurality of individuals, as a data analysis target Only high-quality datasets with high credibility can be easily data mined.
Landscapes
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本発明は、対象者から取得したガウス分布に従う、精度不明もしくはバラバラなデータ集合体の中から、データ解析対象としての信用度の高い、クオリティの高いデータのみをスクリーニングする発明である。
Description
本発明はソフトウェア、データ処理装置及びデータ処理方法に関する。詳しくは、対象者から取得したガウス分布に従うバイタルサインの測定データに基づき、複数の個体から得られた精度不明もしくはバラバラのデータの集合体の中から、データ解析対象としての信用度の高いクオリティデータセットのみを容易にデータマイニングすることが可能なソフトウェア、データ処理装置及びデータ処理方法に係るものである。
近年、情報機器類やクラウド、ウェアラブル端末の急速な発達により、データを簡便に取得し、安価で蓄積することが容易になっている。
そのため、医療分野やヘルスケア分野において、個体から取得したバイタルサインや各種検査結果、臨床データ等の、多様な種類のデータを大量に収集し、ビッグデータを構成して、医療や健康に関する解析に用いることが試されている。
ここで、一般的に、取得した大量のデータでは、測定バイアスや誤入力等により、個々人のデータ精度のばらつきが出てしまう。そのため、医療・ヘルスケア分野に関する解析では、解析の信頼性を高める上で、データの精度検証を行い、信用できるデータか否かの検定を行うことが望まれる。
また、信用できるデータにするために、データの巨大集合やデータベースから有用な情報を抽出するデータマイニングという手法があるが、従来技術において、バイタルサインの測定値に対するデータマイニングの手法はなかった。
しかし、データの精度マネジメントを行う場合、個体から取得するバイタルサイン等においては、様々な状態のもとで、測定データが取得されることが考えられ、利用データの精度向上のために、極力取り除きたい測定バイアスや誤入力として、例えば次のような観点が必要となる。
(1)測定者バイアス:測定を行う測定者の技量に影響される測定データの精度。
(2)測定器バイアス:同じパラメータを測定する測定器または方法であっても、その種類や測定精度により影響される測定データの精度。
(3)測定状態のバイアス:興奮状態、緊張状態等安定していない個体状態での測定や、測定時の個体の体位等、測定状態により影響される測定データの精度。
(4)測定環境のバイアス:個体の状態や置かれた環境により、一時的に正常状態から測定値が外れる可能性のある状態、例えば、室内が熱い、作業後で発熱のある状態にある等により影響される測定データの精度。
(5)誤入力:測定結果を人為的に記録する際の入力ミスや、入力漏れ等により影響される測定データの精度。
(2)測定器バイアス:同じパラメータを測定する測定器または方法であっても、その種類や測定精度により影響される測定データの精度。
(3)測定状態のバイアス:興奮状態、緊張状態等安定していない個体状態での測定や、測定時の個体の体位等、測定状態により影響される測定データの精度。
(4)測定環境のバイアス:個体の状態や置かれた環境により、一時的に正常状態から測定値が外れる可能性のある状態、例えば、室内が熱い、作業後で発熱のある状態にある等により影響される測定データの精度。
(5)誤入力:測定結果を人為的に記録する際の入力ミスや、入力漏れ等により影響される測定データの精度。
このように従来、医療分野に関する解析等に供するデータについては、精度マネジメントを行い、一定の品質が保たれたクオリティデータを準備する必要があった。
また、データの精度マネジメントにおいて、取得した大量のデータが、信頼できるデータか否かを確認するために、取得したデータを集団データとして扱い、調査全期間を対象とした精度検定を行い、集団データそのものの有効性の可否を判定することが行われている。
この集団データにおける、調査全期間を対象とした精度検定では、個々人のデータを区別することはなく、取得した全員分のデータをまとめた集団データにおいて、その正規性の検定を行い、正規性を示した場合に、有効であると判定している。即ち、例えば、1万人分の平均体温データを収集し、この1万人分の集団データが、正規性を示すか否かを確認し、有効性を判定している。
また、一方で、本発明者らは、医療分野に関するデータについて、これまで鋭意研究を重ねることで、個体から測定したバイタルサインの値には個々人特有の個体内変動があり、個別化医療の実現に必要な「バイオマーカー」として利用しうることを発見し、これを用いた医療技術の開発を進めている(例えば、特許文献1、特許文献2及び特許文献3参照)。
この本発明者らによる手法は、日本医師会COVID-19有識者会議で「(37.5℃の一律の発熱基準ではなく、個々人の)平均値±2σ+0.5℃を発熱と考えるべきである」と提言される、また、厚生労働省が新型コロナに対する事務連絡に基づいていると認めるなど、新たな手法として認められつつある。
本発明者は、多くの文献で見られる集団のバイタルサインの分布と、文献にない個々人のバイタルサインの分布の違いに着目し、前者は「10歳から50歳前後の健康な男女3,000人以上の体温の平均値は、36.8℃±0.3℃」とした集団の正規性の記述しか無かったことに対し(図11参照)、本発明者が行った研究の結果、後者(個々人のバイタルサインの分布)は、個々人の体温、血圧、脈拍の経時的なバイタルデータの分布は、Aさん「平均体温36.5℃±0.9℃」、Bさん「平均体温37.3℃±1.0℃」といったように、個人由来の測定データが、ガウス分布に従う性質があることを確認し、論文発表している(図12参照)。
また、本発明者らは、一般的な個々人のバイタルサインの分布は、長期間データ取得した場合の分布はガウス分布に従う性質を示すが、1日1回の測定を、一か月間行うといった、所定の回数では、正規性を示す個人バイタルデータと、正規性を示さない個人バイタルデータがあることを確認している。これは、特定疾患によってガウス分布に従わない場合を除き、測定バイアスや誤入力が原因であると考えられた(特許文献1、特許文献2及び特許文献3においても言及)。
こうしたなか、従前のデータの精度マネジメントの内容から、研究対象となる有効なデータを取得するには、データの取得精度の良い対象機関を最初から選定するか、あるいは、対象機関に対する調査期間前や、期間中の精度マネジメントが必要となり、全ての取得データが有効となる訳ではなかった。
また、全データの精度が否定された場合は、性別や年齢、疾患等によるデータの階層化を行い、階層化した後の集団データに対して精度検定を行うことはあっても、個々人のデータに対して精度検定を行うことはなかった。
このようにデータ測定の精度マネジメントは、その多くが、集団データに対する精度検定であり、個々のデータ1つ1つに対する精度検定を行う事例は稀有である。そのため、集団データに、データの品質が保たれたクオリティデータが含まれていたとしても、そのデータは、信用できないごみデータと一緒に取り扱われてしまう。
例えば、A介護施設で取得したバイタルデータのうち、B看護師が優秀で、精度の高いバイタル測定を行い、クオリティデータを取得していたとしても、他のC看護師らの測定バイアスが大きければ、集団データとして検定された結果、B看護師の取得データも含めて、ごみデータ扱いされる可能性があり、データの二次利用ができないという課題があった。
即ち、データを簡便かつ安価に取得できる手段が出来たにも関わらず、その活用には、データ取得時の精度マネジメントが行われていることが条件となり、データを分析等に活用するための大きな支障となっていた。
また、集団データそのものの有効性の可否の判定において、集団データに対して、正規性が示されないと有効でない、とする従前の手法では、条件をクリアすることが困難であった。この結果、やはり、取得した大量のデータが活用しにくいものとなっていた。
さらに、従前のデータの取得方法及び分析方法では、過去に取得済の精度マネジメントがなされていないデータを、改めて目的を定めて、新たに活用することが難しかった。
即ち、目的に先行して、例えばウェアラブル端末等で、先にデータを収集しておいて、後のタイミングで目的を決めて、その目的に応じて、収集したデータを分類・加工して、分析等にデータを二次利用することが、現実的に困難であった。
本発明は、以上の点に鑑みて創案されたものであり、対象者から取得したガウス分布に従うバイタルサインの測定データに基づき、複数の個体から得られた精度不明もしくはバラバラのデータの集合体の中から、データ解析対象としての信用度の高いクオリティデータセットのみを容易にデータマイニングすることが可能なソフトウェア、データ処理装置及びデータ処理方法を提供することを目的とする。
上記の目的を達成するために、本発明のソフトウェアは、個体の識別情報を含む個体由来データと、個体から測定され、単一種類のデータであり、ガウス分布に従う性質を有する所定の測定データ、及び、個体に生じたイベントに関する情報であるイベントデータを、複数の個体から収集して、収集したデータの集合体から、特定のイベントの情報を含む集団のデータを抽出するためのソフトウェアであって、情報処理機器を、前記個体由来データと、同一個体から測定された前記所定の測定データ及び測定日時の情報と、同一個体に生じたイベント内容の情報、及び、イベントの発生日の情報を含む前記イベントデータの入力を受け付ける情報入力手段と、入力された前記所定の測定データ及び測定日時の情報と、前記イベントデータを、前記識別情報と紐づけて記録させる情報記録手段と、前記情報記録手段が、前記イベントデータを記録した後、同一個体について、記録されたイベントの発生日を基準とする所定の期間に測定された前記所定の測定データを、基準関連測定データとして抽出すると共に、そのイベントに関する前記イベントデータと、前記基準関連測定データを組み合わせて、イベント紐づけデータセットを生成し、前記情報記録手段に記録する紐づけデータセット生成手段と、前記情報記録手段に記録された、複数の個体についての、前記個体由来データと、前記所定の測定データ及び測定日時の情報、及び、前記イベント紐づけデータセットのデータの集合体の中から、特定の前記イベント内容の情報を含む、集団のデータである特定イベント集団データを抽出する集団データ抽出手段と、を含む手段として機能させるためのソフトウェアとして構成されている。
なお、本明細書において、ソフトウェアとは、コンピュータの動作に関するプログラムのことである。また、プログラムとは、コンピュータによる処理に適した命令の順番付けられた列からなるものをいう。
なお、本明細書において、ソフトウェアとは、コンピュータの動作に関するプログラムのことである。また、プログラムとは、コンピュータによる処理に適した命令の順番付けられた列からなるものをいう。
ここで、情報入力手段が、個体の識別情報を含む個体由来データの入力を受け付けることによって、測定データやイベントデータの由来となる個体について、識別情報を取得することができる。これにより、取集した集団のデータを利用する際に、測定データやイベントデータの由来となる個体を識別可能となる。
また、情報入力手段が、同一個体から測定され、単一種類のデータであり、ガウス分布に従う性質を有する所定の測定データと、測定日時の情報の入力を受け付けることによって、所定の測定データを個々の個体から収集して、複数の個体由来の集合のデータとすることができる。
なお、ここでいう「(所定の測定データが)ガウス分布に従う性質を有する」とは、周知の一般的な集団データの分布ではなく、同一の個体由来のデータの分布がガウス分布することを意味する。即ち、同一の個体から取得した、単一の種類のデータであり、一定数のデータを収集すると、データの分布が正規性を示す性質を意味する。また、「ガウス分布に従う性質」には、正規性を示さなくなる正当な理由がある測定値、つまり、(1)個体が特定の疾患にある場合の測定値(例えば、インフルエンザによる高体温)、(2)測定バイアスが生じた上での測定値が含まれる場合に、データの分布が正規性を示さなくなりうる性質を含んでいる。
また、ここでいう「個体」とは、単独の生物(ヒト又は動物)のことである。また、同一個体とは、例えばヒトであれば、同一人物のことをいう。
また、ここでいう「同一個体から測定された所定の測定データ」とは、情報入力手段での入力の段階で個体の区別が可能であることを意味している。例えば、1人の対象者が自分だけの所定の測定データを入力する態様や、複数の対象者の情報を取り扱う際に、特定の個人用の入力画面が表示されて所定の測定データを入力する態様、また、専用のアプリケーションソフトウェアを介して、個々人が自身のスマートフォン端末等から所定の測定データを入力する態様等、入力するための形式を異ならせて、個体を区別することが考えられる。
また、ここでいう「単一種類のデータ」とは、例えば、体温に関する測定データを対象とする場合には、同一個体から測定した体温のみのデータであり、同一個体から、体温に関する複数の測定データを取得して、これがガウス分布に従う性質を示すことになる。
また、情報入力手段が、同一個体に生じたイベント内容の情報、及び、イベントの発生日の情報を含むイベントデータの入力を受け付けることによって、識別情報と共に、個体に生じたイベントの情報を取得することができる。これにより、取集した集団のデータを利用する際に、集団のデータを、イベント内容の情報や、イベントの発生日の情報に応じて分類や加工することが可能となる。
また、情報入力手段が、個体由来データと、同一個体から測定された所定の測定データ及び測定日時の情報と、イベントデータの入力を受け付け、情報記録手段が、入力された所定の測定データ及び測定日時の情報と、イベントデータを、識別情報と紐づけて記録させることによって、同一個体に由来する、所定の測定データ及びイベントデータを、個体に紐づけた上で、蓄積することができる。
また、紐づけデータセット生成手段が、情報記録手段がイベントデータを記録した後、同一個体について、記録されたイベントの発生日を基準とする所定の期間に測定された所定の測定データを、基準関連測定データとして抽出することによって、同一個体に紐づいて記録されている全体のデータの中から、イベントデータと関わりのあるデータ群を、基準関連測定データとして抽出することが可能となる。
また、紐づけデータセット生成手段が、情報記録手段が、イベントデータを記録した後、同一個体について、記録されたイベントの発生日を基準とする所定の期間に測定された所定の測定データを、基準関連測定データとして抽出すると共に、そのイベントに関するイベントデータと、基準関連測定データを組み合わせて、イベント紐づけデータセットを生成し、情報記録手段に記録することによって、同一個体に生じたイベントの内容と、そのイベントデータと関わりのあるデータ群を、1つのデータのセットとして、データを蓄積することができる。
また、集団データ抽出手段が、情報記録手段に記録された、複数の個体についての、個体由来データと、所定の測定データ及び測定日時の情報、及び、イベント紐づけデータセットのデータの集合体の中から、特定のイベント内容の情報を含む、集団のデータである特定イベント集団データを抽出することによって、特定のイベント内容の情報を基準に、全体のデータの集合体から、一部のデータを抽出して、そのデータを分析に利用することが可能となる。即ち、例えば、特定のイベント内容の情報を持ったイベント紐づけデータセットを抽出して、この複数の個体に由来するイベント紐づけデータセットと、ある判定対象者となる個体から測定した基準関連測定データとの比較や分析を行うことが可能となる。また、ここでの抽出源となる「データの集合体」とは、例えば、記録された全てのデータだけでなく、年齢や性別、または、イベントデータを構成する各種情報等を抽出条件として、予めデータの範囲が一次抽出されたデータの集合体であってもよい。
また、集団データ抽出手段が、基準関連測定データについて、所定の正規性の検定を行い、そのP値が、P<0.01またはP<0.05を示す基準関連測定データをクオリティデータと判定する場合には、1つの個体に由来する、ある特定のイベント内容と関わりのあるデータ群について、これが正規性を示すか否かを確認することが可能となる。即ち、複数の個体から収集された個々の基準関連測定データについて、それぞれを、正規性を示すデータ群と、正規性を示さないデータ群に区別し、品質の保たれたクオリティデータと、ごみデータに分けて取り扱うことができる。なお、ここでいう「所定の正規性の検定」とは、例えば、コルモゴロフ-スミルノフ検定、リリフォース検定、シャピロ-ウィルク検定、ダゴスティーノ検定、オムニバス検定と、それらのP値を用いることができる。
また、集団データ抽出手段が、基準関連測定データについて、所定の正規性の検定を行い、そのP値が、P<0.01またはP<0.05を示す基準関連測定データをクオリティデータと判定すると共に、クオリティデータを有する個体のみで構成され、特定のイベント内容の情報を含む、特定イベント集団データを抽出する場合には、特定のイベント内容の情報を基準に、全体のデータの集合体から、基準関連測定データが、品質の保たれたクオリティデータである個体に由来するデータのみで構成された集団のデータを抽出して、そのデータを分析に利用することができる。
また、基準関連測定データに関する所定の期間が、イベントの影響のある影響期間より前の、影響期間から遡った一定期間である第1の期間を含む場合には、個体に生じたイベントの内容の影響が少ないと考えられる期間における、その個体から測定された所定の測定データから、基準関連測定データを取得することができる。即ち、例えば、イベントの内容の情報が、医療機関での受診であった場合、個体の体調に異常や何等かの症状が見られた上でのイベント発生になる。ここで、イベントの影響のある影響期間から遡った一定期間である第1の期間であれば、同期間中での所定の測定データは、体調の異常や症状の発生により影響を受けていない、または、影響が少ないと考えられる。そして、同期間であれば、上記の、ガウス分布に従う性質で言及した、正規性を示さなくなる正当な理由がある測定値(例えば、インフルエンザによる高体温)が含まれにくくなる。これにより、第1の期間のデータで、正規性の検定を行うことで、正規性を示さなくなる正当な理由がある測定値をなるべく排除して、基準関連測定データがクオリティデータか否かを判断することが可能となる。また、その上で、基準関連測定データがクオリティデータである個体に関して、そうした個体の複数のイベント紐づけデータセットを抽出して、医療分野等の分析に利用が可能であり、イベントの内容ごとに分類や加工が可能なデータ群を取得することができる。
また、第1の期間は、少なくとも、イベントの発生日の凡そ2か月前から、発生日の凡そ1か月前の期間である場合には、イベントの発生日を基準にした、一定の決まった期間から基準関連測定データを取得するものとなる。即ち、複数の個体において、同じ条件で抽出した期間中の測定データ群について、そのデータ群が、クオリティデータか否かを判断することができる。また、イベントの発生日の凡そ2か月前から、発生日の凡そ1か月前の期間は、イベントの発生日にある程度近い期間でありながら、個体に生じたイベントの内容の影響が少ない期間と考えられるため、基準関連測定データを、クオリティデータの判定対象として、より適切なものにできる。
また、イベント内容の情報が、少なくとも、個体が発病した疾患の名称及び/又は症状の情報と、個体に生じた病気関連の出来事の情報を含む場合には、個体の疾患や症状、病気に関連して生じたイベントの情報と共に、個体から測定した所定の測定データを蓄積し、分析等に利用することができる。この結果、所定の測定データとの関係での、疾病の発症リスクや、因子の解析、特定の因子の影響度等を分析することが可能となる。なお、ここでいう病気関連の出来事の情報とは、例えば、医療機関の受診、入院、診断、疾病の発症、死亡、退院、転院、病院内での転棟、施設の退所、観察レベルの変更、集中治療室(ICU)への入室・退室等が挙げられる。また、ここでの受診はさらに、服薬、点滴、酸素療法、経過観察等、細分化した項目を採用することもできる。
また、所定の測定データが、個体から測定され、体温、脈拍、血圧、脈圧、または、呼吸数の少なくともいずれか1つのバイタルサインの値であるバイタル情報における単一種類のデータである場合には、各種のバイタルサインの値を蓄積することができる。また、各種のバイタルサインの値を、個体に生じたイベントの内容の情報と共に、イベント紐づけデータセットとして、データを蓄積することができる。また、特定のイベント内容の情報を基準に、全体のデータの集合体から、一部のデータを抽出して、バイタルサインの種類ごとに、そのデータを分析に利用することができる。例えば、特定のバイタルサインやその数値の変動が、ある疾病の発症のリスクの因子となるか、または、その影響度等を分析する際に活用できる。
また、基準関連測定データに関する所定の期間が、イベントの発生日と、発生日より前の3日間と、発生日より後の3日間で構成された7日間である第2の期間を含む場合には、イベントに関連のあるデータ群、特に、イベントの内容に応じて、変動を生じている可能性のあるデータを、基準関連測定データとして、イベントの内容と共に、1つのデータのセットとして、データを蓄積することができる。また、イベントが発生した時やその前後において、その個体の測定データが、どういった挙動を示していたかを示す情報を取得することができる。例えば、所定の測定データがバイタルサインの値であれば、イベントに関して生じたバイタルサインの値の異常値は、イベント発生時(例えば入院時)ではなく、その数日前から発生することが想定される。そのため、第2の期間の測定データを抽出することで、イベントに関連した測定データの変動や異常値を捉え、データの分析等に利用することができる。
また、個体由来データが、個体の年齢、性別、または、既往歴の少なくともいずれか1つの情報を含み、集団データ抽出手段が抽出する特定イベント集団データが、個体の年齢、性別、または、既往歴の少なくともいずれか1つの情報と、所定の測定データ及び測定日時の情報、及び、イベント紐づけデータセットのデータから構成された場合には、個体を特定する情報(個体の識別情報)を含まないデータとして、特定イベント集団データを取り出すことが可能となる。即ち、情報記録手段に記録されたデータの中から、個人情報としての取り扱いが求められる「個体の識別情報」を含まない形式で、必要なデータをアウトプットすることができる。これにより、抽出された特定イベント集団データに関する利活用の自由度を、顕著に高めることができる。また、個体の年齢、性別、または、既往歴の少なくともいずれか1つの情報を用いて、抽出された特定イベント集団データの分析や加工を行うことができる。なお、個体から測定されたバイタルデータは、個体の識別情報と紐づいた形でデータ利用(データ取得)をする場合には、原則、個体本人の同意を得る必要がある情報(要配慮個人情報)であり、個体が特定できない匿名加工情報にしなければ簡単に利用することができない情報である。また、仮に、個体本人の同意を得たとしても、データの明確な利用目的を示さなければ、同意自体が無効になるという厳格な取り扱いがなされている。したがって、特定イベント集団データが、個体の識別情報を含まないことで、バイタルデータの解析等が行いやすくなる。
改正個人情報保護法では、匿名加工情報を施されていないバイタルサインは「要配慮個人情報」に該当し、これを利用するには、予め明確な利用目的を定めた上で、利用許可をデータ提供者一人ひとりから同意を得る必要がある。バイタルサインを一般的に匿名加工情報にする場合、最高値や最低値を削除するなど、データ分析が困難になる加工が必要とされる場合があり、分析データとしての価値が無くなる。よって従来、バイタルデータを利用する際は、データ収集の段階で、対象者全てから同意書を取得する必要があり、過去のデータを含む個人のバイタルデータの活用を困難にしていた。本発明では、個人を特定する一切の情報を取得しなくても、イベントデータと紐づけることにより、二次データとして加工し、活用することが出来る。例えば、「COVID-19で入院」というイベントと「体温:37.8℃」「酸素飽和度89%」「年齢67歳」「女性」「基礎疾患:糖尿病」というデータがあれば、個人を特定せずに、COVID-19の重症化に対するデータとして活用できるようになる。
また、上記の目的を達成するために、本発明のソフトウェアは、個体の識別情報と、個体における年齢、既往歴、または、性別の情報の少なくともいずれか1つを含む個体由来データと、個体から測定され、単一種類のデータであり、ガウス分布に従う性質を有する所定の測定データを、複数の個体から収集して、収集したデータの集合体から、特定の情報を含む集団のデータを抽出するためのソフトウェアであって、情報処理機器を、前記個体由来データと、同一個体から測定された前記所定の測定データ及び測定日時の情報の入力を受け付ける情報入力手段と、入力された前記所定の測定データ及び測定日時の情報を、前記識別情報と紐づけて記録させる情報記録手段と、同一個体について、前記情報記録手段に記録され、所定の基準日を基準とする所定の期間に測定された前記所定の測定データを、簡易基準関連測定データとして抽出し、前記情報記録手段に記録する簡易基準関連測定データ生成手段と、前記情報記録手段に記録された、複数の個体についての、前記個体由来データと、前記所定の測定データ及び測定日時の情報、及び、前記簡易基準関連測定データの集合体の中から、前記特定の情報を含む、集団のデータである特定集団データを抽出する集団データ抽出手段と、を含む手段として機能させるためのソフトウェアとして構成されている。
ここで、情報入力手段が、個体の識別情報と、個体における年齢、既往歴、または、性別の情報の少なくともいずれか1つを含む個体由来データの入力を受け付けることによって、測定データの由来となる個体について、識別情報と共に、年齢、既往歴、または、性別の情報の少なくともいずれか1つを取得することができる。これにより、取集した集団のデータを利用する際に、集団のデータを、年齢、既往歴、または、性別の情報で分類や加工することが可能となる。また、測定データの由来となる個体を識別可能となる。
また、情報入力手段が、同一個体から測定され、単一種類のデータであり、ガウス分布に従う性質を有する所定の測定データと、測定日時の情報の入力を受け付けることによって、所定の測定データを個々の個体から収集して、複数の個体由来の集合のデータとすることができる。
また、簡易基準関連測定データ生成手段が、同一個体について、情報記録手段に記録され、所定の基準日を基準とする所定の期間に測定された所定の測定データを、簡易基準関連測定データとして抽出することによって、同一個体に紐づいて記録されている全体のデータの中から、所定の基準日を基準とする所定の期間に測定されたデータ群を、簡易基準関連測定データとして抽出することが可能となる。
また、集団データ抽出手段が、情報記録手段に記録された、複数の個体についての、個体由来データと、所定の測定データ及び測定日時の情報、及び、簡易基準関連測定データの集合体の中から、特定の情報を含む、集団のデータである特定集団データを抽出することによって、特定の情報を基準に、全体のデータの集合体から、一部のデータを抽出して、そのデータを分析に利用することが可能となる。即ち、例えば、特定の内容の情報を持ったデータを抽出して、データの抽出元となった複数の個体のデータ群と、ある判定対象者となる個体から測定した簡易基準関連測定データとの比較や分析を行うことが可能となる。また、ここでの抽出源となる「データの集合体」とは、例えば、記録された全てのデータだけでなく、年齢や性別、または、何等かの情報を抽出条件として、予めデータの範囲が一次抽出されたデータの集合体であってもよい。
また、集団データ抽出手段が、簡易基準関連測定データについて、所定の正規性の検定を行い、そのP値が、P<0.01またはP<0.05を示す簡易基準関連測定データをクオリティデータと判定すると共に、クオリティデータを有する個体のみで構成され、特定の情報を含む、特定集団データを抽出する場合には、1つの個体に由来する、ある特定の情報と関わりのあるデータ群について、これが正規性を示すか否かを確認することが可能となる。即ち、複数の個体から収集された個々の簡易基準関連測定データについて、それぞれを、正規性を示すデータ群と、正規性を示さないデータ群に区別し、品質の保たれたクオリティデータと、ごみデータに分けて取り扱うことができる。なお、ここでいう「所定の正規性の検定」とは、例えば、コルモゴロフ-スミルノフ検定、リリフォース検定、シャピロ-ウィルク検定、ダゴスティーノ検定、オムニバス検定と、それらのP値を用いることができる。
また、所定の基準日が、情報入力手段により所定の測定データ及び測定日時の情報の入力が開始された日、または、任意の指定日であり、所定の期間は、前記所定の基準日を起点とした、凡そ1か月間の期間である場合には、測定データの入力を開始した日、または、ユーザが指定した任意の日付を基準日として、そこから遡った、凡そ過去1か月分の期間中の測定データを、簡易基準関連測定データとして抽出可能となる。または、ユーザが指定した任意の日付を基準日として、そこから先の、凡そ1か月分の期間中の測定データを、簡易基準関連測定データとして抽出可能となる。
また、上記の目的を達成するために、本発明のデータ処理装置は、個体の識別情報を含む個体由来データと、個体から測定され、単一種類のデータであり、ガウス分布に従う性質を有する所定の測定データ、及び、個体に生じたイベントに関する情報であるイベントデータを、複数の個体から収集して、収集したデータの集合体から、特定のイベントの情報を含む集団のデータを抽出するためのデータ処理装置であって、前記個体由来データと、同一個体から測定された前記所定の測定データ及び測定日時の情報と、同一個体に生じたイベント内容の情報、及び、イベントの発生日の情報を含む前記イベントイデータの入力を受け付ける情報入力手段と、入力された前記所定の測定データ及び測定日時の情報と、前記イベントデータを、前記識別情報と紐づけて記録させる情報記録手段と、前記情報記録手段が、前記イベントデータを記録した後、同一個体について、記録されたイベントの発生日を基準とする所定の期間に測定された前記所定の測定データを、基準関連測定データとして抽出すると共に、そのイベントに関する前記イベントデータと、前記基準関連測定データを組み合わせて、イベント紐づけデータセットを生成し、前記情報記録手段に記録する紐づけデータセット生成手段と、前記情報記録手段に記録された、複数の個体についての、前記個体由来データと、前記所定の測定データ及び測定日時の情報、及び、前記イベント紐づけデータセットのデータの集合体の中から、特定の前記イベント内容の情報を含む、集団のデータである特定イベント集団データを抽出する集団データ抽出手段とを備える。
また、上記の目的を達成するために、本発明のデータ処理方法は、個体の識別情報を含む個体由来データと、個体から測定され、単一種類のデータであり、ガウス分布に従う性質を有する所定の測定データ、及び、個体に生じたイベントの情報であるイベントデータを、複数の個体から収集して、収集したデータの集合体から、特定のイベントの情報を含む集団のデータを抽出するためのデータ処理方法であって、前記個体由来データと、同一個体から測定された前記所定の測定データ及び測定日時の情報と、同一個体に生じたイベント内容の情報、及び、イベントの発生日の情報を含む前記イベントイデータの入力を受け付ける情報入力工程と、入力された前記所定の測定データ及び測定日時の情報と、前記イベントデータを、前記識別情報と紐づけて記録させる情報記録工程と、前記情報記録手段が、前記イベントデータを記録した後、同一個体について、記録されたイベントの発生日を基準とする所定の期間に測定された前記所定の測定データを、基準関連測定データとして抽出すると共に、そのイベントに関する前記イベントデータと、前記基準関連測定データを組み合わせて、イベント紐づけデータセットを生成し、前記情報記録手段に記録する紐づけデータセット生成工程と、前記情報記録工程で記録された、複数の個体についての、前記個体由来データと、前記所定の測定データ及び測定日時の情報、及び、前記イベント紐づけデータセットのデータの集合体の中から、特定の前記イベント内容の情報を含む、集団のデータである特定イベント集団データを抽出する集団データ抽出工程とを備える。
また、集団データ抽出工程が、基準関連測定データについて、所定の正規性の検定を行い、そのP値が、P<0.01またはP<0.05を示す基準関連測定データをクオリティデータと判定すると共に、クオリティデータを有する個体のみで構成され、特定のイベント内容の情報を含む、特定イベント集団データを抽出する場合には、1つの個体に由来する、ある特定のイベント内容と関わりのあるデータ群について、これが正規性を示すか否かを確認することが可能となる。即ち、複数の個体から収集された個々の基準関連測定データについて、それぞれを、正規性を示すデータ群と、正規性を示さないデータ群に区別し、品質の保たれたクオリティデータと、ごみデータに分けて取り扱うことができる。なお、ここでいう「所定の正規性の検定」とは、例えば、コルモゴロフ-スミルノフ検定、リリフォース検定、シャピロ-ウィルク検定、ダゴスティーノ検定、オムニバス検定と、それらのP値を用いることができる。
また、上記の目的を達成するために、本発明のデータ処理方法は、個体の識別情報と、個体における年齢、既往歴、または、性別の情報の少なくともいずれか1つを含む個体由来データと、個体から測定され、単一種類のデータであり、ガウス分布に従う性質を有する所定の測定データを、複数の個体から収集して、収集したデータの集合体から、特定の情報を含む集団のデータを抽出するためのデータ処理方法であって、前記個体由来データと、同一個体から測定された前記所定の測定データ及び測定日時の情報の入力を受け付ける情報入力工程と、入力された前記所定の測定データ及び測定日時の情報を、前記識別情報と紐づけて記録させる情報記録工程と、同一個体について、前記情報記録工程で記録され、所定の基準日を基準とする所定の期間に測定された前記所定の測定データを、簡易基準関連測定データとして抽出し、前記情報記録手段に記録する簡易基準関連測定データ生成工程と、前記情報記録工程で記録された、複数の個体についての、前記個体由来データと、前記所定の測定データ及び測定日時の情報、及び、前記簡易基準関連測定データの集合体の中から、前記特定の情報を含む、集団のデータである特定集団データを抽出する集団データ抽出工程とを備える。
また、集団データ抽出工程は、簡易基準関連測定データについて、所定の正規性の検定を行い、そのP値が、P<0.01またはP<0.05を示す簡易基準関連測定データをクオリティデータと判定すると共に、クオリティデータを有する個体のみで構成され、特定の情報を含む、特定集団データを抽出する場合には、1つの個体に由来する、ある特定の情報と関わりのあるデータ群について、これが正規性を示すか否かを確認することが可能となる。即ち、複数の個体から収集された個々の簡易基準関連測定データについて、それぞれを、正規性を示すデータ群と、正規性を示さないデータ群に区別し、品質の保たれたクオリティデータと、ごみデータに分けて取り扱うことができる。なお、ここでいう「所定の正規性の検定」とは、例えば、コルモゴロフ-スミルノフ検定、リリフォース検定、シャピロ-ウィルク検定、ダゴスティーノ検定、オムニバス検定と、それらのP値を用いることができる。
本発明に係るソフトウェア、データ処理装置及びデータ処理方法は、対象者から取得したガウス分布に従うバイタルサインの測定データに基づき、複数の個体から得られた精度不明もしくはバラバラのデータの集合体の中から、データ解析対象としての信用度の高いクオリティデータセットのみを容易にデータマイニングすることが可能なものとなっている。
[本発明の第1の実施の形態]
以下、本発明の実施の形態について図面を参照しながら説明し、本発明の理解に供する。
図1は、本発明の第1の実施の形態として、本発明を適用したソフトウェアを導入した端末の概略構成を示す図である。なお、以下に示す構造は本発明の一例であり、本発明の内容はこれに限定されるものではない。
以下、本発明の実施の形態について図面を参照しながら説明し、本発明の理解に供する。
図1は、本発明の第1の実施の形態として、本発明を適用したソフトウェアを導入した端末の概略構成を示す図である。なお、以下に示す構造は本発明の一例であり、本発明の内容はこれに限定されるものではない。
[1.全体の装置構成について]
本発明を適用したソフトウェアは、汎用の情報処理機器に導入可能であり、組み込まれた情報処理機器に対して本発明の実施するために必要な各情報処理機能を付与する。この結果、スマートフォン端末等を介して、対象者の測定データを入力して、複数の対象者から、そのバイタルサイン等の値を収集し、情報を収集した解析端末3において、母集団データを構成するデータの中から、目的に応じたデータの抽出を行い、各種の解析に利用することができる。
本発明を適用したソフトウェアは、汎用の情報処理機器に導入可能であり、組み込まれた情報処理機器に対して本発明の実施するために必要な各情報処理機能を付与する。この結果、スマートフォン端末等を介して、対象者の測定データを入力して、複数の対象者から、そのバイタルサイン等の値を収集し、情報を収集した解析端末3において、母集団データを構成するデータの中から、目的に応じたデータの抽出を行い、各種の解析に利用することができる。
なお、情報処理機器とは、CPUなどの演算部と、RAMやROMなどの記憶部と、液晶画面等の表示画面や、キーボード等の入力部、インターネット等との通信を制御する通信部等を備えたものである。例えば、汎用のパーソナルコンピュータやタブレット端末、スマートフォン等である。また、情報処理機器としては、例えば、各種のヘルスケア機器や、病院や施設等に設置された医療システムや介護システムも対象となり、本発明を適用したソフトウェアがこれらに組み込まれて使用されるものでもよい。
本発明を適用したソフトウェアは、アプリケーションソフトウェアとして解析端末3に組み込まれており、母集団データから、指定されたイベント情報等を持つ集団のデータを抽出する機能を備えた解析端末を解析装置1とする。
図1に示すように、解析装置1(解析端末3)は、演算部2を備えている。演算部2は、解析装置1の有する各情報処理機能を実行する処理部である。即ち、本発明を適用したソフトウェアでは、解析端末3の演算部2を情報入力手段23、情報記録手段24、抽出条件設定手段100、データセット生成手段101、集団データ抽出手段102、判定処理手段6、有意差検定手段5等として機能させる。この各手段の処理機能により、情報の送受信、情報の記録、基準関連測定データの抽出、イベント紐づけデータセットの生成、クオリティデータ情報群の抽出、クオリティデータ情報群の有意差検定、母集団データから指定されたイベント情報等を持つ集団のデータの抽出、各種情報の通知、表示情報の作成や表示等を行う。
なお、解析端末3は、インターネットを介して、外部のサーバ、端末等にアクセス可能であり、外部のサーバや端末等との間で情報の送受信を行うことも可能である。
解析端末3は、情報記録部4と、情報送受信部3cと、入力部3aと、表示画面3bを有している。
情報送受信部3cは、演算部2、情報記録部4、入力部3a及び表示画面3b等の間での情報の送受信を担う部分である。また。解析端末3と、外部端末との間で情報の送受信可能に構成されるものであってもよい。
ここで、以下、本発明を適用したソフトウェアが取り扱う各情報が、必ずしも、解析端末3の情報記録部4に記録される必要はない。例えば、解析端末3の情報送受信部3cを介して、外部サーバや外部端末に各種情報を送信して記録させ、情報処理等の際に、外部サーバ等から必要な情報を受信する態様であってもよい。
更に言えば、解析端末3に、解析装置1の主要な構成が全て組み込まれる必要はない。例えば、解析端末3では、母集団データから指定されたイベント情報等を持つ集団のデータの抽出結果等の表示情報の表示のみを行い、各種情報の記録及び判定処理等は外部サーバ等で行う態様であってもよい。
本発明を適用したソフトウェアは、システム上の構成において、複数のバリエーションが存在しうる。以下、幾つかのバリエーションの事例を説明する。
(第1のシステム構成)
図1に示した解析端末3は、本発明を適用したソフトウェアを端末に導入して、端末単体で、情報の入力(外部端末から受信した入力測定データの入力を含む)、記録、抽出、抽出結果の表示、各種情報処理の基準の設定等が可能となっている。
図1に示した解析端末3は、本発明を適用したソフトウェアを端末に導入して、端末単体で、情報の入力(外部端末から受信した入力測定データの入力を含む)、記録、抽出、抽出結果の表示、各種情報処理の基準の設定等が可能となっている。
(第2のシステム構成)
図2では、第2のシステム構成として、本発明を適用したソフトウェア1aの機能を外部サーバに持たせた構成も採用しうる。ここでは、ユーザ端末50aや、外部端末50bが、インターネット30aを介して、情報管理サーバ32aにアクセス可能となっている。情報管理サーバ32aは、例えば、クラウド形式で提供される外部サーバであり、情報管理サーバ32a上で本発明を適用したソフトウェア1aの機能が利用しうる。
図2では、第2のシステム構成として、本発明を適用したソフトウェア1aの機能を外部サーバに持たせた構成も採用しうる。ここでは、ユーザ端末50aや、外部端末50bが、インターネット30aを介して、情報管理サーバ32aにアクセス可能となっている。情報管理サーバ32aは、例えば、クラウド形式で提供される外部サーバであり、情報管理サーバ32a上で本発明を適用したソフトウェア1aの機能が利用しうる。
情報管理サーバ2aは、情報記録部4a、情報送受信部3c、演算部2aを有している。また、演算部2aは、有意差検定手段5a、抽出条件設定手段100a、データセット生成手段101a、集団データ抽出手段102a、判定処理手段6aを有している。測定データの入力は、ユーザ端末50aや、外部端末50bを介して行い、各端末から入力された測定データが、情報管理サーバ32aに送信され、情報管理サーバ32a側で情報の記録、基準関連測定データの抽出、イベント紐づけデータセットの生成、クオリティデータ情報群の抽出、クオリティデータ情報群の有意差検定、母集団データから指定されたイベント情報等を持つ集団のデータの抽出等がなされる。抽出結果や、記録された情報は、ユーザ端末50aや、外部端末50bに送信され、各端末で確認することができる。このように、外部サーバ上にソフトウェア1aの機能を付与するシステム構成も採用しうる。
(第3のシステム構成)
図3では、第3のシステム構成として、本発明を適用したソフトウェア32bの機能以外に、複数のソフトウェア32c、32d等を有するモジュールAを備える管理端末70bの構成を示している。本発明を適用したソフトウェア32bは、これとは異なる各種機能を管理端末70bに実行させる他のソフトウェアと共に、1つのモジュールAを構成している。即ち、予め複数のソフトウェア32c、32d等が導入された管理端末70bのモジュールAに、ソフトウェア32bを組み込んで機能させることが可能である。例えば、電子カルテ等の医療システムの管理端末が備えるモジュールに本発明を適用したソフトウェアを組み込むこともできる。
図3では、第3のシステム構成として、本発明を適用したソフトウェア32bの機能以外に、複数のソフトウェア32c、32d等を有するモジュールAを備える管理端末70bの構成を示している。本発明を適用したソフトウェア32bは、これとは異なる各種機能を管理端末70bに実行させる他のソフトウェアと共に、1つのモジュールAを構成している。即ち、予め複数のソフトウェア32c、32d等が導入された管理端末70bのモジュールAに、ソフトウェア32bを組み込んで機能させることが可能である。例えば、電子カルテ等の医療システムの管理端末が備えるモジュールに本発明を適用したソフトウェアを組み込むこともできる。
このような第3のシステム構成では、管理端末70bに測定データを入力して、情報の記録、クオリティデータの判定、クオリティデータ情報群の抽出を行い、結果の情報を管理端末70b上で確認可能である。また、ユーザ端末60aや、外部端末60bと、管理端末70bを接続させて、ユーザ端末60aや、外部端末60bから測定データを入力して管理端末70bに送信し、管理端末70bで情報の記録、基準関連測定データの抽出、イベント紐づけデータセットの生成、クオリティデータ情報群の抽出、クオリティデータ情報群の有意差検定、母集団データから指定されたイベント情報等を持つ集団のデータの抽出等を行い、結果の情報をユーザ端末60aや、外部端末60bで受信して確認することもできる。このように、本発明を適用したソフトウェアは、複数のソフトウェアで構成されたモジュールの一部として機能させる構成も採用しうる。
以上のように、本発明を適用したソフトウェア(又は解析装置)のシステム上の構成は複数のバリエーションが存在する。なお、上記では、3つの例を中心に説明したが、本発明を適用したソフトウェア(又は解析装置)の構成はこれに限定されるものではなく、適宜設定することができる。
図1に示した解析端末3の使用態様を用いて、以下、詳細な構成の説明を続ける。なお、以下の説明では、解析の対象となる測定データとして、各種バイタルサインの値(バイタル情報)を用いる内容を一例に説明を行う。
[2.情報記録部]
図4に示すように、情報記録部4には、各種情報が記録されている。まず、情報記録部4には、バイタルサインを測定する対象者の各個人に由来する「個人単位の情報(以下、「個人単位情報7」と称する)」が記録される。
図4に示すように、情報記録部4には、各種情報が記録されている。まず、情報記録部4には、バイタルサインを測定する対象者の各個人に由来する「個人単位の情報(以下、「個人単位情報7」と称する)」が記録される。
また、情報記録部4には、複数の対象者についての個人単位情報7が、対象者を識別可能な識別情報に紐づけられて記録されている。つまり、情報記録部4は、複数の対象者に由来する、解析端末3で解析する対象となる「母集団データ情報群」が記録される部分にもなる。また、各個人に由来する個人単位情報7が、識別情報を介して、識別可能に記録されている。
即ち、例えば、情報記録部4には、個人における一人ずつの情報を含めて、それらの情報を、数十人~数百万人分収集した集団の情報が記録される。なお、ここで挙げる人数は、特に限定されるものではなく、数十人~数百万人分はあくまで一例である。
また、情報記録部4に記録される個人単位情報7には、対象者の生年月日の情報と、性別の情報を含む個人情報が含まれている。
なお、個人情報には、対象者の氏名の情報が含まれていてもよいが、個人情報の保護等の観点から、対象者の氏名の情報やその他対象者を特定できる直接的な情報を含めずに、各個人の、個人情報を構成するデータを収集する態様とすることができる。例えば、個人情報が、生年月日と性別の情報のみで構成されてもよい。
また、データ収集後の解析目的等に応じて、個人情報に、住所、居住エリア(例えば、住所のある県や地域名)、家族構成、趣味、嗜好、健康習慣、喫煙の有無、飲酒の有無等の詳細な情報を含めて、これらのデータが、個人ごとに、情報記録部4に記録されてもよい。
また、情報記録部4には、対象者からバイタル計測器で測定された、各種のバイタルサインの測定値と、その測定日時又は取得日時の情報で構成されたバイタル情報8が記録されている。即ち、個人ごとのバイタルサインの測定結果の情報が、その測定日時又は取得日時の情報と共に記録されている。
また、情報記録部4には、個人単位情報7及びバイタル情報8に紐づけた、個人を識別するための識別情報が記録されている。識別情報は、例えば、数字や記号等を組み合わせた識別コード情報等を採用することができる。
また、情報記録部4に記録される各種の情報は、個人ごとのユーザが所有するスマートフォン端末を用いて、専用のアプリケーションソフトウェアを介して情報の入力を受け付けることができる。また、解析端末3が有する入力部3a、情報送受信部3c及び情報入力手段24(図示せず)を介して入力や情報の修正が可能となっている。
例えば、個人ごとのユーザが所有するスマートフォン端末にダウンロードしたアプリケーションソフトウェアを介して、自身で測定したバイタルサインの測定値等が、個人の識別情報と共に、解析端末3の情報送受信部3cに送信され、情報記録部4に記録される。
このように、測定データの測定対象となる物が所有する端末等から測定データが送信され、個人ごとに送信してきたデータ(バイタル情報8)を収集して、解析端末3で情報処理を行うことが可能となる。
バイタル情報8には、体温、脈拍、収縮期血圧、拡張期血圧、脈圧及び呼吸数の測定値が含まれている。なお、バイタル情報8は、本発明で処理が可能な測定データの一例である。
また、バイタル情報8に含まれる測定日時又は取得日時とは、個人ごとのユーザがバイタル計測を行った日時を示す情報であり、例えば、対象者が自身でバイタル計測を行った際に確認した時間を入力するものである。また、バイタル計測器が、測定日時を示す形式のものであれば、実際にバイタル計測器等で表示または記録された時間の情報を採用することもできる。
また、バイタル計測器が、対象者の身体に装着可能なウェアラブル型の計測装置である場合、連続的に取得されるバイタルサインの取得日時であってもよい。このように、バイタル情報8に含まれる測定日時又は取得日時とは、必ずしも、厳密な計測時点の日時の情報だけでなく、ユーザが確認して、採用した時間の情報であってもよい。
また、バイタル情報8は、ガウス分布に従う性質を有する情報である。このガウス分布に従う性質とは、同一の対象者から取得した、単一の種類のデータであり、一定数のデータを収集する(例えば、Aさんから取得した体温のみで構成された、複数の日数分のデータの集合体)と、データの分布が正規性を示す性質を意味する。即ち、従前のデータの精度マネジメントに見られる、集団データの正規性(複数人のデータに関する正規性)ではなく、1つの個体由来の、1種類のデータで正規性を示すことを意味する。
また、「ガウス分布に従う性質」とは、次の、(1)個体が特定の疾患にある場合の測定値、(2)測定時に、極力取り除きたいバイアスが生じた上での測定値、及び、(3)データの値が異常値になる理由(例えば、発熱による高体温)がある測定値等が含まれる場合の各場合において、そのデータの集合体が、正規性を示さなくなりうる性質を含んでいる。即ち、各(1)~(3)の状態で取得されたバイタルサインの値が含まれる場合に、その測定値を含むデータの集合体が、正規性を示さなくなることがある性質を有している。
ここで、(3)データの値が異常値になる理由(例えば、発熱による高体温)がある測定値等が含まれる場合とは、例えば、対象者が何かの疾患を発症しており、発熱して高体温が測定されるようなケースであり、体温で高温が測定される理由(ここでは疾患の発症が理由になる)に基づき、異常な値が見られる場合を意味する。
また、ここで、バイタル情報を計測するバイタル測定器は、特に限定されるものではなく、各バイタルサインが測定可能であれば充分である。例えば、家庭用のバイタル測定器を使用してバイタルが計測されるものでもよい。更に言えば、バイタル情報が取得可能であれば、バイタル測定器を使用することは必須ではない。
また、バイタル情報8は、一定間隔ごとの測定ではなく、不規則な時間で測定した測定値を記録する構成も採用しうる。また、この不規則な測定の場合、例えば、1分間に複数のバイタル情報8を取得する、30分間に複数のバイタル情報8を取得する、1時間に複数のバイタル情報8を取得する、数時間に複数のバイタル情報8を取得する、1日に複数のバイタル情報8を取得する、数日中に複数のバイタル情報8を取得する、1週間に複数のバイタル情報8を取得する、数週間中に複数のバイタル情報8を取得する、1か月中に複数のバイタル情報8を取得する等、一定の期間で、複数のバイタル情報8を記録する構成としてもよい。
このように、バイタル情報8は、時間の長さや測定間隔の規則性の有無に関わらず、複数の測定データを記録可能に構成されている。
また、バイタル情報8は、例えば、1日1回、決まった時間帯に測定したバイタル情報として記録され、これを1日の代表値としてもよい。また、バイタル情報8は、例えば、1日に2回、午前と午後に測定した測定値から平均値を算出して、この平均値の値を、その日の代表値として、これを複数の日数分、収集するような態様としてもよい。さらに、ウェアラブル型の計測器であれば、一定時間、例えば、1時間ごとに測定を行い、その値から算出した平均値を、1日の代表値としてもよい。また一定時間における最高値や最低値を採用しても良い。
ここで、必ずしも、バイタル情報8は、1日1回、決まった時間帯に測定したバイタル情報が記録可能に構成される必要はなく、例えば、数日に1回の測定でもよい。また、後述するが、クオリティデータ情報群の有意差検定に利用するバイタル平均値、バイタル標準偏差の算出の処理において利用する一定のデータ数が記録されていれば、バイタル情報の記録回数は限定されるものではない。
[イベントデータ]
また、情報記録部4は、バイタルサインを測定する対象者の各個人に由来するイベントデータ9が記録される。イベントデータ9は、同一の対象者に生じたイベントごとに作成される。そのため、同じ対象者であっても、複数のイベントのイベントデータ9が記録される。
また、情報記録部4は、バイタルサインを測定する対象者の各個人に由来するイベントデータ9が記録される。イベントデータ9は、同一の対象者に生じたイベントごとに作成される。そのため、同じ対象者であっても、複数のイベントのイベントデータ9が記録される。
また、情報記録部4には、複数の対象者についてのイベントデータ9が、対象者を識別可能な識別情報に紐づけられて記録されている。つまり、情報記録部4には、イベントデータ9についても、個人の一人ずつの情報と、それらを数十人~数百万人分を収集した集団の情報が記録される。
また、情報記録部4に記録されるイベントデータ9は、具体的には、同一の対象者に生じたイベント内容の情報と、その各イベントの発生日の情報が含まれている。また、これらのイベントの内容の情報と、その各イベントの発生日の情報は、それぞれの対象者の識別情報と紐づけて記録される。
また、同一の対象者に生じたイベント内容の情報には、対象者に生じた「病気関連の出来事の情報」が含まれている。また、イベント内容の情報には、対象者が発病した「疾患の名称」や「症状の情報」が含まれることがある。
即ち、例えば、ここでいう「病気関連の出来事の情報」とは、医療機関の受診、入院、診断、疾病の発症、死亡、退院、転院、病院内での転棟、施設の退所、観察レベルの変更、集中治療室(ICU)への入室・退室等が挙げられる。また、ここでの「受診」はさらに、服薬、点滴、酸素療法、経過観察等、細分化した項目が含まれることがある。
また、ここでいう「疾患の名称」や「症状の情報」は、そのイベントが生じた際に、イベントに関連して記録すべき情報が存在した場合に、「病気関連の出来事の情報」と一緒に記録する情報である。
例えば、医療機関の受診、入院、診断等のイベントが発生した際に、対象者が医師に「具体的な疾患」であるとして診断を受けていれば、その疾患の名称が、イベントの種類(受診、入院、診断等)と一緒に、イベント内容の情報として記録される。
また、ここで、イベント内容の情報として、「疾患の名称」が、医療機関の入院、診断、疾病の発症等の病気関連の出来事の情報と一緒に、情報記録部4に記録された場合、対象者が発症した「既往歴」の情報として取り扱われるものとなる。
即ち、対象者が発症した疾患の名称が記録され、その対象者における、過去に罹患した疾患の情報として、情報が記録・蓄積されるものとなる。
また、例えば、同一の対象者が、過去に発症した疾患について、一定期間後に、同じ疾患を発症して、その疾患の名称が記録された場合には、回数の情報(例えば2回目)等と一緒に、再び、その対象者が発症した疾患の情報として、内容が記録・蓄積されるものとなる。
また、例えば、医療機関の受診、入院、診断等のイベントが発生した際に、対象者が、何等か症状を感じている場合には、その症状の内容の情報が、イベントの種類(受診、入院、診断等)と一緒に、イベント内容の情報として記録される。
また、症状とは、例えば、倦怠感、咳、痰、頭痛、味覚障害、嗅覚障害、呼吸不全、浮腫、チアノーゼ、痛み、動悸・めまい・しびれ・震え・麻痺、発熱、冷え、吐き気・おう吐、はれる・むくみ等がある。
このように、情報記録部4で、それぞれの対象者について、その対象者のイベントデータ9を記録することで、蓄積した母集団データから、指定されたイベント情報等を持つ集団のデータを抽出する等、解析の目的に応じて必要な情報を抽出することが可能となる。
[紐づけデータセット]
また、情報記録部4には、イベント紐づけデータセット10が記録されている。このイベント紐づけデータセット10とは、対象者に発生したイベントについて、そのイベントに関するイベントデータ9と、そのイベントの発生日を基準として、所定の期間に測定された「基準関連測定データ」が、組み合わされた、1つのデータセットである。
また、情報記録部4には、イベント紐づけデータセット10が記録されている。このイベント紐づけデータセット10とは、対象者に発生したイベントについて、そのイベントに関するイベントデータ9と、そのイベントの発生日を基準として、所定の期間に測定された「基準関連測定データ」が、組み合わされた、1つのデータセットである。
また、イベント紐づけデータセット10は、データセット生成手段101により、情報記録部4に記録されたイベントデータ9及びバイタル情報8の各データから抽出、生成される。
また、基準関連測定データには、イベントの発生日の凡そ2か月前から、同発生日の凡そ1か月前の期間である「第1の基準関連期間」に測定されたバイタル情報8が含まれている。これにより発病等のイベントに影響されないバイタル情報を得ることができる。
また、基準関連測定データには、イベントの発生日と、イベントの発生日より前の3日間と、イベントの発生日より後の3日間で構成された7日間である「第2の基準関連期間」に測定されたバイタル情報8が含まれている。これによりイベントの影響により変化したバイタル情報を得ることができる。
また、ここでの「第1の基準関連期間」に測定されたバイタル情報8とは、例えば、ある対象者が、COVID-19を発症して、医療機関に入院するというイベントが発生したとすると、入院した日が、イベントの発生日となる。
そして、入院した日を基準日として、入院日の2か月前から、入院日の1か月前までの、30日間分の体温の測定値が、このイベントにおける、第1の基準関連期間に測定されたバイタル情報8となる。
この入院日の2か月前から、入院日の1か月前までの、30日間分の体温は、対象者が、COVID-19を発症したという、イベントの内容に影響を受けていないバイタル情報8として取り扱うものとする。即ち、COVID-19を発症したことで変動した体温(影響を受けた体温)ではなく、その対象者において、そのイベントに影響されない状態の体温を示す情報として、取り扱うことができる。
なお、ここでいう、入院日の2か月前から、入院日の1か月前までの、30日間分の体温の測定値は、対象者が、毎日1回、体温を測定して、その測定データが情報記録部4に記録されたことが前提となる。ここで、体温の由来は、必ずしも、1日1回の測定に限定されるものではなく、30回以上のデータ、または、30日分のデータが収集できれば、その他の取得方法でもよい。
例えば、対象者が、2日に1回しか体温を測定しておらず、その測定データが情報記録部4に記録されていれば、入院日の1か月前から過去に遡って、入院日の約3か月前までの期間に記録された60日間で、30回分の体温を、第1の基準関連期間に測定されたバイタル情報8とすることもできる。
また、ここでのデータの個数は、厳密に「30日間分」の体温に限定されるものではなく、約1か月分のデータとして取得することも可能である。例えば、29日間分や、31日間分など、データの個数が、30日の前後の数で設定されてもよい。但し、ガウス分布に従う性質を確認しやすくする点から、少なくとも、30日間分のデータが揃っていることが好ましい。
また、「第1の基準関連期間」に測定されたバイタル情報8は、体温に限らず、脈拍、収縮期血圧、拡張期血圧、脈圧及び呼吸数の測定値について、各バイタルサインの種類ごとに抽出されるように構成されている。
また、ここでの「第2の基準関連期間」に測定されたバイタル情報8とは、ある対象者が、COVID-19を発症して、医療機関に入院するというイベントを例にすれば、入院した日を基準日として、入院した日を含まない過去3日間と、入院した当日(イベントの発生日)と、入院した日の翌日からの3日間、計7日間分の体温の測定値が、このイベントにおける、第2の基準関連期間に測定されたバイタル情報8となる。即ち、入院した日が真ん中となる1週間分の体温の測定値である。
この入院した日が真ん中となる1週間分の体温は、対象者が、COVID-19を発症したという、イベント内容に影響を受けたバイタル情報8として取り扱うものとする。即ち、COVID-19を発症したことで、その影響を受けて、対象者の平常時の体温ではなく、変動した体温が含まれる情報として取り扱うことができる。
ここで、例えば、対象者が入院や、特定の疾患であると診断された際には、そのイベントの原因となった疾患を発症したことで、対象者のバイタルサインの値は、イベントの発生日を基準に、イベント発生日が真ん中となる1週間の間に、疾患の発症の影響を受けた、バイタルサインの値の変動が生じることが考慮される。
例えば、イベント発生日に、体温の測定値に大きな変化がなくても、発生日の3日前や、発生日の3日後に、体温の急激な上昇が見られることもある。そのようなイベント前後におけるバイタルサインの異常を捉えるために、第2の基準関連期間として、イベントの発生日が真ん中となる1週間(7日間)が、バイタル情報8を含むデータセット化する情報として採用される。
なお、ここでいう、入院した日を含まない過去3日間と、入院した当日(イベントの発生日)と、入院した日の翌日からの3日間、計7日間分の体温の測定値は、対象者が、毎日1回、体温を測定して、その測定データが情報記録部4に記録されたことが前提となる。ここで、体温の由来は、必ずしも、1日1回の測定に限定されるものではなく、イベントの発生日の前後3日間のデータが含まれていれば、必ずしも、7日間分のバイタルが必要になるものではない。
例えば、対象者が、2日に1回しか体温を測定しておらず、その測定データが情報記録部4に記録されていれば、入院日の体温と、入院日より前の過去3日間のいずれかで記録された体温と、入院日より後の3日間のいずれかで記録された体温、即ち、7日間分には満たないが、入院日の前後3日間の情報を含んだ体温を、第2の基準関連期間に測定されたバイタル情報8とすることもできる。また、例えば、入院した日の当日に記録された体温のみを用いることも可能である。
このように、第2の基準関連期間におけるデータの個数は、「イベントの発生日の前後3日間を含む7日間分」の体温に限定されるものではない。但し、イベントの発生日の前後3日間で、より確実に、イベントの発生の影響を受けたバイタルサインの値の変動を確認する点から、イベントの発生日の前後3日間を含む7日間分のデータが揃っていることが好ましい。
また、「第2の基準関連期間」に測定されたバイタル情報8は、体温に限らず、脈拍、収縮期血圧、拡張期血圧、脈圧及び呼吸数の測定値について、各バイタルサインの種類ごとに抽出されるように構成されている。
また、対象者からのバイタル情報8の収集を継続的に行うことで、情報記録部4には、長期間にわたるバイタル情報8を蓄積することができる。ここで、上述した第1の基準関連期間、及び、第2の基準関連期間だけでなく、解析の目的に応じて、収集した全データの中から、任意で設定した特定の期間におけるバイタル情報8を抽出することもできる。
例えば、ある対象者における、特定のイベントの発生日を基準に、そのイベント発生日より前の1年間の期間におけるバイタル情報8を抽出する態様も考えられる。また、ここで示した期間は一例であり、その他の内容で、期間を任意で設定可能である。
[正規性の検定(クオリティデータの判定)]
本発明の集団データ抽出手段102は、イベント紐づけデータセット10に含まれる、第1の基準関連期間に測定されたバイタル情報8のデータについて、同期間のデータに対して、正規性の検定を行い、クオリティデータに該当するか否かの判定を行うように構成されている。
本発明の集団データ抽出手段102は、イベント紐づけデータセット10に含まれる、第1の基準関連期間に測定されたバイタル情報8のデータについて、同期間のデータに対して、正規性の検定を行い、クオリティデータに該当するか否かの判定を行うように構成されている。
即ち、1人ずつの対象者に生じたイベントデータ9ごとに、その対象者における、1つのイベントに関して、そのイベント発生日を基準に、イベントの発生日の凡そ2か月前から、同発生日の凡そ1か月前の期間である「第1の基準関連期間」に測定された、単一の種類のバイタル情報8に対して正規性の検定を行う。
また、本来ガウス分布に従う精度不明な同一個体のバイタルデータの中で、「第1の基準関連期間」に正規性が示されたデータセット群を、「クオリティデータ」であると判定する。(図5参照)。
例えば、ある対象者が、COVID-19を発症して、医療機関に入院するというイベントが発生した例であれば、入院日の2か月前から、入院日の1か月前までの、その対象者の「30日間分の体温の測定値」が、このイベントにおける第1の基準関連期間に測定されたバイタル情報8となる。また、この30日間分の体温について、正規性の検定を行う。
また、集団データ抽出手段102による正規性の検定では、シャピロ-ウィルク検定を用いることができる。ここで、バイタル情報8に含まれる体温、脈拍、収縮期血圧、拡張期血圧、脈圧及び呼吸数の測定値は、上述したように、ガウス分布に従う性質を有する情報である。
即ち、30日間分の体温は、(1)個体が特定の疾患にある場合の測定値、(2)測定時に、極力取り除きたいバイアスが生じた上での測定値、及び、(3)データの値が異常値になる理由(例えば、発熱による高体温)がある測定値等が含まれる場合の各場合に該当しない場合には、安定したバイタルデータとして、正規分布に従うデータである。
なお、ここでの「正規性の検定」では、シャピロ-ウィルク検定以外にも、既知の検定方が利用しうる。例えば、コルモゴロフ-スミルノフ検定、リリフォース検定、ダゴスティーノ検定、オムニバス検定と、各検定に基づき求められるP値を用いることができる。
ここで、本発明における正規性の検定は、次のような考え方に基づき行われる。
まず、安定した(異常を除く)バイタルデータを取得するために、第1の基準関連期間は、1つのイベントに関して、イベント発生日を基準に、イベントの発生日の凡そ2か月前から、同発生日の凡そ1か月前の期間という、発生したイベントの内容に影響を受けていないバイタル情報8を取得した期間である。このことから、上記(3)データの値が異常値になる理由(例えば、発熱による高体温)がある測定値に該当する場合のバイタルサインの測定値が含まれる可能性を、極力抑えることができる。
また、バイタル情報8を構成する、体温、脈拍、収縮期血圧、拡張期血圧、脈圧及び呼吸数の各種類のバイタルサインの値は、上記(1)個体が特定の疾患にある場合(疾患により正規分布しなくなる特定疾患患者)を除き、「安定したバイタルデータ」は、ガウス分布に従う性質を有している。
また、ここでいう「安定したバイタルデータ」とは、上記(2)に該当して、測定ミスや誤入力に基づくデータがある程度含まれていても、バイタルサインの測定期間が長ければ(例えば、数か月間分から1年間分のデータ)、その測定期間でのデータ群は、いずれ正規分布する性質を有している。
このことから、本発明では、精度不明なデータ群の中で、対象者における30日間分の体温の測定値のデータ群に対し、シャピロ-ウィルク検定に基づきP値を求め、P<0.01(またはP<0.05)と正規性を示せば、測定ミスや誤入力が少ないデータセット群と仮定し、クオリティデータであると判定するものとする(図5参照)。
即ち、本発明では、ガウス分布が確認されているデータ項目(体温等)において、取得データが、一定期間以下内(例:30日間)に正規性(例:P<0.01)と検定された場合、その取得データを「クオリティデータ」と判断する。また、ここでの取得データは、発生したイベントの影響を受けたバイタルサインの測定値(イベントの発生日とその前後の測定値)が除外されたデータと考えるものとする。
また、集団データ抽出手段102による正規性の検定では、第1の基準関連期間に測定された体温の30日間分のデータ群だけでなく、脈拍、収縮期血圧、拡張期血圧、脈圧及び呼吸数の、それぞれの種類ごとに、正規性の検定が行われる。
つまり、同一の対象者について、あるイベントが発生した場合、その特定のイベントにおける第1の基準関連期間に測定されたバイタル情報8は、体温、脈拍、収縮期血圧、拡張期血圧、脈圧及び呼吸数の、それぞれの種類ごとに、正規性の検定が行われる。また、同じ対象者でも、別のイベントデータ9が記録されていれば、その別のイベントについても、バイタル情報8のデータ群に対して、正規性の検定が行われる。
また、情報記録部4には、複数の対象者ごとに、各対象者におけるイベントデータ9が、それぞれ記録されている。つまり、1人ずつの対象者について、その対象者に発生した個々のイベント内容ごとに、第1の基準関連期間に測定された各種類のバイタルサインの測定値のデータ群が存在する。そして、そのようなデータ群が、複数の人数分、記録されている。
そのため、集団データ抽出手段102による正規性の検定を行うことで、複数の対象者について、それぞれの対象者ごとに、また、イベントごとに、第1の基準関連期間における、各種類のバイタル情報8のデータ群が、クオリティデータか否かを判定することができる(図5参照)。
また、集団データ抽出手段102による正規性の検定の対象となるデータ群は、抽出条件設定手段100を介して、対象となるデータの範囲を適宜、設定することができる。即ち、情報記録部4に記録された全データを対象とするだけでなく、データを抽出する条件を設定して、あらかじめ、正規性の検定を行うデータ範囲を、適宜変更することができる。
例えば、対象者の年代、性別、特定のイベント内容の情報の有無、特定の疾患の既往歴の有無、特定の症状の有無等、情報記録部4に記録された各情報を元に、データを抽出する条件を設定して、正規性の検定を行うデータ範囲を決めることもできる。また、データを抽出する条件は、上述した内容に限定されず、個人単位情報7やイベントデータ9を構成しうる各種情報を元に、条件を設定することも可能である。
さらに、バイタル情報8の取得期間や、バイタル情報8に対する解析結果を元に、データを抽出する条件を設定することも可能である。
このような集団データ抽出手段102による正規性の検定を行うことで、収集した複数人分のデータ、例えば、数十人~数百万人分に関するイベント紐づけデータセット10(イベントデータ9と基準関連測定データ)が集積されたデータの集合体に対して、各データ群を、「クオリティデータ」と、「ゴミデータ」で区別して、クオリティデータが抽出可能な対象者のみを、解析の対象とすることができる。
例えば、図6に示すように、1億人分のデータを、情報記録部4に記録された出発点の全データ(クラウドで集積されている全データ)として、イベントデータ9のイベント内容の情報として、「心不全になった患者(診断または入院)」のイベント内容の情報が記録された対象者のデータを抽出して、1000万人に絞り込む。
そして、この1000万人分の、個々のイベント内容ごとに、第1の基準関連期間に測定されたバイタル情報のデータ群につき、集団データ抽出手段102による正規性の検定を行い、800万人のバイタル情報のデータ群はゴミデータ、200万人のバイタル情報のデータ群はクオリティデータと区別する。
また、200万人のクオリティデータの由来となった200万人の対象者から、年齢を基準に50代の対象者20万人を抽出する。さらに続けて、50代の対象者20万人から、糖尿病の既往歴を有する6万人を絞り込む。
このように、個人単位情報7や、イベントデータ9を構成する各情報を用いて、収集したデータを段階的に分類・抽出すると共に、集団データ抽出手段102による正規性の検定のステップを入れることで、目的に応じた対象者(ここでは、心不全になり、かつ、糖尿病も発症した50代の対象者)で、クオリティデータが取得可能な対象群を特定することが可能となる。なお、図6に示す絞り込みの内容は、あくまで一例であり、本発明においては、これ以外の内容での情報の分類・抽出及び絞り込みを行うことが可能である。
このように、収集した膨大なデータの集合体から、イベントデータ9の内容と関連づけて、クオリティデータが取得可能な対象群(複数の対象者)を特定できることで、バイタルサインの測定値の生データ(一次データ)だけでは、単なるデータの寄せ集めで、アウトカムに対する分析が困難であったものが、イベントデータ9を含むイベント紐づけデータセット10により、各疾患別や各イベント別などの分析が容易となる二次データに加工することが可能となる。
また、個人単位情報7には、個人の氏名の情報を含めず、性別と生年月日の情報を利用することで、個人情報が直接的に流出するリスクを回避しながら、収集したデータ解析が可能となる
また、先にデータを収集しておき、後に、利用目的に応じて、収集したデータの中から、必要な情報を分類・抽出して、データ解析に利用することも可能となる。なお、データ解析の一例については、後述する。
[抽出条件設定手段]
抽出条件設定手段100は、本発明を適用したソフトウェアが演算部2に実行させる機能の1つであり、収集した各種データから、種々の条件を設定して、データを抽出する部分である。抽出条件は、情報記録部4において、抽出の根拠となる各種情報が、個人の識別情報と紐づけて記録されていれば利用可能となる。
抽出条件設定手段100は、本発明を適用したソフトウェアが演算部2に実行させる機能の1つであり、収集した各種データから、種々の条件を設定して、データを抽出する部分である。抽出条件は、情報記録部4において、抽出の根拠となる各種情報が、個人の識別情報と紐づけて記録されていれば利用可能となる。
また、抽出条件は、解析データを利用したい用途に応じて、その内容を適宜設定することができる。また、単一の抽出条件での抽出に限らず、複数の抽出条件を組み合わせて設定することも可能である。さらに、適宜、個人単位情報7、イベントデータ9、バイタル情報8として取得するデータの種類を追加して、データを収集し、これに対して、追加したデータの種類に基づき抽出条件を設定して、母集団となるデータから、データを抽出することも可能である。
[有意差検定手]
有意差検定手段5について説明する。有意差検定手段5は、本発明を適用したソフトウェアが演算部2に実行させる機能の1つであり、集団データ抽出手段102による正規性の検定により、クオリティデータが取得可能な対象群を特定できた後に、その対象群に由来するデータが、母集団から選ばれた標本データとして有用であるかの検定を行う部分である。
有意差検定手段5について説明する。有意差検定手段5は、本発明を適用したソフトウェアが演算部2に実行させる機能の1つであり、集団データ抽出手段102による正規性の検定により、クオリティデータが取得可能な対象群を特定できた後に、その対象群に由来するデータが、母集団から選ばれた標本データとして有用であるかの検定を行う部分である。
即ち、クオリティデータが取得可能な対象群のバイタル情報8を、その後の解析で、母集団から選ばれた標本データとして、利用しうるものかを確認する部分である。
一般的に、あるデータ群を、母集団データの「標本」とみなすには、無作為(ランダム)抽出されたものか、母集団データと同条件で取集されたデータという条件が求められる。そこで、本発明では、クオリティデータ、ゴミデータのそれぞれのデータ群の平均値と分散と、母集団データの平均値と分散とを比較し、同条件であることを証明するものとする。
この有意差検定手段5は、集団データ抽出手段102が、正規性の検定を行った際に、クオリティデータが取得可能な対象群における第1の基準関連期間のデータ群(以下、「クオリティデータ情報群」と称する。)と、クオリティデータでないゴミデータが取得された対象群における第1の基準関連期間のデータ群(以下、「比較対象データ群」と称する)との間で、有意差を検定する。
ここで、クオリティデータ情報群は、クオリティデータが取得できた複数の対象者における第1の基準関連期間のデータの集合体である。また、比較対象データ群は、クオリティデータが取得できなかった複数の対象者における第1の基準関連期間のデータの集合体である。
また、クオリティデータ情報群と、比較対象データ群を足し合わせたものが、検定母集団データ情報群となる。ここで、検定母集団データ情報群は、正規性の検定を行った対象のデータ範囲の、全対象者における第1の基準関連期間のデータの集合体である。
そのため、正規性の検定を行った対象が、情報記録部4に記録された全対象者であれば、その全対象者における第1の基準関連期間のデータの集合体が、検定母集団データ情報群となる。また、正規性の検定を行った対象が、情報記録部4に記録された全対象者のうちの一部の対象者であれば、その一部の対象者の、全員の第1の基準関連期間のデータの集合体が、検定母集団データ情報群となる。
続いて、バイタル情報に関するクオリティデータ情報群における有意差検定の詳細について説明する。
図4に示すように、本発明を適用したソフトウェアは、演算部2を、有意差検定手段5を構成する平均値算出手段14、標準偏差算出手段15、として機能させる。
また、平均値算出手段14及び標準偏差算出手段15は、情報記録部4に記録されたバイタル情報8(体温、脈拍、収縮期血圧、拡張期血圧、脈圧、呼吸数及び酸素飽和度の測定値)に基づき、集団データ抽出手段102が、正規性の検定を行った際の、それぞれの種類のバイタルサイン(例えば、体温)について、クオリティデータ情報群の抽出の由来となったデータ群の「バイタル情報の平均値」と、同データ群のバイタル情報を統計した分布における「バイタル情報の標準偏差」を、それぞれ算出する。
本方法では、バイタル平均値とバイタル情報の分布に基づく標準偏差は、平均値算出手段14及び標準偏差算出手段15において、以下の式(1)及び式(2)を用いて算出される。
μ=(1/N)×ΣSi・・・式(1)
σ=√((1/N)×Σ(Si-μ)2)・・・式(2)
ここでμはバイタル情報の平均値、Siは各バイタル情報の計測値、Nは全バイタル情報のデータ数であり、σは標準偏差である。ΣSiは、全バイタル情報の計測値の合計を示す。
σ=√((1/N)×Σ(Si-μ)2)・・・式(2)
ここでμはバイタル情報の平均値、Siは各バイタル情報の計測値、Nは全バイタル情報のデータ数であり、σは標準偏差である。ΣSiは、全バイタル情報の計測値の合計を示す。
また、ここでのバイタル情報の平均値と、バイタル情報の標準偏差は、バイタル情報8を構成する種類(体温、脈拍、収縮期血圧、拡張期血圧、脈圧、呼吸数及び酸素飽和度)のそれぞれについて算出可能である。
即ち、体温に基づき、有意差検定を行うのであれば、体温についての、クオリティデータ情報群を構成するデータ群に対する、体温の平均値と、体温の標準偏差が算出される。また、体温についての、比較対象データ群を構成するデータ群に対する、体温の平均値と、体温の標準偏差が算出される。また、検定母集団データ情報群を構成するデータ群に対する、体温の平均値と、体温の標準偏差が算出される。
また、有意差検定手段5は、抽出条件で体温を選択した場合、その体温について、クオリティデータ情報群の「体温の平均値」と、比較データ情報群の「体温の平均値」とを比較して、いずれが、検定母集団データ情報群の「体温の平均値」の値に近いかを判定する。
また、有意差検定手段5は、抽出条件で体温を選択した場合、その体温について、クオリティデータ情報群の「体温の標準偏差」と、比較データ情報群の「体温の標準偏差」とを比較して、いずれが、検定母集団データ情報群の「体温の標準偏差」の値に近いかを判定する。
この有意差検定手段5の比較および判定により、クオリティデータ情報群の「体温の平均値」と「体温の標準偏差」が、比較データ情報群の値よりも、検定母集団データ情報群の値に近ければ、クオリティデータ情報群と比較データ情報群の間に、有意差があるとの検定を行うことができる。
このように、クオリティデータ情報群と比較データ情報群の間に、有意差があると判定されれば、クオリティデータが取得可能な対象群のバイタル情報8を、その後の解析で、母集団から選ばれた標本として利用することができる。
ここで、上述した内容では、体温に基づき有意差検定を行っているが、体温以外の種類のバイタル情報8で、有意差検定を行うこともできる。
また、必ずしも、本発明において、集団データ抽出手段102による正規性の検定により、クオリティデータが取得可能な対象群を特定できた後に、有意差検定手段5で、有意差検定を行う必要はない。有意差検定は、データの解析の目的に応じて、クオリティデータが取得可能な対象群のバイタル情報8につき、標本としての使用可否を求められる場合に、適宜しようすることができる。
続いて、本発明を適用したソフトウェアを機能させる際に使用する装置や、入力画面の具体的な内容について説明する。
例えば、図7(a)に示すように、バイタル情報の取得は、ウェアラブル型のバイタル測定器21aや、体温計21b等で行い、これらで計測した測定値を、測定した時間の情報と共に、個人のスマートフォン端末等の外部端末を介して入力する。入力された情報は、インターネットを介して、解析端末3側に送信される。
また、図7(b)では、バイタル情報をスマートフォン端末22aや、パーソナルコンピュータ端末22b(以下、「PC端末22」と称する)から、上述の第2のシステム構成で述べた外部サーバである情報管理サーバ32aにアクセスして、スマートフォン端末22aやPC端末22bからバイタル情報の入力を行うこともできる。
ここで、本発明の第1の実施の形態では、対象者の各個人に由来するイベントに関する情報を利用する構成となっているが、本発明の内容はこれに限定されるものではない。即ち、上述した本発明の第1の実施の形態とは異なり、イベントデータを利用しない形での、本発明の第2の実施の形態も本発明では採用しうる。
以下、本発明の第2の実施の形態について、上述した本発明の第1の実施の形態と異なる点を中心に説明を行う。また、本発明の第2の実施の形態は、基本的な構成は、本発明の第1の実施の形態と同様である。
まず、本発明の第2の実施の形態では、情報記録部4に、個人単位情報7が記録される。個人単位情報7には、個体の識別情報と、個体における年齢、既往歴、または、性別の情報の少なくともいずれか1つの情報が含まれている。
また、情報記録部4には、イベントデータ9は記録されていない。また、これに伴い、情報記録部4には、イベント紐づけデータセット10も記録されていない。
また、情報記録部4には、「所定の基準日」を基準として、所定の期間に測定された「簡易基準関連測定データ」が記録されている。この簡易基準関連測定データは、本発明の第1の実施の形態における、基準関連測定データの代わりに用いられる情報である。
より詳細には、この簡易基準関連測定データは、以下のような内容で設定することが可能である。
まず、所定の基準日は、(1)情報入力手段を介して、情報記録部4に、バイタルサイン等の入力が開示された日、または、(2)ユーザが任意で設定した日付として設定することができる。
また、所定の期間は、例えば、所定の基準日が、(1)情報入力手段を介して、情報記録部4に、バイタルサイン等の入力が開示された日である場合には、情報の入力が開始された日から先の、凡そ1か月間の期間を採用することができる。また、ここでの1か月間は、情報の入力が開始された日を含む期間と、情報の入力が開始された日を含まない期間の両方を採用することができる。
また、所定の期間は、例えば、所定の基準日が、(2)ユーザが任意で設定した日付である場合には、任意で設定した日付より過去の凡そ1か月間と、任意で設定した日付から先の、凡そ1か月間の期間を採用することができる。即ち、任意の日付から見て、過去の期間と、先の期間の両方を採用することができる。また、ここでの1か月間は、任意の日付を含む期間と、任意の日付を含まない期間の両方を採用することができる。
上記の内容で設定された、簡易基準関連測定データは、個体から測定されたバイタルサインの値についての一定のデータ群となり、同期間のデータに対して、正規性の検定を行い、クオリティデータに該当するか否かの判定を行うように構成されている。即ち、本発明の第1の実施の形態における、第1の基準関連期間に測定されたバイタル情報8のように、クオリティデータに該当するか否かの判定の対象となる。なお、正規性の検定(クオリティデータの判定)については、本発明の第1の実施の形態と同様の手法を採用して行うことができる。
このように、本発明の第2の実施の形態でも、各個体に由来する簡易基準関連測定データが、クオリティデータに該当するか否かの判定の対象となり、データの集合体に対して、各データ群を、「クオリティデータ」と、「ゴミデータ」で区別して、クオリティデータが抽出可能な対象者のみを、解析の対象とすることができる。
また、本発明の第2の実施の形態では、収集した複数の個体に由来する集団のデータの集合体に対して、個人単位情報7に含まれる情報や、バイタル情報8に基づき、データの解析を行うことができる。ここでは、個人単位情報7に含まれる年齢、既往歴、または、性別の情報などが、データの分類・区別するための「特定の情報」として利用される。
即ち、例えば、情報記録部4に記録された集団データの中から、年齢層ごとの高血圧のデータを取得したいときには、集団データの中から、クオリティデータが抽出可能な対象者のみを抽出して、クオリティデータの対象者のデータ群について、年齢層で分類し、平均値や標準偏差等、必要に応じた情報を取得することができる。
このように、本発明の第2の実施の形態では、個体に生じたイベントの情報等とは関係なく、大量に取得したバイタルデータを活用することが可能となる。
続いて、本発明の第1の実施の形態について、その利用事例について、以下説明する。
図8に、本発明を利用する流れの一例を示す。図8に示すように、本発明では、本発明を利用する複数のユーザが、経時的に、体温等のバイタルサインの測定を行い、自身の所有するスマートフォン端末等を介して、バイタル情報の入力を行う。入力されたデータは、情報記録部(例えば、端末内部だけでなく、クラウドに記録されてもよい)に記録されていく。
図8に、本発明を利用する流れの一例を示す。図8に示すように、本発明では、本発明を利用する複数のユーザが、経時的に、体温等のバイタルサインの測定を行い、自身の所有するスマートフォン端末等を介して、バイタル情報の入力を行う。入力されたデータは、情報記録部(例えば、端末内部だけでなく、クラウドに記録されてもよい)に記録されていく。
また、各ユーザにおいて発生したイベントのイベントデータも記録される。例えば、図8の左側に示すように、年齢(52歳)、性別(男性)、基礎疾患(なし)のユーザが、病院で受診したイベントがあった場合、そのユーザの個人単位情報と共に、イベントデータとして、受診日と、受診の根拠となった疾患、または、診断結果の疾患の名称(糖尿病)、イベント内容の情報として、契機(受診)の各情報が記録される。
また、図8の真ん中に示すように、年齢(55歳)、性別(男性)、基礎疾患(糖尿病)のユーザが、COVID-19(新型コロナ)を発症して病院に入院したイベントがあった場合、ユーザの個人単位情報と共に、イベントデータとして、入院日と、入院の根拠となった疾患の名称(コロナ)、イベント内容の情報として、契機(入院)の各情報が記録される。
また、入院した日を基準に、第1の基準関連期間のバイタル情報、及び、第2の基準関連期間のバイタル情報を抽出して、入院時のイベントデータと共に、1つのイベントデータセットとして、クラウドに記録される。
なお、上述した糖尿病での受診のイベントでも、図示しないが、同様に、抽出されたバイタル情報が、イベントデータと共に、1つのイベントデータセットとして、クラウドに記録される。
こうして、図8の右側のフロー図に示すように、あるユーザ(Aさん)のイベント付きのバイタルデータがクラウドに集積され、同様に、多くのユーザのイベント付きバイタルデータ群が集積される。
そして、データ解析の目的、ここでは、ほしいアウトカムとして、「コロナでの入院」を設定した場合、指定されたイベント情報(イベント内容の情報に「コロナで入院」を含む)を持つ集団のデータを抽出することができる。
また、指定されたイベント情報を持つ集団のデータには、個々のイベントデータセットに、入院した日を基準とした、第1の基準関連期間のバイタル情報、及び、第2の基準関連期間のバイタル情報が含まれている。また、入院時の症状や、ユーザの既往歴等も含まれることがある。
そのため、イベントデータセットに含まれる特定の期間のバイタル情報、症状、既往歴等を解析することで、コロナで入院するというイベントの発生に関して、集団データから、因子と影響度を割り出し、リスク要因を決定することができる。
図8に示す流れを、もう少し詳細に、イベントデータセットの準備(図9参照)と、データの活用(図12参照)に分けて示す。
図9に示すイベントデータセットの準備では、ステップ1~ステップ4は、図8で説明したような内容である。ここで、ステップ5に示すように、イベント発生日を基準とした「第1の基準関連期間」のバイタル情報に対する正規性の検定より、クオリティデータを取得可能な対象者群を抽出する。
そして、ステップ6に示すように、クラウドに集積されたデータの中から、クオリティデータを取得可能な対象者群のデータ群(バイタル情報、症状、既往歴等)に対して、イベント発生時(コロナでの入院)のロジスティック回帰分析を行い、疾患(コロナ)に対する因子(バイタルサインの種類、症状、既往歴)の影響度を算出する。
また、図10に示すデータの活用では、ステップ1に示すように、得たいアウトカムは「PCR陽性のBさんがどのよう状態になったらコロナで入院すべきか?」とする。
また、ステップ2で、「コロナで入院」をイベントデータに含み、クオリティデータを取得可能な対象者群のデータ群に対して、クラウドより、Bさんと同じ性別や年齢層、既往歴のデータ群を抽出し、コロナに対する因子(各バイタル項目や症状、既往歴)と、その影響度が判明する。
これにより、ステップ3で、Bさんの「ハイリスク係数(既往歴)」及び「バイタル因子」、「症状因子」により、そのデータ取得時点のリスク度が分かる。即ち、Bさんから、バイタル情報の入力があった時点における、コロナで入院すべきか否かについて、リスク度を確認することができる。
つまり、ステップ4に示すように、Bさんは、バイタル情報、症状データにより(過去にコロナ罹患が無くても)、例えば、自宅療養の状態から、入院すべきタイミングが判明する。
また、上記の内容では、コロナで入院するか否かの段階の、患者候補のユーザに対する活用の例を示したが、本発明は、さらに、バイタル情報、症状、基礎疾患(既往歴)のデータと、血液検査や画像検査の検査結果のデータを組み合わせて、コロナの程度につき、中等症(人口呼吸器治療)、及び、重等症(エクモ治療)に該当するかを判定することもできる。
さらに、本発明では、コロナ以外の疾患について、医療介入(投薬、治療等)が必要かどうか、または、入院すべきか否かの判定用のデータ解析を行うこともできる。
例えば、特定の疾患として、「心不全」について判定する場合、対象となるイベント内容の情報は、「医療介入」、または、「入院」とする。これらをイベントデータに含み、クオリティデータを取得可能な対象者群のデータ群に対して、クラウドより、判定対象のユーザと同じ性別や年齢層、既往歴のデータ群を抽出する。
これにより、心不全に関係するバイタル情報の種類(バイタル因子)は、脈拍、収縮期血圧、拡張期血圧であると導き出せる。また、既往歴の因子としては、高血圧、糖尿病、肥満、または、動脈硬化であると導き出せる。このように、疾患種類に応じて、データ解析により、バイタル情報、症状、既往歴等で、関連性の高い因子を割り出すことができる。
また、本発明を用いたデータの抽出後のデータ解析では、本発明者らが発明した、バイタルデータに基づく異常判定や、バイタルスコアリング、個人ごとの基準域情報の設定等の技術(特許文献1、特許文献2及び特許文献3参照)を組み合わせて、解析を行うことができる。
また、本発明を適用したソフトウェア、データ処理装置、またはデータ処理方法は、一例になるが、以下のような用途が挙げられる。
(1)PCR検査で陽性の患者を、いつ病院に搬送すべきかの判断を、患者のバイタル・症状より判定する用途に利用できる。
(2)保険会社が、特定疾患に対する保険料率を設定する際に、被保険者の経時的なバイタルと現病歴のデータより、同じ疾患の対象群との比較を行い、重症化リスクを算定して、保険料率を計算する。
(3)中国で取得したバイタル情報と、イベントデータに関する生データを入手し、そのデータの中から、クオリティデータが取得可能な対象群を分類し、イベント(例:疾患別・肺炎の入院など)ごとに因子を知りたい際に、二次データとしての加工が可能になる
(2)保険会社が、特定疾患に対する保険料率を設定する際に、被保険者の経時的なバイタルと現病歴のデータより、同じ疾患の対象群との比較を行い、重症化リスクを算定して、保険料率を計算する。
(3)中国で取得したバイタル情報と、イベントデータに関する生データを入手し、そのデータの中から、クオリティデータが取得可能な対象群を分類し、イベント(例:疾患別・肺炎の入院など)ごとに因子を知りたい際に、二次データとしての加工が可能になる
また、本発明を適用したソフトウェア、データ処理装置、またはデータ処理方法は、一例になるが、以下のような各種のデータ単位に対して、検定を行うことができる。
(1)1つ1つのデータ単位。例えば、Aさんのコロナ入院の血圧データは信頼できるという検定。
(2)人単位。Bさん(看護師)が測定した患者群のデータは信用できるという検定。
(3)グループ単位(例:施設単位)。C施設で測定された患者群のデータは信用できるという検定。
(2)人単位。Bさん(看護師)が測定した患者群のデータは信用できるという検定。
(3)グループ単位(例:施設単位)。C施設で測定された患者群のデータは信用できるという検定。
本発明を適用したソフトウェア、データ処理装置、またはデータ処理方法は、ユーザから取得したガウス分布に従うバイタル情報と、ユーザに生じたイベントに関するイベントデータを蓄積して、複数のユーザから得られた集合データの中から、データ分析の際に、解析対象としての信用度の高いクオリティデータを抽出可能なユーザのデータ群を、容易に抜き出すことが可能となっている。
また、イベントの発生日を基準とした第1の基準関連期間におけるデータ群を抽出して、正規性を示すものであれば、バイタルサインの測定精度が高いとする発想は、本発明に特有の技術であり、これまでのような、研究の全期間での取得データの精度に対する正規性の検証とは、全く異なるものである。
さらに、本発明では、バイタル情報と共に、ユーザに生じた「イベント」という要素を、データ取得の際に「データセット」として集積する。そして、そのデータを分析する際に「精度検証=スクリーニング」を行い、更に「分類=イベント時のデータを用いて集団を分ける」ことで、一次データを二次データに加工するものであり、これまでのデータ収集及びデータ解析にはない、新たな手法である。
また、本発明を適用したソフトウェア、データ処理装置、またはデータ処理方法は、医療や健康管理に関する分野で、種々の用途に応用することができる。
以上のように、本発明のソフトウェアは、対象者から取得したガウス分布に従うバイタルサインの測定データに基づき、複数の個体から得られた精度不明もしくはバラバラのデータの集合体の中から、データ解析対象としての信用度の高いクオリティデータセットのみを容易にデータマイニングすることが可能なものとなっている。
また、本発明のデータ処理装置は、対象者から取得したガウス分布に従うバイタルサインの測定データに基づき、複数の個体から得られた精度不明もしくはバラバラのデータの集合体の中から、データ解析対象としての信用度の高いクオリティデータセットのみを容易にデータマイニングすることが可能なものとなっている。
また、本発明のデータ処理方法は、対象者から取得したガウス分布に従うバイタルサインの測定データに基づき、複数の個体から得られた精度不明もしくはバラバラのデータの集合体の中から、データ解析対象としての信用度の高いクオリティデータセットのみを容易にデータマイニングすることが可能なものとなっている。
また、本発明のデータ処理装置は、対象者から取得したガウス分布に従うバイタルサインの測定データに基づき、複数の個体から得られた精度不明もしくはバラバラのデータの集合体の中から、データ解析対象としての信用度の高いクオリティデータセットのみを容易にデータマイニングすることが可能なものとなっている。
また、本発明のデータ処理方法は、対象者から取得したガウス分布に従うバイタルサインの測定データに基づき、複数の個体から得られた精度不明もしくはバラバラのデータの集合体の中から、データ解析対象としての信用度の高いクオリティデータセットのみを容易にデータマイニングすることが可能なものとなっている。
1 解析装置
1a ソフトウェア
2 演算部
2a 演算部
3 解析端末
3a (解析端末の)入力部
3b (解析端末の)表示画面
3c (解析端末の)情報送受信部
4 情報記録部
4a 情報記録部
5 有意差検定手段
5a 有意差検定手段
6 判定処理手段
6a 判定処理手段
7 個人単位情報
8 バイタル情報
9 イベントデータ
10 イベント紐づけデータセット
14 平均値算出手段
15 標準偏差算出手段
21a バイタル測定器
21b 体温計
22a スマートフォン端末
22b パーソナルコンピュータ端末(PC端末)
23 情報入力手段
24 情報記録手段
30a インターネット
32a 情報管理サーバ
32b ソフトウェア
32c ソフトウェア
32d ソフトウェア
50a ユーザ端末
50b 外部端末
60a ユーザ端末
60b 外部端末
70b 管理端末
100 抽出条件設定手段
100a 抽出条件設定手段
101 データセット生成手段
101a データセット生成手段
102 集団データ抽出手段
102a 集団データ抽出手段
1a ソフトウェア
2 演算部
2a 演算部
3 解析端末
3a (解析端末の)入力部
3b (解析端末の)表示画面
3c (解析端末の)情報送受信部
4 情報記録部
4a 情報記録部
5 有意差検定手段
5a 有意差検定手段
6 判定処理手段
6a 判定処理手段
7 個人単位情報
8 バイタル情報
9 イベントデータ
10 イベント紐づけデータセット
14 平均値算出手段
15 標準偏差算出手段
21a バイタル測定器
21b 体温計
22a スマートフォン端末
22b パーソナルコンピュータ端末(PC端末)
23 情報入力手段
24 情報記録手段
30a インターネット
32a 情報管理サーバ
32b ソフトウェア
32c ソフトウェア
32d ソフトウェア
50a ユーザ端末
50b 外部端末
60a ユーザ端末
60b 外部端末
70b 管理端末
100 抽出条件設定手段
100a 抽出条件設定手段
101 データセット生成手段
101a データセット生成手段
102 集団データ抽出手段
102a 集団データ抽出手段
Claims (17)
- 個体の識別情報を含む個体由来データと、個体から測定され、単一種類のデータであり、ガウス分布に従う性質を有する所定の測定データ、及び、個体に生じたイベントに関する情報であるイベントデータを、複数の個体から収集して、収集したデータの集合体から、特定のイベントの情報を含む集団のデータを抽出するためのソフトウェアであって、
情報処理機器を、
前記個体由来データと、同一個体から測定された前記所定の測定データ及び測定日時の情報と、同一個体に生じたイベント内容の情報、及び、イベントの発生日の情報を含む前記イベントデータの入力を受け付ける情報入力手段と、
入力された前記所定の測定データ及び測定日時の情報と、前記イベントデータを、前記識別情報と紐づけて記録させる情報記録手段と、
前記情報記録手段が、前記イベントデータを記録した後、同一個体について、記録されたイベントの発生日を基準とする所定の期間に測定された前記所定の測定データを、基準関連測定データとして抽出すると共に、そのイベントに関する前記イベントデータと、前記基準関連測定データを組み合わせて、イベント紐づけデータセットを生成し、前記情報記録手段に記録する紐づけデータセット生成手段と、
前記情報記録手段に記録された、複数の個体についての、前記個体由来データと、前記所定の測定データ及び測定日時の情報、及び、前記イベント紐づけデータセットのデータの集合体の中から、特定の前記イベント内容の情報を含む、集団のデータである特定イベント集団データを抽出する集団データ抽出手段と、
を含む手段として機能させるためのソフトウェア。 - 前記集団データ抽出手段は、前記基準関連測定データについて、所定の正規性の検定を行い、そのP値が、P<0.01またはP<0.05を示す前記基準関連測定データをクオリティデータと判定すると共に、前記クオリティデータを有する個体のみで構成され、特定の前記イベント内容の情報を含む、前記特定イベント集団データを抽出する
請求項1に記載のソフトウェア。 - 前記基準関連測定データに関する前記所定の期間は、イベントの影響のある影響期間より前の、前記影響期間から遡った一定期間である第1の期間を含む
請求項1または請求項2に記載のソフトウェア。 - 前記第1の期間は、少なくとも、イベントの発生日の凡そ2か月前から、同発生日の凡そ1か月前の期間である
請求項3に記載のソフトウェア。 - 前記イベント内容の情報は、少なくとも、個体が発病した疾患の名称及び/又は症状の情報と、個体に生じた病気関連の出来事の情報を含む
請求項1、請求項2、請求項3または請求項4に記載のソフトウェア。 - 前記所定の測定データは、個体から測定され、体温、脈拍、血圧、脈圧、または、呼吸数の少なくともいずれか1つのバイタルサインの値であるバイタル情報における単一種類のデータである
請求項1、請求項2、請求項3、請求項4または請求項5に記載のソフトウェア。 - 前記基準関連測定データに関する前記所定の期間は、イベントの発生日と、同発生日より前の3日間と、同発生日より後の3日間で構成された7日間である第2の期間を含む
請求項1、請求項2、請求項3、請求項4、請求項5または請求項6に記載のソフトウェア。 - 前記個体由来データは、個体の年齢、性別、または、既往歴の少なくともいずれか1つの情報を含み、
前記集団データ抽出手段が抽出する前記特定イベント集団データは、前記個体の年齢、性別、または、既往歴の少なくともいずれか1つの情報と、前記所定の測定データ及び測定日時の情報、及び、前記イベント紐づけデータセットのデータから構成された
請求項1、請求項2、請求項3、請求項4、請求項5、請求項6または請求項7に記載のソフトウェア。 - 個体の識別情報と、個体における年齢、既往歴、または、性別の情報の少なくともいずれか1つを含む個体由来データと、個体から測定され、単一種類のデータであり、ガウス分布に従う性質を有する所定の測定データを、複数の個体から収集して、収集したデータの集合体から、特定の情報を含む集団のデータを抽出するためのソフトウェアであって、
情報処理機器を、
前記個体由来データと、同一個体から測定された前記所定の測定データ及び測定日時の情報の入力を受け付ける情報入力手段と、
入力された前記所定の測定データ及び測定日時の情報を、前記識別情報と紐づけて記録させる情報記録手段と、
同一個体について、前記情報記録手段に記録され、所定の基準日を基準とする所定の期間に測定された前記所定の測定データを、簡易基準関連測定データとして抽出し、前記情報記録手段に記録する簡易基準関連測定データ生成手段と、
前記情報記録手段に記録された、複数の個体についての、前記個体由来データと、前記所定の測定データ及び測定日時の情報、及び、前記簡易基準関連測定データの集合体の中から、前記特定の情報を含む、集団のデータである特定集団データを抽出する集団データ抽出手段と、
を含む手段として機能させるためのソフトウェア。 - 前記集団データ抽出手段は、前記簡易基準関連測定データについて、所定の正規性の検定を行い、そのP値が、P<0.01またはP<0.05を示す前記簡易基準関連測定データをクオリティデータと判定すると共に、前記クオリティデータを有する個体のみで構成され、前記特定の情報を含む、前記特定集団データを抽出する
請求項9に記載のソフトウェア。 - 前記所定の基準日は、前記情報入力手段により前記所定の測定データ及び測定日時の情報の入力が開始された日、または、任意の指定日であり、
前記所定の期間は、前記所定の基準日を起点とした、凡そ1か月間の期間である
請求項9または請求項10に記載のソフトウェア。 - 前記特定の情報は、個体における年齢、既往歴、または、性別の情報の少なくともいずれか1つの内容の情報である
請求項9、請求項10または請求項11に記載のソフトウェア。 - 個体の識別情報を含む個体由来データと、個体から測定され、単一種類のデータであり、ガウス分布に従う性質を有する所定の測定データ、及び、個体に生じたイベントに関する情報であるイベントデータを、複数の個体から収集して、収集したデータの集合体から、特定のイベントの情報を含む集団のデータを抽出するためのデータ処理装置であって、
前記個体由来データと、同一個体から測定された前記所定の測定データ及び測定日時の情報と、同一個体に生じたイベント内容の情報、及び、イベントの発生日の情報を含む前記イベントイデータの入力を受け付ける情報入力手段と、
入力された前記所定の測定データ及び測定日時の情報と、前記イベントデータを、前記識別情報と紐づけて記録させる情報記録手段と、
前記情報記録手段が、前記イベントデータを記録した後、同一個体について、記録されたイベントの発生日を基準とする所定の期間に測定された前記所定の測定データを、基準関連測定データとして抽出すると共に、そのイベントに関する前記イベントデータと、前記基準関連測定データを組み合わせて、イベント紐づけデータセットを生成し、前記情報記録手段に記録する紐づけデータセット生成手段と、
前記情報記録手段に記録された、複数の個体についての、前記個体由来データと、前記所定の測定データ及び測定日時の情報、及び、前記イベント紐づけデータセットのデータの集合体の中から、特定の前記イベント内容の情報を含む、集団のデータである特定イベント集団データを抽出する集団データ抽出手段とを備える
データ処理装置。 - 個体の識別情報を含む個体由来データと、個体から測定され、単一種類のデータであり、ガウス分布に従う性質を有する所定の測定データ、及び、個体に生じたイベントの情報であるイベントデータを、複数の個体から収集して、収集したデータの集合体から、特定のイベントの情報を含む集団のデータを抽出するためのデータ処理方法であって、
前記個体由来データと、同一個体から測定された前記所定の測定データ及び測定日時の情報と、同一個体に生じたイベント内容の情報、及び、イベントの発生日の情報を含む前記イベントイデータの入力を受け付ける情報入力工程と、
入力された前記所定の測定データ及び測定日時の情報と、前記イベントデータを、前記識別情報と紐づけて記録させる情報記録工程と、
前記情報記録手段が、前記イベントデータを記録した後、同一個体について、記録されたイベントの発生日を基準とする所定の期間に測定された前記所定の測定データを、基準関連測定データとして抽出すると共に、そのイベントに関する前記イベントデータと、前記基準関連測定データを組み合わせて、イベント紐づけデータセットを生成し、前記情報記録手段に記録する紐づけデータセット生成工程と、
前記情報記録工程で記録された、複数の個体についての、前記個体由来データと、前記所定の測定データ及び測定日時の情報、及び、前記イベント紐づけデータセットのデータの集合体の中から、特定の前記イベント内容の情報を含む、集団のデータである特定イベント集団データを抽出する集団データ抽出工程とを備える
データ処理方法。 - 前記集団データ抽出工程は、前記基準関連測定データについて、所定の正規性の検定を行い、そのP値が、P<0.01またはP<0.05を示す前記基準関連測定データをクオリティデータと判定すると共に、前記クオリティデータを有する個体のみで構成され、特定の前記イベント内容の情報を含む、前記特定イベント集団データを抽出する
請求項14に記載のデータ処理方法。 - 個体の識別情報と、個体における年齢、既往歴、または、性別の情報の少なくともいずれか1つを含む個体由来データと、個体から測定され、単一種類のデータであり、ガウス分布に従う性質を有する所定の測定データを、複数の個体から収集して、収集したデータの集合体から、特定の情報を含む集団のデータを抽出するためのデータ処理方法であって、
前記個体由来データと、同一個体から測定された前記所定の測定データ及び測定日時の情報の入力を受け付ける情報入力工程と、
入力された前記所定の測定データ及び測定日時の情報を、前記識別情報と紐づけて記録させる情報記録工程と、
同一個体について、前記情報記録工程で記録され、所定の基準日を基準とする所定の期間に測定された前記所定の測定データを、簡易基準関連測定データとして抽出し、前記情報記録手段に記録する簡易基準関連測定データ生成工程と、
前記情報記録工程で記録された、複数の個体についての、前記個体由来データと、前記所定の測定データ及び測定日時の情報、及び、前記簡易基準関連測定データの集合体の中から、前記特定の情報を含む、集団のデータである特定集団データを抽出する集団データ抽出工程とを備える
データ処理方法。 - 前記集団データ抽出工程は、前記簡易基準関連測定データについて、所定の正規性の検定を行い、そのP値が、P<0.01またはP<0.05を示す前記簡易基準関連測定データをクオリティデータと判定すると共に、前記クオリティデータを有する個体のみで構成され、前記特定の情報を含む、前記特定集団データを抽出する
請求項16に記載のデータ処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2021/020525 WO2022249480A1 (ja) | 2021-05-28 | 2021-05-28 | ソフトウェア、データ処理装置及びデータ処理方法 |
JP2021555336A JP7044431B1 (ja) | 2021-05-28 | 2021-05-28 | ソフトウェア、データ処理装置及びデータ処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2021/020525 WO2022249480A1 (ja) | 2021-05-28 | 2021-05-28 | ソフトウェア、データ処理装置及びデータ処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2022249480A1 true WO2022249480A1 (ja) | 2022-12-01 |
Family
ID=81215170
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2021/020525 WO2022249480A1 (ja) | 2021-05-28 | 2021-05-28 | ソフトウェア、データ処理装置及びデータ処理方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7044431B1 (ja) |
WO (1) | WO2022249480A1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6719799B1 (ja) * | 2019-09-03 | 2020-07-08 | 前田商事株式会社 | ソフトウェア、健康状態判定装置及び健康状態判定方法 |
JP6849870B1 (ja) * | 2020-07-09 | 2021-03-31 | 龍秀 河原 | 管理サーバおよび施術画面提供方法 |
-
2021
- 2021-05-28 WO PCT/JP2021/020525 patent/WO2022249480A1/ja active Application Filing
- 2021-05-28 JP JP2021555336A patent/JP7044431B1/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6719799B1 (ja) * | 2019-09-03 | 2020-07-08 | 前田商事株式会社 | ソフトウェア、健康状態判定装置及び健康状態判定方法 |
JP6849870B1 (ja) * | 2020-07-09 | 2021-03-31 | 龍秀 河原 | 管理サーバおよび施術画面提供方法 |
Also Published As
Publication number | Publication date |
---|---|
JP7044431B1 (ja) | 2022-03-30 |
JPWO2022249480A1 (ja) | 2022-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Milch et al. | Voluntary electronic reporting of medical errors and adverse events: an analysis of 92,547 reports from 26 acute care hospitals | |
Baek et al. | Validity of the Morse Fall Scale implemented in an electronic medical record system | |
Motheral et al. | A checklist for retrospective database studies—report of the ISPOR Task Force on Retrospective Databases | |
Pisa et al. | The prevalence of vegetative and minimally conscious states: a systematic review and methodological appraisal | |
Fleming et al. | Educational and health outcomes of children treated for type 1 diabetes: Scotland-wide record linkage study of 766,047 children | |
US8924226B2 (en) | Interactive testing system for analysing biological samples | |
O’Malley et al. | Fall definitions, faller classifications and outcomes used in falls research among people with multiple sclerosis: a systematic review | |
Guerard et al. | The influence of respondent characteristics on the validity of self‐reported survey responses | |
Mobbs | From the Subjective to the Objective era of outcomes analysis: how the tools we use to measure outcomes must change to be reflective of the pathologies we treat in spinal surgery | |
Improta et al. | A case study to investigate the impact of overcrowding indices in emergency departments | |
Yarznbowicz et al. | Pain pattern classification and directional preference are associated with clinical outcomes for patients with low back pain | |
Bousquet et al. | Patient‐centered digital biomarkers for allergic respiratory diseases and asthma: The ARIA‐EAACI approach–ARIA‐EAACI Task Force Report | |
Olawsky et al. | A new analysis tool for continuous glucose monitor data | |
Chauvin et al. | Building the thermometer for mental health | |
Palmieri et al. | Cardiovascular diseases monitoring: lessons from population-based registries to address future opportunities and challenges in Europe | |
Sundaram et al. | Health-related quality of life and quality of life in type 2 diabetes: relationships in a cross-sectional study | |
Darbà et al. | Economic evaluation of the use of FeNO for the diagnosis and Management of Asthma Patients in primary Care in Sweden | |
WO2022249480A1 (ja) | ソフトウェア、データ処理装置及びデータ処理方法 | |
Duan et al. | Leverage real-world longitudinal data in large clinical research networks for Alzheimer's Disease and Related Dementia (ADRD) | |
Sun et al. | Change in inhaler use, lung function, and oxygenation in association with symptoms in COPD | |
Garg et al. | Validating health information exchange (HIE) data for quality measurement across four hospitals | |
Starunova et al. | HCViewer: software and technology for quality control and processing raw mass data of preventive screening | |
He et al. | Comparing and contrasting a priori and a posteriori generalizability assessment of clinical trials on type 2 diabetes mellitus | |
Rundell et al. | Mapping a patient-reported functional outcome measure to a utility measure for comparative effectiveness and economic evaluations in older adults with low back pain | |
Zhu et al. | Impact of pharmacogenomic information on values of care and quality of life associated with codeine and tramadol-related adverse drug events |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
ENP | Entry into the national phase |
Ref document number: 2021555336 Country of ref document: JP Kind code of ref document: A |
|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21943117 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 21943117 Country of ref document: EP Kind code of ref document: A1 |