JP2018175850A - Data collection device and data collection method - Google Patents

Data collection device and data collection method Download PDF

Info

Publication number
JP2018175850A
JP2018175850A JP2018039697A JP2018039697A JP2018175850A JP 2018175850 A JP2018175850 A JP 2018175850A JP 2018039697 A JP2018039697 A JP 2018039697A JP 2018039697 A JP2018039697 A JP 2018039697A JP 2018175850 A JP2018175850 A JP 2018175850A
Authority
JP
Japan
Prior art keywords
hdp
data
onset
pregnant woman
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018039697A
Other languages
Japanese (ja)
Inventor
隆史 山内
Takashi Yamauchi
隆史 山内
越智 大介
Daisuke Ochi
大介 越智
淑希 恒元
Yoshiki Tsunemoto
淑希 恒元
檜山 聡
Satoshi Hiyama
聡 檜山
準一 菅原
Junichi Sugawara
準一 菅原
理宇 山下
Riu Yamashita
理宇 山下
修 田邉
Osamu Tanabe
修 田邉
正朗 長崎
Masao Nagasaki
正朗 長崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tohoku University NUC
NTT Docomo Inc
Original Assignee
Tohoku University NUC
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tohoku University NUC, NTT Docomo Inc filed Critical Tohoku University NUC
Publication of JP2018175850A publication Critical patent/JP2018175850A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a data collection technique for improving HDP onset prediction accuracy.SOLUTION: One embodiment of the invention relates to a data collection apparatus comprising: a data acquisition function for acquiring data related to a pregnant woman from each of plural data source devices; an HDP onset prediction function for executing HDP onset prediction of the pregnant woman from the pieces of data acquired based on an HDP onset prediction model; and a result notification function for notifying of a result of the HDP onset prediction. The data acquisition function acquires the pieces of data at plural time points in a data acquisition period since any period of before and after pregnancy of the pregnant woman to any period of before and after birth.SELECTED DRAWING: Figure 1

Description

本発明は、一般に医療診断技術に関し、より詳細には、非侵襲的に妊娠高血圧症候群の発症予測又は異常検出を行うための妊娠高血圧症候群発症有無予測のためのデータ収集装置及び方法に関する。   The present invention relates generally to medical diagnostic techniques, and more particularly to a data collection apparatus and method for predicting the onset or absence of pregnancy and hypertension for noninvasively predicting onset or abnormality detection of pregnancy and hypertension.

妊娠関連疾患は、従来は予測が困難であった。妊婦関連疾患の発症は、遺伝的要因だけでなく環境要因が複雑に関与するとされているが、環境要因の把握が困難であったためである。そのため、未だに予兆や原因が特定されずに予防方法が確立されていない妊婦関連疾患が多い。   Pregnancy related diseases have traditionally been difficult to predict. The onset of pregnancy related diseases is not only due to genetic factors but also to environmental factors in a complex way, but it is difficult to grasp environmental factors. For this reason, there are many pregnancy related diseases for which a preventive method has not been established, for which a precursor or a cause has not yet been identified.

現時点の産科診療においては、受診時に取得される検査情報、病歴聴取及び/又は診察情報による発症予測が主体であり、在宅中などの連続した生活環境情報を取得することは困難であった。疾患発症に関する研究において、妊婦の生活環境情報を取得する方法として従来は調査票による調査を実施することが主な手法であった。しかしこの方法には、妊婦の記憶が不正確で回答に誤りがあること(想起バイアス)による精度の問題があり、また実施間隔が早くて半年に1回程度と、取得頻度の問題等があった。そのため、妊婦の生活の実態を捉えて疾患との因果関係を明らかにするには不十分な方法であった。今後、疾患の発症予測を精緻に行うためには、受診時以外の連続環境情報を取得し、それらと受診時情報を統合的に解析することが必要であるが、これらの情報についてはこれまで入手困難だったため、妊娠に関連した疾患の発症予測には利用されてこなかった。   In obstetrics and medical care at the present time, it is mainly based on examination information acquired at the time of medical examination, medical history listening and / or prediction of onset by medical examination information, and it was difficult to obtain continuous living environment information such as at home. In the research on disease onset, conducting surveys using questionnaires has been the main method in the past as a method of acquiring information on the living environment of pregnant women. However, this method has the problem of accuracy because the memory of the pregnant woman is incorrect and there is an error in the response (recollection bias), and the implementation interval is early and there is the problem of acquisition frequency etc. once in half a year. The Therefore, it was an insufficient method to grasp the actual condition of the life of the pregnant woman and clarify the causal relationship with the disease. In the future, in order to precisely predict the onset of the disease, it is necessary to obtain continuous environmental information other than at the time of consultation and analyze them in an integrated manner at the time of consultation, but these information have not been Because it was difficult to obtain, it has not been used to predict the onset of pregnancy related diseases.

妊娠高血圧症候群(HDP:Hypertensive Disorders of Pregnancy)は、母体死亡、胎児発育不全、胎児死亡、常位胎盤早期剥離などを引き起こす母児の命に関わる周産期医療上の代表的な疾患で、遺伝的要因と環境因子による複雑な相互作用により発症する多因子疾患である。また、HDP罹患妊婦はその後の生活習慣病の発症リスクが高いことが知られている。   Gestational hypertension syndrome (HDP: Hypertensive Disorders of Pregnancy) is a typical perinatal medical disease that is associated with the life of mothers and infants causing maternal death, fetal failure, fetal death, permanent placental exfoliation, etc. It is a multifactorial disease that develops due to a complex interaction of environmental and environmental factors. In addition, it is known that pregnant women suffering from HDP have a high risk of developing lifestyle-related diseases thereafter.

妊婦の生活環境に基づいた、疫学的なHDP発症研究としては、例えば、妊娠前BMI(Body Mass Index)を測定し、当該BMIの高さがHDPのリスクを高めるという報告がある(非特許文献1)。しかし、この研究では、単一のパラメータかつ、1時点の計測結果に基づいているため、予測精度がオッズ比で3.4〜8.8であり、臨床的には十分な精度とは言えない。また、評価指標はオッズ比のみであり、その妊婦の最終的なHDPの有無を予測できているわけではない。   As an epidemiological HDP onset study based on the living environment of a pregnant woman, for example, there is a report that BMI (Body Mass Index) before pregnancy is measured and the height of the BMI concerned increases the risk of HDP (non-patent literature) 1). However, in this study, the prediction accuracy is 3.4 to 8.8 in odds ratio because it is based on single parameter and measurement results at one time point, and it can not be said that the accuracy is clinically sufficient. . Also, the evaluation index is only the odds ratio, and it is not possible to predict the final HDP of the pregnant woman.

""Prepregnancy Body Mass Index and the Occurrence of Severe Hypertensive Disorders of Pregnancy"", Lisa M. Bodnar, et al., Epidemiology, Volume 18, Number 2, March 2007 (http://journals.lww.com/epidem/Abstract/2007/03000/Prepregnancy_Body_Mass_Index_and_the_Occurrence_of.11.aspx)"" Pregnancy Body Mass Index and the Occurrence of Severe Hypertension Disorders of Pregnancy "", Lisa M. Bodnar, et al., Epidemiology, Volume 18, Number 2, March 2007 (http://journals.lww.com/epidem/ Abstract / 2007/03000 / Prepregnancy_Body_Mass_Index_and_the_Occurrence_of.11.aspx)

上述した問題点を鑑み、本発明の課題は、HDPの発症予測精度を向上させるためのデータ収集技術を提供することである。   In view of the above-mentioned problems, it is an object of the present invention to provide a data collection technique for improving the accuracy of predicting the onset of HDP.

上記課題を解決するため、本発明の一態様は、複数のデータソース装置から妊婦に関するデータを取得するデータ取得機能と、HDP発症予測モデルに基づき、前記取得したデータから前記妊婦のHDP発症予測を実行するHDP発症予測機能と、前記HDP発症予測の結果を通知する結果通知機能と、を有し、前記データ取得機能は、前記妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において、前記データを複数の時点にて取得するデータ収集装置に関する。   In order to solve the above-mentioned subject, one mode of the present invention predicts HDP onset of the above-mentioned pregnant woman from the data acquired based on a data acquisition function which acquires data about a pregnant woman from a plurality of data source devices, and HDP onset prediction model. The function has an HDP onset prediction function to be executed and a result notification function to notify the result of the HDP onset prediction, and the data acquisition function is from any time before or after pregnancy of the pregnant woman to any time from before to after delivery The present invention relates to a data collection apparatus that acquires the data at a plurality of time points in a data acquisition period up to

本発明によると、HDPの発症予測精度を向上させるためのデータ収集技術を提供することができる。   According to the present invention, it is possible to provide a data collection technique for improving the accuracy in predicting the onset of HDP.

図1は、本発明の一実施例によるシステム構成を示すブロック図である。FIG. 1 is a block diagram showing a system configuration according to an embodiment of the present invention. 図2は、本発明の一実施例による測定値転送装置の機能構成を示すブロック図である。FIG. 2 is a block diagram showing a functional configuration of a measured value transfer apparatus according to an embodiment of the present invention. 図3は、本発明の一実施例による体調登録装置の機能構成を示すブロック図である。FIG. 3 is a block diagram showing a functional configuration of the physical condition registration device according to one embodiment of the present invention. 図4は、本発明の一実施例による気象情報取得装置の機能構成を示すブロック図である。FIG. 4 is a block diagram showing a functional configuration of a weather information acquisition apparatus according to an embodiment of the present invention. 図5は、本発明の一実施例による調査票登録装置の機能構成を示すブロック図である。FIG. 5 is a block diagram showing a functional configuration of a survey form registration device according to an embodiment of the present invention. 図6は、本発明の一実施例による診療記録登録装置の機能構成を示すブロック図である。FIG. 6 is a block diagram showing a functional configuration of the medical care record registration device according to one embodiment of the present invention. 図7は、本発明の一実施例によるデータ収集装置の機能構成を示すブロック図である。FIG. 7 is a block diagram showing a functional configuration of a data collection device according to an embodiment of the present invention. 図8は、本発明の実施例1におけるデータ収集処理を示すフローチャートである。FIG. 8 is a flowchart showing data collection processing in the first embodiment of the present invention. 図9は、本発明の実施例3におけるHDP発症予測モデル生成処理を示すフローチャートである。FIG. 9 is a flowchart showing HDP onset prediction model generation processing in the third embodiment of the present invention. 図10は、HDP発症有無予測を実施した実施例3において選定された特徴量の組み合わせを示す表と、それら特徴量の組み合わせを用いた際のHDP発症有無の予測精度を示すグラフである。FIG. 10 is a table showing combinations of feature amounts selected in Example 3 in which HDP onset / presence prediction was performed, and a graph showing prediction accuracy of HDP onset / absence when using a combination of these feature amounts. 図11は、本発明の実施例4におけるHDP発症予測モデル生成処理を示すフローチャートである。FIG. 11 is a flowchart showing HDP onset prediction model generation processing in the fourth embodiment of the present invention. 図12は、HDP発症有無予測を実施した実施例4において選定された特徴量の組み合わせを示す表と、実施例3および実施例4のHDP発症有無の予測精度を比較したグラフである。FIG. 12 is a table showing combinations of feature amounts selected in Example 4 in which HDP onset / presence prediction was performed, and a graph comparing the prediction accuracy of HDP onset / absence in Example 3 and Example 4. 図13は、本発明の実施例6におけるHDP発症予測モデル生成処理を示すフローチャートである。FIG. 13 is a flowchart showing HDP onset prediction model generation processing in the sixth embodiment of the present invention. 図14は、本発明の実施例7におけるHDP発症予測モデル生成処理を示すフローチャートである。FIG. 14 is a flowchart showing HDP onset prediction model generation processing in the seventh embodiment of the present invention. 図15は、本発明の実施例8におけるHDP発症日予測モデル生成処理を示すフローチャートである。FIG. 15 is a flowchart showing HDP onset date prediction model generation processing in the eighth embodiment of the present invention. 図16は、本発明の実施例9におけるHDP発症リスク予測モデル生成処理を示すフローチャートである。FIG. 16 is a flowchart showing HDP onset risk prediction model generation processing in the ninth embodiment of the present invention.

以下、図面に基づいて本発明の実施の形態を説明する。   Hereinafter, embodiments of the present invention will be described based on the drawings.

後述される実施例では、HDP発症予測のためのデータ収集装置が開示される。BMIなど単一の指標による従来のHDP発症予測ではその予測精度が低いため、以下の実施例によるデータ収集装置は、妊婦の生活環境のデータのうち、複数のデータを組み合わせることで予測精度を向上させる。また、データ収集装置は、取得するデータを1つの時点の測定値ではなく、例えば、連続的または定期的など複数の時点にて取得し、取得したデータから想起バイアスを極力排除することによって客観的なデータを利用する。   In the embodiments described below, a data acquisition device for predicting the onset of HDP is disclosed. Since the prediction accuracy is low in the conventional HDP onset prediction using a single index such as BMI, the data collection device according to the following embodiment improves the prediction accuracy by combining data of the living environment of the pregnant woman. Let In addition, the data collection device is objectively obtained by acquiring data to be acquired not at measurement values at one time but at multiple time points, for example, continuously or periodically, and eliminating recall bias from the acquired data as much as possible. Use the following data.

具体的には、以下の実施例によるデータ収集システムによると、妊婦の生活環境をより客観的により高頻度で取得することで妊婦関連疾患発症の環境要因を明らかにするために、妊娠初期または妊娠前より、以下のような多様なデータが取得される。
1)血圧計、体重体組成計、活動量計、体温計などの計測装置の日々のデータ
2)日々の気分、睡眠、便通、吐き気、痛み、子宮収縮、動悸、胎動間隔、食事内容、服薬内容の体調データ
3)妊婦の居住地の気温、天候、湿度、気圧、潮汐などの日々の生活環境データ
4)食習慣、睡眠状況、喫煙等の生活習慣に関する定期的な調査票データ
5)妊婦健診等の定期的な診療記録データ
これらのようなデータを取得することで、多種類のデータを利用可能となり、単一の指標に基づく従来のHDP発症予測より予測精度を向上させることができる。また、上記1)〜3)に関して妊娠期間中やその前後において、1日数回から1週間に数回など高頻度に、または期間中連続的にデータを取得し、さらに、上記1)、3)などによる客観的なデータ取得と、2)による日々の登録において妊婦が記憶するべき間隔を短くすることによる想起バイアスの排除又は低減を実現することができる。なお、上記のデータのうち、1)〜3)のデータ項目はライフログと定義される。
Specifically, according to the data collection system according to the following example, in order to clarify the environmental factor of the onset of pregnancy related diseases by objectively acquiring the living environment of the pregnant woman more objectively and more frequently, From before, various data such as the following are acquired.
1) Daily data of measuring devices such as blood pressure meter, body weight body composition meter, activity meter, thermometer 2) Daily mood, sleep, bowel movement, nausea, pain, uterine contraction, palpitation, interval interval, meal contents, medication contents Physical condition data 3) Daily living environment data such as temperature, humidity, barometric pressure, tide, etc. 4) Eating habits, sleeping conditions, regular questionnaire data on lifestyle habits such as smoking 5) Pregnant women Periodic medical record data such as a medical examination By acquiring such data, many kinds of data can be used, and prediction accuracy can be improved more than conventional HDP onset prediction based on a single index. Also, with regard to the above 1) to 3), during or before pregnancy, data are obtained frequently, such as several times a day or several times a week, or continuously during the period, and further, 1), 3) above. And objective data acquisition, and elimination or reduction of recall bias by shortening the interval which the pregnant woman should memorize in daily registration by 2) can be realized. Of the above data, the data items 1) to 3) are defined as a life log.

これにより、本発明では、HDP発症予測モデルを生成するために、これらのライフログや調査票、診療記録を取得し、妊婦の環境情報を充実させることができる。つまり、本発明は、非侵襲的にHDPの発症予測又は異常検出のために、妊婦の妊娠期間中や産後に日々のライフログとして、例えば、血圧計、体重体組成計、活動量計、体温計等で計測した客観データ、日々の気分、睡眠、便通、吐き気、痛み、子宮収縮、動悸、胎動、食事、服薬などの妊婦の体調に関するデータを取得すると共に、妊婦の居住地の気温、天候、湿度、気圧、潮汐などの客観データなどのうち1つ以上のデータ項目に関するデータを取得し、これらを組み合わせて解析することによって、より高精度なHDP発症予測を実現することができる。   As a result, in the present invention, in order to generate an HDP onset prediction model, it is possible to acquire the life log, the questionnaire, and the medical record, and enrich the environment information of the pregnant woman. That is, the present invention can be used as a daily life log during pregnancy or after delivery of a pregnant woman, for example, in a blood pressure monitor, body composition monitor, activity meter, thermometer, in order to non-invasively predict the onset of HDP or detect abnormalities. Objective data measured by etc., daily mood, sleep, bowel movement, nausea, pain, contraction of the uterine contraction, palpitation, fetal movement, diet, medication, etc. while acquiring data on the physical condition of the pregnant woman, temperature of the residence of the pregnant woman, weather, By acquiring data on one or more data items out of objective data such as humidity, barometric pressure, tide and the like and analyzing them in combination, it is possible to realize more accurate HDP onset prediction.

まず、図1を参照して、本発明の一実施例によるデータ収集システムを説明する。図1は、本発明の一実施例によるシステム構成を示すブロック図である。   First, referring to FIG. 1, a data collection system according to an embodiment of the present invention will be described. FIG. 1 is a block diagram showing a system configuration according to an embodiment of the present invention.

図1に示されるように、データ収集システム10は、計測装置20、測定値転送装置30、体調登録装置40、気象情報取得装置50、調査票登録装置60、診療記録登録装置70及びデータ収集装置100を有する。なお、図示されたシステム構成は一例にすぎず、一部の装置は省かれてもよいし、あるいは、他の装置が追加されてもよい。例えば、データ収集システム10は、計測装置20又は体調登録装置40のいずれか一方又は両方、診療記録登録装置70及びデータ収集装置100を有し、任意的に、測定値転送装置30、気象情報取得装置50及び/又は調査票登録装置60を有してもよい。   As shown in FIG. 1, the data collection system 10 includes a measurement device 20, a measurement value transfer device 30, a physical condition registration device 40, a weather information acquisition device 50, a survey form registration device 60, a medical record registration device 70, and a data collection device. It has 100. The illustrated system configuration is merely an example, and some devices may be omitted or other devices may be added. For example, the data collection system 10 includes one or both of the measurement device 20 or the physical condition registration device 40, the medical record registration device 70 and the data collection device 100, and optionally, the measurement value transfer device 30, weather information acquisition The device 50 and / or the questionnaire registration device 60 may be included.

計測装置20は、血圧計、体重体組成計、活動量計、体温計などを含み、妊婦の血圧等の生理データを計測する。   The measuring device 20 includes a sphygmomanometer, a body weight body composition meter, an activity meter, a thermometer, and the like, and measures physiological data such as the blood pressure of a pregnant woman.

測定値転送装置30は、計測装置20とデータ収集装置100との間でデータを転送する。なお、計測装置20自体が測定値転送装置30の機能を含み、データ収集装置100に計測値を直接送信するようにしてもよい。   The measurement value transfer device 30 transfers data between the measurement device 20 and the data acquisition device 100. The measurement device 20 itself may include the function of the measurement value transfer device 30, and the measurement value may be directly transmitted to the data collection device 100.

体調登録装置40は、妊婦が日々の体調情報を登録するための装置であり、例えば、スマートフォン及びアプリケーションに実装可能である。具体的には、妊婦は、自らの体調情報を体調登録装置40に入力する。ここで、体調情報は、例えば、気分、睡眠、便通、吐き気、痛み、子宮収縮、動悸、胎動間隔、食事内容、服薬内容などのデータ項目を含むものであってもよいが、これらに限定されない。   The physical condition registration device 40 is a device for a pregnant woman to register daily physical condition information, and can be implemented, for example, in a smartphone and an application. Specifically, the pregnant woman inputs his physical condition information into the physical condition registration device 40. Here, the physical condition information may include, but is not limited to, data items such as, for example, mood, sleep, bowel movement, nausea, pain, uterine contractions, palpitations, intervals between meals, food contents, medication contents, etc. .

気象情報取得装置50は、一般に公開されている気象情報のデータベース(図示せず)から、妊婦の居住地における気象情報を取得する。ここで、気象情報は、例えば、所定の期間毎(1時間単位、1日単位など)の天候、降水確率、気温、湿度、風速、風向、気圧、潮汐などのデータ項目を含むものであってもよいが、これらに限定されない。   The meteorological information acquisition apparatus 50 acquires meteorological information in a residence of a pregnant woman from a database (not shown) of meteorological information that is open to the public. Here, the weather information includes, for example, data items such as weather, precipitation probability, temperature, humidity, wind speed, wind direction, barometric pressure, tide, etc. for each predetermined period (one hour unit, one day unit, etc.) Although it is good, it is not limited to these.

調査票登録装置60は、妊婦からの定期的な調査票の情報を登録するための装置である。具体的には、入力担当者が、妊婦から取得した調査票の情報を調査票登録装置60に登録する。ここで、調査票の情報は、例えば、妊婦やその家族の家族構成、妊婦や家族の既往歴、妊娠出産歴、食生活、睡眠状況、服薬状況、喫煙飲酒状況、運動状況、勤務状況、精神的状況などのデータ項目を含むものであってもよいが、これらに限定されない。   The questionnaire registration device 60 is a device for registering information of a regular questionnaire from a pregnant woman. Specifically, the person in charge of input registers the information on the survey form acquired from the pregnant woman in the survey form registration device 60. Here, information on the questionnaire includes, for example, the family structure of a pregnant woman and a family member, medical history of a pregnant woman and a family, pregnancy and delivery history, diet, sleep status, medication status, smoking and drinking status, exercise status, work status, mental status It may also include data items such as, but not limited to, specific situations.

診療記録登録装置70は、妊婦の出産時の診療記録を登録するための装置である。また、任意で妊婦の定期的な妊婦健診等の診療情報が更に診療記録登録装置70に登録されてもよい。   The medical care record registration device 70 is a device for registering a medical care record at the time of delivery of a pregnant woman. In addition, medical care information such as a regular pregnancy checkup of a pregnant woman may optionally be further registered in the medical care record registration device 70.

データ収集装置100は、以下で詳細に説明されるように、計測装置20、測定値転送装置30、体調登録装置40、気象情報取得装置50、調査票登録装置60及び診療記録登録装置70の1つ以上からネットワーク200を介し上述したデータ項目に関するデータを収集し、HDPの発症予測モデルを生成し、予測を実施する。ネットワーク200については単一のネットワークではなく、複数から構成されていても良い。   The data collection device 100 is one of the measurement device 20, the measurement value transfer device 30, the physical condition registration device 40, the weather information acquisition device 50, the survey form registration device 60, and the medical record registration device 70, as described in detail below. Data on the above-mentioned data items are collected from the network via the network 200, HDP occurrence prediction model is generated, and prediction is performed. The network 200 may be composed of a plurality of networks instead of a single network.

なお、上述した各装置は、典型的には、コンピュータ、スマートフォン、タブレット、サーバなどの通信機能を備えた情報処理装置により実現されてもよい。例えば、情報処理装置に搭載されたプロセッサが、メモリ装置に格納されたデータやプログラムを処理及び実行することによって、後述される各種機能及び処理を実行する。しかしながら、各装置は、何れか特定のハードウェア構成に限定されるものでなく、適切なハードウェア構成により実現されてもよい。   Each device described above may typically be realized by an information processing device having a communication function such as a computer, a smartphone, a tablet, or a server. For example, a processor mounted on an information processing apparatus executes various functions and processes to be described later by processing and executing data and programs stored in a memory device. However, each device is not limited to any specific hardware configuration, and may be realized by an appropriate hardware configuration.

次に、図2を参照して、本発明の一実施例による測定値転送装置を説明する。図2は、本発明の一実施例による測定値転送装置の機能構成を示すブロック図である。   Next, with reference to FIG. 2, a measurement value transfer apparatus according to an embodiment of the present invention will be described. FIG. 2 is a block diagram showing a functional configuration of a measured value transfer apparatus according to an embodiment of the present invention.

図2に示されるように、測定値転送装置30は、データ取得機能31、データ転送機能32、計測装置認証機能33及び利用者認証機能34を有する。   As shown in FIG. 2, the measurement value transfer device 30 has a data acquisition function 31, a data transfer function 32, a measurement device authentication function 33, and a user authentication function 34.

データ取得機能31は、1つ以上の計測装置20と通信し、計測装置20からデータ及び測定値を取得する。なお、測定値転送装置30と計測装置20との間の通信は、以下に限定することなく、Bluetooth(登録商標)、Wi−Fi、NFC、ZigBee、USB接続、モバイル通信(3G、LTE、4G、5Gなど)などの通信方式により実現されてもよい。例えば、計測装置20から取得されるデータ項目は、以下に限定されることなく、血圧計、体重体組成計、活動量計、体温計などの妊婦に関する生理データであってもよい。   The data acquisition function 31 communicates with one or more measuring devices 20 to obtain data and measurements from the measuring devices 20. Communication between the measurement value transfer device 30 and the measurement device 20 is not limited to the following, and Bluetooth (registered trademark), Wi-Fi, NFC, ZigBee, USB connection, mobile communication (3G, LTE, 4G , 5G, etc.). For example, the data items acquired from the measuring device 20 are not limited to the following, and may be physiological data on a pregnant woman such as a sphygmomanometer, a body weight body composition meter, an activity meter, and a thermometer.

データ転送機能32は、取得したデータ及び測定値をネットワーク200を介しデータ収集装置100に転送する。当該データは、妊娠期間中やその前後において、1日数回から1週間に数回など高頻度、または期間中連続的に取得され、データ収集装置100に転送されてもよい。   The data transfer function 32 transfers the acquired data and measurement values to the data collection device 100 via the network 200. The data may be obtained frequently or continuously several times a day or several times a week during or before pregnancy, and may be transferred to the data collection device 100.

計測装置認証機能33は、通信先の計測装置20を認証する。   The measuring device authentication function 33 authenticates the measuring device 20 at the communication destination.

利用者認証機能34は、妊婦などの測定値転送装置30の利用者を認証する。   The user authentication function 34 authenticates the user of the measurement value transfer device 30 such as a pregnant woman.

次に、図3を参照して、本発明の一実施例による体調登録装置を説明する。図3は、本発明の一実施例による体調登録装置の機能構成を示すブロック図である。   Next, referring to FIG. 3, a physical condition registration device according to an embodiment of the present invention will be described. FIG. 3 is a block diagram showing a functional configuration of the physical condition registration device according to one embodiment of the present invention.

図3に示されるように、体調登録装置40は、データ登録機能41、データ転送機能42及び利用者認証機能43を有する。   As shown in FIG. 3, the physical condition registration device 40 has a data registration function 41, a data transfer function 42 and a user authentication function 43.

データ登録機能41は、妊婦などの利用者からの入力内容をデータとして登録する。例えば、妊婦から入力されるデータ項目は、以下に限定されることなく、日々の気分、睡眠、便通、吐き気、痛み、子宮収縮、動悸、胎動間隔、食事内容、服薬内容などの妊婦の体調データであってもよい。   The data registration function 41 registers input content from a user such as a pregnant woman as data. For example, data items input from a pregnant woman are not limited to the following, and physical condition data of the pregnant woman such as daily mood, sleep, bowel movement, nausea, pain, uterine contraction, palpitations, intervals of feces, food content, medication contents, etc. It may be

データ転送機能42は、登録されたデータをデータ収集装置100に転送する。当該データは、妊娠期間中やその前後において、1日数回から1週間に数回など高頻度、または期間中連続的に取得され、データ収集装置100に転送されてもよい。   The data transfer function 42 transfers the registered data to the data collection device 100. The data may be obtained frequently or continuously several times a day or several times a week during or before pregnancy, and may be transferred to the data collection device 100.

利用者認証機能43は、妊婦などの体調登録装置の利用者を認証する。   The user authentication function 43 authenticates the user of the physical condition registration device such as a pregnant woman.

次に、図4を参照して、本発明の一実施例による気象情報取得装置を説明する。図4は、本発明の一実施例による気象情報取得装置の機能構成を示すブロック図である。   Next, a weather information acquiring apparatus according to an embodiment of the present invention will be described with reference to FIG. FIG. 4 is a block diagram showing a functional configuration of a weather information acquisition apparatus according to an embodiment of the present invention.

図4に示されるように、気象情報取得装置50は、データ取得機能51及びデータ転送機能52を有する。   As shown in FIG. 4, the weather information acquisition apparatus 50 has a data acquisition function 51 and a data transfer function 52.

データ取得機能51は、気象情報データベースから気象情報を取得する。気象情報データベースには、例えば、一般公開されているデータベースがある。例えば、気象情報は、以下に限定されることなく、妊婦の居住地の気温、天候、湿度、気圧、潮汐などの生活環境データであってもよい。   The data acquisition function 51 acquires weather information from the weather information database. The weather information database includes, for example, a database that is open to the public. For example, the weather information is not limited to the following, and may be living environment data such as the temperature, weather, humidity, barometric pressure, tide, etc. of the residence of the pregnant woman.

データ転送機能52は、取得したデータをデータ収集装置100に転送する。当該データは、妊娠期間中やその前後において、1日数回から1週間に数回など高頻度、または期間中連続的に取得され、データ収集装置100に転送されてもよい。   The data transfer function 52 transfers the acquired data to the data collection device 100. The data may be obtained frequently or continuously several times a day or several times a week during or before pregnancy, and may be transferred to the data collection device 100.

次に、図5を参照して、本発明の一実施例による調査票登録装置を説明する。図5は、本発明の一実施例による調査票登録装置の機能構成を示すブロック図である。   Next, with reference to FIG. 5, a survey form registration device according to an embodiment of the present invention will be described. FIG. 5 is a block diagram showing a functional configuration of a survey form registration device according to an embodiment of the present invention.

図5に示されるように、調査票登録装置60は、データ登録機能61及びデータ転送機能62を有する。   As shown in FIG. 5, the survey form registration device 60 has a data registration function 61 and a data transfer function 62.

データ登録機能61は、調査票情報の入力担当者が入力するデータを登録する。例えば、妊婦に関する調査票情報は、以下に限定されることなく、妊婦やその家族の家族構成、妊婦や家族の既往歴、妊娠出産歴、食生活、睡眠状況、服薬状況、喫煙飲酒状況、運動状況、勤務状況、精神的状況などの妊婦やその家族の生活習慣に関するデータ項目であってもよい。   The data registration function 61 registers data input by the person in charge of inputting the survey form information. For example, information on questionnaires regarding pregnant women is not limited to the following: family structure of pregnant women and their families, medical history of pregnant women and families, pregnancy delivery history, diet, sleep status, medication status, smoking drinking status, exercise It may be data items on the lifestyle habits of pregnant women and their families such as situations, work situations, and mental situations.

データ転送機能62は、登録したデータをデータ収集装置100に転送する。   The data transfer function 62 transfers the registered data to the data collection device 100.

次に、図6を参照して、本発明の一実施例による診療記録登録装置を説明する。図6は、本発明の一実施例による診療記録登録装置の機能構成を示すブロック図である。   Next, a medical record registration apparatus according to an embodiment of the present invention will be described with reference to FIG. FIG. 6 is a block diagram showing a functional configuration of the medical care record registration device according to one embodiment of the present invention.

図6に示されるように、診療記録登録装置70は、データ登録機能71及びデータ転送機能72を有する。   As shown in FIG. 6, the medical care record registration device 70 has a data registration function 71 and a data transfer function 72.

データ登録機能71は、診療記録の入力担当者が入力するデータを登録する。例えば、診療記録は、以下に限定されることなく、医師などにより記録された妊婦健診などの診療記録であってもよい。   The data registration function 71 registers data input by the person in charge of medical record entry. For example, the medical record is not limited to the following, and may be a medical record such as a pregnant woman medical checkup recorded by a doctor or the like.

データ転送機能72は、登録したデータをデータ収集装置100に転送する。   The data transfer function 72 transfers the registered data to the data collection device 100.

次に、図7を参照して、本発明の一実施例によるデータ収集装置を説明する。図7は、本発明の一実施例によるデータ収集装置の機能構成を示すブロック図である。   Next, with reference to FIG. 7, a data collection device according to an embodiment of the present invention will be described. FIG. 7 is a block diagram showing a functional configuration of a data collection device according to an embodiment of the present invention.

図7に示されるように、データ収集装置100は、データ取得機能110、データ保存機能120、HDP発症予測モデル生成機能130、HDP発症予測機能140及び結果通知機能150を有する。   As shown in FIG. 7, the data collection device 100 has a data acquisition function 110, a data storage function 120, an HDP onset prediction model generation function 130, an HDP onset prediction function 140, and a result notification function 150.

データ取得機能110は、複数のデータソース装置から妊婦に関するデータを取得する。また、データ取得機能110は、妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において、妊婦に関するデータを複数の時点にて取得する。すなわち、データ取得機能110は、上述した計測装置20、測定値転送装置30、体調登録装置40、気象情報取得装置50、調査票登録装置60及び/又は診療記録登録装置70などのデータソース装置から、妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において、妊婦に関する1つ以上のデータ項目のデータを、例えば、定期的など複数の時点にて取得する。   The data acquisition function 110 acquires data on a pregnant woman from a plurality of data source devices. Further, the data acquisition function 110 acquires data on a pregnant woman at a plurality of time points in a data acquisition period from any time before and after pregnancy of the pregnant woman to any time before and after delivery. That is, from the data source device such as the measurement device 20, the measurement value transfer device 30, the physical condition registration device 40, the weather information acquisition device 50, the survey sheet registration device 60 and / or the medical record registration device 70 described above. Data of one or more data items regarding a pregnant woman are acquired at a plurality of time points, for example, periodically, in a data acquisition period from any time before or after pregnancy of the pregnant woman to any time before or after delivery.

ここで、妊婦に関するデータは、例えば、妊娠時年齢、血圧、脈拍、体重、BMI、体脂肪率、骨格筋率、歩数、カロリー、体温、気分、睡眠時間、就寝時刻、起床時刻、就寝中に起きた回数、睡眠の質、便通の回数、便通の柔らかさ、子宮収縮、頭の痛み、歯の痛み、上腹部の痛み、下腹部の痛み、腰の痛み、吐き気、嘔吐、動悸、胎動間隔、食事内容、服薬内容、過去のHDP歴、妊娠状況、気温、室温、湿度、気圧、天気概況、潮汐及び月齢の1つ以上のデータ項目を含むものであってもよい。   Here, data relating to a pregnant woman are, for example, age at pregnancy, blood pressure, pulse, body weight, BMI, body fat rate, skeletal muscle rate, number of steps, calories, body temperature, mood, sleep time, bedtime, wake time, bedtime Number of waking up, quality of sleep, number of bowel movements, softness of the bowel movement, uterine contraction, head pain, tooth pain, upper abdominal pain, lower abdominal pain, lower back pain, nausea, vomiting, palpitations, fetal movement interval Food content, medication content, past HDP history, pregnancy status, temperature, room temperature, humidity, barometric pressure, weather conditions, tides and one or more data items of age.

データ保存機能120は、取得した妊婦に関するデータを保存する。   The data storage function 120 stores the acquired data on the pregnant woman.

HDP発症予測モデル生成機能130は、HDP発症予測モデルを生成及び保持する。例えば、HDP発症予測モデル生成機能130は、HDPを発症した妊婦とHDPを発症しなかった妊婦とを含む複数の妊婦から取得した妊婦に関するデータに基づき、HDP発症予測モデルを生成及び更新してもよい。具体的には、HDP発症予測モデルは、以下で詳細に説明されるようなモデル導出方法に従って生成されてもよい。   The HDP onset prediction model generation function 130 generates and holds an HDP onset prediction model. For example, the HDP onset prediction model generation function 130 generates and updates the HDP onset prediction model based on data on pregnant women acquired from a plurality of pregnant women including a pregnant woman who developed HDP and a pregnant woman who did not develop HDP. Good. Specifically, the HDP onset prediction model may be generated according to a model derivation method as described in detail below.

HDP発症予測機能140は、HDP発症予測モデルに基づき、取得した妊婦に関するデータから妊婦のHDP発症予測を実行する。具体的には、HDP発症予測機能140は、取得した妊婦に関するデータをHDP発症予測モデルに投入し、HDP発症予測モデルの出力結果に基づき当該妊婦のHDP発症有無予測、HDP発症日予測又はHDP発症リスク算出を実行してもよい。すなわち、HDP発症予測において、HDP発症予測機能140は、当該妊婦にHDP発症の可能性があるか予測し(HDP発症有無予測)、当該妊婦のHDP発症日を予測し(HDP発症日予測)、あるいは、当該妊婦のHDP発症リスクを算出してもよい(HDP発症リスク算出)。なお、HDP発症予測機能140は、妊婦の週数に応じて異なるデータ項目に基づき、当該妊婦のHDP発症有無予測、HDP発症日予測又はHDP発症リスク算出を実行してもよい。   The HDP onset prediction function 140 executes HDP onset prediction of the pregnant woman from the acquired data on the pregnant woman based on the HDP onset prediction model. Specifically, the HDP onset prediction function 140 inputs the acquired data on the pregnant woman into the HDP onset prediction model, and predicts the presence or absence of the HDP onset, the HDP onset date prediction or the HDP onset of the pregnant woman based on the output result of the HDP onset prediction model. Risk calculation may be performed. That is, in predicting HDP onset, the HDP onset prediction function 140 predicts whether the pregnant woman has a possibility of HDP onset (presence or absence of HDP onset), and predicts the date of HDP onset of the pregnant woman (HDP onset date prediction), Alternatively, the risk of developing HDP may be calculated for the pregnant woman (calculation of risk of developing HDP). The HDP onset prediction function 140 may execute HDP onset prediction, HDP onset date prediction or HDP onset risk calculation of the pregnant woman based on different data items depending on the number of weeks of the pregnant woman.

結果通知機能150は、HDP発症予測機能140によって実行されたHDP発症予測の結果を妊婦、医療関係者などに通知する。   The result notification function 150 notifies pregnant women, medical personnel, and the like of the result of the HDP prediction performed by the HDP prediction function 140.

なお、上述した装置は、それぞれが単独の装置であることもあれば、ある装置が他の装置の機能の一部又は全部を備えることもある。
(実施例1)
次に、図8を参照して、本発明の一実施例によるデータ収集装置100におけるデータ収集処理を説明する。図8は、本発明の一実施例によるデータ収集処理を示すフローチャートである。
Note that in the devices described above, each may be a single device, or one device may have some or all of the functions of another device.
Example 1
Next, with reference to FIG. 8, data collection processing in the data collection device 100 according to an embodiment of the present invention will be described. FIG. 8 is a flowchart illustrating data collection processing according to an embodiment of the present invention.

図8に示されるように、ステップS100において、データ収集装置100は、上述した計測装置20、測定値転送装置30、体調登録装置40、気象情報取得装置50、調査票登録装置60及び/又は診療記録登録装置70などのデータソース装置の全て又は一部からデータを取得し、取得したデータを保存する。具体的には、データ収集装置100は、妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間においてデータを定期的など複数の時点で取得する。   As shown in FIG. 8, in step S100, the data collection device 100 includes the measurement device 20, the measurement value transfer device 30, the physical condition registration device 40, the weather information acquisition device 50, the survey form registration device 60, and / or medical treatment described above. Data is acquired from all or part of a data source device such as the record registration device 70, and the acquired data is stored. Specifically, the data collection device 100 acquires data at a plurality of time points, such as periodically, in a data acquisition period from any time before and after pregnancy of a pregnant woman to any time before and after delivery.

まず、妊婦は、妊娠前もしくは妊娠中の任意の時点から、出産もしくは産後の任意の時点までの間、計測装置20を使用する。計測装置20は、例えば、血圧計、体重体組成計、活動量計、体温計などを含む。血圧計は、収縮期血圧、拡張期血圧、脈拍数、室温などを計測する。体重体組成計は、体重、BMI、体脂肪率、骨格筋率などを計測する。活動量計は、歩数、消費カロリーなどを計測する。体温計は、体温などを計測する。計測装置20による測定は、血圧計については1日朝晩の2回、その他は1日朝1回を想定するが、その限りではなく、任意の間隔で計測することも可能である。測定値転送装置30は、各計測装置20から計測データを取得し、データ収集装置100に転送する。   First, a pregnant woman uses the measuring device 20 from any time before or during pregnancy to any time after birth or postpartum. The measuring device 20 includes, for example, a sphygmomanometer, a body weight body composition meter, an activity meter, a thermometer, and the like. The sphygmomanometer measures systolic blood pressure, diastolic blood pressure, pulse rate, room temperature and the like. The body weight / body composition meter measures body weight, BMI, body fat percentage, skeletal muscle percentage and the like. The activity meter measures the number of steps and calories consumed. The thermometer measures the temperature and so on. It is assumed that the measurement by the measuring device 20 is performed twice in the morning and evening for the sphygmomanometer and once in the other morning for the sphygmomanometer, but it is also possible to measure at arbitrary intervals. The measurement value transfer device 30 acquires measurement data from each of the measurement devices 20 and transfers the measurement data to the data collection device 100.

また、妊婦は、体調登録装置40に自身の体調を登録する。体調登録装置40として、スマートフォンに体調登録用アプリやWebページを用いる場合を想定するが、その限りではない。体調情報として、気分、就寝日時、起床日時、睡眠時間、就寝時刻、起床時刻、就寝中に起きた回数、睡眠の質、便通の回数、便痛の軟らかさ、吐き気を感じた総時間、嘔吐の回数、空嘔吐の回数、頭の痛み、歯の痛み、腰の痛み、上腹部の痛み、下腹部の痛み、痛みを伴わない子宮収縮回数、痛みを伴う子宮収縮回数、動悸、胎動間隔、食事内容、服薬内容の1つ以上のデータ項目が登録されることが想定されるが、これらに限定されるものでない。体調情報の登録期間は、妊娠前もしくは妊娠中の任意の時点から、出産もしくは産後の任意の時点までの間を想定する。また、体調登録間隔は、主なデータ項目は1日1回を想定するが、食事内容や服薬内容など一部のデータ項目については、1日複数回の入力を想定する。また、これらのデータ項目は毎日ではなく、任意の間隔で計測することも可能である。   Further, the pregnant woman registers the physical condition of the pregnant woman in the physical condition registration device 40. Although the case where the application for physical condition registration and a web page are used for a smart phone as the physical condition registration apparatus 40 is assumed, it is not the limitation. As physical condition information, mood, bedtime, wake up time, sleep time, bedtime, wake up time, frequency of waking up at bedtime, quality of sleep, frequency of bowel movements, softness of stool, total time for feeling nausea, vomiting Number of times, air vomiting number of times, head pain, teeth pain, lower back pain, upper abdominal pain, lower abdominal pain, painless contractions number of contractions, number of painful contractions number of contractions, palpitation, interval interval, Although it is assumed that one or more data items of meal content and medication content are registered, it is not limited thereto. The registration period of physical condition information is assumed to be from any time before or during pregnancy to any time after birth or postpartum. In addition, the physical condition registration interval assumes that the main data items are once a day, but for some data items such as the contents of meals and medications, it is assumed that inputs are made multiple times a day. These data items can also be measured at arbitrary intervals, not daily.

また、気象情報取得装置50は、毎日の気象情報を収集する。例えば、気象庁のWebサイトから取得可能である。取得されるデータ項目は、日付、降水量、平均気温、最高気温、最低気温、全天日射量、平均雲量、降雪の深さ、最深積雪、最大瞬間風速、潮汐及び/又は月齢を想定し、さらには1時間ごとの、気温、降水量、風向き、風速、日照時間、湿度、気圧、天気概況を想定するが、これらに限定されるものでない。また、データの単位も1日や時間に限定されず、週単位、月単位、年単位も取り得る。   Also, the weather information acquisition device 50 collects daily weather information. For example, it can be obtained from the website of the Meteorological Agency. Data items to be acquired assume date, precipitation, average temperature, maximum temperature, minimum temperature, total solar radiation, average cloud amount, snowfall depth, deepest snowfall, maximum instantaneous wind speed, tide and / or age. Furthermore, temperature, precipitation, wind direction, wind speed, sunshine duration, humidity, barometric pressure, general conditions of weather are assumed every hour, but it is not limited to these. Also, the unit of data is not limited to one day or time, but can be weekly, monthly, or yearly.

また、調査票登録装置60は、妊婦が記入した定期的な調査票の情報を取得する。調査票の情報は、妊婦やその家族の家族構成、妊婦や家族の既往歴、妊娠出産歴、食生活、睡眠状況、服薬状況、喫煙飲酒状況、運動状況、勤務状況、精神的状況などのデータ項目を含むが、これらに限定されるものでない。取得の頻度については、調査票の頻度を想定する。   In addition, the survey form registration device 60 acquires information of a regular survey form entered by a pregnant woman. The information on the questionnaire includes data on the family structure of pregnant women and their families, medical history of pregnant women and families, pregnancy birth history, diet, sleep status, medication status, smoking and drinking status, exercise status, work status, mental status, etc. It includes items but is not limited to them. As for the frequency of acquisition, the frequency of questionnaires is assumed.

また、診療記録登録装置70は、妊婦が妊婦健診などで受診した際の検査値や所見などの記録を取得する。取得の頻度については、受診の頻度を想定する。   Further, the medical care record registration device 70 acquires records such as test values and findings when a pregnant woman receives a medical checkup for a pregnant woman and the like. As for the frequency of acquisition, the frequency of consultation is assumed.

ステップs101において、データ収集装置100は、取得したデータに対して異常値を検出及び除去し、欠測値を補間する。例えば、日々の収縮期血圧が120mmHgである妊婦が、ある1日だけ60mmHgであった場合、データ収集装置100は、当該測定値を実際の値ではなく計測エラーとみなして、当該測定値を除去する。この除去基準の一例として、データ収集装置100は、その妊婦のこれまでの収縮期血圧の平均μと標準偏差σを計算し、ある計測値が平均μよりnσ以上解離していた場合に、当該計測値を除去する(nは任意の数値)、などの方法があるが、これに限定されるものでない。また、欠測値に関しては、前後の点を用いた線形補間やスプライン補間や、欠測値以外の計測点にフィッティングしたモデルを用いて補完する方法などがあるが、それらに限定されない。   In step s101, the data collection device 100 detects and removes abnormal values from the acquired data, and interpolates missing values. For example, when a pregnant woman whose daily systolic blood pressure is 120 mmHg is 60 mmHg for only one day, the data collection device 100 regards the measured value as not a real value but a measurement error and removes the measured value. Do. As an example of this removal criterion, the data collection device 100 calculates the mean μ and the standard deviation σ of the previous systolic blood pressure of the pregnant woman, and when a measured value is dissociated by nσ or more from the mean μ, There are methods such as removing the measured value (n is an arbitrary numerical value), etc., but it is not limited thereto. Further, with regard to the missing value, there are a linear interpolation or spline interpolation using points before and after, a method of complementing using a model fitted to a measurement point other than the missing value, and the like, but it is not limited thereto.

ステップs102において、データ収集装置100は、既に出産して出産状況が確定している妊婦のデータを用いて、HDP発症群とそれ以外の群でデータ分布の違いが大きいデータ項目を、HDP発症予測モデルの特徴量として抽出する。データ分布の違いの大きさの定義には、例えば「データの平均値が同じとは言えない確率が大きい」ことや「データの分布が同じとは言えない確率が大きい」という指標が利用可能であるが、それらに限定されるものではない。これには、ステューデントのt検定、ウェルチのt検定、多変量回帰、多変量ロジスティック回帰、カイ二乗検定、フィッシャーの正確確率検定などを用いた方法や、Lasso回帰やRidge回帰やElastic Netなどにより有用なデータ項目を限定する方法や主成分分析の寄与率などからデータ項目を限定する方法などがあるが、それらに限定されるものでない。なお、特徴量とは、何らかの予測モデルを作成する際にモデルの変数として使用するデータ項目のことを指し、例えば血圧、体温などである。   In step s102, the data collection device 100 predicts the occurrence of data items having a large difference in data distribution between the HDP onset group and the other groups, using the data of a pregnant woman who has already given birth and the birth status has been determined. Extract as feature quantity of model. As a definition of the size of the difference in data distribution, for example, the indicator “the probability that the average value of the data is not the same is large” or “the probability that the distribution of the data is not the same is large” can be used Although there is no limitation to them. This is useful with methods such as Student's t-test, Welch's t-test, multivariate regression, multivariate logistic regression, chi-square test, Fisher's exact test, Lasso regression, Ridge regression, Elastic Net, etc. There are a method of limiting the data items, a method of limiting the data items from the contribution rate of the principal component analysis, and the like, but it is not limited thereto. The feature amount refers to a data item used as a variable of a model when creating any prediction model, such as blood pressure and body temperature.

ステップs103、s105及びs107において、データ収集装置100は、抽出した特徴量を用いてHDP発症予測モデルを生成する。具体的には、データ収集装置100は、ステップs103において、HDPになるかどうかを予測する分類モデルとしてHDP発症予測モデルを生成する。また、データ収集装置100は、ステップs105において、各妊婦のHDP発症日を予測する回帰モデルとしてHDP発症日予測モデルを生成する。また、データ収集装置100は、s107において、HDP発症のリスクを算出するHDP発症リスク算出モデルを生成する。回帰モデルには、線形回帰モデル、ロジスティック回帰モデル、SVMによる回帰モデル、多層ニューラルネットワークによる回帰モデルなどがあるが、それらに限定されるものでない。また、分類モデルにおいても、線形分類、ロジスティック回帰、ベイジアンネットワーク、SVM、k近傍法、ランダムフォレスト、多層ニューラルネットワークによる分類モデルなどがあるが、それらに限定されるものでない。HDP発症リスク算出モデルについては、オッズ比、寄与危険度、相対危険度などがあるが、それらに限定されるものでない。また、ステップs103、s105、s107は、s102と切り離さずに一体で処理されてもよい。   In steps s103, s105, and s107, the data collection device 100 generates an HDP onset prediction model using the extracted feature quantities. Specifically, in step s103, the data collection device 100 generates an HDP onset prediction model as a classification model for predicting whether to become an HDP. Further, in step s105, the data collection device 100 generates an HDP onset day prediction model as a regression model for predicting the HDP onset date of each pregnant woman. In addition, the data collection device 100 generates an HDP onset risk calculation model for calculating the risk of HDP onset in s107. The regression model includes, but is not limited to, linear regression model, logistic regression model, regression model by SVM, regression model by multi-layered neural network, and the like. Further, in the classification model, there are linear classification, logistic regression, Bayesian network, SVM, k-neighbor method, random forest, classification model by multilayer neural network, etc., but it is not limited thereto. The HDP risk calculation model includes, but is not limited to, odds ratio, contribution risk, relative risk, and the like. Further, steps s103, s105, s107 may be processed integrally without being separated from s102.

ステップs104、s106及びs108において、データ収集装置100は、生成されたHDP発症予測モデル、HDP発症日予測モデル及びHDP発症のリスク算出モデルに予測対象の妊婦のデータをそれぞれ投入し、HDP発症予測を実行する。具体的には、データ収集装置100は、ステップs104において、HDP発症予測モデルを利用して予測対象の妊婦のデータから将来のHDP発症の有無を予測する。また、データ収集装置100は、ステップs106において、HDP発症日予測モデルを利用して予測対象の妊婦のデータからHDP発症日を予測する。また、データ収集装置100は、ステップs108において、HDP発症リスク算出モデルを利用して予測対象の妊婦のデータからHDPリスクを算出する。なお、HDP有無予測は、最終的なHDP発症有無の予測、この先n1週間(n1は任意の数値)でHDPを発症しない予測、この先n2週間(n2は任意の数値)でHDPを発症する予測、などを含むが、それらに限定されるものでない。   In steps s104, s106 and s108, the data collection device 100 inputs the data of the pregnant woman to be predicted into the generated HDP onset prediction model, the HDP onset prediction model and the risk calculation model of HDP onset, respectively, and predicts the HDP onset. Run. Specifically, in step s104, the data collection device 100 predicts the presence or absence of future HDP onset from the data of the pregnant woman to be predicted using the HDP onset prediction model. Further, in step s106, the data collection device 100 predicts the date of HDP onset from the data of the pregnant woman to be predicted using the HDP onset day prediction model. Further, in step s108, the data collection device 100 calculates the HDP risk from the data of the pregnant woman to be predicted using the HDP onset risk calculation model. In addition, the HDP presence / absence prediction is a final prediction of HDP onset / presence, prediction of not developing HDP in the next n1 weeks (n1 is any numerical value), prediction of developing HDP in the next n2 weeks (n2 is arbitrary numerical value), Including, but not limited to.

ステップs109において、データ収集装置100は、HDP発症予測結果、HDP発症日予測結果及び/又はHDP発症リスク計算結果を妊婦又は医療機関に通知し、当該データ収集処理を終了する。
(実施例2)
なお、上述した実施例1のうち、HDP発症予測モデル、HDP発症日予測モデル又はHDP発症リスク算出モデルを生成及び/又は投入するのに利用するデータ項目は、妊娠時年齢、血圧、脈拍、体重、BMI、体脂肪率、骨格筋率、歩数、消費カロリー、体温、気分、睡眠時間、就寝時刻、起床時刻、就寝中に起きた回数、睡眠の質、便通の回数、便通の柔らかさ、子宮収縮、頭の痛み、歯の痛み、上腹部の痛み、下腹部の痛み、腰の痛み、吐き気、嘔吐、動悸、胎動間隔、食事内容、服薬内容、過去のHDP歴、妊娠状況(多胎など)、気温、室温、湿度、気圧、天気概況、潮汐及び月齢の1つ以上に限定されてもよい(ただし、BMI単独の場合を除く)。これにより、より少ないデータ数で効率的にモデルの生成及び利用が可能となる。
(実施例3)
図9は、本発明の一実施例によるHDP発症予測モデル生成処理を示すフローチャートである。上述した実施例2に関して、後述されるHDP発症予測モデル生成処理では、HDP発症群と非HDP群のデータ分布の違いの大きさを利用し、複数の妊娠週数において安定して高いHDP発症予測精度を示すHDP発症予測モデルが生成される。当該HDP発症予測モデル生成処理は、上述された図8のステップs102,s103において実行可能であり、後述されるステップs102−1〜8がステップs102の特徴量の抽出処理に対応し、ステップs103−1〜9がステップs103のHDP有無予測モデルの生成処理に対応する。実施例3では、HDP発症予測モデル生成機能130は、取得したデータをHDP群と非HDP群に分け、各データ項目のうち二群でデータ分布の違いが大きい(すなわち、区別する、判別する、分離するなど)データ項目を抽出し、さらに各データ項目において相関の高いデータ項目同士のうち一つを選択することでデータ項目数を削減することによって、HDP発症予測モデルの生成に利用する特徴量を抽出する。また、HDP発症予測モデル生成機能130は、HDP群と非HDP群でデータ分布の違いが大きい特徴量から順次特徴量数を増やすことによって、予測精度の高いHDP発症予測モデルを選定する。なお、上記はHDP発症予測モデルに利用する特徴量の抽出方法やHDP発症予測モデルの選定方法の一例であって、HDP発症予測生成モデル130はこれに制限されない。例えば、多層ニューラルネットワークまたはLasso回帰などによって特徴量を抽出し、HDP発症予測モデルを生成する方法もある。
In step s109, the data collection device 100 notifies the pregnant woman or medical institution of the HDP onset prediction result, the HDP onset date prediction result and / or the HDP onset risk calculation result, and ends the data collection processing.
(Example 2)
In Example 1 described above, data items used to generate and / or enter the HDP onset prediction model, HDP onset prediction model or HDP onset risk calculation model include gestational age, blood pressure, pulse, weight , BMI, body fat rate, skeletal muscle rate, number of steps, calories burned, body temperature, mood, sleep time, bedtime, bedtime, wake up time, number of waking up at bedtime, quality of sleep, number of bowel movements, softness of bowel movement, uterus Contraction, head pain, tooth pain, upper abdominal pain, lower abdominal pain, lower back pain, nausea, vomiting, palpitations, interval between meals, meal contents, medication contents, past HDP history, pregnancy status (such as multiple pregnancy) Temperature, room temperature, humidity, barometric pressure, weather conditions, tides and age may be limited to one or more (except in the case of BMI alone). This makes it possible to generate and use a model efficiently with a smaller number of data.
(Example 3)
FIG. 9 is a flowchart showing HDP onset prediction model generation processing according to an embodiment of the present invention. Regarding Example 2 described above, in the HDP onset prediction model generation process described later, the magnitude of the difference in data distribution between the HDP onset group and the non-HDP group is used to stably predict high HDP onset in a plurality of gestational weeks An HDP onset prediction model is generated that shows accuracy. The HDP onset prediction model generation process can be executed in steps s102 and s103 of FIG. 8 described above, and steps s102-1 to s8 described later correspond to the feature value extraction process of step s102, and step s103- 1 to 9 correspond to the generation processing of the HDP presence / absence prediction model in step s103. In Example 3, the HDP onset prediction model generation function 130 divides the acquired data into the HDP group and the non-HDP group, and the difference in data distribution between the two groups of data items is large (ie, distinguish, discriminate, A feature value used to generate an HDP onset prediction model by reducing the number of data items by extracting data items (such as separating) and further selecting one of the highly correlated data items in each data item. Extract In addition, the HDP onset prediction model generation function 130 selects an HDP onset prediction model with high prediction accuracy by sequentially increasing the number of feature amounts from the feature amount having a large difference in data distribution between the HDP group and the non-HDP group. The above is an example of a method of extracting feature amounts used in the HDP onset prediction model and a selection method of the HDP onset prediction model, and the HDP onset prediction generation model 130 is not limited to this. For example, there is also a method of extracting feature quantities by a multi-layered neural network or Lasso regression to generate an HDP onset prediction model.

図9に示されるように、ステップs102−1において、データ収集装置100は、取得したデータ項目の一部のデータ項目を加工する。具体的には、データ収集装置100は、一部のデータ項目について、以下に限定することなく、数日前のデータとの差、数日間の平均及び分散、計測値の近似モデルを生成したその微分、二階微分などを導出する。   As shown in FIG. 9, in step s102-1, the data collection device 100 processes some data items of the acquired data items. Specifically, the data collection device 100 is not limited to the following for some data items, but the difference with the data of several days ago, the average and variance for several days, and the derivative thereof that generated the approximate model of the measurement value , Derive second-order derivatives, etc.

まず、特徴量の抽出処理について説明する。   First, the feature quantity extraction process will be described.

ステップs102−2において、データ収集装置100は、元のデータとs102−1で生成したデータとを結合し、モデル生成のために、既に出産済みの妊婦のデータを抽出する。   In step s102-2, the data collection device 100 combines the original data and the data generated in s102-1 and extracts data of a pregnant woman who has already given birth for model generation.

ステップs102−3において、データ収集装置100は、HDP発症予測に有用なデータ項目が妊娠週数ごとに変化することを前提とし、各データ項目についてのHDP群−非HDP群間のp値を妊娠週数ごとに算出するループを開始する。例えば、N〜N+n週まで各週で特徴量を抽出する場合、妊娠日数を示すパラメータt1をt1=N×7(日)でループ内処理を実行し、次にt1=(N+1)×7として実行し、最終的にt1=(N+n)×7として実行する。   In step s102-3, the data collection device 100 presupposes that the data items useful for predicting the occurrence of HDP change with gestational weeks, and p-values between the HDP group and the non-HDP group for each data item are made pregnant. Start a loop to calculate every week number. For example, when extracting the feature quantity in each week up to N to N + n weeks, execute the in-loop process with t1 = N × 7 (days) as parameter t1 indicating the number of pregnancy days, and then execute as t1 = (N + 1) × 7 Finally, it is executed as t1 = (N + n) × 7.

ステップs102−4において、データ収集装置100は、ループ内処理の最初に、s102−2で抽出したデータから、期間が(t1−a)日から(t1+b)日となるデータを選択し、それらのデータに紐付く妊婦がHDPになった群と、そうでなかった群にデータを分ける。aやbは任意の数値で、例えば1週間単位でモデルを生成する場合は、a=0、b=6である。また、a=28など大きくすることで、t1より28日前のデータからb日後の長期のデータを利用してその後のデータ項目の抽出が可能である。その後、データ収集装置100は、ステップs102−4において例えばウェルチのt検定などを用いてp値を算出する。   In step s102-4, the data collection device 100 selects data whose period is from (t1-a) day to (t1 + b) day from the data extracted in s102-2 at the beginning of in-loop processing, and those data Divide the data into a group in which the pregnant women linked to the data became HDP and a group in which they were not. a and b are arbitrary numerical values, for example, a = 0 and b = 6 in the case of generating a model on a weekly basis. Further, by enlarging a = 28 or the like, it is possible to extract subsequent data items by using long-term data after b days from data 28 days before t1. Thereafter, in step s102-4, the data collection device 100 calculates ap value using, for example, Welch's t-test.

ステップs102−5において、データ収集装置100は、t1の分だけ各データ項目のp値を算出し、ループを終了する。   In step s102-5, the data collection device 100 calculates the p value of each data item by the amount of t1, and ends the loop.

ステップs102−6において、データ収集装置100は、N〜N+n週の中から、1つまたは2つ以上の任意の週の組み合わせlistN1を選定し、listN1における各データ項目のp値の平均値を算出する。p値の平均化においては、妊娠週数ごとに重みをつけてもよい。なお、listN1はN〜N+n週のすべての週であってもよい。   In step s102-6, the data collection device 100 selects one or more arbitrary week combinations listN1 out of N to N + n weeks, and calculates an average value of p values of each data item in listN1. Do. In averaging p values, weights may be given for each gestational week. Note that listN1 may be all weeks of N to N + n weeks.

ステップs102−7において、データ項目間で、相関が高いものをまとめ込むことでデータ項目数を絞る。ここでは、各データ項目の相関係数を算出し、それがc以上のものを同じクラスタとして分類し、各クラスタで最もp値の平均値が低い項目を残してそれ以外を除外することで、データ項目数をクラスタ数に削減する。ここで、cは任意の数値であり、例えば、c=0.7である。クラスタの構成方法としては、同一クラスタ内の相互のデータ項目が全部d以上であるとする場合を想定するが、それに限定されるものでない。   In step s102-7, the number of data items is narrowed by putting together data items having high correlation. Here, the correlation coefficient of each data item is calculated, and those of c or more are classified as the same cluster, and the item with the lowest average value of p values in each cluster is left except the others, Reduce the number of data items to the number of clusters. Here, c is an arbitrary numerical value, for example, c = 0.7. As a cluster configuration method, it is assumed that the mutual data items in the same cluster are all d or more, but it is not limited thereto.

ステップs102−8において、データ収集装置100は、p値の平均値がd以上のデータ項目を除外する。ここでdは任意の数値で、例えばd=0.05である。しかしながら、本発明は、これに限定されず、HDP群と非HDP群とを分離可能な何れか適切な判別モデル(例えば、統計モデル、学習モデルなど)が適用されてもよい。上記で残ったデータ項目をp値の平均値が低い順に並べ替え、これらを特徴量とする。   In step s102-8, the data collection device 100 excludes data items whose average value of p values is d or more. Here, d is an arbitrary numerical value, for example, d = 0.05. However, the present invention is not limited to this, and any appropriate discrimination model (for example, a statistical model, a learning model, etc.) capable of separating the HDP group and the non-HDP group may be applied. The data items remaining above are rearranged in ascending order of the average value of p values, and these are used as feature amounts.

次に、HDP発症予測モデルの生成方法について説明する。上記で生成した特徴量の全てを使ったモデルが最適とは限らないため、特徴量の数を徐々に増やしてモデルを生成し、予測精度が高いモデルを選定することを考える。   Next, a method of generating an HDP onset prediction model will be described. Since a model using all of the feature quantities generated above is not necessarily optimal, it is considered to gradually increase the number of feature quantities to generate a model and select a model with high prediction accuracy.

ステップs103−1において、データ収集装置100は、モデル生成の特徴量数を1から増加させてパラメータfに特徴量名のリストを格納し、後段のループ内処理を実行する。なお、使用した特徴量の組み合わせを図10中に示す。   In step s103-1, the data collection device 100 increases the number of feature quantities for model generation from 1 and stores the list of feature quantity names in the parameter f, and executes the subsequent in-loop processing. In addition, the combination of the used feature-value is shown in FIG.

ステップs103−2において、データ収集装置100は、N〜N+n週の中から、1つまたは2つ以上の任意の週を抽出し、妊娠日数に変換したものの組み合わせlistN2を生成し、パラメータt2に妊娠日数のリストを格納し、後段のループ内処理を実行する。なお、listN2の生成において使用した週はN〜N+n週のすべての週であってもよく、また、上述したN1と同じであってもよい。   In step s103-2, the data collection device 100 extracts one or more arbitrary weeks out of N to N + n weeks, generates a combination list N2 of those converted to gestational days, and generates a pregnancy to the parameter t2 Store a list of days and execute the in-loop processing of the latter stage. Note that the week used in the generation of listN2 may be all weeks from N to N + n weeks, and may be the same as N1 described above.

ステップs103−3において、データ収集装置100は、モデル生成の準備として、学習用データと評価用データを生成する。具体的には、データ収集装置100は、期間(t2−a)から(t2+b)のデータを抽出し、まずHDP群D1と非HDP群D2とに分ける。また、学習用データと評価用データに分ける比率をeとして、データ収集装置100は更に、D1をD1aとD1bとに分け、D2をD2aとD2bとに分け、学習用データをD1a+D2aとし、評価用データをD1b+D2bとする。ここで、eは任意の数値で、例えば、e=0.5であってもよい。また、D2として使用する妊婦の数を調節することが可能であり、例えばD2の妊婦の数をD1の妊婦の数の2倍まで、とすることも可能である。   In step s103-3, the data collection device 100 generates learning data and evaluation data as preparation for model generation. Specifically, the data collection device 100 extracts data of the period (t2-a) to (t2 + b), and first divides the data into the HDP group D1 and the non-HDP group D2. Further, the data collection apparatus 100 further divides D1 into D1a and D1b, divides D2 into D2a and D2b, and sets learning data as D1a + D2a, where e is a ratio of learning data to evaluation data as e. The data is D1b + D2b. Here, e may be any numerical value, for example, e = 0.5. It is also possible to adjust the number of pregnant women used as D2, for example the number of pregnant women of D2 can be up to twice the number of pregnant women of D1.

ステップs103−4において、データ収集装置100は、特徴量を特徴量名リストfに限定してモデルを学習する。例えば、この時点の予測モデルとしてサポートベクターマシン(SVM)を使用し、学習用データを用いて学習させる。発症予測モデルは最終的に多数できるため、区別のためにこの発症予測モデルをM(f,t2)とする。   In step s103-4, the data collection device 100 learns a model by limiting the feature amount to the feature amount name list f. For example, a support vector machine (SVM) is used as a prediction model at this time, and learning is performed using data for learning. Since there can be a large number of onset prediction models, this onset prediction model is M (f, t2) for distinction.

ステップs103−5において、データ収集装置100は、評価用データを用いて、モデルがHDPを予測できる精度を評価する。評価方法には、例えば、F値や感度、特異度、あるいは横軸に擬陽性率をとり、縦軸に感度をとるROC(Receiver Operating Characteristic)曲線を作成し、そのカーブ下の面積であるAUC(Area Under the Curve)を計算する。F値や感度、特異度、あるいはAUCが高いほど予測精度が良いとされる。データ収集装置100は、この評価したF値や感度、特異度、あるいはAUCを予測モデルM(f,t2)とともに記録する。なお、評価方法はこれに限定されるものでなく、図8のs107にてs102−1〜s103−9と同様の方法で算出されるようなHDPリスクの値を組み合わせることも可能である。   In step s103-5, the data collection device 100 uses the evaluation data to evaluate the accuracy with which the model can predict the HDP. As an evaluation method, for example, an ROC (Receiver Operating Characteristic) curve is prepared, which has an F value, sensitivity, specificity, or a false positive rate on the horizontal axis and sensitivity on the vertical axis, and the area under the curve is AUC Calculate Area Under the Curve. The higher the F value, sensitivity, specificity, or AUC, the better the prediction accuracy. The data collection device 100 records the evaluated F value, sensitivity, specificity, or AUC together with the prediction model M (f, t2). The evaluation method is not limited to this, and it is also possible to combine the value of the HDP risk as calculated in the same manner as in s102-1 to s103-9 in s107 of FIG.

ステップs103−6において、データ収集装置100は、t2の分だけモデルを生成し、ループを終了する。   In step s103-6, the data collection device 100 generates a model for t2 and terminates the loop.

ステップs103−7において、データ収集装置100は、listN2におけるF値や感度や特異度あるいはAUCの平均値を算出する。F値や感度や特異度あるいはAUCの平均化においては、t2ごとに重みをつけてもよい。   In step s103-7, the data collection device 100 calculates the F value in the list N2, the sensitivity, the specificity, or the average value of AUC. In averaging of the F value, sensitivity, specificity or AUC, weighting may be performed every t2.

ステップs103−8において、データ収集装置100は、fの分だけF値や感度や特異度あるいはAUCの平均値を算出し、ループを終了する。   In step s103-8, the data collection device 100 calculates the F value, the sensitivity, the specificity, or the average value of AUC by f, and ends the loop.

ステップs103−9において、データ収集装置100は、F値や感度や特異度あるいはAUCの平均値が最も高くなるfを最適な特徴量の組み合わせ(モデル)として選定する。なお、この選定方法はこれに限定されるものでなく、図8のs107にてs102−1〜s103−9と同様の方法で算出されるようなHDPリスクの値をF値や感度、特異度、あるいはAUCと組み合わせることも可能である。   In step s103-9, the data collection device 100 selects f having the highest F value, sensitivity, specificity, or average value of AUC as an optimal combination (model) of feature quantities. Note that this selection method is not limited to this, and the value of the HDP risk that is calculated by the same method as s102-1 to s103-9 in s107 of FIG. Or in combination with AUC.

以上により、複数の妊娠週数において安定して高いHDP発症予測精度を示すHDP発症予測モデルを生成できる。例えば、listN1およびlistN2を[24×7、25×7、26×7]とした場合、血圧、BMI、年齢、睡眠の質の悪さ、痛みを伴わない子宮収縮が利用される。一方、listN1およびlistN2を[27×7、28×7、29×7]とした場合、血圧が利用される。   As described above, it is possible to generate an HDP onset prediction model that stably shows high HDP onset prediction accuracy in a plurality of gestational weeks. For example, when listN1 and listN2 are [24 × 7, 25 × 7, 26 × 7], blood pressure, BMI, age, poor sleep quality and painless uterine contraction are used. On the other hand, when listN1 and listN2 are [27 × 7, 28 × 7, 29 × 7], blood pressure is used.

なお、上述した実施例では、HDP発症有無予測モデルを生成する処理を説明したが、同様の処理によってHDP発症日予測モデル及びHDP発症リスク算出モデルが生成可能であることは明らかであろう。   Although the process for generating the HDP onset / prediction model is described in the above-described embodiment, it is apparent that the HDP onset day prediction model and the HDP onset risk calculation model can be generated by the same process.

また、上述した実施例から理解されるように、HDP発症予測モデル生成機能130は、特徴量からモデルを生成するにあたり、HDP群と非HDP群をでデータ分布の違いが大きい特徴量から順次特徴量数を増やすことで予測精度が高いモデルを選定してもよい。これらにおいてモデルで使用した特徴量数を横軸にして、24週、25週および26週におけるF値の平均値を確認すると、図10に示されるような実施結果が得られる。特徴量数が増加することでF値が高値になる傾向にあり、HDPの発症予測精度が高まっていることがわかる。これにより、複数のデータを組み合わせることによって予測精度が向上することが確認できる。また、特徴量数が9個以上の場合よりも8個の方がF値の平均値が高値であり、ステップs103−1におけるパラメータfのループの効果があることが理解できる。このことはどのようなデータを組み合わせるかの選択によってより最適なデータの組み合わせを見出すことができる可能性があることを示唆している。実施例3において選定された最適な特徴量の組み合わせ(特徴量数8個)を用いた場合、各週のデータに対する予測モデルが示すF値は、24週のデータにおいて0.62、25週において0.52、26週において0.50であった。また、各週のデータに対する予測モデルが示すHDPに対するオッズ比は、24週のデータにおいて33、25週において15、26週において11で、非特許文献1の示すオッズ比3.4〜8.8を上回っており、本発明のデータ収集システム10を用いることによって、HDP発症の予測が改善していることがわかる。
(実施例4)
図11は、本発明の一実施例によるHDP発症予測モデル生成処理を示すフローチャートである。上述した実施例2に関して、後述されるHDP発症予測モデル生成処理では、複数の妊娠週数において安定して実施例3より高いHDP発症予測精度を示すHDP発症予測モデルが生成される。当該HDP発症予測モデル生成処理は、上述された図8のステップs102,s103において実行可能であり、後述されるステップs102−1'〜8'がステップs102の特徴量の抽出処理に対応し、ステップs103−1'〜10'がステップs103のHDP発症有無予測モデルの生成処理に対応する。また、ステップs102−1'〜7'は実施例3で述べたs102−1〜7と等しい。実施例4では、HDP発症予測モデル生成機能130は、HDP群と非HDP群をでデータ分布の違いが大きい特徴量から、HDP発症予測モデルにおける重みの絶対値が小さい特徴量を順次減らすことによって、予測精度の高いHDP発症予測モデルを選定する。なお、使用した特徴量の組み合わせを図12中に示す。
Further, as understood from the above-described embodiment, the HDP onset prediction model generation function 130 sequentially generates features from HDP group and non-HDP group from the feature amount having a large difference in data distribution when generating the model from the feature amount. A model with high prediction accuracy may be selected by increasing the quantity number. In these figures, when the number of feature quantities used in the model is taken on the horizontal axis, and the average value of F values at weeks 24, 25 and 26 is confirmed, the implementation result as shown in FIG. 10 is obtained. As the number of feature quantities increases, the F value tends to be high, and it can be seen that the accuracy of predicting the onset of HDP is enhanced. Thereby, it can be confirmed that the prediction accuracy is improved by combining a plurality of data. In addition, it can be understood that the average value of the F value is higher in the case of eight than in the case where the number of feature amounts is nine or more, and the loop of the parameter f in step s103-1 is effective. This suggests that it is possible to find a more optimal combination of data by selecting what kind of data to combine. In the case of using the optimum combination of feature quantities (eight feature quantities) selected in Example 3, the F value indicated by the prediction model for the data for each week is 0.62 in the data for 24 weeks and 0 for 25 weeks. It was 0.50 at .52, 26 weeks. In addition, the odds ratio for the HDP indicated by the prediction model for the data for each week is 33 for the data for 24 weeks, 15 for the 25th week, 11 for the 26th week, and the odds ratio for 3.4 to 8.8 shown in Non-Patent Document 1. It can be seen that the prediction of the onset of HDP is improved by using the data collection system 10 of the present invention.
(Example 4)
FIG. 11 is a flowchart showing HDP onset prediction model generation processing according to an embodiment of the present invention. With regard to Example 2 described above, in the HDP onset prediction model generation process described later, an HDP onset prediction model is generated that stably shows the HDP onset prediction accuracy higher than that of Example 3 in a plurality of gestational weeks. The HDP onset prediction model generation process can be executed in steps s102 and s103 of FIG. 8 described above, and steps s102-1 to 8 described later correspond to the feature quantity extraction process of step s102, and the steps The steps s103-1 'to 10' correspond to the process of generating the HDP onset / prediction model in step s103. Also, steps s102-1 to 7 'are equal to s102-1 to 7 described in the third embodiment. In the fourth embodiment, the HDP onset prediction model generation function 130 sequentially reduces feature amounts with small absolute values of weights in the HDP onset prediction model from feature amounts with large differences in data distribution between the HDP group and the non-HDP group. , Select HDP onset prediction model with high prediction accuracy. In addition, the combination of the used feature-value is shown in FIG.

以上により、複数の妊娠週数において実施例3より安定して高いHDP発症予測精度を示すHDP発症予測モデルを生成できる。例えば、listN1およびlistN2を[24×7、25×7、26×7]とした場合、血圧、腰の痛み、痛みを伴わない子宮収縮、BMI、起きた回数、年齢が利用される。一方、listN1およびlistN2を[27×7、28×7、29×7]とした場合、血圧、腰の痛みが利用される。   As described above, it is possible to generate an HDP onset prediction model that stably shows high HDP onset prediction accuracy more stably than Example 3 in a plurality of gestational weeks. For example, when listN1 and listN2 are [24 × 7, 25 × 7, 26 × 7], blood pressure, lower back pain, painless uterine contraction, BMI, number of occurrences, age are used. On the other hand, when listN1 and listN2 are [27 × 7, 28 × 7, 29 × 7], blood pressure and lower back pain are used.

実施例3および実施例4にて生成されたモデルについて、特徴量数を横軸にして、24週、25週および26週におけるF値の平均値を確認すると、図12に示されるような実施結果が得られる。実施例3と比較して実施例4にて生成されたモデルのF値が高く、より予測精度も高いモデルが生成されていることが確認できる。実施例4において選定された最適な特徴量の組み合わせ(特徴量数6個)を用いた場合、各週のデータに対する予測モデルが示すF値は、24週のデータにおいて0.55、25週において0.57、26週において0.58で、平均値は0.56あった。また、各週のデータに対する予測モデルが示すHDPに対するオッズ比は、24週のデータにおいて17、25週において45、26週において48で、平均値は37であった。実施例4でのF値及びオッズ比の平均値は、実施例3でのF値の平均値0.55、オッズ比の平均値20をそれぞれ上回っており、本発明のデータ収集システムを用いることによって、HDP発症の予測が改善していることがわかる。
(実施例5)
本発明によるデータ収集装置10のHDP発症予測モデル生成機能130及びHDP発症予測機能140は、対象疾患をHDP以外にも設定可能である。例えば、妊娠糖尿病、SGA(Small-for-gestational age)、胎児発育不全、死産、切迫流産、早産、切迫早産、前期破水、羊水過多、羊水過少、子癇、急性妊娠脂肪肝、HELLP症候群、児のアトピー、児の精神関連疾患、児の心循環系疾患、児の代謝異常、その他妊婦や胎児に関する疾患のうち一つまたは複数を設定可能であり、これらの発症有無予測、発症日予測又は発症リスク算出を行うことができる。また、正期産となる予測にも可能である。
For the models generated in Example 3 and Example 4, when the average of the F values at weeks 24, 25 and 26 is confirmed with the feature quantity number on the horizontal axis, the implementation as shown in FIG. 12 is performed. The result is obtained. It can be confirmed that a model is generated in which the F value of the model generated in Example 4 is higher than that in Example 3 and the prediction accuracy is higher. When the optimum combination of feature amounts selected in Example 4 (6 feature amounts) is used, the F value indicated by the prediction model for the data for each week is 0.55 in the data for 24 weeks, and 0 for 25 weeks. The average value was 0.56 at 0.58 at .57 and 26 weeks. Also, the odds ratio for the HDP indicated by the prediction model for each week of data was 17, in the 24 week data, 45 in the 25th week, 48 in the 26th week, and the average value was 37. The average value of the F value and the odds ratio in Example 4 exceeds the average value of 0.55 of the F value in Example 3 and the average value of the odds ratio 20 in Example 3, respectively, and using the data collection system of the present invention It can be seen that the prediction of the onset of HDP is improved.
(Example 5)
The HDP onset prediction model generation function 130 and the HDP onset prediction function 140 of the data collection device 10 according to the present invention can set a target disease other than HDP. For example, gestational diabetes, SGA (small-for-gestational age), fetal growth failure, stillbirth, threatened abortion, premature birth, premature birth, premature rupture, premature amniotic fluid, excessive amniotic fluid, severe amniotic fluid, eclampsia, acute pregnancy fatty liver, HELLP syndrome, It is possible to set one or more of atopy, mental disease of the child, cardiovascular disease of the child, metabolic disorder of the child, and other diseases related to the pregnant woman and the fetus, and these onset prediction, onset date prediction or onset risk Calculations can be made. It is also possible to predict full-term delivery.

このように、本発明によれば、従来の調査票や診療記録に加え、妊娠期間中やその前後にわたり非侵襲的に日々のライフログの収集が可能であり、HDP有無予測において、生活環境のデータ項目の多様化、データ取得期間と取得時点数の増加、データの客観性や想起バイアスの最小化が可能である。さらに、これら得られた各種データを組み合わせて解析することによりHDPの発症予測が可能となり、事前の予防や迅速な対応につながる。また、日々のライフログからの予測や異常検出が可能となり、数週間に一度の間隔の妊婦健診を待つことなく必要に応じた受診を促すことで、症状の早期発見や重篤化の防止、迅速な対処につながる。
(実施例6)
図13は、本発明の一実施例による任意の発症予測モデル生成処理を示すフローチャートである。後述するように、本実施例6の疾患発症予測モデル生成処理を用いることにより、複数の妊娠週数において安定して実施例3より高い疾患発症予測スコアを示す疾患発症予測モデルが生成される。当該疾患発症予測モデル生成処理は、上述された図8のステップs102,s103において実行可能であり、後述されるステップs1022−1〜s1022−6がステップs102の特徴量の抽出処理に対応し、ステップs1032−1〜s1032−11がステップs103の疾患発症有無予測モデルの生成処理に対応するが、厳密にステップs102とs103に区別できるものではなく、一部重複する。実施例6では、疾患発症予測モデル生成機能130は、疾患群と正常群をでデータ分布の違いが大きい全ての特徴量から疾患発症予測モデルにおける予測スコアが最も高い特徴量を選択し、その後に残りの特徴量から更に予測スコアを高める特徴量を順次追加することによって、予測スコアの高い疾患発症予測モデルを選定する。予測スコアには様々な指標が指定可能であるが、例えばF値が指定可能である。
Thus, according to the present invention, in addition to conventional questionnaires and medical records, daily life logs can be collected noninvasively during pregnancy and before and after pregnancy, and it is possible to predict the presence of HDP in HDP presence / absence prediction. It is possible to diversify data items, increase data acquisition period and number of acquisition points, and minimize data objectivity and recall bias. Furthermore, by combining and analyzing these obtained various data, it is possible to predict the onset of HDP, leading to prior prevention and prompt response. In addition, it is possible to predict daily life logs and detect abnormalities, and prevent the early detection of symptoms and seriousness by prompting a consultation as needed without waiting for a pregnancy checkup once every several weeks. Leads to quick action.
(Example 6)
FIG. 13 is a flowchart showing an optional onset prediction model generation process according to an embodiment of the present invention. As described later, by using the disease onset prediction model generation process of the sixth embodiment, a disease onset prediction model indicating a disease onset prediction score higher than that of the third embodiment is generated stably at a plurality of gestational weeks. The disease onset prediction model generation process can be executed in steps s102 and s103 of FIG. 8 described above, and steps s1022-1 to s1022-6 described later correspond to the feature value extraction process of step s102, and the steps Although s1032-1 to s1032-11 correspond to the generation processing of the disease onset / prediction prediction model of step s103, they can not be distinguished strictly between steps s102 and s103, and overlap partially. In the sixth embodiment, the disease onset prediction model generation function 130 selects a feature amount having the highest prediction score in the disease onset prediction model from all feature amounts in which the difference in data distribution is large between the disease group and the normal group. A disease onset prediction model with a high prediction score is selected by sequentially adding feature amounts that further increase the prediction score from the remaining feature amounts. Although various indexes can be designated as the prediction score, for example, an F value can be designated.

図13において、ステップs1022−1〜7s1022−5は実施例3で述べたステップs102−1〜s102−5と等しい。またステップs1022−6は、実施例3のステップs102−7に等しい。ここまでで、各データ項目において疾患発症群と正常群に分けるp値を計算し、さらに各データ項目間の相関を比較し、相関が高いものの中からデータ項目を一つに絞ることで、データ項目数を削減することが可能となる。   In FIG. 13, steps s1022-1 to s1022-5 are equal to steps s102-1 to s102-5 described in the third embodiment. Step s1022-6 is equivalent to step s102-7 of the third embodiment. Up to this point, in each data item, calculate the p value to divide the disease onset group and the normal group, compare the correlation between each data item, and narrow down the data items to one out of high correlation. It is possible to reduce the number of items.

次に、N〜N+nの任意の週の中から1つまたは複数の週を選定し(例えば16,20,24,28,32週)、それらの週のデータにおける疾患予測モデルを作成することを考える。ステップs−1032−1において、パラメータt2に選定した週数に該当する日数(例えば16×7,20×7,24×7,28×7,32×7)を順次入れて、ループを開始する。ステップs1032−2では、t2の前後Δtにおける各データ項目のp値の平均を算出する。例えばΔt=7である。ステップs−1032−3では、これにより疾患予測モデルを生成したい週数において、各データ項目が安定して二群間でデータ分布の違いが大きいデータ項目群を選択し、それらを特徴量とする。また、最終的な最適特徴量群を算出するため、f_bestという空の配列変数を用意し、best_scoreという変数を用意する。   Next, select one or more weeks out of any week from N to N + n (for example, 16, 20, 24, 28, 32 weeks) and create a disease prediction model in the data for those weeks. Think. In step s-1032-1, a loop is started by sequentially inserting the days (for example, 16 × 7, 20 × 7, 24 × 7, 28 × 7, 32 × 7) corresponding to the number of weeks selected for the parameter t2 . In step s1032-2, an average of p values of each data item before and after t2 at t is calculated. For example, Δt = 7. In step s-1032-3, in the number of weeks for which a disease prediction model is to be generated, thereby selecting each data item group in which each data item is stable and the difference in data distribution between the two groups is large, and use them as feature values. . Also, in order to calculate the final optimal feature value group, an empty array variable called f_best is prepared, and a variable called best_score is prepared.

ステップs1032−4では、特徴量の全てについて、順番に変数fに代入してその後の処理を実行するループを開始し、変数fおよび配列変数f_bestにある特徴量群から最高の予測スコアを持つ特徴量群、すなわちデータ項目の組合せを探索する。例えば、特徴量群が{fa,fb,fc,fd}の4つあった場合、最初にf=faとしてステップs−1032−5〜s−1032−8を実行し、次にf=fbとして同様に処理を実行し、それをfdまで繰り返す。   In step s1032-4, a loop is started in which all the feature quantities are sequentially substituted into the variable f and the subsequent processing is executed, and the feature having the highest prediction score from the feature quantity group in the variable f and the array variable f_best Search for groups of quantities, ie combinations of data items. For example, when there are four feature amount groups {fa, fb, fc, fd}, first execute steps s-1032-5 to s-1032-8 as f = fa, and then f = fb Execute the same process and repeat it to fd.

ステップs1032−5では、すでに配列変数f_bestに入っている特徴量を重複して探索しないように、変数fがf_bestに入っている場合は次の変数fに移る。例えば、faを変数fとして処理している時にfaがf_bestに入っている場合は、faの処理を終了し、fbを変数fとしてステップs1032−4から次の処理を行う。   In step s1032-5, if the variable f is included in f_best, the process moves to the next variable f so that feature amounts already included in the array variable f_best are not searched redundantly. For example, when fa is processed as a variable f and fa is included in f_best, the process of fa is ended, and the following process is performed from step s1032-4 with fb as a variable f.

ステップs1032−6において、データ収集装置100は、モデル生成の準備として、学習用データと評価用データを生成する。具体的には、データ収集装置100は、期間(t2−a)から(t2+b)のデータを抽出し、まず疾患群D1と正常群D2とに分ける。また、学習用データと評価用データに分ける比率をeとして、データ収集装置100は更に、D1をD1aとD1bとに分け、D2をD2aとD2bとに分け、学習用データをD1a+D2aとし、評価用データをD1b+D2bとする。ここで、eは任意の1未満の数値で、例えば、e=0.5であってもよい。また、D2として使用する妊婦の数を調節することが可能であり、例えばD2の妊婦の数をD1の妊婦の数の2倍まで、とすることも可能である。   In step s1032-6, the data collection device 100 generates learning data and evaluation data as preparation for model generation. Specifically, the data collection device 100 extracts data of the period (t2-a) to (t2 + b), and first divides the data into the disease group D1 and the normal group D2. Further, the data collection apparatus 100 further divides D1 into D1a and D1b, divides D2 into D2a and D2b, and sets learning data as D1a + D2a, where e is a ratio of learning data to evaluation data as e. The data is D1b + D2b. Here, e may be any numerical value less than 1, for example, e = 0.5. It is also possible to adjust the number of pregnant women used as D2, for example the number of pregnant women of D2 can be up to twice the number of pregnant women of D1.

ステップs1032−7において、データ収集装置100は、特徴量をf_best+fに限定してモデルを学習する。つまり、f=fcで、f_bestに特徴量faとfbの2つがある場合、fa,fb,fcの3つの特徴量で予測モデルを学習する。例えば、この時点の予測モデルとしてサポートベクターマシン(SVM)を使用し、学習用データを用いて学習させる。発症予測モデルは最終的に多数できるため、区別のためにこの発症予測モデルをM(f_best+f,t2)とする。   In step s1032-7, the data collection device 100 learns a model by limiting the feature amount to f_best + f. That is, when f = fc and f_best has two feature quantities fa and fb, the prediction model is learned with three feature quantities fa, fb and fc. For example, a support vector machine (SVM) is used as a prediction model at this time, and learning is performed using data for learning. Since there are a large number of prediction models for the onset eventually, this onset prediction model is M (f_best + f, t2) for discrimination.

ステップs1032−8において、データ収集装置100は、評価用データを用いて、モデルが疾患を予測できる予測スコアを評価する。評価方法には、例えば、F値や感度、特異度、あるいは横軸に擬陽性率をとり、縦軸に感度をとるROC(Receiver Operating Characteristic)曲線を作成し、そのカーブ下の面積であるAUC(Area Under the Curve)を計算する。F値や感度、特異度、あるいはAUCが高いほど予測スコアが良いとされる。データ収集装置100は、この評価した予測スコアがこの時点のbest_scoreよりも高い場合、配列変数f_best'をf_best'=f_best+fとし、さらに変数best_score'を今回の予測スコアにし、再帰的にステップs−1032−4から実行する。その際、ステップs−1032−4以降ではf_bestに代わってf_best'を、best_scoreに代わってbest_score'を用いる。つまり、今回更新した新しいf_best'とbest_score'を用いて、さらに全特徴量のうち1つを変数f'として追加したパターンの予測スコアを評価し、より高い物があれば、更に再帰的に探索する。全てのf'を通してより高い予測スコアがなければ、再帰的なループを終了し、そのときの配列変数f_best'と変数best_score'を、再帰呼び出し前の配列変数f_bestと変数best_scoreに代入して更新する。なお、評価方法はこれに限定されるものでない。   In step s1032-8, the data collection device 100 uses the data for evaluation to evaluate a prediction score that allows the model to predict a disease. As an evaluation method, for example, an ROC (Receiver Operating Characteristic) curve is prepared, which has an F value, sensitivity, specificity, or a false positive rate on the horizontal axis and sensitivity on the vertical axis, and the area under the curve is AUC Calculate Area Under the Curve. The higher the F value, sensitivity, specificity, or AUC, the better the prediction score. If the estimated score thus evaluated is higher than the best_score at this time, the data collection device 100 sets the array variable f_best 'to f_best' = f_best + f, further changes the variable best_score 'to the current prediction score, and recursively performs step s-1032. Execute from -4. At this time, f_best 'is used in place of f_best and best_score' is used in place of best_score in steps s-1032-4 and later. That is, using the new f_best 'and best_score' updated this time, the prediction score of the pattern in which one of all the feature quantities is added as a variable f 'is evaluated, and if there is a higher one, the search is further recursively performed Do. If there is no higher prediction score through all f ', end the recursive loop and substitute the array variable f_best' and the variable best_score 'at that time into the array variable f_best before the recursive call and the variable best_score to update . The evaluation method is not limited to this.

ステップs−1032−9は、ステップs−1032−4でループを開始した変数fのループ終了に対応し、fが全特徴量を終了するまで繰り返す。   The step s-1032-9 corresponds to the end of the loop of the variable f which started the loop in the step s-1032-4 and is repeated until the f ends all the feature quantities.

ステップs−1032−10において、best_scoreとなった予測モデルM(f_best,t2)を最適な予測モデルとして選定する。   In step s-1032-10, the prediction model M (f_best, t2) that has become the best_score is selected as the optimum prediction model.

ステップs−1032−11は、ステップs−1032−1でループを開始したt2に対応し、t2が予測モデルを作成したい全期間を終了するまで繰り返す。   Step s-1032-11 corresponds to t2 at which the loop is started in step s-1032-1 and is repeated until t2 ends the entire period for which a prediction model is desired to be created.

以上により、探索的に良い予測モデルを作成することができる。
(実施例7)
図14は、本発明の一実施例によるHDP発症予測モデル生成処理を示すフローチャートである。上述した実施例3と比べ、後述される処理では、複数の週数のデータを用いることで、HDP群と非HDP群のデータ分布の違いの大きさだけでなく、データ分布の時系列的変化の違いの大きさを利用し、より性能の高い予測モデルを生成可能である。データ分布の時系列的変化の違いの大きさの定義には、例えば、HDP群と非HDP群においてそれぞれのあるデータ項目のデータ分布が妊娠週数に従って変化するなかで、その「変化のしかたが同じとは言えない確率が大きい」という指標が利用可能であるが、それに限定されるものではない。例えば非HDP群ではあるデータ項目が妊娠週数に従って低下するのに対し、HDP群では低下が見られない、などの場合である。これには、ステューデントのt検定、ウェルチのt検定、多変量回帰、多変量ロジスティック回帰、カイ二乗検定、フィッシャーの正確確率検定などを用いた方法や、Lasso回帰やRidge回帰やElastic Netなどにより有用なデータ項目を限定する方法や主成分分析の寄与率などからデータ項目を限定する方法などがあるが、それらに限定されるものでない。
From the above, it is possible to create a predictive model that is searchable.
(Example 7)
FIG. 14 is a flowchart showing HDP onset prediction model generation processing according to an embodiment of the present invention. Compared to the third embodiment described above, in the process described later, using data of a plurality of weeks, not only the magnitude of the difference between the data distribution of the HDP group and the non-HDP group but also the time series change of the data distribution It is possible to generate a more sophisticated prediction model by using the magnitude of the difference of For the definition of the magnitude of the difference in time series change of data distribution, for example, while the data distribution of certain data items in each of the HDP group and the non-HDP group changes according to the number of gestational weeks, There is an indication that “the probability that can not be said to be the same is large” is available, but it is not limited thereto. For example, in the non-HDP group, certain data items decrease according to the number of gestational weeks, whereas in the HDP group, no decrease is observed. This is useful with methods such as Student's t-test, Welch's t-test, multivariate regression, multivariate logistic regression, chi-square test, Fisher's exact test, Lasso regression, Ridge regression, Elastic Net, etc. There are a method of limiting the data items, a method of limiting the data items from the contribution ratio of the principal component analysis, etc.

当該HDP発症予測モデル生成処理は、上述された図8のステップs102,s103において実行可能であり、後述されるステップs202−1〜7がステップs102の特徴量の抽出処理を行い、ステップs203−1〜6がステップs103のHDP発症有無予測モデルの生成処理を行う。
実施例5では、HDP発症予測モデル生成機能130は、取得したデータをHDP群と非HDP群に分け、各データ項目のうち二群でデータ分布が異なる(すなわち、区別する、判別する、分離するなど)データ項目を抽出するが、複数の週別データや静的データ(年齢、非妊時BMI、身長、既往歴、分娩歴など)を含めて交絡因子を抽出し、その影響を調整のうえ、抽出する。さらに各データ項目において相関の高いデータ項目同士のうち一つを選択することでデータ項目数を削減することによって、HDP発症予測モデルの生成に利用する特徴量を抽出する。また、HDP発症予測モデル生成機能130は、HDP群と非HDP群でデータ分布が異なる特徴量のうち上位の所定数の特徴量を抽出し、抽出された特徴量を用いてHDP発症予測モデルを作成し、最も性能の良い特徴量によるHDP発症予測モデルを特定する。次に、HDP発症予測モデル生成機能130は、当該特徴量を除いた残りの特徴量と特定された特徴量とを併せた2変数の予測モデルを作成し、これらのモデルを含めて最適なモデルを選択する。HDP発症予測モデル生成機能130は、上述した一連の処理を再帰的に実行し、最終的にHDP発症予測モデルを特定する。なお、上記はHDP発症予測モデルに利用する特徴量の抽出方法やHDP発症予測モデルの選定方法の一例であって、HDP発症予測モデル生成機能130はこれに制限されない。例えば、多層ニューラルネットワークまたはLasso回帰などによって特徴量の抽出を抽出し、HDP発症予測モデルを作成する方法もある。
The HDP onset prediction model generation process can be executed in steps s102 and s103 of FIG. 8 described above, and steps s202-1 to s7 described later perform the feature value extraction process of step s102, and step s203-1 6 perform the generation processing of the HDP onset / prediction prediction model in step s103.
In the fifth embodiment, the HDP onset prediction model generation function 130 divides the acquired data into the HDP group and the non-HDP group, and the data distribution differs between the two groups among the data items (that is, distinguish, discriminate, separate Etc.) but extract confounding factors including multiple weekly data and static data (age, non-fertility BMI, height, medical history, past labor history, etc.) and adjust their effects. ,Extract. Further, the number of data items is reduced by selecting one of the data items having high correlation in each data item, thereby extracting the feature value used for generating the HDP onset prediction model. In addition, the HDP onset prediction model generation function 130 extracts a predetermined number of high-order feature amounts among feature amounts having different data distributions in the HDP group and the non-HDP group, and uses the extracted feature amounts to calculate the HDP onset prediction model. Create and identify HDP onset prediction model with the best performing feature value. Next, the HDP onset prediction model generation function 130 creates a two-variable prediction model combining the remaining feature amounts excluding the feature amount and the specified feature amounts, and including these models, an optimal model Choose The HDP onset prediction model generation function 130 recursively executes the above-described series of processes, and finally identifies the HDP onset prediction model. The above is an example of a method of extracting feature quantities used in the HDP onset prediction model and a selection method of the HDP onset prediction model, and the HDP onset prediction model generation function 130 is not limited thereto. For example, there is also a method of extracting feature quantities by multi-layer neural network, Lasso regression, etc., and creating an HDP onset prediction model.

図14に示されるように、ステップs202−1において、データ収集装置100は、取得したデータ項目の一部のデータ項目を加工する。具体的には、データ収集装置100は、一部のデータ項目について、以下に限定することなく、数日前のデータとの差、数日間の平均及び分散、計測値の近似モデルを作成したその微分、二階微分などを導出する。   As shown in FIG. 14, in step s202-1, the data collection device 100 processes some data items of the acquired data items. Specifically, the data collection device 100 is not limited to the following for some data items, but the difference with the data of several days ago, the average and variance for several days, and the derivative of the approximation model of the measurement value created , Derive second-order derivatives, etc.

まず、特徴量の抽出処理について説明する。   First, the feature quantity extraction process will be described.

ステップs202−2において、データ収集装置100は、元のデータとs202−1で作成したデータとを結合し、モデル作成のために、既に出産済みの妊婦の妊娠時データと経時データを抽出する。妊娠時データとは、妊娠週数に依らない静的なデータ項目のデータであり、妊娠時年齢、非妊時BMI、非妊時体重、身長、経産歴、既往症、家族歴などを含む。経時データとは、妊娠期間中の特定の期間の計測値を集計したデータの羅列であり、例えば特定の期間として一週間を指定可能であり、ユーザID、16週の血圧、16週の脈拍、16週の体温、・・・、17週の血圧、17週の脈拍、17週の体温、・・・、などのように横方向に各妊婦の集計値を記述したものである。なお、特定の期間には任意の期間を指定可能である。また、特定の期間での計測値の集計方法としては、平均値、中央値など任意の方法を指定可能である。   In step s202-2, the data collection device 100 combines the original data and the data created in s202-1 and extracts pregnancy data and time-lapse data of a pregnant woman who has already given birth, for model creation. Pregnancy data are data of static data items not depending on gestational age, and include gestational age, non-fertility BMI, non-fertility weight, height, postpartum history, medical history, family history and the like. Temporal data is a list of data obtained by aggregating measurement values of a specific period during pregnancy. For example, one week can be specified as a specific period, user ID, blood pressure of 16 weeks, pulse of 16 weeks, The calculated values of each pregnant woman are described in the lateral direction such as body temperature of 16 weeks, ..., blood pressure of 17 weeks, pulse of 17 weeks, body temperature of 17 weeks, and so on. In addition, an arbitrary period can be designated to a specific period. Moreover, as a method of tabulating measurement values in a specific period, any method such as average value or median value can be specified.

ステップs202−3において、上記妊娠時データに対して、それらのデータに紐付く妊婦がHDPになった群と、HDPにならなかった群のデータを抽出する。その後、データ収集装置100は、s102で説明するような方法を用いて、二群間でデータ分布が異なるデータ項目を抽出し、交絡データ項目とする。ここでは、例えば多変量ロジスティック回帰にてp値がa(例えばa=0.01)未満となるデータ項目を抽出する。さらに、交絡データ項目に季節項を入れても良い。本発明は、これに限定されず、HDP群と非HDP群とを分離可能な何れか適切な判別モデル(例えば、統計モデル、学習モデルなど)が適用されてもよい。   In step s202-3, with respect to the above pregnancy data, data of a group in which a pregnant woman linked to the data becomes HDP and a group of a group in which the pregnant woman does not become HDP are extracted. Thereafter, the data collection device 100 extracts data items having different data distributions between the two groups as a confounding data item using the method described in s102. Here, for example, data items in which the p value is less than a (for example, a = 0.01) in multivariate logistic regression are extracted. Furthermore, a seasonal term may be included in the confounding data item. The present invention is not limited to this, and any appropriate discrimination model (for example, a statistical model, a learning model, etc.) capable of separating the HDP group and the non-HDP group may be applied.

ステップs202−4において、それらの交絡データ項目間の相関係数を計算し、相関がb(例えばb=0.75)以上のものを同じクラスタに分け、各クラスタでもっともp値が低い項目を残してそれ以外を除外することで交絡データ項目数をクラスタの数に削減する。クラスタの構成方法としては、同一クラスタ内の相互のデータ項目が全部b以上であるとする場合を想定するが、それに限定されるものでない。なお、s202−4を実行してからs202−3を実行する場合もあれば、s202−3とs202−54を繰り返して実行する場合もある。   In step s202-4, the correlation coefficient between those confounding data items is calculated, and those having a correlation of b (for example, b = 0.75) or more are divided into the same cluster, leaving the item with the lowest p value in each cluster. Reduce the number of confounding data items to the number of clusters by excluding the others. As a cluster configuration method, it is assumed that the mutual data items in the same cluster are all b or more, but it is not limited thereto. In some cases, s202-3 may be executed after s202-4 is executed, or s202-3 and s202-54 may be repeatedly executed.

次に、ステップs202−5において、データ収集装置100は、妊娠時データおよび経時データに対し、各データ項目1つずつに交絡データ項目を加えてロジスティック回帰によるp値とオッズ比を算出し、p値がc(例えばc=0.01)未満となるデータ項目を選択することで、交絡因子の影響を除いたうえで二群を有意に分けるデータ項目を特定する。   Next, in step s202-5, the data collection device 100 adds a confounding data item to each data item one by one with respect to pregnancy data and time-lapse data to calculate p value and odds ratio by logistic regression, p By selecting a data item whose value is less than c (for example, c = 0.01), a data item that divides the two groups into significant after excluding the influence of the confounding factor is specified.

ステップs202−6において、それらのデータ項目間の相関係数を計算し、相関がd(例えばd=0.75)以上のものを同じクラスタに分け、各クラスタでもっともp値が低い項目を残してそれ以外を除外することでデータ項目数をクラスタの数に削減する。クラスタの構成方法については、s202−4の場合と同様である。   In step s202-6, the correlation coefficient between those data items is calculated, and those having a correlation of d (for example, d = 0.75) or more are divided into the same cluster, leaving the item with the lowest p value in each cluster Reduce the number of data items to the number of clusters by excluding the others. The cluster configuration method is the same as in the case of s202-4.

次にステップs202−7において、データ収集装置100は、上記で残ったデータ項目をp値が低い順に並べ替え、これらをHDP発症予測モデル作成のための特徴量とする。また、特徴量表として、データ項目名、オッズ比、p値、変回帰係数βなどの情報を保存する。   Next, in step s202-7, the data collection device 100 rearranges the data items remaining above in ascending order of p value, and uses these as feature amounts for creating an HDP onset prediction model. In addition, information such as data item name, odds ratio, p value, and regression coefficient β is stored as a feature amount table.

次に、HDP発症予測モデルの作成方法について説明する。   Next, a method of creating an HDP onset prediction model will be described.

上記で作成した特徴量の全てを使ったモデルが最適とは限らないため、特徴量の数を徐々に増やしてモデルを作成し、予測精度が高いモデルを選定することを考える。   Since a model using all of the feature quantities created above is not necessarily optimal, it is considered to create a model by gradually increasing the number of feature quantities and select a model with high prediction accuracy.

ステップs203−1において、データ収集装置100は、妊娠の進み具合によってその後のHDP発症のリスクが変化することを想定し、一定の時間単位ごとにHDP発症の予測モデルを構築するものとする。一定の時間単位とは、例えば一週間を単位とすることが可能であるが、その限りではない。ここでは、妊娠16週から36週の各週(t週)においての予測モデルを構築するものとする。   In step s203-1, the data collection device 100 assumes that the risk of the subsequent onset of HDP changes according to the progress of pregnancy, and constructs a prediction model of the onset of the HDP in fixed time units. A certain unit of time may be, for example, one week, but it is not limited thereto. Here, it is assumed that a prediction model is built at each week (t week) of 16 weeks to 36 weeks of pregnancy.

ステップs203−2において、データ収集装置100は、s202−2の妊娠時データおよび経時データにおいて、s202−7で特定した特徴量のうち、妊娠時データおよびt週以前の経時データを抽出する。   In step s203-2, the data collection device 100 extracts pregnancy data and time-lapse data before t week from the feature quantities identified in s202-7 in the pregnancy data and time-lapse data of s202-2.

ステップs203−3において、データ収集装置100は、モデル作成の準備として、学習用データと評価用データを作成する。具体的には、データ収集装置100は、まずHDP群D1と非HDP群D2とに分ける。また、学習用データと評価用データに分ける比率をeとして、データ収集装置100は更に、D1をD1aとD1bとに分け、D2をD2aとD2bとに分け、学習用データをD1a+D2aとし、評価用データをD1b+D2bとする。ここで、eは任意の数値で、例えば、e=0.5であってもよい。また、D2として使用する妊婦の数を調節することが可能であり、例えばD2の妊婦の数をD1の妊婦の数の2倍まで、とすることも可能である。   In step s203-3, the data collection device 100 creates learning data and evaluation data as preparation for model creation. Specifically, the data acquisition device 100 is first divided into the HDP group D1 and the non-HDP group D2. Further, the data collection apparatus 100 further divides D1 into D1a and D1b, divides D2 into D2a and D2b, and sets learning data as D1a + D2a, where e is a ratio of learning data to evaluation data as e. The data is D1b + D2b. Here, e may be any numerical value, for example, e = 0.5. It is also possible to adjust the number of pregnant women used as D2, for example the number of pregnant women of D2 can be up to twice the number of pregnant women of D1.

ステップs203−4において、データ収集装置100は、予測性能を向上させるため、学習用データD1a, D2aにおいてD1aをオーバーサンプリングしてもよく、及び/又はD2aをアンダーサンプリングしてもよい。   In step s203-4, the data collection device 100 may oversample D1a in the learning data D1a and D2a, and / or undersample D2a to improve the prediction performance.

ステップs203−5において、データ収集装置100は、学習用データD1a, D2aを用いてforward stepwise selectionによって特徴量を選択し、t週時点でのHDP発症予測モデルMtを学習する。例えば、この時点の予測モデルとしてサポートベクターマシン(SVM)を使用し、学習用データを用いて学習させる。例えば、最初に100個の特徴量(妊娠時データおよび経時データ)について、データ収集装置100は、1つの特徴量だけを用いてt時点のHDP発症予測暫定モデルMt (1)〜Mt (100)を作成する。そして、データ収集装置100は、評価データ用D1b, D2bを用いて、最も性能の良いMt (A)(特徴量Aを使用)を特定する。性能スコアとして、例えば、AUC(Area under the curve)、f-score、感度と特異度の調和平均などが利用されてもよい。次に、データ収集装置100は、学習用データD1a, D2aを用いて、当該特徴量を除いた残りの99個の特徴量から1つの特徴量を選択してAと併せた2変数のHDP発症予測モデルMt (A,1)〜Mt (A,99)を作成し、評価用データD1b, D2bを用いて、Mt (A)を含めて最適なモデルMt(A,B)を選択する。データ収集装置100は、上述した一連の処理を再帰的に実行し、最終的にHDP発症予測モデルMt (A,B,C,...)を特定する。   In step s203-5, the data collection device 100 selects feature quantities by forward stepwise selection using the learning data D1a and D2a, and learns an HDP onset prediction model Mt at t week time point. For example, a support vector machine (SVM) is used as a prediction model at this time, and learning is performed using data for learning. For example, for the first 100 feature quantities (pregnancy data and time-lapse data), the data collection apparatus 100 uses only one feature quantity to predict the HDP onset provisional model Mt (1) to Mt (100) at time t. Create Then, the data collection apparatus 100 identifies Mt (A) (using the feature amount A) with the highest performance, using the evaluation data D1b and D2b. As the performance score, for example, area under the curve (AUC), f-score, harmonic mean of sensitivity and specificity, etc. may be used. Next, using the learning data D1a and D2a, the data collection device 100 selects one feature quantity from the remaining 99 feature quantities excluding the feature quantity, and causes the two variables HDP onset to be combined with A. Predictive models Mt (A, 1) to Mt (A, 99) are created, and the optimal data Mt (A, B) including Mt (A) is selected using the evaluation data D1b and D2b. The data acquisition device 100 recursively executes the series of processes described above, and finally identifies the HDP onset prediction model Mt (A, B, C,...).

なお、HDP発症予測モデルMは、SVM、線形ロジスティック回帰、ニューラルネットワーク、ランダムフォレストなどに基づき生成されてもよい。また、最適な特徴量を選択する方法としてはforward step selectionに限定されず、backward stepwise selection又はbidirectional stepwise selectionが利用されてもよい。また、全データ項目を利用し、PCAやMDS、NMDSなどで次元削減した後、PC1, PC2, ..., PCNのN個の特徴量に対してforward/backward/bidirectional stepwise selectionを適用してもよい。   The HDP onset prediction model M may be generated based on SVM, linear logistic regression, neural network, random forest, and the like. In addition, as a method of selecting the optimal feature amount, not only forward step selection but backward stepwise selection or bidirectional stepwise selection may be used. Also, after using all data items and reducing dimensions by PCA, MDS, NMDS, etc., apply forward / backward / bidirectional stepwise selection to N feature values of PC1, PC2, ..., PCN. It is also good.

ステップs203−6において、データ収集装置100は、tについて全時点のモデルを作成し、ループを終了する。
(実施例8)
図15は、本発明の他の実施例によるHDP発症日予測モデル作成処理を示すフローチャートである。複数の週数のデータを用いることで、HDP群と非HDP群のデータ分布の違いだけでなく、データ分布の時系列的変化の違いを利用し、より性能の高い予測モデルを生成可能である。当該HDP発症日予測モデル作成処理は、上述された図8のステップs102,s105において実行可能であり、前述のステップs202−1〜7がステップs102の特徴量の抽出処理を行い、後述のステップs205−1〜6がステップs105のHDP発症日予測モデルの生成処理を行う。なお、図15のステップs202−1〜7は図14のステップs202−1〜7と同じであり、ステップs205−1〜4,s205−6は図14のステップs203−1〜4,s203−6と同じであるため、その説明は省く。
In step s203-6, the data collection device 100 creates models at all points in time for t, and ends the loop.
(Example 8)
FIG. 15 is a flowchart showing HDP onset date prediction model creation processing according to another embodiment of the present invention. By using multiple weeks of data, it is possible to generate a higher-performance prediction model by using not only the difference in data distribution between HDP group and non-HDP group but also the difference in time series change of data distribution . The HDP onset date prediction model creation processing can be executed in steps s102 and s105 of FIG. 8 described above, and the above-described steps s202-1 to s7 perform the feature amount extraction processing of step s102, and the below-described step s205 -1 to 6 perform generation processing of the HDP onset day prediction model in step s105. Steps s202-1 to 7 in FIG. 15 are the same as steps s202-1 to 7 in FIG. 14, and steps s205-1 to s4 and s205-6 are steps s203-1 to s203 and s203-6 in FIG. Since it is the same as, its explanation is omitted.

図15のステップs205−5において、データ収集装置100は、学習用データD1a, D2aを用いてforward stepwise selectionによって特徴量を選択し、t週時点でのHDP発症日予測モデルMtを学習する。例えば、この時点の予測モデルとしてサポートベクターマシン(SVM)を使用し、学習用データを用いて学習させる。例えば、最初に100個の特徴量(妊娠時データおよび経時データ)について、データ収集装置100は、1つの特徴量だけを用いてt時点のHDP発症日予測暫定モデルMt (1)〜Mt (100)を作成する。そして、データ収集装置100は、評価データ用D1b, D2bを用いて、最も性能の良いMt (A)(特徴量Aを使用)を特定する。性能スコアとして、例えば、MSE(平均平方誤差)又はR2(決定係数)が利用されてもよい。次に、データ収集装置100は、学習用データD1a, D2aを用いて、当該特徴量を除いた残りの99個の特徴量から1つの特徴量を選択してAと併せた2変数のHDP発症日予測モデルMt (A,1)〜Mt (A,99)を作成し、評価用データD1b, D2bを用いて、Mt (A)を含めて最適なモデルMt(A,B)を選択する。データ収集装置100は、上述した一連の処理を再帰的に実行し、最終的にHDP発症日予測モデルMt (A,B,C,...)を特定する。   In step s205-5 of FIG. 15, the data collection device 100 selects feature quantities by forward stepwise selection using the learning data D1a and D2a, and learns an HDP onset date prediction model Mt at t week time point. For example, a support vector machine (SVM) is used as a prediction model at this time, and learning is performed using data for learning. For example, for the first 100 feature quantities (pregnancy data and time-lapse data), the data collection apparatus 100 uses only one feature quantity to predict the date of onset of HDP at time t, and the provisional models Mt (1) to Mt (100 (100) Create). Then, the data collection apparatus 100 identifies Mt (A) (using the feature amount A) with the highest performance, using the evaluation data D1b and D2b. As a performance score, for example, MSE (mean squared error) or R2 (decision coefficient) may be used. Next, using the learning data D1a and D2a, the data collection device 100 selects one feature quantity from the remaining 99 feature quantities excluding the feature quantity, and causes the two variables HDP onset to be combined with A. A daily prediction model Mt (A, 1) to Mt (A, 99) is created, and an optimal model Mt (A, B) including Mt (A) is selected using the evaluation data D1b and D2b. The data acquisition device 100 recursively executes the above-described series of processes, and finally identifies the HDP onset date prediction model Mt (A, B, C,...).

なお、HDP発症日予測モデルMは、SVM、線形回帰、ニューラルネットワークなどに基づき生成されてもよい。また、最適な特徴量を選択する方法としてはforward step selectionに限定されず、backward stepwise selection又はbidirectional stepwise selectionが利用されてもよい。また、全データ項目を利用し、PCAやMDS、NMDSなどで次元削減した後、PC1, PC2, ..., PCNのN個の特徴量に対してforward/backward/bidirectional stepwise selectionを適用してもよい。
(実施例9)
図16は、本発明の他の実施例によるHDP発症リスク予測モデル作成処理を示すフローチャートである。複数の週数のデータを用いることで、HDP群と非HDP群のデータ分布の違いだけでなく、データ分布の時系列的変化の違いを利用し、より性能の高い予測モデルを生成可能である。当該特徴量抽出・モデル作成処理は、上述された図8のステップs102,s107において実行可能であり、前述のステップs202−1〜7がステップs102の特徴量の抽出処理に対応し、後述のステップs207−1〜6がステップs107のHDP発症リスク予測モデルの生成処理に対応する。なお、図16のステップs202−1〜7は図14のステップs102−1〜7と同じであり、ステップs207−1〜4,s207−6は図14のステップs203−1〜4,s203−6と同じであるため、その説明は省く。
The HDP onset day prediction model M may be generated based on SVM, linear regression, neural network, or the like. In addition, as a method of selecting the optimal feature amount, not only forward step selection but backward stepwise selection or bidirectional stepwise selection may be used. Also, after using all data items and reducing dimensions by PCA, MDS, NMDS, etc., apply forward / backward / bidirectional stepwise selection to N feature values of PC1, PC2, ..., PCN. It is also good.
(Example 9)
FIG. 16 is a flowchart showing HDP risk prediction model creation processing according to another embodiment of the present invention. By using multiple weeks of data, it is possible to generate a higher-performance prediction model by using not only the difference in data distribution between HDP group and non-HDP group but also the difference in time series change of data distribution . The feature quantity extraction / model creation process can be executed in steps s102 and s107 of FIG. 8 described above, and the above-described steps s202-1 to s7 correspond to the feature quantity extraction process of step s102, and Steps s207-1 to s6 correspond to the process of generating an HDP onset risk prediction model in step s107. Steps s202-1 to 7 in FIG. 16 are the same as steps s102-1 to 7 in FIG. 14, and steps s207-1 to s4 and s207-6 are steps s203-1 to 4, s203-6 in FIG. Since it is the same as, its explanation is omitted.

図16のステップs207−5において、データ収集装置100は、s203−5と同様な方法で週数tにおけるHDP発症リスク予測モデルMtを作成するが、この際に用いるモデルには多変量ロジスティック回帰とする。   In step s207-5 of FIG. 16, the data collection device 100 creates the HDP onset risk prediction model Mt in the week t by the same method as s203-5, but the model used at this time includes multivariate logistic regression and the like. Do.

図8のデータ収集装置100は、s108にて、妊娠週数t1週の未出産の妊婦において、HDP発症リスク予測モデルMt1に特徴量のデータを当てはめ、HDPとなる確率pを計算することができる。   The data collection device 100 of FIG. 8 can calculate the probability p of becoming an HDP by applying feature amount data to the HDP risk prediction model Mt1 in a pregnant woman who has not given birth weeks t1 in s108. .

以上、本発明の実施例について詳述したが、本発明は上述した特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。   Although the embodiments of the present invention have been described in detail, the present invention is not limited to the specific embodiments described above, and various modifications may be made within the scope of the subject matter of the present invention described in the claims.・ Change is possible.

10 データ収集システム
20 計測装置
30 測定値転送装置
40 体調登録装置
50 気象情報取得装置
60 調査票登録装置
70 診療記録登録装置
100 データ収集装置
200 ネットワーク
DESCRIPTION OF SYMBOLS 10 Data acquisition system 20 Measurement apparatus 30 Measurement value transfer apparatus 40 Physical condition registration apparatus 50 Weather information acquisition apparatus 60 Questionnaire registration apparatus 70 Medical record registration apparatus 100 Data acquisition apparatus 200 Network

Claims (7)

複数のデータソース装置から妊婦に関するデータを取得するデータ取得機能と、
HDP発症予測モデルに基づき、前記取得したデータから前記妊婦のHDP発症予測を実行するHDP発症予測機能と、
前記HDP発症予測の結果を通知する結果通知機能と、
を有し、
前記データ取得機能は、前記妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において、前記データを複数の時点にて取得するデータ収集装置。
A data acquisition function for acquiring data on pregnant women from multiple data source devices;
An HDP onset prediction function that executes HDP onset prediction of the pregnant woman from the acquired data based on the HDP onset prediction model;
A result notification function for notifying the result of the HDP prediction;
Have
The data acquisition device acquires the data at a plurality of time points in a data acquisition period from any time before or after pregnancy of the pregnant woman to any time before or after delivery of the pregnant woman.
前記妊婦に関するデータは、妊娠時年齢、血圧、脈拍、体重、BMI、体脂肪率、骨格筋率、歩数、消費カロリー、体温、気分、睡眠時間、就寝時刻、起床時刻、就寝中に起きた回数、睡眠の質、便通の回数、便通の柔らかさ、子宮収縮、頭の痛み、歯の痛み、上腹部の痛み、下腹部の痛み、腰の痛み、吐き気、嘔吐、動悸、胎動間隔、食事内容、服薬内容、過去のHDP歴、妊娠状況、気温、室温、湿度、気圧、天気概況、潮汐及び月齢の1つ以上のデータ項目を含む、請求項1記載のデータ収集装置。   The data on the pregnant woman include pregnancy age, blood pressure, pulse, body weight, BMI, body fat rate, skeletal muscle rate, number of steps, calorie consumption, body temperature, mood, sleeping time, bedtime, wake up time, number of times during sleeping , Quality of sleep, frequency of bowel movements, softness of bowel movements, uterine contraction, head pain, tooth pain, upper abdominal pain, lower abdominal pain, lower back pain, nausea, vomiting, palpitations, interval of feces, food contents The data collection device according to claim 1, comprising one or more data items of medication content, past HDP history, pregnancy status, temperature, room temperature, humidity, barometric pressure, weather conditions, tides and age. 前記妊婦に関するデータは、妊娠時年齢、血圧、脈拍、体重、BMI、体脂肪率、骨格筋率、歩数、消費カロリー、体温、気分、睡眠時間、就寝時刻、起床時刻、就寝中に起きた回数、睡眠の質、便通の回数、便通の柔らかさ、子宮収縮、頭の痛み、歯の痛み、上腹部の痛み、下腹部の痛み、腰の痛み、吐き気、嘔吐、動悸、胎動間隔、食事内容、服薬内容、過去のHDP歴、妊娠状況、気温、室温、湿度、気圧、天気概況、潮汐及び月齢の2つ以上のデータ項目の組み合わせを含む、請求項1又は2記載のデータ収集装置。   The data on the pregnant woman include pregnancy age, blood pressure, pulse, body weight, BMI, body fat rate, skeletal muscle rate, number of steps, calorie consumption, body temperature, mood, sleeping time, bedtime, wake up time, number of times during sleeping , Quality of sleep, frequency of bowel movements, softness of bowel movements, uterine contraction, head pain, tooth pain, upper abdominal pain, lower abdominal pain, lower back pain, nausea, vomiting, palpitations, interval of feces, food contents The data collection device according to claim 1 or 2, comprising a combination of two or more data items of medication content, past HDP history, pregnancy status, temperature, room temperature, humidity, barometric pressure, weather conditions, tide and age. 前記HDP発症予測機能は、前記取得したデータを用い、前記HDP発症予測モデルにおいて、HDP群と非HDP群のデータ分布の違いの大きさもしくは/およびデータ分布の時系列的変化の違いの大きさを利用することで前記妊婦のHDP発症有無予測、HDP発症日予測又はHDP発症リスク算出を実行する、請求項1乃至3何れか一項記載のデータ収集装置。   The HDP onset prediction function uses the acquired data, and in the HDP onset prediction model, the magnitude of the difference in data distribution between the HDP group and the non-HDP group and / or the magnitude of the difference in time series change in data distribution The data collection device according to any one of claims 1 to 3, wherein the prediction of the onset of HDP, the prediction of the onset date of HDP, or the calculation of the risk of developing HDP is performed by using the above. HDP群と非HDP群とを分離する特徴量数を順次増やすことによって、前記HDP発症予測モデルを生成するHDP発症予測モデル生成機能を更に有する、請求項1乃至4何れか一項記載のデータ収集装置。   The data collection according to any one of claims 1 to 4, further comprising an HDP onset prediction model generation function of generating the HDP onset prediction model by sequentially increasing the number of feature quantities separating the HDP group and the non-HDP group. apparatus. HDP群と非HDP群とを分離する特徴量数を順次減らすことによって、前記HDP発症予測モデルを生成するHDP発症予測モデル生成機能を更に有する、請求項1乃至4何れか一項記載のデータ収集装置。   The data collection according to any one of claims 1 to 4, further comprising an HDP onset prediction model generation function of generating the HDP onset prediction model by sequentially reducing the number of feature quantities separating the HDP group and the non-HDP group. apparatus. 複数のデータソース装置から妊婦に関するデータを取得するステップと、
HDP発症予測モデルに基づき、前記取得したデータから前記妊婦のHDP発症予測を実行するステップと、
前記HDP発症予測の結果を通知するステップと、
を有し、
前記妊婦のHDP発症予測を実行するステップは、前記妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において、前記データを複数の時点にて取得することを含むデータ収集方法。
Obtaining data about a pregnant woman from a plurality of data source devices;
Performing HDP onset prediction of the pregnant woman from the acquired data based on the HDP onset prediction model;
Notifying the result of the HDP prediction.
Have
The step of performing HDP prediction of the pregnant woman includes acquiring the data at a plurality of time points in a data acquisition period from any time before and after pregnancy of the pregnant woman to any time before and after delivery. Data collection method.
JP2018039697A 2017-04-14 2018-03-06 Data collection device and data collection method Pending JP2018175850A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017080950 2017-04-14
JP2017080950 2017-04-14

Publications (1)

Publication Number Publication Date
JP2018175850A true JP2018175850A (en) 2018-11-15

Family

ID=64281976

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018039697A Pending JP2018175850A (en) 2017-04-14 2018-03-06 Data collection device and data collection method

Country Status (1)

Country Link
JP (1) JP2018175850A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019041754A (en) * 2017-08-31 2019-03-22 株式会社Nttドコモ Prediction device and prediction method
JP2020102046A (en) * 2018-12-21 2020-07-02 株式会社Nttドコモ Information processor, method for processing information, and program
JP2020110486A (en) * 2019-01-16 2020-07-27 株式会社Nttドコモ Outlier detection device, outlier detection system and outlier detection method
JP2020119406A (en) * 2019-01-25 2020-08-06 株式会社Nttドコモ Information processing device, information processing method, and program
KR20200104828A (en) * 2019-02-27 2020-09-04 울산과학기술원 System for Providing Efficient Detection of Disease Based on Data Association and its Operation Method
JP6988034B1 (en) * 2021-04-13 2022-01-05 国立大学法人東海国立大学機構 Pregnant woman depressive symptom estimation system and estimation method, estimation model generator

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009252945A (en) * 2008-04-04 2009-10-29 Hitachi High-Technologies Corp Deciding method of etching treatment state and system
JP2009543066A (en) * 2006-06-30 2009-12-03 アボット・ラボラトリーズ Method and apparatus for diagnosis of pre-eclampsia
US20120135427A1 (en) * 2009-04-23 2012-05-31 Wallac Oy Methods for determining maternal health risks
JP2013515255A (en) * 2009-12-21 2013-05-02 ユニバーシティ カレッジ コーク ナショナル ユニバーシティ オブ アイルランド コーク Detection of the risk of preeclampsia
JP2013524251A (en) * 2010-04-13 2013-06-17 プロノタ エヌ.ヴェ. Biomarkers for pregnancy-induced hypertension
WO2014109040A1 (en) * 2013-01-10 2014-07-17 富士通株式会社 Control method, control program, and control device
JP2014529308A (en) * 2011-06-30 2014-11-06 ユニヴァーシティ オヴ ピッツバーグ オヴ ザ コモンウェルス システム オヴ ハイアー エデュケーション System and method for determining susceptibility to cardiopulmonary dysfunction
JP2017027510A (en) * 2015-07-27 2017-02-02 Kddi株式会社 Selection device

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009543066A (en) * 2006-06-30 2009-12-03 アボット・ラボラトリーズ Method and apparatus for diagnosis of pre-eclampsia
JP2009252945A (en) * 2008-04-04 2009-10-29 Hitachi High-Technologies Corp Deciding method of etching treatment state and system
US20120135427A1 (en) * 2009-04-23 2012-05-31 Wallac Oy Methods for determining maternal health risks
JP2013515255A (en) * 2009-12-21 2013-05-02 ユニバーシティ カレッジ コーク ナショナル ユニバーシティ オブ アイルランド コーク Detection of the risk of preeclampsia
JP2013524251A (en) * 2010-04-13 2013-06-17 プロノタ エヌ.ヴェ. Biomarkers for pregnancy-induced hypertension
JP2014529308A (en) * 2011-06-30 2014-11-06 ユニヴァーシティ オヴ ピッツバーグ オヴ ザ コモンウェルス システム オヴ ハイアー エデュケーション System and method for determining susceptibility to cardiopulmonary dysfunction
WO2014109040A1 (en) * 2013-01-10 2014-07-17 富士通株式会社 Control method, control program, and control device
JP2017027510A (en) * 2015-07-27 2017-02-02 Kddi株式会社 Selection device

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019041754A (en) * 2017-08-31 2019-03-22 株式会社Nttドコモ Prediction device and prediction method
JP2020102046A (en) * 2018-12-21 2020-07-02 株式会社Nttドコモ Information processor, method for processing information, and program
JP7253181B2 (en) 2018-12-21 2023-04-06 株式会社Nttドコモ Information processing device, information processing method and program
JP2020110486A (en) * 2019-01-16 2020-07-27 株式会社Nttドコモ Outlier detection device, outlier detection system and outlier detection method
JP7182163B2 (en) 2019-01-16 2022-12-02 株式会社Nttドコモ Outlier detection device, outlier detection system, and outlier detection method
JP2020119406A (en) * 2019-01-25 2020-08-06 株式会社Nttドコモ Information processing device, information processing method, and program
KR20200104828A (en) * 2019-02-27 2020-09-04 울산과학기술원 System for Providing Efficient Detection of Disease Based on Data Association and its Operation Method
KR102338369B1 (en) 2019-02-27 2021-12-13 울산과학기술원 System for Providing Efficient Detection of Disease Based on Data Association and its Operation Method
JP6988034B1 (en) * 2021-04-13 2022-01-05 国立大学法人東海国立大学機構 Pregnant woman depressive symptom estimation system and estimation method, estimation model generator
WO2022219702A1 (en) * 2021-04-13 2022-10-20 国立大学法人東海国立大学機構 Maternal depression symptom estimation system, estimation method, and estimation model generation device

Similar Documents

Publication Publication Date Title
JP2018175850A (en) Data collection device and data collection method
Munjanja et al. Randomised controlled trial of a reduced-visits programme of antenatal care in Harare, Zimbabwe
Maddock et al. Adherence to a Dietary Approaches to Stop Hypertension (DASH)-type diet over the life course and associated vascular function: a study based on the MRC 1946 British birth cohort
Wang et al. Evaluating the risk of type 2 diabetes mellitus using artificial neural network: an effective classification approach
Poslusna et al. Misreporting of energy and micronutrient intake estimated by food records and 24 hour recalls, control and adjustment methods in practice
Hardy et al. A life course approach to cardiovascular aging
JP5185785B2 (en) Health condition judgment device
Chavarro et al. Contributions of the nurses’ health studies to reproductive health research
Smith et al. Physical activity during pregnancy: impact of applying different physical activity guidelines
JP2018140172A (en) Data collection device and data collection method
JP2010142273A (en) Biomarker management apparatus
US11529105B2 (en) Digital twin updating
CN107358556A (en) Health monitoring and evaluation platform based on Internet of Things
JP7097570B2 (en) Data collection analysis device and data collection analysis method
Adane et al. Pre-pregnancy weight change and incidence of gestational diabetes mellitus: A finding from a prospective cohort study
Riaz et al. Risk assessment of Pakistani individuals for diabetes (RAPID)
McKenzie et al. The association of energy and macronutrient intake with all-cause mortality, cardiovascular disease and dementia: findings from 120 963 women and men in the UK Biobank
CN108735281A (en) Dynamic and intelligent Weight management system and method
Montano Depressive symptoms and blood pressure
KR101009083B1 (en) Bayesian network system for incident risk prediction of pressure ulcers
Rahman et al. Hypertension and diabetes prevalence among adults with moderately increased BMI (23· 0–24· 9 kg/m2): findings from a nationwide survey in Bangladesh
Kuh et al. Early life origins of adult health and aging
Valero-Ramon et al. A dynamic behavioral approach to nutritional assessment using process mining
KR101274431B1 (en) Apparatus and method for determining health using survey information, apparatus and method for generating health sort function
Kim et al. Causes of different estimates of the prevalence of metabolic syndrome in Korea

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200806

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210414

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210618

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211116

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220426