JP2019045264A - 予測装置及び予測方法 - Google Patents

予測装置及び予測方法 Download PDF

Info

Publication number
JP2019045264A
JP2019045264A JP2017167634A JP2017167634A JP2019045264A JP 2019045264 A JP2019045264 A JP 2019045264A JP 2017167634 A JP2017167634 A JP 2017167634A JP 2017167634 A JP2017167634 A JP 2017167634A JP 2019045264 A JP2019045264 A JP 2019045264A
Authority
JP
Japan
Prior art keywords
prediction
preterm birth
birth
bacterial flora
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017167634A
Other languages
English (en)
Other versions
JP6876300B2 (ja
Inventor
越智 大介
Daisuke Ochi
大介 越智
隆史 山内
Takashi Yamauchi
隆史 山内
淑希 恒元
Yoshiki Tsunemoto
淑希 恒元
檜山 聡
Satoshi Hiyama
聡 檜山
正朗 長崎
Masao Nagasaki
正朗 長崎
準一 菅原
Junichi Sugawara
準一 菅原
修 田邉
Osamu Tanabe
修 田邉
理宇 山下
Riu Yamashita
理宇 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tohoku University NUC
NTT Docomo Inc
Original Assignee
Tohoku University NUC
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tohoku University NUC, NTT Docomo Inc filed Critical Tohoku University NUC
Priority to JP2017167634A priority Critical patent/JP6876300B2/ja
Publication of JP2019045264A publication Critical patent/JP2019045264A/ja
Application granted granted Critical
Publication of JP6876300B2 publication Critical patent/JP6876300B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

【課題】口腔内細菌叢から早産発症予測を実現するための予測装置及び方法を提供することである。【解決手段】本発明の一態様は、妊婦の口腔内の細菌叢に関する細菌叢データを取得するデータ取得機能と、前記細菌叢データに基づき早産予測モデルを生成する早産予測モデル生成機能と、前記早産予測モデルに基づき、前記取得した細菌叢データから前記妊婦の早産発症予測を実行する早産予測機能と、前記早産発症予測の結果を通知する結果通知機能と、を有し、前記データ取得機能は、前記妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において、前記細菌叢データを複数の時点にて取得し、前記早産予測機能は、前記複数の時点において取得された前記細菌叢データに基づき前記早産発症予測を実行する予測装置に関する。【選択図】図3

Description

本発明は、一般に医療診断技術に関し、より詳細には、非侵襲的に早産の発症予測又は異常検出を行うために情報を収集し早産発症予測を行う予測装置及び方法に関する。
妊娠関連疾患として、早産は、原因不明が約3分の1を占める周産期医療上の代表的な疾患であり、複雑な相互作用により発症する多因子疾患である。妊婦の歯周炎と早産・低体重児出産との関連が報告されているが、その詳細なメカニズムは不明な点が多い。
非特許文献1によると、妊婦124名に対し、妊娠期間中あるいは産後3日以内にClinical attachment level (CAL)、Probing depth (PD)を測定し、PLBW(Preterm Low Birth Weight)だったケース群とそうでないコントロール群で評価したところ、ケース群(31名)のCAL平均値がコントロール群よりも有意に大きかった。また、CALが3mm以上の歯が60%以上を占めた妊婦においては、PLBW発症危険率が全体で5.9倍、初産で6.7倍だった。
また、非特許文献2によると、切迫早産から早産となった18名とそうでない正期産40名の第2トライメスターの歯垢細菌叢を比較したところ、歯周病関連細菌の一つであるTannerella forsythenesisの割合が有意に高かった。このTannerella forsythenesisは、歯周病に関連のある細菌と言われる3つのred complexのうちの一つである。
Offenbacher S, et al, Periodontal Infection as a Possible Risk Factor for Preterm Low Birth Weight, J Peridontol, 67, 1103-1113, 1996 Hasegawa K, et al, Associations between systemic status, oeruidibtak statysm seryn cytokine levels and delivery outcomes in pregnant women with a diagnosis of threatened premature labor (TPL), J Peridontol, 74, 1764-1770, 2003
Offenbacherらの報告を発端として、世界各地で同様に歯周病と早産・低体重との関連が報告されているが、これらの関係は人種差があり、日本人の妊婦を対象にした研究が少ない。長谷川らの報告によると、時系列で1点のみの測定であるため、経時的な変化による早産への影響が不明である。また、単に関連性のみを報告しているが、それが早産の予測にどれだけ役立つのかの評価がない。
上述した問題点を鑑み、本発明の課題は、口腔内細菌叢から早産発症予測を実現するための予測装置及び方法を提供することである。
上記課題を解決するため、本発明の一態様は、妊婦の口腔内の細菌叢に関する細菌叢データを取得するデータ取得機能と、前記細菌叢データに基づき早産予測モデルを生成する早産予測モデル生成機能と、前記早産予測モデルに基づき、前記取得した細菌叢データから前記妊婦の早産発症予測を実行する早産予測機能と、前記早産発症予測の結果を通知する結果通知機能と、を有し、前記データ取得機能は、前記妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において、前記細菌叢データを複数の時点にて取得し、前記早産予測機能は、前記複数の時点において取得された前記細菌叢データに基づき前記早産発症予測を実行する予測装置に関する。
本発明によると、口腔内細菌叢から早産発症予測を実現するための予測装置及び方法を提供することができる。
図1は、本発明の一実施例による予測システムの構成を示す概略図である。 図2は、本発明の一実施例による予測装置の機能構成を示すブロック図である。 図3は、本発明の一実施例による予測処理を示すフローチャートである。 図4は、本発明の一実施例による特徴量抽出・モデル作成処理を示すフローチャートである。 図5は、本発明の他の実施例による特徴量抽出・モデル作成処理を示すフローチャートである。 図6は、本発明の他の実施例による特徴量抽出・モデル作成処理を示すフローチャートである。
以下、図面に基づいて本発明の実施の形態を説明する。
後述される実施例では、早産発症予測のための予測装置が開示される。後述される実施例によると、複数の妊娠フェーズにおいて採取された妊婦の口腔内の細菌叢に関する細菌叢データを取得すると、予測装置は、早産発症と相関を有する細菌種を抽出し、抽出した細菌種を用いて生成した早産予測モデルに基づき、取得した細菌叢データから妊婦の早産発症予測を実行する。これにより、人種間の差があると共に、経時的に変化すると考えられている細菌叢データからの早産予測に対して、特定の人種に適した早産予測モデルが生成可能になる。
まず、図1を参照して、本発明の一実施例による予測システムを説明する。図1は、本発明の一実施例による予測システムの構成を示す概略図である。
図1に示されるように、予測システム10は、細菌叢計測装置50及び予測装置100を有する。
細菌叢計測装置50は、採取された歯垢検体から口腔内の細菌叢を測定し、生成された細菌叢データを予測装置100に提供する。具体的には、検査技師が妊婦の歯垢検体を採取し、細菌叢計測装置50を用いて採取した歯垢検体に存在する細菌種を示す細菌叢データを取得し、取得した細菌叢データを予測装置100に提供する。
人間の口腔内に存在する細菌種として、例えば、Porphyromonas gingivalis, Treponema denticola, Tabberella forsythensis, Bergeyella, Kingella denitrificans, Scardovia wiggsiae, Streptococus mutans, Selenomonas, Capnocytophaga, Treponema vincentiiなどを含む約200種類以上の細菌種が知られており、特にPorphyromonas gingivalis, Treponema denticola, Tabberella forsythensisは、歯周病に関わるred complexとして分類され、妊娠関連疾患との相関が指摘されている。細菌叢計測装置50は、口腔内の細菌種を計測するのに用いられる何れか既知のものであってもよい。
予測装置100は、提供された細菌叢データから早産発症を予測する。具体的には、予測装置100は、以下で詳細に説明されるように、早産群の細菌叢データ及び非早産群又は正期産群の細菌叢データを含む既知のデータから早産予測モデルを作成し、作成した早産予測モデルに予測対象となる妊婦の細菌叢データを入力することによって、当該妊婦の早産の発症の有無を予測する。なお、本発明による早産発症予測は、早産の発症の有無に限定されず、後述されるように、出産日の予測、早産リスクの算出などを含むものであってもよい。
ここで、予測装置100は、典型的には、コンピュータ、サーバ、スマートフォン、タブレットなどの通信機能を備えた情報処理装置により実現されてもよい。例えば、情報処理装置に搭載されたプロセッサが、メモリ装置に格納されたデータやプログラムを処理及び実行することによって、後述される各種機能及び処理を実行する。しかしながら、予測装置100は、何れか特定のハードウェア構成に限定されるものでなく、適切なハードウェア構成により実現されてもよい。
次に、図2を参照して、本発明の一実施例による予測装置を説明する。図2は、本発明の一実施例による予測装置の機能構成を示すブロック図である。
図2に示されるように、予測装置100は、データ取得機能110、データ保存機能120、早産予測モデル生成機能130、早産予測機能140及び結果通知機能150を有する。
データ取得機能110は、細菌叢計測装置50から細菌叢データを取得する。具体的には、データ取得機能110は、妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において、妊婦に関する細菌叢データを複数の時点にて取得する。例えば、データ取得機能110は、細菌叢計測装置50から、異なる妊娠フェーズ(例えば、12〜23週と24〜34週)に採取された妊婦の口腔内の細菌叢データを取得してもよい。
データ保存機能120は、取得した妊婦の口腔内の細菌叢データを保存する。具体的には、データ保存機能120は、取得した細菌叢データを各妊娠フェーズで採取された細菌種(例えば、200菌種など)のそれぞれを独立した変数として保存する。例えば、2つの妊娠フェーズでそれぞれ200菌種の細菌種が採取された場合、経時的な複数時点の歯垢細菌組成の変化を加味したモデルを作成できるように、400個(200菌種×2妊娠フェーズ)の変数が設定されてもよい。
早産予測モデル生成機能130は、取得された妊婦の口腔内の細菌叢データに基づき、早産の発症の有無を予測する早産予測モデルを生成する。具体的には、早産予測モデル生成機能130は、正期産により出産した妊婦(正期産群)と早産により出産した妊婦(早産群)とを含む複数の妊婦から取得した口腔内の細菌叢データに基づき、早産発症予測モデルを生成及び更新してもよい。例えば、以下で詳細に説明されるように、早産予測モデル生成機能130は、取得した細菌叢データから早産群と正期産群とをよく分ける細菌種を特定し、変数を削減するため、二群をよく分ける細菌種として10〜20個の細菌種×妊娠フェーズを抽出してもよい。早産群と正期産群とをよく分ける細菌種として、red complexとして分類されるPorphyromonas gingivalis, Treponema denticola, Tabberella forsythensisや、Bergeyella, Kingella denitrificans, Scardovia wiggsiae, Streptococus mutans, Selenomonas, Capnocytophaga, Treponema vincentiiなどが抽出されてもよい。
続いて、早産予測モデル生成機能130は、抽出された細菌種を特徴量として用いて早産予測モデルを作成する。具体的な予測モデルの作成手法として、例えば、早産予測モデル生成機能130は、Linear SVMを用いて、特徴量として用いられる細菌種をforward stepwise selectionによって選択してもよい。例えば、最初に20個の特徴量(妊娠フェーズごとの細菌種)について、早産予測モデル生成機能130は、1つの特徴量だけを用いて早産予測モデルM(1)〜M(20)を作成し、最も性能の良いM(A)(特徴量Aを使用)を特定する。次に、早産予測モデル生成機能130は、当該特徴量を除いた残りの19個の特徴量から1つの特徴量を選択してAと併せた2変数の予測モデルM(A,1)〜M(A,19)を作成し、M(A)を含めて最適なモデルを選択する。早産予測モデル生成機能130は、上述した一連の処理を再帰的に実行し、最終的に予測モデルM(A,B,C,...)を特定する。
なお、上述した実施例では、早産の発症有無を示す早産発症予測モデルについて説明したが、本発明による早産予測モデルは、これに限定されず、出産日を予測する出産日予測及び早産発症リスクモデル又は発症確率を予測する早産発症リスクモデルであってもよい。
早産予測機能140は、早産予測モデルに基づき、取得した妊婦の細菌叢データから当該妊婦の早産発症予測を実行する。具体的には、早産予測機能140は、複数の時点において取得した妊婦の細菌叢データを早産予測モデルに投入し、複数の時点において取得した細菌叢データに基づく早産予測モデルの出力結果に基づき当該妊婦の早産有無予測、出産日予測又は早産発症リスク算出を実行してもよい。すなわち、早産予測機能140は、当該妊婦に早産の可能性があるか予測するか(早産発症有無予測)、当該妊婦の出産日を予測するか(出産日予測)、あるいは、当該妊婦の早産発症リスクを算出してもよい(早産発症リスク算出)。
結果通知機能150は、早産予測機能140によって実行された早産予測の結果を妊婦、医療関係者などに通知する。
次に、図3〜6を参照して、本発明の一実施例による予測処理を説明する。当該予測処理は、上述した予測装置100によって実行される。図3は、本発明の一実施例による予測処理を示すフローチャートである。
図3に示されるように、ステップS100において、予測装置100は、細菌叢計測装置50から細菌叢データを取得し、取得した細菌叢データを保存する。具体的には、細菌叢計測装置50は、妊婦から採取された歯垢検体を計測し、当該歯垢検体に含まれる細菌種量を示す細菌叢データを予測装置100に提供する。予測装置100は、細菌叢計測装置50から取得した細菌叢データを妊婦毎に保存する。本実施例によると、細菌叢データは、例えば、妊娠フェーズ毎など、妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において各妊婦に対して複数回採取される。
ステップs101において、予測装置100は、取得した細菌叢データに対して異常値を検出及び除去し、欠測値を補完する。例えば、基準値から閾値範囲外の細菌種量が測定された場合、予測装置100は、当該測定値を実際の値ではなく計測エラーとみなして、当該測定値を除去すると共に、他の細菌種量の値が類似する別の歯垢検体の当該測定値にランダムなノイズを加えて流用するか、他の細菌種量の値が類似する別の歯垢検体を複数抽出してそれらの当該測定値の分布からその分布に従うように1つの推定値を算出するなど何れかの方法により当該測定値を補完してもよい。例えば、検体Sの細菌種spA-2が閾値範囲外または欠測値である場合、まず検体S以外の検体群においてspA-2の細菌種量の分散Vを計算する。つぎに、細菌種群BALL={spA-1, spB-1,…, spA-2, spB-2}からspA-2を抜いた細菌種群BSUBの各細菌種量が検体Sと近い検体を1検体抽出し、そのspA-2の細菌種量に正規分布N(0,V)に従うランダムな1点を足し合わせた値を検体SのspA-2の推定量とする方法がある。このとき、検体Sと近い検体の抽出には、各細菌種量を各細菌種量の標準偏差で割って標準化した値を用いてユーグリッド距離を計算しても良いし、MSE(平均平方誤差)又はR2(決定係数)などを用いても良い。また別の補完方法として、細菌種群BSUBの各細菌種量が検体Sと近い検体を例えば10検体だけ抽出し、その平均値E2および分散V2を求め、正規分布N(E2,V2)に従うランダムな1点を検体SのspA-2の推定量とする方法がある。また、分布は必ずしも正規分布とせず、任意の分布で推定してもよい。
ステップs102において、予測装置100は、既に出産して出産状況が確定している妊婦のデータを用いて、早産群と正期産群とをよく分ける変数を特徴量として抽出する。これには、ステューデントのt検定、ウェルチのt検定、多変量ロジスティック回帰、カイ二乗検定などを用いて変数を限定する方法、Lasso回帰、Ridge回帰、Elastic Netなどにより有用な変数を限定する方法、主成分分析の寄与率などから変数を限定する方法などがあるが、それらに限定されるものでない。
ステップs103、s105及びs107において、予測装置100は、抽出した特徴量を用いて早産予測モデルを生成する。具体的には、予測装置100は、ステップs103において、早産になるかどうかを予測する分類モデルとして早産発症予測モデルを生成する。また、予測装置100は、ステップs105において、各妊婦の出産日を予測する回帰モデルとして出産日予測モデルを生成する。また、予測装置100は、s107において、早産発症のリスクを算出する早産発症リスク算出モデルを生成する。回帰モデルには、線形回帰モデル、ロジスティック回帰モデル、SVMによる回帰モデル、多層ニューラルネットワークによる回帰モデルなどがあるが、それらに限定されるものでない。また、分類モデルにおいても、線形分類、ロジスティック回帰、ベイジアンネットワーク、SVM、k近傍法、ランダムフォレスト、多層ニューラルネットワークによる分類モデルなどがあるが、それらに限定されるものでない。早産発症リスク算出モデルについては、オッズ比、寄与危険度、相対危険度などがあるが、それらに限定されるものでない。また、ステップs103、s105、s107は、s102と切り離さずに一体で処理されてもよい。
ステップs104、s106及びs108において、予測装置100は、生成された早産発症予測モデル、出産日予測モデル及び早産発症リスク算出モデルに予測対象の妊婦の細菌叢データをそれぞれ投入し、早産予測を実行する。具体的には、予測装置100は、ステップs104において、早産発症予測モデルを利用して予測対象の妊婦の細菌叢データから将来の早産発症の有無を予測する。また、予測装置100は、ステップs106において、出産日予測モデルを利用して予測対象の妊婦の細菌叢データから出産日を予測する。また、予測装置100は、ステップs108において、早産発症リスク算出モデルを利用して予測対象の妊婦の細菌叢データから早産発症リスクを算出する。なお、早産有無予測は、最終的な早産発症有無の予測、この先n1週間(n1は任意の数値)で早産を発症しない予測、この先n2週間(n2は任意の数値)で早産を発症する予測、などを含むが、それらに限定されるものでない。
ステップs109において、予測装置100は、早産発症予測結果、出産日予測結果及び/又は早産発症リスク計算結果を妊婦又は医療機関に通知し、当該予測処理を終了する。
図4は、本発明の一実施例による特徴量抽出・モデル作成処理を示すフローチャートである。当該特徴量抽出・モデル作成処理は、上述された図3のステップs102,s103において実行可能であり、後述されるステップs102−1〜5がステップs102の特徴量の抽出処理に対応し、ステップs103−1〜3がステップs103の早産発症有無予測モデルの生成処理に対応する。当該特徴量抽出・モデル作成処理では、早産予測モデル生成機能130は、取得したデータを早産群と正期産群とに分け、各変数のうち二群をよく分ける(すなわち、区別する、判別する、分離するなど)変数、例えば、二群をよく分ける上位の所定数の変数を特徴量として抽出し、抽出された特徴量を用いて早産予測モデルを作成し、最も性能の良い特徴量による早産予測モデルを特定する。次に、早産予測モデル生成機能130は、当該特徴量を除いた残りの特徴量と特定された特徴量とを併せた2変数の予測モデルを作成し、これらのモデルを含めて最適なモデルを選択する。早産予測モデル生成機能130は、上述した一連の処理を再帰的に実行し、最終的に早産予測モデルを特定する。なお、上記は早産発症有無予測モデルに利用する特徴量の抽出方法や早産発症有無予測モデルの選定方法の一例であって、早産発症有無予測モデルはこれに制限されない。例えば、多層ニューラルネットワークまたはLasso回帰などによって特徴量を抽出し、早産発症有無予測モデルを生成する方法もある。
図4に示されるように、ステップs102−1において、予測装置100は、取得した細菌叢データを加工する。具体的には、予測装置100は、例えば、細菌種の計測量を相対量に標準化してもよいし、また、相対量が少ない細菌種を削除してもよい。
ステップs102−2において、予測装置100は、モデル生成のために、既に出産済みの妊婦の細菌叢データを抽出する。
ステップs102−3において、予測装置100は、妊娠フェーズ毎に採取された歯垢検体の細菌叢データについて、各妊娠フェーズにおいて採取された各細菌種のそれぞれを独立した変数として保存する。例えば、2つの妊娠フェーズでそれぞれ200菌種の細菌種が採取された場合、400個(200菌種×2妊娠フェーズ)の変数が設定される。例えば、400個のデータは、当該妊婦のID(userid)と関連付けて、"spA-1, spB-1, ...,spA-2, spB-2, ..."の変数列により表されてもよい。
ステップS102−4において、予測装置100は、早産群と正期産群とに細菌叢データを分け、検定にてp値がa未満(例えば、a=0.01)となる二群間をよく分ける細菌種を抽出する。
ステップS102−5において、予測装置100は、抽出した細菌種をp値の昇順にソートし、これらを特徴量とする。
ステップS103−1において、予測装置100は、細菌叢データを早産群D1と正期産群D2とに分け、それぞれの比率e(例えば、e=0.9)で早産群D1を学習用データD1a及び評価用データD1bに分け、正期産群D2を学習用データD2a及び評価用データD2bに分ける。
ステップS103−2において、予測装置100は、予測性能を向上させるため、学習用データD1a, D2aにおいてD1aをオーバーサンプリングしてもよく、及び/又はD2aをアンダーサンプリングしてもよい。
ステップS103−3において、予測装置100は、学習用データD1a, D2aを用いてforward stepwise selectionによって特徴量を選択し、早産予測モデルMを作成する。例えば、最初に20個の特徴量(妊娠フェーズごとの細菌種)について、予測装置100は、1つの特徴量だけを用いて早産予測モデルM(1)〜M(20)を作成する。そして、予測装置100は、評価データ用D1b, D2bを用いて、最も性能の良いM(A)(特徴量Aを使用)を特定する。性能スコアとして、例えば、AUC(Area under the curve)又はf-scoreが利用されてもよい。次に、予測装置100は、学習用データD1a, D2aを用いて、当該特徴量を除いた残りの19個の特徴量から1つの特徴量を選択してAと併せた2変数の早産予測モデルM(A,1)〜M(A,19)を作成し、評価用データD1b, D2bを用いて、M(A)を含めて最適なモデルを選択する。予測装置100は、上述した一連の処理を再帰的に実行し、最終的に早産予測モデルM(A,B,C,...)を特定する。
なお、早産予測モデルMは、SVM、線形ロジスティック回帰、ニューラルネットワーク、ランダムフォレストなどに基づき生成されてもよい。また、性能スコアは、AUC又はf-scoreに限定されず、sensitivityとspecificityとの調和平均などが用いられてもよい。また、最適な特徴量を選択する方法としてはforward step selectionに限定されず、backward stepwise selection又はbidirectional stepwise selectionが利用されてもよい。また、全細菌種を利用し、PCAやMDS、NMDSなどで次元削減した後、PC1, PC2, ..., PCNのN個の特徴量に対してforward/backward/bidirectional stepwise selectionを適用してもよい。
図5は、本発明の他の実施例による特徴量抽出・モデル作成処理を示すフローチャートである。当該特徴量抽出・モデル作成処理は、上述された図3のステップs102,s105において実行可能であり、後述されるステップs102−1〜5がステップs102の特徴量の抽出処理に対応し、ステップs105−1〜3がステップs105の出産日予測モデルの生成処理に対応する。なお、ステップS102−1〜5は図4のステップS102−1〜5と同じであるため、その説明は省く。
ステップS105−1において、予測装置100は、細菌叢データを早産群D1と正期産群D2とに分け、それぞれの比率e(例えば、e=0.9)で早産群D1を学習用データD1a及び評価用データD1bに分け、正期産群D2を学習用データD2a及び評価用データD2bに分ける。
ステップS105−2において、予測装置100は、予測性能を向上させるため、学習用データD1a, D2aにおいてD1aをオーバーサンプリングしてもよく、及び/又はD2aをアンダーサンプリングしてもよい。
ステップS105−3において、予測装置100は、学習用データD1a, D2aを用いてforward stepwise selectionによって特徴量を選択し、出産日予測モデルMを作成する。例えば、最初に20個の特徴量(妊娠フェーズごとの細菌種)について、予測装置100は、1つの特徴量だけを用いて出産日予測モデルM(1)〜M(20)を作成する。そして、予測装置100は、評価データ用D1b, D2bを用いて、最も性能の良いM(A)(特徴量Aを使用)を特定する。性能スコアとして、例えば、MSE(平均平方誤差)又はR2(決定係数)が利用されてもよい。次に、予測装置100は、学習用データD1a, D2aを用いて、当該特徴量を除いた残りの19個の特徴量から1つの特徴量を選択してAと併せた2変数の出産日予測モデルM(A,1)〜M(A,19)を作成し、評価用データD1b, D2bを用いて、M(A)を含めて最適なモデルを選択する。予測装置100は、上述した一連の処理を再帰的に実行し、最終的に出産日予測モデルM(A,B,C,...)を特定する。
なお、出産日予測モデルMは、SVM、線形ロジスティック回帰、ニューラルネットワークなどに基づき生成されてもよい。また、性能スコアは、MSE(平均平方誤差)又はR2(決定係数)に限定されなくてもよい。また、最適な特徴量を選択する方法としてはforward step selectionに限定されず、backward stepwise selection又はbidirectional stepwise selectionが利用されてもよい。また、全細菌種を利用し、PCAやMDS、NMDSなどで次元削減した後、PC1, PC2, ..., PCNのN個の特徴量に対してforward/backward/bidirectional stepwise selectionを適用してもよい。
図6は、本発明の他の実施例による特徴量抽出・モデル作成処理を示すフローチャートである。当該特徴量抽出・モデル作成処理は、上述された図3のステップs102,s107において実行可能であり、後述されるステップs102−1〜5がステップs102の特徴量の抽出処理に対応し、ステップs107−1〜2がステップs107の早産リスクモデルの生成処理に対応する。なお、ステップS102−1〜5は図4のステップS102−1〜5と同じであるため、その説明は省く。
ステップS107−1において、予測装置100は、細菌種(spA-1, spB-1, ..., spA-2, spB-2, ...)毎に量の閾値範囲SspA-1=[AspA-1, Bspa-1]を設定し、早産に対するリスク比(RRspA-1)を計算する。ここで、リスク比はRR=a(c+d)/c(a+b)であり、aは早産群であって(細菌種の量が)閾値範囲内である歯垢検体数であり、bは正期産群であって閾値範囲内である歯垢検体数であり、cは早産群であって閾値範囲外である歯垢検体数であり、dは正期産群であって閾値範囲外である歯垢検体数である。
ステップS107−2において、予測装置100は、予測対象の妊婦の細菌種の量を(xspA-1, xspB-1,...)とした場合、
RR=ΠspRRsp f(x sp )
f(xsp) = 1 if xsp is in Ssp
f(xsp) = -1 if xsp is not in Ssp
によって、早産リスク予測モデルを生成してもよい。
上記の一例を実施した結果では、早産群と正期産群をよく分ける細菌種として、Porphyromonas gingivalis, Treponema denticola, Tabberella forsythensisや、Bergeyella, Kingella denitrificans, Scardovia wiggsiae, Streptococus mutans, Selenomonas, Capnocytophaga, Treponema vincentiiなどが抽出され、これらを特徴量として用いた早産発症有無予測モデルの性能は、感度0.714、特異度0.751となった。
以上、本発明の実施例について詳述したが、本発明は上述した特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
10 予測システム
50 細菌叢計測装置
100 予測装置
110 データ取得機能
120 データ保存機能
130 早産予測モデル生成機能
140 早産予測機能
150 結果通知機能

Claims (5)

  1. 妊婦の口腔内の細菌叢に関する細菌叢データを取得するデータ取得機能と、
    前記細菌叢データに基づき早産予測モデルを生成する早産予測モデル生成機能と、
    前記早産予測モデルに基づき、前記取得した細菌叢データから前記妊婦の早産発症予測を実行する早産予測機能と、
    前記早産発症予測の結果を通知する結果通知機能と、
    を有し、
    前記データ取得機能は、前記妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において、前記細菌叢データを複数の時点にて取得し、
    前記早産予測機能は、前記複数の時点において取得された前記細菌叢データに基づき前記早産発症予測を実行する予測装置。
  2. 前記早産予測モデル生成機能は、前記複数の時点で取得された細菌叢データの各細菌種を独立した変数として設定し、早産群と正期産群とをよく分ける上位の所定数の変数を抽出し、
    前記早産予測モデル生成機能は、forward stepwise selection方式に従って、前記抽出した変数から前記早産予測モデルを生成する、請求項1記載の予測装置。
  3. 前記早産予測モデル生成機能は、早産群と正期産群とをよく分ける細菌種として、Porphyromonas gingivalis, Treponema denticola, Tabberella forsythensisや、Bergeyella, Kingella denitrificans, Scardovia wiggsiae, Streptococus mutans, Selenomonas, Capnocytophaga, Treponema vincentiiの1つ以上を抽出する、請求項1又は2記載の予測装置。
  4. 前記早産予測モデル生成機能は、早産発症有無予測モデル、出産日予測モデル及び早産リスクモデルを生成し、
    前記早産予測機能は、前記生成された早産発症有無予測モデル、出産日予測モデル及び早産リスクモデルにそれぞれ基づき、早産発症有無予測、出産日予測及び早産リスク算出を実行する、請求項1乃至3何れか一項記載の予測装置。
  5. 妊婦の口腔内の細菌叢に関する細菌叢データを取得するステップと、
    前記細菌叢データに基づき早産予測モデルを生成するステップと、
    前記早産予測モデルに基づき、前記取得した細菌叢データから前記妊婦の早産発症予測を実行するステップと、
    前記早産発症予測の結果を通知するステップと、
    を有する予測方法であって、
    前記取得するステップは、前記妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において、前記細菌叢データを複数の時点にて取得し、
    前記実行するステップは、前記複数の時点において取得された前記細菌叢データに基づき前記早産発症予測を実行する予測方法。
JP2017167634A 2017-08-31 2017-08-31 予測装置 Active JP6876300B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017167634A JP6876300B2 (ja) 2017-08-31 2017-08-31 予測装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017167634A JP6876300B2 (ja) 2017-08-31 2017-08-31 予測装置

Publications (2)

Publication Number Publication Date
JP2019045264A true JP2019045264A (ja) 2019-03-22
JP6876300B2 JP6876300B2 (ja) 2021-05-26

Family

ID=65812735

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017167634A Active JP6876300B2 (ja) 2017-08-31 2017-08-31 予測装置

Country Status (1)

Country Link
JP (1) JP6876300B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019041754A (ja) * 2017-08-31 2019-03-22 株式会社Nttドコモ 予測装置及び予測方法
KR20230013726A (ko) * 2021-07-19 2023-01-27 주식회사 디앤피바이오텍 기계 학습에 기반한 조산 위험도 예측 장치

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019041754A (ja) * 2017-08-31 2019-03-22 株式会社Nttドコモ 予測装置及び予測方法
KR20230013726A (ko) * 2021-07-19 2023-01-27 주식회사 디앤피바이오텍 기계 학습에 기반한 조산 위험도 예측 장치
KR102559223B1 (ko) 2021-07-19 2023-07-26 주식회사 디앤피바이오텍 기계 학습에 기반한 조산 위험도 예측 장치

Also Published As

Publication number Publication date
JP6876300B2 (ja) 2021-05-26

Similar Documents

Publication Publication Date Title
Vila-Blanco et al. Deep neural networks for chronological age estimation from OPG images
Li et al. Teeth category classification via seven‐layer deep convolutional neural network with max pooling and global average pooling
Galibourg et al. Comparison of different machine learning approaches to predict dental age using Demirjian’s staging approach
Liversidge Controversies in age estimation from developing teeth
Ito et al. Risk assessment of dental caries by using Classification and Regression Trees
JP6988895B2 (ja) 疾病発症リスク予測システム、疾病発症リスク予測方法および疾病発症リスク予測プログラム
Mielczarek et al. Modeling healthcare demand using a hybrid simulation approach
Lee et al. Bayesian variable selection for multivariate zero-inflated models: Application to microbiome count data
JP2019045264A (ja) 予測装置及び予測方法
Sathyavathi et al. Human age estimation using deep convolutional neural network based on dental images (orthopantomogram)
JP2019041754A (ja) 予測装置及び予測方法
Murray et al. Applying artificial intelligence to determination of legal age of majority from radiographic
Jaiswal et al. Multi oral disease classification from panoramic radiograph using transfer learning and XGBoost
Chen et al. Determining simulation run length with the runs test
JP7365747B1 (ja) 階層図ニューラルネットワークに基づく疾患診療過程異常識別システム
Fan et al. Multivariate exponential survival trees and their application to tooth prognosis
Mutegeki et al. Interpretable Machine Learning-Based Triage For Decision Support in Emergency Care
Jaiswal et al. Classification and prediction of oral diseases in dentistry using an insight from panoramic radiographs and questionnaire
US11961204B2 (en) State visualization device, state visualization method, and state visualization program
Hemalatha et al. A modified machine learning classification for dental age assessment with effectual ACM-JO based segmentation
Lakshmi et al. Digital Decision Making in Dentistry: Analysis and Prediction of Periodontitis Using Machine Learning Approach.
Li The probabilistic life table and its applications to Canada
JP2022551325A (ja) 診断ツール
CN116013503B (zh) 一种牙科治疗计划确定方法、电子设备及存储介质
US20230229937A1 (en) Ai training data creation support system, ai training data creation support method, and ai training data creation support program

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20170915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20170915

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210315

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210406

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210416

R150 Certificate of patent or registration of utility model

Ref document number: 6876300

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE

Ref document number: 6876300

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250