JP6901169B1 - 年齢学習装置、年齢推定装置、年齢学習方法及び年齢学習プログラム - Google Patents

年齢学習装置、年齢推定装置、年齢学習方法及び年齢学習プログラム Download PDF

Info

Publication number
JP6901169B1
JP6901169B1 JP2020029862A JP2020029862A JP6901169B1 JP 6901169 B1 JP6901169 B1 JP 6901169B1 JP 2020029862 A JP2020029862 A JP 2020029862A JP 2020029862 A JP2020029862 A JP 2020029862A JP 6901169 B1 JP6901169 B1 JP 6901169B1
Authority
JP
Japan
Prior art keywords
age
learning
data
estimated value
calculation means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020029862A
Other languages
English (en)
Other versions
JP2021135618A (ja
Inventor
渡辺 信一
信一 渡辺
Original Assignee
日新ビジネス開発株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日新ビジネス開発株式会社 filed Critical 日新ビジネス開発株式会社
Priority to JP2020029862A priority Critical patent/JP6901169B1/ja
Application granted granted Critical
Publication of JP6901169B1 publication Critical patent/JP6901169B1/ja
Publication of JP2021135618A publication Critical patent/JP2021135618A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

【課題】健康診断結果に基づいて生物学的年齢を推定するための推定モデルを生成する年齢学習装置を提供する。【解決手段】年齢学習装置2は、機能構成要素として、入力受付手段201、第1算出手段202、第2算出手段203及び係数算出手段204並びに健康診断データベースDB1、遺伝子解析データベースDB2及びモデルデータベースDB3を備える。第1算出手段202は、モデルデータベースDB3より第1モデル(死亡リスク推定モデル及び表現型年齢推定モデル)を取得し、入力された健康診断データD1に基づいて死亡リスクの推定値M及び表現型年齢の推定値D3を算出する。第1算出手段202は、更に死亡リスクの推定値M及び表現型年齢の推定値D3を、算出に用いた健康診断データD1と対応付けて健康診断データベースDB1に格納する。【選択図】図1

Description

健康診断結果に基づいて対象者の生物学的年齢の推定値を算出する推定モデルを生成する年齢学習装置、年齢推定装置、年齢学習方法及び年齢学習プログラムに関する。
自身の健康状態を把握することは、日々の健康管理や健康増進において有意義である。健康診断を受診することで、肝機能、腎機能、循環器機能、免疫機能、消化管機能などの状態を示す数値が指標として得られた。しかしながら、医師などの専門知識を有する者の説明なくして、そのような数値から自身の健康状態を正確に把握することは困難であった。また、例えば生命保険会社などでは、保険の契約に際して対象者の疾病リスク等について把握することが重要であるため、対象者の健康状態を正確に示す指標を必要としていた。また、例えば銀行では、健康状態の良い契約者は、優良顧客として融資の利率や個人ローンの金利を割り引く等の優遇措置を実施することによって、個人の属性に応じた金融商品を提供することが可能となるが、その際に基準となる指標は、開発されていなかった。さらに、個人が自身の健康状態を知ることは、健康増進のインセンティブとなるだけでなく、国家的な重要課題である医療費の削減に寄与する効果が期待できる。
特許文献1では、健康診断結果を用いて、将来予測される医療費を統計に基づいて算出し、更に予測された医療費から健康年齢(登録商標)を算出することで、健康状態を示す指標として提供する技術について開示されている。一方、医療費に基づいて算出される健康年齢は統計的に算出された数値であり、生物学的な知見は含まれていなかった。また、医療費が変化した場合、健康年齢にも変化が生じるといった問題があった。
近年、組織や細胞の老化の程度に基づいて定義される生物学的年齢が、信頼性の高い老化を示すバイオマーカーとして注目されている。生物学的年齢はDNAのメチル化レベルと強い相関関係を有し、従来以上に高精度の健康指標として活用できる。(非特許文献1)
特開2018−132959号公報
Horvath, S and Raj. Kenneth (2018). "DNA methylation based biomarkers and the epigenetic clock theory of ageing". Nature Reviews Genetics. 19 (6): 371−384. Levine, Morgan E. et al (2018). "An epigenetic biomarker of aging for lifespan and healthspan". Aging 10(4) Hannum, G. et al (2013). "Genome wide methylation profiles reveal quantitative views of human aging rates". Mol. Cell 49: 359−367. Horvath, S (2013). "DNA methylation age of human tissues and cell types". Genome Biology. 14 (10): R115.
生物学的年齢は、通常DNA解析検査により計測されるDNAメチル化レベルから求められる。しかしながら、DNA解析検査は、高額であるため、生物学的年齢を健康指標として活用することは容易ではなかった。
本発明は、上記のような実状に鑑みてなされたものであり、健康診断結果に基づいて生物学的年齢の推定値を算出する推定モデルを生成する年齢学習装置を提供することを解決すべき課題とする。
上記課題を解決する為に、本発明は、生物学的年齢を推定する為の係数を算出する年齢学習装置であって、学習用健康診断データ及び、学習用遺伝子解析データの入力を受け付ける入力受付手段と、前記学習用健康診断データを用いて少なくとも死亡リスクの推定値を算出する第1算出手段と、前記学習用遺伝子解析データを用いて遺伝学的年齢の推定値を算出する第2算出手段と、前記第1算出手段及び、前記第2算出手段により算出された推定値に基づいて、生物学的年齢の推定値を算出する為の推定係数を算出する係数算出手段と、を備える。
このような構成とすることにより、遺伝子解析データに基づく遺伝学的年齢を反映させた生物学的年齢を算出する為の係数を算出することができる。
本発明の好ましい形態では、前記係数算出手段は、前記推定係数を用いて推定モデルを生成する。
このような構成とすることにより、従来にない生物学的年齢を算出する為のモデルを生成することができる。
本発明の好ましい形態では、前記第1算出手段は、算出した死亡リスクの推定値を用いて表現型年齢の推定値を更に算出する。
このような構成とすることにより、指標となる表現型年齢を取得することができる。
本発明の好ましい形態では、前記学習用健康診断データと前記学習用遺伝子解析データは、少なくとも1以上の共通する参照データを有し、前記係数算出手段は、共通の参照データが含まれる前記学習用健康診断データ及び前記学習用遺伝子解析データに基づいて、前記推定モデルを生成する。
このような構成とすることにより、学習用健康診断データと学習用遺伝子解析データを紐づけて、推定モデルを生成することができる。
本発明の好ましい形態では、前記参照データは、少なくともデータ提供者の実年齢を含む。
このような構成とすることにより、共通の実年齢を含むデータを紐づけすることができる。
本発明の好ましい形態では、前記係数算出手段は、不同のデータ提供者より取得される前記学習用健康診断データと前記学習用遺伝子解析データに基づいて前記推定モデルを生成する。
このような構成とすることにより、学習用健康診断データと学習用遺伝子解析データのデータ提供者が異なる場合であっても、データを紐づけて、推定モデルを生成することができる。
本発明の好ましい形態では、前記学習用遺伝子解析データは、少なくともDNAメチル化レベルを示す数値を含む。
このような構成とすることにより、学習用遺伝子解析データとしてDNAメチル化レベルを用いることができる。
本発明の好ましい形態では、前記学習用健康診断データは、アルブミン、クレアチニン、グルコース、C反応性蛋白、リンパ球、平均赤血球容積、赤血球分布幅、アルカリフォスファターゼ、白血球数、実年齢のうち少なくとも1以上を含む。
このような構成とすることにより、学習用健康診断データとしてアルブミンなどの数値を用いることができる。
本発明の好ましい形態では、前記年齢学習装置によって算出された推定係数に基づく推定モデルを用いて生物学的年齢を推定する年齢推定装置であって、推定用健康診断データの入力を受け付ける入力受付手段と、前記推定用健康診断データを用いて少なくとも死亡リスクの推定値を算出する第1算出手段と、前記推定用健康診断データを用いて前記第1算出手段により算出された推定値を前記推定モデルに入力し、生物学的年齢の推定値を算出する第3算出手段と、を備える。
このような構成とすることにより、推定用健康診断データに基づいて生物学的年齢を算出することができる。
本発明の好ましい形態では、前記第1算出手段は、前記推定用健康診断データを用いて前記第1算出手段により算出された死亡リスクの推定値を用いて表現型年齢の推定値を更に算出し、前記第3算出手段は、前記表現型年齢の推定値を前記推定モデルに入力し、生物学的年齢の推定値を算出する。
このような構成とすることにより、推定用健康診断データに基づいて生物学的年齢を算出することができる。
本発明の好ましい形態では、前記第3算出手段は、前記学習用健康診断データ及び、前記推定用健康診断データの一部の項目についてデータが入力されない場合、データが入力されない項目に予め設定された所定値を入力する。
このような構成とすることにより、推定用健康診断データの一部が欠けていても、所定値を入力し、生物学的年齢を算出することができる。
本発明の好ましい形態では、前記推定用健康診断データは、アルブミン、クレアチニン、グルコース、C反応性蛋白、リンパ球、平均赤血球容積、赤血球分布幅、アルカリフォスファターゼ、白血球数、実年齢のうち少なくとも1以上を含む。
このような構成とすることにより、推定用健康診断データとしてアルブミンなどの数値を用いることができる。
本発明は、生物学的年齢を推定する為の係数を算出する年齢学習方法であって、学習用健康診断データ及び、学習用遺伝子解析データの入力を受け付けるステップと、前記学習用健康診断データを用いて少なくとも死亡リスクの推定値を算出するステップと、前記学習用遺伝子解析データを用いて遺伝学的年齢の推定値を算出するステップと、前記第1算出手段及び、前記第2算出手段により算出された推定値に基づいて、生物学的年齢の推定値を算出する為の推定係数を算出するステップと、をコンピュータが実行する。
本発明は、生物学的年齢を推定する為の係数を算出する年齢学習プログラムであって、コンピュータを、学習用健康診断データ及び、学習用遺伝子解析データの入力を受け付ける入力受付手段と、前記学習用健康診断データを用いて少なくとも死亡リスクの推定値を算出する第1算出手段と、前記学習用遺伝子解析データを用いて遺伝学的年齢の推定値を算出する第2算出手段と、前記第1算出手段及び、前記第2算出手段により算出された推定値に基づいて、生物学的年齢の推定値を算出する為の推定係数を算出する係数算出手段と、として機能させる。
本発明によれば、健康診断結果に基づいて生物学的年齢の推定値を算出する推定モデルを生成する年齢学習装置及び、健康診断結果に基づいて生物学的年齢の推定値を算出する年齢推定装置を提供することができる。
本発明の実施形態における年齢学習装置の機能ブロック図である。 本発明の実施形態における年齢学習装置のハードウェア構成を示す図である。 本発明の実施形態における生物学的年齢の推定モデルを生成する処理に関するフローチャートである。 本発明の実施形態における第1算出手段の概要図である。 本発明の実施形態における表現型年齢を示すグラフである。 本発明の実施形態における第2算出手段の概要図である。 本発明の実施形態における各算出手段における入力データと出力データの概要図である。 本発明の実施形態における実年齢と生物学的年齢の対応関係を示すグラフである。 本発明の実施形態における年齢推定システムの構成図である。 本発明の実施形態における生物学的年齢の推定値を算出する処理に関するフローチャートである。 本発明の実施形態におけるデータ入力画面とデータ出力画面の画面表示例を示す。 本発明の実施形態における年齢推定装置の機能ブロック図の一例である。
以下、図面を用いて、本発明の実施形態に関する年齢推定装置について説明する。なお、以下に示す実施形態は本発明の一例であり、本発明を以下の実施形態に限定するものではなく、様々な構成を採用することもできる。
本実施形態では、年齢学習装置、年齢推定装置、ユーザ端末、外部装置を含む年齢推定システムの構成、動作等について説明するが、同様の構成の方法、コンピュータプログラム、記録媒体等も、同様の作用効果を奏することができる。この記録媒体を用いれば、例えばコンピュータに当該プログラムをインストールすることができる。ここで、当該プログラムを記憶した記録媒体は、例えばCD−ROM等の非一過性の記録媒体であっても良い。
はじめに、生物学的年齢の推定値を算出する推定モデルを生成する方法について説明する。生物学的年齢とは、暦年齢とは別に組織や細胞の老化の程度を示す年齢である。生物学的年齢は、通常DNAメチル化レベルに基づいて算出される。DNAメチル化レベルを取得する為には、一般的にDNA解析検査を受診する必要がある。
一方、健康診断結果の特定の項目に基づいて算出される表現型年齢は、生物学的年齢と比較すると精度は下がるものの一定程度の信頼性を有する健康状態を示す指標として扱われる。健康診断は、受診のハードルは低く、容易に結果を取得できる。一般に、加齢に伴う死亡リスクは、ある程度の年齢となった時点(いわゆる高齢者と呼ばれる60歳程度)で指数関数的に増加するが、最終的に収束する傾向がみられる。表現型年齢や生物学的年齢は、そのような傾向を反映して算出されるものであるため、両者の間には何かしらの相関関係が存在することが予測される。本発明の年齢学習装置では、健康診断結果に基づいて算出される表現型年齢の推定値を、生物学的年齢に修正するモデルを機械学習により生成する。本発明の年齢推定装置では、健康診断結果を年齢学習装置により生成したモデルに入力することで、生物学的年齢の推定値を直接算出できるようにする。
図1〜図8を参照し、本実施形態における年齢学習装置による生物学的年齢の推定値を算出する生物学的年齢推定モデルを生成する処理について説明する。
図1は、本実施形態における年齢学習装置2の機能ブロック図を示す。年齢学習装置2は、機能構成要素として、入力受付手段201、第1算出手段202、第2算出手段203、係数算出手段204及び、健康診断データベースDB1、遺伝子解析データベースDB2、モデルデータベースDB3を備える。なお、図1において、実線はデータの流れを、破線はモデル(係数)の流れをそれぞれ示す。
図2に例示するように、年齢学習装置2は、データ通信機能を有し、ハードウェア及び、機能の構成要素を含んでいる。すなわち、年齢学習装置2は、ハードウェア構成要素として、演算装置(CPU(Central Processing Unit))21と、作業用メモリとしての主記憶装置(RAM(Random Access Memory))22とを備える。また、年齢学習装置2は、OS(Operating System)、アプリケーションプログラム、及び各種情報(データを含む)を書換え可能に格納するHDDやSSD、フラッシュメモリ等の補助記憶装置25と、通信制御部23と、NIC(Network Interface Card)などの通信インタフェース(IF)部24などとを、更に備える。また、年齢学習装置2は、表示制御部、表示部、情報入力部などを備えてもよい。なお、健康診断データベースDB1、遺伝子解析データベースDB2、モデルデータベースDB3は、通信IF部24により通信ネットワークを介して通信可能な外部のデータベースによって構成されてもよい。
図3は、生物学的年齢の推定値D5を算出する推定モデルを生成する処理の流れを示すフローチャート図である。S101〜S103は、第1モデル(死亡リスク推定モデル及び表現型年齢推定モデル)の生成と、第1モデルを用いた死亡リスクの推定値M及び表現型年齢の推定値D3の算出について説明する。S104〜S106は、第2モデル(遺伝学的年齢推定モデル)を用いた遺伝学的年齢の推定値D4の算出について説明する。S107は、第3モデル(生物学的年齢推定モデル)の生成について説明する。
まず、S101において、入力受付手段201は、通信ネットワークに接続され、通信接続された医療機関などの外部装置6から健康診断データD1の入力を受け付け、健康診断データベースDB1に格納する。入力受付手段201は、情報入力部を介して、健康診断データD1の入力を直接受け付けてもよい。
S102において、第1算出手段202は、入力受付手段201を介して入力された健康診断データD1の入力を受け付ける。S103において、第1算出手段202は、モデルデータベースDB3より第1モデル(死亡リスク推定モデル及び表現型年齢推定モデル)を取得し、入力された健康診断データD1に基づいて死亡リスクの推定値M及び表現型年齢の推定値D3を算出する。第1算出手段202は、更に死亡リスクの推定値M及び表現型年齢の推定値D3を、算出に用いた健康診断データD1と対応付けて健康診断データベースDB1に格納する。
続いて、S104において、入力受付手段201は、健康診断データD1と同様、医療機関などのサーバ装置やコンピュータ端末を介して遺伝子解析データD2の入力を受け付け、遺伝子解析データベースDB2に格納する。遺伝子解析データD2については後に詳述する。
モデルデータベースDB3は、遺伝学的年齢の推定値D4を算出する第2モデルを格納する。S105において、第2算出手段203は、入力受付手段201を介して入力された遺伝子解析データD2の入力を受け付ける。S106において、第2算出手段203は、モデルデータベースDB3より第2モデルを取得し、入力された遺伝子解析データD2に基づいて遺伝学的年齢の推定値D4を算出する。第2算出手段203は、更に遺伝学的年齢の推定値D4を、算出に用いた遺伝子解析データD2と対応付けて遺伝子解析データベースDB2に格納する。
S107において、係数算出手段204は、第1算出手段202により算出された死亡リスクの推定値M又は表現型年齢の推定値D3と、第2算出手段203により算出された遺伝学的年齢の推定値D4と、を用いて生物学的年齢の推定値D5を算出する第3モデルの係数を算出する。
続いて、本実施形態において用いる年齢学習装置2に入力する健康診断データD1及び遺伝子解析データD2について説明する。また、本実施形態において使用する第1モデル、第2モデル、第3モデルの詳細について説明する。
健康診断データD1は、ユーザが受診した健康診断の結果を項目別にデータ化したものである。健康診断データD1の検査項目は、生年月日(実年齢)、身長、体重、BMI、腹囲、血圧、尿検査(糖、蛋白、クレアチニン、C反応性蛋白)、肝機能検査(アルブミン、アルカリフォスターゼ)、血液検査(グルコース、LDLコレステロール、HDLコレステロール、中性脂肪、リンパ球、平均赤血球容積、赤血球分布幅、白血球、血糖値)、などが含まれるが、これらに限定されない。例えばC反応性蛋白は、受診者の炎症反応の指標として用いられるが、同様の指標として赤血球沈降速度などが用いられてもよい。
本実施形態では、上述した健康診断データD1の項目中から、表現型年齢との相関の特に強い項目が選定される。健康診断結果の数値や運動量などから対象者の健康状態を示す健康年齢を算出する方法が知られている。本発明では、健康年齢よりも更に生物学的年齢に近い数値をもつ表現型年齢を算出する為に、年齢に対して強い相関関係を有する検査項目を分析し、選定する。検査項目を選定する手法として、強制投入法、総当たり法、前進選択法、後進選択法、ステップワイズ法などが挙げられる。
本実施形態では、選定された健康診断データD1の検査項目について、多変量解析することにより表現型年齢の推定値D3を算出する第1モデルを生成する。本実施形態において、第1モデルは、後に詳述する死亡リスク推定モデルと表現型年齢推定モデルである。多変量解析の一例として、重回帰分析、ロジスティック回帰分析、因子分析、正準相関分析、クラスター分析などが挙げられる。本実施形態では、多変量の生存時間解析に適したコックス比例ハザードモデルをベースとした第1モデルを生成する。コックス比例ハザードモデルは、時間tの経過により確率的に発生するハザード(本実施形態では、死亡)に対して、複数の共変量x(本発明では、健康診断データD1のそれぞれの項目)がいかに寄与したかを分析できる。コックス比例ハザードモデルは、式(1)により定義される。h0(t)は、共変量xが全てゼロとなる場合において、時間tに依存して発生するハザード率を表すベースラインハザード関数である。exp(βx)は、共変量xに依存して発生するハザード率を表す状態ハザード関数である。ここでβは、ハザードの要因となる共変量xの寄与度、すなわち重みを表す。また、共変量xがゼロでない場合の時間tに依存して発生するハザード率を表す時間ハザード関数をh(t)と定義する。すなわち、式(1)は、共変量xを持つ個体が時間tまで生存した場合、その個体が時間tにおいて死亡する確率(死亡リスク)を表す。
Figure 0006901169
本実施形態では、式(1)コックス比例ハザードモデルの時間ハザード関数にゴンペルツ分布を仮定する。ゴンペルツ分布は、時間に対する死亡率を統計的に分析した結果得られる分布関数で表される。ゴンペルツ分布は、いわゆるゴンペルツの法則(ヒトの年齢と死亡率の関係を表す法則で、35〜40歳以降では、年齢に対して死亡率は指数関数的に増大する。特に35歳以降の死亡率は8年毎に2倍となる。)を数式化したものである。ゴンペルツの法則は、人口の減少率が累積死亡率に比例すると言い換えることができる。このように、元来、死亡率を推定する為のモデルであったゴンペルツ分布を成長曲線に応用したものが、ゴンペルツ曲線である。ゴンペルツ曲線は、ロジスティック曲線等と同様に、S字の曲線(シグモイド曲線)で表される点に特徴がある。本実施形態における、ゴンペルツ分布に基づく時間ハザード関数は、式(2)により表される。式(2)のλは、状態ハザード関数を表す。また、γは、生物に固有の定数であり、例えば、ヒトの場合γ=0.000671の定数である。γは第1モデルの推定の過程で修正されてもよい。なお、γを修正することによって、ヒト以外の生物の死亡リスクの推定値M及び表現型年齢の推定値D3を算出することができる。さらに、式(2)から式(3)の生存関数が求められる。生存関数は、ある時間tにおける死亡率を示す時間ハザード関数と対照的に、ある時間tにおける生存率を意味する。ゴンペルツ分布に基づくベースラインハザード関数は、式(4)により表される。
Figure 0006901169
Figure 0006901169
Figure 0006901169
式(3)の生存関数の累積分布関数Dは、式(5)により表される。ここで、モデルを決定するために年齢Tの対象者の10年(120か月)以内の死亡率を条件として仮定して、x=T,t=120を式(5)代入して計算すると、式(6)が導出される。ここで、式(5)において、個人j(対象者)に関して、状態ハザード関数λは、λ=exp(xβ)と表される。上記の状態ハザード関数λより、式(6)のxbは、式(7)で表される。式(7)において、iは、一般的な健康診断の検査項目(i=1〜p)を表す。
Figure 0006901169
Figure 0006901169
Figure 0006901169
本実施形態において、健康診断データD1は、2つの目的で利用される。第1の目的は、ハザード(死亡率)に影響を与える健康診断データD1の項目と、その感応度である重みβを選定することで、死亡リスク推定モデルを生成することである。はじめに、母集団に属するすべての健康診断受診者の健康診断データD1が式(6)に代入される。次に、コックス比例ハザードモデルの数値解析により、ハザード(死亡リスク)に対して寄与の大きな健康診断データD1の項目とその重みβが推計される。このようにして、死亡リスク(死亡率)を健康診断の検査項目で説明する比例ハザードモデルが導出される。次に、式(7)にしたがって、推計された重みβに、入力された個人の健康診断データD1の実数値xを掛け合わせ、更に掛け合わせた値を合計する。更に、合計した値を再び式(6)に代入することで、死亡リスクの推定値Mが算出される。なお、重みβがプラスの項目は、死亡リスクの推定値Mの増加に対して寄与し、マイナスの項目は、死亡リスクの推定値Mの低下に対してそれぞれ寄与する。なお、本実施形態において、重みβの死亡率(死亡リスクの推定値M)に対する寄与の程度は、p値によって判断され、選定される健康診断データD1の項目の数は、AIC(赤池情報量基準)の値によって判断されるが、これらの判断基準に限定されるものではない。
第2の目的は、死亡リスクの推定値Mに基づいて表現型年齢の推定値D3を算出する係数を推定し、表現型年齢推定モデルを生成することである。表現型年齢推定モデルの生成では、はじめに、式(6)において、xb=β1T+β0とする。ただし、ここでTは、健康診断受診者の生年月日(実年齢)を表す。この条件では、年齢以外の健康診断データD1の共変量をゼロとすることで、年齢に対する重みβと切片β0を推計する。ここで、式(8)によって、Pを定義する。ゴンペルツ分布を仮定する場合、10年以内の死亡リスクの推定値Mは式(9)で表される。更に、式(9)を年齢Tを算出する式として変形すると、最終的に表現型年齢の推定値D3を算出する式は、式(10)として表される。なお、式(10)では、α=β0、β=β1をそれぞれ表す。
Figure 0006901169
Figure 0006901169
Figure 0006901169
切片β0(=α)及び実年齢の重みβを回帰分析により決定する。回帰分析の結果、算出された切片β0及び実年齢の重みβを式(10)に代入することによって、健康診断受診者の健康診断データD1を受診者の表現型年齢の推定値D3に変換する表現型年齢推定モデルを生成するプロセスが完了する。なお、各検査項目の実数値は、対数換算などにより補正した上で入力されてもよい。また、健康診断データD1の各項目の単位を変換する計算処理が含まれてもよい。上記のように重みβを決定し、最終的に得られる表現型年齢推定モデルは、式(11)に例示される。これらの式(6)及び式(10)を用いることにより、健康診断データD1に基づいて死亡リスクの推定値M及び表現型年齢の推定値D3が算出される。
Figure 0006901169
第1算出手段202は、健康診断データD1の一部の検査項目についてデータとなる数値が入力されていない場合、数値が入力されていない検査項目に予め設定された所定の数値を入力し、死亡リスクの推定値M及び表現型年齢の推定値D3を算出できる。所定の数値には、例えば、平均値を用いる。特に、表現型年齢の推定値D3に相関性の高い検査項目の赤血球分布幅は、通常の健康診断ではデータが得られない場合がある。第1算出手段は所定の数値として、統計的な最適値や、属性(実年齢、性別など)に分類して得られた平均値など、如何なる数値を用いてもよい。
図4は、選定された健康診断データD1の一例を示す。図5は、死亡リスクの推定値Mを横軸、表現型年齢の推定値D3を縦軸とした健康診断データD1に基づく表現型年齢の分布を示すグラフである。
モデルデータベースDB3は、上述した健康診断データD1を用いて死亡リスクの推定値Mを算出する死亡リスク推定モデル(式(6))と、死亡リスクの推定値Mを用いて表現型年齢の推定値D3を算出する表現型年齢推定モデル(式(10))を第1モデルとして少なくとも備える。
続いて、遺伝子解析データD2及び遺伝子解析データD2に基づいて遺伝学的年齢の推定値D4を算出する第2モデルについて説明する。入力受付手段201は、医療機関などのサーバ装置やコンピュータ端末を介して遺伝子解析データD2の入力を受け付け、遺伝子解析データベースDB2に格納する。遺伝子解析データD2は、ユーザが受診した遺伝子解析検査の結果を項目別にデータ化したものである。より具体的には、遺伝子解析データD2の項目は、実年齢とDNAのメチル化レベルを示すデータを少なくとも含む。DNAのメチル化は、DNAの塩基配列においてシトシン(C)とグアニン(G)の配列(CpGサイト)が集中するCpGアイランドと呼ばれる領域に多く生じることが知られる。遺伝子解析検査により、所定のCpGサイトのDNAメチル化レベルが取得できる。なお、遺伝子解析データD2は、生物学的年齢を算出する為のデータであれば、DNAメチル化レベルに限定されるものではない。
以下、DNAメチル化レベルに基づいて算出される生物学的年齢を遺伝学的年齢と定義する。DNAメチル化レベルに基づいて遺伝学的年齢の推定値D4を算出する方法として、Levineらの方法(非特許文献2)、Hannumらの方法(非特許文献3)、Horvathらの方法(非特許文献4)などが挙げられる。本実施形態では、Levineらの方法に準じて遺伝学的年齢の推定値D4を算出するが、この方法に限定するものではない。
遺伝学的年齢の推定値D4の算出モデル(第2モデル)は、式(12)で表される。Levineらの方法では、513のCpGサイトのDNAメチル化レベルに基づいて、遺伝学的年齢の推定値D4を算出する。式(12)のCpGは、各CpGサイトのDNAメチル化レベルを表す。式(12)のβ(β1、β2、・・・β513)は、各CpGサイトの遺伝学的年齢に対する重みを表す。式(12)の第2モデルの生成過程などの詳細な説明は、非特許文献2を参照されたい。
Figure 0006901169
モデルデータベースDB3は、式(12)により表される遺伝学的年齢の推定値D4を算出する第2モデルを格納する。第2算出手段203は、モデルデータベースDB3より第2モデルを取得し、入力された遺伝子解析データD2に基づいて遺伝学的年齢の推定値D4を算出する。第2算出手段203は、更に遺伝学的年齢の推定値D4を、算出に用いた遺伝子解析データD2と対応付けて遺伝子解析データベースDB2に格納する。図6は、遺伝子解析データD2の一例を示す。遺伝子解析データD2では、それぞれのCpGサイトにおけるDNAメチル化レベルを例えば0〜1の数値で保持する。第2算出手段203は、遺伝子解析データD2の一部の検査項目についてデータとなる数値が入力されていない場合、数値が入力されていない検査項目に予め設定された所定の数値を入力し、遺伝学的年齢の推定値D4を算出してもよい。
ここまで、健康診断データD1及び第1モデルに基づく死亡リスクの推定値M及び、表現型年齢の推定値D3の算出方法及び、遺伝子解析データD2及び第2モデルに基づく遺伝学的年齢の推定値D4の算出方法について説明した。続いて、第3モデルの生成方法について説明する。
係数算出手段204は、健康診断データベースDB1に格納された表現型年齢の推定値D3を取得し、更に遺伝子解析データベースDB2に格納された遺伝学的年齢の推定値D4を取得し、取得した表現型年齢の推定値D3及び遺伝学的年齢の推定値D4に基づいて生物学的年齢の推定値D5を算出する生物学的年齢推定モデル(第3モデル)の係数を算出する。なお、係数算出手段204は、表現型年齢の推定値D3に代えて死亡リスクの推定値Mと、遺伝学的年齢の推定値D4に基づいて第3モデルの係数を算出してもよい。
健康診断データD1の提供者と、遺伝子解析データD2の提供者が同一人であれば、表現型年齢の推定値D3と遺伝学的年齢の推定値D4が比較的近い数値を示すことは容易に予測できる。しかし、遺伝子解析データD2は、遺伝子解析検査に掛かる費用や時間、設備などの観点から第3モデルの学習の為の十分なデータを収集することが困難である。健康診断データD1と遺伝子解析データD2は、少なくとも1つ以上の共通する参照データを有する。本実施形態では、係数算出手段204は、参照データに基づいて健康診断データD1と遺伝子解析データD2を対応付け、第3モデルの係数の算出に用いる。本実施形態において、参照データは、少なくともデータ提供者の実年齢を含む。参照データは、データ提供者ID、性別、身長、体重、BMI、病歴などデータ提供者の身体状態や健康状態の特徴を示すデータを含んでもよい。また、これらのデータの特定の項目の組み合わせを参照データとしてもよい。
図7は、参照データによる健康診断データD1と遺伝子解析データD2の対応付けに関する説明図である。ここで、第1モデルは死亡リスク推定モデル及び表現型年齢推定モデルを、第2モデルは遺伝学的年齢推定モデルを、第3モデルは生物学的年齢推定モデルを、それぞれ示す。図7において、健康診断データD1と遺伝子解析データD2はそれぞれ異なるデータ提供者より取得されたデータであり、異なるデータ提供者IDを有する。ここで、係数算出手段204は、参照データとして「実年齢」を参照する場合、健康診断データD1と遺伝子解析データD2は共通の実年齢を有するため、2つのデータを対応付けて第3モデルの係数の算出に用いる。ここで、更に係数算出手段204は、実年齢に加えてデータ提供者の例えば「性別」について参照データとして参照し、実年齢及び性別を共通する参照データとして有する健康診断データD1と遺伝子解析データD2を用いて第3モデルの係数を算出するようにしてもよい。なお、係数算出手段204は、共通のデータ提供者IDを有する健康診断データD1と遺伝子解析データD2を優先的に対応付けて、係数の算出に用いてもよい。
係数算出手段204は、対応付けた健康診断データD1及び遺伝子解析データD2に基づいてそれぞれ算出された死亡リスクの推定値M又は表現型年齢の推定値D3と、遺伝学的年齢の推定値D4と、を用いて生物学的年齢の推定値D5を算出する第3モデルの係数を算出する。
本実施形態では、係数算出手段204は、所定のモデルに表現型年齢の推定値D3と遺伝学的年齢の推定値D4を入力し、回帰分析により生物学的年齢推定モデル(第3モデル)の係数を算出する。この回帰分析により、表現型年齢の推定値D3が遺伝学的年齢の推定値D4の近似値に修正され、その近似値を生物学的年齢の推定値D5として出力する第3モデルが生成される。回帰分析の手法として、機械学習の手法を用いたロジスティック回帰、k近傍法、決定木、ランダムフォレスト、サポートベクターマシンや、統計学の手法を用いたロジスティック分布やゴンペルツ分布を用いた回帰などが挙げられる。また、機械学習を用いた係数の算出手法として、ニューラルネットワークを用いてもよい。本実施形態では、ロジスティック曲線が表現型年齢の分布と類似するシグモイド曲線で表現される点に着目し、ロジスティック分布を用いた回帰を採用したが、如何なる回帰分析の手法が採用されてもよい。
一般的なロジスティック曲線は、式(13)で表される。ロジスティック回帰分析により表現型年齢の推定値D3をxとして入力し、遺伝学的年齢の推定値D4をyとして出力する係数b、cが求められる。通常のロジスティック曲線を用いた生存時間解析では、年齢xとしたときの死亡リスクyの分布が分析される。このとき、Kは死亡リスクyの最大値を表すためK=1の定数が用いられる。一方、遺伝学的年齢は、遺伝子型に依らない後天的な獲得形質を反映したものであるため、表現型年齢よりも小さい数値となる性質がある。したがって、本実施形態では、K=x=表現型年齢の推定値D3とすることで、入力である表現型年齢の推定値D3のxを遺伝学的年齢の推定値D4のyに直接修正するモデルを生成する。これにより、表現型年齢xが生成されたモデルに入力されることで、遺伝学的年齢yに変換される。なお、遺伝学的年齢の推定値D4をx、健康診断データD1に基づいて算出される死亡リスクの推定値Mをyとして式(13)に入力し、回帰分析により第3モデルの係数を算出する方法も制限されない。
Figure 0006901169
非特許文献2などにおいて、遺伝学的年齢yの増加率は、表現型年齢xの増加に伴って、指数関数的に減少する傾向にあることが報告されている。式(13)では、遺伝学的年齢yの増加率が、表現型年齢xの増加に伴って、指数関数的に減少する傾向を示す。本実施形態では、特に生物学的年齢が60歳以降のとき、表現型年齢より大きく低下する傾向を反映させる係数を推計する。
係数算出手段204は、例えば、1つの遺伝学的年齢yに対して、共通の参照データを有する1つ以上の表現型年齢xを入力する。係数算出手段204は、更にそれによって算出された係数b、cについて、非線形最小二乗法や最尤法を用いることで係数b、cの近似値を算出する。係数算出手段204は、算出した係数b、cを所定のモデルの推定係数として入力することで、生物学的年齢の推定値D5を算出する第3モデルを生成してもよい。係数算出手段204によって算出された推定係数または、生成された第3モデルはモデルデータベースDB3に格納される。式(14)は、係数算出手段204により算出された推定係数に基づいて生成された生物学的年齢推定モデル(第3モデル)の一例である。
Figure 0006901169
図8は、縦軸を生物学的年齢の推定値D5、横軸を表現型年齢の推定値D3としたときの生物学的年齢と表現型年齢の対応関係を示すグラフである。なお、図8では、式(14)の表現型年齢の推定値D3に実年齢を代入している。図8のグラフは、年齢増加に伴って、特に60歳以降において、表現型年齢に対して生物学的年齢の増加率が低下する傾向を反映していることを示す。
なお、本実施形態の一例では、係数算出手段204が回帰分析する際に、正則化項を加味するモデルを採用してもよい。正則化の手法として、リッジ回帰、ラッソ回帰、エラスティックネットなどが挙げられる。正則化については、過学習を抑制するため適宜回帰分析に取り入れることができる。
次いで、図9〜図12を参照し、本実施形態における年齢推定装置3又は年齢推定装置4を用いた生物学的年齢の推定値D5を算出する処理を説明する。一実施の形態におけるシステム構成を示す図9を参照すると、年齢推定システムは年齢推定システム100として具体化されている。
年齢推定システム100は、年齢推定装置3、ユーザ端末5、外部装置6及び、通信ネットワークNWを備える。通信ネットワークNWは、インターネットなどのIP(Internet Protocol)網などから構成される。年齢推定装置3、ユーザ端末5、外部装置6は通信ネットワークNWを介して通信可能に構成される。なお、以下の説明では、不明確にならない限り通信ネットワークNWの介在を省略する。また、ここではユーザ端末5を1つのみ示したが、本実施形態ではユーザ端末5がそれぞれ複数存在する。また、外部装置6a及び外部装置6bが、それぞれ複数存在してもよい。
年齢推定装置3は、機能構成要素として、入力受付手段301、第1算出手段302、第3算出手段303及び、出力手段304、健康診断データベースDB1、モデルデータベースDB3を備える。モデルデータベースDB3は、年齢学習装置2の係数算出手段204によって算出された推定係数または、算出された推定係数を用いて生成された第3モデルを格納している。第3算出手段303は、モデルデータベースDB3に格納された第3モデルにしたがって、生物学的年齢の推定値D5を算出する。また、年齢推定装置3は、ハードウェア構成要素として、演算装置、主記憶装置、通信制御部、通信IF部、補助記憶装置などを備える。
ユーザ端末5はユーザUにより所持される通信機能を備えたコンピュータ端末(パーソナルコンピュータ、タブレット端末及びスマートフォン端末を含む)である。ユーザUは、医療機関で健康診断を受診し、紙面又は電子データで健康診断結果を受け取る。ユーザ端末5の入力手段501は、健康診断結果を健康診断データD1として入力を受け付ける。出力手段502は、健康診断データD1に一意に対応するユーザ端末5を識別するための識別情報を健康診断データD1に付与し、通信手段503を介して年齢推定装置3に送信する。本実施形態において、入力手段501は、撮像機能とOCR(Optical Character Recognition)機能を備える。入力手段501は、紙面の健康診断結果を撮像機能により撮影し、OCR機能で健康診断結果の各項目をそれぞれ健康診断データD1としてデータ化する。なお、入力手段501は、キーボード入力や、タッチディスプレイを介したフリック入力などにより直接健康診断データD1の入力を受け付けてもよい。
外部装置6は、生命保険会社、医療機関、健康増進推奨企業などが所持する通信機能を備えたサーバ装置である。例えば、生命保険会社が所持する外部装置6aは、ユーザUの健康状態を示す指標として生物学的年齢を参照し、生命保険の契約を交わす。外部装置6aの入力手段601は、ユーザUに生物学的年齢を提出させる為の提出要求の入力を受け付ける。出力手段602は、提出要求にユーザUの識別情報を付与し、通信手段603を介してユーザ端末5に送信する。ユーザ端末5は、提出要求を受信し、健康診断データD1を年齢推定装置3に送信する。年齢推定装置3は、受信した健康診断データD1に基づいてユーザUの生物学的年齢の推定値D5を少なくとも算出し、算出された生物学的年齢の推定値D5をユーザUの識別情報に基づいてユーザ端末5及び外部装置6aに送信する。
また、医療機関が所持する外部装置6bは、ユーザUの健康診断を実施し、健康診断データD1をデータベースに保管する。外部装置6bの入力手段601は、健康診断データD1を提出させる為の提出要求の入力をユーザ端末5から受け付ける。出力手段602は、提出要求に含まれるユーザUの識別情報に対応する健康診断データD1を通信手段603を介して年齢推定装置3に送信し、年齢推定装置3に生物学的年齢の推定値D5を算出させる。年齢推定装置3は、生物学的年齢の推定値D5を算出し、算出結果を提出要求のあったユーザ端末5に送信する。なお、外部装置6aが、ユーザUの健康診断データD1の提出要求を外部装置6bに送信する構成としてもよい。また、外部装置6aは、ユーザUからの許諾のうえ、ユーザUの識別情報を年齢推定装置3に送信することで、算出されたユーザUの生物学的年齢の推定値D5を受信できるようにしてもよい。
図10は、生物学的年齢の推定値D5を算出する処理の流れを示すフローチャート図である。以下、図10を参酌し、年齢推定装置3における生物学的年齢の推定値D5を算出する処理について説明する。
S201において、入力受付手段301は、ユーザ端末5又は外部装置6を介して、健康診断データD1の入力を受け付け、健康診断データベースDB1に格納する。このとき、入力受付手段301は、健康診断データD1の送信元を識別する識別情報を健康診断データD1に対応付ける。
続くS202において、第1算出手段302は、モデルデータベースDB3より、第1モデル(死亡リスク推定モデル及び表現型年齢推定モデル)を取得し、入力受付手段301が入力を受け付けた健康診断データD1を第1モデルに入力する。第1算出手段302は、第1算出手段202と同様の処理により、健康診断データD1の入力に基づいて、死亡リスクの推定値Mを算出し(S203)、更に死亡リスクの推定値Mに基づいて表現型年齢の推定値D3を算出する(S204)。第1算出手段302は、算出した死亡リスクの推定値M及び表現型年齢の推定値D3を、算出の基となった健康診断データD1と対応付けて健康診断データベースDB1に格納する。
S205において、第3算出手段303は、モデルデータベースDB3より第3モデル(生物学的年齢推定モデル)を取得し、S204において算出した表現型年齢の推定値D3の入力を受け付ける。これによって、S206において、第3算出手段303は、健康診断データD1に基づく生物学的年齢の推定値D5を算出する。第3算出手段303は、算出した生物学的年齢の推定値D5を、算出の基となった健康診断データD1と対応付けて格納する。
出力手段304は、健康診断データD1の送信元を識別する情報に基づいて送信元であるユーザ端末5又は外部装置6を特定し、年齢推定結果を送信する。年齢推定結果には、生物学的年齢の推定値D5の他に、生物学的年齢の推定値D5に基づいて算出された10年以内の死亡リスクの推定値M2及び、生物学的年齢の推定値D5に特に寄与した健康診断データD1の検査項目を要注意項目Aとして含んでもよい。出力手段304は、年齢推定結果を表示処理したうえで、ユーザ端末5又は外部装置6aに送信する。ユーザ端末5又は外部装置6aは、表示処理結果を受信し、年齢推定結果を表示させる。これによって、ユーザUは、健康診断データD1に基づいて生物学的年齢の推定値D5、死亡リスクの推定値M2及び要注意項目Aを確認し、自身の健康状態の把握に活用できる。外部装置6aを所持する生命保険会社は、例えばユーザUの生物学的年齢の推定値D5を参照し、将来的な健康リスクを加味して保険契約を交わすことができる。
出力手段304は、生物学的年齢の推定値D5を式(11)の左辺に代入することで、死亡リスクの推定値M2を算出する。生物学的年齢の推定値D5に基づいて算出される死亡リスクの推定値M2は、表現型年齢の推定値D3と対応する死亡リスクの推定値Mよりも信頼性の高い数値として得られる。
出力手段304は、死亡リスクの推定値Mに対する寄与度(β×x)の計算により生物学的年齢に寄与した検査項目の数値を評価することで、要注意項目Aを特定する(図4参照)。xは任意の検査項目の実数値を、また、βは、任意の検査項目の重みを表す。出力手段304は、この計算結果により得られた各検査項目の数値を比較したとき、数値が大きい検査項目ほど生物学的年齢に対する寄与が大きいと評価する。要注意項目Aは、注意が必要な程度に応じて異なる数値として出力される。例えば、やや注意が必要な項目に1、十分な注意が必要な項目に2が出力される。
図11は、生物学的年齢の推定値D5の算出に用いる健康診断データD1の入力画面及び、算出された生物学的年齢の推定値D5を含む年齢推定結果を表示する結果画面の画面表示例を示す。
図11(a)は、ユーザ端末5における健康診断データD1の入力を受け付ける入力画面W1の一例である。入力画面W1は、項目表示部W11、数値入力部W12、決定ボタンW13を備える。項目表示部W11は、第1モデルに入力し、死亡リスクの推定値M及び表現型年齢の推定値D3を算出する為に選定された健康診断データD1の項目を表示する。数値入力部W12は、例えば、ユーザ端末5の入力手段501を介して健康診断データD1の項目における実数値の入力を受け付ける。本実施形態では、数値入力部W12に入力される各項目の数値は、入力手段501のOCR機能により自動的に入力されるが、手入力などで数値が変更されてもよい。ユーザ端末5は、数値入力部W12に入力された健康診断データD1を、決定ボタンW13が押下されることで年齢推定装置3又は年齢推定装置4に送信する。このようにして、入力受付手段301又は入力受付手段401は、送信された健康診断データD1の入力を受け付ける(図10のS201)。
図11(b)は、ユーザ端末5における年齢推定結果を表示する結果画面W2の画面表示例を示す。結果画面W2は、年齢推定結果を表示する結果表示部W21を備える。結果表示部W21は、出力手段304により出力された年齢推定結果に基づいて表示され、表示内容として、入力された健康診断データD1に対応するユーザUの実年齢、表現型年齢、生物学的年齢、10年後生存確率、10年以内死亡率、要注意項目などを含む。表現型年齢は、表現型年齢の推定値D3に基づいて表示され、生物学的年齢は、生物学的年齢の推定値D5に基づいて表示される。表現型年齢は、必要に応じて、健康診断年齢などと呼称し、表示されてもよい。10年以内死亡率は、死亡リスクの推定値M2に基づいて、例えば百分率などで表示される。10年後生存確率は、死亡リスクの推定値M2を用いて、1−M2の計算により算出された数値に基づいて表示される。10年以内死亡率と10年後生存確率は、どちらか一方のみを表示する構成であってもよい。要注意項目は、要注意項目Aに基づいて表示される。また、十分な注意が必要な項目を要注意項目、やや注意が必要な項目を注意項目とするなど、注意が必要な程度に応じて異なる表示がされる。また、健康診断受診者の健康状態を総合的に判断して、表示することも可能である。例えば、生物学的年齢の推定値D5が実年齢よりも低ければ、「優良」、生物学的年齢の推定値D5が実年齢と同程度であれば、「相応」、生物学的年齢の推定値D5が実年齢よりも高ければ、「注意」と表示することが可能である。なお、この際、簡単な健康上や生活上のアドバイスを表示することが可能である。例えば、「優良」と判断された受診者には、「実年齢より若々しいあなた。周りの人からも若く見られるのでは?そんなあなたは、今が頑張り時!今頑張って将来のための貯蓄をおススメします!!!」と表示し、「相応」と判断された受診者には、「実年齢相当のあなた。とても適した生活ができています。この調子で充実した日常を過ごしましょう。より充実させるためにこんなレジャーや商品はいかが?」と表示し、「注意」と判断された受診者には、「実年齢より老け込んでいます。周りから年上にみられているかも?でも大丈夫!生物学的年齢にあった生活を行えば、加齢は緩み、実年齢が追い越せば若々しくなるはず。そんなあなたへのおすすめは運動と食事のサポート。万一のための保険も検討しよう!」などと表示することが可能である。さらに、死亡リスクの推定値M2をグラフにして表示することも可能である。なお、結果画面W2は、生命保険会社において、外部装置6aが取得した年齢推定結果を端末装置に出力するなどして同様の画面を表示するようにしてもよい。
年齢学習装置2及び、年齢推定装置3は、図12に例示するように年齢推定装置4として1装置によって実現されてもよい。年齢推定装置4は、機能構成要素として、入力受付手段401、第1算出手段402、第2算出手段403、係数算出手段404、第3算出手段405、出力手段406及び、健康診断データベースDB1、遺伝子解析データベースDB2、モデルデータベースDB3を備える。
年齢推定装置4を用いた生物学的年齢の推定値D5を算出する処理について、説明する。年齢推定装置4は、年齢学習装置2及び年齢推定装置3の機能を一括で処理する装置である。初めに、入力受付手段401は、モデルを生成する為の健康診断データD1及び遺伝子解析データD2の入力を受け付ける。第1算出手段402は、モデルデータベースDB3より第1モデルを取得し、入力受付手段401より受け渡された健康診断データD1に基づいて死亡リスクの推定値M及び表現型年齢の推定値D3を算出する。第2算出手段403は、モデルデータベースDB3より第2モデルを取得し、入力受付手段401より受け渡された遺伝子解析データD2に基づいて遺伝学的年齢の推定値D4を算出する。係数算出手段404は、第1算出手段402及び第2算出手段403により算出された推定値(M、D3、D4)を回帰分析することにより、生物学的年齢の推定値D5を算出する第3モデルの係数を算出し、モデルデータベースDB3に格納する。第3モデルは、例えば、表現型年齢の推定値D3を、遺伝学的年齢の推定値D4の近似値(生物学的年齢の推定値D5)に修正する。以上のプロセスを経て、年齢推定装置4は、健康診断データD1から直接に生物学的年齢の推定値D5を算出する機能を備えることとなる。次に、入力受付手段401は、生物学的年齢の推定値D5を算出する為の健康診断データD1の入力を受け付け、第1算出手段402は、健康診断データD1を第1モデルに入力し、表現型年齢の推定値D3を算出する。第3算出手段405は、モデルデータベースDB3に格納された第3モデルを取得し、第3モデルを用いて表現型年齢の推定値D3を生物学的年齢の推定値D5に変換する。出力手段406は、第3算出手段により算出された生物学的年齢の推定値D5などを出力することで、ユーザ端末5や外部装置6aにデータを提供する。
本実施形態の応用形態としては、マーケッティングツールとしての活用が考えられる。本人の承諾のもと、情報提供者は、例えば、生物学的年齢が実年齢よりも短い(健康的な)健康診断受診者には、年金保険への加入の推奨や長生きを前提とした商品の情報提供を行うことが考えられる。例えば、将来の長生きリスクに備えた貯蓄の推奨や、インフレを想定した試算用のアドバイスなどが考えられる。一方、生物学的年齢が実年齢よりも長い(健康的ではない)健康診断受診者には、生命保険への加入の推奨や健康増進に役立つ商品の情報提供を行うことが考えられる。例えば、トレーニングジムへの入会の勧誘や体に良い健康食品の紹介等が考えられる。この機能を活用することによって、健康診断受診者は、自分に相応しい商品の情報を入手することが可能となる。すなわち、本機能を活用することによって、情報提供者は、消費者を健康状態に応じて区分し、ターゲットを定めたマーケッティング活動を実施することが可能となると同時に、健康診断受診者は、自分に相応しい商品の情報を入手することが可能となる。さらに、本実施形態を利用する人々は、健康に関心を持った人々である。これらの人々の情報を匿名化してデータベース化することによって、新たな商品開発や創薬のデータベースとして活用することも可能である。
本実施形態の別の応用形態としては、生命保険会社での利用が考えられる。例えば、生物学的年齢が実年齢よりも短い(健康的な)健康診断受診者ヘは、終身保険の保険料を割り引くことが可能となる。反対に、生物学的年齢が実年齢よりも長い(健康的ではない)健康診断受診者には、終身保険の保険料を割り増すことが可能となる。このように、本実施形態の導入は、保険会社のビジネスモデルを変化させる可能性がある。同様に、本実施形態の別の応用形態としては、銀行での利用が考えられる。例えば、生物学的年齢が実年齢よりも短い(健康的な)健康診断受診者ヘは、融資の利率や個人ローンの金利を割り引くことが可能となる。反対に、生物学的年齢が実年齢よりも長い(健康的ではない)健康診断受診者には、融資の利率や個人ローンの金利を割り増すことが可能となる。このように、本実施形態の導入は、銀行のビジネスモデルを変化させる可能性がある。本実施形態が普及することによって、金融機関は、個人の属性に応じた金融商品を提供することが可能となる。
本実施形態には、「遺伝子検査と保険」の問題を回避するメリットがある。「遺伝子検査と保険」の問題とは、遺伝子検査が普及するにつれて、遺伝子上の問題を抱える人(将来病気になる可能性の高い人)だけが保険契約を結ぶようになり(いわゆる逆選択)、保険会社の経営が成り立たなくなる問題である。これに対して、本実施形態は、遺伝子の解析データに基づくものの(第2モデル)、アウトプットされるのは、生物学的年齢の推定値D5と実年齢の差のみである。既述のとおり、生物学的年齢の推定値D5が実年齢よりも短い(健康的な)健康診断受診者には金融商品の優遇を行い、生物学的年齢の推定値D5が実年齢よりも長い(健康的でない)健康診断受診者には金融商品の優遇を行わないのは、通常の商品の販売者と何ら異なることはない行動である。本実施形態においては、「遺伝子検査と保険」の問題をクリアしながら、消費者のニーズに合わせた金融商品を提供できるメリットがある。
本実施形態の最大の受益者は、健康診断受診者本人である。本実施形態によって、健康診断受診者は。自分の健康状態をこれまで以上に正確に知ることができるようになる。この結果、生物学的年齢の推定値D5が実年齢よりも短い(健康的な)健康診断受診者は、より一層健康的な活動を行うことができるようになる。一方、生物学的年齢の推定値D5が実年齢よりも長い(健康的でない)健康診断受診者は、健康増進のための活動に取り組むきっかけを得ることができる。このように、本実施形態の最大のメリットは、健康診断受診者に健康増進のインセンティブを与えることにある。このような活動が国全体で広がることで、現在、国民的な課題である医療費の削減にも繋がることが期待される。
2 年齢学習装置
21 演算装置(CPU)
22 主記憶装置(RAM)
23 通信制御部
24 通信IF部
25 補助記憶装置
201 入力受付手段
202 第1算出手段
203 第2算出手段
204 係数算出手段
DB1 健康診断データベース
DB2 遺伝子解析データベース
DB3 モデルデータベース
3 年齢推定装置
301 入力受付手段
302 第1算出手段
303 第3算出手段
304 出力手段
4 年齢推定装置
401 入力受付手段
402 第1算出手段
403 第2算出手段
404 係数算出手段
405 第3算出手段
406 出力手段
5 ユーザ端末
501 入力手段
502 出力手段
503 通信手段
6 外部装置
601 入力手段
602 出力手段
603 通信手段
100 年齢推定システム
D1 健康診断データ
D2 遺伝子解析データ
D3 表現型年齢の推定値
D4 遺伝学的年齢の推定値
D5 生物学的年齢の推定値
M 死亡リスクの推定値
M2 死亡リスクの推定値
A 要注意項目
NW 通信ネットワーク
W1 入力画面
W11 項目表示部
W12 数値入力部
W13 決定ボタン
W2 結果画面
W21 結果表示部

Claims (13)

  1. 生物学的年齢を推定する為の推定モデルの係数を算出する年齢学習装置であって、
    学習用健康診断データ及び、学習用遺伝子解析データの入力を受け付ける入力受付手段と、
    前記学習用健康診断データを用いて少なくとも死亡リスクの推定値を算出する第1算出手段と、
    前記学習用遺伝子解析データを用いて遺伝学的年齢の推定値を算出する第2算出手段と、
    前記第1算出手段及び、前記第2算出手段により算出された推定値に基づいて、生物学的年齢の推定値を算出する為の推定モデルの推定係数を算出する係数算出手段と、を備え、
    前記学習用健康診断データと前記学習用遺伝子解析データは、少なくとも1以上の共通する参照データを有し、
    前記係数算出手段は、共通の参照データが含まれる前記学習用健康診断データ及び前記学習用遺伝子解析データに基づいて、前記推定モデルを生成する、年齢学習装置。
  2. 前記係数算出手段は、生物学的年齢を算出する回帰式の係数として前記推定係数を用いて推定モデルを生成する請求項1に記載の年齢学習装置。
  3. 前記第1算出手段は、算出した死亡リスクの推定値を用いて表現型年齢の推定値を更に算出する請求項1又は請求項2に記載の年齢学習装置。
  4. 前記参照データは、少なくともデータ提供者の実年齢を含む請求項1〜請求項3の何れかに記載の年齢学習装置。
  5. 前記係数算出手段は、不同のデータ提供者より取得される前記学習用健康診断データと前記学習用遺伝子解析データに基づいて前記推定モデルを生成する請求項1〜請求項4の何れかに記載の年齢学習装置。
  6. 前記学習用遺伝子解析データは、少なくともDNAメチル化レベルを示す数値を含む請求項1〜請求項5の何れかに記載の年齢学習装置。
  7. 前記学習用健康診断データは、アルブミン、クレアチニン、グルコース、C反応性蛋白、リンパ球、平均赤血球容積、赤血球分布幅、アルカリフォスファターゼ、白血球数、実年齢のうち少なくとも1以上を含む請求項1〜請求項6の何れかに記載の年齢学習装置。
  8. 前記年齢学習装置によって算出された推定係数に基づく推定モデルを用いて生物学的年齢を推定する年齢推定装置であって、
    推定用健康診断データの入力を受け付ける入力受付手段と、
    前記推定用健康診断データを用いて少なくとも死亡リスクの推定値を算出する第1算出手段と、
    前記推定用健康診断データを用いて前記第1算出手段により算出された推定値を前記推定モデルに入力し、生物学的年齢の推定値を算出する第3算出手段と、を備える請求項1〜請求項7の何れかに記載の年齢推定装置。
  9. 前記第1算出手段は、前記推定用健康診断データを用いて前記第1算出手段により算出された死亡リスクの推定値を用いて表現型年齢の推定値を更に算出し、
    前記第3算出手段は、前記表現型年齢の推定値を前記推定モデルに入力し、生物学的年齢の推定値を算出する請求項8に記載の年齢推定装置。
  10. 前記第3算出手段は、前記学習用健康診断データ又は、前記推定用健康診断データの一部の項目についてデータが入力されない場合、データが入力されない項目に予め設定された所定値を入力する請求項8又は請求項9に記載の年齢推定装置。
  11. 前記推定用健康診断データは、アルブミン、クレアチニン、グルコース、C反応性蛋白、リンパ球、平均赤血球容積、赤血球分布幅、アルカリフォスファターゼ、白血球数、実年齢のうち少なくとも1以上を含む請求項8〜請求項10の何れかに記載の年齢推定装置。
  12. 生物学的年齢を推定する為の係数を算出する年齢学習方法であって、
    学習用健康診断データ及び、学習用遺伝子解析データの入力を受け付けるステップと、
    前記学習用健康診断データを用いて少なくとも死亡リスクの推定値を算出する第1算出ステップと、
    前記学習用遺伝子解析データを用いて遺伝学的年齢の推定値を算出する第2算出ステップと、
    前記第1算出ステップ及び、前記第2算出ステップにより算出された推定値に基づいて、生物学的年齢の推定値を算出する為の推定係数を算出するステップと、をコンピュータが実行し、
    前記学習用健康診断データと前記学習用遺伝子解析データは、少なくとも1以上の共通する参照データを有し、
    前記推定係数を算出するステップは、共通の参照データが含まれる前記学習用健康診断データ及び前記学習用遺伝子解析データに基づいて、前記推定係数を算出する、年齢学習方法。
  13. 生物学的年齢を推定する為の係数を算出する年齢学習プログラムであって、
    コンピュータを、学習用健康診断データ及び、学習用遺伝子解析データの入力を受け付ける入力受付手段と、
    前記学習用健康診断データを用いて少なくとも死亡リスクの推定値を算出する第1算出手段と、
    前記学習用遺伝子解析データを用いて遺伝学的年齢の推定値を算出する第2算出手段と、
    前記第1算出手段及び、前記第2算出手段により算出された推定値に基づいて、生物学的年齢の推定値を算出する為の推定係数を算出する係数算出手段と、として機能させ、
    前記学習用健康診断データと前記学習用遺伝子解析データは、少なくとも1以上の共通する参照データを有し、
    前記係数算出手段は、共通の参照データが含まれる前記学習用健康診断データ及び前記学習用遺伝子解析データに基づいて、前記推定モデルを生成する、年齢学習プログラム。
JP2020029862A 2020-02-25 2020-02-25 年齢学習装置、年齢推定装置、年齢学習方法及び年齢学習プログラム Active JP6901169B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020029862A JP6901169B1 (ja) 2020-02-25 2020-02-25 年齢学習装置、年齢推定装置、年齢学習方法及び年齢学習プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020029862A JP6901169B1 (ja) 2020-02-25 2020-02-25 年齢学習装置、年齢推定装置、年齢学習方法及び年齢学習プログラム

Publications (2)

Publication Number Publication Date
JP6901169B1 true JP6901169B1 (ja) 2021-07-14
JP2021135618A JP2021135618A (ja) 2021-09-13

Family

ID=76753078

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020029862A Active JP6901169B1 (ja) 2020-02-25 2020-02-25 年齢学習装置、年齢推定装置、年齢学習方法及び年齢学習プログラム

Country Status (1)

Country Link
JP (1) JP6901169B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023025037A1 (zh) * 2021-08-27 2023-03-02 华为技术有限公司 健康管理方法、系统和电子设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060131154A (ko) * 2005-06-15 2006-12-20 주식회사 리얼 에이지 생체 연령 측정 장치 및 그 서비스 방법
RU2010119453A (ru) * 2007-10-16 2011-11-27 Конинклейке Филипс Электроникс Н.В. (Nl) Оценка диагностических маркеров
US20110207128A1 (en) * 2010-02-16 2011-08-25 Cawthon Richard M Methods and kits for determining biological age and longevity based on gene expression profiles
KR101669526B1 (ko) * 2015-03-04 2016-10-26 주식회사 바이오에이지 생체나이를 이용한 잔여 수명 예측방법
EP3494210A4 (en) * 2016-08-05 2020-03-11 The Regents Of The University Of California MORTALITY PRONOSTICER BASED ON DNA METHYLATION

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023025037A1 (zh) * 2021-08-27 2023-03-02 华为技术有限公司 健康管理方法、系统和电子设备

Also Published As

Publication number Publication date
JP2021135618A (ja) 2021-09-13

Similar Documents

Publication Publication Date Title
KR20130132802A (ko) 심혈관 질환들의 발병을 예측하기 위한 건강관리 정보 기술 시스템
Moy et al. Physical activity assessed in routine care predicts mortality after a COPD hospitalisation
Redfern et al. Predicting in-hospital mortality and unanticipated admissions to the intensive care unit using routinely collected blood tests and vital signs: Development and validation of a multivariable model
US20120303381A1 (en) System and method for scoring illness complexity to predict healthcare cost
Cross et al. Coronary risk assessment among intermediate risk patients using a clinical and biomarker based algorithm developed and validated in two population cohorts
US20210118571A1 (en) System and method for delivering polygenic-based predictions of complex traits and risks
EP4158638A1 (en) Machine learning platform for generating risk models
Hamad et al. Using “big data” to capture overall health status: properties and predictive value of a claims-based health risk score
JP5818321B2 (ja) 健診情報分析システム及び健診情報分析システムの動作方法
Doudesis et al. Machine learning for diagnosis of myocardial infarction using cardiac troponin concentrations
Severin et al. Value judgments for priority setting criteria in genetic testing: a discrete choice experiment
Jain et al. Awareness of racial and ethnic bias and potential solutions to address bias with use of health care algorithms
Amin et al. Determinants of the willingness to participate in biobanking among Malaysian stakeholders in the Klang Valley
Wong et al. Derivation and validation of a model to predict daily risk of death in hospital
JP6901169B1 (ja) 年齢学習装置、年齢推定装置、年齢学習方法及び年齢学習プログラム
JP2009205464A (ja) 医療情報処理装置、医療情報処理方法、及び医療情報処理プログラム
Singh et al. Understanding racial bias in health using the Medical Expenditure Panel Survey data
Li et al. Evaluating and mitigating bias in machine learning models for cardiovascular disease prediction
Cournane et al. Predicting outcomes in emergency medical admissions using a laboratory only nomogram
Wickrama et al. Midlife family economic hardship and later life cardiometabolic health: The protective role of marital integration
Bergsten et al. Predicting adults likely to develop heart failure using readily available clinical information: an analysis of heart failure incidence using the NHEFS
Sun et al. Neural network on interval-censored data with application to the prediction of Alzheimer's disease
Ahmadian et al. Combining binary and continuous biomarkers by maximizing the area under the receiver operating characteristic curve
Hamburger et al. Utility of the Diamond-Forrester classification in stratifying acute chest pain in an academic chest pain center
Al Sayah et al. The predictive ability of EQ-5D-3L compared to the LACE index and its association with 30-day post-hospitalization outcomes

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200302

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201217

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20201217

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20210121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210316

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210324

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210608

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210610

R150 Certificate of patent or registration of utility model

Ref document number: 6901169

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150