JP2022536785A - 発症率を監視する方法、装置、設備および記憶媒体 - Google Patents

発症率を監視する方法、装置、設備および記憶媒体 Download PDF

Info

Publication number
JP2022536785A
JP2022536785A JP2021574345A JP2021574345A JP2022536785A JP 2022536785 A JP2022536785 A JP 2022536785A JP 2021574345 A JP2021574345 A JP 2021574345A JP 2021574345 A JP2021574345 A JP 2021574345A JP 2022536785 A JP2022536785 A JP 2022536785A
Authority
JP
Japan
Prior art keywords
training
data
model
prediction
disease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021574345A
Other languages
English (en)
Other versions
JP7295278B2 (ja
Inventor
嫻嫻 陳
暁▲うぇん▼ 阮
亮 徐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Publication of JP2022536785A publication Critical patent/JP2022536785A/ja
Application granted granted Critical
Publication of JP7295278B2 publication Critical patent/JP7295278B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/60ICT specially adapted for the handling or processing of medical references relating to pathologies
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本出願は、人工知能の技術分野に関し、既往歴の情報に基づいて発症率を監視する方法、装置、設備およびコンピュータ可読記憶媒体を開示しており、既往歴の情報に基づく発症率の監視方法は、予め設定されたゲート付き回帰型ニューラルネットワークとアンサンブル学習アルゴリズムの組み合わせによって、既往歴データを連続的に自律学習することにより、既往歴の情報に基づく発症率監視のための予測モデルを形成し、そして予測対象疾病の疾病データを予測モデルに入力して予測および監視する。本出願は、上記のアルゴリズムとニューラルネットワークの組み合わせによって、既往歴データから一定のパターンを捉え、予測モデルを形成し、かつゲート付き回帰型ニューラルネットワークとアンサンブル学習アルゴリズムの組み合わせにより、モデルが記憶するデータ量が簡略化されるだけでなく、疾病予測の効率が向上し、疾病の流行に対する急速および正確な予測が可能になり、早期警報をタイムリーに作動させることができ、流行疾患の予防と制御の展開に向けた関連スタッフの準備が容易になる。【選択図】図1

Description

本出願は、2019年8月1日に中国特許局に提出された、「発症率を監視する方法、装置、設備および記憶媒体」と題する中国特許出願第201910706318.4号の優先権を主張し、その内容は全て参照により本出願に組み込まれている。
本出願は、ニューラルネットワーク技術の分野に関し、特に、既往歴の情報に基づいて発症率を監視する方法、装置、設備、および記憶媒体に関する。
科学技術と経済・生活の融合が加速するにつれて、経済・交流活動の活発化や人の移動がますます頻繁になることで、病気の拡散や発生に適した環境となり、公衆衛生問題はますます深刻化している。同時に、社会環境や自然環境も変化しており、環境汚染や自然災害など公衆衛生に影響を与える事象の増加により、公衆衛生上の緊急事態が発生する可能性も高くなっている。
病気の発生を早期に発見し、早期に警告し、発生による被害を最小限に抑えるために早期に対策を講じることは、現在の医療技術の重要な焦点の一つである。
特にインフルエンザ疾患への監視については、例えば主に熱帯・亜熱帯地域で流行し、かつ南方都市を中心に流行しているデング熱は、季節的に流行する伝染病の一つであり、このようなウイルスの伝染・影響要因は多く、被害・影響の度合いはそれほど明らかではなく、この種のウイルスを予防するために、現在、医学界では主に季節的な気候・気象、および機械学習を利用して発生するか否かを判断しているが、発症率の予測については、既存の制御方法では、ある地域でのサンプルと誘発因子を採取し、サンプルと誘発因子に基づいてモデルの訓練とテストを行い、その後、モデルとリアルタイムなデータに基づいて疾病の発症を予測し、この方法では、疾病の発症に影響を与える要因を1つのモデルに効果的に組み込むことができないため、機械がタイムリーに学習することができず、疾病の予測精度に影響を与えてしまう。
本出願は、既往歴の情報に基づく発症率の監視方法、装置、設備、および記憶媒体を提供することを主な目的とし、従来技術では機械学習方法によって、疾病の発症率を監視する精度が高くないという技術的課題を解決することを旨とする。
上記の目的を実現するために、本出願の第1の態様は、既往歴の情報に基づく発症率の監視方法を提供しており、疾病に関する既往歴データを取得し、予め分割された様々な年齢層に応じて前記既往歴データに対して分類区別処理を実行することと、分類区別処理後の前記既往歴データに基づいて、予め設定されたゲート付き回帰型ニューラルネットワークとアンサンブル学習アルゴリズムにより、各年齢層における既往歴データに対してモデル訓練の自律学習動作を実行し、予測対象疾病の発症率の予測計算を実現するための予測モデルを生成することと、予測対象疾病の種類、予測対象時点、および、前記時点以前に監視された症例データを含む前記時点以前の関連データを取得し、かつ前記関連データを前記予測モデルに入力して、前記時点における予測対象疾病の発症率の予測結果を算出することと、を含む。
本出願の第2の態様は、既往歴の情報に基づく発症率の監視設備を提供しており、それは、メモリと、プロセッサと、前記メモリに記憶され、かつ前記プロセッサ上で実行可能なコンピュータ可読命令とを備えており、前記プロセッサが前記コンピュータ可読命令を実行する時、疾病に関する既往歴データを取得し、予め分割された様々な年齢層に応じて前記既往歴データに対して分類区別処理を実行するステップと、分類区別処理後の前記既往歴データに基づいて、予め設定されたゲート付き回帰型ニューラルネットワークとアンサンブル学習アルゴリズムにより、各年齢層における既往歴データに対してモデル訓練の自律学習動作を実行し、予測対象疾病の発症率の予測計算を実現するための予測モデルを生成するステップと、予測対象疾病の種類、予測対象時点、および、前記時点以前に監視された症例データを含む前記時点以前の関連データを取得し、かつ前記関連データを前記予測モデルに入力して、前記時点における予測対象疾病の発症率の予測結果を算出するステップと、を実現する。
本出願の第3の態様は、コンピュータ命令が記憶されたコンピュータ可読記憶媒体を提供しており、前記コンピュータ命令がコンピュータ上で実行されると、疾病に関する既往歴データを取得し、予め分割された様々な年齢層に応じて前記既往歴データに対して分類区別処理を実行するステップと、分類区別処理後の前記既往歴データに基づいて、予め設定されたゲート付き回帰型ニューラルネットワークとアンサンブル学習アルゴリズムにより、各年齢層における既往歴データに対してモデル訓練の自律学習動作を実行し、予測対象疾病の発症率の予測計算を実現するための予測モデルを生成するステップと、予測対象疾病の種類、予測対象時点、および、前記時点以前に監視された症例データを含む前記時点以前の関連データを取得し、かつ前記関連データを前記予測モデルに入力して、前記時点における予測対象疾病の発症率の予測結果を算出するステップと、をコンピュータに実行させる。
本出願の第4の態様は、既往歴の情報に基づく発症率の監視装置を提供しており、それは、疾病に関する既往歴データを取得し、予め分割された様々な年齢層に応じて前記既往歴データに対して分類区別処理を実行するための第1のデータ取得モジュールと、分類区別処理後の前記既往歴データに基づいて、予め設定されたゲート付き回帰型ニューラルネットワークとアンサンブル学習アルゴリズムにより、各年齢層における既往歴データに対してモデル訓練の自律学習動作を実行し、予測対象疾病の発症率の予測計算を実現するための予測モデルを生成するためのモデル訓練モジュールと、予測対象疾病の種類、予測対象時点、および、前記時点以前に監視された症例データを含む前記時点以前の関連データを取得し、かつ前記関連データを前記予測モデルに入力して、前記時点における予測対象疾病の発症率の予測結果を算出するための発症予測モジュールと、を含む。
本出願が提供する技術的解決手段では、予め設定されたゲート付き回帰型ニューラルネットワークGate Recurrent Unitとアンサンブル学習アルゴリズムの組み合わせによって、既往歴データを連続的に自律学習することにより、既往歴の情報に基づく発症率監視のための予測モデルを形成し、当該アルゴリズムとニューラルネットワークの組み合わせに基づいて既往歴データから一定のパターンを捉え、予測モデルを形成し、かつGate Recurrent Unitネットワークとアンサンブル学習アルゴリズムの組み合わせにより、モデルが記憶するデータ量が簡略化されるだけでなく、疾病予測の効率が向上し、疾病の流行に対する急速および正確な予測が可能になり、早期警報をタイムリーに作動させることができ、流行疾患の予防と制御の展開に向けた関連スタッフの準備が容易になる。
本出願で提供される既往歴の情報に基づく発症率の監視方法の第1の実施例のフローチャートである。 本出願で提供される既往歴の情報に基づく発症率の監視方法の第2の実施例のフローチャートである。 本出願の実施例の解決手段に係るサーバー動作環境の構成模式図である。 本出願で提供される既往歴の情報に基づく発症率の監視装置の一実施例の機能モジュールの模式図である。
本出願の実施例は、既往歴の情報に基づいて発症率を監視する方法、装置、設備、および記憶媒体を提供し、アルゴリズムとニューラルネットワークの組み合わせを用いて、既往歴の情報に基づく発症率の監視方法を実現し、ニューラルネットワークにおけるGate Recurrent UnitとRandom Forest(ランダムフォレスト学習アルゴリズム)の組み合わせによって、カルテを長時間学習と訓練し、対応する予測モデルを生成し、既往歴データの学習に基づいて、発症のパターン、共通性と有効性を十分に把握できることで、データモデルの統計精度が向上し、また、以上のように構築された予測モデルによる発症人数の予測に基づき、Gate Recurrent Unitの学習方法を採用しているため、データ情報に対するモデルの記憶時間が増加し、かつ記憶された情報が相対的に簡略化され、その結果、予測時間の延長が実現され、かつ予測精度の点で、既存のモデルによる予測方法に比べて、本提案の方がさらに高く、医療従事者が予防・制御を実施する上で利便性が向上する。
当業者が本出願の解決手段をよりよく理解できるように、本出願の実施例における図面と併せて、本出願の実施例を以下に説明する。
本出願の明細書、特許請求の範囲、および上記の図面における「第1」、「第2」、「第3」、「第4」(存在する場合)などの用語は、特定の順序又は優先順位を説明するためのものではなく、類似した対象物を区別するために使用されている。このように使用されるデータは、適切な場合には交換可能であり、これによって、本明細書に記載されている実施例は、本明細書に図示または記載されているものと異なる順序で実行することができることを理解すべきである。さらに、「含む」または「有する」という用語およびその変型は、非排他的な包含をカバーすることを意図しており、例えば、一連のステップまたはユニットを含む過程、方法、システム、製品または設備は、明確に記載されたそれらのステップまたはユニットに限定される必要はなく、明確に記載されていない他のステップまたはユニットを含むか、それらの過程、方法、製品または設備に固有のステップまたはユニットを含んでもよい。
理解を容易にするために、以下において、本出願の実施例の具体的な流れを説明し、図1を参照すると、図1は、本出願の実施例で提供される既往歴の情報に基づく発症率の監視方法のフローチャートである。本実施例では、上述した既往歴の情報に基づく発症率の監視方法は、具体的には、以下のステップを含む。
一実施例では、当該既往歴の情報に基づく発症率の監視方法は、以下のステップS110、ステップS120、ステップS130を含む。
ステップS110では、疾病に関する既往歴データを取得し、予め分割された様々な年齢層に応じて前記既往歴データに対して分類区別処理を実行する。
当該ステップでは、デング熱に関する既往歴データを取得する際に、現在のオープンな医療システムのカルテデータベースや、インターネット上の多数の医療専門家の相談窓口から検索することができる。
具体的には、上記の既往歴データを取得する際に、時間、地域やカルテ種類などの条件に応じて抽出することができ、例えば、A、B、Cの地域から、ある年後にカルテ人数が最も多い数月中のカルテを選択し、かつ取得した当該数月のカルテから、全てのリスクレベルをカバーするものを優先的に選択することで、取得した既往歴データの網羅性を確保することができる。
実際の応用では、これらのデータは、予め設定された地域の疾病サーベイランスセンターのネットワークから入手でき、任意選択的に、当該疾病サーベイランスセンターは、対応する対象グループへの疾病監視およびデータ収集をそれぞれ実行する医療機関、学校・保育施設、薬局などであり得る。予め設定された条件を満たす場所を、データの取得元として選択することができる。前記予め設定された条件は、人数や規模、さらに全ての監視場所から割合で抽出することなどであり得る。例えば、学生の人数が予め設定された数に達した学校・保育施設を取得場所として選択する。他の例として、規模(例えば、1日の売上高)が予め設定された規模に達した薬局を取得場所として選択する。別の例として、規模(例えば、1日の入院者数)が予め設定された規模に達した病院を取得場所として選択する。
本実施例では、前記カルテデータには、年齢、性別、職業や居住地など、発症者の情報や疾病の種類が含まれる。好ましくは、データが参考になれるように、選択されたデータは、以前の長い時期内のものとされ、選択的に、例えば、現時点に近い2-3年間と設定してもよく、このようなデータは、よりリアルタイムに参照でき、特定のウイルスの変異を回避することができる。
本実施例では、既往歴データを分類する場合、人口のグループ別または発症の特性別に応じて分類してもよく、実際の応用では、人によって生活様式や習慣が異なるため、生活習慣の違いがデング熱の発症率の変化にもつながる可能性があり、例えば、生活密度が高いグループ、工場のグループ、ハイテク職業のグループなどに分けることができ、生活密度が高いグループでは環境や衛生状態が相対的に悪いため、より多くの蚊を誘うことになり、デング熱の広がりはまさに蚊を感染手段としている。
さらに、典型的なデング熱、軽度のデング熱や重度のデング熱など、既往歴における患者の重症度に応じて分割し、各程度の患者人数を統計してもよい。
実際の応用では、当該方法により発症数を予測する場合、一般的にはある特定の疾病を予測対象とするが、疾病の種類が設定されていない状況もあり、既往歴データを取得した後、分類過程で上記の状況を区別する以外、さらに疾病の種類を分類する必要もあり、ここでいう疾病とは、具体的には、伝染性・感染性を持つ疾病、例えば、デング熱、インフルエンザ、手足口病、はしか、おたふくかぜなどの流行疾患であると理解すべきである。
ステップS120では、分類区別処理後の前記既往歴データに基づいて、予め設定されたゲート付き回帰型ニューラルネットワークとアンサンブル学習アルゴリズムにより、各年齢層における既往歴データに対してモデル訓練の自律学習動作を実行し、予測対象疾病の発症率の予測計算を実現するための予測モデルを生成する。
当該ステップでは、GRU(Gate Recurrent Unit)は回帰型ニューラルネットワーク(Recurrent Neural Network)の1つであり、長い観察値シーケンスを学習する能力を持ち、本解決手段では、訓練モデルを構築する主な手段として使用されるが、アンサンブル学習アルゴリズムは、GRUネットワークで構成されたモデルにおいて異なるデータを制御学習するため、複数のモデルを個別に訓練して疾病を予測する必要がなくなり、かつGRUで構築されたモデルは、GRUモデルと呼ばれてもよく、具体的には、ゲートをいくつか構築することで情報を記憶し、かつモデルの訓練中に勾配がすぐに消えないようにされ、同時に、当該手段で構築されたモデルは、多くの情報を記憶する必要がなく、記憶する時間も他のモデルよりはるかに長い。
ステップS130では、予測対象疾病の種類、予測対象時点、および、前記時点以前に監視された症例データを含む前記時点以前の関連データを取得し、前記関連データを前記予測モデルに入力し、前記時点における予測対象疾病の発症率の予測結果を算出する。
本実施例では、上記のステップによって将来の一定の期間内のある疾病の発症人数の予測を実現するためには、予測を行う期間を決定し、かつ現在の期間内における近いある時点のカルテデータと併せて予測する必要があり、ここでいうカルテデータは、ステップS110での既往歴データと重なっているものであってもよいし、もちろん重ならないものであってもよい。
予測の精度をさらに向上させるために、本解決手段のステップS110では、既往歴データを取得した後、さらに上記の既往歴データに対して共通性/発症パターンの分析を実行してもよく、ここでいう共通性またはパターンの分析とは、前記既往歴データにおける発症パターンを分析することを指し、例えば、全ての患者の居住環境を統計して相互に比較することで、居住環境が当該流行疾患を誘発した要因の1つであるか否か、その年の発症人数の増減の要因となったか否かを決定する。別の例として、ウイルス自体が変異しているか否かを確認し、変異している場合には、その変異を環境と組み合わせてさらに分析し、ウイルスの変異と環境との間に関係があるか否かを判断し、これらの分析で得られた情報全体を、ステップS120のモデル訓練を行い、かつアンサンブル学習アルゴリズムによりモデルに統合することで、疾病発症人数を正確に予測することができる。
本実施例では、さらに、既往歴データを分類した後で、さらに分類後の各種別に個別に分析してもよく、その分析には発症人数の統計、および発症要因の統計などが含まれ、つまり、モデル訓練を実行する時に、各種別に対して1つのモデルを訓練して個別に使用することができる。
例えば、取得された既往歴データは、現時点から遡って連続した3年間のA地域における発症カルテであり、この3年間のデータに関して、まず、カルテデータを年ごとに分け、次に、各年に発症した患者のカルテを、典型的なデング熱、軽度のデング熱と重度のデング熱の3種類に分類し、続いて、各種別の人数の変化を年ごとに比較する。
同時に、既往歴を分類した後、デング熱発生時の外部環境がどうだったかなど、発症の外的要因をさらに分析し、3年間の各データを逐次比較して、最終的に発症のパターンを出力し、これらのパターンもカルテデータとして記憶し、かつモデルを訓練する時に統合的に訓練し、このようにデータを処理してモデルに訓練させることで、モデルの網羅性がより高くなり、予測する時により多くのデータと組み合わせて分析と予測することができ、予測精度、およびこれらの疾病に対する予防・制御の展開作業の強さと指向性がさらに向上する。
さらに、本実施例では、上述した分類区別処理後の前記既往歴データに基づいて、予め設定されたゲート付き回帰型ニューラルネットワーク(GRU)とアンサンブル学習アルゴリズムにより、各年齢層における既往歴データに対してモデル訓練の自律学習動作を実行し、予測モデルを生成するステップは、
サンプル無作為抽出法により、分類された各種別の既往歴データから少なくとも2つの訓練サンプルを抽出することと、
抽出された前記訓練サンプルから1つの訓練サンプルを初期サンプルとして選択し、前記初期サンプルに基づいてモデルの初期訓練を行い、前記予測モデルのプロトタイプモデルを取得することと、
前記ゲート付き回帰型ニューラルネットワークによって前記プロトタイプモデルに情報記憶ゲートを追加し、かつ前記アンサンブル学習アルゴリズムを用いて、各種別から抽出した前記訓練サンプルに基づいて、情報記憶ゲートが追加された前記プロトタイプモデルに対して2回目の深層アンサンブル学習訓練を実行することで、前記予測モデルを構築することと、を含む。
実現中では、GRUニューラルネットワークによってモデルを作成した後、次のカルテデータに基づくモデルの訓練統合は具体的に、以下の通りであってよく、すなわち、
まず、ステップS110で取得した既往歴データから、によるBootstraping方法を用いて無作為に返却サンプリングを行ってM個のサンプルを抽出し、合計でn_tree回のサンプリングを実行して、n_tree個の訓練サンプルを生成し、1つの訓練セットを形成し、
n_tree個の訓練セットに対して、作成された訓練モデルに基づいてn_tree個の決定ツリーモデルを訓練し、
単一の決定ツリーモデルに対して、訓練サンプルの特徴の数をnとすると、情報利得/情報利得比/ジニ指数に基づいて、各分割時に最適な特徴を選択して分割し、
各ツリーモデルは、そのノードの全ての訓練サンプルが同じクラスに属するようになるまで上記のように分割されるが、その分割訓練プロセスにおいてモデルの刈り込み処理を必要とせず、
生成された複数の決定ツリーを、アンサンブル学習アルゴリズムによって統合処理し、疾病予測モデルを形成する。
さらに、GRニューラルネットワークとアンサンブル学習アルゴリズムの組み合わせによって訓練されたモデルはさらに、回帰モデルとしても機能するため、データの回帰検証をある程度行うことができ、データの勾配分散が予測結果に影響することを回避する。
本実施例では、上述した前記アンサンブル学習アルゴリズムを用いて、各種別から抽出した前記訓練サンプルに基づいて、情報記憶ゲートが追加された前記プロトタイプモデルに対して深層アンサンブル学習訓練を実行することで、前記予測モデルを構築するステップは、具体的に、
前記アンサンブル学習アルゴリズムによって各前記訓練サンプルに対して特徴分割の訓練を行い、第1の訓練特徴を得ることと、
前記第1の訓練特徴を前記プロトタイプモデルに順次入力して深層の特徴訓練を行い、複数の分岐を有する決定ツリーモデルを得て、かつ前記決定ツリーモデルを前記予測モデルとして使用することと、をさらに含んでもよい。
すなわち、アンサンブル学習アルゴリズムによって各訓練サンプルに対して訓練特徴の分割処理を行い、第1の訓練特徴を得て、
そして、前記初期モデルに対して前記第1の訓練特徴を訓練して、複数の分岐を有する決定ツリーモデルを得て、前記決定ツリーモデルを前記疾病予測モデルとして使用する。
実際の応用では、アンサンブル学習アルゴリズムとして、具体的にはランダムフォレスト学習アルゴリズムRandom Forestを使用して実現することができ、当該アルゴリズムは、データの統合処理の精度が非常に高く、ランダム導入を実現できるため、ランダムフォレストはオーバーフィッティングが起こりにくく、また、ランダムフォレストは耐ノイズ性にも優れており、非常に高次元のデータを扱うことができ、かつ特徴選択を行う必要がなく、離散データと連続データの両方を処理することができ、データセットを正規化する必要がなく、訓練が高速で、変数の重要度ランキングを得ることができ、異なる影響要因の並行化処理を容易に実現することは何よりも重要である。
本実施例では、前記既往歴の情報に基づく発症率の監視方法は、
前記既往歴データに対応する医療生態情報を取得することをさらに含み、前記医療生態情報には、気象データ、医療水準データ、疾病監視データのうちの少なくとも1つが含まれ、
実際の応用では、当該ステップは、具体的には、前記時点以前の関連データを取得する前に実施してもよく、医療システムやウェブページから既往歴データを取得しながら実行してもよく、すなわち、当該ステップで取得した医療生態情報は、最初に取得した既往歴データに対応していることで、既往歴データを用いて予測モデルを訓練する際に、より多くの変化要因が導入され、予測モデルの精度が大幅に向上する。
この時、予測モデルを訓練するステップは、
前記アンサンブル学習アルゴリズムによって前記医療生態情報に対して特徴分解の訓練を行い、第2の訓練特徴を得ることと、
前記第2の訓練特徴を前記決定ツリーモデルに入力して、3回目の深層訓練学習を行い、完全な前記予測モデルを構築することと、をさらに含む。
実際の応用では、取得した医療生態情報のモデル訓練過程への追加は、上記の方法で決定ツリーモデルに追加して深層訓練の方法を用いて実現されてもよく、1回目の深層訓練に実現されてもよい。
本実施例では、当該気象データには、気温および湿度などが含まれており、実際の応用では、前記医療生態情報には、人口密度などが含まれている場合もある。疾病予測モデルを訓練する際に、データに基づいてモデルの学習訓練を行い、ニューラルネットワーク(Gate Recurrent Unit)とランダムフォレストアルゴリズム(Random Forest)を組み合わせた完全な訓練モデルを形成する過程中に、回帰型ニューラルネットワークによる既往歴データの継続的な学習により、安定的で強固なモデルが形成されるが、医療生態情報の追加訓練に関しては、加算メカニズムにより気象データ、医療水準データ、疾病監視データ、および人々の健康レベルをモデルの訓練に追加して、発症の確率およびある地域全体の発症人数を正確に予測できることで、訓練されたモデルの網羅性がより良くなり、予測精度もより高くなる。
本実施例では、その疾病監視データは、具体的には、ユーザーの普段の生活における防御薬の購入・使用状況や、健康状態に関する普段の相談履歴などであってもよく、これらはいずれも、現時点での人々の健康状態を判断するための要素であり、また、一部の流行疾患に対する抵抗力である健康度は、発症するか否かを左右する要因の1つでもある。
本実施例では、上述した分類区別処理後の前記既往歴データに基づいて、予め設定されたゲート付き回帰型ニューラルネットワークとアンサンブル学習アルゴリズムにより、各年齢層における既往歴データに対してモデル訓練の自律学習動作を実行し、予測モデルを生成するステップの後、
前記既往歴データからある期間内のカルテデータを無作為に抽出して前記予測モデルに入力し、前記期間内のカルテデータに対応する発症数の予測値を得ることと、
前記予測値が、前記期間内のカルテデータに対応する実際の発症データを満たしているか否かを判断し、モデル検証結果を得ることと、
前記モデル検証結果に応じて、前記予測モデルを最適化するための、前記2回目の深層訓練と3回目の深層訓練学習を繰り返す4回目の深層訓練を実行するか否かを決定することと、をさらに含む。
実際の応用では、具体的には、前記既往歴データから一部のカルテデータを無作為に抽出して前記疾病予測モデルに入力し、前記一部のカルテデータに対応する期間内の発症数の予測値を得て、
前記予測値が前記一部のカルテデータに対応する期間内の実際の発症データであるか否かを判断し、
前記判断結果に応じて、前記疾病予測モデルを最適化するための深層訓練を実行するか否かを決定する。
当該検証の過程では、具体的に以下の例によって実現され得る。
前記既往歴データから、前記疾病予測モデルを訓練するためのある期間内のシーケンスデータを抽出し、抽出されたシーケンスデータから、各時点に対応する訓練モデルに必要なデータを所定次元の訓練セットとして構成し、時系列に応じて、各時点に対応する訓練セットを前記疾病予測モデルに順次入力して、前記疾病予測モデルを訓練するために使用する。前記既往歴データから、前記疾病予測モデルを訓練するためのある期間内のシーケンスデータを抽出し、抽出されたシーケンスデータから、各時点に対応する訓練モデルに必要なデータを所定次元の検証セットとして構成し、時系列に応じて、各時点に対応する検証セットを前記疾病予測モデルに順次入力して、前記多層GRUモデルを検証するために使用する。
さらに、前記モデル検証結果としては前記予測値が前記実際の発症データを満たさないと判断された場合、上述した予測対象疾病の種類、予測対象時点、および前記時点以前の関連データを取得し、前記関連データを前記予測モデルに入力し、前記時点における予測対象疾病の発症率の予測結果を算出するステップの後、
前記既往歴データからN個のサンプルデータを抽出し、かつ前記予測モデルを訓練するための訓練サンプルを加算メカニズムにより更新および/再設定し、更新および/再設定された訓練サンプルに基づいて予測モデルを訓練することをさらに含み、ここで、Nは2以上である。
具体的には、定量の既往歴データを抽出し、前記疾病予測モデルを訓練するデータを加算メカニズムにより更新および/再設定し、かつ更新および/再設定された後の既往歴データに基づいて疾病予測モデルを訓練する。
本実施例では、モデル学習の訓練に関して、既往歴データの学習訓練だけでなく、リアルタイムの患者データの学習更新も含まれており、つまり、Gate Recurrent Unitによる学習訓練モデルにおいて、学習訓練の方法を追加することでモデルを更新および改良し、また、カルテデータの学習過程では、いくつかのアルゴリズムによってデータを引き締めることもでき、例えば、RNN構造に加えて、tからt-1への伝搬に加算メカニズムを追加して、データの勾配分散を防ぎ、updateとresetで情報を直接かつ高速に制御し、データのパラメータを減らして絞り込むことで、少ないパラメータで情報の長期記憶を実現し、発症人数の予測に有効に活用することができる。
本実施例では、上記の学習訓練に加えて、機械学習において安定性の非常に高いツリーモデルRandom Forestと統合し、Random Forestによる重要度スクリーニング後の既往歴データの特徴をGate Recurrent Unitに入力してモデルの統合を行うことで、より精度の高い予測モデルを得ることができる。
本実施例では、ステップ130の実現に関して、実際には、予測モデルを取得した後、予測対象データを取得して予測モデルに入力することで、自動的に発症人数を予測できるが、当該予測対象データには、予測時点と他のいくつかの実験データが含まれており、好ましくは、当該実現形態では、実験データは、気象データ、医療水準、およびその時点に応じて既往歴データからその時点に対応する既往歴データを抽出したものであり、例えば、その時点が2018年3月であれば、抽出された既往歴データは2017年3月、2016年3月などであるべきであり、すなわち、既往歴データは、月だけで抽出される。
これらの実験データを予測モデルに入力し、その時点に対応する発症人数の予測データを得る。
要約すると、本出願の実施例で提供される既往歴の情報に基づく発症率の監視方法では、回帰型ニューラルネットワークとRandom Forestアルゴリズムの組み合わせで、ツリーモデルと回帰型ニューラルネットワークを統合することによって、既往歴データのパターンに対するモデルの記憶を向上させ、かつ継続的に学習してモデルを更新することでモデルの精度を向上させ、これにより、モデルを用いて発症人数を予測する時に、将来の長期にわたる発症人数を正確に予測できるとともに、予測の効率と速度を向上させ、流行の早期警報を可能にし、予防・制御の展開の位置付けと促進に大きな役割を果たしている。
以下、具体的な疾病監視を例に挙げて、本出願で提供される既往歴の情報に基づく発症率の監視方法について詳細に説明し、図2は、既往歴の情報に基づく発症率の監視方法の具体的な実施例、例えばデング熱疾病の予測のフローチャートであり、当該既往歴の情報に基づく発症率の監視方法は、具体的には、以下のステップS210、ステップS220、ステップS230、ステップS240、ステップS250、およびステップS260を含む。
ステップS210では、オープンされた医療システムや医療関連ウェブページからデング熱の症例データを抽出し、
当該ステップでは、抽出された症例データには、ユーザー情報、発症原因、発症時の環境情報および当時の医療水準などのデータが含まれている。
もちろん、当該ステップを実行するために、システムとウェブページから取得されるだけでなく、いくつかのコミュニティの研究活動のプラットフォームや、異なるグループの調査統計からも取得され得る。実際の応用では、好ましくは、異なる生活環境に住む人々のヘルスケアステーションから取得されたデータが最適なものとして選択され、環境と人々の生活習慣は、疾病の高い発生率を引き起こす重要な要因であり、これらの要因から考慮して取得されるデータは、疾病発症の予測を反映しやすい。
ステップS220では、取得された症例データに基づき、症例データに共通するパターンおよび要因を抽出し、
当該ステップでは、共通するパターンおよび要因の抽出は、具体的には、既存の特徴抽出アルゴリズム、例えばキーワードの抽出アルゴリズムなどによって実現され得る。
ステップS230では、GRUニューラルネットワークとランダムフォレストアルゴリズムの組み合わせにより、特徴抽出された症例データを用いてモデル訓練学習を行い、疾病発症の予測モデルを構築し、
実際の応用では、サンプル無作為抽出法により、抽出された症例データから代表的な症例データをいくつか抽出してモデルの訓練サンプルとして用い、
抽出された前記訓練サンプルから1つの訓練サンプルを初期サンプルとして選択し、前記初期サンプルに基づいてモデルの初期訓練を行い、前記予測モデルのプロトタイプモデルを取得し、
前記GRUニューラルネットワークによって前記プロトタイプモデルに情報記憶ゲートを追加し、かつ前記ランダムフォレストアルゴリズムを用いて、抽出された前記訓練サンプルに基づいて、情報記憶ゲートが追加された前記プロトタイプモデルに対して深層のアンサンブル学習訓練を実行することで、前記予測モデルを構築する。
ステップS240では、将来のある期間内におけるデング熱の予測時点、およびその予測時点における予測環境情報と現在のデング熱の監視データを取得する。
ステップS250では、上記データを予測モデルに入力して、デング熱の発症率の予測値を算出する。
ステップS260では、その予測値に基づいて事前警告を行い、かつ対応する防御策を講じる。
本実施例では、ニューラルネットワークとランダムフォレストアルゴリズムを用いて自律的な訓練学習を行うことで、・回発症するパターンまたは共通点を統計し、パターンまたは共通点に応じて将来のある期間内の発症率の予測を実現する。なお、ニューラルネットワークとランダムフォレストアルゴリズムによる自律学習訓練の統計だけでなく、さらにいくつかのモデルと組み合わせて統計の集中性を向上させ、例えば、ツリーモデルまたは加算メカニズムにより情報を簡単に記憶することで、ニューラルネットワークモデルの作成効率を向上させ、予測精度を向上させる。
上記の問題を解決するために、本出願はさらに、既往歴の情報に基づく発症率の監視設備を提供し、当該既往歴の情報に基づく発症率の監視設備は、本出願の実施例で提供される既往歴の情報に基づく発症率の監視方法を実現するために使用され得、その物理的な実装はサーバーの形で存在し、そのサーバーの具体的なハードウェアによる実装を図1に示す。
図3を参照すると、当該サーバーは、CPUなどのプロセッサ301、通信バス302、ユーザーインターフェース303、ネットワークインターフェース304、およびメモリ305を含む。ここで、通信バス302は、これらのコンポーネント間の接続通信を実現するために使用される。ユーザーインターフェース303は、ディスプレイ(Display)、キーボード(Keyboard)のような入力ユニットを含んでもよく、ネットワークインターフェース304は、任意選択可能に、標準的な有線インターフェース、無線インターフェース(例えば、WI-FIインターフェース)を含んでもよい。メモリ305は、高速RAMメモリであってもよく、ディスクメモリのような安定したメモリ(non-volatilememory)であってもよい。また、メモリ305は、任意選択可能に、前述のプロセッサ301とは独立した記憶装置であってもよい。
当業者であれば、図3に示す設備のハードウェア構造は、既往歴の情報に基づく発症率の監視装置を限定するものではなく、図示したものよりも多くのまたは少ない部品を含んでもよいし、特定の部品を組み合わせてもよいし、部品の異なる配置であってもよいことを理解できるであろう。
図3に示すように、コンピュータ可読記憶媒体としてのメモリ305は、オペレーティングシステム、ネットワーク通信モジュール、ユーザーインターフェースモジュール、および既往歴の情報に基づく発症率監視プログラムを含んでもよい。ここで、オペレーティングシステムは、既往歴の情報に基づく発症率監視装置とソフトウェアリソースを管理するプログラムであり、既往歴の情報に基づく発症率監視プログラム、および他のソフトウェアおよび/またはプログラムの実行を支援する。
図3に示すサーバーのハードウェア構造において、ネットワークインターフェース104は、主にネットワークにアクセスするために使用され、ユーザーインターフェース103は、設備でケース情報を実行し、およびケース実行過程で生成されたデータを実行するために使用され、プロセッサ301は、メモリ305に記憶された、既往歴の情報に基づく発症率監視プログラムを呼び出し、かつ以下の既往歴の情報に基づく発症率の監視方法の各実施例の動作を実行するために使用され得る。
本出願の実施例では、図3は、タッチ操作が可能な携帯電話などのモバイル端末によって実現してもよく、当該モバイル端末のプロセッサは、バッファーまたは記憶ユニットに記憶された、既往歴の情報に基づく発症率の監視方法が実現可能なプログラムコードを読み取って、既往歴データを分析し、自律的に訓練学習して、既往歴の情報に基づく発症率監視のための予測モデルを生成し、この学習の過程では、モデルの訓練精度を高めるために、ランダムフォレストアルゴリズムを組み合わせて疾病発症に影響を与える可能性がある要因を無作為に挿入する。
上記の問題を解決するために、本出願の実施例はさらに、既往歴の情報に基づく発症率の監視装置を提供し、図4を参照すると、図4は、本出願の実施例で提供される既往歴の情報に基づく発症率の監視装置の機能モジュールの模式図である。本実施例では、当該装置は、
疾病に関する既往歴データを取得し、予め分割された様々な年齢層に応じて前記既往歴データに対して分類区別処理を実行するための第1のデータ取得モジュール41と、
分類区別処理後の前記既往歴データに基づいて、予め設定されたゲート付き回帰型ニューラルネットワークとアンサンブル学習アルゴリズムにより、各年齢層における既往歴データに対してモデル訓練の自律学習動作を実行し、予測対象疾病の発症率の予測計算を実現するための予測モデルを生成するためのモデル訓練モジュール42と、
予測対象疾病の種類、予測対象時点、および、前記時点以前に監視された症例データを含む前記時点以前の関連データを取得し、かつ前記関連データを前記予測モデルに入力して、前記時点における予測対象疾病の発症率の予測結果を算出するための発症予測モジュール43と、を含む。
上述した本出願の実施例に係る既往歴の情報に基づく発症率の監視方法と同じ実施例に基づいて内容を説明するため、本実施例では、既往歴の情報に基づく発症率の監視装置の実施例について再度の説明は省略される。
本実施例では、ニューラルネットワークにおけるGate Recurrent UnitとRandom Forest(ランダムフォレスト学習アルゴリズム)の組み合わせにより、カルテを長時間学習と訓練し、対応する予測モデルを生成し、既往歴データの学習に基づいて、発症のパターン、共通性と有効性を十分に把握できることで、データモデルの統計精度が向上し、また、以上のように構築された予測モデルによる発症人数の予測に基づき、Gate Recurrent Unitの学習方法を採用しているため、データ情報に対するモデルの記憶時間が増加し、かつ記憶された情報が相対的に簡略化され、その結果、予測時間の延長が実現され、かつ予測精度の点で、既存のモデルによる予測方法に比べて、本提案の方がさらに高く、医療従事者が予防・制御を実施する上で利便性が向上する。
本出願はさらに、既往歴の情報に基づく発症率の監視設備を提供し、命令が記憶されたメモリと、少なくとも1つのプロセッサとを含み、前記メモリと前記少なくとも1つのプロセッサは、回線によって相互に接続されており、前記少なくとも1つのプロセッサは、前記メモリ内の前記命令を呼び出して、前記インテリジェントパスプランニング設備に、上記の既往歴の情報に基づく発症率の監視方法のステップを実行させる。
本出願はさらに、コンピュータ可読記憶媒体を提供し、当該コンピュータ可読記憶媒体は、不揮発性コンピュータ可読記憶媒体であってもよいし、揮発性コンピュータ可読記憶媒体であってもよい。コンピュータ可読記憶媒体にはコンピュータ命令が記憶されており、前記コンピュータ命令がコンピュータ上で実行されると、
疾病に関する既往歴データを取得し、予め分割された様々な年齢層に応じて前記既往歴データに対して分類区別処理を実行するステップと、
分類区別処理後の前記既往歴データに基づいて、予め設定されたゲート付き回帰型ニューラルネットワークとアンサンブル学習アルゴリズムにより、各年齢層における既往歴データに対してモデル訓練の自律学習動作を実行し、予測対象疾病の発症率の予測と計算を実現するための予測モデルを生成するステップと、
予測対象疾病の種類、予測対象時点、および、前記時点以前に監視された症例データを含む前記時点以前の関連データを取得し、かつ前記関連データを前記予測モデルに入力して、前記時点における予測対象疾病の発症率の予測結果を算出するステップと、をコンピュータに実行させる。
当業者であれば分かるように、説明の便宜上、上述したシステム、装置、およびユニットの具体的な動作プロセスは、上述した方法実施例における対応するプロセスを参照することができ、ここでは繰り返して説明しない。
本出願で提供されるいくつかの実施例では、開示されたシステム、装置、および方法は、他の方法によって実現できることを理解すべきである。例えば、上述した装置の実施例は、単に説明するためのものに過ぎず、例えば、前記ユニットの分割は、論理的な機能分割に過ぎず、実際に実装する際には別の方法で分割することができ、例えば、複数のユニットまたはコンポーネントを組み合わせたり、別のシステムに統合したりすることができ、または、一部の特徴を無視したり、実行しなかったりすることができる。別の点では、図示または議論されている相互結合または直接結合または通信接続は、いくつかのインターフェースを介して実現され得、装置またはユニットの間接結合または通信接続は、電気的、機械的またはその他の形態で実現され得る。
前述のように、上記の実施例は、本出願の技術的解決手段を説明するためのものに過ぎず、それらを限定するものではなく、上記の実施例を参照して本出願を詳細に説明したが、当業者であれば分かるように、上記の各実施例に記載された技術的解決手段を修正したり、その技術的特徴の一部を同等のものに置き換えたりすることは可能であり、それらの修正または置き換えは、対応する技術的解決手段の本質を本出願の各実施例の技術的解決手段の精神と範囲から逸脱させるものではない。

Claims (20)

  1. 疾病に関する既往歴データを取得し、予め分割された様々な年齢層に応じて前記既往歴データに対して分類区別処理を実行するステップと、
    分類区別処理後の前記既往歴データに基づいて、予め設定されたゲート付き回帰型ニューラルネットワークとアンサンブル学習アルゴリズムにより、各年齢層における既往歴データに対してモデル訓練の自律学習動作を実行し、予測対象疾病の発症率の予測と計算を実現するための予測モデルを生成するステップと、
    予測対象疾病の種類、予測対象時点、および、前記時点以前に監視された症例データを含む前記時点以前の関連データを取得し、かつ前記関連データを前記予測モデルに入力して、前記時点における予測対象疾病の発症率の予測結果を算出するステップと、含む、既往歴の情報に基づく発症率の監視方法。
  2. サンプル無作為抽出法により、分類された各種別の既往歴データから少なくとも2つの訓練サンプルを抽出し、
    抽出された前記訓練サンプルから1つの訓練サンプルを初期サンプルとして選択し、前記初期サンプルに基づいてモデルの初期訓練を行い、前記予測モデルのプロトタイプモデルを取得し、
    前記ゲート付き回帰型ニューラルネットワークによって前記プロトタイプモデルに情報記憶ゲートを追加し、かつ前記アンサンブル学習アルゴリズムを用いて、各種別から抽出した前記訓練サンプルに基づいて、情報記憶ゲートが追加された前記プロトタイプモデルに対して2回目の深層アンサンブル学習訓練を実行することで、前記予測モデルを構築する、請求項1に記載の既往歴の情報に基づく発症率の監視方法。
  3. 上述した前記アンサンブル学習アルゴリズムを用いて、各種別から抽出した前記訓練サンプルに基づいて、情報記憶ゲートが追加された前記プロトタイプモデルに対して深層アンサンブル学習訓練を実行することで、前記予測モデルを構築するステップは、
    前記アンサンブル学習アルゴリズムによって各前記訓練サンプルに対して特徴分割の訓練を行い、第1の訓練特徴を得ることと、
    前記第1の訓練特徴を前記プロトタイプモデルに順次入力して深層の特徴訓練を行い、複数の分岐を有する決定ツリーモデルを得て、かつ前記決定ツリーモデルを前記予測モデルとして使用することと、を含む、請求項2に記載の既往歴の情報に基づく発症率の監視方法。
  4. 上述した前記時点以前の関連データを取得するステップの前に、
    前記既往歴データに対応する医療生態情報を取得することをさらに含み、前記医療生態情報には、気象データ、医療水準データ、疾病監視データのうちの少なくとも1つが含まれ、
    上述した前記第1の訓練特徴を前記プロトタイプモデルに順次入力して深層の特徴訓練を行い、複数の分岐を有する決定ツリーモデルを得るステップの後、
    前記アンサンブル学習アルゴリズムによって前記医療生態情報に対して特徴分解の訓練を行い、第2の訓練特徴を得ることと、
    前記第2の訓練特徴を前記決定ツリーモデルに入力して、3回目の深層訓練学習を行い、完全な前記予測モデルを構築することと、をさらに含む、請求項3に記載の既往歴の情報に基づく発症率の監視方法。
  5. 上述した分類区別処理後の前記既往歴データに基づいて、予め設定されたゲート付き回帰型ニューラルネットワークとアンサンブル学習アルゴリズムにより、各年齢層における既往歴データに対してモデル訓練の自律学習動作を実行し、予測モデルを生成するステップの後、
    前記既往歴データからある期間内のカルテデータを無作為に抽出して前記予測モデルに入力し、前記期間内のカルテデータに対応する発症数の予測値を得ることと、
    前記予測値が、前記期間内のカルテデータに対応する実際の発症データを満たしているか否かを判断し、モデル検証結果を得ることと、
    前記モデル検証結果に応じて、前記予測モデルを最適化するための、前記2回目の深層訓練と3回目の深層訓練学習を繰り返す4回目の深層訓練を実行するか否かを決定することと、をさらに含む、請求項1~4のいずれか1項に記載の既往歴の情報に基づく発症率の監視方法。
  6. 上述した予測対象疾病の種類、予測対象時点、および前記時点以前の関連データを取得し、前記関連データを前記予測モデルに入力して、前記時点における予測対象疾病の発症率の予測結果を算出するステップの後、
    前記モデル検証結果としては前記予測値が前記実際の発症データを満たさないと判断された場合、前記既往歴データからN個のサンプルデータを抽出し、かつ前記予測モデルを訓練するための訓練サンプルを加算メカニズムにより更新および/再設定し、更新および/再設定された訓練サンプルに基づいて予測モデルを訓練することをさらに含み、ここで、Nは2以上である、請求項5に記載の既往歴の情報に基づく発症率の監視方法。
  7. 前記アンサンブル学習アルゴリズムは、ランダムフォレスト学習アルゴリズムである、請求項6に記載の既往歴の情報に基づく発症率の監視方法。
  8. メモリと、プロセッサと、前記メモリに記憶され、かつ前記プロセッサ上で実行可能なコンピュータ可読命令とを備えており、前記プロセッサが前記コンピュータ可読命令を実行する時、
    疾病に関する既往歴データを取得し、予め分割された様々な年齢層に応じて前記既往歴データに対して分類区別処理を実行するステップと、
    分類区別処理後の前記既往歴データに基づいて、予め設定されたゲート付き回帰型ニューラルネットワークとアンサンブル学習アルゴリズムにより、各年齢層における既往歴データに対してモデル訓練の自律学習動作を実行し、予測対象疾病の発症率の予測と計算を実現するための予測モデルを生成するステップと、
    予測対象疾病の種類、予測対象時点、および、前記時点以前に監視された症例データを含む前記時点以前の関連データを取得し、かつ前記関連データを前記予測モデルに入力して、前記時点における予測対象疾病の発症率の予測結果を算出するステップと、を実現する、既往歴の情報に基づく発症率の監視設備。
  9. 前記プロセッサが前記コンピュータプログラムを実行する時に、
    サンプル無作為抽出法により、分類された各種別の既往歴データから少なくとも2つの訓練サンプルを抽出するステップと、
    抽出された前記訓練サンプルから1つの訓練サンプルを初期サンプルとして選択し、前記初期サンプルに基づいてモデルの初期訓練を行い、前記予測モデルのプロトタイプモデルを取得するステップと、
    前記ゲート付き回帰型ニューラルネットワークによって前記プロトタイプモデルに情報記憶ゲートを追加し、かつ前記アンサンブル学習アルゴリズムを用いて、各種別から抽出した前記訓練サンプルに基づいて、情報記憶ゲートが追加された前記プロトタイプモデルに対して2回目の深層アンサンブル学習訓練を実行することで、前記予測モデルを構築するステップと、をさらに実現する、請求項8に記載の既往歴の情報に基づく発症率の監視設備。
  10. 前記プロセッサが前記コンピュータプログラムを実行する時に、
    前記アンサンブル学習アルゴリズムによって各前記訓練サンプルに対して特徴分割の訓練を行い、第1の訓練特徴を得るステップと、
    前記第1の訓練特徴を前記プロトタイプモデルに順次入力して深層の特徴訓練を行い、複数の分岐を有する決定ツリーモデルを得て、かつ前記決定ツリーモデルを前記予測モデルとして使用するステップと、をさらに実現する、請求項9に記載の既往歴の情報に基づく発症率の監視設備。
  11. 前記プロセッサが前記コンピュータプログラムを実行する時に、
    前記既往歴データに対応する医療生態情報を取得するステップをさらに含み、前記医療生態情報には、気象データ、医療水準データ、疾病監視データのうちの少なくとも1つが含まれ、
    上述した前記第1の訓練特徴を前記プロトタイプモデルに順次入力して深層の特徴訓練を行い、複数の分岐を有する決定ツリーモデルを得るステップの後、
    前記アンサンブル学習アルゴリズムによって前記医療生態情報に対して特徴分解の訓練を行い、第2の訓練特徴を得ることと、
    前記第2の訓練特徴を前記決定ツリーモデルに入力して、3回目の深層訓練学習を行い、完全な前記予測モデルを構築することと、をさらに含む、請求項10に記載の既往歴の情報に基づく発症率の監視設備。
  12. 前記プロセッサが前記コンピュータプログラムを実行する時に、
    前記既往歴データからある期間内のカルテデータを無作為に抽出して前記予測モデルに入力し、前記期間内のカルテデータに対応する発症数の予測値を得るステップと、
    前記予測値が、前記期間内のカルテデータに対応する実際の発症データを満たしているか否かを判断し、モデル検証結果を得るステップと、
    前記モデル検証結果に応じて、前記予測モデルを最適化するための、前記2回目の深層訓練と3回目の深層訓練学習を繰り返す4回目の深層訓練を実行するか否かを決定するステップと、をさらに実現する、請求項8~11のいずれか1項に記載の既往歴の情報に基づく発症率の監視設備。
  13. 前記プロセッサが前記コンピュータプログラムを実行する時に、
    前記モデル検証結果としては前記予測値が前記実際の発症データを満たさないと判断された場合、前記既往歴データからN個のサンプルデータを抽出し、かつ前記予測モデルを訓練するための訓練サンプルを加算メカニズムにより更新および/再設定し、更新および/再設定された訓練サンプルに基づいて予測モデルを訓練するステップをさらに実現し、ここで、Nは2以上である、請求項12に記載の既往歴の情報に基づく発症率の監視設備。
  14. 前記プロセッサが前記コンピュータプログラムを実行する時に、
    前記アンサンブル学習アルゴリズムは、ランダムフォレスト学習アルゴリズムである、請求項14に記載の既往歴の情報に基づく発症率の監視設備。
  15. コンピュータ命令が記憶されており、前記コンピュータ命令がコンピュータ上で実行されると、
    疾病に関する既往歴データを取得し、予め分割された様々な年齢層に応じて前記既往歴データに対して分類区別処理を実行するステップと、
    分類区別処理後の前記既往歴データに基づいて、予め設定されたゲート付き回帰型ニューラルネットワークとアンサンブル学習アルゴリズムにより、各年齢層における既往歴データに対してモデル訓練の自律学習動作を実行し、予測対象疾病の発症率の予測と計算を実現するための予測モデルを生成するステップと、
    予測対象疾病の種類、予測対象時点、および、前記時点以前に監視された症例データを含む前記時点以前の関連データを取得し、かつ前記関連データを前記予測モデルに入力して、前記時点における予測対象疾病の発症率の予測結果を算出するステップと、をコンピュータに実行させる、コンピュータ可読記憶媒体。
  16. 前記コンピュータ命令がコンピュータ上で実行されると、
    サンプル無作為抽出法により、分類された各種別の既往歴データから少なくとも2つの訓練サンプルを抽出するステップと、
    抽出された前記訓練サンプルから1つの訓練サンプルを初期サンプルとして選択し、前記初期サンプルに基づいてモデルの初期訓練を行い、前記予測モデルのプロトタイプモデルを取得するステップと、
    前記ゲート付き回帰型ニューラルネットワークによって前記プロトタイプモデルに情報記憶ゲートを追加し、かつ前記アンサンブル学習アルゴリズムを用いて、各種別から抽出した前記訓練サンプルに基づいて、情報記憶ゲートが追加された前記プロトタイプモデルに対して2回目の深層アンサンブル学習訓練を実行することで、前記予測モデルを構築するステップと、をコンピュータに実行させる、請求項15に記載のコンピュータ可読記憶媒体。
  17. 前記コンピュータ命令がコンピュータ上で実行されると、
    前記アンサンブル学習アルゴリズムによって各前記訓練サンプルに対して特徴分割の訓練を行い、第1の訓練特徴を得るステップと、
    前記第1の訓練特徴を前記プロトタイプモデルに順次入力して深層の特徴訓練を行い、複数の分岐を有する決定ツリーモデルを得て、かつ前記決定ツリーモデルを前記予測モデルとして使用するステップと、をコンピュータに実行させる、請求項16に記載のコンピュータ可読記憶媒体。
  18. 前記コンピュータ命令がコンピュータ上で実行されると、
    前記既往歴データに対応する医療生態情報を取得するステップをコンピュータに実行させ、ここで、前記医療生態情報には、気象データ、医療水準データ、疾病監視データのうちの少なくとも1つが含まれ、
    上述した前記第1の訓練特徴を前記プロトタイプモデルに順次入力して深層の特徴訓練を行い、複数の分岐を有する決定ツリーモデルを得るステップの後、
    前記アンサンブル学習アルゴリズムによって前記医療生態情報に対して特徴分解の訓練を行い、第2の訓練特徴を得ることと、
    前記第2の訓練特徴を前記決定ツリーモデルに入力して、3回目の深層訓練学習を行い、完全な前記予測モデルを構築することと、をさらに含む、請求項17に記載のコンピュータ可読記憶媒体。
  19. 前記コンピュータ命令がコンピュータ上で実行されると、
    前記既往歴データからある期間内のカルテデータを無作為に抽出して前記予測モデルに入力し、前記期間内のカルテデータに対応する発症数の予測値を得るステップと、
    前記予測値が、前記期間内のカルテデータに対応する実際の発症データを満たしているか否かを判断し、モデル検証結果を得るステップと、
    前記モデル検証結果に応じて、前記予測モデルを最適化するための、前記2回目の深層訓練と3回目の深層訓練学習を繰り返す4回目の深層訓練を実行するか否かを決定するステップと、をコンピュータに実行させる、請求項15~18のいずれか1項に記載のコンピュータ可読記憶媒体。
  20. 疾病に関する既往歴データを取得し、予め分割された様々な年齢層に応じて前記既往歴データに対して分類区別処理を実行するための第1のデータ取得モジュールと、
    分類区別処理後の前記既往歴データに基づいて、予め設定されたゲート付き回帰型ニューラルネットワークとアンサンブル学習アルゴリズムにより、各年齢層における既往歴データに対してモデル訓練の自律学習動作を実行し、予測対象疾病の発症率の予測計算を実現するための予測モデルを生成するためのモデル訓練モジュールと、
    予測対象疾病の種類、予測対象時点、および前記時点以前に監視された症例データを含む、前記時点以前の関連データを取得し、前記関連データを前記予測モデルに入力して、前記時点における予測対象疾病の発症率の予測結果を算出するための発症予測モジュールと、を含む、既往歴の情報に基づく発症率の監視装置。
JP2021574345A 2019-08-01 2020-06-30 発症率を監視する方法、装置、設備および記憶媒体 Active JP7295278B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201910706318.4A CN110610767B (zh) 2019-08-01 2019-08-01 发病率监测方法、装置、设备及存储介质
CN201910706318.4 2019-08-01
PCT/CN2020/099450 WO2021017733A1 (zh) 2019-08-01 2020-06-30 发病率监测方法、装置、设备存储介质

Publications (2)

Publication Number Publication Date
JP2022536785A true JP2022536785A (ja) 2022-08-18
JP7295278B2 JP7295278B2 (ja) 2023-06-20

Family

ID=68889766

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021574345A Active JP7295278B2 (ja) 2019-08-01 2020-06-30 発症率を監視する方法、装置、設備および記憶媒体

Country Status (4)

Country Link
US (1) US20220254513A1 (ja)
JP (1) JP7295278B2 (ja)
CN (1) CN110610767B (ja)
WO (1) WO2021017733A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110610767B (zh) * 2019-08-01 2023-06-02 平安科技(深圳)有限公司 发病率监测方法、装置、设备及存储介质
CN111274305B (zh) * 2020-01-15 2023-03-31 深圳平安医疗健康科技服务有限公司 三维图片的生成方法、装置、计算机设备和存储介质
CN111309852B (zh) * 2020-03-16 2021-09-03 青岛百洋智能科技股份有限公司 生成可视化决策树集模型的方法、系统、装置及存储介质
CN111554408B (zh) * 2020-04-27 2024-04-19 中国科学院深圳先进技术研究院 城市内部登革热时空预测方法、系统及电子设备
JP2022018415A (ja) * 2020-07-15 2022-01-27 キヤノンメディカルシステムズ株式会社 医用データ処理装置及び方法
CN112712903A (zh) * 2021-01-15 2021-04-27 杭州中科先进技术研究院有限公司 一种基于人机物三元空间协同感知的传染病监测方法
CN113057586B (zh) * 2021-03-17 2024-03-12 上海电气集团股份有限公司 一种病症预警方法、装置、设备及介质
CN113628703B (zh) * 2021-07-20 2024-03-29 慕贝尔汽车部件(太仓)有限公司 职业健康档案管理方法、系统和网络测服务端
CN113658718B (zh) * 2021-08-20 2024-02-27 清华大学 一种个体疫情防控方法及系统
CN117334331B (zh) * 2023-10-25 2024-04-09 浙江丰能医药科技有限公司 基于人工智能的健康状况医学诊断系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108288502A (zh) * 2018-04-11 2018-07-17 平安科技(深圳)有限公司 疾病预测方法及装置、计算机装置及可读存储介质
JP2018526697A (ja) * 2015-07-27 2018-09-13 グーグル エルエルシー 再帰型ニューラルネットワークを使用する健康イベントの分析
WO2018221689A1 (ja) * 2017-06-01 2018-12-06 株式会社ニデック 医療情報処理システム
CN109063911A (zh) * 2018-08-03 2018-12-21 天津相和电气科技有限公司 一种基于门控循环单元网络的负荷聚合体分组预测方法
JP2019016235A (ja) * 2017-07-07 2019-01-31 株式会社エヌ・ティ・ティ・データ 疾病発症予測装置、疾病発症予測方法およびプログラム
JP2019074969A (ja) * 2017-10-17 2019-05-16 新日鐵住金株式会社 品質予測装置及び品質予測方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10332637B2 (en) * 2013-02-15 2019-06-25 Battelle Memorial Institute Use of web-based symptom checker data to predict incidence of a disease or disorder
US20180211010A1 (en) * 2017-01-23 2018-07-26 Ucb Biopharma Sprl Method and system for predicting refractory epilepsy status
CN109545386B (zh) * 2018-11-02 2021-07-20 深圳先进技术研究院 一种基于深度学习的流感时空预测方法及装置
CN109545385A (zh) * 2018-11-30 2019-03-29 周立广 一种基于物联网的医疗大数据分析处理系统及其方法
CN109656918A (zh) * 2019-01-04 2019-04-19 平安科技(深圳)有限公司 流行病发病指数的预测方法、装置、设备及可读存储介质
CN110610767B (zh) * 2019-08-01 2023-06-02 平安科技(深圳)有限公司 发病率监测方法、装置、设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018526697A (ja) * 2015-07-27 2018-09-13 グーグル エルエルシー 再帰型ニューラルネットワークを使用する健康イベントの分析
WO2018221689A1 (ja) * 2017-06-01 2018-12-06 株式会社ニデック 医療情報処理システム
JP2019016235A (ja) * 2017-07-07 2019-01-31 株式会社エヌ・ティ・ティ・データ 疾病発症予測装置、疾病発症予測方法およびプログラム
JP2019074969A (ja) * 2017-10-17 2019-05-16 新日鐵住金株式会社 品質予測装置及び品質予測方法
CN108288502A (zh) * 2018-04-11 2018-07-17 平安科技(深圳)有限公司 疾病预测方法及装置、计算机装置及可读存储介质
CN109063911A (zh) * 2018-08-03 2018-12-21 天津相和电气科技有限公司 一种基于门控循环单元网络的负荷聚合体分组预测方法

Also Published As

Publication number Publication date
WO2021017733A1 (zh) 2021-02-04
US20220254513A1 (en) 2022-08-11
CN110610767B (zh) 2023-06-02
CN110610767A (zh) 2019-12-24
JP7295278B2 (ja) 2023-06-20

Similar Documents

Publication Publication Date Title
JP7295278B2 (ja) 発症率を監視する方法、装置、設備および記憶媒体
Zeng et al. Artificial intelligence–enabled public health surveillance—from local detection to global epidemic monitoring and control
Appice et al. A multi-stage machine learning approach to predict dengue incidence: a case study in Mexico
Mahalle et al. Data analytics: Covid-19 prediction using multimodal data
Nelli et al. Achieving explanatory depth and spatial breadth in infectious disease modelling: integrating active and passive case surveillance
Deepika et al. Relief-F and Budget Tree Random Forest Based Feature Selection for Student Academic Performance Prediction.
Frey et al. Modeling ecological success of common pool resource systems using large datasets
Casalino et al. Exploiting time in adaptive learning from educational data
Turgut et al. A framework proposal for machine learning-driven agent-based models through a case study analysis
Bali et al. Life Expectancy: Prediction & Analysis using ML
Constantinou et al. Open problems in causal structure learning: A case study of COVID-19 in the UK
Papadimitriou et al. Needs and priorities of road safety stakeholders for evidence-based policy making
Li et al. Classifying crowdsourced mobile test reports with image features: An empirical study
Ronmi et al. How can artificial intelligence and data science algorithms predict life expectancy-An empirical investigation spanning 193 countries
Mbunge et al. Machine learning techniques for predicting malaria: Unpacking emerging challenges and opportunities for tackling malaria in sub-saharan Africa
Maulana et al. Leveraging Artificial Intelligence to Predict Student Performance: A Comparative Machine Learning Approach
Kariyapperuma et al. Classification of Covid19 vaccine-related tweets using deep learning
Balakumar et al. Dengue outbreak and severity prediction: current methods and the future scope
Romney et al. Curriculum for hands-on artificial intelligence cybersecurity
Edali et al. Analysis of an individual‐based influenza epidemic model using random forest metamodels and adaptive sequential sampling
Nangia et al. A machine learning approach to identify the students at the risk of dropping out of secondary education in India
Fantechi et al. Learning from the past: a machine-learning approach for predicting the resilience of locked-in regions after a natural shock
Wang Prediction Analysis of College Students’ Physical Activity Behavior by Improving Gray Wolf Algorithm and Support Vector Machine
Kumar et al. Predictive analysis of novel coronavirus using machine learning model-a graph mining approach
Ingle et al. Identification of Vector Borne Disease Spread Using Big Data Analysis

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211214

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230124

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20230316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230410

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230608

R150 Certificate of patent or registration of utility model

Ref document number: 7295278

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150