JP7433541B2 - 多中心医学診断知識グラフ表示学習方法及びシステム - Google Patents

多中心医学診断知識グラフ表示学習方法及びシステム Download PDF

Info

Publication number
JP7433541B2
JP7433541B2 JP2023535611A JP2023535611A JP7433541B2 JP 7433541 B2 JP7433541 B2 JP 7433541B2 JP 2023535611 A JP2023535611 A JP 2023535611A JP 2023535611 A JP2023535611 A JP 2023535611A JP 7433541 B2 JP7433541 B2 JP 7433541B2
Authority
JP
Japan
Prior art keywords
medical
knowledge graph
server
codes
disease classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023535611A
Other languages
English (en)
Other versions
JP2023547562A (ja
Inventor
▲勁▼松 李
▲勝▼▲強▼ 池
雨 田
天舒 周
Original Assignee
之江実験室
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 之江実験室 filed Critical 之江実験室
Publication of JP2023547562A publication Critical patent/JP2023547562A/ja
Application granted granted Critical
Publication of JP7433541B2 publication Critical patent/JP7433541B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/322Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/008Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Description

本発明は、医療情報技術分野に属し、特に多中心医学診断知識グラフ表示学習方法及びシステムに属する。
知識グラフは、構造化の形式で客観世界における概念、エンティティ及びそれらの関係を記述し、情報を人間の認知世界により近い形式で表現し、情報をより適切に整理、管理及び理解する能力を提供し、知識のマイニング、分析、知識間の相互関係の構築、描写及び表示に使用できる。表示学習は、研究対象の意味情報を密な低次元のエンティティベクトルとして表示することを目的とする。知識グラフ表示学習は、主に知識グラフにおけるエンティティ及び関係を表示学習し、大規模な知識グラフ及び原データの学習と訓練により、知識の低次元の密な空間での分布ベクトル表示を取得することができ、エンティティと関係の意味情報を表示し、知識の算出と推理を容易にする。
医学本体を利用して階層化臨床構造と医学概念との間の関係をエンコードし、大量のデータに対する需要を減少することができ、情報を失うことなく検索空間を効果的に減少する。幸いなことに、医療保健分野には多くの組織の良好な本体があり、例えば、国際疾患分類(ICD)、臨床分類ソフトウェア(CCS)または医学臨床用語システム化命名(SNOMED)がある。医学本体において、互いに近いノード(すなわち、医学概念)は、類似する患者に関連する可能性が高く、これにより、我々はそれらの間で知識を伝達することができる。データ量がディープ学習モデルを訓練するのに不十分である場合、医学本体を使用することは有用である可能性がある。さらにデータ量が十分である場合、情報を損失しない前提で、モデルを簡略化する方法として、学習により本体構造に適合するより多くの解釈可能な表現が得られる。
医療知識グラフ構造情報に基づく知識表示学習モデルは、複雑な関係モデリングとデータの希薄性による意味表現能力低下などの問題を解決できない。既存の研究作業は、知識グラフ自体構造以外の大量のテキスト情報を利用し、知識グラフ構造情報を拡張してデータの希薄性による影響を低減する。従来方法は、データに固有の構造及び相関情報を無視している。また、プライバシー保護及びデータ安全の前提でデータ量を拡張し、知識表示学習に使用する方法が欠いている。
本発明は、従来技術の欠点に対して、多中心医学診断知識グラフ表示学習方法及びシステムを提出し、各医療機構参加者のデータプライバシーと安全を保護する前提で、多中心データを利用し、データ密度を高め、また、大規模な知識グラフ及び原データを学習する過程において、知識源における人間の認知に適合する階層情報と複雑な関連関係を統合し、データ間の相関関係をマイニングし、意味情報を豊かにし、これにより、データの希薄性による意味表現能力低下の問題を解決する。
本発明の目的は、以下の技術的解決手段により実現される。
本発明の一様態は、多中心医学診断知識グラフ表示学習方法を開示しており、当該方法は、連合学習と同型暗号化に基づき、多中心データを利用し、階層情報と複雑な関連関係を組み合わせて、構造情報の知識表示学習を実現し、具体的に、ステップ1~ステップ5を含み、
前記ステップ1では、第1のサーバがグローバル医学診断知識グラフを構築し、前記グローバル医学診断知識グラフが有向非巡回グラフの形式で医学診断概念の階層構造を表現し、リーフノードと祖先ノードの2つの部分で構成され、前記リーフノードが最も小さい疾患分類コードであり、その祖先ノードがリーフノード疾患分類コードに対応する上層疾患分類コードであり、
前記ステップ2では、第1のサーバが構築されたグローバル医学診断知識グラフを各医療機構参加者に配信し、
前記ステップ3では、各医療機構参加者の内部で疾患診断共起情報統計を行うステップであって、具体的には、
ある医療機構参加者電子カルテにおける全ての疾患分類コードの集合を
Figure 0007433541000001
として記し、総計で|C|種の疾患分類コードがあり、医療機構参加者の各患者のカルテを複数回診療とみなし、
Figure 0007433541000002
として記し、総計でT回診療し、毎回診療する疾患分類コードセットをVとして記し、Vにおける各疾患分類コードの上層疾患分類コードをVに加入し、強化疾患分類コードセットを取得してV’として記し、V’におけるコードの任意の2つを組み合わせてコードペアを構成し、コードペアの共起情報を算出することと、医学診断知識グラフにおける全ての疾患分類コードの集合を
Figure 0007433541000003
として記し、総計でN種の疾患分類コードがある(
Figure 0007433541000004
)ことと、当該医療機構参加者が医学診断知識グラフにおける全ての疾患分類コードに基づいて共起マトリックスMを構築し、共起マトリックスMの第i行の第j列の元素Mijが2つのコード
Figure 0007433541000005

Figure 0007433541000006
の共起情報
Figure 0007433541000007
を表現し、pが当該医療機構参加者における患者総数を表現し、m ijが2つのコード
Figure 0007433541000008

Figure 0007433541000009
の患者pのある回で診療する強化疾患分類コードセットV’における共起情報を表すこととを含み、
前記ステップ4では、データ暗号化算出であって、第2のサーバが暗号化アルゴリズム、暗号化キー、復号化アルゴリズム及び復号化キーを生成し、かつ暗号化アルゴリズム及び暗号化キーを各医療機構参加者に配信することと、各医療機構参加者が暗号化アルゴリズム及び暗号化キーを用いてその共起マトリックスを暗号化して第1のサーバにアップロードすることと、第1のサーバが暗号文状態において、同じ2つのコードの共起情報を加算し、暗号文状態におけるグローバル共起マトリックスを取得して、第2のサーバに送信することと、第2のサーバが復号化アルゴリズム及び復号化キーによりグローバル共起マトリックスを取得し、第1のサーバに返信することと、を含み、
前記ステップ5では、知識表示学習であって、第1のサーバにおいて、各疾患分類コードを実数からなる1つの表現ベクトルとして表現し、以下の目標関数Jを作成し、
Figure 0007433541000010
ここで、WとWがそれぞれコード
Figure 0007433541000011

Figure 0007433541000012
の表現ベクトルであり、bとbがそれぞれ2つの表現ベクトルのバイアス項であり、Xijがグローバル共起マトリックスにおけるコード
Figure 0007433541000013

Figure 0007433541000014
の共起情報を表現し、fが重み関数であることと、
収束するまで目標関数を最適化し、2つの表現ベクトルWとWを取得することとを含む。
さらに、前記第1のサーバ及び第2のサーバがいずれも第3者のサーバであり、第3者のサーバが正直である必要があり、第3者のサーバの間は相互に通信することができ、各医療機構参加者の内部にそれぞれの電子カルテデータベースが配備され、電子カルテデータベースにおける原データが各医療機構参加者から離れることは、許可されず、各医療機構参加者の間は相互通信を直接的に行うことができず、第3者のサーバと通信しかできない。
さらに、グローバル医学診断知識グラフを構築する過程において、使用される医学診断本体がICD、CCS、SNOMEDを含む。
さらに、構築された医学診断知識グラフが辞書形式で記憶され、辞書における各元素が1つの疾患の階層構造情報を記録する。
さらに、強化疾患分類コードセットV’の構築は具体的に、医学診断知識グラフにおいてリーフノードに対応する祖先ノードをルックアップし、共同祖先ノードに対応する上層疾患分類コードをVに繰り返して加入する必要がある。
さらに、前記ステップ3において、あるコードペアにおける2つのコードc、cについて、コードペアの共起情報算出式が下記の通りであり、
Figure 0007433541000015
ここで、
Figure 0007433541000016
がV’にcの出現する回数であり、
Figure 0007433541000017
がV’にcの出現する回数であり、dijが2つのコードc、c間の距離であり、
Figure 0007433541000018
がコードペアの共起情報である。
さらに、前記ステップ3において、m ijの算出は具体的に、2つのコード
Figure 0007433541000019

Figure 0007433541000020
が患者pのある回で診療する強化疾患分類コードセットV’に同時に出現した場合、当該患者のこの回のV’においてコードcがコード
Figure 0007433541000021
に等しいことを見つけ、コードcがコード
Figure 0007433541000022
に等しいことを見つけることができ、m ij
Figure 0007433541000023
に等しく、そうでない場合、m ijが0に等しい。
さらに、前記ステップ4は具体的に、
K個の医療機構参加者のK個の共起マトリックスを
Figure 0007433541000024
として記し、任意の2つのコード
Figure 0007433541000025

Figure 0007433541000026
の共起情報を
Figure 0007433541000027
として記することと、
第2のサーバが加法同型暗号化アルゴリズムを利用して暗号化アルゴリズムENC、復号化アルゴリズムDEC、暗号化キーKEY及び復号化キーKEYを取得し、暗号化アルゴリズムENC及び暗号化キーKEYを各医療機構参加者に送信することと、
安全加法重合を実現する過程において、任意の2つのコードの共起情報に対して、各医療機構参加者がまず共起情報を暗号文として暗号化し、
Figure 0007433541000028
として記し、そして暗号文を第1のサーバに送信することと、
第1のサーバが直接に暗号文を操作することと、加法同型性によれば、暗号文の積を算出するだけでよく、2つのコード
Figure 0007433541000029

Figure 0007433541000030
の暗号化後の共起情報EncXij式が下記の通りであり、
Figure 0007433541000031
医学診断知識グラフにおける任意の2つの疾患分類コードについて、いずれも暗号文状態における2つのコード共起情報を算出し、最終的に暗号文状態におけるグローバル共起マトリックスEncXを取得することと、
第1のサーバがEncXを第2のサーバに送信し、第2のサーバが復号化を取得してグローバル共起マトリックスX、すなわち、
Figure 0007433541000032
を取得して、第1のサーバに返信することと、を含む。
さらに、前記ステップ5において、fが以下のセグメント関数を採用し、
Figure 0007433541000033
ここで、MAXとαがいずれもハイパーパラメータであり、実験結果に応じて最適な値を設定し、共起情報がMAXを超えた後、f(Xij)が1である一定のレベルを維持する。
本発明の別の様態は、多中心医学診断知識グラフ表示学習システムを開示しており、当該システムは、グローバル医学診断知識グラフ構築モジュール、医学診断知識グラフ配信モジュール、疾患診断共起情報統計モジュール、データ暗号化算出モジュール及び知識表示学習モジュールを含み、
前記グローバル医学診断知識グラフ構築モジュールは、第1のサーバ上でグローバル医学診断知識グラフを構築することに用いられ、前記グローバル医学診断知識グラフが有向非巡回グラフの形式で医学診断概念の階層構造を表現し、リーフノードと祖先ノードの2つの部分で構成され、前記リーフノードが最も小さい疾患分類コードであり、その祖先ノードがリーフノード疾患分類コードに対応する上層疾患分類コードであり、
前記医学診断知識グラフ配信モジュールは、第1のサーバで構築されたグローバル医学診断知識グラフを各医療機構参加者に配信し、
前記疾患診断共起情報統計モジュールは、各医療機構参加者に配備することと、ある医療機構参加者電子カルテにおける全ての疾患分類コードの集合を
Figure 0007433541000034
として記し、総計で|C|種の疾患分類コードがあり、医療機構参加者の各患者のカルテを複数回診療とみなし、
Figure 0007433541000035
として記し、総計でT回診療し、毎回診療する疾患分類コードセットをVとして記し、Vにおける各疾患分類コードの上層疾患分類コードをVに加入し、強化疾患分類コードセットを取得してV’として記することと、V’におけるコードの任意の2つを組み合わせてコードペアを構成し、コードペアの共起情報を算出することと、医学診断知識グラフにおける全ての疾患分類コードの集合を
Figure 0007433541000036
として記し、総計でN種の疾患分類コードがある(
Figure 0007433541000037
)ことと、当該医療機構参加者が医学診断知識グラフにおける全ての疾患分類コードに基づいて共起マトリックスMを構築し、共起マトリックスMの第i行の第j列の元素Mijが2つのコード
Figure 0007433541000038

Figure 0007433541000039
の共起情報
Figure 0007433541000040
を表現し、Pが当該医療機構参加者における患者総数を表現し、m ijが2つのコード
Figure 0007433541000041

Figure 0007433541000042
の患者Pのある回で診療する強化疾患分類コードセットV’における共起情報を表すこととに使用され、
前記データ暗号化算出モジュールは、第2のサーバが暗号化アルゴリズム、暗号化キー、復号化アルゴリズム及び復号化キーを生成し、かつ暗号化アルゴリズム及び暗号化キーを各医療機構参加者に配信することと、各医療機構参加者が暗号化アルゴリズム及び暗号化キーを用いてその共起マトリックスを暗号化して第1のサーバにアップロードすることと、第1のサーバが暗号文状態において、同じ2つのコードの共起情報を加算し、暗号文状態におけるグローバル共起マトリックスを取得して、第2のサーバに送信することと、第2のサーバが復号化アルゴリズム及び復号化キーによりグローバル共起マトリックスを取得し、第1のサーバに返信することとに使用され、
前記知識表示学習モジュールは、第1のサーバに配備され、各疾患分類コードを実数からなる1つの表現ベクトルとして表現し、以下の目標関数Jを作成し、
Figure 0007433541000043
ここで、WとWがそれぞれコード
Figure 0007433541000044

Figure 0007433541000045
の表現ベクトルであり、bとbがそれぞれ2つの表現ベクトルのバイアス項であり、Xijがグローバル共起マトリックスにおけるコード
Figure 0007433541000046

Figure 0007433541000047
の共起情報を表現し、fが重み関数であることと、
収束するまで目標関数を最適化し、2つの表現ベクトルWとWを取得することとにに使用される。
本発明の有益な効果としては、
1.既存の医学診断本体(ICD、CCS、SNOMED等)に基づき、有向非巡回グラフの形式で医学診断概念の階層構造を表現し、グローバル医学診断知識グラフを構築する。グローバル医学診断知識グラフを利用して、全ての疾患分類コードの共起マトリックスを構築し、各ペアのコードの共起情報を算出し、同時に出現するコードペアが多く、距離が近いほど、共起情報が大きくなる。
2.連合学習に基づき、各医療機構参加者のデータプライバシーと安全を保護する前提で、多中心データを利用し、共起情報を加算し、データ密度を高め、データ希薄性の問題を解決する。
3.大規模な知識グラフ及び原データを学習する過程において、知識源における人間の認知に適切する階層情報と複雑な関連関係を統合し、データ間の相関関係をマイニングし、意味情報を豊かにし、知識の高品質表現形態を学習し、知識の算出と推理を容易にする。
本発明の実施例による多中心医学診断知識グラフ表示学習方法のネットワークアーキテクチャ概略図である。 本発明の実施例による多中心医学診断知識グラフ表示学習方法の実現フローチャートである。 本発明の実施例による医学診断知識グラフ構造示例である。
本発明の上記目的、特徴及び利点をより分かりやすくするために、以下、図面を参照して本発明の実施形態を詳細に説明する。
本発明を十分に理解するために、以下の説明では、多くの具体的な詳細が記載されているが、本発明は、ここで説明するものとは異なる他の方式で実施することもでき、当業者は、本発明の意味合いに違反することなく、同様の拡張を行うことができるため、本発明は、以下に開示される具体的な実施例に限定されない。
本発明は、多中心医学診断知識グラフ表示学習方法を提供し、当該方法は、連合学習と同型暗号化に基づき、多中心データを利用し、階層情報と複雑な関連関係を組み合わせて、構造情報の知識表示学習を実現する。当該方法は、図1に示すネットワークアーキテクチャに基づくものであり、2つの第3者のサーバ(第1のサーバと第2のサーバ)と複数の医療機構参加者を含み、第3者のサーバが正直である必要があり、第3者のサーバの間は相互通信することができる。各医療機構参加者の内部にそれぞれの電子カルテデータベースが配備され、電子カルテデータベースにおける原データが各医療機構参加者から離れることは、許可されない。各医療機構参加者の間は相互通信を直接的に行うことができず、第3者のサーバと通信しかできない。
図2に示すように、本実施例による多中心医学診断知識グラフ表示学習方法のステップは、下記の通りである。
1.グローバル医学診断知識グラフ構築
第1のサーバがグローバル医学診断知識グラフの構築を担当する。グローバル医学診断知識グラフは、有向非巡回グラフの形式で医学診断概念の階層構造を表現する。グローバル医学診断知識グラフリーフノードと祖先ノードの2つの部分で構成され、ここでリーフノードが最も小さい疾患分類コードであり、その祖先ノードがリーフノード疾患分類コードに対応する上層疾患分類コードである。
本実施例においてICD10を医学診断本体として使用し、グローバル医学診断知識グラフを構築する。ここで、医学診断本体は、さらにCCS、SNOMEDなどの医学分野で常用される知識源を選択してもよい。ウイルス性咽頭炎を例とし、ウイルス性咽頭炎J02.801がリーフノードであり、ICD10における疾患階層情報に基づき、図3に示すように、その祖先ノードである呼吸器疾患J00-J99、急性上気道感染J00-J06、急性咽頭炎J02を構築する。
構築された医学診断知識グラフが辞書形式で記憶され、辞書における各元素が1つの疾患の階層構造情報を記録する。ウイルス性咽頭炎を例とし、階層構造情報を{J02.801:[J02.801,root,J00-J99,J00-J06,J02]}として記憶し、rootがルートノードを代表する。
2.医学診断知識グラフ配信
第1のサーバが構築されたグローバル医学診断知識グラフを各医療機構参加者に配信する。知識グラフは公開されて取得されるため、暗号化されていなくてもよい。
3.各医療機構参加者の内部で疾患診断共起情報統計を行う
各医療機構参加者電子カルテにおける全ての疾患分類コードの集合を
Figure 0007433541000048
として記し、総計で|C|種の疾患分類コードがある。当該医療機構参加者の各患者のカルテを複数回診療とみなし、
Figure 0007433541000049
として記し、総計でT回診療し、毎回診療する疾患分類コードセットをVとして記する。
医療機構参加者は、1回の診療Vを単位とし、Vに各疾患分類コードの上層疾患分類コードを加入することにより、強化疾患分類コードセットを取得してV’として記し、すなわち、医学診断知識グラフにおいてリーフノードに対応する祖先ノードをルックアップし、共同祖先ノードに対応する上層疾患分類コードを繰り返して加入する必要がある。
各疾患分類コード及びその上層疾患分類コードのV’における出現回数を算出する。V’におけるコードの任意の2つを組み合わせてコードペアを構成し、コードペアにおける2つのコードの出現回数を乗算することにより、当該コードペアの共起情報を算出する。同時に、コードペアにおける2つのコード間の距離を算出し、すなわち、2つのノードを接続する最短経路に含まれるエッジの数を算出し、距離の逆数を重みとする。
あるコードペアにおける2つのコードc、cに対して、コードペアの共起情報は、下記の通りであり、
Figure 0007433541000050
ここで、
Figure 0007433541000051
がV’にcの出現する回数であり、
Figure 0007433541000052
がV’にcの出現する回数であり、dijが2つのコードc、c間の距離であり、
Figure 0007433541000053
がコードペアの共起情報である。
医学診断知識グラフにおける全ての疾患分類コードの集合を
Figure 0007433541000054
として記し、総計でN種の疾患分類コードがある(
Figure 0007433541000055
)。当該医療機構参加者が医学診断知識グラフにおける全ての疾患分類コードに基づいて共起マトリックスMを構築し、表1に示す通りである。Mijが2つのコード
Figure 0007433541000056

Figure 0007433541000057
の共起情報
Figure 0007433541000058
を表現し、Pが当該医療機構参加者中患者の総数を表現し、m ijが2つのコード
Figure 0007433541000059

Figure 0007433541000060
の患者pのある回で診療する強化疾患分類コードセットV’における共起情報を表現し、2つのコード
Figure 0007433541000061

Figure 0007433541000062
が患者pのある回で診療する強化疾患分類コードセットV’に同時に出現した場合、当該患者のこの回のV’においてコードcがコード
Figure 0007433541000063
に等しいことを見つけ、コードcがコード
Figure 0007433541000064
に等しいことを見つけることができ、m ij
Figure 0007433541000065
に等しく、そうでない場合、0として記する。共起マトリックスMが対称し、MijとMjiとが等しく、対角線が同じ疾患分類コードの共起情報であり、0として記する。
表1共起マトリックス構造示例
Figure 0007433541000066
図3の医学診断知識グラフを例とし、仮に患者のある回で診療する疾患診断がウイルス性咽頭炎及び急性喉頭炎であるとすると、V=[J02.801,J04.000]であり、上層疾患分類コードを加入することにより、V’=[J02.801,J02,J00-J06,J00-J99,root,J04.000,J04,J00-J06,J00-J99,root]として強化し、コードJ02.801の出現回数が1、J00-J06の出現回数が2、両者間の距離が2、共起情報の値が1である。
4.データ暗号化算出
第2のサーバが暗号化アルゴリズム、暗号化キー、復号化アルゴリズム及び復号化キーを生成し、かつ暗号化アルゴリズム及び暗号化キーを各医療機構参加者に配信する。各医療機構参加者が暗号化アルゴリズム及び暗号化キーを用いてその共起マトリックスを暗号化して第1のサーバにアップロードする。第1のサーバが暗号文状態において、同じ2つのコードの共起情報を加算し、暗号文状態におけるグローバル共起マトリックスを取得して、第2のサーバに送信する。第2のサーバが復号化アルゴリズム及び復号化キーによりグローバル共起マトリックスを取得し、第1のサーバに返信する。プロセス全体でデータリークのリスクはない。具体的な実現流れは下記の通りである。
K個の医療機構参加者のK個の共起マトリックスを
Figure 0007433541000067
として記し、任意の2つのコード
Figure 0007433541000068

Figure 0007433541000069
の共起情報を
Figure 0007433541000070
として記する。
第2のサーバが加法同型暗号化アルゴリズムを利用して暗号化アルゴリズムENC、復号化アルゴリズムDEC、暗号化キーKEY及び復号化キーKEYを取得し、暗号化アルゴリズムENC及び暗号化キーKEYを各医療機構参加者に送信する。
次に、安全加法重合を実現する過程において、任意の2つのコードの共起情報に対して、各医療機構参加者がまず共起情報を暗号文として暗号化し、
Figure 0007433541000071
として記し、そして暗号文を第1のサーバに送信する。
第1のサーバは復号化操作を実行しないが、暗号文を直接操作する。加法同型性によれば、暗号文の積を算出するだけでよく、2つのコード
Figure 0007433541000072

Figure 0007433541000073
暗号化後の共起情報EncXij式が下記の通りであり、
Figure 0007433541000074

医学診断知識グラフにおける任意の2つの疾患分類コードについて、何れも上記ステップに従って、暗号文状態における2つのコード共起情報を算出し、最終的に暗号文状態におけるグローバル共起マトリックスEncXを取得する。第1のサーバがEncXを第2のサーバに送信し、第2のサーバが復号化してグローバル共起マトリックスX、すなわち、
Figure 0007433541000075
を取得し、第1のサーバに返信する。
5.知識表示学習
第1のサーバにおいて、GloVeアルゴリズム原理によれば、各疾患分類コードを実数からなる1つの表現ベクトルとして表現し、当該表現ベクトルとグローバル共起マトリックスの間の関係は以下の通り表現し、
Figure 0007433541000076
ここで、WとWがそれぞれ最終的に求める必要がある疾患分類コード
Figure 0007433541000077

Figure 0007433541000078
の表現ベクトルであり、128次元の、値が-0.1~0.1間のランダムベクトルにランダムに初期化される。上付き文字Tが転置操作を表現する。bとbがそれぞれ2つの表現ベクトルのバイアス項であり、初期値が0である。Xijがグローバル共起マトリックスXにおけるコード
Figure 0007433541000079

Figure 0007433541000080
の共起情報を表現する。
上記式に基づき、目標関数Jを作成し、
Figure 0007433541000081
ここで、fが重み関数である。共起の多いコードペアがより高い重みを得るために、fが非減少関数であり、同時に、この重みが大きすぎてはならず、一定のレベルに達した後に増加してはならない。2つのコード
Figure 0007433541000082

Figure 0007433541000083
が一緒に出現しない場合、すなわち、Xij=0の場合、それらは目標関数の算出に参加せず、すなわち、
Figure 0007433541000084
である。以上の要求に基づき、fが以下のセグメント関数を採用し、
Figure 0007433541000085
すなわち、共起情報がしきい値MAXを超えた後、その重みが1である一定のレベルを維持する。ハイパーパラメータMAX及びαが実験結果に応じて最適な値を設定し、それぞれ100及び0.75に設定してもよい。
目標関数最適化過程がAdaDelta勾配降下アルゴリズムを採用し、グローバル共起マトリックスXにおける元素をランダムサンプリングし、学習率を0.05として設定し、収束するまで50回反復し、2つの表現ベクトルWとWを取得する。
知識グラフ表示学習によって得られた表現ベクトルは、疾患間の類似性を算出するために使用できるだけでなく、それを患者カルテと組み合わせて、ディープ学習モデルに統合して予測タスクを完成することもできる。例えば、患者の履歴診療記録に基づき、次回の診療に出現する可能性がある疾患を予測する。電子カルテにおいて、各患者のカルテ記録を複数回診療とみなすことができ、毎回診療には一連の疾患分類コード、すなわち、C’のサブセットが含まれる。患者のある回で診療する疾患分類コードセットがバイナリベクトル
Figure 0007433541000086
として表現してもよく、ここで、i番目の元素は当該患者のこの回の診療にコード
Figure 0007433541000087
が出現しているか否かを代表し、出現している場合、1であり、そうでない場合、0である。ディープ学習モデル訓練において、患者の毎回診療するバイナリベクトルxと表現ベクトルとを乗算して非線形変換を行い、RNN予測モデルの入力として、次回の診療する疾患分類コードを予測取得して、出現する可能性がある疾患を予測することができる。
本発明の実施例は、多中心医学診断知識グラフ表示学習システムをさらに提供し、当該システムは、
第1のサーバ上でグローバル医学診断知識グラフを構築するためのものであって、前記グローバル医学診断知識グラフが有向非巡回グラフの形式で医学診断概念の階層構造を表現し、リーフノードと祖先ノードの2つの部分で構成され、前記リーフノードが最も小さい疾患分類コードであり、その祖先ノードがリーフノード疾患分類コードに対応する上層疾患分類コードであるグローバル医学診断知識グラフ構築モジュールと、
第1のサーバで構築されたグローバル医学診断知識グラフを各医療機構参加者に配信するための医学診断知識グラフ配信モジュールと、
各医療機構参加者に配備することと、ある医療機構参加者電子カルテにおける全ての疾患分類コードの集合を
Figure 0007433541000088
として記し、総計で|C|種の疾患分類コードがあり、医療機構参加者の各患者のカルテを複数回診療とみなし、
Figure 0007433541000089
として記し、総計でT回診療し、毎回診療する疾患分類コードセットをVとして記し、Vにおける各疾患分類コードの上層疾患分類コードをVに加入し、強化疾患分類コードセットを取得してV’として記することと、V’におけるコードの任意の2つを組み合わせてコードペアを構成し、コードペアの共起情報を算出することと、医学診断知識グラフにおける全ての疾患分類コードの集合を
Figure 0007433541000090
として記し、総計でN種の疾患分類コードがある(
Figure 0007433541000091
)ことと、当該医療機構参加者が医学診断知識グラフにおける全ての疾患分類コードに基づいて共起マトリックスMを構築し、共起マトリックスMの第i行の第j列の元素Mijが2つのコード
Figure 0007433541000092

Figure 0007433541000093
の共起情報
Figure 0007433541000094
を表現し、Pが当該医療機構参加者における患者総数を表現し、m ijが2つのコード
Figure 0007433541000095

Figure 0007433541000096
の患者Pのある回で診療する強化疾患分類コードセットV’における共起情報を表現することとに使用される疾患診断共起情報統計モジュールと、
第2のサーバが暗号化アルゴリズム、暗号化キー、復号化アルゴリズム及び復号化キーを生成し、かつ暗号化アルゴリズム及び暗号化キーを各医療機構参加者に配信することと、各医療機構参加者が暗号化アルゴリズム及び暗号化キーを用いてその共起マトリックスを暗号化して第1のサーバにアップロードすることと、第1のサーバが暗号文状態において、同じ2つのコードの共起情報を加算し、暗号文状態におけるグローバル共起マトリックスを取得して、第2のサーバに送信することと、第2のサーバが復号化アルゴリズム及び復号化キーによりグローバル共起マトリックスを取得し、第1のサーバに返信することとに使用されるデータ暗号化算出モジュールと、
第1のサーバに配備され、各疾患分類コードを実数からなる1つの表現ベクトルとして表現し、以下の目標関数Jを作成し、
Figure 0007433541000097
ここで、WとWがそれぞれコード
Figure 0007433541000098

Figure 0007433541000099
の表現ベクトルであり、bとbがそれぞれ2つの表現ベクトルのバイアス項であり、Xijがグローバル共起マトリックスにおけるコード
Figure 0007433541000100

Figure 0007433541000101
の共起情報を表現し、fが重み関数であることと、
収束するまで目標関数を最適化し、2つの表現ベクトルWとWを取得することとに使用される知識表示学習モジュールと、
を備える。
以上は、本発明の好ましい実施形熊だけであり、本発明は好ましい実施例で以上のように開示されているが、本発明を限定するものではない。当業者であれば、本発明の技術的解決手段の範囲から逸脱することなく、上記開示された方法及び技術内容を利用して本発明の技術的解決手段に対して多くの可能な変動及び修飾を行い、又は同等変化の等価実施例に修正することができる。したがって、本発明の技術的解決手段の内容から逸脱せず、本発明の技術的思想に基ついて以上の実施例に対して行われたいかなる簡単な修正、同等変化及び修飾は、いずれも依然として本発明の技術的解決手段の保護範囲内に属する。

Claims (10)

  1. グローバル医学診断知識グラフ構築モジュール、医学診断知識グラフ配信モジュール、疾患診断共起情報統計モジュール、データ暗号化算出モジュール及び知識表示学習モジュールを含む多中心医学診断知識グラフ表示学習システムにより実行される多中心医学診断知識グラフ表示学習方法であって、ステップ1~ステップ5を含み、
    前記ステップ1では、前記グローバル医学診断知識グラフ構築モジュールは第1のサーバを介してグローバル医学診断知識グラフを構築し、前記グローバル医学診断知識グラフが有向非巡回グラフの形式で医学診断概念の階層構造を表現し、リーフノードと祖先ノードの2つの部分で構成され、前記リーフノードが最も小さい疾患分類コードであり、その祖先ノードがリーフノード疾患分類コードに対応する上層疾患分類コードであり、
    前記ステップ2では、前記医学診断知識グラフ配信モジュールは第1のサーバを介して構築されたグローバル医学診断知識グラフを各医療機構参加者に配信し、
    前記ステップ3では、前記疾患診断共起情報統計モジュールは各医療機構参加者の内部で疾患診断共起情報統計を行い、具体的には、
    ある医療機構参加者電子カルテにおける全ての疾患分類コードの集合を
    Figure 0007433541000102
    として記し、総計で|C|種の疾患分類コードがあり、医療機構参加者の各患者のカルテを複数回診療とみなし、
    Figure 0007433541000103
    として記し、総計でT回診療し、毎回診療する疾患分類コードセットをVとして記し、Vにおける各疾患分類コードの上層疾患分類コードをVに加入し、強化疾患分類コードセットを取得してV’として記し、V’におけるコードの任意の2つを組み合わせてコードペアを構成し、コードペアの共起情報を算出することと、
    医学診断知識グラフにおける全ての疾患分類コードの集合を
    Figure 0007433541000104
    として記し、総計でN種の疾患分類コードがある(
    Figure 0007433541000105
    )ことと、当該医療機構参加者が医学診断知識グラフにおける全ての疾患分類コードに基づいて共起マトリックスMを構築し、共起マトリックスMの第i行の第j列の元素Mijが2つのコード
    Figure 0007433541000106

    Figure 0007433541000107
    の共起情報
    Figure 0007433541000108
    を表現し、pが当該医療機構参加者における患者総数を表現し、m ijが2つのコード
    Figure 0007433541000109

    Figure 0007433541000110
    の患者pのある回で診療する強化疾患分類コードセットV’における共起情報を表すこととを含み、
    前記ステップ4では、前記データ暗号化算出モジュールがデータに対して暗号化算出を行うことであって、第2のサーバが暗号化アルゴリズム、暗号化キー、復号化アルゴリズム及び復号化キーを生成し、かつ暗号化アルゴリズム及び暗号化キーを各医療機構参加者に配信することと、各医療機構参加者が暗号化アルゴリズム及び暗号化キーを用いてその共起マトリックスを暗号化して第1のサーバにアップロードすることと、第1のサーバが暗号文状態において、同じ2つのコードの共起情報を加算し、暗号文状態におけるグローバル共起マトリックスを取得して、第2のサーバに送信することと、第2のサーバが復号化アルゴリズム及び復号化キーによりグローバル共起マトリックスを取得し、第1のサーバに返信することとを含み、
    前記ステップ5では、前記知識表示学習モジュールが知識表示学習を行うことであって、第1のサーバにおいて、各疾患分類コードを実数からなる1つの表現ベクトルとして表現し、以下の目標関数Jを作成し、
    Figure 0007433541000111
    ここで、WとWがそれぞれコード
    Figure 0007433541000112

    Figure 0007433541000113
    の表現ベクトルであり、bとbがそれぞれ2つの表現ベクトルのバイアス項であり、Xijがグローバル共起マトリックスにおけるコード
    Figure 0007433541000114

    Figure 0007433541000115
    の共起情報を表現し、fが重み関数であることと、
    収束するまで目標関数を最適化し、2つの表現ベクトルWとWを取得することとを含む
    ことを特徴とする多中心医学診断知識グラフ表示学習方法。
  2. 前記第1のサーバ及び第2のサーバがいずれも第3者のサーバであり、第3者のサーバが正直である必要があり、第3者のサーバの間は相互に通信することができ、各医療機構参加者の内部にそれぞれの電子カルテデータベースが配備され、電子カルテデータベースにおける原データが各医療機構参加者から離れることは、許可されず、各医療機構参加者の間は相互通信を直接的に行うことができず、第3者のサーバと通信しかできない
    ことを特徴とする請求項1に記載の多中心医学診断知識グラフ表示学習方法。
  3. グローバル医学診断知識グラフを構築する過程において、使用される医学診断本体がICD、CCS、SNOMEDを含む
    ことを特徴とする請求項1に記載の多中心医学診断知識グラフ表示学習方法。
  4. 構築された医学診断知識グラフが辞書形式で記憶され、辞書における各元素が1つの疾患の階層構造情報を記録する
    ことを特徴とする請求項1に記載の多中心医学診断知識グラフ表示学習方法。
  5. 強化疾患分類コードセットV’の構築は具体的に、医学診断知識グラフにおいてリーフノードに対応する祖先ノードをルックアップし、共同祖先ノードに対応する上層疾患分類コードをVに繰り返して加入する必要がある
    ことを特徴とする請求項1に記載の多中心医学診断知識グラフ表示学習方法。
  6. 前記ステップ3において、あるコードペアにおける2つのコードc、cについて、コードペアの共起情報算出式が下記の通りであり、
    Figure 0007433541000116
    ここで、
    Figure 0007433541000117
    がV’にcの出現する回数であり、
    Figure 0007433541000118
    がV’にcの出現する回数であり、dijが2つのコードc、c間の距離であり、
    Figure 0007433541000119
    がコードペアの共起情報である
    ことを特徴とする請求項1に記載の多中心医学診断知識グラフ表示学習方法。
  7. 前記ステップ3において、m ijの算出は具体的に、2つのコード
    Figure 0007433541000120

    Figure 0007433541000121
    が患者pのある回で診療する強化疾患分類コードセットV’に同時に出現した場合、当該患者のこの回のV’においてコードcがコード
    Figure 0007433541000122
    に等しいことを見つけ、コードcがコード
    Figure 0007433541000123
    に等しいことを見つけることができ、m ij
    Figure 0007433541000124
    に等しく、そうでない場合、m ijが0に等しい
    ことを特徴とする請求項6に記載の多中心医学診断知識グラフ表示学習方法。
  8. 前記ステップ4は具体的に、
    K個の医療機構参加者のK個の共起マトリックスを
    Figure 0007433541000125
    として記し、任意の2つのコード
    Figure 0007433541000126

    Figure 0007433541000127
    の共起情報を
    Figure 0007433541000128
    として記することと、
    第2のサーバが加法同型暗号化アルゴリズムを利用して暗号化アルゴリズムENC、復号化アルゴリズムDEC、暗号化キーKEY及び復号化キーKEYを取得し、暗号化アルゴリズムENC及び暗号化キーKEYを各医療機構参加者に送信することと、
    安全加法重合を実現する過程において、任意の2つのコードの共起情報に対して、各医療機構参加者がまず共起情報を暗号文として暗号化し、
    Figure 0007433541000129
    として記し、そして暗号文を第1のサーバに送信することと、
    第1のサーバが直接に暗号文を操作することと、加法同型性によれば、暗号文の積を算出するだけでよく、2つのコード
    Figure 0007433541000130

    Figure 0007433541000131
    の暗号化後の共起情報EncXij式が下記の通りであり、
    Figure 0007433541000132
    医学診断知識グラフにおける任意の2つの疾患分類コードについて、いずれも暗号文状態における2つのコード共起情報を算出し、最終的に暗号文状態におけるグローバル共起マトリックスEncXを取得することと、
    第1のサーバがEncXを第2のサーバに送信し、第2のサーバが復号化を取得してグローバル共起マトリックスX、すなわち、
    Figure 0007433541000133
    を取得して、第1のサーバに返信することと、を含む
    ことを特徴とする請求項1に記載の多中心医学診断知識グラフ表示学習方法。
  9. 前記ステップ5において、fが以下のセグメント関数を採用し、
    Figure 0007433541000134
    ここで、MAXとαがいずれもハイパーパラメータであり、実験結果に応じて最適な値を設定し、共起情報がMAXを超えた後、f(Xij)が1である一定のレベルを維持する
    ことを特徴とする請求項1に記載の多中心医学診断知識グラフ表示学習方法。
  10. 多中心医学診断知識グラフ表示学習システムであって、グローバル医学診断知識グラフ構築モジュール、医学診断知識グラフ配信モジュール、疾患診断共起情報統計モジュール、データ暗号化算出モジュール及び知識表示学習モジュールを含み、
    前記グローバル医学診断知識グラフ構築モジュールは、第1のサーバ上でグローバル医学診断知識グラフを構築することに用いられ、前記グローバル医学診断知識グラフが有向非巡回グラフの形式で医学診断概念の階層構造を表現し、リーフノードと祖先ノードの2つの部分で構成され、前記リーフノードが最も小さい疾患分類コードであり、その祖先ノードがリーフノード疾患分類コードに対応する上層疾患分類コードであり、
    前記医学診断知識グラフ配信モジュールは、第1のサーバで構築されたグローバル医学診断知識グラフを各医療機構参加者に配信し、
    前記疾患診断共起情報統計モジュールは、各医療機構参加者に配備することと、ある医療機構参加者電子カルテにおける全ての疾患分類コードの集合を
    Figure 0007433541000135
    として記し、総計で|C|種の疾患分類コードがあり、医療機構参加者の各患者のカルテを複数回診療とみなし、
    Figure 0007433541000136
    として記し、総計でT回診療し、毎回診療する疾患分類コードセットをVとして記し、Vにおける各疾患分類コードの上層疾患分類コードをVに加入し、強化疾患分類コードセットを取得してV’として記することと、V’におけるコードの任意の2つを組み合わせてコードペアを構成し、コードペアの共起情報を算出することと、医学診断知識グラフにおける全ての疾患分類コードの集合を
    Figure 0007433541000137
    として記し、総計でN種の疾患分類コードがある(
    Figure 0007433541000138
    )ことと、当該医療機構参加者が医学診断知識グラフにおける全ての疾患分類コードに基づいて共起マトリックスMを構築し、共起マトリックスMの第i行の第j列の元素Mijが2つのコード
    Figure 0007433541000139

    Figure 0007433541000140
    の共起情報
    Figure 0007433541000141
    を表現し、Pが当該医療機構参加者における患者総数を表現し、m ijが2つのコード
    Figure 0007433541000142

    Figure 0007433541000143
    の患者Pのある回で診療する強化疾患分類コードセットV’における共起情報を表すこととに使用され、
    前記データ暗号化算出モジュールは、第2のサーバが暗号化アルゴリズム、暗号化キー、復号化アルゴリズム及び復号化キーを生成し、かつ暗号化アルゴリズム及び暗号化キーを各医療機構参加者に配信することと、各医療機構参加者が暗号化アルゴリズム及び暗号化キーを用いてその共起マトリックスを暗号化して第1のサーバにアップロードすることと、第1のサーバが暗号文状態において、同じ2つのコードの共起情報を加算し、暗号文状態におけるグローバル共起マトリックスを取得して、第2のサーバに送信することと、第2のサーバが復号化アルゴリズム及び復号化キーによりグローバル共起マトリックスを取得し、第1のサーバに返信することとに使用され、
    前記知識表示学習モジュールは、第1のサーバに配備され、各疾患分類コードを実数からなる1つの表現ベクトルとして表現し、以下の目標関数Jを作成し、
    Figure 0007433541000144
    ここで、WとWがそれぞれコード
    Figure 0007433541000145

    Figure 0007433541000146
    の表現ベクトルであり、bとbがそれぞれ2つの表現ベクトルのバイアス項であり、Xijがグローバル共起マトリックスにおけるコード
    Figure 0007433541000147

    Figure 0007433541000148
    の共起情報を表現し、fが重み関数であることと、
    収束するまで目標関数を最適化し、2つの表現ベクトルWとWを取得することとにに使用される
    ことを特徴とする多中心医学診断知識グラフ表示学習システム。
JP2023535611A 2021-08-27 2022-08-25 多中心医学診断知識グラフ表示学習方法及びシステム Active JP7433541B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202110995013.7 2021-08-27
CN202110995013.7A CN113434626B (zh) 2021-08-27 2021-08-27 一种多中心医学诊断知识图谱表示学习方法及系统
PCT/CN2022/114879 WO2023025255A1 (zh) 2021-08-27 2022-08-25 一种多中心医学诊断知识图谱表示学习方法及系统

Publications (2)

Publication Number Publication Date
JP2023547562A JP2023547562A (ja) 2023-11-10
JP7433541B2 true JP7433541B2 (ja) 2024-02-19

Family

ID=77798239

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023535611A Active JP7433541B2 (ja) 2021-08-27 2022-08-25 多中心医学診断知識グラフ表示学習方法及びシステム

Country Status (3)

Country Link
JP (1) JP7433541B2 (ja)
CN (1) CN113434626B (ja)
WO (1) WO2023025255A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113434626B (zh) * 2021-08-27 2021-12-07 之江实验室 一种多中心医学诊断知识图谱表示学习方法及系统
CN113990495B (zh) * 2021-12-27 2022-04-29 之江实验室 一种基于图神经网络的疾病诊断预测系统
CN116364299B (zh) * 2023-03-30 2024-02-13 之江实验室 一种基于异构信息网络的疾病诊疗路径聚类方法及系统
CN116072298B (zh) * 2023-04-06 2023-08-15 之江实验室 一种基于层级标记分布学习的疾病预测系统
CN116564535B (zh) * 2023-05-11 2024-02-20 之江实验室 基于隐私保护下局部图信息交换的中心疾病预测方法和装置
CN116757275A (zh) * 2023-06-07 2023-09-15 京信数据科技有限公司 一种知识图谱的联邦学习装置及方法
CN116403728B (zh) * 2023-06-09 2023-08-29 吉林大学第一医院 医疗就诊数据的数据处理装置和相关设备
CN116502129B (zh) * 2023-06-21 2023-09-22 之江实验室 一种知识与数据协同驱动的不平衡临床数据分类系统
CN116525125B (zh) * 2023-07-04 2023-09-19 之江实验室 一种虚拟电子病历的生成方法及装置
CN116821375B (zh) * 2023-08-29 2023-12-22 之江实验室 一种跨机构医学知识图谱表示学习方法及系统
CN116825264B (zh) * 2023-08-30 2023-11-21 青岛市妇女儿童医院(青岛市妇幼保健院、青岛市残疾儿童医疗康复中心、青岛市新生儿疾病筛查中心) 基于互联网的妇产科信息处理方法及系统
CN117409911B (zh) * 2023-10-13 2024-05-07 四川大学 一种基于多视图对比学习的电子病历表示学习方法
CN117116432B (zh) * 2023-10-23 2023-12-15 博奥生物集团有限公司 一种疾病特征的处理装置和设备
CN117711578B (zh) * 2024-02-06 2024-04-30 重庆医科大学绍兴柯桥医学检验技术研究中心 一种医学影像数据分析管理系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008083928A (ja) 2006-09-27 2008-04-10 Gifu Univ 医療情報抽出装置、及び医療情報抽出プログラム
JP2014228907A (ja) 2013-05-20 2014-12-08 株式会社日立製作所 情報構造化システム
WO2016157314A1 (ja) 2015-03-27 2016-10-06 株式会社日立製作所 計算機システム、及び、情報処理方法
CN106951684A (zh) 2017-02-28 2017-07-14 北京大学 一种医学疾病诊断记录中实体消歧的方法
CN107610770A (zh) 2016-07-11 2018-01-19 百度(美国)有限责任公司 用于自动化诊断的问题生成系统和方法
CN111739595A (zh) 2020-07-24 2020-10-02 湖南创星科技股份有限公司 一种医疗大数据共享分析方法及装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060136259A1 (en) * 2004-12-17 2006-06-22 General Electric Company Multi-dimensional analysis of medical data
CN106886543B (zh) * 2015-12-16 2020-01-17 清华大学 结合实体描述的知识图谱表示学习方法和系统
US20170277841A1 (en) * 2016-03-23 2017-09-28 HealthPals, Inc. Self-learning clinical intelligence system based on biological information and medical data metrics
CN106874695B (zh) * 2017-03-22 2019-10-25 北京大数医达科技有限公司 医疗知识图谱的构建方法和装置
CN107145744B (zh) * 2017-05-08 2018-03-02 合肥工业大学 医学知识图谱的构建方法、装置及辅助诊断方法
CN108197290B (zh) * 2018-01-19 2021-08-03 桂林电子科技大学 一种融合实体和关系描述的知识图谱表示学习方法
CN108614885B (zh) * 2018-05-03 2019-04-30 杭州认识科技有限公司 基于医学信息的知识图谱分析方法及装置
CN109284396A (zh) * 2018-09-27 2019-01-29 北京大学深圳研究生院 医学知识图谱构建方法、装置、服务器及存储介质
CN110347798B (zh) * 2019-07-12 2021-06-01 之江实验室 一种基于自然语言生成技术的知识图谱辅助理解系统
CN111180061B (zh) * 2019-12-09 2023-05-02 广东工业大学 融合区块链与联邦学习的共享医疗数据智能辅助诊断系统
CN111191020B (zh) * 2019-12-27 2023-09-22 江苏省人民医院(南京医科大学第一附属医院) 基于机器学习和知识图谱的处方推荐方法和系统
CN111292848B (zh) * 2019-12-31 2023-05-16 同方知网数字出版技术股份有限公司 一种基于贝叶斯估计的医疗知识图谱辅助推理方法
CN111382272B (zh) * 2020-03-09 2022-11-01 西南交通大学 一种基于知识图谱的电子病历icd自动编码方法
CN111858955B (zh) * 2020-07-01 2023-08-18 石家庄铁路职业技术学院 基于加密联邦学习的知识图谱表示学习增强方法和装置
CN112364376A (zh) * 2020-11-11 2021-02-12 贵州大学 一种属性代理重加密医疗数据共享方法
CN112765312B (zh) * 2020-12-31 2022-05-10 湖南大学 一种基于图神经网络嵌入匹配的知识图谱问答方法和系统
CN113434626B (zh) * 2021-08-27 2021-12-07 之江实验室 一种多中心医学诊断知识图谱表示学习方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008083928A (ja) 2006-09-27 2008-04-10 Gifu Univ 医療情報抽出装置、及び医療情報抽出プログラム
JP2014228907A (ja) 2013-05-20 2014-12-08 株式会社日立製作所 情報構造化システム
WO2016157314A1 (ja) 2015-03-27 2016-10-06 株式会社日立製作所 計算機システム、及び、情報処理方法
CN107610770A (zh) 2016-07-11 2018-01-19 百度(美国)有限责任公司 用于自动化诊断的问题生成系统和方法
CN106951684A (zh) 2017-02-28 2017-07-14 北京大学 一种医学疾病诊断记录中实体消歧的方法
CN111739595A (zh) 2020-07-24 2020-10-02 湖南创星科技股份有限公司 一种医疗大数据共享分析方法及装置

Also Published As

Publication number Publication date
CN113434626B (zh) 2021-12-07
CN113434626A (zh) 2021-09-24
WO2023025255A1 (zh) 2023-03-02
JP2023547562A (ja) 2023-11-10

Similar Documents

Publication Publication Date Title
JP7433541B2 (ja) 多中心医学診断知識グラフ表示学習方法及びシステム
Li et al. A review of applications in federated learning
Wen et al. A survey on federated learning: challenges and applications
CN113205863B (zh) 基于蒸馏的半监督联邦学习的个性化模型的训练方法
Alzubi et al. Optimal multiple key‐based homomorphic encryption with deep neural networks to secure medical data transmission and diagnosis
Chen et al. Metafed: Federated learning among federations with cyclic knowledge distillation for personalized healthcare
Alabdulkarim et al. A Privacy-Preserving Algorithm for Clinical Decision-Support Systems Using Random Forest.
CN111477337B (zh) 基于个体自适应传播网络的传染病预警方法、系统及介质
CN115952280A (zh) 基于多模型联邦集成的用户画像方法
Tutsoy Graph theory based large-scale machine learning with multi-dimensional constrained optimization approaches for exact epidemiological modelling of pandemic diseases
Chu et al. Privacy-preserving self-taught federated learning for heterogeneous data
Anande et al. Generative adversarial networks for network traffic feature generation
Cao et al. Cross-silo heterogeneous model federated multitask learning
Sun et al. Internet of things-assisted advanced dynamic information processing system for physical education system
Awoseyi et al. Hybridization of decision tree algorithm using sequencing predictive model for COVID-19
Guan et al. T-mgcl: Molecule graph contrastive learning based on transformer for molecular property prediction
Wang et al. DUGRA: dual-graph representation learning for health information networks
Jamshidi et al. Adjustable privacy using autoencoder-based learning structure
Dagli et al. A proposed solution to build a breast cancer detection model on confidential patient data using federated learning
Rathinaeaswari et al. A New Efficient and Privacy-Preserving Hybrid Classification model for Patient-Centric Clinical Decision Support System
Puri et al. Digital cloning of online social networks for language-sensitive agent-based modeling of misinformation spread
Feng et al. A drug information embedding method based on graph convolution neural network
Wang et al. Federated Knowledge Graph Completion via Latent Embedding Sharing and Tensor Factorization
Rocheteau Representation learning for patients in the Intensive Care Unit
Wang et al. GAN-based dual active learning for nosocomial infection detection

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230609

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20230705

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240206

R150 Certificate of patent or registration of utility model

Ref document number: 7433541

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150