JP2023547562A - 多中心医学診断知識グラフ表示学習方法及びシステム - Google Patents
多中心医学診断知識グラフ表示学習方法及びシステム Download PDFInfo
- Publication number
- JP2023547562A JP2023547562A JP2023535611A JP2023535611A JP2023547562A JP 2023547562 A JP2023547562 A JP 2023547562A JP 2023535611 A JP2023535611 A JP 2023535611A JP 2023535611 A JP2023535611 A JP 2023535611A JP 2023547562 A JP2023547562 A JP 2023547562A
- Authority
- JP
- Japan
- Prior art keywords
- medical
- knowledge graph
- server
- codes
- disease classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 66
- 238000000034 method Methods 0.000 title claims abstract description 33
- 201000010099 disease Diseases 0.000 claims abstract description 122
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 122
- 239000011159 matrix material Substances 0.000 claims abstract description 49
- 238000004364 calculation method Methods 0.000 claims abstract description 16
- 230000008569 process Effects 0.000 claims abstract description 10
- 230000008520 organization Effects 0.000 claims description 33
- 230000006870 function Effects 0.000 claims description 23
- 239000013598 vector Substances 0.000 claims description 16
- 239000000654 additive Substances 0.000 claims description 9
- 230000000996 additive effect Effects 0.000 claims description 9
- 239000013604 expression vector Substances 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 8
- 238000006116 polymerization reaction Methods 0.000 claims description 3
- 230000019771 cognition Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 abstract description 2
- 206010047473 Viral pharyngitis Diseases 0.000 description 4
- 238000013136 deep learning model Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 201000008197 Laryngitis Diseases 0.000 description 1
- 201000007100 Pharyngitis Diseases 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- 201000010550 acute laryngitis Diseases 0.000 description 1
- 208000016150 acute pharyngitis Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/322—Trees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/008—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
Description
前記ステップ1では、第1のサーバがグローバル医学診断知識グラフを構築し、前記グローバル医学診断知識グラフが有向非巡回グラフの形式で医学診断概念の階層構造を表現し、リーフノードと祖先ノードの2つの部分で構成され、前記リーフノードが最も小さい疾患分類コードであり、その祖先ノードがリーフノード疾患分類コードに対応する上層疾患分類コードであり、
前記ステップ2では、第1のサーバが構築されたグローバル医学診断知識グラフを各医療機構参加者に配信し、
前記ステップ3では、各医療機構参加者の内部で疾患診断共起情報統計を行うステップであって、具体的には、
ある医療機構参加者電子カルテにおける全ての疾患分類コードの集合を
として記し、総計で|C|種の疾患分類コードがあり、医療機構参加者の各患者のカルテを複数回診療とみなし、
として記し、総計でT回診療し、毎回診療する疾患分類コードセットをVtとして記し、Vtにおける各疾患分類コードの上層疾患分類コードをVtに加入し、強化疾患分類コードセットを取得してVt’として記し、Vt’におけるコードの任意の2つを組み合わせてコードペアを構成し、コードペアの共起情報を算出することと、医学診断知識グラフにおける全ての疾患分類コードの集合を
として記し、総計でN種の疾患分類コードがある(
)ことと、当該医療機構参加者が医学診断知識グラフにおける全ての疾患分類コードに基づいて共起マトリックスMを構築し、共起マトリックスMの第i行の第j列の元素Mijが2つのコード
と
の共起情報
を表現し、pが当該医療機構参加者における患者総数を表現し、mp ijが2つのコード
と
の患者pのある回で診療する強化疾患分類コードセットVt’における共起情報を表すこととを含み、
前記ステップ4では、データ暗号化算出であって、第2のサーバが暗号化アルゴリズム、暗号化キー、復号化アルゴリズム及び復号化キーを生成し、かつ暗号化アルゴリズム及び暗号化キーを各医療機構参加者に配信することと、各医療機構参加者が暗号化アルゴリズム及び暗号化キーを用いてその共起マトリックスを暗号化して第1のサーバにアップロードすることと、第1のサーバが暗号文状態において、同じ2つのコードの共起情報を加算し、暗号文状態におけるグローバル共起マトリックスを取得して、第2のサーバに送信することと、第2のサーバが復号化アルゴリズム及び復号化キーによりグローバル共起マトリックスを取得し、第1のサーバに返信することと、を含み、
前記ステップ5では、知識表示学習であって、第1のサーバにおいて、各疾患分類コードを実数からなる1つの表現ベクトルとして表現し、以下の目標関数Jを作成し、
と
の表現ベクトルであり、biとbjがそれぞれ2つの表現ベクトルのバイアス項であり、Xijがグローバル共起マトリックスにおけるコード
と
の共起情報を表現し、fが重み関数であることと、
収束するまで目標関数を最適化し、2つの表現ベクトルWiとWjを取得することとを含む。
がVt’にciの出現する回数であり、
がVt’にcjの出現する回数であり、dijが2つのコードci、cj間の距離であり、
がコードペアの共起情報である。
と
が患者pのある回で診療する強化疾患分類コードセットVt’に同時に出現した場合、当該患者のこの回のVt’においてコードciがコード
に等しいことを見つけ、コードcjがコード
に等しいことを見つけることができ、mp ijが
に等しく、そうでない場合、mp ijが0に等しい。
K個の医療機構参加者のK個の共起マトリックスを
として記し、任意の2つのコード
と
の共起情報を
として記することと、
第2のサーバが加法同型暗号化アルゴリズムを利用して暗号化アルゴリズムENC、復号化アルゴリズムDEC、暗号化キーKEYE及び復号化キーKEYDを取得し、暗号化アルゴリズムENC及び暗号化キーKEYEを各医療機構参加者に送信することと、
安全加法重合を実現する過程において、任意の2つのコードの共起情報に対して、各医療機構参加者がまず共起情報を暗号文として暗号化し、
として記し、そして暗号文を第1のサーバに送信することと、
第1のサーバが直接に暗号文を操作することと、加法同型性によれば、暗号文の積を算出するだけでよく、2つのコード
と
の暗号化後の共起情報EncXij式が下記の通りであり、
第1のサーバがEncXを第2のサーバに送信し、第2のサーバが復号化を取得してグローバル共起マトリックスX、すなわち、
を取得して、第1のサーバに返信することと、を含む。
前記グローバル医学診断知識グラフ構築モジュールは、第1のサーバ上でグローバル医学診断知識グラフを構築することに用いられ、前記グローバル医学診断知識グラフが有向非巡回グラフの形式で医学診断概念の階層構造を表現し、リーフノードと祖先ノードの2つの部分で構成され、前記リーフノードが最も小さい疾患分類コードであり、その祖先ノードがリーフノード疾患分類コードに対応する上層疾患分類コードであり、
前記医学診断知識グラフ配信モジュールは、第1のサーバで構築されたグローバル医学診断知識グラフを各医療機構参加者に配信し、
前記疾患診断共起情報統計モジュールは、各医療機構参加者に配備することと、ある医療機構参加者電子カルテにおける全ての疾患分類コードの集合を
として記し、総計で|C|種の疾患分類コードがあり、医療機構参加者の各患者のカルテを複数回診療とみなし、
として記し、総計でT回診療し、毎回診療する疾患分類コードセットをVtとして記し、Vtにおける各疾患分類コードの上層疾患分類コードをVtに加入し、強化疾患分類コードセットを取得してVt’として記することと、Vt’におけるコードの任意の2つを組み合わせてコードペアを構成し、コードペアの共起情報を算出することと、医学診断知識グラフにおける全ての疾患分類コードの集合を
として記し、総計でN種の疾患分類コードがある(
)ことと、当該医療機構参加者が医学診断知識グラフにおける全ての疾患分類コードに基づいて共起マトリックスMを構築し、共起マトリックスMの第i行の第j列の元素Mijが2つのコード
と
の共起情報
を表現し、Pが当該医療機構参加者における患者総数を表現し、mp ijが2つのコード
と
の患者Pのある回で診療する強化疾患分類コードセットVt’における共起情報を表すこととに使用され、
前記データ暗号化算出モジュールは、第2のサーバが暗号化アルゴリズム、暗号化キー、復号化アルゴリズム及び復号化キーを生成し、かつ暗号化アルゴリズム及び暗号化キーを各医療機構参加者に配信することと、各医療機構参加者が暗号化アルゴリズム及び暗号化キーを用いてその共起マトリックスを暗号化して第1のサーバにアップロードすることと、第1のサーバが暗号文状態において、同じ2つのコードの共起情報を加算し、暗号文状態におけるグローバル共起マトリックスを取得して、第2のサーバに送信することと、第2のサーバが復号化アルゴリズム及び復号化キーによりグローバル共起マトリックスを取得し、第1のサーバに返信することとに使用され、
前記知識表示学習モジュールは、第1のサーバに配備され、各疾患分類コードを実数からなる1つの表現ベクトルとして表現し、以下の目標関数Jを作成し、
と
の表現ベクトルであり、biとbjがそれぞれ2つの表現ベクトルのバイアス項であり、Xijがグローバル共起マトリックスにおけるコード
と
の共起情報を表現し、fが重み関数であることと、
収束するまで目標関数を最適化し、2つの表現ベクトルWiとWjを取得することとにに使用される。
1.既存の医学診断本体(ICD、CCS、SNOMED等)に基づき、有向非巡回グラフの形式で医学診断概念の階層構造を表現し、グローバル医学診断知識グラフを構築する。グローバル医学診断知識グラフを利用して、全ての疾患分類コードの共起マトリックスを構築し、各ペアのコードの共起情報を算出し、同時に出現するコードペアが多く、距離が近いほど、共起情報が大きくなる。
2.連合学習に基づき、各医療機構参加者のデータプライバシーと安全を保護する前提で、多中心データを利用し、共起情報を加算し、データ密度を高め、データ希薄性の問題を解決する。
3.大規模な知識グラフ及び原データを学習する過程において、知識源における人間の認知に適切する階層情報と複雑な関連関係を統合し、データ間の相関関係をマイニングし、意味情報を豊かにし、知識の高品質表現形態を学習し、知識の算出と推理を容易にする。
第1のサーバがグローバル医学診断知識グラフの構築を担当する。グローバル医学診断知識グラフは、有向非巡回グラフの形式で医学診断概念の階層構造を表現する。グローバル医学診断知識グラフリーフノードと祖先ノードの2つの部分で構成され、ここでリーフノードが最も小さい疾患分類コードであり、その祖先ノードがリーフノード疾患分類コードに対応する上層疾患分類コードである。
本実施例においてICD10を医学診断本体として使用し、グローバル医学診断知識グラフを構築する。ここで、医学診断本体は、さらにCCS、SNOMEDなどの医学分野で常用される知識源を選択してもよい。ウイルス性咽頭炎を例とし、ウイルス性咽頭炎J02.801がリーフノードであり、ICD10における疾患階層情報に基づき、図3に示すように、その祖先ノードである呼吸器疾患J00-J99、急性上気道感染J00-J06、急性咽頭炎J02を構築する。
構築された医学診断知識グラフが辞書形式で記憶され、辞書における各元素が1つの疾患の階層構造情報を記録する。ウイルス性咽頭炎を例とし、階層構造情報を{J02.801:[J02.801,root,J00-J99,J00-J06,J02]}として記憶し、rootがルートノードを代表する。
第1のサーバが構築されたグローバル医学診断知識グラフを各医療機構参加者に配信する。知識グラフは公開されて取得されるため、暗号化されていなくてもよい。
各医療機構参加者電子カルテにおける全ての疾患分類コードの集合を
として記し、総計で|C|種の疾患分類コードがある。当該医療機構参加者の各患者のカルテを複数回診療とみなし、
として記し、総計でT回診療し、毎回診療する疾患分類コードセットをVtとして記する。
医療機構参加者は、1回の診療Vtを単位とし、Vtに各疾患分類コードの上層疾患分類コードを加入することにより、強化疾患分類コードセットを取得してVt’として記し、すなわち、医学診断知識グラフにおいてリーフノードに対応する祖先ノードをルックアップし、共同祖先ノードに対応する上層疾患分類コードを繰り返して加入する必要がある。
各疾患分類コード及びその上層疾患分類コードのVt’における出現回数を算出する。Vt’におけるコードの任意の2つを組み合わせてコードペアを構成し、コードペアにおける2つのコードの出現回数を乗算することにより、当該コードペアの共起情報を算出する。同時に、コードペアにおける2つのコード間の距離を算出し、すなわち、2つのノードを接続する最短経路に含まれるエッジの数を算出し、距離の逆数を重みとする。
あるコードペアにおける2つのコードci、cjに対して、コードペアの共起情報は、下記の通りであり、
がVt’にciの出現する回数であり、
がVt’にcjの出現する回数であり、dijが2つのコードci、cj間の距離であり、
がコードペアの共起情報である。
医学診断知識グラフにおける全ての疾患分類コードの集合を
として記し、総計でN種の疾患分類コードがある(
)。当該医療機構参加者が医学診断知識グラフにおける全ての疾患分類コードに基づいて共起マトリックスMを構築し、表1に示す通りである。Mijが2つのコード
と
の共起情報
を表現し、Pが当該医療機構参加者中患者の総数を表現し、mp ijが2つのコード
と
の患者pのある回で診療する強化疾患分類コードセットVt’における共起情報を表現し、2つのコード
と
が患者pのある回で診療する強化疾患分類コードセットVt’に同時に出現した場合、当該患者のこの回のVt’においてコードciがコード
に等しいことを見つけ、コードcjがコード
に等しいことを見つけることができ、mp ijが
に等しく、そうでない場合、0として記する。共起マトリックスMが対称し、MijとMjiとが等しく、対角線が同じ疾患分類コードの共起情報であり、0として記する。
表1共起マトリックス構造示例
図3の医学診断知識グラフを例とし、仮に患者のある回で診療する疾患診断がウイルス性咽頭炎及び急性喉頭炎であるとすると、Vt=[J02.801,J04.000]であり、上層疾患分類コードを加入することにより、Vt’=[J02.801,J02,J00-J06,J00-J99,root,J04.000,J04,J00-J06,J00-J99,root]として強化し、コードJ02.801の出現回数が1、J00-J06の出現回数が2、両者間の距離が2、共起情報の値が1である。
第2のサーバが暗号化アルゴリズム、暗号化キー、復号化アルゴリズム及び復号化キーを生成し、かつ暗号化アルゴリズム及び暗号化キーを各医療機構参加者に配信する。各医療機構参加者が暗号化アルゴリズム及び暗号化キーを用いてその共起マトリックスを暗号化して第1のサーバにアップロードする。第1のサーバが暗号文状態において、同じ2つのコードの共起情報を加算し、暗号文状態におけるグローバル共起マトリックスを取得して、第2のサーバに送信する。第2のサーバが復号化アルゴリズム及び復号化キーによりグローバル共起マトリックスを取得し、第1のサーバに返信する。プロセス全体でデータリークのリスクはない。具体的な実現流れは下記の通りである。
K個の医療機構参加者のK個の共起マトリックスを
として記し、任意の2つのコード
と
の共起情報を
として記する。
第2のサーバが加法同型暗号化アルゴリズムを利用して暗号化アルゴリズムENC、復号化アルゴリズムDEC、暗号化キーKEYE及び復号化キーKEYDを取得し、暗号化アルゴリズムENC及び暗号化キーKEYEを各医療機構参加者に送信する。
次に、安全加法重合を実現する過程において、任意の2つのコードの共起情報に対して、各医療機構参加者がまず共起情報を暗号文として暗号化し、
として記し、そして暗号文を第1のサーバに送信する。
第1のサーバは復号化操作を実行しないが、暗号文を直接操作する。加法同型性によれば、暗号文の積を算出するだけでよく、2つのコード
と
暗号化後の共起情報EncXij式が下記の通りであり、
医学診断知識グラフにおける任意の2つの疾患分類コードについて、何れも上記ステップに従って、暗号文状態における2つのコード共起情報を算出し、最終的に暗号文状態におけるグローバル共起マトリックスEncXを取得する。第1のサーバがEncXを第2のサーバに送信し、第2のサーバが復号化してグローバル共起マトリックスX、すなわち、
を取得し、第1のサーバに返信する。
第1のサーバにおいて、GloVeアルゴリズム原理によれば、各疾患分類コードを実数からなる1つの表現ベクトルとして表現し、当該表現ベクトルとグローバル共起マトリックスの間の関係は以下の通り表現し、
と
の表現ベクトルであり、128次元の、値が-0.1~0.1間のランダムベクトルにランダムに初期化される。上付き文字Tが転置操作を表現する。biとbjがそれぞれ2つの表現ベクトルのバイアス項であり、初期値が0である。Xijがグローバル共起マトリックスXにおけるコード
と
の共起情報を表現する。
上記式に基づき、目標関数Jを作成し、
と
が一緒に出現しない場合、すなわち、Xij=0の場合、それらは目標関数の算出に参加せず、すなわち、
である。以上の要求に基づき、fが以下のセグメント関数を採用し、
目標関数最適化過程がAdaDelta勾配降下アルゴリズムを採用し、グローバル共起マトリックスXにおける元素をランダムサンプリングし、学習率を0.05として設定し、収束するまで50回反復し、2つの表現ベクトルWiとWjを取得する。
知識グラフ表示学習によって得られた表現ベクトルは、疾患間の類似性を算出するために使用できるだけでなく、それを患者カルテと組み合わせて、ディープ学習モデルに統合して予測タスクを完成することもできる。例えば、患者の履歴診療記録に基づき、次回の診療に出現する可能性がある疾患を予測する。電子カルテにおいて、各患者のカルテ記録を複数回診療とみなすことができ、毎回診療には一連の疾患分類コード、すなわち、C’のサブセットが含まれる。患者のある回で診療する疾患分類コードセットがバイナリベクトル
として表現してもよく、ここで、i番目の元素は当該患者のこの回の診療にコード
が出現しているか否かを代表し、出現している場合、1であり、そうでない場合、0である。ディープ学習モデル訓練において、患者の毎回診療するバイナリベクトルxtと表現ベクトルとを乗算して非線形変換を行い、RNN予測モデルの入力として、次回の診療する疾患分類コードを予測取得して、出現する可能性がある疾患を予測することができる。
第1のサーバ上でグローバル医学診断知識グラフを構築するためのものであって、前記グローバル医学診断知識グラフが有向非巡回グラフの形式で医学診断概念の階層構造を表現し、リーフノードと祖先ノードの2つの部分で構成され、前記リーフノードが最も小さい疾患分類コードであり、その祖先ノードがリーフノード疾患分類コードに対応する上層疾患分類コードであるグローバル医学診断知識グラフ構築モジュールと、
第1のサーバで構築されたグローバル医学診断知識グラフを各医療機構参加者に配信するための医学診断知識グラフ配信モジュールと、
各医療機構参加者に配備することと、ある医療機構参加者電子カルテにおける全ての疾患分類コードの集合を
として記し、総計で|C|種の疾患分類コードがあり、医療機構参加者の各患者のカルテを複数回診療とみなし、
として記し、総計でT回診療し、毎回診療する疾患分類コードセットをVtとして記し、Vtにおける各疾患分類コードの上層疾患分類コードをVtに加入し、強化疾患分類コードセットを取得してVt’として記することと、Vt’におけるコードの任意の2つを組み合わせてコードペアを構成し、コードペアの共起情報を算出することと、医学診断知識グラフにおける全ての疾患分類コードの集合を
として記し、総計でN種の疾患分類コードがある(
)ことと、当該医療機構参加者が医学診断知識グラフにおける全ての疾患分類コードに基づいて共起マトリックスMを構築し、共起マトリックスMの第i行の第j列の元素Mijが2つのコード
と
の共起情報
を表現し、Pが当該医療機構参加者における患者総数を表現し、mp ijが2つのコード
と
の患者Pのある回で診療する強化疾患分類コードセットVt’における共起情報を表現することとに使用される疾患診断共起情報統計モジュールと、
第2のサーバが暗号化アルゴリズム、暗号化キー、復号化アルゴリズム及び復号化キーを生成し、かつ暗号化アルゴリズム及び暗号化キーを各医療機構参加者に配信することと、各医療機構参加者が暗号化アルゴリズム及び暗号化キーを用いてその共起マトリックスを暗号化して第1のサーバにアップロードすることと、第1のサーバが暗号文状態において、同じ2つのコードの共起情報を加算し、暗号文状態におけるグローバル共起マトリックスを取得して、第2のサーバに送信することと、第2のサーバが復号化アルゴリズム及び復号化キーによりグローバル共起マトリックスを取得し、第1のサーバに返信することとに使用されるデータ暗号化算出モジュールと、
第1のサーバに配備され、各疾患分類コードを実数からなる1つの表現ベクトルとして表現し、以下の目標関数Jを作成し、
と
の表現ベクトルであり、biとbjがそれぞれ2つの表現ベクトルのバイアス項であり、Xijがグローバル共起マトリックスにおけるコード
と
の共起情報を表現し、fが重み関数であることと、
収束するまで目標関数を最適化し、2つの表現ベクトルWiとWjを取得することとに使用される知識表示学習モジュールと、
を備える。
Claims (10)
- 多中心医学診断知識グラフ表示学習方法であって、ステップ1~ステップ5を含み、
前記ステップ1では、第1のサーバがグローバル医学診断知識グラフを構築し、前記グローバル医学診断知識グラフが有向非巡回グラフの形式で医学診断概念の階層構造を表現し、リーフノードと祖先ノードの2つの部分で構成され、前記リーフノードが最も小さい疾患分類コードであり、その祖先ノードがリーフノード疾患分類コードに対応する上層疾患分類コードであり、
前記ステップ2では、第1のサーバが構築されたグローバル医学診断知識グラフを各医療機構参加者に配信し、
前記ステップ3では、各医療機構参加者の内部で疾患診断共起情報統計を行い、具体的には、
ある医療機構参加者電子カルテにおける全ての疾患分類コードの集合を
として記し、総計で|C|種の疾患分類コードがあり、医療機構参加者の各患者のカルテを複数回診療とみなし、
として記し、総計でT回診療し、毎回診療する疾患分類コードセットをVtとして記し、Vtにおける各疾患分類コードの上層疾患分類コードをVtに加入し、強化疾患分類コードセットを取得してVt’として記し、Vt’におけるコードの任意の2つを組み合わせてコードペアを構成し、コードペアの共起情報を算出することと、
医学診断知識グラフにおける全ての疾患分類コードの集合を
として記し、総計でN種の疾患分類コードがある(
)ことと、当該医療機構参加者が医学診断知識グラフにおける全ての疾患分類コードに基づいて共起マトリックスMを構築し、共起マトリックスMの第i行の第j列の元素Mijが2つのコード
と
の共起情報
を表現し、pが当該医療機構参加者における患者総数を表現し、mp ijが2つのコード
と
の患者pのある回で診療する強化疾患分類コードセットVt’における共起情報を表すこととを含み、
前記ステップ4では、データ暗号化算出であって、第2のサーバが暗号化アルゴリズム、暗号化キー、復号化アルゴリズム及び復号化キーを生成し、かつ暗号化アルゴリズム及び暗号化キーを各医療機構参加者に配信することと、各医療機構参加者が暗号化アルゴリズム及び暗号化キーを用いてその共起マトリックスを暗号化して第1のサーバにアップロードすることと、第1のサーバが暗号文状態において、同じ2つのコードの共起情報を加算し、暗号文状態におけるグローバル共起マトリックスを取得して、第2のサーバに送信することと、第2のサーバが復号化アルゴリズム及び復号化キーによりグローバル共起マトリックスを取得し、第1のサーバに返信することとを含み、
前記ステップ5では、知識表示学習であって、第1のサーバにおいて、各疾患分類コードを実数からなる1つの表現ベクトルとして表現し、以下の目標関数Jを作成し、
と
の表現ベクトルであり、biとbjがそれぞれ2つの表現ベクトルのバイアス項であり、Xijがグローバル共起マトリックスにおけるコード
と
の共起情報を表現し、fが重み関数であることと、
収束するまで目標関数を最適化し、2つの表現ベクトルWiとWjを取得することとを含む
ことを特徴とする多中心医学診断知識グラフ表示学習方法。 - 前記第1のサーバ及び第2のサーバがいずれも第3者のサーバであり、第3者のサーバが正直である必要があり、第3者のサーバの間は相互に通信することができ、各医療機構参加者の内部にそれぞれの電子カルテデータベースが配備され、電子カルテデータベースにおける原データが各医療機構参加者から離れることは、許可されず、各医療機構参加者の間は相互通信を直接的に行うことができず、第3者のサーバと通信しかできない
ことを特徴とする請求項1に記載の多中心医学診断知識グラフ表示学習方法。 - グローバル医学診断知識グラフを構築する過程において、使用される医学診断本体がICD、CCS、SNOMEDを含む
ことを特徴とする請求項1に記載の多中心医学診断知識グラフ表示学習方法。 - 構築された医学診断知識グラフが辞書形式で記憶され、辞書における各元素が1つの疾患の階層構造情報を記録する
ことを特徴とする請求項1に記載の多中心医学診断知識グラフ表示学習方法。 - 強化疾患分類コードセットVt’の構築は具体的に、医学診断知識グラフにおいてリーフノードに対応する祖先ノードをルックアップし、共同祖先ノードに対応する上層疾患分類コードをVtに繰り返して加入する必要がある
ことを特徴とする請求項1に記載の多中心医学診断知識グラフ表示学習方法。 - 前記ステップ4は具体的に、
K個の医療機構参加者のK個の共起マトリックスを
として記し、任意の2つのコード
と
の共起情報を
として記することと、
第2のサーバが加法同型暗号化アルゴリズムを利用して暗号化アルゴリズムENC、復号化アルゴリズムDEC、暗号化キーKEYE及び復号化キーKEYDを取得し、暗号化アルゴリズムENC及び暗号化キーKEYEを各医療機構参加者に送信することと、
安全加法重合を実現する過程において、任意の2つのコードの共起情報に対して、各医療機構参加者がまず共起情報を暗号文として暗号化し、
として記し、そして暗号文を第1のサーバに送信することと、
第1のサーバが直接に暗号文を操作することと、加法同型性によれば、暗号文の積を算出するだけでよく、2つのコード
と
の暗号化後の共起情報EncXij式が下記の通りであり、
第1のサーバがEncXを第2のサーバに送信し、第2のサーバが復号化を取得してグローバル共起マトリックスX、すなわち、
を取得して、第1のサーバに返信することと、を含む
ことを特徴とする請求項1に記載の多中心医学診断知識グラフ表示学習方法。 - 多中心医学診断知識グラフ表示学習システムであって、グローバル医学診断知識グラフ構築モジュール、医学診断知識グラフ配信モジュール、疾患診断共起情報統計モジュール、データ暗号化算出モジュール及び知識表示学習モジュールを含み、
前記グローバル医学診断知識グラフ構築モジュールは、第1のサーバ上でグローバル医学診断知識グラフを構築することに用いられ、前記グローバル医学診断知識グラフが有向非巡回グラフの形式で医学診断概念の階層構造を表現し、リーフノードと祖先ノードの2つの部分で構成され、前記リーフノードが最も小さい疾患分類コードであり、その祖先ノードがリーフノード疾患分類コードに対応する上層疾患分類コードであり、
前記医学診断知識グラフ配信モジュールは、第1のサーバで構築されたグローバル医学診断知識グラフを各医療機構参加者に配信し、
前記疾患診断共起情報統計モジュールは、各医療機構参加者に配備することと、ある医療機構参加者電子カルテにおける全ての疾患分類コードの集合を
として記し、総計で|C|種の疾患分類コードがあり、医療機構参加者の各患者のカルテを複数回診療とみなし、
として記し、総計でT回診療し、毎回診療する疾患分類コードセットをVtとして記し、Vtにおける各疾患分類コードの上層疾患分類コードをVtに加入し、強化疾患分類コードセットを取得してVt’として記することと、Vt’におけるコードの任意の2つを組み合わせてコードペアを構成し、コードペアの共起情報を算出することと、医学診断知識グラフにおける全ての疾患分類コードの集合を
として記し、総計でN種の疾患分類コードがある(
)ことと、当該医療機構参加者が医学診断知識グラフにおける全ての疾患分類コードに基づいて共起マトリックスMを構築し、共起マトリックスMの第i行の第j列の元素Mijが2つのコード
と
の共起情報
を表現し、Pが当該医療機構参加者における患者総数を表現し、mp ijが2つのコード
と
の患者Pのある回で診療する強化疾患分類コードセットVt’における共起情報を表すこととに使用され、
前記データ暗号化算出モジュールは、第2のサーバが暗号化アルゴリズム、暗号化キー、復号化アルゴリズム及び復号化キーを生成し、かつ暗号化アルゴリズム及び暗号化キーを各医療機構参加者に配信することと、各医療機構参加者が暗号化アルゴリズム及び暗号化キーを用いてその共起マトリックスを暗号化して第1のサーバにアップロードすることと、第1のサーバが暗号文状態において、同じ2つのコードの共起情報を加算し、暗号文状態におけるグローバル共起マトリックスを取得して、第2のサーバに送信することと、第2のサーバが復号化アルゴリズム及び復号化キーによりグローバル共起マトリックスを取得し、第1のサーバに返信することとに使用され、
前記知識表示学習モジュールは、第1のサーバに配備され、各疾患分類コードを実数からなる1つの表現ベクトルとして表現し、以下の目標関数Jを作成し、
と
の表現ベクトルであり、biとbjがそれぞれ2つの表現ベクトルのバイアス項であり、Xijがグローバル共起マトリックスにおけるコード
と
の共起情報を表現し、fが重み関数であることと、
収束するまで目標関数を最適化し、2つの表現ベクトルWiとWjを取得することとにに使用される
ことを特徴とする多中心医学診断知識グラフ表示学習システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110995013.7A CN113434626B (zh) | 2021-08-27 | 2021-08-27 | 一种多中心医学诊断知识图谱表示学习方法及系统 |
CN202110995013.7 | 2021-08-27 | ||
PCT/CN2022/114879 WO2023025255A1 (zh) | 2021-08-27 | 2022-08-25 | 一种多中心医学诊断知识图谱表示学习方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023547562A true JP2023547562A (ja) | 2023-11-10 |
JP7433541B2 JP7433541B2 (ja) | 2024-02-19 |
Family
ID=77798239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023535611A Active JP7433541B2 (ja) | 2021-08-27 | 2022-08-25 | 多中心医学診断知識グラフ表示学習方法及びシステム |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP7433541B2 (ja) |
CN (1) | CN113434626B (ja) |
WO (1) | WO2023025255A1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113434626B (zh) * | 2021-08-27 | 2021-12-07 | 之江实验室 | 一种多中心医学诊断知识图谱表示学习方法及系统 |
CN113990495B (zh) * | 2021-12-27 | 2022-04-29 | 之江实验室 | 一种基于图神经网络的疾病诊断预测系统 |
CN116364299B (zh) * | 2023-03-30 | 2024-02-13 | 之江实验室 | 一种基于异构信息网络的疾病诊疗路径聚类方法及系统 |
CN116072298B (zh) * | 2023-04-06 | 2023-08-15 | 之江实验室 | 一种基于层级标记分布学习的疾病预测系统 |
CN116564535B (zh) * | 2023-05-11 | 2024-02-20 | 之江实验室 | 基于隐私保护下局部图信息交换的中心疾病预测方法和装置 |
CN116757275B (zh) * | 2023-06-07 | 2024-06-11 | 京信数据科技有限公司 | 一种知识图谱的联邦学习装置及方法 |
CN116403728B (zh) * | 2023-06-09 | 2023-08-29 | 吉林大学第一医院 | 医疗就诊数据的数据处理装置和相关设备 |
CN116502129B (zh) * | 2023-06-21 | 2023-09-22 | 之江实验室 | 一种知识与数据协同驱动的不平衡临床数据分类系统 |
CN116525125B (zh) * | 2023-07-04 | 2023-09-19 | 之江实验室 | 一种虚拟电子病历的生成方法及装置 |
CN116821375B (zh) * | 2023-08-29 | 2023-12-22 | 之江实验室 | 一种跨机构医学知识图谱表示学习方法及系统 |
CN116825264B (zh) * | 2023-08-30 | 2023-11-21 | 青岛市妇女儿童医院(青岛市妇幼保健院、青岛市残疾儿童医疗康复中心、青岛市新生儿疾病筛查中心) | 基于互联网的妇产科信息处理方法及系统 |
CN117409911B (zh) * | 2023-10-13 | 2024-05-07 | 四川大学 | 一种基于多视图对比学习的电子病历表示学习方法 |
CN117116432B (zh) * | 2023-10-23 | 2023-12-15 | 博奥生物集团有限公司 | 一种疾病特征的处理装置和设备 |
CN117711578B (zh) * | 2024-02-06 | 2024-04-30 | 重庆医科大学绍兴柯桥医学检验技术研究中心 | 一种医学影像数据分析管理系统 |
CN117811722B (zh) * | 2024-03-01 | 2024-05-24 | 山东云海国创云计算装备产业创新中心有限公司 | 全局参数模型构建方法、秘钥生成方法、装置及服务器 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008083928A (ja) * | 2006-09-27 | 2008-04-10 | Gifu Univ | 医療情報抽出装置、及び医療情報抽出プログラム |
JP2014228907A (ja) * | 2013-05-20 | 2014-12-08 | 株式会社日立製作所 | 情報構造化システム |
WO2016157314A1 (ja) * | 2015-03-27 | 2016-10-06 | 株式会社日立製作所 | 計算機システム、及び、情報処理方法 |
CN106951684A (zh) * | 2017-02-28 | 2017-07-14 | 北京大学 | 一种医学疾病诊断记录中实体消歧的方法 |
CN107610770A (zh) * | 2016-07-11 | 2018-01-19 | 百度(美国)有限责任公司 | 用于自动化诊断的问题生成系统和方法 |
CN111739595A (zh) * | 2020-07-24 | 2020-10-02 | 湖南创星科技股份有限公司 | 一种医疗大数据共享分析方法及装置 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060136259A1 (en) * | 2004-12-17 | 2006-06-22 | General Electric Company | Multi-dimensional analysis of medical data |
CN106886543B (zh) * | 2015-12-16 | 2020-01-17 | 清华大学 | 结合实体描述的知识图谱表示学习方法和系统 |
US20170277841A1 (en) * | 2016-03-23 | 2017-09-28 | HealthPals, Inc. | Self-learning clinical intelligence system based on biological information and medical data metrics |
CN106874695B (zh) * | 2017-03-22 | 2019-10-25 | 北京大数医达科技有限公司 | 医疗知识图谱的构建方法和装置 |
CN107145744B (zh) * | 2017-05-08 | 2018-03-02 | 合肥工业大学 | 医学知识图谱的构建方法、装置及辅助诊断方法 |
CN108197290B (zh) * | 2018-01-19 | 2021-08-03 | 桂林电子科技大学 | 一种融合实体和关系描述的知识图谱表示学习方法 |
CN108614885B (zh) * | 2018-05-03 | 2019-04-30 | 杭州认识科技有限公司 | 基于医学信息的知识图谱分析方法及装置 |
CN109284396A (zh) * | 2018-09-27 | 2019-01-29 | 北京大学深圳研究生院 | 医学知识图谱构建方法、装置、服务器及存储介质 |
CN110347798B (zh) * | 2019-07-12 | 2021-06-01 | 之江实验室 | 一种基于自然语言生成技术的知识图谱辅助理解系统 |
CN111180061B (zh) * | 2019-12-09 | 2023-05-02 | 广东工业大学 | 融合区块链与联邦学习的共享医疗数据智能辅助诊断系统 |
CN111191020B (zh) * | 2019-12-27 | 2023-09-22 | 江苏省人民医院(南京医科大学第一附属医院) | 基于机器学习和知识图谱的处方推荐方法和系统 |
CN111292848B (zh) * | 2019-12-31 | 2023-05-16 | 同方知网数字出版技术股份有限公司 | 一种基于贝叶斯估计的医疗知识图谱辅助推理方法 |
CN111382272B (zh) * | 2020-03-09 | 2022-11-01 | 西南交通大学 | 一种基于知识图谱的电子病历icd自动编码方法 |
CN111858955B (zh) * | 2020-07-01 | 2023-08-18 | 石家庄铁路职业技术学院 | 基于加密联邦学习的知识图谱表示学习增强方法和装置 |
CN112364376A (zh) * | 2020-11-11 | 2021-02-12 | 贵州大学 | 一种属性代理重加密医疗数据共享方法 |
CN112765312B (zh) * | 2020-12-31 | 2022-05-10 | 湖南大学 | 一种基于图神经网络嵌入匹配的知识图谱问答方法和系统 |
CN113434626B (zh) * | 2021-08-27 | 2021-12-07 | 之江实验室 | 一种多中心医学诊断知识图谱表示学习方法及系统 |
-
2021
- 2021-08-27 CN CN202110995013.7A patent/CN113434626B/zh active Active
-
2022
- 2022-08-25 JP JP2023535611A patent/JP7433541B2/ja active Active
- 2022-08-25 WO PCT/CN2022/114879 patent/WO2023025255A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008083928A (ja) * | 2006-09-27 | 2008-04-10 | Gifu Univ | 医療情報抽出装置、及び医療情報抽出プログラム |
JP2014228907A (ja) * | 2013-05-20 | 2014-12-08 | 株式会社日立製作所 | 情報構造化システム |
WO2016157314A1 (ja) * | 2015-03-27 | 2016-10-06 | 株式会社日立製作所 | 計算機システム、及び、情報処理方法 |
CN107610770A (zh) * | 2016-07-11 | 2018-01-19 | 百度(美国)有限责任公司 | 用于自动化诊断的问题生成系统和方法 |
CN106951684A (zh) * | 2017-02-28 | 2017-07-14 | 北京大学 | 一种医学疾病诊断记录中实体消歧的方法 |
CN111739595A (zh) * | 2020-07-24 | 2020-10-02 | 湖南创星科技股份有限公司 | 一种医疗大数据共享分析方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2023025255A1 (zh) | 2023-03-02 |
CN113434626B (zh) | 2021-12-07 |
JP7433541B2 (ja) | 2024-02-19 |
CN113434626A (zh) | 2021-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7433541B2 (ja) | 多中心医学診断知識グラフ表示学習方法及びシステム | |
Wen et al. | A survey on federated learning: challenges and applications | |
Li et al. | A review of applications in federated learning | |
Marsan et al. | Stochastic evolutionary differential games toward a systems theory of behavioral social dynamics | |
Iyawa et al. | Digital health innovation ecosystems: From systematic literature review to conceptual framework | |
CN113205863B (zh) | 基于蒸馏的半监督联邦学习的个性化模型的训练方法 | |
Chen et al. | Metafed: Federated learning among federations with cyclic knowledge distillation for personalized healthcare | |
Alzubi et al. | Optimal multiple key‐based homomorphic encryption with deep neural networks to secure medical data transmission and diagnosis | |
Mandala et al. | Privacy preservation of data using crow search with adaptive awareness probability | |
CN111477337B (zh) | 基于个体自适应传播网络的传染病预警方法、系统及介质 | |
Alabdulkarim et al. | A Privacy-Preserving Algorithm for Clinical Decision-Support Systems Using Random Forest. | |
CN112289448A (zh) | 一种基于联合学习的健康风险预测方法和装置 | |
Chu et al. | Privacy-preserving self-taught federated learning for heterogeneous data | |
Anande et al. | Generative adversarial networks for network traffic feature generation | |
Cao et al. | Cross-silo heterogeneous model federated multitask learning | |
Sun et al. | Internet of things-assisted advanced dynamic information processing system for physical education system | |
Jamshidi et al. | Adjustable privacy using autoencoder-based learning structure | |
Wang et al. | [Retracted] Application of Improved Machine Learning and Fuzzy Algorithm in Educational Information Technology | |
Rathinaeaswari et al. | A New Efficient and Privacy-Preserving Hybrid Classification model for Patient-Centric Clinical Decision Support System | |
Wang et al. | Federated Knowledge Graph Completion via Latent Embedding Sharing and Tensor Factorization | |
Zhou et al. | A distributed and privacy-preserving random forest evaluation scheme with fine grained access control | |
Awoseyi et al. | Hybridization of decision tree algorithm using sequencing predictive model for COVID-19 | |
Zhang et al. | Research on Key Technologies of Personalized Intervention for Chronic Diseases Based on Case‐Based Reasoning | |
Dagli et al. | A proposed solution to build a breast cancer detection model on confidential patient data using federated learning | |
Wang et al. | GAN-based dual active learning for nosocomial infection detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230609 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20230705 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240206 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7433541 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |