JP6825389B2 - ヘルスケア・リスク推定システム及び方法 - Google Patents

ヘルスケア・リスク推定システム及び方法 Download PDF

Info

Publication number
JP6825389B2
JP6825389B2 JP2017014692A JP2017014692A JP6825389B2 JP 6825389 B2 JP6825389 B2 JP 6825389B2 JP 2017014692 A JP2017014692 A JP 2017014692A JP 2017014692 A JP2017014692 A JP 2017014692A JP 6825389 B2 JP6825389 B2 JP 6825389B2
Authority
JP
Japan
Prior art keywords
risk
term
terms
healthcare
entities
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017014692A
Other languages
English (en)
Other versions
JP2017174406A (ja
Inventor
ラ トーレ・ビクトール デ
ラ トーレ・ビクトール デ
ビリャソン−テラサス・ボリス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB1605113.8A external-priority patent/GB201605113D0/en
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2017174406A publication Critical patent/JP2017174406A/ja
Application granted granted Critical
Publication of JP6825389B2 publication Critical patent/JP6825389B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/60ICT specially adapted for the handling or processing of medical references relating to pathologies
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/20ICT specially adapted for the handling or processing of medical references relating to practices or guidelines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、個人又は対象(通常、「患者」と言及される)のヘルスケアを評価することに関連する。患者は人間であってもよいし、あるいは、希少種族(rare breed)の検体又はペットでさえあってもよいものの試料などのような動物であってもよい。多くの状況において、患者は既に不調を煩っているかもしれないが、それ以外において患者は今のところ健康的である。本発明は、医療、健康管理及び獣医学などに広く適用可能である。
医薬において、リスクは、患者又は患者集団の健康に対してマイナスの成果をもたらす確率として考えることが可能である。健康リスク要因は、人が病気又は健康障害を助長する確率を増やす属性、特性又は体調悪化として観察されることが可能である。
医薬における重要なタスクのうちの1つは、リスクの評価である。このタスクは、これらの要因の定量化とともに、厳格な薬学研究から得られる科学的な知識を当てにしている。しかしながら、現在のリスク評価ソリューションは、通常、リスク評価に対する非常に限られた医学的知識しか考慮に入れておらず、多くの場合、このリスクに関連する知識はそのソリューションの中でハードコード化されている。
臨床診察では、様々な状態を発展させる患者のリスクを推定するために、多くのプロトコルが設計されている。しかしながら、多くの場合、所与の患者に対する健康のリスクは、単純なリストとして表現されているが、実際には、これらのリスクは相互に結び付いている。様々なリスク間の結び付き(又はリンク)は、様々なレベルで(すなわち、様々な形式で及び/又は様々なウェイトで)設定されることが可能である。例えば、患者の遺伝的背景に含まれるリスク、薬の逆効果、生活スタイル等は、全て異なるリンクである。
最近、健康の研究団体が、ゲノム、毒薬物、被爆及び疾患のデータ等のような有用な健康データの収集及びそれに対するアクセス提供が順調に進行している。リスク評価の分野に、これらの大量のデータを適用する際に障害は、特に、被爆、薬物、処置及び病気における関係を発見するために、非常に多数の定期刊行物、非常に多数のデータベース、多数のオントロジを収集し、不要なものを削除し(clean)及び処理する方法、ツール及び技術が不足していることである。
本発明の第1側面の実施形態によれば、ヘルスケア・リスク推定システムが提供され、本システムは:
医師によるタームの入力を受け入れるリスク関連ターム収集部であって、前記医師によるタームは、潜在的な障害の形態にあるリスクに関連するタームと、障害の可能性を増やすリスク要因に関連するタームと、医学的状態についての処置に関連するタームとを含む、リスク関連ターム収集部;
タームの標準的な語彙を利用して、類義語及び同義語を含むように、前記医師によるタームを標準化及び拡張する医療エンティティ・リコンシリエーター;
拡張されたタームにリンクされる一群の文書を、医療文書データベースから取得するトピック検出及びタグ付け部;
前記一群の文書からエンティティを抽出する固有表現抽出−分解−曖昧性解消(NERD)モジュールであって、各々の文書は標準化された語彙に調整されている、NERDモジュール;及び
取得された一群の文書中の文書における2つのエンティティの共起性に基づいて、エンティティ間の関係にスコアを付ける関係抽出部;
を有し、前記ヘルスケア・リスク推定システムは、前記エンティティ及びスコアが付されたそれらの関係を保存するリスク・ナレッジ・グラフを生成するように構成される、ヘルスケア・リスク推定システムである。
リスク・ナレッジ・グラフは、(1人以上の医師からの)医師の知識と公のデータとを混合(又は融合)し、リスク、リスク要因に対する関係及び処置を提示する際にユーザーにとって計り知れない新たな情報群を提供する。
本システムは、リスク・ナレッジ・グラフを表示し、生成されたグラフをマニュアルでキュレートする(curate)ための医師の入力を受け入れるナレッジ・グラフ・キュレータを更に有してもよい。
リスク関連ターム収集部は、リスク、リスク要因及び処置のカテゴリ毎に、タームのリスト(又は複数のリスト)としてタームを受け入れるように構成されてもよい。これは、プレーン・テキストの入力であってもよく、医師(又は複数の医師)は、例えばターム間のリンク等のような何らかの他の情報を入力する必要がない。
トピック検出部(及びタグ付け部)は、例えば、文書が由来する定期刊行物は何であるか、刊行物の日付は何時であるか等のような文書の起源(provenance)を考慮するように構成されることが可能である。この起源は、スコアを付けるため及び後の他の目的で考慮に入れることが可能である。
この場合、リスク・ナレッジ・グラフは、エンティティの起源も保存することが可能である。これは、そのような外的な情報をユーザーに提供することが可能である。
リスク関連ターム収集部(又はシステムの他のコンポーネント)は、タームの標準的な語彙による医師による注釈を受け入れるように構成されてもよく、注釈は、リスク、リスク要因及び処置のカテゴリにおける語彙をラベル付けしている。この情報は、上記のように入力される注釈に起因して有用になるかもしれない。このタグ付けプロセスは重要であり、その理由は、タグ付けが文書のメイン・トピックを識別することが可能だからであり、従って、システムは、主要なトピックと文書の固有表現(named entity)との間の関連性を作成することが可能になる。これはコンテキストを取り扱う特殊な方法の1つである。
一実施形態では、NERDモジュールは、標準的な語彙のタームと、抽出されたリンクした文書中の対応するターム(又は複数のターム)との間の合致精度を反映するように、各々のエンティティのスコアを付ける。
本システムは、ユーザーによるタームの入力を受け入れるユーザー入力部、及び/又は、ユーザーに表示するためにグラフのうち関連する部分を選択するサブグラフ選択モジュールを更に有してもよい。例えば、この機能はグラフィカル・ユーザー・インターフェース(GUI)を利用して提供されてもよい。
本システムは、或る言語でタームを受け入れ、当該タームを、標準的な語彙の言語における同義語に翻訳する翻訳モジュールを更に有してもよい。
本発明の別の側面の実施形態によれば、コンピュータにより実行されるヘルスケア・リスク推定方法が提供され、本方法は:
医師によるタームの入力を受け入れる工程であって、前記医師によるタームは、潜在的な障害の形態にあるリスクに関連するタームと、障害の可能性を増やすリスク要因に関連するタームと、医学的状態についての処置に関連するタームとを含む、工程;
タームの標準的な語彙を利用して、類義語及び同義語を含むように、前記医師によるタームを標準化及び拡張する工程;
拡張されたタームにリンクされる一群の文書を、医療文書データベースから取得する工程;
前記一群の文書からエンティティを抽出する工程であって、各々の文書は標準化された語彙に調整されている、工程;及び
取得された一群の文書中の文書における2つのエンティティの共起性に基づいて、エンティティ間の関係にスコアを付ける工程;
を有し、リスク・ナレッジ・グラフは、前記エンティティ及びスコアが付されたそれらの関係を保存する、方法である。
本発明の別の側面の実施形態によれば、コンピュータで実行される場合に、上記の方法を実行するコンピュータ・プログラムが提供される。
本発明の好適な実施形態による方法又はコンピュータ・プログラムは、上記の装置形態の任意の組み合わせを構成することが可能であり、関連するシステムの具体的な部分に関する制限を受けない。これらの更なる実施形態による方法又はコンピュータ・プログラムは、処理及びメモリ能力を要するコンピュータで実行されるものとして説明されることが可能である。
好ましい実施形態による装置は、所定の機能を実行するように構成又は配置され、或いは単に実行するように説明される。その構成又は配置は、ハードウェア、ミドルウェア又は適切な他の何らかのシステムにより使用されることが可能である。好ましい実施形態では、構成又は配置はソフトウェアによるものであってもよい。
従って、一側面によればプログラムが提供され、プログラムは、少なくとも1つのコンピュータにロードされると、上記のシステムの詳細のうちの何れか又はそれらの任意の組み合わせによるシステムとなるように、コンピュータを構築する。
別の側面によればプログラムが提供され、そのプログラムは、少なくとも1つのコンピュータにロードされると、上記の方法の詳細のうちの何れか又はそれらの任意の組み合わせによる方法ステップを実行するように、少なくとも1つのコンピュータを構築する。
一般に、コンピュータは、設定される機能を提供するように構成又は配置されるようにリスト化された要素を有する。例えば、コンピュータは、メモリ、プロセッサ及びネットワーク・インターフェースを含んでいてもよい。
本発明は、ディジタル電子回路で実現されることが可能であり、或いは、コンピュータ・ハードウェア、ファームウェア、ソフトウェアで実現されることが可能であり、或いは、それらの組み合わせで実現されることも可能である。本発明は、コンピュータ・プログラム又はコンピュータ・プログラム・プロダクトとして実現されることが可能であり、例えば、1つ以上のハードウェア・モジュールによる動作又はそれらを制御するために、マシン読み取り可能な記憶デバイス等のような非一時的な情報キャリア或いは伝送される信号に具体的に組み込まれるコンピュータ・プログラムとして実現されてもよい。コンピュータ・プログラムは、スタンド・アローン・プログラム、コンピュータ・プログラムの一部分、或いは、1つより多いコンピュータ・プログラム等の形式であるとすることが可能であり、かつ、コンパイルされる又はインタープリットされる言語を含む任意の形式のプログラミング言語で書き込まれることが可能であり、コンピュータ・プログラムは、スタンド・アローン・プログラムとして、モジュールとして、コンポーネントとして、サブルーチンとして、或いは、データ処理環境で使用するのに適した他のユニットとしての形態を含む任意の形態で配備されることが可能である。コンピュータ・プログラムは、1つのモジュールで実行されるように、1つのサイトにおける複数のモジュールにおいて実行されるように、或いは、複数のサイトにわたって分散されて通信ネットワークにより相互接続されるように配備されることが可能である。
本発明の方法ステップは、入力データに処理を施して出力を生成することにより本発明の機能を実行するように、コンピュータ・プログラムを実行する1つ以上のプログラム可能なプロセッサにより実行されることが可能である。本発明による装置は、プログラム可能なハードウェアとして又は特定目的の論理回路として実現されることが可能であり、例えば、FPGA(フィールド・プログラマブル・ゲート・アレイ)又はASIC(特定用途向け集積回路)を含んでもよい。
コンピュータ・プログラムの実行に相応しいプロセッサは、例えば、汎用及び専用双方のマイクロプロセッサ、任意の種類のディジタル・コンピュータの任意の1つ以上のプロセッサを含んでよい。一般に、プロセッサは、リード・オンリ・メモリ又はランダム・アクセス・メモリ又はそれら双方から、命令及びデータを受信する。コンピュータの本質的な要素は、命令を実行するプロセッサであり、プロセッサは、命令及びデータを保存する1つ以上のメモリ・デバイスに結合される。
本発明は特定の実施形態の観点から説明される。他の実施形態も特許請求の範囲に属する。例えば、本発明の目的は、異なる順序で実行され、それでも所望の結果をもたらすことが可能である。
オブジェクト指向プログラミング技術を利用することなく、複数のテスト・スクリプト・バージョンが編集及び起動されることが可能であり;例えば、スクリプト・オブジェクトの要素は、構造化されたデータベース又はファイル・システムで組織化されることが可能であり、スクリプト・オブジェクトにより実行されるように記述されるオペレーションは、テスト制御プログラムにより実行されることが可能である。
本発明の要素は、「モジュール」及び「ユニット」という用語及び機能的な定義を利用して記述されている。当業者は、そのような用語及びそれらの均等物は、個別的ではあるが、規定された機能を提供するように組み合わせるシステムの一部を指してもよいことを認めるであろう。また、システムのうち同じ物理的な部分が、規定される機能のうちの2つ以上を提供してもよい。
例えば、別々に規定される手段は、必要に応じて、同じメモリ及び/又はプロセッサを利用して実現されてもよい。
以下、本発明の好ましい特徴が、単なる一例として、添付図面に関連して説明される。
本発明の一般的な実施形態におけるコンポーネントのブロック図。 一般的な実施形態における方法のフローチャートを示す図。 詳細な実施形態における主要なシステム・コンポーネントのブロック図。 医療エンティティ・リコンシリエーションの基礎的な具体例を示す図。 PUBMED文書のトピック・タグ付け及び検出を説明するためのブロック図。 NERDを説明するためのブロック図。 関係推定を説明するためのブロック図。 情報グラフからの引用を説明するための図。 本発明の実施形態に相応しいハードウェアを示す図。
概して、本願の発明者等は、健康管理の分野において、次のような洞察に至った:
・リスク要因、並びに、薬、治療及び病気に対する関連性とともに健康リスクを表現するための標準的な手法は存在しないこと。
・リスクに関するデータ及びリスク要因を取得し、キュレートし、リコンサイル(reconcile)し、及び、インテグレート(integrate)するための方法及びツールが欠如していること。
従って、実施形態は、次のことを目指している:
・リスク及びリスク要因に対する関連する概念を識別すること、並びに、潜在的にはこれらの定義を医者により確認すること。
・リスク要因、並びに、薬、治療及び病気に対するそれらの関連性とともにヘルス・リスクのグラフを作成すること。データは、リスク評価に関する医者の専門知識とともに、文献及び公のデータソースから取り出されることが可能である。
精密医療(precision medicine)は、個々の患者/対象に対して特化されたヘルスケアのカスタム化を目的とする医療モデルである。これは、遺伝子、肉体、生体組織、環境及び生活様式における個人的な相違を考慮に入れる疾患治療、処置及び予防のための新しいアプローチである。この文脈において、本実施形態は、リスク要因、関連する処置、病気及び薬とともに健康リスクのナレッジ・グラフ(Knowledge Graph)を作成することを目指している。
本願では以下の定義が使用される:
健康リスク:平均的な疾患率又は致死率より高く関連付けられる病気の前兆。病気の前兆は、人口統計学変数、所定の個々人の行動、家族的及び個人的な病歴、及び、所定の生理学的な変化を含む。
健康リスク要因:リスクを増やす状態、行動又はその他の要因(例えば、鬱病は自殺のリスク要因である)。
医学的処置:患者の管理及び世話であり、例えば、メンタル・ヘルスの分野における看護、生理的な介護、及び、専門家によるメンタル・ヘルス・リハビリテーション等を含む。このターム(又は用語)は、「代替的な」医学的処置、及び、薬剤(例えば、望まれる場合に、ホメオパシー療法/催眠療法/針治療などが処方されてもよい)を含んでもよい。
診断:病気の兆し及び症状から、病気又は状態の性質及び状況の検査による判断するプロセス。
ドラッグ:病気の兆候又は状態を、処置又は予防又は緩和する薬。
発明者等が認識している範囲内では、健康リスクを取り扱うための標準的なリソースは存在しておらず、医学的機関の中で及び特定の領域に関する単なるリストのようなその場しのぎのリソースしか存在していない。
概要:
・例えばICD9及びICD10(病気の国際分類の第9版及び第10版)のように病気に関してスタンダードが存在するのと同様な仕方で、健康リスクを表現するスタンダードは存在していない;リスクの簡易なリストが存在するに過ぎず、それらは特定の医療機関又は領域に特化したものである;
・医療雑誌刊行物、データベース及びオントロジから、リスク及びリスク因子に関するデータを、取得、キュレート、リコンサイル及びインテグレートするための方法及びツールが欠如している。
本実施形態は、病気、治療、薬及び兆候に対する関連性及びリスク要因とともに、医学的リスクのナレッジ・グラフを生成する。
図1は、一般的な実施形態によるヘルスケア・リスク推定システムを示し、本システムは、本質的には健康リスク・エンジン10を有し、そのエンジンは、医者からの入力を受け入れ、(i)タームの標準的な語彙の形式で、及び、(ii)ヘルスケア・ドメイン、看護、獣医学、健康管理、医療及び科学の文献による文書ライブラリの形式で、オープンデータに接続される。以下において個々のモジュールが更に説明されるが、簡明化のため、健康リスク・エンジンの中に明示されていない。
リスク関連ターム収集部は、医者による(又は医者のグループからの)タームの入力を受け入れる。これらの医者からのタームは、潜在的な病気の形式でリスクに関連するターム、病気の可能性を増やすリスク要因に関連するターム、及び、医学的状況に対する治療に関するタームを含む。
医療エンティティ・リコンシリエーターは、タームの標準的な語彙を利用して、類似するターム及び同義のタームを包含するように、医者からのタームを標準化及び拡張するために使用される。例えば、SNMEDオントロジが使用されてもよく、この点については後述される。
トピック・ディテクタは、検索可能な医療文献データベース(例えば、PUBMED)から、拡張されたタームにリンクされる一群の文書を抽出するために使用される。本質的には、このコンポーネントは、文書の内容(例えば、文書の要約)と、標準化されたタームとを比較し、厳密にそれらのタームを含む文書、又は、それらのタームに非常に合致する文書を選択する。
固有表現抽出、分解及び曖昧性解消(named entity recognition, resolution and disambiguation:NERD)モジュールは、各々がスコアを有し且つ各々が標準化されたタームに整合する一群の文書からエンティティを抽出する。すなわち、エンティティは、例えば、SNOMED語彙から取得されてもよいが、文書内容に合致している。
関係推定部は、文書中の2つのエンティティの共起性(co-occurrence)、及び、抽出された一群の文書中の内容に基づいて、エンティティ間の関係にスコアを付ける。例えば、これは、既存の共起性メトリック及び適切な他の任意の技法を使用することが可能である。
ヘルスケア・リスク推定システムは、エンティティ及びそれらのスコアが付された関係(又はリレーション)を保存するリスク・ナレッジ・グラフ80を生成するように構成される。グラフは、上述したパーツにより生成されてもよい。そして、グラフは、(例えば、他の医者であるかもしれない)ユーザーに表示されることが可能である。例えば、ユーザーは、リスク、リスク要因及び処置などのようなタームを入力し、かつ、PUBMEDライブラリに黙示的に保存されているナレッジ(又は知識又は情報)に基づいて、リンクされたタームのサブグラフ及びリンクの強さ(strength)を受信してもよい。
図2は対応するフローチャートを示す。S10において、システムは医師によるタームの入力を受け入れる。ステップS20において、これらは、拡張及び標準化のために、広範囲に及ぶ標準語彙とともにリコンサイルされる。ステップS30において、拡張されたタームにリンクされるもののような関連する文書が、文書データベースから取得される。ステップS40において、一群の文書からエンティティが取得され、各々のエンティティは標準語彙に整合している。ステップS50において、エンティティ間の関係が、取得された一群の文書中の文書における2つ(又はそれ以上の)エンティティの共起性に基づいて採点される(スコアが付される);最終的に、ステップS60において、エンティティ及びそれらのスコアが付された関係を保存するリスク・ナレッジ・グラフが生成される。例えば、(文書全体ではなく)文書IDの形式で、エンティティの起源が保存されてもよい。上述したように、上記のステップはグラフを一緒に提供してもよく、その場合、別個のステップS60は不要になる。
詳細な実施形態は以下のメインモジュールから構成されてもよい:
・医師の知識から、一群のリスク関連タームを収集するモジュール。
・スノメド(Systemized Nomenclature of Medicine:SNOMED(薬の体系化された命名法))によるエンティティに対して、関連タームをリコンサイルする。
・一群のリスク関連定義から初期ナレッジ・モデルを生成し、SNOMEDの概念にリンクするモジュール。
・識別されたSNOMED概念に基づいて、PUBMED文書により、リスク・トピック文書識別を実行するモジュール。PUBMEDは、アメリカ国立医学図書館(US National Library of Medicine:NLM)のサービスであり、看護、獣医学、健康管理、薬、及び、科学の記事に対する自由なアクセスを提供する。
・上記のモジュールからの結果の文書に関し、固有表現抽出、分解及び曖昧性解消(NERD)を実行するモジュール。
・上記のモジュールから抽出されたエンティティに関し、関係の推定を実行するモジュール。
・医師の支援とともに、エンティティ及び関係をキュレート及びリファインするモジュール。
前提とする概念のうちの1つは、使用されるデータは、広範囲に及ぶ様々なリスク及びリスク要因をカバーしていることであり;本実施形態は所定の医薬の領域に限定されない。例えば、「SNOMED CT」(医学用語)は、一般に医学及び健康管理の領域に使用可能である標準化された多言語語彙である。PUBMEDも、「US NLM」として広く普及しており、一般に適用可能である。
簡単に言えば、詳細な実施形態のうちのシステム又は健康リスク・エンジン10は、以下に説明され且つ図3に示される6つのメインモジュールを有する。
<リスク関連ターム収集部20>
このコンポーネントは、健康管理に従事する者、医師、看護師及び獣医学従事者などのうちの1人以上(以下、「医師等」と言及される)との相互作用を担当し、医師等は、リスクに関連付けられるターム(リスク関連ターム)のシード(seed)をシステムに入力する。医師等により、タームは以下の3つのメイングループにグループ化されてもよい:
・リスクに関連するターム;
・リスク要因に関連するターム;及び
・治療に関連するターム。
リスクの定義によれば、健康リスクは、患者の健康に対してマイナスの影響を及ぼす確率であり、マイナスの影響は特定の病気であってもよいし、或いは、死とすることさえ可能である。従って、リスク・グループに属するタームは、潜在的な病気(又は状態、通常的には、病又は障害を含む)のリストになる言葉である。
タームは、医師により下位のグループに細分されて入力されてもよい。
リスク因子は、例えば、以下のサブグループにグループ化されてもよい:
・環境
・層/環境
・・年齢
・・性別
・・家系(又は血筋)
・・場所
・・宗教
・人間のゲノムにハードコード化される状態に対する傾向、遺伝
・(以下のような傾向を有する)行動
・・タバコの喫煙
・・不健康な食事
・・運動不足
・・アルコール摂取
・・危険な性行為
・生物医学(患者の健康に影響を及ぼし得る医師の診断及び状態を含む)
・・糖尿病
・・妊娠
・・高血圧
・・空腹時の異常血糖値
・最後に、「治療(又は処置)」は以下のサブグループにグループ化されることが可能である:
・投薬(投与方法及び投与量を含む)
・手術手順
・頻度及び期間を含む管理方法
上記は、医師の専門性により示唆される仮の初期ターム群であるに過ぎず、この段階でこれらは網羅的なものでも完全なリストでもないことは、言及に値する。
このコンポーネントは、改善された一群のタームを収集してシステムに保存してもよい。
<医療エンティティ・リコンシリエーション>
このコンポーネントは、同じ現実世界の対象についての複数の表現を識別することを目指しており、言い換えれば、2つの異なるデータソースにおける等価なタームを識別する。この特定の場合、医師から収集したタームとSNOMEDとの間でマッチング/アライメントを実行することにより、タームの標準的な多言語語彙が、個人のケアに関連付けられる。コンポーネントの成果は、SNOMEDの観点から注釈される、医師により提案される、改善された一群のタームを有することになる。例えば、「高血圧」は、医師により示唆されるリスク・タームに由来するタームであって、SNOMEDのうちの「高血圧障害」、「全身動脈」(疾患)に対応するタームである。リコンシリエーションは、SNOMEDを採用し、医師のタームを潜在的な同義語としておく。コンプロセスは、2つの異なるソースからのタームを整合させるための既存の利用可能なアプローチを当てにすることが可能である。図4は上記の例を示す。
<トピック検出及びタグ付けプロセッサ40>
SNOMED語彙の観点から入力情報を突合すると、一群のPUBMEDの文書を抽出し、トピック検出を実行し、かつ、SNOMEDタームに従ってそれらのタグ付けを行う状態に段階に至る。基本的には、このコンポーネントは、関連するカテゴリを検出及びタグ付けし、関連するカテゴリは、以前に識別された以下のものである:
・リスク(それが含む記述を伴う)
・リスク要因(医師により識別されるタームを含む)
・治療(識別されたサブカテゴリを伴う)。
コンポーネントの出力は、これらのカテゴリのうちのそれぞれによるPUBMED文書グループのクラスタになる。文書は、1つ以上のカテゴリに含まれることが可能である。図5はこのコンポーネントの一般的なフローを示す。
<NERDプロセッサ50>
このコンポーネントは、以前に生成されたPUBMED文書の各クラスタから、医療エンティティを認識して曖昧さを除外することを担当する。コンポーネントの出力は、SNOMED概念に整合する、それらのスコアを伴う一群の抽出されたエンティティである。図6はコンポーネントについてのフローを示す。このコンポーネントは、医療エンティティのリコンシリエーション・コンポーネントの何らかの機能を再利用する。
<関係推定部60>
このコンポーネントの主な目的は、以前に識別されたエンティティの「関係」を推定することである。推定された「関係」は、その「関係」が存在していた文献の数に基づくスコアも有する。これは、例えば、双方のエンティティを含む文書数を文書の総数で除算したものに基づき;且つコンテキストに基づく共起性スコアに関する既存の利用可能なアプローチを当てにすることが可能である。
図7はコンポーネントの相互作用を示す。この特定の例では、コンポーネントは、「不安神経症」と「鬱病」との間の関係を、0.7というスコアの併存症として識別し、「鬱病」と「セルトラリン」との間の関係を「処置」として識別ことが可能であり、後者の理由は鬱病の処方薬がしばしばセルトラリンであることに起因する。
ラベルは、ターム収集部又は他のモジュールを利用して、リスク、リスク要因及び処置とともに、SNOMEDの以前の注釈により利用可能である。例えば、2つのリスク同士の間のリンクに「併存症(co-morbidity)」というラベルが付され、リスクとリスク要因との間のリンクに「リスク要因」というラベルが付され、処置とリスク又はリスク要因との間のリンクに「処置」というラベルが付される。
<ナレッジ・グラフ・キュレータ70>
最後のモジュールは、抽出されたエンティティをそれらの関係によって統合することを目指すものであり、スコア情報及び起源情報をリスク・ナレッジ・グラフに統合することを含む。この起源情報(provenance information)は、関係の識別を支援する関連文書IDを含む。
システムは、非常に直感的な方法で医師にリスク・ナレッジ・グラフを提示し、そして医師は生成されたグラフのうちの何らかの潜在的な矛盾(inconsistencies)をマニュアルでキュレート及び決定することが可能である。
本発明の実施形態は、医師のサポートとともに、リスク・ナレッジ・グラフ80の生成を許容する仕組みを提供し、そのグラフは更に精密な方法で患者のリスクを識別するための基礎となる。グラフは、エンジンと同じロケーションに保存されてもよいし、或いは、別々に提供されてもよい。エンジン及び/又はグラフは、クラウドで提供されてもよい。
図8はグラフのうちの僅かな部分を示し、リスク(黒みがかった灰色の影が付されている)、リスク要因及び処置を示す。各々のエンティティはスコア(例えば、不安神経症−0.9)を有し、スコアは、抽出された一群の文書中の文書全体に対する類似度(similarity)を示す。1は全ての関連文書における同じタームがあること示す。一群の文書における共起性を利用して及び/又はそれらのコンテキスト(又は文脈)に基づいて、上述したエンティティ同士の間の関係及びスコアとともに、リンクにラベルが付されている。
図9は、データ・ストレージ・サーバのようなコンピューティング・デバイスのブロック図であり、そのコンピューティング・デバイスは、本発明を組み込み、実施形態による方法を実現するために使用される。コンピューティング・デバイスは、コンピュータ・プロセシング・ユニット(CPU)993、ランダム・アクセス・メモリ(RAM)995のようなメモリ、ハード・ディスク996のようなストレージを有する。選択的に、コンピューティング・デバイスは、実施形態によるそのような他のコンピューティング・デバイスと通信するためのネットワーク・インターフェース999を含む。例えば、実施形態はそのようなコンピューティング・デバイスのネットワークにより構成されてもよい。選択的に、コンピューティング・デバイスは、リード・オンリ・メモリ994、キーボード及びマウス998のような1つ以上の入力手段、及び、1つ以上のモニタ997のようなディスプレイ・ユニットも含む。コンポーネントは、バス992を介して互いに接続されることが可能である。
CPU993は、コンピューティング・デバイスを制御し、処理オペレーションを実行するように構成される。RAM995は、CPU993により読み込まれる及び書き込まれるデータを保存する。ストレージ・ユニット996は、例えば、不揮発性ストレージ・ユニットであってもよく、データを保存するように構成される。
ディスプレイ・ユニット997は、コンピューティング・デバイスにより保存されたデータの表現を表示し、カーソル及びダイアログ・ボックスを表示し、コンピューティング・デバイスに保存されるデータ及びプログラムとユーザー/医師との間で動作されるやり取りを映す。入力手段998は、コンピューティング・デバイスにデータ及び命令を入力することを、ユーザー/医師が実行できるようにする。
ネットワーク・インターフェース(ネットワークI/F)999は、インターネット等のようなネットワークに接続され、ネットワークを介して、そのような他のコンピューティング・デバイスに接続することが可能である。ネットワークI/F999は、ネットワークを介して、他の装置から/への、データ入力/出力を制御する。マイクロフォン、スピーカ、プリンタ、電源ユニット、ファン、ケース、スキャナ、トラックボール等のような他のペリフェラル・デバイスが、コンピューティング・デバイスに含まれてもよい。
本発明を組み込む方法は、図9に示されるようなコンピューティング・デバイスで実行されてもよい。そのようなコンピューティング・デバイスは、図9に示される全てのコンポーネントを有する必要はなく、それらのコンポーネントのうちの一部分により構成されてもよい。本発明を組み込む方法は、ネットワークを介して1つ以上のデータ・ストレージ・サーバと通信する単独のコンピューティング・デバイスにより実行されてもよい。コンピューティング・デバイスは、データ・グラフの少なくとも一部を保存するデータ・ストレージそのものであってもよい。本発明を組み込む方法は、互いに協調して動作する複数のコンピューティング・デバイスにより実行されてもよい。複数のコンピューティング・デバイスのうちの1つ以上は、データ・グラフの少なくとも一部を保存するデータ・ストレージ・サーバであってもよい。
以上の実施の形態に関し、更に以下の付記を開示する。
(付記1)
ヘルスケア・リスク推定システムであって:
医師によるタームの入力を受け入れるリスク関連ターム収集部であって、前記医師によるタームは、潜在的な障害の形態にあるリスクに関連するタームと、障害の可能性を増やすリスク要因に関連するタームと、医学的状態についての処置に関連するタームとを含む、リスク関連ターム収集部;
タームの標準的な語彙を利用して、類義語及び同義語を含むように、前記医師によるタームを標準化及び拡張する医療エンティティ・リコンシリエーター;
拡張されたタームにリンクされる一群の文書を、医療文書データベースから取得するトピック検出及びタグ付け部;
前記一群の文書からエンティティを抽出する固有表現抽出−分解−曖昧性解消(NERD)モジュールであって、各々の文書は標準化された語彙に調整されている、NERDモジュール;及び
取得された一群の文書中の文書における2つのエンティティの共起性に基づいて、エンティティ間の関係にスコアを付ける関係抽出部;
を有し、前記ヘルスケア・リスク推定システムは、前記エンティティ及びスコアが付されたそれらの関係を保存するリスク・ナレッジ・グラフを生成するように構成される、ヘルスケア・リスク推定システム。
(付記2)
前記リスク・ナレッジ・グラフを表示し、生成されたグラフをマニュアルでキュレートするための医師の入力を受け入れるナレッジ・グラフ・キュレータを更に有する付記1に記載のヘルスケア・リスク推定システム。
(付記3)
前記リスク関連ターム収集部は、リスク、リスク要因及び処置のカテゴリ毎のタームのリストとして、タームを受け入れるように構成される、請求項1又は2に記載のヘルスケア・リスク推定システム。
(付記4)
前記トピック検出及びタグ付け部は、前記文書の起源を考慮するように構成されている、請求項1ないし3のうちの何れか一項に記載のヘルスケア・リスク推定システム。
(付記5)
前記リスク・ナレッジ・グラフは、前記エンティティの起源も保存する、付記1ないし4のうちの何れか一項に記載のヘルスケア・リスク推定システム。
(付記6)
前記リスク関連ターム収集部は、前記タームの標準的な語彙による前記医師による注釈を受け入れるように構成され、前記注釈は、リスク、リスク要因及び処置のカテゴリにおける語彙をラベル付けする、請求項1ないし5のうちの何れか一項に記載のヘルスケア・リスク推定システム。
(付記7)
前記トピック検出及びタグ付け部は、リスク、リスク要因及び処置のカテゴリに応じて前記文書にタグ付けするように構成される、付記1ないし6のうちの何れか一項に記載のヘルスケア・リスク推定システム。
(付記8)
前記NERDモジュールは、標準的な語彙のタームと、抽出されたリンクした文書中の対応するタームとの間の合致精度を反映するように、各々のエンティティのスコアを付ける、付記1ないし7のうちの何れか一項に記載のヘルスケア・リスク推定システム。
(付記9)
ユーザーによるタームの入力を受け入れるユーザー入力部と、前記ユーザーに表示するためにグラフのうち関連する部分を選択するサブグラフ選択モジュールとを更に有する、付記1ないし8のうちの何れか一項に記載のヘルスケア・リスク推定システム。
(付記10)
或る言語でタームを受け入れ、当該タームを、前記標準的な語彙の言語で同義語に翻訳する翻訳モジュールを更に有する、付記1ないし9のうちの何れか一項に記載のヘルスケア・リスク推定システム。
(付記11)
コンピュータにより実行されるヘルスケア・リスク推定方法であって:
医師によるタームの入力を受け入れる工程であって、前記医師によるタームは、潜在的な障害の形態にあるリスクに関連するタームと、障害の可能性を増やすリスク要因に関連するタームと、医学的状態についての処置に関連するタームとを含む、工程;
タームの標準的な語彙を利用して、類義語及び同義語を含むように、前記医師によるタームを標準化及び拡張する工程;
拡張されたタームにリンクされる一群の文書を、医療文書データベースから取得する工程;
前記一群の文書からエンティティを抽出する工程であって、各々の文書は標準化された語彙に調整されている、工程;及び
取得された一群の文書中の文書における2つのエンティティの共起性に基づいて、エンティティ間の関係にスコアを付ける工程;
を有し、リスク・ナレッジ・グラフは、前記エンティティ及びスコアが付されたそれらの関係を保存する、ヘルスケア・リスク推定方法。
(付記12)
付記11に記載のヘルスケア・リスク推定方法をコンピュータに実行させるコンピュータ・プログラム。

Claims (12)

  1. ヘルスケア・リスク推定システムであって:
    医師によるタームの入力を受け入れるリスク関連ターム収集部であって、前記医師によるタームは、潜在的な障害の形態にあるリスクに関連するタームと、障害の可能性を増やすリスク要因に関連するタームと、医学的状態についての処置に関連するタームとを含む、リスク関連ターム収集部;
    タームの標準的な語彙を利用して、類義語及び同義語を含むように、前記医師によるタームを標準化及び拡張する医療エンティティ・リコンシリエーター;
    拡張されたタームにリンクされる一群の文書を、医療文書データベースから取得するトピック検出及びタグ付け部;
    前記一群の文書からエンティティを抽出する固有表現抽出−分解−曖昧性解消(NERD)モジュールであって、各々の文書は標準化された語彙に調整されている、NERDモジュール;及び
    取得された一群の文書中の文書における2つのエンティティの共起性に基づいて、エンティティ間の関係にスコアを付ける関係抽出部;
    を有し、前記ヘルスケア・リスク推定システムは、前記エンティティ及びスコアが付されたそれらの関係を保存するリスク・ナレッジ・グラフを生成するように構成される、ヘルスケア・リスク推定システム。
  2. 前記リスク・ナレッジ・グラフを表示し、生成されたグラフをマニュアルでキュレートするための医師の入力を受け入れるナレッジ・グラフ・キュレータを更に有する請求項1に記載のヘルスケア・リスク推定システム。
  3. 前記リスク関連ターム収集部は、リスク、リスク要因及び処置のカテゴリ毎のタームのリストとして、タームを受け入れるように構成される、請求項1又は2に記載のヘルスケア・リスク推定システム。
  4. 前記トピック検出及びタグ付け部は、前記文書の起源を考慮するように構成されている、請求項1ないし3のうちの何れか一項に記載のヘルスケア・リスク推定システム。
  5. 前記リスク・ナレッジ・グラフは、前記エンティティの起源も保存する、請求項1ないし4のうちの何れか一項に記載のヘルスケア・リスク推定システム。
  6. 前記リスク関連ターム収集部は、前記タームの標準的な語彙による前記医師による注釈を受け入れるように構成され、前記注釈は、リスク、リスク要因及び処置のカテゴリにおける語彙をラベル付けする、請求項1ないし5のうちの何れか一項に記載のヘルスケア・リスク推定システム。
  7. 前記トピック検出及びタグ付け部は、リスク、リスク要因及び処置のカテゴリに応じて前記文書にタグ付けするように構成される、請求項1ないし6のうちの何れか一項に記載のヘルスケア・リスク推定システム。
  8. 前記NERDモジュールは、標準的な語彙のタームと、抽出されたリンクした文書中の対応するタームとの間の合致精度を反映するように、各々のエンティティのスコアを付ける、請求項1ないし7のうちの何れか一項に記載のヘルスケア・リスク推定システム。
  9. ユーザーによるタームの入力を受け入れるユーザー入力部と、前記ユーザーに表示するためにグラフのうち関連する部分を選択するサブグラフ選択モジュールとを更に有する、請求項1ないし8のうちの何れか一項に記載のヘルスケア・リスク推定システム。
  10. 或る言語でタームを受け入れ、当該タームを、前記標準的な語彙の言語で同義語に翻訳する翻訳モジュールを更に有する、請求項1ないし9のうちの何れか一項に記載のヘルスケア・リスク推定システム。
  11. コンピュータにより実行されるヘルスケア・リスク推定方法であって:
    医師によるタームの入力を受け入れる工程であって、前記医師によるタームは、潜在的な障害の形態にあるリスクに関連するタームと、障害の可能性を増やすリスク要因に関連するタームと、医学的状態についての処置に関連するタームとを含む、工程;
    タームの標準的な語彙を利用して、類義語及び同義語を含むように、前記医師によるタームを標準化及び拡張する工程;
    拡張されたタームにリンクされる一群の文書を、医療文書データベースから取得する工程;
    前記一群の文書からエンティティを抽出する工程であって、各々の文書は標準化された語彙に調整されている、工程;及び
    取得された一群の文書中の文書における2つのエンティティの共起性に基づいて、エンティティ間の関係にスコアを付ける工程;
    を有し、リスク・ナレッジ・グラフは、前記エンティティ及びスコアが付されたそれらの関係を保存する、ヘルスケア・リスク推定方法。
  12. 請求項11に記載のヘルスケア・リスク推定方法をコンピュータに実行させるコンピュータ・プログラム。
JP2017014692A 2016-03-24 2017-01-30 ヘルスケア・リスク推定システム及び方法 Active JP6825389B2 (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
DE102016205065.6 2016-03-24
GBGB1605113.8A GB201605113D0 (en) 2016-03-24 2016-03-24 A healthcare risk extraction system and method
DE102016205065 2016-03-24
GB1605113.8 2016-03-24
EP16201280.1A EP3223179A1 (en) 2016-03-24 2016-11-29 A healthcare risk extraction system and method
EP16201280.1 2016-11-29

Publications (2)

Publication Number Publication Date
JP2017174406A JP2017174406A (ja) 2017-09-28
JP6825389B2 true JP6825389B2 (ja) 2021-02-03

Family

ID=57442527

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017014692A Active JP6825389B2 (ja) 2016-03-24 2017-01-30 ヘルスケア・リスク推定システム及び方法

Country Status (3)

Country Link
US (1) US20170277856A1 (ja)
EP (1) EP3223179A1 (ja)
JP (1) JP6825389B2 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11568982B1 (en) 2014-02-17 2023-01-31 Health at Scale Corporation System to improve the logistics of clinical care by selectively matching patients to providers
EP3507721B1 (en) 2016-09-02 2022-11-23 FutureVault Inc. Real-time document filtering systems and methods
CA3035100C (en) 2016-09-02 2024-05-28 FutureVault Inc. Systems and methods for sharing documents
CN108509479B (zh) * 2017-12-13 2022-02-11 深圳市腾讯计算机系统有限公司 实体推荐方法及装置、终端及可读存储介质
JP6975682B2 (ja) * 2018-05-29 2021-12-01 株式会社日立製作所 医学情報処理装置、医学情報処理方法、及び医学情報処理プログラム
CN109145003B (zh) * 2018-08-24 2022-05-27 联动数科(北京)科技有限公司 一种构建知识图谱的方法及装置
CN109472032A (zh) * 2018-11-14 2019-03-15 北京锐安科技有限公司 一种实体关系图的确定方法、装置、服务器及存储介质
JP7304960B2 (ja) * 2019-02-26 2023-07-07 フラティロン ヘルス,インコーポレイテッド 健康情報に基づく予後スコア
CN110245211B (zh) * 2019-04-17 2023-09-05 创新先进技术有限公司 一种信息展示方法、装置、计算设备及存储介质
CN110299209B (zh) * 2019-06-25 2022-05-20 北京百度网讯科技有限公司 相似病历查找方法、装置、设备及可读存储介质
US11574713B2 (en) 2019-07-17 2023-02-07 International Business Machines Corporation Detecting discrepancies between clinical notes and administrative records
CN110472065B (zh) * 2019-07-25 2022-03-25 电子科技大学 基于gcn孪生网络的跨语言知识图谱实体对齐方法
CN110659348A (zh) * 2019-09-24 2020-01-07 福建正孚软件有限公司 一种基于知识推理的集团企业全域风险融合分析方法及系统
US11610679B1 (en) 2020-04-20 2023-03-21 Health at Scale Corporation Prediction and prevention of medical events using machine-learning algorithms
CN111737594B (zh) * 2020-06-24 2023-07-25 中网数据(北京)股份有限公司 基于无监督标签生成的虚拟网络角色行为塑造方法
US11494720B2 (en) * 2020-06-30 2022-11-08 International Business Machines Corporation Automatic contract risk assessment based on sentence level risk criterion using machine learning
CN112800175B (zh) * 2020-11-03 2022-11-25 广东电网有限责任公司 一种电力系统知识实体跨文档搜索方法
CN112487214B (zh) * 2020-12-23 2024-06-04 中译语通科技股份有限公司 基于实体共现矩阵的知识图谱关系抽取方法及系统
CN113254650B (zh) * 2021-06-28 2021-11-19 明品云(北京)数据科技有限公司 一种基于知识图谱的评估推送方法、系统、设备和介质
CN113590842A (zh) * 2021-08-05 2021-11-02 思必驰科技股份有限公司 医学术语标准化方法及系统
CN117271804B (zh) * 2023-11-21 2024-03-01 之江实验室 一种共病特征知识库生成方法、装置、设备及介质
CN117334352B (zh) * 2023-11-24 2024-03-08 北京邮电大学 基于多元角色知识图谱的高血压诊疗决策推理方法及装置
CN117435714B (zh) * 2023-12-20 2024-03-08 湖南紫薇垣信息系统有限公司 一种基于知识图谱的数据库和中间件问题智能诊断系统

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4674043A (en) * 1985-04-02 1987-06-16 International Business Machines Corp. Updating business chart data by editing the chart
GB2323693B (en) * 1997-03-27 2001-09-26 Forum Technology Ltd Speech to text conversion
US6915254B1 (en) * 1998-07-30 2005-07-05 A-Life Medical, Inc. Automatically assigning medical codes using natural language processing
US20060241943A1 (en) * 2005-02-16 2006-10-26 Anuthep Benja-Athon Medical vocabulary templates in speech recognition
US20020143862A1 (en) * 2000-05-19 2002-10-03 Atitania Ltd. Method and apparatus for transferring information between a source and a destination on a network
US6725230B2 (en) * 2000-07-18 2004-04-20 Aegis Analytical Corporation System, method and computer program for assembling process data of multi-database origins using a hierarchical display
US7831548B1 (en) * 2001-10-24 2010-11-09 Amazon Technologies, Inc. Systems and methods that use search queries to identify related lists
US7698155B1 (en) * 2002-11-29 2010-04-13 Ingenix, Inc. System for determining a disease category probability for a healthcare plan member
US7233938B2 (en) * 2002-12-27 2007-06-19 Dictaphone Corporation Systems and methods for coding information
US8326653B2 (en) * 2003-03-04 2012-12-04 Nuance Communications, Inc. Method and apparatus for analyzing patient medical records
US20040243545A1 (en) * 2003-05-29 2004-12-02 Dictaphone Corporation Systems and methods utilizing natural language medical records
WO2005103978A2 (en) * 2004-04-15 2005-11-03 Artifical Medical Intelligence, Inc. System and method for automatic assignment of medical codes to unformatted data
US20130304453A9 (en) * 2004-08-20 2013-11-14 Juergen Fritsch Automated Extraction of Semantic Content and Generation of a Structured Document from Speech
US8751266B2 (en) * 2005-03-04 2014-06-10 Cerner Innovation, Inc. Method and system for facilitating clinical decisions
CA2624816C (en) * 2005-10-04 2016-01-26 Thomson Global Resources Systems, methods, and software for assessing ambiguity of medical terms
US7610192B1 (en) * 2006-03-22 2009-10-27 Patrick William Jamieson Process and system for high precision coding of free text documents against a standard lexicon
US7496852B2 (en) * 2006-05-16 2009-02-24 International Business Machines Corporation Graphically manipulating a database
CA2652444C (en) * 2006-06-22 2020-04-28 Multimodal Technologies, Inc. Automatic decision support
US10796390B2 (en) * 2006-07-03 2020-10-06 3M Innovative Properties Company System and method for medical coding of vascular interventional radiology procedures
JP2008108199A (ja) * 2006-10-27 2008-05-08 Konica Minolta Medical & Graphic Inc データベースシステム、プログラム、及びデータベースシステムにおける情報検索方法
US20080249374A1 (en) * 2007-04-06 2008-10-09 General Electric Company Method and apparatus to enable multiple methods of clinical order input into a healthcare it application
US8823709B2 (en) * 2007-11-01 2014-09-02 Ebay Inc. User interface framework for viewing large scale graphs on the web
US8589149B2 (en) * 2008-08-05 2013-11-19 Nuance Communications, Inc. Probability-based approach to recognition of user-entered data
US8943437B2 (en) * 2009-06-15 2015-01-27 Nuance Communications, Inc. Disambiguation of USSD codes in text-based applications
US20110040576A1 (en) * 2009-08-11 2011-02-17 Microsoft Corporation Converting arbitrary text to formal medical code
US20130041681A1 (en) * 2010-03-04 2013-02-14 Koninklijke Philips Electronics N.V. Clinical decision support system with temporal context
US20110302167A1 (en) * 2010-06-03 2011-12-08 Retrevo Inc. Systems, Methods and Computer Program Products for Processing Accessory Information
US20120096070A1 (en) * 2010-10-15 2012-04-19 Shane Bryzak Web application framework remoting model api
US9413803B2 (en) * 2011-01-21 2016-08-09 Qualcomm Incorporated User input back channel for wireless displays
US8694335B2 (en) * 2011-02-18 2014-04-08 Nuance Communications, Inc. Methods and apparatus for applying user corrections to medical fact extraction
US9916420B2 (en) * 2011-02-18 2018-03-13 Nuance Communications, Inc. Physician and clinical documentation specialist workflow integration
US8788289B2 (en) * 2011-02-18 2014-07-22 Nuance Communications, Inc. Methods and apparatus for linking extracted clinical facts to text
US8768723B2 (en) * 2011-02-18 2014-07-01 Nuance Communications, Inc. Methods and apparatus for formatting text for clinical fact extraction
US8515782B2 (en) * 2011-03-10 2013-08-20 Everett Darryl Walker Processing medical records
US8832095B2 (en) * 2011-08-24 2014-09-09 International Business Machines Corporation Automated information discovery and traceability for evidence generation
US8700589B2 (en) * 2011-09-12 2014-04-15 Siemens Corporation System for linking medical terms for a medical knowledge base
JP2013069111A (ja) * 2011-09-22 2013-04-18 Fuji Xerox Co Ltd 情報処理装置及びプログラム
US20130226616A1 (en) * 2011-10-13 2013-08-29 The Board of Trustees for the Leland Stanford, Junior, University Method and System for Examining Practice-based Evidence
SG11201404678RA (en) * 2012-03-14 2014-09-26 Nec Corp Term synonym acquisition method and term synonym acquisition apparatus
US9239876B2 (en) * 2012-12-03 2016-01-19 Adobe Systems Incorporated Automatic document classification via content analysis at storage time
WO2014127183A2 (en) * 2013-02-15 2014-08-21 Voxy, Inc. Language learning systems and methods
JP6101563B2 (ja) * 2013-05-20 2017-03-22 株式会社日立製作所 情報構造化システム
WO2015084757A1 (en) * 2013-12-02 2015-06-11 Qbase, LLC Systems and methods for processing data stored in a database
JP2015138402A (ja) * 2014-01-22 2015-07-30 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
JP6354192B2 (ja) * 2014-02-14 2018-07-11 オムロン株式会社 因果ネットワーク生成システム
US10275576B2 (en) * 2014-06-27 2019-04-30 Passport Health Communications, Inc Automatic medical coding system and method
JP6525527B2 (ja) * 2014-08-07 2019-06-05 キヤノン株式会社 読影レポート作成支援装置、読影レポート作成支援方法及びプログラム
WO2018057639A1 (en) * 2016-09-20 2018-03-29 Nuance Communications, Inc. Method and system for sequencing medical billing codes

Also Published As

Publication number Publication date
JP2017174406A (ja) 2017-09-28
EP3223179A1 (en) 2017-09-27
US20170277856A1 (en) 2017-09-28

Similar Documents

Publication Publication Date Title
JP6825389B2 (ja) ヘルスケア・リスク推定システム及び方法
JP6780520B2 (ja) オープンデータ及び臨床医の入力を用いて患者のリスクを評価するシステム及び方法
JP6915282B2 (ja) オープンデータ及び臨床医の入力を用いて患者の治療リスクを評価するシステム及び方法
Pendergrass et al. Using electronic health records to generate phenotypes for research
JP6907831B2 (ja) コンテキストベースの患者類似性の方法及び装置
JP7035314B2 (ja) 患者の診断を支援するシステムおよび方法
Dalianis et al. HEALTH BANK-A Workbench for Data Science Applications in Healthcare.
Pivovarov et al. Learning probabilistic phenotypes from heterogeneous EHR data
Zolnoori et al. A systematic approach for developing a corpus of patient reported adverse drug events: a case study for SSRI and SNRI medications
WO2016049795A1 (zh) 一种多维度用药信息处理方法、系统和设备
US20110295595A1 (en) Document processing, template generation and concept library generation method and apparatus
JP2015103247A (ja) 医療事象追跡システム
US20190362825A1 (en) Medical information translation system
US20190114304A1 (en) Systems and methods for modeling free-text clinical documents into a hierarchical graph-like data structure based on semantic relationships among clinical concepts present in the documents
US11694814B1 (en) Determining patient condition from unstructured text data
Mermin-Bunnell et al. Use of natural language processing of patient-initiated electronic health record messages to identify patients with COVID-19 infection
Yu et al. Clinical coverage of an archetype repository over SNOMED-CT
Boshnaka et al. Ontology-based knowledge modelling for clinical data representation in electronic health records
Ahmad et al. A survey on the role of artificial intelligence in managing Long COVID
JP2018060537A (ja) 潜在的な診断を所与として患者により利用される医療資源を特定するためのコンピュータ装置及び方法
GB2548627A (en) A system and a method for assessing patient treatment risk using open data and clinician input
Graves et al. Microethics for healthcare data science: Attention to capabilities in sociotechnical systems
US11940986B1 (en) Determining repair status information using unstructured textual repair data in response to natural language queries
Ioerger et al. How to Fully Leverage the Power of Electronic Health Records for Research—Self-Service Analytics
US20230017211A1 (en) System and method for implementing a medical records analytics platform

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191008

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200729

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201228

R150 Certificate of patent or registration of utility model

Ref document number: 6825389

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150