JP5937601B2 - 動的構造化文書コーパスの構造化探索 - Google Patents

動的構造化文書コーパスの構造化探索 Download PDF

Info

Publication number
JP5937601B2
JP5937601B2 JP2013533002A JP2013533002A JP5937601B2 JP 5937601 B2 JP5937601 B2 JP 5937601B2 JP 2013533002 A JP2013533002 A JP 2013533002A JP 2013533002 A JP2013533002 A JP 2013533002A JP 5937601 B2 JP5937601 B2 JP 5937601B2
Authority
JP
Japan
Prior art keywords
annotation
type
query
search
document corpus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013533002A
Other languages
English (en)
Other versions
JP2013543999A (ja
Inventor
コール,デトレフ
フリツク,ユルゲン
Original Assignee
エムモーダル アイピー エルエルシー
エムモーダル アイピー エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エムモーダル アイピー エルエルシー, エムモーダル アイピー エルエルシー filed Critical エムモーダル アイピー エルエルシー
Priority claimed from PCT/US2011/055494 external-priority patent/WO2012048306A2/en
Publication of JP2013543999A publication Critical patent/JP2013543999A/ja
Application granted granted Critical
Publication of JP5937601B2 publication Critical patent/JP5937601B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B8/00Diagnosis using ultrasonic, sonic or infrasonic waves
    • A61B8/08Detecting organic movements or changes, e.g. tumours, cysts, swellings
    • A61B8/0808Detecting organic movements or changes, e.g. tumours, cysts, swellings for diagnosis of the brain
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/02Detecting, measuring or recording pulse, heart rate, blood pressure or blood flow; Combined pulse/heart-rate/blood pressure determination; Evaluating a cardiovascular condition not otherwise provided for, e.g. using combinations of techniques provided for in this group with electrocardiography or electroauscultation; Heart catheters for measuring blood pressure
    • A61B5/0205Simultaneously evaluating both cardiovascular conditions and different types of body conditions, e.g. heart and respiratory condition
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/03Detecting, measuring or recording fluid pressure within the body other than blood pressure, e.g. cerebral pressure; Measuring pressure in body tissues or organs
    • A61B5/031Intracranial pressure
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/68Arrangements of detecting, measuring or recording means, e.g. sensors, in relation to patient
    • A61B5/6801Arrangements of detecting, measuring or recording means, e.g. sensors, in relation to patient specially adapted to be attached to or worn on the body surface
    • A61B5/6813Specially adapted to be attached to a specific body part
    • A61B5/6814Head
    • A61B5/6815Ear
    • A61B5/6817Ear canal
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B8/00Diagnosis using ultrasonic, sonic or infrasonic waves
    • A61B8/46Ultrasonic, sonic or infrasonic diagnostic devices with special arrangements for interfacing with the operator or the patient
    • A61B8/461Displaying means of special interest
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B8/00Diagnosis using ultrasonic, sonic or infrasonic waves
    • A61B8/52Devices using data or image processing specially adapted for diagnosis using ultrasonic, sonic or infrasonic waves
    • A61B8/5215Devices using data or image processing specially adapted for diagnosis using ultrasonic, sonic or infrasonic waves involving processing of medical diagnostic data
    • A61B8/5223Devices using data or image processing specially adapted for diagnosis using ultrasonic, sonic or infrasonic waves involving processing of medical diagnostic data for extracting a diagnostic or physiological parameter from medical diagnostic data
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B8/00Diagnosis using ultrasonic, sonic or infrasonic waves
    • A61B8/54Control of the diagnostic device

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Health & Medical Sciences (AREA)
  • Veterinary Medicine (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Otolaryngology (AREA)
  • Physiology (AREA)
  • Hematology (AREA)
  • Cardiology (AREA)
  • Neurosurgery (AREA)
  • Neurology (AREA)
  • Pulmonology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)

Description

種々の技法が、スピーチから構造化文書を生成するために存在する。こうした技法の例は、「Automated Extraction of Semantic Content and Generation of a Structured Document From Speech」という名称の2009年9月1日に発行された米国特許第7,584,103号、および、「Verification of Extracted Data」という名称の2010年5月11日に発行された米国特許第7,716,040号に開示され、これらの特許は共に、ペンシルベニア州ピッツバーグのMultimodal Technologies,Inc.に譲渡されている。同様に、Multimodal Technologies,Inc.から入手可能な製品AnyModalCDS Speech Understandingは、スピーチから構造化文書を生成するために使用されることができる。
たとえば、医師が患者訪問の報告書を口述する場合、医師のスピーチは、単に口述される報告書の逐語的トランスクリプトにトランスクライブされるのではなく、代わりに、トランスクライブされるスピーチを表すテキストが、その中でスピーチによって表される概念に対応するセクション、サブセクション、パラグラフ、および他の構造に編成される構造化文書にトランスクライブされることができる。こうした概念は、たとえば、HL7 CDA文書フォーマットまたは他のフォーマットによって定義されるようなXMLタグを使用してテキストをマークアップすることによって構造化文書で表されることができる。
セクション、サブセクション、および他の概念は、「CurrentMedication(カレントメディケーション)」、「Findings(所見)」、および「Discharge Instructions(退院指導)」などの概念の語義的分類(semantic class)を示すコードを使用して、文書内でアノテートされることができる。さらに、トランスクライブされるテキストは、テキストで述べられるメディケーションについての「RxNorm」コード、患者の問題を記述するpost−coordinated SNOMED CT用語、またはアレルギー(allergy)に関連するアレルゲン(allergen)、重篤度(severity)、および有害反応(adverse reaction)に関する情報を使用してアレルギーを記述する複雑なデータ構造などの、テキストの意味をコンピューヤ処理可能形態で表すコードによってアノテートされることができる。
さらに、構造化文書は、文書(「Discharge Summary(退院サマリー)」または「Progress Note(進行メモ)」など)およびコンテキスト情報(たとえば、文書の対象である患者に関する情報、文書を口述した内科医に関する情報)のタイプを示すヘッダ情報でアノテートされることができる。
スピーチから構造化文書を生成するためのこれらのまた他の技法は、先に参照した2つの米国特許第7,584,103号および第7,716,040号に、より詳細に記載される。先に示したように、こうした構造化文書は、テキストおよびテキストに関連するコーディング(XMLタグなど)を含む。コーディングは、対応するテキストによって表される概念を、コンピュータ処理可能形態でエンコードする。
関連情報をできる限り迅速に、容易に、また正確に見出すようにこうした構造化文書を探索できることが望ましい。
こうした探索を実施するためのいくつかの技法が存在するが、構造化文書を、特にこうした構造化文書が経時的に増大し変化する構造化文書の動的コーパスの一部であるときに、探索するための改良型技法についての必要性が存在する。
システムは、テキストとテキストのアノテーションの両方を含む構造化文書を含む文書コーパスを含む。システムはまた、構造化文書の構造化探索を実施するように適合されている探索エンジンを含む。新しいタイプのアノテーションがシステムに追加されると、探索エンジンは、新しいタイプのアノテーションについての構造化探索を実施することが可能になるように自動的に更新される。たとえば、新しいタイプのアノテーションを生成するように適合された新しい自然言語処理(NLP)コンポーネントがシステムに追加される場合、システムは、新しいタイプのアノテーションの定義を含むようにクエリ言語を自動的に更新する。探索エンジンは、その後すぐに、新しいタイプのアノテーションを参照する構造化クエリを処理することが可能であるとすることができる。
本発明の一実施形態による文書コーパス内で構造化文書の構造化探索を実施するためのシステムのデータフロー図を示す。 図1のシステムを生成するプロセスの中間ステップを示すデータフロー図を示す。 図1のシステムを生成するプロセスの中間ステップを示すデータフロー図を示す。 図1のシステムを生成するプロセスの中間ステップを示すデータフロー図を示す。 図1のシステムを生成するプロセスの中間ステップを示すデータフロー図を示す。 文書コーパス内で文書内の新しいタイプのアノテーションについての構造化探索を実施することが可能になるように自動的に適合するために、図1および図2A〜2Dのシステムによって実施される方法のフローチャートである。
本発明のいくつかの実施形態によって実施される1つの機能は、構造化文書に関して構造化探索を実行することである。上述したように、「Structured document(構造化文書)」は、テキストおよび/または他のコンテキストが、コーディングによってアノテートされた文書であり、コーディングは、コーディングに対応するコンテキストの(語義的なおよび/または文法的な)意味を示す。
「structured search(構造化探索)」は、文書構造に対して特定の参照を行うクエリを実行する探索である。こうしたクエリは、「structured query(構造化クエリ)」である。たとえば、特定の構造化文書コーパス内の構造化文書が、患者のアレルギーに関する情報を記憶するために、タイプ<allergy>のアノテーションを使用すると仮定する。この場合、ペニシリンアレルギーを有する全ての患者を識別するために定式化され、かつ、「<allergy>=penicillin」などの構文を使用して定式化されるクエリは、構造化クエリである。その理由は、クエリが、文書構造、すなわち<allergy>アノテーションに対して特定の参照を行うからである。こうしたクエリを実行する探索は、構造化クエリである。こうした探索を実施する探索エンジンは、テキスト「penicillin」について(または、ペニシリンを表す他のトークンについて)文書コーパスにおいて<allergy>アノテーションだけを探索することができる。
対照的に、<penicillin allergy>などのクエリは、平易なテキスト「penicillin allerg」だけからなるため、非構造化クエリである。こうしたクエリは、文書構造を全く参照しない。結果として、こうした非構造化探索は、構造化探索に比べて正確さに欠ける結果を生じる可能性がある。その理由は、非構造化探索が、
・テキスト「penicillin allergy」に遭遇することに応答して、患者が、目下、ペニシリンアレルギーを持っていないことをこうしたテキストがたとえ示さない(たとえば、患者の母親がペニシリンアレルギーを持っていたことをテキストが示す場合がある)ときでも偽陽性を生成し、また、
・患者が、目下、ペニシリンアレルギーを持っていることを、「penicillin allergy」(たとえば、「PN allergy」)以外のテキストが示すことを認めることに失敗することによって、偽陰性を生成する場合があるからである。
したがって、構造化探索は、非構造化探索比べより関連性のある結果を生成しうるため有利である。しかし、構造化クエリは、長々しく、生成するのに時間がかかる。その理由は、構造化クエリが、見出されるコンテンツ(たとえば、テキスト)だけでなく、こうしたコンテンツがその中で見出される特定のタイプ(複数可)のアノテーション(複数可)をも参照しなければならないからである。したがって、人間オペレータが特定の文書コーパスにわたって実行するためのこうしたクエリを生成するために、人間オペレータは、文書コーパス内で探索するために、どのタイプのアノテーションが利用可能であるかを知らなければならない。特に、アノテーションタイプの数が非常に大きい場合、また、たとえば新しい文書が文書コーパス内に以前には存在しないタイプを含む結果として、アノテーションタイプの数が経時的に増大する場合、人間オペレータがこれを行うことは難しい可能性がある。
さらに、システムが構造化クエリを実行するために、探索される文書コーパスは、まず、構造化形態になるようにアノテートされなければならない。これは、こうしたアノテーションを実施するために設計および構築コンポーネントを必要とする。結果として、構造化クエリの1つの欠点は、構造化クエリがこうしたコンテンツに関して実施されうる前に、非構造化コンテンツを構造化コンテンツに変換するときの先行投資が必要とされることである。対照的に、非構造化クエリを実行することは、非構造化コンテンツに関して実施されうるため、こうした先行投資を全く必要としない。
さらに、構造化クエリの生成は、エラーを受ける。人間オペレータは、たとえば、「<allergy>=penicillin」の代わりに誤って「<irritant(刺激物)>=penicillin」についてクエリを定式化する場合がある。こうしたクエリを実行しようと試みることは、任意のマッチング文書を見出すためにエラーまたは失敗をもたらす場合がある。
いくつかの既存のシステムは、ユーザが構造化クエリを定式化するのを支援する。たとえば、いくつかのシステムは、目下のカーソルロケーションのクエリに挿入されることができる許容される用語(アノテーションタイプの名前など)のドロップダウンリストをユーザに提供するクエリ定式化ユーザインタフェースを含む。たとえば、こうしたユーザインタフェースは、「<allergy>」、「<currentmedication>」、および「<prognosis(予後)>」などのアノテーションタイプの選択を含むドロップダウンリストをユーザに提供することができる。同様に、他のクエリ定式化ユーザインタフェースは、ユーザが目下タイプしている用語を完結させるために許容される用語をユーザにプロンプト表示する「auto−complete(オートコンプリート)」機能を提供する。たとえば、ユーザが、「<all」をタイプする場合、システムは、用語「<allergy>」および「<allergen>」をユーザにプロンプト表示することができ、ユーザは、その中から選択して、クエリ内の目下の用語を完結させることができる。
ユーザにこうした支援を提供するために、いずれのこうしたクエリ定式化ユーザインタフェースも、探索される文書コーパス内に存在し、したがって、クエリ内に含まれることを許容されるアノテーションタイプのセットの知識を持たなければならない。クエリ言語は、アノテーションタイプのセットの定義を含むことができ、クエリ定式化ユーザインタフェースは、クエリ言語、したがってクエリ言語内のアノテーションタイプの知識によってプログラムされることができる。クエリ定式化ユーザインタフェースに新しいアノテーションタイプを認識する能力を提供することは、したがって、クエリ言語が更新されることを必要とする場合がある。文書コーパス内の全てのアノテーションについての、完全で正確で最新の知識を含むように、クエリ言語を更新すること、または、その他の方法でクエリ定式化ユーザインタフェースを更新することは、特に探索される文書コーパスが経時的に増大し変化する場合、また、文書コーパス内での探索について利用可能なアノテーションの数およびタイプが増大し変化する場合、難しい作業である可能性がある。
クエリ定式化ユーザインタフェースは、クエリ言語の知識によってハードコードされる、またはその他の方法でプログラムされることができる。結果として、クエリ定式化ユーザインタフェースは、「<allergy>」、「<allergen>」、および「<severity(重篤度)>」などのアノテーションに対して特定の参照を行う構造化クエリを人間オペレータが定式化するのを支援することが可能であるとすることができる。
さらに、特定の探索エンジンが、特定の文書コーパスを探索するときに使用するに配備されると仮定する。こうした配備の前に、探索エンジンは、アノテーションタイプのセットの定義を含むクエリ言語の知識を有するように探索エンジンをプログラムすることなどによって、文書コーパス内でアノテーションタイプのセットの知識によってハードコードされることができる。クエリ言語は、特定のオントロジー内でコードの互いの関係の定義を含むことができる。たとえば、クエリ言語は、「<allergy>」タイプのアノテーションが、「<allergen>」および「<severity>」などのサブアノテーション(サブコード)を有することを示すことができる。結果として、クエリ言語の知識を有する探索エンジンは、「<allergy>」、「<allergen>」、および「<severity>」などのアノテーションタイプに対して参照を行う構造化クエリを実行することが可能であるとすることができる。
しかし、こうしたシステムは、新しいアノテーションタイプ(すなわち、探索エンジンおよび/またはクエリ定式化ユーザインタフェース内に以前にハードコードされていないアノテーションタイプ)が導入されると、困難に直面する。こうした新しいアノテーションタイプは、たとえば、新しいアノテーションタイプを含む新しい構造化文書を文書コーパスに追加することによって、または、新しい非構造化文書を文書コーパスに追加し、次に、自然言語処理(NLP)を新しい文書に適用し、それにより、新しいタイプを有する1つまたは複数のアノテーションを含むアノテーションを新しい文書に追加することによって導入されることができる。
こうしたシステムでは、探索エンジンは、新しいアノテーションタイプに対して参照を行う構造化クエリを処理することが可能である場合がある。その理由は、探索エンジンによって使用されるクエリ言語が新しいアノテーションタイプの定義を含まないからである。同様に、システムのクエリ定式化ユーザインタフェースは、新しいアノテーションタイプをユーザにプロンプト表示することが可能でない場合がある。その理由は、クエリ定式化ユーザインタフェースによって使用されるクエリ言語が新しいアノテーションタイプの知識を持たないからである。
通常、既存のシステムにおいてこれらの問題に対処するために、システム管理者または他の人間ユーザが、クエリ言語を手動で更新する、またはその他の方法で、追加されたアノテーションタイプの知識によって探索エンジンおよび/またはクエリ定式化ユーザインタフェースを更新することが必要である。こうした手動による更新を必要とすることは、長々しく、時間がかかり、エラーを起こし易い。こうした更新が正確に実施されるときでさえ、文書コーパスに対する新しいアノテーションタイプの追加と、新しいアノテーションタイプを反映するようにクエリ言語が更新されるとき、したがって探索エンジンおよびクエリ定式化ユーザインタフェースが新しいアノテーションタイプの知識を得るときとの間に、ある程度の固有の遅延が存在し、それにより、システムのユーザがシステムを最適利用できない期間が生じる。
文書コーパス内のコーディングは、前もって予測できない仕方で経時的に変化する場合がある。たとえば、(1)文書コーパスのユーザのニーズは、たとえば、規制の変化、処置レジメンに対する修正、および新しい調査研究のニーズの結果として経時的に進化する場合があり、(2)オントロジーは、用語を追加または洗練し、古い用語を軽視し、軽視される用語を新しい用語に置換えることによって経時的に進化する場合があり、(3)自然言語処理(NLP)アルゴリズムは、経時的に進化する場合があり、結果として、テキスト内のコーディングの精度を改善するために、文書コーパス内で以前にエンコードされた文書を再処理し、それにより再コード(再アノテーション化)することが可能とすることができる。したがって、文書が経時的にできる限り有用のままであることを保証するために、先に挙げた変化に応答して、経時的に文書内でマークアップを修正する能力を有することが必要である。しかし、既存のシステムは、こうしたマークアップ修正に応答して、自分の探索エンジンおよびクエリ定式化ユーザインタフェースを自動的に更新することが可能でない。
本発明の実施形態は、探索エンジン、クエリ定式化ユーザインタフェース、および構造化探索システムの他のコンポーネントが、文書コーパスに追加されたアノテーションタイプの知識によって即座にかつ自動的に更新されることを可能にすることによって、既存の構造化探索システムのこれらのまた他の欠点に対処する。
本発明の特定の実施形態を述べる前に、構造化探索を一般に実行するプロセスが、まず、より詳細に述べられる。文書コーパスに関して構造化探索を実施するプロセスは、2つの高位ステップ、すなわち、
(1)選択(たとえば、ペニシリンに対してアレルギー性があり、かつ、30歳と40歳との間である、文書コーパス内で表される全ての患者を見出すこと)、および、
(2)予測(たとえば、こうしたそれぞれの患者について、患者のカレントメディケーションを論じる、患者についての文書(複数可)の部分(複数可)を取出すこと)
を含む。
選択クエリは、以下の形態の任意の形態など、種々の形態の任意の形態を、個々にまたは互いに組合せることができる。以下の形態とは、
・フリーフォームテキスト探索、
・文書(たとえば、「Penicillin in Allergy Section(アレルギーセクション内のペニシリン)」)内のある概念(たとえば、セクション)に制限されたフリーフォームテキスト探索、
・コーディング(アノテーション)探索、たとえば、
−オントロジーからの特定のコードの存在または非存在についての探索、
−コードの一般化の存在についての探索(たとえば、コード「Neoplasm(新生物)」についての探索は、タイプ「Neoplasm」のコードと、オントロジーで表現されるISA関係によって「Neoplasm」コードに関連するオントロジー内の任意のコードの両方にマッチングすることができる)、
−所与の範囲(たとえば、否定、極性(たとえば、「possible(たぶん)」および「likely(おそらく)」)、時間、または対象の範囲)内のコード(またはコードの一般化)についての探索、
−コンプレックスアノテーションについての探索であって、マッチングされる値(複数可)だけでなく、その値(複数可)に対してマッチングされる複雑なアノテーション内のコンポーネント(複数可)(サブコード(複数可))をもクエリが指定する、探索。たとえば、「allergy」コンプレックスアノテーションでは、クエリは、「allergy」アノテーションの「allergen」フィールド(アブアノテーション)内の「penicillin」についての探索を指定するであろう。
・ヘッダ(たとえば、患者名、患者年齢、処置する内科医(複数可)、文書タイプ、文章表題)内のコンテキスト情報に関して実施されるコンテキスト情報探索、たとえば、
−範囲探索(たとえば、訪問日時、患者年齢)、
−フリーフォームテキスト探索(たとえば、患者名、文書表題)、
−コーデッド情報(たとえば、文書タイプ、受診の理由)についての探索であって、クエリ用語を拡張するために、オントロジーを使用することによって一般化されることができる、探索。たとえば、「note(メモ)」タイプの文書についての探索は、タイプ「note」の文書と、そのタイプが「note」のサブタイプである文書の両方についての探索に一般化されることができる。
である。
選択クエリは、たとえば、構造化クエリ、非構造化クエリ、または、構造化クエリと非構造化クエリの組合せ(本明細書で「mixed query(混合クエリ)」と呼ばれる)とすることができる。
クエリの予測は、クエリの結果として、どの情報(たとえば、選択によって識別された文書セットの一部または集合体)が返送されるかを決定する。予測は、たとえば、以下のものの任意の1つまたは複数が、クエリの結果として返送されることを指定することができる。以下のものとは、
・選択用語(たとえば、「CurrentMedication」セクション)によって識別される、各マッチング文書のあるセクション、
・各マッチング文書内のあるタイプのコーディング(たとえば、タイプ「<allergy>」のコーディング)、
・各マッチング文書についてのコンテキスト情報(たとえば、患者名、患者年齢、処置する内科医)、
・全てのマッチング文書のセットからの集約情報(たとえば、全てのマッチのカウント、マッチのファセット)
である。
本発明の実施形態による、構造化文書のある特徴および構造化文書を生成するためのある技法を一般的に述べたが、本発明の実施形態による、構造化文書を探索するためのある技法がここで述べられる。
本発明の一実施形態では、図1に示すように、システム100は、複数の構造化文書104a〜104n(本明細書で、総称的に文書コーパス104と呼ばれる)を含むコンテンツストア102を含む。ここで、nは任意の数字とすることができる。コンテンツストア102はまた、構造化文書104a〜104nおよびユーザ情報108によって使用されるオントロジー106などの、文書コーパス104に関連するデータを含む。コンテンツストア102内の文書104a〜104nは、たとえば、XMLフォーマットで表されることができる。文書104a〜104nはそれぞれ、テキストおよび対応するマークアップ(本明細書で「アノテーション(annotation)」または「コーディング(coding)」とも呼ばれる)を含むことができる。より具体的には、文書104aは、テキスト114aおよび対応するマークアップ116aを含み、文書104bは、テキスト114bおよび対応するマークアップ116bを含み、文書104nは、テキスト114nおよび対応するマークアップ116nを含む。
システム100はまた、自然言語処理(NLP)フレームワーク110を含み、NLPフレームワーク110は、非構造化または半構造化データ(平易なテキスト文書など)をアノテート(エンコード)し、それにより、コンテンツストア102に追加されることができる構造化文書を生成するために使用されることができる。たとえば、既存の構造化文書104a〜104b内のマークアップ116a〜116nは、構造化文書104a〜104nを生成するために、以前にNLP処理フレームワーク110によって生成され、非構造化文書に追加されている場合がある。NLPフレームワークは、文書内のセクションを認識すること、それらのセクションを離散的セクションとしてマークアップすること、オントロジー106(SNOMED CTなど)に対して一般的な用語マッチングを実施すること、オントロジー106からのコードを使用してマッチングされた任意の用語をママークアップすることなど、NLPフレームワークが所有する文書に関して任意の種類のマークアップを実施することができる。
より一般的には、NLP処理フレームワーク110は、先に参照した先に参照した2つの米国特許第7,584,103号および第7,716,040号に開示される任意の種類の概念を認識し、こうした認識された概念を表すアノテーションによって文書(構造化文書104a〜104nなど)を相応してマークアップすることができる。こうした概念は、種々の方法のうちの任意の方法でエンコードされることができる。たとえば、ある概念は、単一値としてエンコードされることができる。たとえば「Systolic Blood Pressure Measurement(収縮期血圧測定)」概念は、特定の患者の収縮期血圧測定を表す単一数字を使用してエンコードされることができる。
しかし、概念は、複数の値を使用して表されることができる点で複雑であるとすることができる。たとえば、概念「Systolic Blood Pressure Measurement」は、患者の血圧を測定するために使用されたデバイスに関する情報および患者の血圧が測定されたときの患者の状態(たとえば、患者が立った状態で、寝た状態で、身体運動後に、または安静時などに測定が行われたかどうか)に関する情報をさらに含むことができる。
別の例として、「SmokingStatus(喫煙状態)」概念は、(1)患者の喫煙状態(たとえば、目下の喫煙者、過去の喫煙者、または非喫煙者)、(2)どれほどを患者が目下喫煙しているか(たとえば、パック/日単位で測定される)、および(3)過去の喫煙者について、患者がいつ喫煙を辞めたかを表す値を含むフィールド(本明細書で「sub−annotation(サブアノテーション)」および「sub−code(サブコード)」とも呼ばれる)を使用してエンコードされることができる。
先に述べたようい、こうした概念は、テキストおよびテキストのマークアップ(たとえば、XMLタグ)の組合せを使用して文書内で表されることができる。一般に、特定のテキストに対応するマークアップは、特定のテキストによって表される(語義的および/または文法的)概念を指定する。
システム100はまた、複数のアノテーションタイプの定義162a〜162nを含むクエリ言語定義160を含む。図1に4つの定義162a〜162dが示されるが、クエリ言語定義160は、任意の数のアノテーションタイプ定義を含むことができる。一般に、アノテーションタイプ定義162a〜162dはそれぞれ、コーディング内のアノテーションタイプを表すシンボル(シンボル<allergy>など)、アノテーションタイプの許容されるサブアノテーションタイプ、およびアノテーションタイプのインスタンス内で使用するための許容される値などの、特定の対応するアノテーションのタイプの関連特性を定義する。各アノテーション定義は、特定の概念をエンコードするためのアノテーションのタイプを定義することができ、異なるタイプのアノテーションは、異なる概念をエンコードすることができる。クエリ言語定義160は、対応するクエリ言語の他の態様を定義することができ、アノテーション定義162a〜162nだけが、例示を容易にするために図1に示される。
システス100はまた、文書コーパス104に関して構造化探索を実施するための探索エンジン120、および、ユーザ170が処理される構造化クエリを探索エンジン120によって定式化するのを支援するためのクエリ定式化ユーザインタフェース150を含む。より具体的には、ユーザ170は、部分的なまたは完全なクエリを表すテキスト入力、用語のドロップダウンリストから1つまたは複数の用語を選択するマウス入力、あるいはその任意の組合せなどのクエリ定式化入力152をクエリ定式化ユーザインタフェース150に提供する。クエリ定式化ユーザインタフェース150は、クエリ定式化入力152に基づいて構造化クエリ154を生成し、構造化クエリ154を探索エンジン120に提供する。探索エンジン120は、クエリ154を処理することによって文書コーパス104の構造化探索を実施し、もしあれば探索結果122をユーザ170に返送する。
NLP処理フレームワーク110、探索エンジン120、およびクエリ定式化ユーザインタフェース150などのシステム100のコンポーネントは、文書コーパス104ならびに文書コーパス104が含むテキスト114a〜114nおよびアノテーション116a〜116nに直接作用する、または、テキスト114a〜114nおよびアノテーション116a〜116nの中間文書モデル(図示せず)を通して作用することができる。たとえば、これらのコンポーネント110、120、および150の任意の1つまたは複数は、JavaBeansなどのデータオブジェクトを使用して文書114a〜114n内の概念を表すことができる。異なるオブジェクトクラスが、各概念(アノテーション)タイプについて定義されることができ、各データオブジェクトは、特定のオブジェクトクラスのインスタンスとすることができる。各クラスは、データオブジェクト内に記憶された値にアクセスするための自分自身の方法のセットを定義することができる。たとえば、「SmokingStatus」アノテーションタイプに対応する「SmokingStatus」クラスは、getStatus()、getPacksPerDay()、およびgetDateStoppedSmoking()などの方法を定義することができる。
しかし、オブジェクトクラスおよびデータオブジェクトの使用は、本発明の要件ではない。したがって、以下の説明は、オブジェクトクラスおよびデータオブジェクトを使用することなく、文書コーパス104内のテキスト114a〜114nおよびアノテーション116a〜116nの直接の処理を述べることになる。しかし、当業者は、オブジェクトクラスおよびデータオブジェクトを使用し、他の方法で同じ機能を実施するために、本明細書で述べる技法を修正する方法を理解するであろう。
NLP処理フレームワーク110、探索エンジン120、およびクエリ定式化ユーザインタフェース150などのシステム100のコンポーネントは、クエリ言語定義160にアクセスすることができる。結果として、探索エンジン120は、クエリ言語定義160に対するそのアクセスの結果として、特定の時点においてクエリ言語定義160内のアノテーション定義162a〜162dの目下のセットによって定義されるアノテーションタイプを参照する構造化クエリを処理することによって構造化探索を実施することが可能とすることができる。逆に、探索エンジン120は、特定の時点においてクエリ言語定義160内のアノテーション定義162a〜162dの目下のセットによって定義されないアノテーションタイプを参照する構造化クエリを処理することによって構造化探索を実施することが可能でないとすることができる。たとえば、図1の場合に、構造化クエリが、クエリ言語定義160内のアノテーションタイプ定義162a〜162dの任意の定義によって定義されないアノテーションタイプを参照する場合、探索エンジン120は、こうしたクエリを正しく実行するためにエラーまたは失敗を信号送信することができる。
同様に、クエリ定式化ユーザインタフェース150は、クエリ言語定義160に対するそのアクセスの結果として、特定の時点においてクエリ言語定義160内のアノテーション定義162a〜162dの目下のセットによって定義されるアノテーションタイプを参照する構造化クエリを定式化するときの支援をユーザに提供することが可能とすることができる。たとえば、クエリ定式化ユーザインタフェースは、クエリ言語定義160によって定義されるアノテーションタイプ162a〜162dを表すラベルのドロップダウンリストをユーザに提供すること、および/または、クエリ言語定義160によって定義されるアノテーションタイプ162a〜162dを表すラベルのオートコンプリーションを提供することが可能とすることができる。
逆に、クエリ定式化ユーザインタフェース150は、特定の時点においてクエリ言語定義160内のアノテーション定義162a〜162dの目下のセットによって定義されないアノテーションタイプを参照する構造化クエリを定式化するときの支援をユーザに提供することが可能でないとすることができる。たとえば、クエリ定式化ユーザインタフェース150によって提供されるドロップダウンリストは、クエリ言語定義160が生成されて以来または最後に更新されて以来文書コーパス104に追加されたアノテーションのタイプを表すラベルなどの、特定の時点においてクエリ言語定義160内のアノテーション定義162a〜162dの目下のセットによって定義されないアノテーションタイプを表すラベルを含まない場合がある。同様に、クエリ定式化ユーザインタフェース150は、特定の時点においてクエリ言語定義160内のアノテーション定義162a〜162dの目下のセットによって定義されないアノテーションタイプを表すラベルをオートコンプリートすることが可能でないとすることができる。
本発明の実施形態による、これらの問題を克服するために使用されることができる技法の例がここで述べられる。図1のシステム100の例とすることができるが、図1に示すシステム100より時期が早い、図2に示すシステム200aを考える。特に、図2では、NLP処理フレームワーク110は、コンテンツが特定のタイプのアノテーションでマークアップされるべきであることを認識し、また、そのタイプのアノテーションのインスタンスを生成し、文書コーパス104内の文書内に挿入するための単一NLP処理コンポーネント112aだけを含む。例のために、NLP処理コンポーネント112aは、患者の収縮期血圧を表すコンテンツをアノテートするためにタイプ「SystolicBloodPressure」のアノテーションを認識し生成すると仮定する。
同様に、図2Aにおいて、文書コーパス104は、テキスト114aおよび対応するアノテーション116aを含む単一文書104aだけを含む。例のために、テキスト114aは、患者の収縮期血圧を表すテキストを含み、また、こうしたテキストは、対応するアノテーション116a内のタイプ「SystolicBloodPressure(収縮期血圧)」のアノテーションによってアノテート(マークアップ)される。このアノテーションは、文書104aを走査し、患者の収縮期血圧を表すテキストを文書104aが含んでいたことを認識することに応答してNLP処理コンポーネント112aによって生成されている場合がある。
図2のクエリ言語定義160は、単一アノテーション定義162aだけを含む。例のために、アノテーション定義162aがアノテーションタイプ「SystolicBloodPressure」を定義すると仮定する。したがって、クエリ定式化ユーザインタフェース150は、「SystolicBloodPressure」などの、アノテーションタイプを参照する構造化クエリをユーザが定式化するのを支援することが可能であり、探索エンジン120は、こうした構造化クエリを処理することによって構造化探索を実施することが可能である。
したがって、図2Aに示す時点で、探索エンジン120は、「SystolicBloodPressure」アノテーションタイプ以外のアノテーションタイプを参照する構造化クエリを処理することによって構造化探索を実施することが可能でないとすることができる。たとえば、「SmokingStatus」アノテーションタイプを参照するクエリを処理することによって構造化探索を実施するために探索エンジン120を使用しようとするユーザによる試みは、探索エンジン120に、こうしたクエリを正しく実行するためにエラーまたは失敗を信号送信するようにさせる。同様に、図2Aに示す時点で、クエリ定式化ユーザインタフェース150は、「SmokingStatus」アノテーションタイプなどの、「SystolicBloodPressure」アノテーションタイプ以外のアノテーションタイプを参照する構造化クエリを定式化するときの支援をユーザに提供することが可能でない場合がある。
ここで、図1のシステム100の例とすることができるが、図1に示すシステム100より時期が早く、かつ、図2に示すシステム200aより時期が遅い、図2Bに示すシステム200bを考える。さらに、本発明の一実施形態において図2Bのシステム200bによって実施される方法300のフローチャートを示す。
特に、図2Bにて、新しい文書104bが、文書コーパス104に追加された(図3、ステップ302)。新しい文書104bは、患者の喫煙状態を表すテキスト114bを含む。図2Bに示す特定の例では、文書104bは、平易なテキスト文書であり、したがって、テキスト114bのアノテーションを全く含まない。
図2Bにて、新しいNLP処理コンポーネント112bが、NLP処理フレームワーク110に追加された(図3、ステップ304)。NLP処理コンポーネント112bは、(1)患者の喫煙状態を表すテキストを認識すること、および、(2)こうしたテキストをアノテートするために、「SmokingStatus」アノテーションタイプのインスタンスを生成し、文書に挿入することが可能である。
NLP処理フレームワーク110は、新しいNLP処理コンポーネント112bを使用して、患者の喫煙状態を表す新しい文書内のテキストを認識することができる(図3、ステップ306)。簡潔にするために、新しい文書104bのテキスト114b内のまさに1つの節が患者の喫煙状態を表すと仮定する。この場合、NLP処理コンポーネント112bは、こうしたテキストを認識し、「SmokingStatus」アノテーションタイプのインスタンスであるアノテーションを生成し(図3、ステップ308)、アノテーション116bとして文書104b内にアノテーションを挿入することができる(図3、ステップ310)。文書104b内にアノテーション116bを挿入することは、テキスト114bとアノテーション116bが、その後互いに相関するように、アノテーション116bを対応するテキスト114bに関連付けることを含むことができる。その結果は、図2Cのシステム200cによって示される。
NLP処理フレームワーク110は、たとえば、文書コーパス104に対する新しい文書104bの追加に応答して、新しい文書104bに対して目下のNLP処理コンポーネント112a〜112dの全てを適用することによってステップ306〜310を実施することができる。
あるいは、たとえば、NLP処理フレームワーク110は、文書コーパス104内の文書104a〜104bの全てに対して新しいNLP処理コンポーネント112bだけを適用することによってステップ306〜310を実施することができる。この場合、患者の喫煙状態を表す既存の文書104a内の任意のテキストはまた、タイプ「SmokingStatus」のアノテーションでアノテートされることになる。NLP処理フレームワーク110は、文書コーパス104内のアノテーションができる限り最新になることを保証するために、文書コーパス104内の文書の全てに対してNLP処理フレームワーク110内のNLP処理コンポーネントの全てを定期的に(たとえば、1時間ごとに、毎日、毎週)適用することができる。
したがって、NLP処理フレームワーク110は、文書コーパス104に対して文書が全く追加されないときでも、新しいアノテーションタイプのインスタンスを生成することができる。たとえば、やはり文書コーパス104が文書104aだけを含む図2Aのシステムを考える。ここで、文書104aは、患者の収縮期血圧を表すテキストと患者の喫煙状態を表すテキストの両方を含むと仮定する。図2AのNLP処理フレームワーク110は、文書104aを処理する場合、NLP処理コンポーネント112aを使用して、文書104a内でタイプ「SystolicBloodPressure」のアノテーションを生成することになるが、文書104aに対してタイプ「SmokingStatus」のアノテーションを生成しないことになる。その理由は、図2Bの「SmokingStatus」NLP処理コンポーネント112bが、図2AのNLP処理フレームワーク110にいまだ追加されていないからである。
しかし、「SmokingStatus」NLP処理コンポーネント112bが、図2Bに示すようにNLP処理フレームワーク110に追加され、NLP処理フレームワーク110が、次に文書104aの(未修正)テキスト114aに「SmokingStatus」NLP処理コンポーネント112bを適用する場合、「SmokingStatus」NLP処理コンポーネント112bは、文書104a内で患者の喫煙状態を表すテキストを認識し、相応して文書104a内で「SmokingStatus」アノテーションを生成することになる。この例が示すように、文書コーパス104に対する新しい文書の追加は、新しいアノテーションタイプのインスタンスの生成について必要でない。
元の文書104aが、患者の喫煙状態を表すテキストを元の文書104aに追加することによって修正された場合、同様の結果が生じることになる。この場合、文書104aの修正バージョンに対して新しい「SmokingStatus」NLP処理コンポーネント112bを適用することは、NLP処理コンポーネント112bに、修正されたテキストを認識させ、相応して「SmokingStatus」アノテーションを生成させ、文書104a内に挿入させる。これは、文書コーパス104に対する新しい文書の追加が、新しいアノテーションタイプのインスタンスの生成について必要でないことをさらに示す。
クエリ言語定義160は、新しいアノテーションタイプ(すなわち、新しいNLPコンポーネント112bによって認識されるアノテーションタイプ)の定義を含むために更新される(図3、ステップ312)。結果として、クエリ言語定義160は、図2Dのシステム200dに示すように、新しいアノテーションタイプの定義162bを含む。
こうした更新は、種々の方法で実施されることができる。たとえば、クエリ言語定義160は、文書コーパス104に対する新しいタイプのアノテーション(たとえば、アノテーション116b)の追加に応答して更新されることができる。アノテーションのタイプがクエリ言語定義160内に対応するアノテーション定義を持たない場合、アノテーションは「new(新しい)」タイプである。こうしたアノテーションは、たとえば、文書コーパス104内に現れる、そのタイプの最初のものとすることができる。クエリ言語定義160は、たとえば、自動的に(たとえば、自然言語処理フレームワーク110によって)またはシステム200の人間ユーザによって手動で修正されることができる。
たとえば、クエリ言語定義160が「SmokingStatus」アノテーションタイプの定義を含まず、かつ、NLP処理フレームワーク110が、文書コーパス104内の文書104a〜104dのうちの1つの文書に対してタイプ「SmokingStatus」のアノテーションを追加する場合、こうしたアノテーションは、「new」タイプのアノテーションである。システム100は、文書コーパス104に対するこうしたアノテーションの追加に応答してクエリ言語定義160を更新することができる。
文書コーパス104に対する新しいアノテーションの追加は、種々の方法のうちの任意の方法で検出されることができる。たとえば、NLP処理フレームワーク110は、対応するアノテーションを文書コーパス104内に挿入するための新しいNLP処理コンポーネント(NLP処理コンポーネント112b)の最初の使用によって、新しいタイプのアノテーションが文書コーパス104に追加されたと判定し、こうした判定に応答して、NLP処理フレームワーク110は、クエリ言語更新202をクエリ言語定義160に送出することができる(図2C)。クエリ言語更新202は、新しいアノテーション定義162bおよびクエリ言語定義160に対して新しいアノテーション定義162bを追加するための対応する命令を含むことができる。更新202を受信することに応答して、クエリ言語定義160は、(クエリ言語定義160がアノテーション定義162bを既に含んでいない場合)アノテーション定義162bを含むように更新されることができる。
別の例として、システム100のNLP処理フレームワーク110または何らかの他のコンポーネントは、文書コーパス104が最後に走査されてから文書コーパス104内で起こらなかったタイプを有するアノテーションを識別すること、または、クエリ言語定義160内で定義を持たないタイプを有するアノテーションを識別することなどによって、新しいタイプのアノテーションを検出するために自然言語処理を適用することによって文書コーパス104を定期的に構文解析することができる。こうした新しいアノテーションタイプを検出することに応答して、クエリ言語定義160は、新しいアノテーションタイプの定義を含むように更新されることができる。
新しいタイプのアノテーションを有する文書がNLP処理フレームワーク110を使用してアノテートされている必要がないことに留意された。たとえば、NLP処理フレームワーク110によって生成されない既存のアノテーションを含む文書は、文書コーパス104内にインポートされることができる。別の例として、文書コーパス104内のある文書は、手動で、または、NLP処理フレームワーク110以外の何らかの他のメカニズムを使用してアノテートされることができる。こうした文書は、クエリ言語定義160を更新するために使用されることができる新しいタイプのアノテーションを識別するために(NLPフレームワーク110を使用してまたは使用せずに)走査されることができる。
新しいタイプを有するアノテーションは、NLPフレームワーク110内のNLP処理コンポーネント112aによって認識されることが可能なタイプを持つ場合があるまたは持たない場合がある。たとえば、タイプ「CurrentMedication」の既存のアノテーションを含む新しい文書は、NLPフレームワーク110内のNLP処理コンポーネント112a〜112nがいずれも、(1)患者のカレントメディケーションを表すコンテンツを認識すること、または、(2)タイプ「CurrentMedication」のアノテーションを生成することが可能でなくても、文書コーパス104内にインポートされることができる。それでも、新しい文書内のタイプ「CurrentMedication」のアノテーションは、システム100によって識別され、クエリ言語定義160の更新をトリガーするために使用されることができる。これらの例が示すように、新しいNLP処理コンポーネントが全くNLPフレームワーク110に追加されない場合でも、新しいタイプのアノテーションが検出されることができ、対応するアノテーション定義が、クエリ言語定義160に追加されることができる。
さらに、既存のタイプのアノテーションに対する修正は、上述した技法と同様の技法を使用して検出されることができる。たとえば、システム100は、文書コーパス104内の新しいまたは既存の文書を走査し、既存のタイプであるが、クエリ言語定義160内の対応するアノテーション定義において反映されないフィールド(サブコード)を含むアノテーションを検出する場合、新しく発見されたフィールドを反映するためにそのアノテーション定義を更新することができる。
さらに、新しいNLP処理コンポーネント(すなわち、クエリ言語定義160内の対応するアノテーション定義を持たないタイプのアノテーションを生成することが可能であるNLP処理コンポーネント)の単なる追加は、新しいNLP処理コンポーネントによって生成されることが可能なアノテーションのタイプの定義を含むために、クエリ言語定義160の更新をトリガーすることができる。クエリ言語定義160は、新しいNLP処理コンポーネントによって生成されることが可能なタイプのアノテーションが文書コーパス104内で起こるか否かによらず、こうした新しいNLP処理コンポーネントの追加に応答して、更新されることができる。
新しいアノテーション定義162bを含むためにクエリ言語定義160が更新されると、ユーザは、次に、クエリ定式化入力152をクエリ定式化ユーザインタフェース150に提供することができ(図3、ステップ314)、その間に、クエリ定式化ユーザインタフェース150は、新しいアノテーションタイプを参照する構造化クエリをユーザ170が定式化するのを支援することができる(図3、ステップ316)。
クエリ定式化ユーザインタフェース150は、種々の形態の任意の形態をとることができる。たとえば、クエリ定式化ユーザインタフェース150は、ユーザ170がそれを通してクエリ154をタイプすることができるテキストベースユーザインタフェースを含むことができる。別の例として、ユーザインタフェース150は、グラフィカルユーザインタフェースを含むことができ、グラフィカルユーザインタフェースを通して、ユーザ170は、キーワード(「GET」および「FOR」など)、アノテーションタイプおとびフィールドの名前(「SmokingStatus」および「packsPerDay(パック/日)」など)、およびブール代数コネクタ(「AND」および「OR」など)を選択して、クエリ154を形成することができる。
先に述べたように、クエリ定式化ユーザインタフェース150は、クエリ言語定義160にアクセスすることができ、したがって、新しいアノテーションタイプの定義162bがクエリ言語定義160にたった今追加された場合であっても、新しいアノテーションタイプの名前をユーザにプロンプト表示する、またはその他の方法で、新しいアノテーションタイプに関連する支援を提供することができる。換言すれば、クエリ定式化ユーザインタフェース150は、単にクエリ言語定義160に対するアノテーション定義162bの追加に応答して、また、システム100またはシステム100の任意のコンポーネントをポーズする、リコンパイルする、リローンチする、リブートする、またはその他の方法で再構成する必要なしで、新しいタイプのアノテーションを参照する構造化クエリをユーザ170が定式化するのを支援することが自動的に可能になる。
たとえば、クエリ定式化ユーザインタフェース150は、目下のカーソルロケーションでクエリに挿入されることができる許容される用語(アノテーションタイプの名前など)のドロップダウンリストをユーザ170に提供することができる。このリストは、新しいアノテーションタイプの名前または他の識別子(たとえば、「SmokingStatus」)を含むことができる。ユーザ170は、こうした名前または識別子を選択し、それにより、クエリ定式化ユーザインタフェース150に、新しいアノテーションタイプを参照する用語を構造化クエリ154に追加させることができる。クエリ定式化ユーザインタフェース150は、アノテーションタイプ162a〜162dによって定義されるアノテーションのタイプに関する情報をクエリ言語定義160から得ることによってドロップダウンリスト150を生成することができる。
別の例として、クエリ定式化ユーザインタフェースは、構造化クエリ154を定式化するプロセスにおいてユーザ170によって目下タイプされる用語を完結させるために、許容される用語をユーザ170にプロンプト表示することができる「autocomplete」機能を含むことができる。こうした許容される用語は、新しく追加されたアノテーションタイプの名前または他の識別子を含むことができる。たとえば、構造化クエリ154をタイプするプロセスにおいて、ユーザ170は、「Smok」をタイプし、クエリ定式化ユーザインタフェース150は、「Smok」の許容されるコンプリーションとして「SmokingStatus」を提供することができる。ユーザ170は、次に、「SmokingStatus」を選択し、それにより、クエリ定式化ユーザインタフェース150に、構造化クエリ154に用語「SmokingStatus」を追加させることができる。ユーザ170は、所望に応じて、他の用語を構造化クエリ154に追加することができる。
クエリ定式化ユーザインタフェース150は、結果として得られる構造化クエリ154を探索エンジン120に提供することができ、探索エンジン120は、構造化クエリ154に基づいて文書コーパス104に関して構造化探索を実施することができ、それにより、探索結果122を生成することができる(図3、ステップ318)。探索エンジン120は、探索結果122をユーザ170に提供することができる(図3、ステップ320)。
先に述べたように、探索エンジン120は、クエリ言語定義160にアクセスすることができ、したがって、その定義162bがクエリ言語定義160にたった今追加されたアノテーションの新しいタイプを構造化クエリ154が参照する場合であっても、構造化クエリ154を処理することができる。換言すれば、探索エンジン120は、単にクエリ言語定義160に対するアノテーション定義162bの追加に応答して、また、システム100またはシステム100の任意のコンポーネントをポーズする、リコンパイルする、リローンチする、リブートする、またはその他の方法で再構成する必要なしで、新しいタイプのアノテーションを参照する構造化クエリを処理することが自動的に可能になる。
構造化探索を実施するプロセス(図3、ステップ318)は、2つのステップ、すなわち選択および予測を含むことができる。選択および予測(図示せず)を実施する探索エンジン120のサブコンポーネントは、クエリ言語定義160にアクセスすることができ、したがって、その定義162bがクエリ言語定義160にたった今追加されたアノテーションのタイプを参照するクエリ用語を使用して、選択および予測をそれぞれ実施することができる。
たとえば、「.SmokingStatus.packsPerDay>2 AND .SmokingStatus.status=ACTIVE」などのクエリを考える。探索エンジン120の選択コンポーネントは、文書コーパス104によって記載される患者から、1日当たり2パックより多くを目下喫煙している全ての患者を選択することによって、こうしたクエリを処理することができる。
別の例として、クエリ「GET SmokingStatus FOR.finding.code isA<Neoplasm>」を考える。このクエリは、選択要求(「FOR.finding.code isA<Neoplasm>」)および予測要求(「GET SmokingStatus」)を含む。探索エンジン120の選択コンポーネントは、任意の種類の新生物の臨床所見の論議を含む、文書コーパス104内の全ての文書を見出すために選択要求を処置することによって、また、選択要求からもたらされた、文書コーパス104内に記載される患者の喫煙状態を返送するために予測要求を処理することによって、こうしたクエリを処理することができる。
したがって、一般に、クエリ言語定義160によって定義されるクエリ言語を使用して形成されることができるクエリは、経時的に、自動的に、文書コーパス104内に含まれるアノテーションの経時的な変化に応答して増大し変化することができる。
先の説明が明確にするように、本発明の実施形態は種々の利点を有する。たとえば、本明細書で開示される技法は、非常に特異的な構造化クエリが高い信頼性を持って処理されることを可能にする。その理由は、探索可能なアノテーションタイプのセットが文書コーパス104内の構造化コンテンツに直接対応しており、また、処理されるクエリが、単に平易なテキストではなく、こうしたアノテーションタイプを特に参照することができるからである。これは、構造化クエリが、文書コーパス104内のコンテンツの語義的および/または文法的意味を考慮することを可能にし、それにより、偽陽性と偽陰性の両方を減少させる。
本発明の実施形態の別の利点は、本発明の実施形態が、動的に拡張可能である文書を探索するために使用されるクエリ言語を使用可能にすることである。こうした拡張は、文書コーパス104内の対応する探索可能な構造化文書104a〜104nの変化に応答して自動的に行われることができる。結果として、こうした拡張を行うためのさらなる努力は、エンドユーザまたはシステム管理者の部分に関して全く必要とされない。さらに、こうした自動的でかつ動的な拡張の結果として、ユーザが文書104a〜104nの最新の(most current)状態を反映することがいつの時点でも常に可能であり、探索エンジン120がこうしたクエリを処理することがいつの時点でも常に可能である。これは、考えられる最大の表現力を有するクエリがいつでも実施されることを可能にし、それにより、ユーザが、必要とする情報を迅速にかつ正確に見出すことができる可能性を高める。
既存の構造化クエリシステムの1つの欠点は、非構造化コンテンツをアノテートして、そのコンテンツを構造化コンテンツに変換するコンポーネントを、そのコンテンツに関して構造化クエリを実施することが可能になる前に生成するよう、こうしたシステムの設計者にシステムが要求することである。既存の構造化クエリシステムの関連する欠点は、こうしたシステムのクエリ言語定義を手動で構成して、クエリ言語定義が新しい種類の構造化コンテンツに関して構造化探索を実施することが可能になるようにさせることが必要であることである。さらに上述したように、非構造化クエリシステムの対応する利点は、システムがこうした先行投資を必要としないこと、および、非構造化クエリが、こうしたコンテンツをアノテートすることなく、いずれの非構造化コンテンツ上でも実行されうることである。しかし、非構造化クエリシステムの欠点は、システムが、構造化クエリを実施できず、したがって、構造化クエリシステムの精度および深度を有する探索結果を得ることができないことである。
本発明の実施形態は、構造化クエリシステムと非構造化クエリシステムの両方の利点を含むシステムを提供することによってこれらの問題に対処する。特に、本発明の実施形態は、非構造化コンテンツが、構造化クエリを使用して、しかし、システムを手動で構成して、システムがこうした構造化クエリを実施することが可能になるようにさせることをシステムの設計者または管理者に要求することなく、クエリされることを可能にする。代わりに、本発明の実施形態は、非構造化コンテンツを自動的にアノテートして、そのコンテンツを構造化コンテンツに変換すると共に、新しくアノテートされたコンテンツに関して構造化クエリをシステムが実施できるように、システムのクエリ言語定義を自動的に更新することができる。結果として、システムのユーザは、新しいコンテンツが最小の努力でシステムに追加されるため、新しいコンテンツに関して構造化クエリを実施できる。
本発明の実施形態の別の利点は、本発明の実施形態が、混合コンテンツデータセット、すなわち非構造化コンテンツ(たとえば、物語テキスト)と構造化テキスト(たとえば、離散的事実)の両方を含むデータセットの進化的かつ動的な理解を生じるために使用されることができることがでる。非構造化コンテンツがアノテートされるため、非構造化コンテンツの意味のより深い理解が得られ、アノテーションの形態で記録される。システム内の(新しくアノテートされたコンテンツを含む)混合コンテンツに関して構造化クエリをシステムが実施することを可能にするためにシステムのクエリ言語を動的に更新することは、混合コンテンツから情報がより容易に抽出されることを可能にする。こうした情報は、その後、コンテンツをさらにアノテートするために使用されることができる。結果として、本発明の実施形態は、システムのコンテンツのより深い理解が経時的に得られる正フィードバックループを可能にする。
特定の実施形態によって本発明が上述されたが、先の実施形態は、単に例証として提供され、本発明の範囲を限定または規定しないことが理解される。限定はしないが以下を含む種々の他の実施形態もまた特許請求の範囲内にある。たとえば、本明細書で述べる要素およびコンポーネントはさらに、さらなるコンポーネントに分割されることができる、または、共に結合されて、同じ機能を実施するためのより少数のコンポーネントを形成することができる。
上述したように、構造化文書は、テキストおよび/またはコンテンツが、アノテーションによってマークアップされる文書である。こうしたアノテーションは、XMLタグの形態などで、構造化文書自体内にあるとすることができる。あるいは、たとえば、アノテーションは、文書の外部にあるとすることができるが、その意味がアノテーションによって示されるコンテンツにリンクされるまたはその他の方法で関連付けられることができる。XMLが、本発明の種々の実施形態の説明に関連して使用されるが、これらは、例に過ぎず、本発明の制限を構成しない。アノテーションは、XML以外の表現を使用して表されることができる。
先に述べたいくつかの例では、構造化文書は、スピーチをトランスクライブすることによって生成される。しかし、これは、本発明の制限ではない。むしろ、本発明の実施形態に関連して使用される構造化文書は、スピーチをトランスクライブすることによってだけでなく、任意の方法で生成されることができる。たとえば、構造化文書は、文書内のテキストによって表される概念(たとえば、セクション)をエンコードするコーディング(アノテーション)によって既存の平易なテキスト文書をマークアップすることによる本発明の実施形態に従って生成されることができる。
本明細書で述べるいくつかの例では、アノテートされる「text(テキスト)」が参照されるが、テキストは、本発明の実施形態を適用することができるある種類のコンテンツの例として単に提供され、本発明の制限を構成しない。むしろ、文書内の「text」に対する本明細書におけるいずれの参照も、オーディオ、ビデオ、および/または他のコンテンツに同様に当てはまる。同様に、本明細書で述べるいくつかの例は、「document(文書)」の使用を含むが、本明細書で使用される用語「document」は、テキストを含む、または、テキストを含むだけである文書に限定されない。むしろ、本明細書で使用される用語「document」は、任意の種類のコンテンツを含む、コンピュータ可読媒体上に有形に記憶された任意のデータ構造当てはまる。
クエリ言語定義160は、システム100の他のコンポーネントと別個であるとして図1および図2A〜2Dに示されるが、これは、本発明の要件ではない。たとえば、クエリ言語定義160は、自然言語処理フレームワーク110、探索エンジン120、およびクエリ定式化ユーザインタフェース150の1つまたは複数に統合されることができる。結果として、クエリ言語定義160を修正することは、探索エンジン120を修正して、修正型探索エンジンを生成することができ、かつ/または、クエリ定式化ユーザインタフェース150を修正して、修正型クエリ定式化ユーザインタフェースを生成することができる。クエリ言語定義160の異なる表現が、NLP処理フレームワーク110、探索エンジン120、およびクエリ定式化ユーザインタフェース150によって使用されることができる。さらに、クエリ言語定義160a〜160dは、任意の方法でアノテーション定義162a〜162dを表すことができる。
NLP処理コンポーネント112a〜112nは、図1および図2A〜2DのNLP処理フレームワークに含まれるものとして示されるが、これは、本発明の制限ではない。代わりに、たとえば、NLP処理コンポーネント112a〜112nは、NLP処理フレームワーク110の外部にあるとすることができ、その場合、NLP処理コンポーネント112a〜112nは、自然言語処理を文書コーパス104に適用するときにどのNLP処理コンポーネント112a〜112nを使用すべきかをNLP処理フレームワーク110がわかるように、NLP処理フレームワーク110によって登録されることができる。
クエリ定式化ユーザインタフェース150はオプションである。さらに、たとえクエリ定式化ユーザインタフェース150が使用される場合でも、クエリ定式化ユーザインタフェース150は、探索エンジン120と同じシステムの一部である必要はない。構造化クエリ154は、クエリ定式化ユーザインタフェース150を使用することなく生成されることができる。たとえば、構造化クエリ154は、ユーザ170によってではなく、ソフトウェアによって自動的に生成されることができる。
上述した技法は、たとえば、ハードウェア、コンピュータ可読媒体上に有形に記憶されたソフトウェア、ファームウェア、またはその任意の組合せで実装されることができる。上述した技法は、プロセッサを含むプログラム可能なコンピュータ上で実行される1つまたは複数のコンピュータプログラム、プロセッサによって読出し可能な記憶媒体(たとえば、揮発性および不揮発性メモリおよび/または記憶要素)、少なくとも1つの入力デバイス、および少なくとも1つの出力デバイスで実装されることができる。プログラムコードは、入力デバイスを使用して入力される入力に適用されて、述べた機能を実施し、出力を生成することができる。出力は、1つまたは複数の出力デバイスに提供されることができる。
添付特許請求の範囲内の各コンピュータプログラムは、アセンブリ言語、機械言語、高位手続き型プログラミング言語、またはオブジェクト指向プログラミング言語などの任意のプログラミング言語で実装されることができる。プログラミング言語は、たとえば、コンパイル済みまたはインタープリト済みプログラミング言語とすることができる。
こうした各コンピュータプログラムは、コンピュータプロセッサが実行するために、機械可読記憶デバイスで有形に具現化されるコンピュータプログラム製品で実装されることができる。本発明の方法ステップは、コンピュータ可読媒体上に有形に具現化されるプログラムを実行するコンピュータプロセッサによって実施されて、入力に作用し、出力を生成することによって本発明の機能を実施することができる。適したプロセッサは、例として、汎用マイクロプロセッサと専用プロセッサの両方含む。一般に、プロセッサは、読出し専用をメモリおよび/またはランダムアクセスメモリから命令およびデータを受信する。コンピュータプログラム命令を有形に具現化するのに適した記憶デバイスは、たとえば、EPROM、EEPROM、およびフラッシュメモリデバイスを含む、半導体メモリデバイスなどの不揮発性メモリ、内部ハードディスクおよび取外し可能なディスクなどの磁気ディスク、光磁気ディスク、およびCD−ROMの全ての形態を含む。上記の全ては、特別に設計されたASIC(特定用途向け集積回路)またはFPGA(フィールドプログラマブルゲートアレイ)によって補完される、または、それに組込まれることができる。コンピュータは、一般に、内部ディスク(図示せず)または取外し可能なディスクなどの記憶媒体からプログラムおよびデータを受信することもできる。これらの要素はまた、従来のデスクトップまたはワークステーションならびに本明細書で述べる方法を実装するコンピュータプログラムを実行するのに適した他のコンピュータにおいて見出されることになり、それらの要素は、任意のデジタルプリントエンジンまたはマーキングエンジン、ディスプレイモニタ、あるいは、紙、フィルム、ディスプレイスクリーン、または他の出力媒体上にカラーまたはグレースケールピクセルを生成することが可能な他のラスター出力デバイスと共に使用されることができる。

Claims (28)

  1. 少なくとも1つの非一時的なコンピュータ可読媒体上に有形に記憶されたコンピュータプログラム命令を実行する少なくとも1つのコンピュータプロセッサによって実施される方法であって、
    システムであって、
    文書コーパス内で第1のタイプのアノテーションを生成するために前記文書コーパス内のテキストを構文解析するように適合された第1の自然言語処理コンポーネントと、
    第2のタイプのアノテーションを生成し、前記第2のタイプのアノテーションを前記文書コーパスに追加するために前記文書コーパス内のテキストを構文解析するように適合された第2の自然言語処理コンポーネントと、
    第2のタイプのアノテーションではなく、前記第1のタイプのアノテーションの構造化探索を実施するように適合された探索コンポーネントと
    を備える、システムと共に使用するためのものであり、
    (A)前記文書コーパス内で前記第2のタイプの第1のアノテーションを識別すること、
    (B)前記第2のタイプのアノテーションの構造化探索を前記探索コンポーネントが実施することを可能にするように、前記探索コンポーネントを修正することであって、それにより、修正探索コンポーネントを生成する、修正すること、
    (C)前記第2のタイプのアノテーションを参照する用語を含むクエリを受信すること、および、
    (D)前記クエリを使用して前記文書コーパスに関する探索を実施するために前記修正探索コンポーネントを使用することを含み、
    前記(A)は、
    (A1)前記文書コーパス内で前記第2のタイプの第1のアノテーションを生成するために第2のタイプの前記アノテーションに対応する概念を表す文書コーパス内のテキストを認識することと、
    (A2)前記認識されたテキストを前記第2のタイプの前記第1のアノテーションに関連づけること
    を含む方法。
  2. (A)は、前記文書コーパスに対する前記第1のアノテーションの追加を検出することを含む請求項1に記載の方法。
  3. (A)の前に、前記文書コーパスは、前記第2のタイプのいずれのアノテーションも含まず、
    (B)は、前記文書コーパスに対する前記第2のタイプの前記第1のアノテーションの追加の検出に応答して前記探索コンポーネントを修正することを含む請求項2に記載の方法。
  4. (F)(A)の前に、前記第2のタイプのアノテーションを生成するためにテキストを構文解析するように適合された前記第2の自然言語処理コンポーネントを前記システムに追加することをさらに含み、
    (B)は、前記システムに対する前記第2の自然言語処理コンポーネントの追加に応答して前記探索コンポーネントを修正することを含む請求項に記載の方法。
  5. (B)は、前記少なくとも1つのコンピュータプロセッサによって自動的に実施される請求項1に記載の方法。
  6. (B)は、人間ユーザによって手動で実施される請求項1に記載の方法。
  7. 前記探索コンポーネントは、前記第1のタイプのアノテーションの構造化探索、テキストの非構造化探索、ならびに、テキストと前記第1のタイプのアノテーションの混合探索を実施するように適合される請求項1に記載の方法。
  8. (B)は、前記第2のタイプのアノテーションの定義を含むように、前記第1のタイプのアノテーションの定義を含むクエリ言語定義を修正することを含む請求項1に記載の方法。
  9. 前記システムは、クエリ定式化ユーザインタフェースであって、前記クエリをユーザが定式化するのを支援するように適合された、クエリ定式化ユーザインタフェースをさらに含み、
    (E)前記クエリ定式化ユーザインタフェースを自動的に修正することであって、それにより、前記クエリ定式化ユーザインタフェースが、前記第2のアノテーションを参照する用語を含むように前記クエリを前記ユーザが定式化するのを支援することを可能にする、修正することをさらに含む請求項1に記載の方法。
  10. (B)は、前記第2のタイプのアノテーションの定義を含むように、前記第1のタイプのアノテーションの定義を含むクエリ言語定義を修正することを含む請求項に記載の方法。
  11. 前記文書コーパスは、前記第2のタイプの複数のアノテーションを含み、(D)は、
    (D)(1)前記第2のアノテーションを参照するクエリの用語を使用して前記文書コーパス内で前記第2のタイプのアノテーションに関する選択を実施するために前記探索コンポーネントを使用することを含む請求項1に記載の方法。
  12. コンピュータプログラム命令が有形に記憶されている非一時的なコンピュータ可読媒体であって、前記コンピュータプログラム命令は、システムと共に使用するための方法を実施するために少なくとも1つのコンピュータプロセッサによって実行可能であり、前記システムは、
    文書コーパス内で第1のタイプのアノテーションを生成するために前記文書コーパス内のテキストを構文解析するように適合された第1の自然言語処理コンポーネントと、
    第2のタイプのアノテーションを生成し、前記第2のタイプのアノテーションを前記文書コーパスに追加するために前記文書コーパス内のテキストを構文解析するように適合された第2の自然言語処理コンポーネントと、
    第2のタイプのアノテーションではなく、前記第1のタイプのアノテーションの構造化探索を実施するように適合された探索コンポーネントと
    を備え、
    前記方法は、
    (A)前記文書コーパス内で前記第2のタイプの第1のアノテーションを識別すること、
    (B)前記第2のタイプのアノテーションの構造化探索を前記探索コンポーネントが実施することを可能にするように、前記探索コンポーネントを修正することであって、それにより、修正探索コンポーネントを生成する、修正すること、
    (C)前記第2のタイプのアノテーションを参照する用語を含むクエリを受信すること、および、
    (D)前記クエリを使用して前記文書コーパスに関する探索を実施するために前記修正探索コンポーネントを使用することを含み、
    前記(A)は、
    (A1)前記文書コーパス内で前記第2のタイプの第1のアノテーションを生成するために第2のタイプの前記アノテーションに対応する概念を表す文書コーパス内のテキストを認識することと、
    (A2)前記認識されたテキストを前記第2のタイプの前記第1のアノテーションに関連づけること
    を含むコンピュータ可読媒体。
  13. (A)は、前記文書コーパスに対する前記第1のアノテーションの追加を検出することを含む請求項12に記載のコンピュータ可読媒体。
  14. (A)の前に、前記文書コーパスは、前記第2のタイプのいずれのアノテーションも含まず、
    (B)は、前記文書コーパスに対する前記第2のタイプの前記第1のアノテーションの追加の検出に応答して前記探索コンポーネントを修正することを含む請求項13に記載のコンピュータ可読媒体。
  15. (F)(A)の前に、前記第2のタイプのアノテーションを生成するためにテキストを構文解析するように適合された前記第2の自然言語処理コンポーネントを前記システムに追加することをさらに含み、
    (B)は、前記システムに対する前記第2の自然言語処理コンポーネントの追加に応答して前記探索コンポーネントを修正することを含む請求項14に記載のコンピュータ可読媒体。
  16. (B)は、前記少なくとも1つのコンピュータプロセッサによって自動的に実施される請求項12に記載のコンピュータ可読媒体。
  17. (B)は、人間ユーザによって手動で実施される請求項12に記載のコンピュータ可読媒体。
  18. 前記探索コンポーネントは、前記第1のタイプのアノテーションの構造化探索、テキストの非構造化探索、ならびに、テキストと前記第1のタイプのアノテーションの混合探索を実施するように適合される請求項12に記載のコンピュータ可読媒体。
  19. (B)は、前記第2のタイプのアノテーションの定義を含むように、前記第1のタイプのアノテーションの定義を含むクエリ言語定義を修正することを含む請求項12に記載のコンピュータ可読媒体。
  20. 前記システムは、クエリ定式化ユーザインタフェースであって、前記クエリをユーザが定式化するのを支援するように適合された、クエリ定式化ユーザインタフェースをさらに含み、
    (F)前記クエリ定式化ユーザインタフェースを自動的に修正することであって、それにより、前記クエリ定式化ユーザインタフェースが、前記第2のアノテーションを参照する用語を含むように前記クエリを前記ユーザが定式化するのを支援することを可能にする、修正することをさらに含む請求項12に記載のコンピュータ可読媒体。
  21. (B)は、前記第2のタイプのアノテーションの定義を含むように、前記第1のタイプのアノテーションの定義を含むクエリ言語定義を修正することを含む請求項20に記載のコンピュータ可読媒体。
  22. 前記文書コーパスは、前記第2のタイプの複数のアノテーションを含み、(D)は、
    (D)(1)前記第2のアノテーションを参照するクエリの用語を使用して前記文書コーパス内で前記第2のタイプのアノテーションに関する選択を実施するために前記探索コンポーネントを使用することを含む請求項12に記載のコンピュータ可読媒体。
  23. 少なくとも1つの非一時的なコンピュータ可読媒体上に有形に記憶されたコンピュータプログラム命令を実行する少なくとも1つのコンピュータプロセッサによって実施される方法であって、
    システムであって、
    文書コーパス内で第1のタイプのアノテーションを生成するために前記文書コーパス内のテキストを構文解析するように適合された第1の自然言語処理コンポーネントと、
    第2のタイプのアノテーションではなく、前記第1のタイプのアノテーションの構造化探索を実施するように適合された探索コンポーネントと
    を備える、システムと共に使用するためのものであり、
    (A)前記第2のタイプのアノテーションを生成するためにテキストを構文解析するように適合された第2の自然言語処理コンポーネントの前記システムに対する追加を検出すること、
    (B)前記第2のタイプのアノテーションの構造化探索を前記探索コンポーネントが実施することを可能にするように、前記検出に応答して前記探索コンポーネントを修正することであって、それにより、修正探索コンポーネントを生成する、修正すること、
    (C)前記第2のタイプのアノテーションを参照する用語を含むクエリを受信すること、および、
    (D)前記クエリを使用し前記文書コーパスに関する探索を実施するために前記修正探索コンポーネントを使用することを含む方法。
  24. 前記文書コーパスは、(B)が実施される時間に、前記第2のタイプのいずれのアノテーションも含まない請求項23に記載の方法。
  25. (A)は、前記システムに対して前記第2の自然言語処理コンポーネントを追加することを含む請求項23に記載の方法。
  26. コンピュータプログラム命令が有形に記憶されている非一時的なコンピュータ可読媒体であって、前記コンピュータプログラム命令は、システムと共に使用するための方法を実施するために少なくとも1つのコンピュータプロセッサによって実行可能であり、前記システムは、
    文書コーパス内で第1のタイプのアノテーションを生成するために前記文書コーパス内のテキストを構文解析するように適合された第1の自然言語処理コンポーネントと、
    第2のタイプのアノテーションではなく、前記第1のタイプのアノテーションの構造化探索を実施するように適合された探索コンポーネントと
    を備え、
    前記方法は、
    (A)前記第2のタイプのアノテーションを生成するためにテキストを構文解析するように適合された第2の自然言語処理コンポーネントの前記システムに対する追加を検出すること、
    (B)前記第2のタイプのアノテーションの構造化探索を前記探索コンポーネントが実施することを可能にするように、前記検出に応答して前記探索コンポーネントを修正することであって、それにより、修正探索コンポーネントを生成する、修正すること、
    (C)前記第2のタイプのアノテーションを参照する用語を含むクエリを受信すること、および、
    (D)前記クエリを使用して文書コーパスに関する探索を実施するために前記修正探索コンポーネントを使用することを含むコンピュータ可読媒体。
  27. 前記文書コーパスは、(B)が実施される時間に、前記第2のタイプのいずれのアノテーションも含まない請求項26に記載のコンピュータ可読媒体。
  28. (A)は、前記システムに対して前記第2の自然言語処理コンポーネントを追加することを含む請求項26に記載のコンピュータ可読媒体。
JP2013533002A 2010-10-08 2011-11-02 動的構造化文書コーパスの構造化探索 Expired - Fee Related JP5937601B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US39154410P 2010-10-08 2010-10-08
PCT/US2011/055494 WO2012048306A2 (en) 2010-10-08 2011-11-02 Structured searching of dynamic structured document corpuses

Publications (2)

Publication Number Publication Date
JP2013543999A JP2013543999A (ja) 2013-12-09
JP5937601B2 true JP5937601B2 (ja) 2016-06-22

Family

ID=44675641

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013532314A Expired - Fee Related JP5841605B2 (ja) 2010-10-08 2011-07-31 頭蓋内圧を測定する装置と方法
JP2013533002A Expired - Fee Related JP5937601B2 (ja) 2010-10-08 2011-11-02 動的構造化文書コーパスの構造化探索

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2013532314A Expired - Fee Related JP5841605B2 (ja) 2010-10-08 2011-07-31 頭蓋内圧を測定する装置と方法

Country Status (7)

Country Link
US (2) US9138154B2 (ja)
EP (1) EP2624747A1 (ja)
JP (2) JP5841605B2 (ja)
CN (1) CN103260504B (ja)
BR (1) BR112013008455A2 (ja)
RU (1) RU2571328C2 (ja)
WO (1) WO2012046223A1 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2571328C2 (ru) * 2010-10-08 2015-12-20 Хэдсенс Медикал Лтд. Система и способ измерения внутричерепного давления
RU2014153909A (ru) * 2012-06-01 2016-07-27 Конинклейке Филипс Н.В. Система и способ сопоставления информации о пациенте с клиническими критериями
US9126009B2 (en) * 2013-03-12 2015-09-08 DePuy Synthes Products, Inc. System and method for determining position and pressure of an implantable shunt
JP6081278B2 (ja) * 2013-04-15 2017-02-15 株式会社イチカワ 頭蓋内圧測定装置及び頭蓋内圧測定方法
CN105792750B (zh) * 2013-11-20 2022-01-25 皇家飞利浦有限公司 创伤性脑损伤指南系统和方法
US20160213248A1 (en) * 2015-01-22 2016-07-28 Ovard, Llc Gaze stabilization system and method
WO2016205824A1 (en) 2015-06-19 2016-12-22 Neural Analytics, Inc. Transcranial doppler probe
CA2992961A1 (en) * 2015-07-22 2017-01-26 Headsense Medical Ltd. System and method for measuring icp
EP3399920B1 (en) 2016-01-05 2020-11-04 Neural Analytics, Inc. Integrated probe structure
US11589836B2 (en) 2016-01-05 2023-02-28 Novasignal Corp. Systems and methods for detecting neurological conditions
CN108778140A (zh) 2016-01-05 2018-11-09 神经系统分析公司 用于确定临床指征的系统和方法
RU2621580C1 (ru) * 2016-05-13 2017-06-06 ООО "ГлобалТест" Способ неинвазивного определения внутричерепного давления
US11166643B2 (en) * 2016-06-07 2021-11-09 Michael F. O'Rourke Non-invasive method of estimating intra-cranial pressure (ICP)
JP6989826B2 (ja) * 2016-06-17 2022-01-12 株式会社イチカワ 頭蓋内圧推定方法及び頭蓋内圧推定装置
CN106175743B (zh) * 2016-07-12 2019-02-22 苏州景昱医疗器械有限公司 颅内状态监护系统及监护方法
CN106236138A (zh) * 2016-08-19 2016-12-21 西南医科大学 基于瑞利波的颅内压无创监测仪
CN109497998B (zh) * 2018-12-14 2021-08-10 深圳和而泰数据资源与云技术有限公司 脑电信号质量评估方法、脑电信号采集器和头戴设备
WO2020201083A1 (de) * 2019-04-03 2020-10-08 Sonovum Gmbh Verfahren und vorrichtung zur nicht-invasiven bestimmung und/oder überwachung der intrakraniellen compliance
US20210000407A1 (en) * 2019-07-03 2021-01-07 EpilepsyCo Inc. Systems and methods for a brain acoustic resonance seizure monitor
US10709345B1 (en) * 2019-11-26 2020-07-14 David Michaeli Method and apparatus for noninvasive absolute (mean) intracranial pressure (A-ICP) measurement and/or monitoring
US20210169559A1 (en) * 2019-12-06 2021-06-10 Board Of Regents, The University Of Texas System Acoustic monitoring for electrosurgery

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4690149A (en) 1985-10-28 1987-09-01 The Johns Hopkins University Non-invasive electromagnetic technique for monitoring physiological changes in the brain
GB8622671D0 (en) 1986-09-19 1986-10-22 Marchbanks R J Intracranial fluid pressure monitoring
JPS6382622A (ja) 1986-09-27 1988-04-13 日立建機株式会社 頭蓋内圧の記録装置
JPS6382623A (ja) 1986-09-27 1988-04-13 日立建機株式会社 頭蓋内圧の測定装置
SU1708307A1 (ru) * 1989-08-15 1992-01-30 Особое Конструкторское Бюро Биологической И Медицинской Кибернетики Ленинградского Электротехнического Института Им.В.И.Ульянова (Ленина) Способ внутричерепной диагностики и устройство дл его осуществлени
US5117835A (en) 1990-07-31 1992-06-02 Mick Edwin C Method and apparatus for the measurement of intracranial pressure
WO1992002174A1 (en) * 1990-07-31 1992-02-20 Mick Edwin C Method and apparatus for measuring intracranial pressure
US5074310A (en) 1990-07-31 1991-12-24 Mick Edwin C Method and apparatus for the measurement of intracranial pressure
US5388583A (en) 1993-09-01 1995-02-14 Uab Vittamed Method and apparatus for non-invasively deriving and indicating of dynamic characteristics of the human and animal intracranial media
US5617873A (en) 1994-08-25 1997-04-08 The United States Of America As Represented By The Administrator, Of The National Aeronautics And Space Administration Non-invasive method and apparatus for monitoring intracranial pressure and pressure volume index in humans
US6117089A (en) 1995-04-25 2000-09-12 The Regents Of The University Of California Method for noninvasive intracranial pressure measurement
US5919144A (en) * 1997-05-06 1999-07-06 Active Signal Technologies, Inc. Apparatus and method for measurement of intracranial pressure with lower frequencies of acoustic signal
US5951477A (en) * 1997-09-11 1999-09-14 Uab Vittamed Method and apparatus for determining the pressure inside the brain
US6231509B1 (en) * 1997-12-05 2001-05-15 Royce Johnson Apparatus and method for monitoring intracranial pressure
US6387051B1 (en) 1999-09-15 2002-05-14 Uab Vittamed Method and apparatus for non-invasively deriving and indicating of dynamic characteristics of the human and animal intracranial media
US6589189B2 (en) 2000-01-07 2003-07-08 Rice Creek Medical, Llc Non-invasive method and apparatus for monitoring intracranial pressure
EP1276419A4 (en) 2000-04-20 2009-01-07 Univ Monash METHOD AND DEVICE FOR DETERMINING THE CONDITION OF BIOLOGICAL TISSUE
RU2163090C1 (ru) * 2000-04-24 2001-02-20 Бохов Борис Батразович Способ определения изменений внутричерепного давления и устройство для его осуществления
US6702743B2 (en) 2000-05-26 2004-03-09 Inta-Medics, Ltd. Ultrasound apparatus and method for tissue resonance analysis
US7104958B2 (en) 2001-10-01 2006-09-12 New Health Sciences, Inc. Systems and methods for investigating intracranial pressure
US20060100530A1 (en) * 2000-11-28 2006-05-11 Allez Physionix Limited Systems and methods for non-invasive detection and monitoring of cardiac and blood parameters
US20060079773A1 (en) * 2000-11-28 2006-04-13 Allez Physionix Limited Systems and methods for making non-invasive physiological assessments by detecting induced acoustic emissions
US20020161304A1 (en) 2001-04-30 2002-10-31 Eide Per Kristian Monitoring pressure in a body cavity
EP1480721A4 (en) 2002-02-04 2007-09-12 Great Lakes Biosciences Llc TREATMENT OF NEUROLOGICAL ILLNESSES WITH ELECTRICAL STIMULATION
US6746410B2 (en) * 2002-04-04 2004-06-08 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Method and apparatus for determining changes in intracranial pressure utilizing measurement of the circumferential expansion or contraction of a patient's skull
US6773407B2 (en) 2002-04-08 2004-08-10 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Non-invasive method of determining absolute intracranial pressure
US7147605B2 (en) 2002-07-08 2006-12-12 Uab Vittamed Method and apparatus for noninvasive determination of the absolute value of intracranial pressure
WO2005016121A2 (en) 2003-08-08 2005-02-24 Virginia Commonwealth University Monitoring intra ocular and intra cranial pressure
ATE451878T1 (de) * 2005-05-27 2010-01-15 Inst Tecnologico De Canarias S Halter für chirurgische nadel zum nähen
JP2008077512A (ja) * 2006-09-22 2008-04-03 Fuji Xerox Co Ltd 文書解析装置、および文書解析方法、並びにコンピュータ・プログラム
FR2911060B1 (fr) 2007-01-08 2009-09-18 Univ D Auvergne Clermont 1 Eta Procede non invasif de detection d'un parametre electrique dependant de la pression intralabyrinthique (pil) chez un sujet.
US8632475B2 (en) 2007-02-15 2014-01-21 The Board Of Trustees Of The University Of Illinois Non-invasive, bedside intra-cranial pressure and brain shift/herniation monitoring unit utilizing early onset auditory evoked responses
US7938780B2 (en) 2008-01-31 2011-05-10 Uab Vittamed Technologijos Ultrasonic method and apparatus for measuring intracranial contents volume change
JP2009199192A (ja) * 2008-02-19 2009-09-03 Ohbayashi Corp 文書情報提示方法、文書情報提示プログラムおよび文書情報提示装置
US8366627B2 (en) 2008-09-10 2013-02-05 Massachusetts Institute Of Technology Systems, devices and methods for noninvasive or minimally-invasive estimation of intracranial pressure and cerebrovascular autoregulation
US9398861B2 (en) 2009-12-04 2016-07-26 Third Eye Diagnostics, Inc. Methods and devices for assessing intracranial pressure
RU2571328C2 (ru) * 2010-10-08 2015-12-20 Хэдсенс Медикал Лтд. Система и способ измерения внутричерепного давления
JP5766585B2 (ja) 2011-11-10 2015-08-19 国立大学法人信州大学 頭蓋内圧測定装置および測定方法

Also Published As

Publication number Publication date
CN103260504B (zh) 2015-10-07
EP2624747A1 (en) 2013-08-14
JP2013538664A (ja) 2013-10-17
BR112013008455A2 (pt) 2016-06-28
WO2012046223A1 (en) 2012-04-12
JP5841605B2 (ja) 2016-01-13
RU2571328C2 (ru) 2015-12-20
RU2013118445A (ru) 2014-11-20
US9801608B2 (en) 2017-10-31
US20150351716A1 (en) 2015-12-10
JP2013543999A (ja) 2013-12-09
US9138154B2 (en) 2015-09-22
CN103260504A (zh) 2013-08-21
US20130197390A1 (en) 2013-08-01

Similar Documents

Publication Publication Date Title
JP5937601B2 (ja) 動的構造化文書コーパスの構造化探索
US9659055B2 (en) Structured searching of dynamic structured document corpuses
CN107408156B (zh) 用于从临床文档进行语义搜索和提取相关概念的系统和方法
CA2652441C (en) Verification of extracted data
US9275115B2 (en) Correlating corpus/corpora value from answered questions
US6182029B1 (en) System and method for language extraction and encoding utilizing the parsing of text data in accordance with domain parameters
AU2012235939B2 (en) Real-time automated interpretation of clinical narratives
US8700589B2 (en) System for linking medical terms for a medical knowledge base
US7657832B1 (en) Correcting validation errors in structured documents
US20160132648A1 (en) Data Processing System and Method for Computer-Assisted Coding of Natural Language Medical Text
US20140298199A1 (en) User Collaboration for Answer Generation in Question and Answer System
GB2413664A (en) Extracting chemical data from text documents
US20140337355A1 (en) Indexed Natural Language Processing
Lakshmi et al. Association rule extraction from medical transcripts of diabetic patients
Donatelli et al. Saarland at MRP 2019: Compositional parsing across all graphbanks
Patrick et al. Automated proof reading of clinical notes
Fan et al. Evaluating the impact of dictionary updates on automatic annotations based on clinical NLP systems
Rebholz-Schuhmann et al. IeXML: towards an annotation framework for biomedical semantic types enabling interoperability of text processing modules
Barrett Natural language processing techniques for the purpose of sentinel event information extraction
Supekar et al. Representing lexical components of medical terminologies in OWL
CN115759060A (zh) 结构化病历生成方法、终端及可读存储介质
Chen A Web-Based Annotation System for Lung Cancer Radiology Reports

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150930

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150930

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20151228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160415

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160512

R150 Certificate of patent or registration of utility model

Ref document number: 5937601

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees