図1は、本発明による有害事象に関係する情報を提供するための医療評価支援システムに組み込まれるオントロジー・ベースの検索用語展開機能の一実施形態を示している。このような医療評価システムは、本願明細書に援用する、「Medical Assessment Support System and Method」という表題の、2007年8月22日に出願された、同時係属PCT特許出願第PCT/US2007/076583号で説明されているものに類似するものであってもよい。このような医療評価支援システムは、患者の病状/症状、患者の薬物/治療、患者の投薬/治療、および有害事象を含む情報を備え、これらの入力に関係する情報を出力することができる。システム20は、(a)システム20とユーザ・インターフェース22に直接接続され得るか、またはネットワーク26を通じて接続され得るユーザ24に関連付けられている電子またはコンピューティング・デバイスとの間の通信を円滑にするユーザ・インターフェース22を備える。データ・インターフェース28は、システム20と、1つまたは複数のデータの外部ソース30またはユーザ・インターフェース22上でユーザがシステム20に伝達するクエリを処理するために使用される情報との間の通信を円滑にする。(単数または複数の)外部データ・ソース30は、データ・インターフェース28に直接接続することができ、かつ/またはネットワーク32の接続を通じて接続することもできる。処理エンジン34は、ユーザ・インターフェース22上でサブミットされるユーザ・クエリに応答して、データまたは情報ソースの1つまたは複数の検索を実行させ、ユーザ・インターフェース22上でユーザに1つまたは複数の検索の結果を受け渡す。
引き続き図1を参照すると、そこでは、ユーザ・インターフェース22は、ネットワーク26を通じてユーザ24に関連付けられているクライアント・ウェブ・ブラウザ対応の電子装置または計算装置と通信することができるウェブ・サーバからなるものとしてもよい。ユーザ・インターフェース22が通信できる電子装置または計算装置としては、パーソナル・コンピュータ、PDA、およびウェブ・ブラウザを実行することができる携帯電話が挙げられるが、これらに限定されない。このような一実施形態におけるユーザ・インターフェース22では、クライアント・ブラウザに、キャッシュ・サーバ・ページ(CSP)を介してデータベース管理システムにリンクされているフィールドを含むフォームを表示させることができる。例示的な一実施形態では、ユーザ・インターフェース22およびクライアント・ブラウザは(1)(単数または複数の)医薬品情報すなわち処方入力フィールドと、(2)(単数または複数の)病気情報入力フィールドと、(3)(単数または複数の)有害事象情報入力フィールドとを含むがこれらに限定されない一対一の関連付けを保持する。図2は、記載されたフィールドを含む例示的なブラウザ・ウィンドウを示している。この実施形態では、すべてのフィールドが、データベース管理システム(DBMS)36内に内部的に格納されている情報にリンクされる。1人または複数のユーザとの通信がウェブ以外のネットワーク(ワイドエリアネットワークまたはローカルエリアネットワーク)上で実行される必要がある場合に、ユーザ・インターフェース22が任意の種類のサーバを含み得ることは理解されるであろう。ユーザ・インターフェース22は、ユーザに関連付けられている電子装置または計算装置と通信することもでき、また医療産業において広く使用されているメッセージング標準であるHL7メッセージングを使用することができ、また医療産業に存在している、または将来の医療産業に採用される他のメッセージング・プロトコルに適応可能なものとすることもできる。
ユーザ・インターフェース22は、一実施形態では、ユーザ24がウェブ・ブラウザ・ウィンドウをバイパスし、処理エンジン34に関連付けられている1つまたは複数のデータベース管理システムに直接アクセスすることを可能にするカスタム統合ソリューション・インターフェースからなるものとしてもよい。このようなカスタム統合ソリューション・インターフェースは、リレーショナル・データベースまたはオブジェクト指向データベース・プロトコルに従っているクエリを受け付けることが可能である。例えば、インターフェースは、SQL型のクエリにODBCまたはJDBCプロトコルを使用するリレーショナル・データベース・クエリを受け取って、応答をSQL形式で送ることができるものとしてよい。インターフェースは、JAVA(登録商標)、C++、VB、SOAP、.NETなどに基づくクエリを受け取って、それに適した形式で応答を送ることもできる。インターフェースは、必要になった場合に他のプロトコルと統合するように適合させることもできる。リレーショナル・データベース・クエリまたはオブジェクト指向データベース・クエリを処理する機能は、プロトコル・インテリジェント型の、つまり、クエリが基づいているプロトコルを認識することができるCACHEをベースとする処理エンジン34を構成することによって実現される。プロトコル・インテリジェント型の他のシステムも使用できることが理解されるであろう。
引き続き図1を参照すると、データ・インターフェース28は、外部データ・ソース30(典型的には商用データ・ソースであるが、私的データ・ソース、専用データ・ソース、または公開データ・ソースを含んでいてもよい)にデータまたは情報の要求を送り、処理エンジン34の一部である1つまたは複数のデータベースを構築するために使用されるデータまたは情報をこれらのソースから受け取るために使用される。一実施形態では、データ・インターフェース28は、バイオマーカー・データ、安全性データ、医薬品表示(PPI)データ、製薬会社医療情報(Ml)レター、白書、臨床試験データ、マイクロアレイ・データ、ゲノムおよび/またはプロテオーム・データ、一塩基変異多型(SNP)、薬物反応シミュレーション・システムなどを提供するデータ・ソースに要求を送り、そのような要求に対する応答を受け取るために使用される。データ・インターフェース28は、記載された型のデータまたは情報の部分集合を提供する1つまたは複数のデータ・ソース30に要求を送り、応答を受け取ることができる。例示的な一実施形態では、データ・インターフェース28は、HL7、XML、JDBC、ODBC、およびその他を含むすべての主要な通信プロトコルをサポートするバック・エンド通信インターフェースである。データ・インターフェース28は、異種の外部システムと通信し、内部クラス構造を用いて、データの解析およびDBMS 36へのマージを素早くかつ効率的に実行する機能を備えることができる。DBMS 36は、一実施形態では、さまざまな異なる方法で(オブジェクト、リレーショナル・テーブル、および/またはその他を使用して)データを格納し、リレーショナルまたオブジェクト・クエリに素早く応答することができる。
引き続き図1を参照すると、処理エンジン34は、(a)ユーザ・インターフェース22を介してユーザによって提示されるそれぞれのクエリを処理するアプリケーション・サーバ38、(b)オントロジー言語プロセッサ40、(c)(単数または複数の)薬物と(単数または複数の)病気とのユーザ指定の組合せに基づく有害事象についての1回または複数回の検索、ユーザ指定の(単数または複数の)有害事象および(単数または複数の)病気および(単数または複数の)薬物のうちの少なくとも1つに基づく1回または複数回の検索を行わせ、ユーザに対するシステムの便益を定量化する評価指標をユーザに提供し、システムの使用に基づき医療従事者であるユーザに対する継続的医療教育クレジットを監視することができるクライアント・データベース管理システム42、および/または(d)システム20の外部に常駐するが、システム20にアクセス可能な、識別されない、または他の何らかの状態の、電子医療記録データベース46へのアクセスを可能にするアプリケーション・プログラム・インターフェース(API)44からなる。例示されている実施形態では、処理エンジン34は、データを対象(オブジェクト)とテーブル(SQLリレーショナル)として格納する多次元ポスト・データベース管理システムである。データは、オブジェクト指向言語(.net、Java(登録商標)、XMLなど)および/またはSQL、DBMSリレーショナル・データベース業界標準に従うデータベース言語を使用して直接的にアクセスすることができる。DBMS 34は、トランザクション・ビットマップ・インデックス作成方式を使用して、ユーザ応答時間を向上させる。
例示されている実施形態では、処理エンジン34の1つまたは複数の要素は、ユーザ24から検索用語を含む多数の異なる型のクエリに応答し、受け取った検索用語に基づいて展開された検索用語を含んでいた検索クエリを生成することができる。さまざまな実施形態において、検索用語がユーザ・インターフェースに入力されると、その検索用語は、展開され、これにより、検索用語に対し実行された検索クエリの結果として適切な情報が提示されることを確実にすることができる。「検索用語」という用語を使用する場合、検索されることが望まれている該当する項目を対象としたインターフェースから受け取った1つまたは複数の単語が参照される。データ・リポジトリが、インターフェースで受け取った概念を参照しつつ、異なる命名を使用する情報を含む場合、関連する情報は、検索から生成されないことがある。例えば、医療評価システムでは、ユーザは、「心調律動の異常(abnormal heart rhythms)」などの有害事象に対応する検索用語を入力することができる。しかし、処理エンジンによってアクセスされる外部データ・ソースのうちの1つまたは複数は、「不整脈(arrhythmias)」のカテゴリに下にあるそのような事象に関係する情報を含むことがある。このような場合、外部データ・ソースからの関連性の高い情報は、検索用語と外部データベースで使用される用語にこのような違いがあるため、検索結果リストに返されないことになる。
本開示の実施形態では、検索用語を受け取った後、検索から関連する結果を生成する可能性の高い多数の異なる検索用語、または代替検索用語を含むように検索クエリを展開する検索用語展開を行う。本明細書で開示されている実施形態では、オントロジー・ベースの検索用語展開を行い、さまざまな異なる病状に関係する多数の異なるオントロジーを構成する。オントロジーに含まれる検索用語が入力された場合、他の検索用語は、このオントロジーに基づいて決定される。したがって、実施形態は、自動生成オントロジー(AGO)すなわち検索用語のリストあって、そのすべての用語がユーザによって入力された一つの臨床用語に機能的に関係するリストを提供する。臨床用語は、いくつかの実施形態では、ユーザによって入力された有害事象を指す。一実施形態では、ユーザ・インターフェースは、ユーザが検索用語を入力することができるウェブ・ベース・インターフェースを構成し、AOGは、オートフィル機能を介して、優先使用語(PT)とも称される入力された語を、可変機能不全オントロジーの「ユニバース」と比較して、関連臨床用語を含むようにPTをさらに展開する。
次に図3を参照しつつ、実施形態の操作について説明する。この実施形態では、ブロック100に示されているように、検索用語の入力が開始される。検索用語は、ユーザによって、ウェブ・アクセス可能な入力フォームなどを介してユーザ・インターフェースに入力され得る。ユーザが入力を行うと、ブロック104において、オートフィル機能が、部分的に入力された検索用語の一部に基づいて可能性のある検索用語がないか判定する。例えば、ユーザが、ウェブ・アクセス可能な入力フォームに検索用語を入力し始めると、オートフィル機能が、入力された最初の文字を認識し、入力された文字で始まる検索用語に対する1つまたは複数のオプションを提示することができる。他の実施形態では、ユーザからまたは自動化システムから検索用語全体を単純に受け取ることができ、したがってオートフィル機能は使用されないことが理解されるであろう。オートフィル機能が使用された場合には、ユーザは、誤入力の可能性を減らし、検索用語の入力に要する時間を短縮するような機能が便利であることを理解するであろう。ブロック108で、検索用語が選択されているかどうかの判定が行われる。オートフィル用語を選択するか、または検索用語が完全に入力されたことの確認を入力することなどによって、検索用語が選択されていない場合、ブロック100で始まる操作が繰り返される。ブロック108で、検索用語が入力されたと判定された場合、ブロック112で、入力された検索用語に基づいて処理エンジンに関連付けられているDBMS内に格納されているオントロジーに対する検索が実行される。ブロック116で、他の検索用語がオントロジーから識別されているかどうかの判定が行われる。他の検索用語の決定については、以下でさらに詳しく説明する。識別された検索用語が他になければ、ブロック120で指示されているように、クエリが検索エンジンにサブミットされる。このようなクエリは、内部データ・ソース、および/または1つまたは複数の外部データ・ソースに対して生成され得る。
例示的な一実施形態において、他の検索用語の判定は、図1に示されているように、処理エンジン内のオントロジー言語プロセッサを通じて実行される。処理エンジンは、システム20によって保持されているか、またはシステム20が利用可能なデータベースの1つまたは複数のデータベース検索を実行して、入力された検索用語に臨床的に関連する検索用語の展開された集合を識別するように動作する。4つの例示的な機能不全オントロジーが、図4〜7に示されている。一実施形態では、これらのオントロジーは、図1に示されているシステム20のDBMS 36などのDBMSに含まれる。このようなオントロジーは、容易に理解されるように、1つまたは複数の外部データ・ソースに含まれ得る。一実施形態では、システム20は、ユーザ・インターフェース22から検索用語を受け取った後、リアルタイムで自動化オントロジー生成を実行する。ユーザ・インターフェースは、検索用語を受け取る。例えば、検索用語が、「Elevated LFTs」(LFTの上昇)であるとすると、これは、「肝機能検査値の上昇」(Elevated Liver Function Tests)という有害事象を表す。オントロジー言語プロセッサは、図7Aの「肝機能不全オントロジー」に見られる、「Elevated LFTs」という検索用語について利用可能なさまざまな機能不全オントロジーを検索する。この例では、オントロジー言語プロセッサ40は、切り取りおよび語幹抽出型の検索を含む機能不全オントロジーの検索を実行し、図7Aのオントロジーから導出されたインデックス上のLFT*に接続されるElevat*を見つける。文字列「Elevated LFTs」は、図7Aに示されている文字列「Elevat* LFT*」から生成され得るので、図7のこの機能不全オントロジーから導出され得る可能なすべての用語が生成され、自動生成されたオントロジーに追加される。図7の例では、この結果、図7Aから7Dのそれぞれから利用可能である30個の用語が得られる。図4の心不全オントロジーなどの、他の例示的なオントロジーでは、潜在的に数百に達する臨床的概念が、識別された機能不全オントロジーから生成されることができ、ほぼすべての用語が複数の単語を含んでいる。
それぞれのオントロジーは、機能不全オントロジーに関する用語のグルーピングにおいて、他の用語に関係しない独立した用語を含むこともできる。図4の実施形態では、心不全オントロジーは、互いに関係する用語の多数のグループを含み、これらの用語は直接的関係および間接的関係を有する。示されている例では、直接関連用語は直線で接続されているものとして識別されている。それぞれのオントロジーは、他の用語に必ずしも直接的に関係していない多数の独立した用語を含み得る。例えば、図4の心不全オントロジーは、独立した用語として、
ACS、abrupt vessel closure(急な血管閉鎖)、afterload(後負荷)、AHA、AMI、aneurysm(動脈瘤)、angina(狭心症)、angiogra*(血管造影*)、anticoagula*(抗凝固*)、aort*(大動脈*)、arrhythmia(不整脈)、atherosclero*(アテローム性*)、Atri*(心房*)、backward effect(逆流効果)、angioplast*(血管形成*)、CABG、CAD、Cardiac(心臓の)、Cheyne−Stokes respiration(チェーン・ストークス呼吸)、C reactive(C反応性)、C−reactive(C反応性)、CK、CK−MB、CRP、clot*(凝血*)、coagula*(凝固*)、coronary(冠状動脈)、Cor pulmonale(肺性心)、creatine kinase(クレアチンキナーゼ)、cyanosis(チアノーゼ)、Diastol*(心臓拡張*)、dyspnea(呼吸困難)、ECG、echocardiogra*(心エコー*)、ejection fraction(駆出分画)、EKG、electrocardiogra*(心電図*)、embol*(塞栓*)、endocardi*(心内膜*)、epicardi*(心外膜*)、exertional dyspnea(労作性呼吸困難)、fibrin*(フィブリン*)、Factor VIII(第VIII因子)、fbrillat*(細動*)、filling time(充填時間)、foam cells(泡沫細胞)、forward effects(前方効果)、Framingham heart study(フラミンガム心臓研究)、Frank−Starling mechanism(フランク−スターリング機構)、GP 2b/3a、GP 2b3a、GP IIb IIIa、GP IIb/IIIa、HDL、heart(心臓)、hemosta*(止血*)、heparin(ヘパリン)、Holter monitor(ホルタ・モニタ)、hsCRP、hypercholesterol*(高コレステロール*)、hypercoag*(凝固亢進*)、hypertensi*(高血圧*)、hypertroph*(肥大*)、IIb/IIIa、inotropic(変力)、interventricular septum(心室中隔)、intra−aortic balloon(大動脈内バルーン)、irregular pulse(不整脈)、Ischemic attack*(虚血性発作*)、Ischaemic attack*(虚血性発作*)、lactate dehydrogenase(乳酸脱水素酵素)、LAD、LCA、LCX、LD、LD1、LDL、lipoprotein*(リポタンパク*)、LMWH、LVEDP、LVEDV、LVEF、malfunction* heart(心*不全)、MI、muddy streaks(泥状の縞)、MUGA、Multiple−gated acquisition scanning(マルチゲート収集スキャン)、mural thrombi(壁在血栓)、myocardi*(心筋*)、myoglobin(ミオグロビン)、non−cardiovascular(非心臓血管)、non−Q、NQMI、NYHA、PAAD、pacemaker(ペースメーカー)、palpitations(動悸)、PAOD、paroxysmal nocturnal dyspnea(発作性夜間呼吸困難)、patent ductus arteriosus(動脈管開存症)、PCI、PDA、pericardi*(心膜*)、pericardi* effusion(心膜*液)、PND、preload(前負荷)、Prinzmetal’s(プリンツメタル)、prothrombin(プロトロンビン)、PTCA、Purkinje(プルキンエ)、PVC、QRS complex abnormalities(QRS群異常)、Q wave*(Q波*)、RAA、RCA、renin−angiotensin−aldosterone(レニン・アンジオテンシン・アルドステロン)、S3 gallop(III音性ギャロップ)、ST segment(ST部分)、SEMI、SGOT、sinoatrial(洞房の)、stenotic(狭窄)、stent(ステント)、stroke(卒中)、subendocardial(心内膜下の)、substernal heaviness(胸骨下の重苦しさ)、sudden death(突然死)、systol*(収縮期*)、tachycardia(頻脈)、tachypnea(頻呼吸)、tetralogy of Fallot(ファロー四徴症)、third heart sound(第3心音)、thromb*(トロンボ*)、thyrotoxicosis(甲状腺機能亢進症)、troponin*(トロポニン*)、T−wave inversion(T波逆転)、vasoconstriction(血管収縮)、vena cava*(大静脈*)、ventric*(心室*)、VLDL、およびvon Willebrand’s Factor(フォン・ヴィレブランド因子)を含み得る。
機能不全オントロジーから導出された検索用語展開を実行する際に、オントロジー言語プロセッサ40によってルール集合が確立され、使用され得る。このようなルール集合は、例えば、機能不全オントロジーにおける用語のそれぞれのグルーピングからの用語を、その用語がそのグループ内の他の用語に直接結び付けられている場合にのみ検索に使用できることを含んでいてもよい。用語がそのグループ内の他の語に直接結び付けられている場合、または独立した用語が検索用語として入力される場合、検索クエリは、オントロジー内のそれぞれのグルーピングからの直接関連用語さらにはオントロジーからの独立した用語のすべての可能な文字列を含まなければならない。冗長な用語は、検索クエリから削除されることができる。例えば、親の用語と子の用語が1つのクエリ内に複数回出現する場合、重複する出現を削除することができる。このような一実施形態では、それらの中に埋め込まれた親の用語を含む子の用語は、冗長であるとして排除されることはなく、検索用語の展開リスト(または自動生成されたオントロジー)に含まれる。例えば、システムは、親の用語「Colitis」(結腸炎)に基づいて生成されたリストから「Protocolitis」を排除せず、両方の用語がクエリに含まれる。しかし、親の用語が修正単語と異なる用語は排除され得る。例えば、「Ulcerative colitis」(潰瘍性結腸炎)が、親の用語「Colitis」(結腸炎)の子の用語であった場合には、「Ulcerative colitis」(潰瘍性結腸炎)は、冗長な単語全体が親の用語によく似ているため、展開リストから排除される。
図4〜7の例を続けると、図4の心不全オントロジーは、図5の下痢症オントロジーと比べて、比較的複雑なオントロジーであり、関連用語の2つのグルーピングと単一の独立した用語「diarrhea」(下痢)がある。図6の膵臓機能不全オントロジーは、関連用語の4つのグルーピングを含み、また、独立した用語、Cullen’s Sign(カレン徴候)、Diabet*(糖尿病*)、Dyspnea(呼吸困難)、Ecchymoses of the flank(脇腹の斑状出血)、Eruptive xanthomas*(発疹性黄色腫*)、Gallstone*(胆石*)、Grey−Turner’s sign(グレー・ターナー徴候)、Hyperglycemia(高血糖症)、Hyperglycaemia(高血糖症)、Hyperlipidemia(高脂血症)、Hyperlipidaemia(高脂血症)、IDDM、Insulin(インスリン)、Pancrea*(膵臓*)、Purtscher retinopathy(Purtscher網膜症)、Tachypnea(頻呼吸)、およびUmbilicus(臍)も含む。同様に、図7の肝機能不全オントロジーは、関連用語の4つのグルーピングおよび独立した用語、Jaundice*(黄疸)、およびCholestatic(胆汁鬱滞性の)を含む。理解されるように、多数の他のオントロジーが、同様に生成され、受け取った検索用語を展開するために使用され得る。
他の実施形態では、生成された検索用語に同義語があるかどうかを調べるために、検索用語リストをさらに展開することもできる。このような実施形態では、オントロジー言語プロセッサが、ユーザ・インターフェースで受け取った元の検索用語にすべて機能的に関係する検索用語のリストを生成した後、外部ソースにクエリを実行して、追加の機能的に関係する臨床用語を自動生成オントロジーに追加できるかどうかを調べる。探索されるべきこのような外部ソースは、SNOMED−CTオントロジーとすることができる。SNOMED−CT(Systematized Nomenclature of Medicine−Clinical Terms)は、元々、米国病理医協会(CAP)が作成した包括的な臨床用語集であり、2007年4月現在において、デンマークの非営利団体であるInternational Health Terminology Standards Development Organization(IHTSDO)によって所有、保守、配布がなされている。CAPは、IHTSDOとの契約に基づきSNOMED−CTの作業の支援を続けており、SNOMED関連製品およびサービスを専門用語集のライセンシーとして提供している。
このような実施形態において、ユーザ・インターフェースは、オートフィル機能、および外部データ・ソース内のSNOMED−CTオントロジーへのリンクを提供することができる。一実施形態におけるオントロジー言語プロセッサは、SNOMED−CTによって「疾患」、「所見」、または「事象」として分類されていないすべての用語から選り抜かれたリストから、SNOMED−CT優先使用語(PT)(「コンセプト」とも称される)のリストを提供する。上記で使用されている肝機能不全の例をここでも続けると、入力された検索用語「Elevated LFTs」(LFTの上昇)は、SNOMED−CTオントロジーから用語を提示せず、検索は、図7の肝機能不全オントロジーからのみ導出された30個の検索用語を使用して開始するように用意されている。
次に、図8〜12を参照すると、元の検索用語が「Skin disease」(皮膚病)である一例について一実施形態が説明されている。このような一実施形態では、皮膚機能不全オントロジーから検索用語を生成した後、オントロジー言語プロセッサは、元の検索用語をSNOMED−CTに受け渡す。ユーザがSNOMED−CTから渡されたものからPTを選択した場合、その「コンセプト」は、捕捉され、自動生成オントロジーからの用語に追加されるべき用語となる。次いで、オントロジー言語プロセッサは、SNOMED−CTを「呼び出し」、選択された語(この場合には、「Skin disease」)をSNOMED−CTにパラメータとして受け渡す。オントロジー言語プロセッサは、そのパラメータを使用して、すべてのSNOMED−CTコンセプトのインデックスにアクセスし、SNOMED−CTコンセプトがその特定の用語を含むどうかを確認する。「Skin disease」という用語は、図8に示されているスクリーン・ショットにSNOMED−CT検索用語として入力されることが図示されている。次いで、オントロジー言語プロセッサは、図9のスクリーン・ショットに例示されているように、用語(Skin disease)が(SNOMED−CTで定義されているような)同義語を有するかどうかを調べる。オントロジー言語プロセッサは、PTのすべての同義語を捕捉し、それらの用語を異なるPTとしてSNOMED−CT検索ウィンドウ内に再入力する。この場合、「Skin disease」の同義語は、例えば、「Dermatosis」(皮膚症)を含む他のいくつかの語を含むように図示されている。「Dermatosis」を、オントロジー言語プロセッサがPTの同義語で実行するものの一例として使用した場合、図10は、オントロジー言語プロセッサが「Dermatosis」(皮膚病)をPTとして使用してSNOMED−CT内を検索し、この同義語を独立したPTとして処置し、自動生成されたオントロジー内の用語のリストに追加の用語を加えるスクリーン・ショットを示している。次いで、オントロジー言語プロセッサは、PTのそれぞれ(元の検索用語+同義語)が関連する部分集合を有しているかどうか、つまり、展開可能かどうかを調べる。用語がSNOMED−CTオントロジー内に展開可能である場合、その用語は、用語の左側にあるボックスの中に「+」記号を有しており、これは、その用語が、それと関連付けられている「子の用語」、つまり部分集合を有すること、およびそれらの子の用語を表示するように展開可能であることを示しており、これは図8〜10のスクリーン・ショットに例示されている。
用語が展開可能である場合、オントロジー言語プロセッサは、用語「Skin disease」(皮膚病)が展開されている図11のスクリーン・ショットに例示されているように、PTのすべての「子の用語」、つまり部分集合を含むように用語を自動的に展開する。子の用語のいくつかは、他の単語に加えて親の用語(PT)を含むことができ、またいくつかは、子の用語の中に埋め込まれているPTを含むことができ、またいくつかの子の用語は、一意的であるものとしてよい。一意的であるか、または用語の中に埋め込まれたPTを含むすべての子の用語が、自動生成オントロジーの検索用語に加えられる。子の用語がそれ自体展開可能である場合、それらの用語のそれぞれは、展開され、それらの部分集合内の一意的な用語が捕捉され、「Acute skin disorder」(急性皮膚疾患)という用語に対して、図12に例示されているように、自動生成オントロジーに加えられる。選択された用語のすべてが、展開された場合、オントロジー言語プロセッサは、次いで子および子の同義語を再帰的に含めることによって用語のその集合を展開する他の方法を呼び出す。
PTおよびすべての同義語が捕捉され、それらの用語の下のすべての一意的な子の用語が捕捉され、すべての展開可能な子の用語がそれらの下の一意的な子の用語の捕捉のために展開され、というように続けていった後、SNOMED−CT導出自動生成オントロジーが作成され、機能不全オントロジーから導出された初期自動生成オントロジーに加えられる。
オントロジー言語プロセッサが、機能不全オントロジーから導出されたすべての検索用語をSNOMED−CTから導出された検索用語のリストに追加した後、オントロジー言語プロセッサは、他のソースへと進むことで、この検索用語展開方法を続けることができる。次いで、それは、データをアルファベット順にソートされた配列内に埋め込み、ユーザに、編集可能バージョンの自動生成オントロジーを提示する前に冗長性を排除する。
このようにして生成された自動生成オントロジーを使用して処理エンジンがデータ・ソースを検索する前に、例示的な一実施形態では、編集可能バージョンの自動生成オントロジーを再検討する選択肢がユーザに与えられ、したがって、ユーザは、そのユーザにとって重要でない自動生成オントロジー内の検索用語の「チェックボックスをオフにする」か、または「選択解除」する機会を与えられる。それに加えて、ユーザは、最終的な編集された自動生成オントロジーを使用してデータ・ソースの検索を開始する前に、自動生成オントロジーに検索用語を「追加」することを許される。ユーザは、特定のPTに関連付けられている自動生成オントロジーに加えられた変更を「優先して保存する(Save as preference)」で保存することができ、したがって、次回ユーザがそのPTを入力すると、自動生成オントロジーがそれに応じて修正される。
他の実施形態は、異なるユーザによって(追加または選択解除を用いて)繰り返し変更され、システム内に格納されている自動生成オントロジーが、例えば、DBMS内でクラスタ化できることを規定している。共通の変更は、「ピア・キュレイテッド(peer−curated)」自動生成オントロジーすなわちPCAGOとして知られているその自動生成オントロジーのあるバージョン内に保存され得る。これは、オントロジー生成に対するwiki方式であり、PCAGOは、ユーザが他の何らかの形で再検討および編集が必要であると感じる新規の自動生成オントロジーに頼るのではなく、時間が限られているときにこれらのピア・レビュー自動生成オントロジーを使用することを好む可能性のあるユーザにとって利用可能なものである。例示的な一実施形態では、ユーザは、PCAGOを選択し、次いで、PCAGOをさらに精密化し、修正してから、検索のためクエリをサブミットすることができる。
当業者であれば、本明細書で開示されている実施形態に関して説明されているさまざまな例示的な論理ブロック、モジュール、回路、およびアルゴリズム・ステップは、電子ハードウェア、コンピュータソフトウェア、ファームウェア、またはこれらの組合せとして実装することができることを理解するであろう。このような互換性を明確に例示するために、上では、さまざまな例示的なコンポーネント、ブロック、モジュール、回路、およびステップが、一般的にその機能に関して説明されている。このような機能がハードウェア、ソフトウェア、および/またはファームウェアとして実装されるかどうかは、特定の用途およびシステム全体に課せられる設計制約条件によって決まる。当業者であれば、それぞれの特定の用途についてさまざまな方法により説明されている機能を実装することができるが、そのような実装決定は、本発明の範囲からの逸脱を引き起こすものとして解釈されるべきではない。
ハードウェアによる実装では、処理ニットは、1つまたは複数の特定用途向け集積回路(ASIC)、デジタル・シグナル・プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラマブル・ロジック・デバイス(PLD)、フィールド・プログラマブル・ゲート・アレイ(FPGA)、プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサ、電子デバイス、本明細書で説明されている機能を実行するように設計されている他の電子ユニット、またはこれらの組合せの中に実装することができる。
ファームウェアおよび/またはソフトウェア実装では、これらの方法は、本明細書で説明されている機能を実行するモジュール(例えば、プロシージャ、関数など)で実装され得る。命令を明白に具体化する機械可読媒体は、本明細書で説明されている方法を実装する際に使用され得る。例えば、ソフトウェア・コードは、メモリ内に格納され、プロセッサによって実行され得る。メモリは、プロセッサ内に、またはプロセッサの外部に実装することができる。本明細書で使用されているように、「メモリ」という用語は、任意の種類の長期的な、短期的な、揮発性の、不揮発性の、または他のメモリを指し、メモリの特定の種類、メモリの特定の数、またはメモリが置かれる媒体の種類に限定されないものとする。
ソフトウェアで実装された場合、これらの関数は、コンピュータ可読媒体上で1つまたは複数の命令もしくはコードとして格納または伝送され得る。コンピュータ可読媒体は、一方の場所から他方の場所へのコンピュータ・プログラムの転送を容易にする媒体を含むコンピュータ記憶媒体と通信媒体の両方を含む。記憶媒体は、コンピュータによってアクセスできる利用可能な媒体とすることができる。例えば、限定はしないが、このようなコンピュータ可読媒体としては、RAM、ROM、EEPROM、CD−ROM、または他の光ディスク記憶装置、磁気ディスク記憶装置、または他の磁気記憶デバイス、または命令もしくはデータ構造体の形態で所望のプログラム・コードを搬送または格納するために使用することができ、またコンピュータによってアクセスできる他の媒体が挙げることができる。また、任意の接続を、コンピュータ可読媒体と呼んで差し支えない。例えば、ソフトウェアが同軸ケーブル、光ファイバ・ケーブル、ツイスト・ペア線、デジタル加入者回線(DSL)、または赤外線、ラジオ、およびマイクロ波などの無線技術を使用してウェブ・サイト、サーバ、または他のリモート・ソースから送信される場合、同軸ケーブル、光ファイバ・ケーブル、ツイスト・ペア線、DSL、または赤外線、ラジオ、およびマイクロ波などの無線技術は、媒体の定義に含まれる。本明細書で使用されているような、「Disk」と「Disc」は、コンパクト・ディスク(CD)、レーザー・ディスク、光ディスク、デジタル多用途ディスク(DVD)、フロッピ・ディスク、およびブルーレイ・ディスクを含み、「Disk」は通常磁気的にデータを再現し、「Disc」はレーザーを使って光学的にデータを再現する。上記の組合せも、コンピュータ可読媒体の範囲に収まらなければならない。
開示されている実施形態を前記のように提示したのは、当業者が本発明を製作または使用することができるようにするためである。これらの実施形態に対しさまざまな修正を加えられることは、当業者にとっては明白であろうし、また本明細書で定義されている一般原理は、本発明の趣旨または範囲から逸脱することなく他の実施形態にも適用することができる。したがって、本発明は、本明細書に示されている実施形態に限定されることを意図されておらず、本明細書で開示されている原理および新規性のある特徴と一致する最も広い範囲を適用されることを意図されている。