JP2008546098A - 患者の人口統計的レコード照会のデータ依存型フィルタリングシステム及び方法 - Google Patents

患者の人口統計的レコード照会のデータ依存型フィルタリングシステム及び方法 Download PDF

Info

Publication number
JP2008546098A
JP2008546098A JP2008514799A JP2008514799A JP2008546098A JP 2008546098 A JP2008546098 A JP 2008546098A JP 2008514799 A JP2008514799 A JP 2008514799A JP 2008514799 A JP2008514799 A JP 2008514799A JP 2008546098 A JP2008546098 A JP 2008546098A
Authority
JP
Japan
Prior art keywords
search
field
record
search criteria
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008514799A
Other languages
English (en)
Inventor
エッチ ジアン、ファン
エイ ランディ、ウイリアム
サンディラ、サティアカマ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens Medical Solutions USA Inc
Original Assignee
Siemens Medical Solutions USA Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Medical Solutions USA Inc filed Critical Siemens Medical Solutions USA Inc
Publication of JP2008546098A publication Critical patent/JP2008546098A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Abstract

1つ又は複数の探索ロケータフィールドを含む探索基準を規定するステップ(71)と、前記探索基準におけるエラートレランスを最大にし、同時に、予め定められた応答時間要件を満たす検索式を前記探索基準から決定するステップと、前記データベースから前記候補レコードを検索(72)し、前記応答時間要件を満たす検索式を見つけることができなければ、追加探索基準を要求し、探索基準ロケータフィールドと対応する検索レコードフィールドを比較して、前記各候補レコードを評価するステップ(73)と、前記候補レコードの評点が予め定められたしきい値を超えるか否かを判定するステップ(75)と、前記候補の評点が前記しきい値を超えると、前記探索基準に応答して戻されるレコードリストに前記候補レコードを追加するステップを含む、患者データベース探索におけるデータ依存型フィルタリング方法。

Description

関連米国特許出願の相互参照
本出願は、その内容が参考までに本明細書において援用されている、2005年5月31日に提出された、Phan他の米国仮特許出願第60/686,065号、「Data Sensitive Filtering in Search for Patient Demographic Records」からの優先権を主張するものである。
本発明は、医療記録データベース照会の探索及びフィルタリングに関するものである。
病院情報システムの重要な機能性は、何らかの入力基準に基づいて患者のレコードのエラートレラント探索を実施する能力である。例えば、病院職員は、わずかに姓、名、及び/または、誕生日だけを根拠に患者を識別しなければならないことがよくある。
こうした探索の2つの要件は、次の通りである、(1)病院データベースに記憶されている値に照らして、探索基準にはエラーが含まれている可能性があるので、探索はエラートレランスでなければならない、(2)探索は、例えば1−2秒といった指定時間内に終了すべきである。これら2つの要件は、エラートレランスを強めるには、応答時間を長くしなければならないという意味において競合性である。例えば、評価アルゴリズムによって、毎秒10,000のレコードと探索基準を比較することが可能であり、評価に割り当てられる時間が1秒であると仮定する。従って、応答時間を指定された限界内に保つためには、システムは、おそらく数百万のレコードを含んでいる人口統計的データベースから、可能性の高いレコードをせいぜい10,000ぐらいしか検索することができない。
通常、データベースレコードが満たさなければならない事前定義条件であるフィルタを設定することによって、より詳細な評価にとって適切なプールのレコードを検索することが可能である。基本的には、探索基準の少なくともいくつかの部分が合っていると仮定して、その情報に基づいて、データベースからレコードを検索する。姓及び名によって探索する例の場合、探索基準における名の最初の4文字及び/または姓の最初の5文字が合っているものと仮定することによって、フィルタを設定することが可能である。従って、検索されるプールは、探索基準として名の最初の4文字及び/または姓の5文字を有するレコードだけから構成されている。2つの論理結合子AND及びORが、検索されるレコード数及びエラートレランスに異なる影響を及ぼすという点に留意されたい。AND結合子は、名の4文字と姓の5文字の両方が合っているものと仮定するが、検索することになるレコード数は、OR結合子を用いるよりもはるかに少なくなる、しかしながら、OR結合子は、名の4文字と姓の5文字のいずれかしか合っていると仮定しないので、エラートレラントは高くなる。
この方法の欠点は、前もってフィルタ位置を固定することによって、プールサイズが探査値の頻度によって大きく変動することになるという点である。例えば、探索基準が「James Smith」の場合、フィルタは、あまりにも多くのレコードを検索することになるであろうが、探索基準が「Zbigniew Brzezinski」の場合、検索は少なすぎることになる。前者の場合、探索を完了するのに必要な時間は、指定の応答時間を超える可能性がある。後者の場合、「Zbig」または「Brzez」といった最初の数文字にキー入力ミスが生じると、対象とする「真の」レコードがプールに含まれない可能性がある(従って、探索が失敗することになる)。
本明細書に記載の本発明の典型的な実施形態には、一般に、患者の人口統計的レコードの探索において、人口統計的データベースから可能性の高いレコードを検索して、入力基準と比較するデータ依存型フィルタリング方法及びシステムが含まれている。フィルタは、特定の限定なしに、応答時間を維持しながら、最大エラートレランスを可能とする。本発明の実施形態の1つによるデータ依存型フィルタには、探索値の頻度によって決まるフィルタリング条件が用いられる。これらの頻度は、あらかじめ計算しておき、データベースの更新時に、定期的に(例えば、毎月、毎年)計算しなおすことが可能である。例えば、「James Smith」を探索する場合、フィルタは、データベースにあまりにも多くの「James Smith」項目が存在しており、厳格なフィルタリング条件を用いるか、または、追加情報を求めるのが望ましいことを承知しておくべきである。「Zbigniew Brzezinski」の場合、フィルタは、めったにない名前であることを理解して、例えば、名の最初の2文字だけが合っており(4文字ではなく)、姓の最初の3文字だけが合っている(5文字ではなく)ものと仮定して、フィルタ条件を緩和すべきである。この種のフィルタは、エラートレランスを最大にし、同時に、応答時間が限界内に収まることを保証する。
本発明の態様の1つによれば、1つ又は複数の探索ロケータフィールドを含む探索基準を規定するステップと、前記探索基準におけるエラートレランスを最大にし、同時に、予め定められた応答時間要件を満たす検索式を前記探索基準から決定するステップと、前記データベースから前記候補レコードを検索し、前記応答時間要件を満たす検索式を見つけることができなければ、追加探索基準を要求し、探索基準ロケータフィールドと対応する検索レコードフィールドを比較して、前記各候補レコードを評価するステップと、前記候補レコードの評点が予め定められたしきい値を超えるか否かを判定するステップと、前記候補の評点が予め定められたしきい値を超えると、前記探索基準に応答して戻されるレコードリストに前記候補レコードを追加するステップを含む、患者データベース探索におけるデータ依存型フィルタリング方法が提供される。
本発明のもう1つの態様によれば、探索基準に名と姓が含まれるが、この方法には、さらに、前記探索基準における前記名と同等の名のリストをコンパイルするステップが含まれている。
本発明のもう1つの態様によれば、探索基準ロケータフィールドと対応する候補レコードフィールドを比較するステップには、前記ロケータフィールドと前記候補レコードフィールド対のフィールド毎の比較を実施し、各フィールド対毎に事前定義されたフィールド比較法を利用して、フィールド対jに関する比較結果ベクトルcjの成分を前記フィールド対に予め定められた文字数まで充填するステップと、下記の式を利用し、1つ又は複数の確率に基づいて前記比較結果cjを評価するステップが含まれており、
Figure 2008546098
ここで、P0j(cj)及びP1j(cj)は、前記フィールド対において一致する文字数の関数である確率であり、さらに、ロケータフィールドと前記候補レコードにおける対応するフィールドの両方が空白ではない全てのフィールドjにわたる評点(cj)を合計して、第1の評点を算出するステップが含まれている。
本発明のもう1つの態様によれば、探索基準において名と姓の両方が指定されると、前記探索基準において前記名と姓をスワップし、スワップしたロケータフィールドと候補レコードフィールドのフィールド毎の比較を実施する前記ステップを繰り返し、前記比較結果cjを評価し、全フィールドjにわたる前記評点を合計して、第2の評点を求め、前記第1の評点及び前記第2の評点からスワップペナルティを引いた最大値を選択する。
本発明のもう1つの態様によれば、この方法には、下記の式に従って前記評点を0〜100の等級に変換するステップが含まれている。
transformedScore=(score−minScore)/(maxScore−minScore)%100
ここで、maxScore=Σj maxScorej、minScore=Σj minScorejであり、比較ベクトルのj番目の成分を生成するために用いられるロケータフィールドは、探索基準において空白ではなく、maxScorej=可能性のある全てのcj値にわたるmax(score(cj))及びminScorej=可能性のある全てのcj値にわたるmi(score(cj))である。
本発明のもう1つの態様によれば、フィールドに関するフィールド比較法は、正確な距離一致、ハミング距離、編集距離、及び、スワップを伴う編集距離、名距離、及び、姓距離の1つである。
本発明のもう1つの態様によれば、この方法には、戻される前記レコードリスト内の各候補レコード毎に、前記データベースから前記探索ロケータフィールドに関する最新の完全レコードを検索するステップと、前記候補レコード内の非空値を有する各フィールド毎に、検索される完全レコード内のフィールド値を候補レコード内の対応する値に置換するステップと、変更された完全レコードを前記データベースに追加するステップが含まれている。
本発明のもう1つの態様によれば、1つ又は複数の探索ロケータフィールドを含むデータベースから1つ又は複数のレコードを検索するための探索基準を規定するステップと、前記データベースから検索すべき候補レコードの最大数、及び、前記レコードを検索する最長応答時間を決定するステップと、前記探索基準における合っている文字数に基づいて検索される候補レコード数を決定するステップと、前記探索基準におけるエラートレランスを最大にし、同時に、前記応答時間要件を満たす検索式を前記探索基準から決定するステップと、前記データベースから前記候補レコードを検索し、前記応答時間要件を満たす検索式を見つけることができなければ、追加探索基準を要求するステップを含む、患者データベース探索におけるデータ依存型フィルタリング方法が提供される。
本発明のもう1つの態様によれば、前記検索式を用いて検索可能な候補レコード数が、候補レコードの最小数未満であれば、前記探索基準において合っていると仮定される前記文字数が減らされる。
本発明のもう1つの態様によれば、検索すべき候補レコードの最大数は、前記データベースに含まれている探索基準フィールドの確率を表わすデータベース値の頻度表から決定され、予め定められたしきい値より確率値の高いストリングがメモリに記憶されている。
本発明のもう1つの態様によれば、しきい値は、データベースサイズ、要求される応答時間、及び、前記探索基準と前記候補レコードとの比較速度に基づく。
本発明のもう1つの態様によれば、確率には、探索基準サブフィールドが前記データベースに含まれている確率が含まれている。
本発明のもう1つの態様によれば、この方法には、前記探索基準と第1の候補レコードを比較して、前記比較結果及び前記第1の候補レコードを表に記憶するステップと、
前記表を探索することによって各後続候補レコードを探索し、前記表に前記後続候補レコードが見つからない場合には、前記後続候補レコードと前記探索基準を比較して、前記比較結果及び前記後続候補レコードを前記表に記憶するステップが含まれている。
本発明のもう1つの態様によれば、検索式に前記1つ又は複数の探索ロケータフィールドから作成される論理式が含まれる。
本発明のもう1つの態様によれば、前記探索基準に探索フィールドが1つだけしか含まれていない場合、前記検索式が前記探索フィールドのサブストリングに基づくようにし、高頻度のストリングの辞書を探索し、前記辞書に前記探索サブストリングが見つからなければ、データベース照会を実施する。
本発明のもう1つの態様によれば、前記探索基準に3つ以上の探索フィールドが含まれる場合、探索基準対の論理積の論理和から前記論理式を作成する。
本発明のもう1つの態様によれば、前記探索基準に2つの探索フィールドが含まれる場合、全探索フィールドの比較と部分探索フィールドの比較の論理的組み合わせから前記論理式を作成する。
本発明のもう1つの態様によれば、患者データベース探索におけるデータ依存型フィルタリング方法のステップを実施するためにコンピュータによって実行可能な命令プログラムを明確に具体化する、コンピュータによって読み取り可能なプログラム記憶装置が提供される。
本明細書に記載の本発明の典型的な実施形態には、一般に、患者の人口統計的レコード探索にデータ依存型フィルタリングを施すためのシステム及び方法が含まれている。従って、本発明は、さまざまな修正及び代替形態を受け入れることが可能であるが、その具体的実施形態が、図面に例証として示されており、本明細書において詳述されることになる。ただし、云うまでもないが、本発明を開示の特定の形態に制限するつもりは全くなく、それどころか、本発明は、本発明の精神及び範囲内に含まれる全ての修正、同等、及び、代替実施形態を網羅するものである。
医療データベースには、全フィールドの履歴が記録されているものもあるので、レコード検索では履歴レコードも探索するのが望ましい。本発明の実施形態の1つによれば、履歴情報を備えた患者の人口統計的レコードは、いくつかのレコードとして扱うことが可能であり、例えば、3つの名前と、2つの住所が存在するが、患者の人口統計的レコード1つおきに1つの値だけしかない場合、この患者について6つの人口統計的レコードが存在することになる。ある特定の患者に関する最新情報を検索する手段が存在し、それを用いて、一番上の候補のリストを戻さなければならないものと仮定することが可能である。
さらに、データベースには、名前(氏名、別名、偽名)及び住所(自宅住所、郵送先住所、請求先住所)のような、特定のフィールドに関して複数の値を有することに対応するものもある。人口統計的情報を表わすデータ構造は、異なるフィールドの区別を行うのが望ましい。検索及び評価の便宜上、本発明の実施形態の1つによるアルゴリズムでは、これらの可変要素を全て対称に取り扱う。フィールドの可変要素は、そのフィールドの履歴値と全く同様に扱われる。
さらに、人口統計的レコードから導き出される値を用いて、評価のためのレコードを検索することが可能である。これらの人口統計的レコードは、レコードリンケージ(RL)キーと呼ばれる。例えば、姓の最初の4文字と名の最後の4文字を連結することによって新たなストリングを作成し、データベースに記憶しておいて、後でそれを利用して、計算しなくても、データ列を見つけることができるようにすることが可能である。本発明の実施形態の1つによれば、それぞれのフィールドの「最新値」に関してRLキーの値をあらかじめ計算することになる。この事前計算は、履歴値の計算及び記憶にまで拡げることが可能である。
本発明の実施形態の1つによれば、典型的な医療データベースDはnのレコードを備えており、各レコードはmのフィールドF1、F2、...、Fmを備えている。このデータベースからの典型的な検索要求には、あるレコードのフィールドF1、...、FIのおそらくノイズ値を表わした、1つ又は複数のストリングs1、...、sIに基づくレコードの検索を必然的に伴うことになる。
この要求に対する応答には下記の2つの部分が含まれる。
(1)第1の部分では、要求されるフィールドと入力値に基づいて、論理式Φが作成される。この式は、データベースDからデータを検索するためのSQL照会とみなされる。この結果、k個からなるレコード集合が生じる。
(2)第2の部分では、k個の検索レコードが評価される。
解明のコストは、要求の完了に必要な時間と、所望の正確度によって判定される。全要求処理時間がある上限T未満であることも必要とされる。
全時間=検索時間+評価時間、
評価時間=k%a
ここで、kは検索レコード数であり、aは各評価に必要な時間である。検索時間はレコード数に影響されやすいが、その依存性は線形ではない可能性がある。性能要件から、検索すべき最大数kを概算することが可能である。可能性のある検索式がいくつか存在する。
1つの式には、単純な論理式の論理和が含まれる。
Φ=(F1=s1)∨(F2=s2)...∨(FI=sI
この式によって、少なくとも1つのストリングが合っていれば、対象とするレコードが確実に検索され、評価されることになる。
iがストリングsiにおけるエラー数とする。単純な論理式φの場合、S(φ)がφを満たすレコード数であるとする。Φが対象とするレコードを検索できない確率は、次の通りであり、
Figure 2008546098
Φ=φ1∨φ2...∨φIを用いて検索されるレコード数は、次の通りである。
Figure 2008546098
例えば、I=3の場合、Φ=φ1∨φ2∨φ3であり、しかも、次の通りである。
Figure 2008546098
もう1つの式には、論理積が含まれる。
Ψ=(F1=s1)&(F2=s2)...&(FI=sI
この場合、対象とするレコードが検索されない確率は、次の通りであり、
Figure 2008546098
検索されるレコード数は、次の通りである。
S(Ψ)=S(φ1&φ2...&φI
これらの式の使用例として、n=106のレコードを備え、確率がP(φ1)=0.04、P(φ2)=0.03、及び、P(φ3)=0.02のデータベースを考察することにする。これは、S(φ1)=4%104、S(φ2)=3%104、及び、S(φ3)=2%104を意味している。それぞれ、長さが2、6、及び、4のストリングS1S2S3が0.05の誤り率で入力されるものと仮定する。S1S2S3にエラーが生じない確率は、それぞれ、0.5404、0.7351、及び、0.8145である。
検索式としてΦを利用すると、
S(Φ)=8.7×104
及び
F(Φ)=0.0226になる。
検索式としてΨを利用すると、
S(Ψ)=24、
及び、
F(Ψ)=0.6765になる。
この例に示すように、OR論理だけ並びにAND論理だけを利用した検索式では、逆の理由によって満足のいく結果が得られない可能性がある。OR論理では、検索及び評価しなければならないレコードが多すぎることになり、一方、AND論理では、対象とするレコードを入手できない確率が高すぎることになる。
このシナリオを改善する手法の1つは、より少ない数の項の論理積の論理和である式を用いることである。例えば、I=3の場合、次のようになるであろう
Γ=(φ1&φ2)∨(φ2&φ3)∨(φ3&φ1
これにより、上記例については、
S(Γ)=2.6%104
及び
F(Γ)=0.2110になる。
論理積の論理和を用いる式は、I=2の場合には適用されない。前述の検索式は全ストリングとフィールド値の比較に基づくものであった。もう1つの式は、フィールド値の一部の比較に基づくものである。s(i)がストリングのi番目の文字を表わし、s(i,j)がiで始まり、jで終わるsのサブストリングを表わすものとする。
下記形式の検索式について考察する。
Δ=((F1=s1)&(F2(i,j)=s2(i,j)))∨((F1(i,j)=s1(i,j))&(F2=s2))
例えば、i=j=1の場合、Δは、第1のフィールドがs1に等しく、第2のフィールドの最初の文字がs2の最初の文字に等しいか、あるいは、第1のフィールドがs2に等しく、第1のフィールドの最初の文字がs1の最初の文字に等しい全てのレコードを検索する。
フィールドFiの最初の文字の確率がxであると仮定すると、P(Fi(1)=x)=0.1。これは、アルファベットには26字あるので、控えめな推定値である。
この部分的比較式を適用して、上記数値例についてS(Δ)及びF(Δ)を計算することが可能である
S(Δ)=0.58×104=(0.04×0.1+0.03×0.1−0.04×0.03)×106
F(Δ)=0.1855=1−(0.5404×0.95+0.7351×0.95−0.5404×0.7351)
対照的に、Φ=(F1=s1)∨(F2=s2)の場合、
S(Φ)=6.88×104=(0.04+0.03−0.04×0.03)×106
F(Φ)=0.1218=(1−0.5404)×(1−0.7351)
となり、Ψ=(F1=s1)∨(F2=s2)の場合、
S(Ψ)=0.12×104=(0.04×0.03)×106
F(Ψ)=0.6028になる。
このΔ式を拡張して、次のように4つのパラメータi、j、h、kを取り扱う形式にすることが可能である
Δ(i,j,h,k)=((F1(i,j)=s1(i,j))&(F2(h,k)=s2(h,k))。
この式では、ストリングs1の(j−i)及びストリングs2の(k−h)である、q=(j−i)+(k−h)の文字を選択して、フィールドの対応する値と比較する。通常、異なるストリング(フィールド)に関する2つの文字群を利用するのは、1つのストリングから同じ数の文字を選択するよりも効率が良い。その理由は、2つのストリングにおける2つの文字群が独立していると仮定するのは道理に適うが、同じストリング内の文字群についてそう仮定するのは道理に適わないからである。例えば、「Smith」は平凡な姓であるが(確率P(LastName=“Smith”)=0.03)、条件付き確率P(LastName(4,5)=“th”|LastName(1,3)=“Smi”)は高い(0.3)。
比較する文字の識別は、必ずしもストリング内の自然位置に制限されるものではないという点に留意されたい。それは、左からの場合もあれば、右からの場合もあり、子音だけまたは母音だけ、あるいは、アルファベットの任意の部分集合をカウントする場合もある。さらに、文字の選択によって、独立性の仮定が道理に適うことが保証されるべきである。
1つの入力ストリングs1だけの場合、異なる問題が提示される。S(F1=s1)が大きすぎる場合、探索に時間を費やす前に、この条件を検出するのが道理に適う。制限時間内に評価すべき最大レコード数がkmであると仮定する。その頻度がkmを超えるフィールド値のリストを記憶しておくことが可能であり、SQL検索の開始前に、ある特定のストリングs1とそのリストを照合することが可能である。こうした値の数は、n/km未満である。ストリング全体の探索によって対象とするレコードの検索に失敗する確率は、
1−(1−r)lであり、
ここで、rは誤り率、lは入力ストリングの長さである。ほとんどの場合、問題は、S(F1=s1)が大きすぎるということではなく、むしろ、失敗の確率が高すぎるということである。例えば、sが入力された長さ15の姓であり、誤り率が0.05の場合、F(LastName=s)=0.5367になる。こうした失敗レベルが容認できない場合、探索条件を緩和すべきである。例えば、探索条件F1(i,j)=s(i,j)を用いることが可能である。j−i=5の場合、対象とするレコードを検索できない確率は、0.2262に低下する。
従って、探索条件が1つのストリングの場合、その探索については部分探索がより有効なアプローチである。例えば、ストリング全体を探索するのではなく、データベース探索基準として最初の5または6文字を用いる方が良い。多すぎるレコード検索を回避するため、おそらくは、最初の実行前に、高頻度のストリングの辞書を作成すべきである。その後、SQL照会に取りかかる前に、その辞書によってユーザの探索にフィルタリングが施される。ユーザの探索ストリングが辞書にある場合、SQL照会は行われず、ユーザはより多くの情報を要求されることになる。部分比較を利用する検索式の場合、部分ストリングを事前計算するのが望ましい。
ユーザによって2つのストリングが提供される場合、検索式Δ(i,j,h,k)によって、検索及び評価するレコード数とエラートレランスとのバランスが良くなる。ユーザによって3つ以上のストリングが提供される場合、論理積式の論理和が有効な探索候補である。
本発明の実施形態の1つによれば、予備ステップとしてデータベース値の頻度情報を収集すべきである。患者探索が施される各フィールドのストリング内に、文字位置集合を事前定義することが可能である。患者探索が施されるフィールドについて、全てのレコードを走査し、全ての値の頻度をカウントすることになる。例えば、患者探索が、例えば、姓、名、誕生日、自宅住所、医療記録番号(MRN)、及び、社会保障番号(SSN)といったフィールドの組み合わせに基づくことが可能であると仮定する。位置集合は、任意とすることが可能であるが、単純化のため、選択位置が連続しており、ストリングの左(始め)から右(終わり)にカウントするものと仮定することが可能である。位置集合が与えられると、各別個の値の頻度がカウントされる。データベースの走査によって、姓、名、誕生日、自宅住所の最初のi文字及び、MRN、SSNの最後のi文字によって形成される、後続する限定されない典型的なストリング値の頻度がカウントされる。値iは3、4、及び、5とすることが可能である。例えば、i=4で、名フィールドの場合、ストリング「adle」の頻度には、名「Adler」、「Adley」、「Adleen」等がカウントされる。
次に、カウントをデータベースのサイズで割って、ストリング頻度が確率(割合)に変換される。データベース自体が更新されるので、確率は、カウント数よりもある時間期間にわたって安定している。
これら2つのステップは、定期的に、または、データベースが、その現在の状態を反映するため大幅な更新合併を受ける毎に反復される。
メモリには、予め定められたしきい値より確率の高いストリングが記憶されている。しきい値は、データベースサイズ及び必要な応答時間及び比較速度に基づいて決定される。例えば、100万レコードのサイズのデータベースについて、頻度カウントが100を超えるストリングだけを保持することが求められる場合、しきい値は102/106=10-4に設定される。すなわち、頻度が100を超えるストリングだけが保持される。表に見つからないストリングは、頻度が極めて低いものとみなすことが可能である。現実的な名前の分布の歪みは、この条件を満たすストリング数が数百未満であることが多い。一方、例えば、社会保障番号(SSN)の最後の4つの数字の分布がほぼ均一である(すなわち、4つの数字からなる任意のストリングの確率が同じである)ことが分かれば、その確率値だけを記憶する。
図7には、本発明の実施形態の1つによるデータ依存型検索フィルタリングプロセスのフローチャートが描かれている。データベース値の頻度情報が表にされているものと仮定して、ステップ71で探索基準が規定される。探索基準には、医療人口統計的データベースの適合するレコードと突き合せられるフィールド値の1つ又は複数のストリングを含むことが可能である。この探索基準が与えられると、データベース探索エンジンが、頻度表を参照し、探索基準のi文字が合っているものと仮定した場合、各フィルタリング式毎に、プールがどれだけのレコードを備えることになるか、及び、どんな論理結合が用いられるかを決定する。探索基準が受け入れられると、電話番号、住所、SSN等を取り出せるように、探索基準が標準化される。
図1には、本発明の実施形態の1つによる典型的なフィールド比較表が描かれている。この表には、表の各番号付き行毎に1つずつ、18の可能性のある探索基準が示されている。留意すべきは、探索基準のこの選択は典型的なものであって、制限するものではなく、本発明の実施形態の1つに従って、より多くのまたはより少ない探索基準を用いることが可能である。「ロケータフィールド」と表示された列は、探索基準が設けられたロケータに対応し、一方、「レコードフィールド」と表示された列は、データベース内のレコードに対応する。「距離測定」と表示された列は、ロケータとその行のレコードを比較するために用いられるフィールド比較法を表わし、「限度」と表示された最後の列は、比較に用いられる文字数を表わしている。表の最後の行は、省略時比較において、2文字のEditDistanceコンパレータが用いられることを表わしている。
探索フィールド構成情報から、探索基準で指定された名に相当する名のリスト、すなわち、指定された名が属するグループの少なくとも1つに属する全ての名のリストが検索される。人の名には、さまざまな変形がある可能性がある。例えば、ロバート−ボブ−ボビー、あるいは、テオドル−テッド−エドなどがある。こうした名の変形は等しいものとみなされる。ユーザがボブ・ホワイトを見つけたい場合、ロバート・ホワイト及びボビー・ホワイトを試す価値のある候補とみなすべきである。このリストは、sc.equivalentFirstNameListと呼ばれる。
さらに、本発明の実施形態の1つでは、音声符号化に基づく探索をサポートするデータベースのために、名の音声符号化の計算が可能である。
もう一度図7を参照すると、ステップ72において、以下で列挙する条件の任意の1つが真である全ての人口統計的レコードが、データベースから検索される(ここで、rec.はデータベース内のレコードを表わし、sc.は探索基準を表わしている)。評価には探索基準で指定されたフィールドだけが用いられるので、検索プロセスにおいてコストのかかる結合に起因する効率の悪さを阻止するため、候補に関して検索されるのは、探索基準で指定されたフィールドだけである。
一例として、探索基準が「John Deer」であると仮定する。100万レコードのデータベースにおいて、ストリング「john」の確率が0.01で、ストリング「deer」の確率が0.015であると仮定する。下記の状況の可能性がある。
a)名の最初の4文字が合っていると仮定すると、プールは1,000,000%0.01=10,000のレコードを有していることになる。
b)姓の最初の3文字が合っていると仮定すると、プールは15,000のレコードを有していることになる。
c)名の最初の4文字が合っている AND 姓の最初の3文字が合っていると仮定すると、プールサイズは1,000,000%0.01%0.015=150になる。
d)名の最初の4文字が合っている OR 姓の最初の3文字が合っていると仮定すると、プールサイズは、約1,000,000%(0.01+0.015−0.01%0.015)=24,850λ25,000になる。
応答時間要件を満たすため、検索されるプールのレコードは10,000を超えてはならないものと仮定する。従って、最大エラートレランスを可能にし、同時に、プールサイズを範囲内に保つフィルタリング条件(論理式)を見つけることが望ましい。例えば、上記オプション(a)は、最大のエラートレランスをもたらし、同時に、時間応答要件を満たすので最良である。オプション(b)及び(d)は、プールが大きくなりすぎるので、除外されることになるであろう。例えば、3番目の文字にエラーが生じると(正しい名前はJohn Dear)、オプション(a)ならそれでもレコードを検索するが、オプション(c)は検索できないと思われるので、(c)は、(a)ほど望ましくはない。
場合によっては、利用可能などのオプションからも、10,000未満のプールが供給されないことが起こりうる。「James Smith」を探索する例の場合、「jame」の確率が0.12で、「smi」の確率が0.1であれば、AND結合を利用するオプション(c)でさえ、1,000,000%0.12%0.1=12,000を備えることになる。これは、指定時間内にその検索を完了できないことを表わしている。ユーザがより長い応答時間を受け入れない限り、システムは、例えば、自宅住所といったより多くの情報を求めるべきであり、その情報を利用して、さらにプールを制限することになる。例えば、自宅住所が「123 Main St」の場合、「Jame」+「Smi」によってデータベースからレコードを検索するのではなく、「Jame」+「Smi」+「Main」によって検索する。最良のフィルタは、自宅住所の最初の4文字によってレコードを検索するものと思われるが、結果は、1,000,000%0.009=9,000レコードになる。
「Zbigniew Brzezinski」といっためったにない名前の場合、「zbig」の確率=0.00001で、「brz」の確率=0.0001であれば、名の4文字 OR 姓の3文字を仮定するオプションでさえ、わずかに約1,000,000%(0.0001+0.0001)=110レコードになる。この場合、名の3文字または姓の3文字だけが合っていると仮定することによって、仮定を緩和することが可能である。それによって、名の4番目の文字のエラーが許容される。
本発明の実施形態の1つによる典型的な制限のない条件リストは、次の通りである。条件に後続する「(RL key)」は、その条件が事前計算されたレコードリンケージであることを表わしている。
a. 名前
i.Sc.lastname=rec.lastname
ii.Sc.firstname=rec.firstname
iii.Sc.lastnamephonetic=rec.lastnamephonetic(RL key)
iv. Sc.lastname has length>=4 AND rec.lastname starts with sc.lastname
v. (includeNickNameInQuery=true) AND Rec.firstname is present in sc.equivalentFirstNamelist
vi.Rec.firstname=sc.lastname AND rec.lastname=sc.firstname
vii.Sc.lastNameFirst4Chars=rec.lastNameFirst4Chars(RL key)
b.住所
i.Sc.addressLine1=rec.addressLine1
ii.Sc.houseNo=rec.houseNo(RL key)
iii.Sc.streetName=rec.streetName(RL key)
c.電話番号
i.sc.phoneNo=rec.phoneNo(局番後の7つの数字、RL key)
d.誕生日
i. Sc.birthMonth=rec.birthMonth AND sc.birthDate=rec.birthDate AND sc.birthYear=rec.birthYear
e.個人識別子
i.Sc.SSN=rec.SSN
ii.Sc.SSNLast4Chars=rec.SSNLast4Chars(RL key)
iii.Sc.personNumber=rec.personNumber
iv.Sc.medicalRecordNumber=rec.medicalRecordNumber
ステップ73において、データベースから検索される各候補レコードは次のように評価される。特定のロケータと候補を比較して、探索基準フィールドに関する成分を備えた比較ベクトルが生成される。フィールド対フィールドの比較を実施して、比較ベクトルの成分が充填される。本発明の実施形態の1つによれば、図1にリストアップされたフィールド比較法が用いられる。このリストのフィールド比較法は、典型的なものであって、制限のためのものでなく、本発明の他の実施形態では、他のフィールド比較法を用いることが可能である。この比較構成に明示的に記載されていない各指定の探索基準については、省略時比較法を用いて、そのフィールドとデータベースから検索されるレコードの同じフィールドが比較される。
フィールドは、ある特定の(フィールド依存)上限で距離が飽和するという制約条件を追加して、フィールド間の指定のストリング距離を計算することによって比較される。上限を超える任意の距離がその限界に設定される、例えば、名が編集距離(5)(後述する)を用いて比較される場合、この距離が5未満であれば、2つのレコードにおける名の比較結果がそれらの間の編集距離であり、さもなければ、それは5に設定されることになる。
フィールド比較に関する典型的な制限のないストリング距離関数(全てのストリング・メトリクスが大文字と小文字を区別しない)のリストは、次の通りである。
a.正確な一致距離:ストリングが正確に一致すれば0、さもなければ1である。
b.ハミング距離:同じ長さの2つのストリングが異なる(例えば、1000と1010の間の距離が1で、1000と0100の間の距離が2)位置数をカウントする。2つのストリングの長さが異なる場合、距離は、長さの差と短いストリング間のハミング距離の和とすべきであり、長さの長いストリングの接頭辞は短いストリングの接頭辞に等しくなる。
c.編集距離:あるストリングを別のストリングに変換するのに必要な基本(単一文字)編集操作(挿入、削除、置換)の最小数をカウントする(例えば、JohnとJonとの間の距離は1、JohnとJonhとの間の距離は2、JohnとJoとの間の距離は2)。
d.スワップを伴う編集距離:上記定義における特別操作として隣接文字のスワッピングを含む。(用いられる実施法がこの定義によると誤っているが、どの文字位置も、多くとも1回のスワッピング操作にしか含まれないものと仮定すると、正しい可能性があるので、この用途にとっては十分に有効である点に留意されたい)。
e.名距離:2つのストリングが等しければ、その距離は0であり、一方がもう一方の接頭辞である場合、または、両方のストリングを含む、一般に用いられる名のグループが存在する場合、その距離は1であり、さもなければ、2つのストリングの間でスワップを伴う編集距離である。
f.姓距離:2つのストリングが等しければ、その距離は0であり、そうではなく、一方がもう一方の接頭辞である場合、距離は1であり、編集距離が3以上で、2つのストリングの音声符号化が同じ場合には、姓距離は2であり、さもなければ、2つのストリングの間でスワップを伴う編集距離である。
次に、構成ファイルに指定された確率情報を利用して比較ベクトルを評価し、評点が求められる。フィールドjに関する比較結果cjを評価するために用いられる典型的な制限のない式は、次の通りである
Figure 2008546098
bScoreは、ロケータフィールドと人口統計的レコードにおける対応するフィールドの両方が空白ではない、全てのjにわたるscore(cj)の和と定義される。この式における確率パラメータPij(cj)は、ストリング頻度とデータの質を反映し、cjによって選択される値の範囲は、用いられる比較方法によっても左右される。
第1の確率P0j(cj)と第2の確率P1j(cj)に関する典型的な値が、図2及び3の表に表示されている。これらの表のそれぞれのフォーマットは同じである。図2を参照すると、索引jは行番号(すなわち、探索基準ロケータフィールド)を表わし、5までの数列が、対応するフィールド名の左に表示されている。5つの列は、本発明の実施形態の1つによれば、フィールド検索に用いられる最大文字数が、図1の表の「限度」列に記載のように、5文字であるという事実に対応する。ある特定の行に関して、左から右に進むにつれて、確率値が単調に増大し、共通の文字が存在するので、ロケータフィールドとレコードフィールドとの一致確率が高まるのを反映している。従って、「名」フィールドを参照すると、ロケータフィールドとレコードフィールドの最初の文字だけしか一致しない場合、確率値は0.003と低くなり、一方、最初の5文字が一致すると、確率値は0.85と高くなる。
名と姓の両方が探索基準で指定されている場合、探索基準において名と姓のスワッピングも行われ、ロケータと候補を比較し、比較ベクトルを評価して、cScoreを求めるステップを繰り返すことによって、レコードと対照した新しい探索基準の評価が行われる。候補の評点はmax(bScore,cScore−swapPenalty)に設定される。SwapPenaltyは、初めに、常用対数log(10)に当てられる。名前を含まないbScore計算からの全ての比較結果は、再利用可能であり、再計算する必要がない。
もう一度図7を参照すると、ステップ74で、評点は次に0〜100の等級に変換される。これは、探索基準において、特定されたフィールドに基づいてなされる。変換された評点は、次のように定義される
transformedScore=(score−minScore)/(maxScore−minScore)%100
ここで、scoreは、前述のステップで得られる評点であり、maxScore及びminScoreは、指定の探索基準について達成できる可能性のある最大及び最小の評点であり、下記のように定義される。可能性のある全てのcj値にわたって、最大評点は、
maxScorej=max(score(cj))
によって定義される。ある特定の探索基準集合に関して、maxScoreは、全てのjにわたるmaxScorejの和と定義されるが、ここで、比較ベクトルのj番目の成分を生成するために用いられるロケータフィールドは探索基準において空白ではない。同様に、ある探索基準集合に関して、minScorej及びminScoreが定義される。開始時に、各j毎に、maxScorej及びminScorejが計算されるという点、及び、どの基準が指定されるかに基づいて、各探索毎に、maxScore及びminScoreを計算する必要があるという点に留意されたい。
ステップ75で、レコードが「良い」候補を表わしている場合、そのレコードは戻すべきレコードリストに追加される。本発明の実施形態の1つによれば、変換された一致評点が65に初期設定された設定しきい値を超えると、候補は良いとみなされる。戻されるレコードリストの各候補レコード毎に、その個人識別子に関する完全な「最新」レコードが検索される。候補レコードに非空値のある各フィールド毎に、現在検索されている完全レコードの値が、候補レコードの値に置き換えられる。
個人名、住所、及び、電話番号フィールドがまとめられたデータベース行を表わす典型的な表が、図4に示されている。次にこの図を参照すると、この表には、John Smytheを探索照会するための8つのデータ行が設けられている。「PersObjId」と表示された最初の列は、照会によって探索される対象者の識別番号を表わしている。第2の列「FN」には名が記載され、第3の列「LN」には姓が記載され、第4の列「AddressLine1」には対象者の住所が記載され、第5の列「Ph.#」には対象者の電話番号が記載されており、一方、それぞれ、「Curr.Name?」、「Curr.Addr.?」、及び、「Curr.Ph.?」と表示された第6、第7、及び、第8の列は、名前、住所、及び、電話番号フィールドが探索基準と一致するか否かを表わしている。例えば、ユーザがJohn Smytheを探索して、住所及び電話番号を提供し、データベースには、図5の表に示すように、後で名前をJack Smytheに変えたJohn Smithが含まれている場合、データベースレコードは、図4の表の最下行に示すように更新されることになり、戻される照会結果が図6の表に示されている。
本発明の実施形態の1つによれば、データベース値の頻度を利用して、探索基準とデータベース値の比較をさらに効率よくすることが可能である。探索基準が名に関するストリングSG及び姓に関するストリングSLであると仮定する。検索されるプールには、(DG1,DL1)、(DG2,DL2)...(DG10000,DL10000)が含まれている。実は、10,000のストリングDGiの中には、多くの反復が存在している。1つは、全比較をスピードアップするのに有利である。i=1から始めて、SGとDGiのそれぞれを比較するのではなく、SGとDG1を比較して、DG1を記憶し、結果を表に記入する。i=2の場合、表のDGiを探索し、見つかると、記憶されている結果を利用する。DGiが見つからなければ、SGとDGiの比較を行って、その結果を表に記憶する。
云うまでもないが、本発明は、さまざまな形態のハードウェア、ソフトウェア、ファームウェア、専用プロセス、または、それらの組み合わせによって実施可能である。実施形態の1つでは、本発明は、コンピュータ可読プログラム記憶装置で具現化される具体的なアプリケーションプログラムとして、ソフトウェアで実施することが可能である。アプリケーションプログラムは、任意の適合するアーキテクチャを含むマシンにアップロードし、そのマシンによって実行することが可能である。
図8は、本発明の実施形態の1つによるデータベース探索のデータ依存型フィルタリングを実施するための典型的なコンピュータシステムのブロック図である。図8を参照すると、本発明を実施するためのコンピュータシステム81には、とりわけ、中央演算処理装置(CPU)82、メモリ83、及び、入力/出力(I/O)インターフェイス84を含むことが可能である。コンピュータシステム81は、一般に、I/Oインターフェイス84を介してディスプレイ85及びマウス及びキーボードのような各種入力装置86に結合されている。支援回路には、キャッシュ、電源、クロック回路、及び、通信バスのような回路を含むことが可能である。メモリ83には、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、ディスクドライブ、テープドライブ等、または、それらの組み合わせを含むことが可能である。本発明は、データベース88からのデータを処理するため、メモリ83に記憶され、CPU82によって実行されるルーチン87として実施することが可能である。従って、コンピュータシステム81は、本発明のルーチン87の実行時に、専用コンピュータシステムになる、汎用コンピュータシステムである。
コンピュータシステム81には、オペレーティングシステム及びマイクロ命令コードも含まれている。本明細書に記載のさまざまなプロセス及び機能は、マイクロ命令コードの一部、あるいは、オペレーティングシステムを介して実行されるアプリケーションプログラムの一部(またはそれらの組み合わせ)とすることが可能である。さらに、コンピュータプラットフォームには、追加データ記憶装置及び印刷装置のような他の各種周辺装置を接続することも可能である。
さらに、云うまでもなく、添付の図に描かれた構成要素であるシステムコンポーネント及び方法ステップの一部は、ソフトウェアで実施することができるので、システムコンポーネント(またはプロセスステップ)間の実際の関係は、本発明のプログラムの仕方によって異なる可能性がある。本明細書に記載の本発明の教示を前提として、関連技術者には、本発明のこれらの及び同様の実施または構成を検討することが可能になるであろう。
本発明については望ましい実施形態に関連して詳述してきたが、当該技術者には明らかなように、付属の請求項に記載の本発明の精神及び範囲から逸脱することなく、さまざまな修正及び置換を施すことが可能である。
本発明の実施形態の1つによるフィールド比較法の表である。 本発明の実施形態の1つによる典型的な確率値P0j(cj)の表である。 本発明の実施形態の1つによる典型的な確率値P1j(cj)の表である。 本発明の実施形態の1つによる個人名、住所、及び、電話フィールドがまとめられたデータベース行を例示した表である。 本発明の実施形態の1つによるJohn Smytheの典型的な候補を表わした表である。 本発明の実施形態の1つによるJohn Smytheについて報告される典型的な照会結果を例示した表である。 本発明の実施形態の1つによるデータ依存型検索フィルタリングプロセスのフローチャートである。 本発明の実施形態の1つによるデータ依存型検索フィルタリングプロセスを実施するための典型的なコンピュータシステムのブロック図である。
符号の説明
81 コンピュータシステム
82 中央演算処理装置
83 メモリ
84 I/Oインターフェイス
85 ディスプレイ
86 入力装置
88 データベース

Claims (24)

  1. 1つ又は複数の探索ロケータフィールドを含む探索基準を規定するステップと、
    前記探索基準におけるエラートレランスを最大にし、同時に、予め定められた応答時間要件を満たす検索式を前記探索基準から決定するステップと、
    前記データベースから前記候補レコードを検索し、前記応答時間要件を満たす検索式を見つけることができなければ、追加探索基準を要求するステップと、
    探索基準ロケータフィールドと対応する検索レコードフィールドを比較して、前記各候補レコードを評価するステップと、
    前記候補レコードの前記評点が予め定められたしきい値を超えるか否かを判定し、前記候補の評点が前記しきい値を超えると、前記探索基準に応答して戻されるレコードリストに前記候補レコードを追加するステップと、
    が含まれていることを特徴とする患者データベース探索におけるデータ依存型フィルタリング方法。
  2. 前記探索基準に名と姓が含まれることと、この方法に、さらに、前記探索基準における前記名と同等の名のリストをコンパイルするステップが含まれることを特徴とする請求項1に記載の方法。
  3. 探索基準ロケータフィールドと対応する候補レコードフィールドを比較するステップに、
    前記ロケータフィールドと前記候補レコードフィールド対のフィールド毎の比較を実施し、各フィールド対毎に事前定義されたフィールド比較法を利用して、フィールド対jに関する比較結果ベクトルcjの成分を前記フィールド対に予め定められた文字数まで充填するステップと、
    下記の式を利用し、1つ又は複数の確率に基づいて前記比較結果cjを評価するステップが含まれており、
    Figure 2008546098
    ここで、P0j(cj)及びP1j(cj)が、前記フィールド対において一致する文字数の関数である確率であることと、さらに、
    前記ロケータフィールドと前記候補レコードにおける前記対応するフィールドの両方が空白ではない全てのフィールドjにわたる評点(cj)を合計して、第1の評点を算出するステップが含まれていることを特徴とする請求項1に記載の方法。
  4. 前記探索基準において名と姓の両方が指定されると、前記探索基準において前記名と姓をスワップし、前記スワップしたロケータフィールドと前記候補レコードフィールドのフィールド毎の比較を実施する前記ステップを繰り返し、前記比較結果cjを評価し、全フィールドjにわたる前記評点を合計して、第2の評点を求め、前記第1の評点及び前記第2の評点からスワップペナルティを引いた最大値を選択することを特徴とする請求項3に記載の方法。
  5. さらに、下記の式に従って前記評点を0〜100の等級に変換するステップが含まれることと、
    transformedScore=(score−minScore)/(maxScore−minScore)%100
    ここで、
    maxScore=Σj maxScorej
    minScore=Σj minScorejであり、
    前記比較ベクトルのj番目の成分を生成するために用いられる前記ロケータフィールドが、前記探索基準において空白ではないことと、maxScorej=可能性のある全てのcj値にわたるmax(score(cj))及びminScorej=可能性のある全てのcj値にわたるmi(score(cj))であることを特徴とする請求項4に記載の方法。
  6. フィールドに関する前記フィールド比較法が、正確な距離一致、ハミング距離、及び、編集距離、及び、スワップを伴う編集距離、名距離、及び、姓距離の1つであることを特徴とする請求項3に記載の方法。
  7. さらに、戻される前記レコードリスト内の各候補レコード毎に、前記データベースから前記探索ロケータフィールドに関する最新の完全レコードを検索するステップと、
    前記候補レコード内の非空値を有する各フィールド毎に、前記検索される完全レコード内のフィールド値を前記候補レコード内の対応する値に置換するステップと、
    前記変更された完全レコードを前記データベースに追加するステップと、が含まれることを特徴とする請求項1に記載の方法。
  8. 1つ又は複数の探索ロケータフィールドを含むデータベースから1つ又は複数のレコードを検索するための探索基準を規定するステップと、
    前記データベースから検索すべき候補レコードの最大数、及び、前記レコードを検索する最長応答時間を決定するステップと、
    前記探索基準における合っている文字数に基づいて検索される候補レコード数を決定するステップと、
    前記探索基準におけるエラートレランスを最大にし、同時に、前記応答時間要件を満たす検索式を前記探索基準から決定するステップと、
    前記データベースから前記候補レコードを検索し、前記応答時間要件を満たす検索式を見つけることができなければ、追加探索基準を要求するステップと、
    が含まれていることを特徴とする患者データベース探索におけるデータ依存型フィルタリング方法。
  9. 前記検索式を用いて検索可能な候補レコード数が、候補レコードの最小数未満であれば、前記探索基準において合っていると仮定される前記文字数を減らすことを特徴とする請求項8に記載の方法。
  10. 検索すべき候補レコードの前記最大数が、前記データベースに含まれている探索基準フィールドの確率を表わすデータベース値の頻度表から決定さることと、予め定められたしきい値より確率値の高いストリングがメモリに記憶されていることを特徴とする請求項8に記載の方法。
  11. 前記しきい値が、データベースサイズ、要求される応答時間、及び、前記探索基準と前記候補レコードとの比較速度に基づくことを特徴とする請求項10に記載の方法。
  12. 前記確率には、探索基準サブフィールドが前記データベースに含まれている確率が含まれることを特徴とする請求項10に記載の方法。
  13. さらに、
    前記探索基準と第1の候補レコードを比較して、前記比較結果及び前記第1の候補レコードを表に記憶するステップと、
    前記表を探索することによって各後続候補レコードを探索し、前記表に前記後続候補レコードが見つからない場合には、前記後続候補レコードと前記探索基準を比較して、前記比較結果及び前記後続候補レコードを前記表に記憶するステップが含まることを特徴とする、
    請求項8に記載の方法。
  14. 前記検索式に前記1つ又は複数の探索ロケータフィールドから作成される論理式が含まれることを特徴とする請求項18に記載の方法。
  15. 前記探索基準に探索フィールドが1つだけしか含まれていない場合、前記検索式が前記探索フィールドのサブストリングに基づくようにし、高頻度のストリングの辞書を探索し、前記辞書に前記探索サブストリングが見つからなければ、データベース照会を実施することを特徴とする請求項14に記載の方法。
  16. 前記探索基準に3つ以上の探索フィールドが含まれる場合、探索基準対の論理積の論理和から前記論理式を作成することを特徴とする請求項14に記載の方法。
  17. 前記探索基準に2つの探索フィールドが含まれる場合、全探索フィールドの比較と部分探索フィールドの比較の論理的組み合わせから前記論理式を作成することを特徴とする請求項14に記載の方法。
  18. 患者データベース探索におけるデータ依存型フィルタリング方法のステップを実施するためにコンピュータによって実行可能な命令プログラムを明確に具体化する、コンピュータによって読み取り可能なプログラム記憶装置であって、前記方法に、
    1つ又は複数の探索ロケータフィールドを含む探索基準を規定するステップと、
    前記探索基準におけるエラートレランスを最大にし、同時に、予め定められた応答時間要件を満たす検索式を前記探索基準から決定するステップと、
    前記データベースから前記候補レコードを検索し、前記応答時間要件を満たす検索式を見つけることができなければ、追加探索基準を要求するステップと、
    探索基準ロケータフィールドと対応する検索レコードフィールドを比較して、前記各候補レコードを評価するステップと、
    前記候補レコードの前記評点が予め定められたしきい値を超えるか否かを判定し、前記候補の評点が前記しきい値を超えると、前記探索基準に応答して戻されるレコードリストに前記候補レコードを追加するステップと
    が含まれていることを特徴とするコンピュータ可読プログラム記憶装置。
  19. 前記探索基準に名と姓が含まれることと、この方法に、さらに、前記探索基準における前記名と同等の名のリストをコンパイルするステップが含まれることを特徴とする請求項18に記載のコンピュータ可読プログラム記憶装置。
  20. 探索基準ロケータフィールドと対応する候補レコードフィールドを比較するステップに、
    前記ロケータフィールドと前記候補レコードフィールド対のフィールド毎の比較を実施し、各フィールド対毎に事前定義されたフィールド比較法を利用して、フィールド対jに関する比較結果ベクトルcjの成分を前記フィールド対に予め定められた文字数まで充填するステップと、
    下記の式を利用し、1つ又は複数の確率に基づいて前記比較結果cjを評価するステップが含まれており、
    Figure 2008546098
    ここで、P0j(cj)及びP1j(cj)が、前記フィールド対において一致する文字数の関数である確率であることと、さらに、
    前記ロケータフィールドと前記候補レコードにおける前記対応するフィールドの両方が空白ではない全てのフィールドjにわたる評点(cj)を合計して、第1の評点を算出するステップが含まれていることを特徴とする請求項18に記載のコンピュータ可読プログラム記憶装置。
  21. 前記探索基準において名と姓の両方が指定されると、前記探索基準において前記名と姓をスワップし、前記スワップしたロケータフィールドと前記候補レコードフィールドのフィールド毎の比較を実施する前記ステップを繰り返し、前記比較結果cjを評価し、全フィールドjにわたる前記評点を合計して、第2の評点を求め、前記第1の評点及び前記第2の評点からスワップペナルティを引いた最大値を選択することを特徴とする請求項20に記載のコンピュータ可読プログラム記憶装置。
  22. 前記方法に、さらに、下記の式に従って前記評点を0〜100の等級に変換するステップが含まれることと、
    transformedScore=(score−minScore)/(maxScore−minScore)%100
    ここで、
    maxScore=Σj maxScorej
    minScore=Σj minScorejであり、
    前記比較ベクトルのj番目の成分を生成するために用いられる前記ロケータフィールドが、前記探索基準において空白ではないことと、maxScorej=可能性のある全てのcj値にわたるmax(score(cj))及びminScorej=可能性のある全てのcj値にわたるmi(score(cj))であることを特徴とする請求項21に記載のコンピュータ可読プログラム記憶装置。
  23. フィールドに関する前記フィールド比較法が、正確な距離一致、ハミング距離、及び、編集距離、及び、スワップを伴う編集距離、名距離、及び、姓距離の1つであることを特徴とする請求項20に記載のコンピュータ可読プログラム記憶装置。
  24. 前記方法に、さらに、戻される前記レコードリスト内の各候補レコード毎に、前記データベースから前記探索ロケータフィールドに関する最新の完全レコードを検索するステップと、
    前記候補レコード内の非空値を有する各フィールド毎に、前記検索される完全レコード内のフィールド値を前記候補レコード内の対応する値に置換するステップと、
    前記変更された完全レコードを前記データベースに追加するステップと、
    が含まれることを特徴とする請求項18に記載のコンピュータ可読プログラム記憶装置。
JP2008514799A 2005-05-31 2006-05-31 患者の人口統計的レコード照会のデータ依存型フィルタリングシステム及び方法 Pending JP2008546098A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US68606505P 2005-05-31 2005-05-31
PCT/US2006/021068 WO2006130658A1 (en) 2005-05-31 2006-05-31 System and method for data sensitive filtering of patient demographic record queries

Publications (1)

Publication Number Publication Date
JP2008546098A true JP2008546098A (ja) 2008-12-18

Family

ID=37023039

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008514799A Pending JP2008546098A (ja) 2005-05-31 2006-05-31 患者の人口統計的レコード照会のデータ依存型フィルタリングシステム及び方法

Country Status (7)

Country Link
US (1) US9336283B2 (ja)
EP (1) EP1886239A1 (ja)
JP (1) JP2008546098A (ja)
CN (1) CN101194258B (ja)
AU (1) AU2006252583B2 (ja)
CA (1) CA2609916A1 (ja)
WO (1) WO2006130658A1 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7657540B1 (en) 2003-02-04 2010-02-02 Seisint, Inc. Method and system for linking and delinking data records
CA2563834C (en) 2004-04-23 2016-08-16 Nielsen Media Research, Inc. Methods and apparatus to maintain audience privacy while determining viewing of video-on-demand programs
US8310336B2 (en) * 2008-10-10 2012-11-13 Masimo Corporation Systems and methods for storing, analyzing, retrieving and displaying streaming medical data
US8266168B2 (en) * 2008-04-24 2012-09-11 Lexisnexis Risk & Information Analytics Group Inc. Database systems and methods for linking records and entity representations with sufficiently high confidence
US8639682B2 (en) 2008-12-29 2014-01-28 Accenture Global Services Limited Entity assessment and ranking
EP2404253B1 (en) 2009-03-04 2019-09-18 Masimo Corporation Medical monitoring system
US10032002B2 (en) 2009-03-04 2018-07-24 Masimo Corporation Medical monitoring system
US10007758B2 (en) 2009-03-04 2018-06-26 Masimo Corporation Medical monitoring system
US9323894B2 (en) 2011-08-19 2016-04-26 Masimo Corporation Health care sanitation monitoring system
US8412755B2 (en) * 2009-06-23 2013-04-02 Hewlett-Packard Development Company, L.P. Permuting records in a database for leak detection and tracing
US9411859B2 (en) 2009-12-14 2016-08-09 Lexisnexis Risk Solutions Fl Inc External linking based on hierarchical level weightings
US8307006B2 (en) * 2010-06-30 2012-11-06 The Nielsen Company (Us), Llc Methods and apparatus to obtain anonymous audience measurement data from network server data for particular demographic and usage profiles
US20120089604A1 (en) * 2010-10-08 2012-04-12 Jocelyn Siu Luan Hamilton Computer-Implemented Systems And Methods For Matching Records Using Matchcodes With Scores
US9594853B2 (en) * 2013-08-30 2017-03-14 International Business Machines Corporation Combined deterministic and probabilistic matching for data management
US9443015B1 (en) * 2013-10-31 2016-09-13 Allscripts Software, Llc Automatic disambiguation assistance for similar items in a set
US10026114B2 (en) * 2014-01-10 2018-07-17 Betterdoctor, Inc. System for clustering and aggregating data from multiple sources
US10685743B2 (en) 2014-03-21 2020-06-16 Ehr Command Center, Llc Data command center visual display system
US20150317311A1 (en) * 2014-04-30 2015-11-05 Cerner Innovation, Inc. Patient search quality indicator
US20150317393A1 (en) 2014-04-30 2015-11-05 Cerner Innovation, Inc. Patient search with common name data store
EP3596620A4 (en) 2017-03-13 2020-12-23 Chartspan Medical Technologies, Inc. INTEROPERABLES DATA SET MATCHING PROCEDURE
US20190197428A1 (en) 2017-12-27 2019-06-27 Cerner Innovation, Inc. Systems and methods for refactoring a knowledge model to increase domain knowledge and reconcile electronic records
CN110851459B (zh) * 2018-07-25 2021-08-13 上海柯林布瑞信息技术有限公司 一种搜索方法及装置、存储介质、服务器
WO2021042077A1 (en) * 2019-08-29 2021-03-04 Ehr Command Center, Llc Data command center visual display system
US11675805B2 (en) 2019-12-16 2023-06-13 Cerner Innovation, Inc. Concept agnostic reconcilation and prioritization based on deterministic and conservative weight methods

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07225772A (ja) * 1993-12-14 1995-08-22 Toshiba Corp 類似情報検索装置とその方法
JPH10260990A (ja) * 1997-03-18 1998-09-29 Nippon Telegr & Teleph Corp <Ntt> 例示検索の高速化方法
JPH10320420A (ja) * 1997-03-14 1998-12-04 Dainippon Screen Mfg Co Ltd データ検索方法
JPH10326286A (ja) * 1997-05-27 1998-12-08 Mitsubishi Electric Corp 類似検索装置及び類似検索プログラムを記録した記録媒体
JPH11120179A (ja) * 1997-10-17 1999-04-30 Sanyo Electric Co Ltd 検索条件入力方法並びに情報検索装置
JPH11203320A (ja) * 1998-01-20 1999-07-30 Hitachi Ltd データベース前処理方式
JPH11259518A (ja) * 1998-03-13 1999-09-24 Hitachi Ltd データベース検索方法
JP2002140364A (ja) * 2000-10-31 2002-05-17 Seiko Epson Corp 情報検索システム、コンテンツ検索システム、コンテンツ配信システム及び記憶媒体
JP2004054619A (ja) * 2002-07-19 2004-02-19 Nec Soft Ltd 文書検索システム、文書検索方法、および、文書検索プログラム
JP2005115514A (ja) * 2003-10-06 2005-04-28 Ibm Japan Ltd データベース検索システム及びその検索方法並びにプログラム

Family Cites Families (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5084815A (en) * 1986-05-14 1992-01-28 At&T Bell Laboratories Sorting and merging of files in a multiprocessor
US5544044A (en) * 1991-08-02 1996-08-06 United Healthcare Corporation Method for evaluation of health care quality
US5506984A (en) * 1993-06-30 1996-04-09 Digital Equipment Corporation Method and system for data retrieval in a distributed system using linked location references on a plurality of nodes
US5724968A (en) * 1993-12-29 1998-03-10 First Opinion Corporation Computerized medical diagnostic system including meta function
US5560005A (en) * 1994-02-25 1996-09-24 Actamed Corp. Methods and systems for object-based relational distributed databases
US5497486A (en) * 1994-03-15 1996-03-05 Salvatore J. Stolfo Method of merging large databases in parallel
US5724597A (en) * 1994-07-29 1998-03-03 U S West Technologies, Inc. Method and system for matching names and addresses
US5737539A (en) * 1994-10-28 1998-04-07 Advanced Health Med-E-Systems Corp. Prescription creation system
US5729730A (en) * 1995-03-28 1998-03-17 Dex Information Systems, Inc. Method and apparatus for improved information storage and retrieval system
US5664109A (en) * 1995-06-07 1997-09-02 E-Systems, Inc. Method for extracting pre-defined data items from medical service records generated by health care providers
US5899998A (en) * 1995-08-31 1999-05-04 Medcard Systems, Inc. Method and system for maintaining and updating computerized medical records
US5680611A (en) * 1995-09-29 1997-10-21 Electronic Data Systems Corporation Duplicate record detection
US5907839A (en) * 1996-07-03 1999-05-25 Yeda Reseach And Development, Co., Ltd. Algorithm for context sensitive spelling correction
US5903889A (en) * 1997-06-09 1999-05-11 Telaric, Inc. System and method for translating, collecting and archiving patient records
US5895461A (en) * 1996-07-30 1999-04-20 Telaric, Inc. Method and system for automated data storage and retrieval with uniform addressing scheme
US5745900A (en) * 1996-08-09 1998-04-28 Digital Equipment Corporation Method for indexing duplicate database records using a full-record fingerprint
US5924074A (en) 1996-09-27 1999-07-13 Azron Incorporated Electronic medical records system
US6168568B1 (en) * 1996-10-04 2001-01-02 Karmel Medical Acoustic Technologies Ltd. Phonopneumograph system
US5968109A (en) * 1996-10-25 1999-10-19 Navigation Technologies Corporation System and method for use and storage of geographic data on physical media
US6061503A (en) * 1996-11-06 2000-05-09 Zenith Electronics Corporation Method for resolving conflicts among time-based data
US6816880B1 (en) * 1997-03-26 2004-11-09 Concerto Software, Inc. Browser user inter face for client workstation
US6082776A (en) * 1997-05-07 2000-07-04 Feinberg; Lawrence E. Storing personal medical information
US5806061A (en) * 1997-05-20 1998-09-08 Hewlett-Packard Company Method for cost-based optimization over multimeida repositories
US6052685A (en) * 1997-08-13 2000-04-18 Mosaix, Inc. Integration of legacy database management systems with ODBC-compliant application programs
KR20010023028A (ko) * 1997-08-20 2001-03-26 맥슨 시스템스 아이엔시. (런던) 엘티디. 전자식 디렉토리의 저장된 엔트리 위치지정 방법 및 통신 장치
US6018735A (en) * 1997-08-22 2000-01-25 Canon Kabushiki Kaisha Non-literal textual search using fuzzy finite-state linear non-deterministic automata
US6266675B1 (en) * 1997-10-07 2001-07-24 Phycom Corporation System and method for using a relational database to enable the dynamic configuration of an application program
US6205446B1 (en) * 1997-10-31 2001-03-20 Selectica, Inc. Method for merging multiple knowledge bases into one optimized and compressed knowledge base
US6295541B1 (en) * 1997-12-16 2001-09-25 Starfish Software, Inc. System and methods for synchronizing two or more datasets
CA2239015C (en) 1998-02-24 2005-12-20 Luc Bessette Method and apparatus for the management of data files
US6158673A (en) 1998-03-02 2000-12-12 Ecolab Inc. Portable unit wall unit dispensers and method of dispensing
US6666874B2 (en) * 1998-04-10 2003-12-23 Endicor Medical, Inc. Rotational atherectomy system with serrated cutting tip
US6119126A (en) * 1998-05-29 2000-09-12 Oracle Corporation Object-relational query builder which determines existence of structures from information loaded from the server and cached locally on the client computing system
US7216091B1 (en) 1998-06-26 2007-05-08 American Express Travel Related Services Company, Inc. Stored value transaction system including an integrated database server
US6370522B1 (en) * 1999-03-18 2002-04-09 Oracle Corporation Method and mechanism for extending native optimization in a database system
WO2000065522A2 (en) 1999-04-28 2000-11-02 San Diego State University Foundation Electronic medical record registry including data replication
US6565609B1 (en) * 1999-06-15 2003-05-20 Microsoft Corporation Translating data into HTML while retaining formatting and functionality for returning the translated data to a parent application
EP1077415A1 (en) 1999-08-19 2001-02-21 Humetrix, Inc. System and method for remotely accessing user data records
WO2001022285A2 (en) 1999-09-21 2001-03-29 Borthwick Andrew E A probabilistic record linkage model derived from training data
US6606744B1 (en) * 1999-11-22 2003-08-12 Accenture, Llp Providing collaborative installation management in a network-based supply chain environment
US20010051879A1 (en) * 1999-12-01 2001-12-13 Johnson Robin D. System and method for managing security for a distributed healthcare application
US20010051880A1 (en) * 1999-12-01 2001-12-13 Schurenberg Kurt B. System and method for connecting a healthcare business to a plurality of laboratories
US20020007284A1 (en) * 1999-12-01 2002-01-17 Schurenberg Kurt B. System and method for implementing a global master patient index
US6507840B1 (en) * 1999-12-21 2003-01-14 Lucent Technologies Inc. Histogram-based approximation of set-valued query-answers
US20010051881A1 (en) * 1999-12-22 2001-12-13 Aaron G. Filler System, method and article of manufacture for managing a medical services network
US6988075B1 (en) * 2000-03-15 2006-01-17 Hacker L Leonard Patient-controlled medical information system and method
US6701345B1 (en) * 2000-04-13 2004-03-02 Accenture Llp Providing a notification when a plurality of users are altering similar data in a health care solution environment
US7039878B2 (en) * 2000-11-17 2006-05-02 Draeger Medical Systems, Inc. Apparatus for processing and displaying patient medical information
US20020082870A1 (en) * 2000-11-20 2002-06-27 Mark Penny System and method for processing patient medical information
US20020073099A1 (en) * 2000-12-08 2002-06-13 Gilbert Eric S. De-identification and linkage of data records
US6636850B2 (en) * 2000-12-28 2003-10-21 Fairisaac And Company, Inc. Aggregate score matching system for transaction records
US7152060B2 (en) * 2002-04-11 2006-12-19 Choicemaker Technologies, Inc. Automated database blocking and record matching
AU2002343175A1 (en) 2002-11-28 2004-06-18 Nokia Corporation Method and device for determining and outputting the similarity between two data strings
US7296011B2 (en) * 2003-06-20 2007-11-13 Microsoft Corporation Efficient fuzzy match for evaluating data records
US7340448B2 (en) * 2003-11-13 2008-03-04 International Business Machines Corporation Method, apparatus, and computer program product for implementing enhanced query governor functions
US7254774B2 (en) * 2004-03-16 2007-08-07 Microsoft Corporation Systems and methods for improved spell checking

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07225772A (ja) * 1993-12-14 1995-08-22 Toshiba Corp 類似情報検索装置とその方法
JPH10320420A (ja) * 1997-03-14 1998-12-04 Dainippon Screen Mfg Co Ltd データ検索方法
JPH10260990A (ja) * 1997-03-18 1998-09-29 Nippon Telegr & Teleph Corp <Ntt> 例示検索の高速化方法
JPH10326286A (ja) * 1997-05-27 1998-12-08 Mitsubishi Electric Corp 類似検索装置及び類似検索プログラムを記録した記録媒体
JPH11120179A (ja) * 1997-10-17 1999-04-30 Sanyo Electric Co Ltd 検索条件入力方法並びに情報検索装置
JPH11203320A (ja) * 1998-01-20 1999-07-30 Hitachi Ltd データベース前処理方式
JPH11259518A (ja) * 1998-03-13 1999-09-24 Hitachi Ltd データベース検索方法
JP2002140364A (ja) * 2000-10-31 2002-05-17 Seiko Epson Corp 情報検索システム、コンテンツ検索システム、コンテンツ配信システム及び記憶媒体
JP2004054619A (ja) * 2002-07-19 2004-02-19 Nec Soft Ltd 文書検索システム、文書検索方法、および、文書検索プログラム
JP2005115514A (ja) * 2003-10-06 2005-04-28 Ibm Japan Ltd データベース検索システム及びその検索方法並びにプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
OZSOYOGLU, G., ET AL.: "Time-Constrained Query Processing in CASE-DB", IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING, JPN6010043577, December 1995 (1995-12-01), US, pages 865 - 884, ISSN: 0001685015 *
相澤 彰子: "レコード同定問題に関する研究の課題と現状", 電子情報通信学会論文誌 (J88−D−I) 第3号, vol. 第J88-D-I巻 第3号, JPN6010043573, 1 March 2005 (2005-03-01), JP, pages 576 - 589, ISSN: 0001685014 *

Also Published As

Publication number Publication date
CA2609916A1 (en) 2006-12-07
CN101194258A (zh) 2008-06-04
AU2006252583B2 (en) 2010-04-22
WO2006130658A1 (en) 2006-12-07
US9336283B2 (en) 2016-05-10
CN101194258B (zh) 2011-09-14
EP1886239A1 (en) 2008-02-13
AU2006252583A1 (en) 2006-12-07
US20060294092A1 (en) 2006-12-28

Similar Documents

Publication Publication Date Title
JP2008546098A (ja) 患者の人口統計的レコード照会のデータ依存型フィルタリングシステム及び方法
US10025904B2 (en) Systems and methods for managing a master patient index including duplicate record detection
US10803099B2 (en) Incremental maintenance of inverted indexes for approximate string matching
US10572461B2 (en) Systems and methods for managing a master patient index including duplicate record detection
CN100557606C (zh) 用于查找串的方法和设备
US7996369B2 (en) Method and apparatus for improving performance of approximate string queries using variable length high-quality grams
KR101511656B1 (ko) 퍼스널 아이덴티티를 기술하는 데이터에 대한 액셔너블 속성의 애스클라이빙
US7984036B2 (en) Processing a text search query in a collection of documents
US20130006975A1 (en) System and method for matching entities and synonym group organizer used therein
JP5810719B2 (ja) データ配置変更プログラム、データ配置変更方法およびデータ配置変更装置
US10417208B2 (en) Constant range minimum query
CN103688260A (zh) 实体解析
JPWO2008108297A1 (ja) 相同性検索システム
JP4237813B2 (ja) 構造化文書管理システム
US11151317B1 (en) Contextual spelling correction system
WO2022019275A1 (ja) 文書検索装置、文書検索システム、文書検索プログラム、および文書検索方法
US7805430B2 (en) Evaluation of name prefix and suffix during a search
CN111223533B (zh) 一种医疗数据检索方法及系统
US20200117735A1 (en) Method for identifying complex textual patterns containing keywords within data records
KR101303363B1 (ko) 데이터 처리 시스템 및 방법
JP2006106907A (ja) 構造化文書管理システム、索引構築方法及びプログラム
GB2327133A (en) Automatic recognition and expansion of abbreviated medical descriptions
EP2942720A1 (en) Domain based keyword search

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100803

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101102

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101110

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101203

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101210

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101229

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110322

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110622

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110629

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110722

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110729

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110822

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110829

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111122