JP2007102770A - 計算機支援式領域特定型実体写像の方法及びシステム - Google Patents

計算機支援式領域特定型実体写像の方法及びシステム Download PDF

Info

Publication number
JP2007102770A
JP2007102770A JP2006250279A JP2006250279A JP2007102770A JP 2007102770 A JP2007102770 A JP 2007102770A JP 2006250279 A JP2006250279 A JP 2006250279A JP 2006250279 A JP2006250279 A JP 2006250279A JP 2007102770 A JP2007102770 A JP 2007102770A
Authority
JP
Japan
Prior art keywords
data
classification
entity
entities
attributes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006250279A
Other languages
English (en)
Inventor
Gopal B Avinash
ゴパール・ビー・アヴィナシュ
Saad Ahmed Sirohey
サアド・アハメド・シロヘイ
Allison L Weiner
アリソン・リー・ウェイナー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
General Electric Co
Original Assignee
General Electric Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by General Electric Co filed Critical General Electric Co
Publication of JP2007102770A publication Critical patent/JP2007102770A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】利用者指示型の関連領域の定義及び当該領域内での分類に基づいて、データ実体の大規模な分析、構造化、写像及び分類を可能にする。
【解決手段】概念枠組が、関心のある属性(26)の関連一覧を有する領域定義(12)によって確立される。データ実体はアクセスされ(70)、関連一覧、及び実体に見出される属性に従って、また属性を分析し、認識し、分類する規則及びアルゴリズムに従って、分析され(74)、適当な場合には構造化され、写像され、分類される。分類に続いて様々な形式の分析を実行することができる。データ実体の検索及び選択を実行することもできる。テキスト文書(430)、画像データ(432)、音声データ(434)、波形データ(438)及びこれらの組み合わせを含めた複合型データ実体を処理することができる。
【選択図】図1

Description

本発明は一般的には、データ分類及び写像(マッピング)の分野に関する。さらに具体的には、本発明は、関連領域の計算機支援式定義の手法、並びに性質がテキスト型でない選択、分析及び分類規準を含め、上述のような定義に基づく文書及び他のデータ実体の自動分類に関する。
特定の関心分野に対する関連を有するデータ実体を識別するために、広範な手法が開発され、また現在用いられている。本書で用いられる「データ実体」との用語は、自動化された手法によって識別され、分析され、分類されることが可能な任意の形式のディジタル型データを含み得る。かかる実体としては、少しだけ挙げると、例えばテキスト文書、画像ファイル、音声ファイル、波形データ、及びこれらの組み合わせ等がある。
既存のデータ実体の識別、分析及び分類の手法はしばしば、関連文書及び他のデータ項目を識別して、項目自体か又は関連のある部分かをある程度まで収集するように設計されている。例えば一般的な検索エンジンは、単語のブール検索又は他の規準を可能にする。これらの検索は、文書自体又は文書の部分、及び索引付き文書等に対して実行され得る。幾つかの検索ツールは、同様の目的のために関連のある用語による文書のタグ付けを用いる。結果は典型的には列挙項目(リスティング)として返され、文書に対するリンクが付されている場合もある。一般的な手法はまた、文書の関連性の順位付けを用いている。
かかるツールは多くの検索に極めて有用であるが、さらに有用な検索及び分類を実行することのできる改良型ツールが必要とされている。特に、さらに完全な利用者指示型の関連領域の定義及び当該領域内での分類に基づいて、データ実体の大規模な分析、構造化、写像及び分類を可能にすることのできるツールが必要とされている。さらに、複数の規準の組み合わせに基づいて、文書、画像、テキスト・ファイル及び音声ファイル等を検索して分類することのできるツールが必要とされている。
本発明は、かかる必要に応えるように設計されたデータ実体の識別、分析、構造化、写像及び分類のための新規の手法を提供する。この手法は、利用者による「領域(domain)」の定義を容易にする点で「領域特定型」であると言える。領域は、利用者によって定義された如何なる概念場に関係したものであってよく、領域内部には概念下位区分又はレベル、及び最終的にはデータ実体の特定の属性を伴って、これによりデータ実体の所在を突き止めることができる。そして、領域は、どのデータ実体が識別され、構造化され、写像され、分類され得るかに応じた概念枠組を本質的に定義する。
本発明は、テキスト、画像、波形及び音声ファイル等、並びにこれらの組み合わせとして定義されたデータを含めて、広範囲のデータ実体を識別し、選択し、処理することを可能にする。本発明は、軸、各々の軸についてのラベル、及び各々のラベルの属性の定義を設定することにより、特定の多次元の関心領域(主題領域等)を定義することを可能にする。軸は領域を下位分割し、ラベルは軸を下位分割することができる。このようにして、任意の数の連続したレベルを定義することができる。属性はラベルの基礎を成すと共に、一般的には、データ実体を識別して処理するときの規準の基礎を成す。領域定義の全体が経時的に変更され、精密化され、拡張され又は他の場合には操作され得る。
軸、ラベル及び属性は全て、多数の形式のデータ定義すなわちテキスト、画像、波形及び音声ファイル等の任意のものであってよいし、或いはこれらを含んでいてよい。続いて、所望のテキスト、画像、波形及び音声ファイル等を表わす符号の直接比較等によるデータ定義の適用によって、データ実体の検索、構造化、領域に対する写像、分類及び分析等のような動作を直接実行することができる。
次いで、この枠組から、知識ベース又は統合型知識ベース(Integrated Knowledge Base、IKB)を確立することができ、IKBに基づいて、又は異なるデータベースにおいて行なわれる新たな検索に基づいて、後の実体の検索、分析、写像及び分類、並びに利用を行なうことができる。
また、利用者による分析及び領域定義との相互作用(対話)、領域精密化、データ実体の統計学分析若しくは他の分析、又はデータ実体自体との相互作用を容易にするために、利用者による構成設定が可能な一連の表示が提供される。
本発明は、かかる領域定義、並びにデータ実体の分析、構造化、写像及び分類を実行する方法、並びにかかる機能を果たすシステム及びソフトウェアを思量している。
本発明のこれらの特徴、観点及び利点、並びに他の特徴、観点及び利点は、添付図面を参照して以下の詳細な説明を精読するとさらに十分に理解されよう。尚、図面全体にわたり、類似の参照符号は類似の部材を表わす。
図面に移り、先ず図1を参照して述べると、領域定義を確立すると共に、この定義に従ってデータ実体を検索し、分析し、構造化し、写像し、分類するデータ実体写像システム10が線図で図示されている。図1に示す実施形態では、領域定義を参照番号12で示す。後にあらためて詳述するように、領域定義は、技術分野のような任意の関連する場(field)に関わるものであってよい。領域定義は、後述の手法に従って確立されることができ、関連する場の論理的に下位区分された各部分の概念枠組であると一般に考えることができる。各々の部分は、任意の数の概念レベルにさらに下位区分され得る。これらのレベルは最終的には、データ実体において見出される可能性の高い属性と関連付けされ、データ実体の識別、分析、構造化、写像及び分類を可能にする。後に説明するように、これらの属性は、テキスト、画像の特徴若しくは特性、波形の特徴若しくは特性、音声ファイルの特徴若しくは特性、又はその他任意の形式の情報の符号体系化(codification)によって定義され得る。
領域定義12は処理システム14に結合されており、処理システム14は、一連のデータ資源16の任意のものからデータ実体を識別するために領域定義を用いる。処理システム14は一般的には、1箇所又は複数箇所に位置していてよい1又は複数のプログラムされたコンピュータを含んでいる。領域定義自体は、処理システム14に記憶されていてもよいし、データ実体を検索し、分析し、構造化し、写像し又は分類するように要求されたときに、処理システム14によってアクセスされてもよい。利用者と領域定義、並びにデータ資源及びデータ実体自体との相互作用を可能にするために、一連の編集自在型インタフェイス18が設けられる。この場合にも、かかるインタフェイスは処理システム14に記憶されていてもよいし、必要に応じてシステムによってアクセスされてもよい。インタフェイスは一連の画面20を形成する。このことについては後にあらためて説明する。一般的には、これらの画面は、領域の定義、領域の精密化、データ実体の分析、分析結果の視覚化、並びにデータ実体自体の視覚化及びデータ実体自体との相互作用を可能にする。
領域定義12に戻り、ここでの議論では、領域定義によって表わされる概念枠組の異なるレベルについて、「軸」、「ラベル」及び「属性」との用語が用いられる。当業者には認められるように、その他任意の用語を用いてよい。一般的には、定義の軸は領域の概念下位区分を表わす。軸は必ずしも領域全体を網羅していなくてもよく、実際には特定のレベルでのデータ実体の幾つかの側面の分析及び視覚化を可能にするように戦略的に構造化されていればよい。このことについては後に議論する。次いで、参照番号22に示す軸はラベル24によって下位区分される。この場合にも、この付加的なレベルにある概念下位区分に対して任意の適当な用語を用いてよい。ラベルは一般的には、それぞれの軸の概念的部分であるが、軸に割当て可能な概念の全範囲を網羅していなくてもよい。さらに、本発明の手法は一つの軸のラベルと他の軸のラベルとの間又は事実上軸同士の重なり、冗長性又は反対に除外を排除するものではない。
次いで、各々のラベルは属性26に関連付けされる。この場合にも、属性は、ラベルの間又は軸の間でも共通であってよい。但し、一般的には、領域の戦略的定義は、利用者がデータ実体を分類することを可能にする方式で個々のデータ実体の一対多写像及び分類を可能にするものとする。このように、軸とラベルと属性との間に何らかの区別を設けることは、データ実体同士の間の区別を可能にするために有用である。
さらに、例示のみのために述べると、本発明の手法を、テキスト文書の識別にも、画像データ、音声データ及び波形データ等のような他の形態及び形式のデータを有する文書の識別にも適用することができる。このことについては後に議論する。さらに他の例として、この手法を特定の技術分野又は関心領域にある特許及び特許出願のような知的財産権を識別することに応用してもよい。かかる領域の範囲内では、従来の分類に従っていてもよいし特定の知識又は関心に基づいて完全に利用者によって定義されてもよい一連の個々の分類を考案することができる。次いで、個々の軸の各々の範囲内では、分類の個々の下位区分を具現化することができる。後にあらためて詳述するように、分類の多くのかかるレベルを具現化することができる。最後に、文書は主に性質がテキスト型であり得るので、個々の属性26は、特定の単語、単語列及び句等を含み得る。他の形式のデータ実体では、属性は、画像内の関心のある特徴、音声ファイルの部分、及び波形の部分又は傾向等を含み得る。そして、領域定義は、実体内及び実体間で識別可能な特定の特徴による個々のデータ実体の検索、分析、構造化、写像及び分類を可能にする。
但し、後にあらためて詳述するように、本発明の手法はテキスト文書の分析のための先例のないツールを提供するが、本発明はテキスト型データ実体のみとの応用に一切限定されない。これらの手法は、画像、音声データ、波形データのようなデータ実体、並びにこれらの形式のデータの1若しくは複数(すなわちテキストと画像、テキストと音声、画像と音声、テキストと画像と音声等)を含むデータ実体、又はこれらを有して互いに関連付けされたデータ実体と共に用いることができる。さらに、軸、ラベル及び属性自体が、特徴のテキスト若しくは単語による記述とは独立に又はかかる記述を補完して、目標データ実体において関心を持たれ易い性質(例えば画像特徴、波形特徴及び音声ファイル特徴等)を帯びることを可能にすることにより、単なるテキスト検索及びカテゴリー分けを遥かに超えた強力な実体管理ツールが提供される。
領域定義に基づいて、処理システム14はデータ資源16にアクセスして、個々のデータ実体を識別し、分析し、構造化し、写像し、分類する。広範なかかるデータ実体が、システムによってアクセスされて、任意の適当な位置に又は任意の適当な形態で見出され得る。例えば、本発明の手法を用いて、構造化されたデータ実体28又は構造化されていない実体30を識別し、分析することができる。構造化されたデータ実体28は、書誌内容、予め識別された欄及びタグ等のような構造化されたデータを含み得る。構造化されていないデータ実体は、かかる識別可能な欄を一切含まず、代わりに、さらなる処理又は異なる処理を施すのが順当な「未処理(raw)」のデータ実体を含み得る。さらに、かかる構造化されたデータ実体及び構造化されていないデータ実体は、「全般型」ソース32からのもの、又は統合型知識ベース(IKB)34のような既知の予め確立されたデータベースからのものと考えてよい。本書で用いられる「全般型(at large)」ソースとの用語は、典型的には利用者によってIKBに予め組織化されてはいない任意のソースを含んでおり、かかる全般型ソースは、インターネット、図書館、職能組織、利用者グループを介して、又はその他何であれ任意の資源から見出すことができる。
一方、IKBは、領域定義の概念枠組に従って予め識別され、分析され、構造化され、分類されたデータ実体を含み得る。IKBの確立は、後にあらためて詳述するように、実体のさらに詳細でさらに高速の分析及び再分類、並びに利用者定義の検索規準に基づく実体の検索に特に有用である。但し、全般型ソースからのデータ実体を識別するためにも同一又は類似の検索規準を用いてよく、本発明の手法は、予め定義されたIKBとの利用に限定されるものではないことに留意されたい。
最後に、図1に示すように、データ実体のその他任意のソースが、参照番号36によって全体的に示すように処理システム14によって参照され得る。これらその他のソースは、新たに確立された資源又は新たに加入した資源のような領域の確立及び分類に続いて利用可能となるソースを含み得る。また、かかる新たな資源は任意の時刻に存在を開始してよく、本発明の手法は、これらの資源の分類システムへの組み入れを可能にし、実際に上述のような新たなデータ実体を収容する分類システム自体の精密化を可能にしていることに留意されたい。
本発明の手法は、関係はあるが別個であると看做すべき幾つかの有用な機能を提供する。第一に、データ実体の「識別」は、関心又は潜在的関心のある実体の選択に関わる。このことは典型的には、領域定義の属性、及び属性と協働するように具現化されている任意の規則又はアルゴリズムを参照して行なわれる。実体の「分析」は、データによって定義される特徴の検査を必然的に伴う。多くの形式の分析はここでも、関心のある属性、実体の属性、並びに構造化、写像及び分類の基礎となる規則又はアルゴリズムに基づいて実行され得る。分析はまた、構造化され分類されたデータ実体に対しても実行されて、類似性、差、傾向、及び以前には認知されていなかった対応等まで識別する。
本書で用いられる「構造化」との用語は、概念枠組の確立又は領域定義を指す。データ・マイニング(採掘)分野では、「構造化する」との用語、及び「構造化された」データと「構造化されていない」データとの間の区別を用いる場合がある(例えば図1に示す構造化された実体及び構造化されていない実体に関して上で述べたように)。かかる「構造化」は、幾つかのデータ実体に作用しこれらデータ実体の範囲内にある特定の分析システムを具現化することと考えることができる。このように、一つの文書を標題、要約及び小部分に下位区分することができる。但し、これら各々の範囲内では、データは本質的に構造化されないままであってよい。本発明の手法は、領域定義の特定の概念枠組に応じてかかる構造を利用し、変更し、又は廃棄することまで可能にする。かかる構造化は、翻訳、書式整形、タグ付け、又は他の場合にはさらに容易に検索され、分析され、比較され、分類される形態へのデータの変換を必然的に伴い得る。例として述べると、かかる構造化は、XMLのようなマークアップ言語の利用等を介した特定の形式のファイル又は書式へのデータの変換を含み得る。
実体の「写像」は、データ実体の特徴及び属性に対する領域定義の属性の関係を含んでいる。かかる写像は、領域定義の属性、並びに用いられている規則及びアルゴリズムに従って、各々の実体のデータに対して領域定義を適用する過程であるものと考えることができる。写像はここでの文脈では、「分類」とは深く関わっているが区別される。分類は、領域定義の概念枠組の下位区分と(例えば軸及びラベルの属性を介した)データ実体との間の関係の割当てである。ここでの文脈では、一対多写像及び一対多分類を参照し、写像を領域定義の構造的システムに基づく分類に到達する過程であるものとする。
結果的に得られる工程は、データ・マイニング、タクソノミィ(分類学)、マークアップ言語及び単純な検索エンジンのような幾つかの既存の手法とは区別され得るが、これらの手法の幾つかをここで具現化されている下位工程に用いてもよい。例えば、典型的なデータ・マイニングは、データの関係又はパターンをデータ実体の観点から識別するものであって、領域定義によって確立された構造に基づいて識別するものではない。データ・マイニングは一般的には、実体の一対多写像又は分類を提供しない。タクソノミィは、タクソノミィを定義する複数のカテゴリーの分解によって実体の一意の分類を強制的に行なう。マークアップ言語は、実体を構造化するためには潜在的に有用であるが、一対多写像又は分類には適さず、一般的には言語のタグ又は他の特徴に基づいて実体内部に「構造」を与えるものである。同様に、単純な検索手法は典型的には、幾つかの検索規準を満たす実体の列挙項目を返すに留まり、本書に掲げたような実体の写像又は分類を与えるものではない。
処理システム14はまた、データ実体の分析、構造化、写像及び分類について規則及びアルゴリズム38を参照する。後にあらためて詳述するように、規則及びアルゴリズム38は典型的には、データ実体の特定の形式に適応させられ、実際にはデータ実体の特定の目的(例えば分析及び分類)に適応させられる。例えば、これらの規則及びアルゴリズムは、テキスト文書のテキスト又はデータ実体のテキスト部分の分析に関わり得る。これらのアルゴリズムは、画像実体又は実体の画像部分等についての画像分析を提供することもできる。これらの規則及びアルゴリズムは処理システム14に記憶されていてもよいし、必要に応じて処理システムによってアクセスされてもよい。例えば、アルゴリズムの幾つかは、診断画像ファイルのような様々な形式のデータ実体に対して極めて特異的であってよい。これらのアルゴリズムの中には、画像の関心のある特徴の分析及び識別のための洗練されたアルゴリズムがあってもよく、データ実体の分析のために必要に応じて参照されてよい。
データ実体の分析、構造化、写像及び分類に用いられる規則及びアルゴリズムは典型的には、データ実体の形式及び領域定義に用いられる規準の性質に特に適応させられる。例えば、単にテキスト式の用語で関心のある特徴を記述したり定義したりするのではなく、これらの規則及びアルゴリズムは、特徴が何の「ように見える」若しくは何の「ように聞こえる」、又はその他任意の類似した規準を参照してデータ実体の所在を突き止めて処理するのを助けることができる。所望のある場合には、これらの規則及びアルゴリズムは、軸、ラベル及び属性に基づく比較工程において幾分かの自由度又は許容度を与えることもできる。このようにして、例えば、分類は、画像が「最もそのように見える」又は波形が「最も似ている」又は音声が「最もそのように聞こえる」ようなラベル又は軸を参照することにより行なわれ得る。
データ処理システム14はまた、分析、構造化、写像及び分類の目的を果たすのに必要とされ得る検索結果、分析結果、利用者初期設定、及びその他任意の恒久的データ又は一時的データを記憶する1又は複数の記憶装置40に結合されている。具体的には、一旦、分析、構造化、写像及び分類が一連の識別されたデータ実体に対して完了したら、記憶装置40を用いてIKB34を記憶することができる。この場合にも、経時的に追加のデータ実体をIKBに加えることができ、IKB内のデータ実体の分析及び分類を精密化したり、領域定義の変化、並びに分析及び分類に適用される規則の変化等に基づいて変更したりすることができる。
領域定義、規則及びアルゴリズム、並びに実体自体と相互作用(対話)するために、一連の編集自在型インタフェイスが思量され得る。例示のみのために述べると、図1に示すように、幾つかのかかるインタフェイスが現在思量されている。これらインタフェイスは、領域の軸、ラベル及び属性を確立する領域定義インタフェイス42を含み得る。規則定義インタフェイス44は、用いられるべき特定の規則、又は外部規則及びアルゴリズムへのリンクを定義するために設けられ得る。検索定義インタフェイス46は、全般型ソース又はIKBのいずれかから利用者がデータ実体を検索し、分析し、分類することを可能にするために設けられ、また様々な結果視覚化インタフェイス48が1又は複数のデータ実体の分析結果を図示するために思量されている。これらのインタフェイスは典型的には、処理システム14に結合されているワークステーション50によって利用者に提供される。実際に、処理システム14は、ワークステーション50の一部であってもよいし、ワークステーションから完全に遠隔に位置して、適当なネットワークによって結合されていてもよい。スタンプ画面、フォーム画面、表形式画面、強調画面、基本的空間表示(スプレイ(splay))、オーバレイ付きスプレイ、利用者定義型スキーム、又はその他任意の画面と名付けて図1に列挙した画面を含めて、多くの異なる画面がインタフェイスの一部として提供されてよい。尚、これらの画面は、分析及び分類の例示的な検討用画面に過ぎず、他の多くの画面又はこれらの画面の変形が想到され得ることに留意されたい。
尚、かかるインタフェイスにおいて軸、ラベル又は属性で構成される表現は、実際には「省略表現」又はアイコン式表現のみを成していてよいことを特記しておく。すなわち、特性がテキスト以外の軸、ラベル又は属性によって定義されていて視覚的表現には容易には馴染まない場合でも、視覚的表現をインタフェイスに配置することができる。所望があれば、利用者がアイコン式表現の選択によって実際のデータ特性に(任意の適当な形態で)アクセスし得るようにすることができる。このようにして、例えば、音声特徴をアイコンによって表現することができ、所望の場合にはこの特徴に対応する実際の音声を再生することができる。画像及び波形等におけるもののような他の特徴を、インタフェイスでは単純化しておいて、選択に応じてさらに詳細な形態が利用可能となるようにしてもよい。しかしながら、全ての場合に、領域を定義して関心のある実体を処理するための基礎として役立つのは特徴自体であって、単にアイコン式表現であるのではない。
上述のように、本発明の手法は、領域定義によって表わされる概念枠組の利用者定義及び精密化を可能にする。図2は、領域の概念枠組を定義する例示的なステップを示す。参照番号52によって全体的に示された全体のロジックは、第一の段階54での領域の一般的な指定と、続いての第二の段階56での領域定義の精密化とを含んでいる。領域54の指定は、領域の軸の定義58及び各々の軸内でのラベルの定義60のような一連のステップを含み得る。前述のように、軸は一般的には、利用者によって定義される任意の適当な態様で分解された領域の概念的部分を表わす。そして、ラベルは個々の軸の概念分解を表わす。ラベル、そして実際には軸も、概念的下位分類レベルと考えることができる。後にあらためて詳述するように、レベルの幾つかが冗長であってもよいし、また低いレベルを高いレベルと共に冗長にして、領域の内部で「概念的ズーム」を可能にすることもできる。すなわち、特定のラベルを領域の軸としても列挙して、データ実体の特定の分類の根拠の分析及び視覚化を可能にしてもよい。
領域の指定に続いて、段階56において領域をさらに精密化することができる。かかる精密化は、各々の軸の個々のラベルの属性を列挙することを含み得る。一般的には、これらの属性は、データ実体に見られる特徴であって識別、分析、構造化、写像又は分類を容易にするデータ実体の任意の特徴であってよい。図2に示すように、文書については、かかる実体は、単語、単語及び術語の変化形、同義語、関連語及び概念等を含み得る。これらの属性を、後にあらためて詳述するように、各々のラベルについて単純に列挙することができる。列挙された属性に基づいて、ステップ64に示すように関連一覧を生成することができる。この関連一覧は実効的には、各々のラベル及び軸に関連付けされるべき属性の集合を表わす。ここでも、関連一覧は、画像、波形及び音声ファイル等について任意の適当な態様で定義される特徴、並びにかかる特徴をテキストと組み合わせたもの又は互いに組み合わせたものを含み得る。
領域の定義に続いて、ステップ66において特定のデータ実体の検索、分析、構造化、写像及び分類に適用されるべき規則及びアルゴリズムを識別して定義する。これらの規則及びアルゴリズムは、利用者によって領域と共に定義され得る。かかる規則及びアルゴリズムは、単語及び句を識別すべきか否か、また如何に識別すべきか等(例えば単語単位又は句単位で検索すべきか、及び近接性規準等)のように単純であってよい。他の文脈では、遥かに精巧なアルゴリズムを用いてもよい。例えば、テキスト文書の分析であっても、複雑なテキスト分析、索引付け、分類、タグ付け、及び他のかかるアルゴリズムを用いることができる。画像データ実体の場合には、アルゴリズムは、画像内の関心のある特定の部位又は特徴の識別、セグメント分割、分類及び比較等を可能にするアルゴリズムを含み得る。例えば医療診断文脈では、かかるアルゴリズムは疾患状態の計算機支援式診断、又はさらに精巧な画像データの分析を可能にするものであってよい。さらに、これらの規則及びアルゴリズムは、テキストと、画像データ及び音声データ等を含む他のデータとの別個の分析を可能にするものであってよい。さらに、これらの規則及びアルゴリズムは、テキスト及び他のデータの分析の組み合わせを提供するものであってもよい。
後にあらためて詳述するように、本発明の手法はこのように、分析され得るデータの形式において、並びにデータ実体に含まれるテキスト、画像及び他の形式のデータのためのアルゴリズムの組み合わせに基づくデータ実体の分類において、先例のない自由及び広がりを与える。ステップ68では、選択随意で、かかる規則及びアルゴリズムへのリンクを設けることができる。かかるリンクは、例えば特定のデータ実体の所在を突き止めたいが、これらのデータ実体の分析及び分類のためには複雑であるか、発展途上にあるか又は新規のアルゴリズムが利用可能である場合に有用であり得る。適当である場合には多くのかかるリンクを設けて、利用者入力による検索規準に基づいて、一旦識別された個々のデータ実体の分類を容易にすることができる。
ステップ70ではデータ実体にアクセスする。データ実体はこの場合にも、全般型ソース、及び既知の又は予め定義されている知識ベース等を含めて任意の適当な位置にあってよい。本発明の手法は、データ実体自体の取得又は作成に拡張することもできるが、図2に示す処理は、データ実体が既に存在するものと仮定している。ステップ72では、選択随意で、データ実体に索引付けしてデータ実体を記憶することができる。当業者には認められるように、かかる索引付けは、後に行なわれるデータ実体の極めて高速な処理を可能にする。かかる索引付けは、データ実体が再びアクセスされるような状況であって、元の実体が構造化されていないか半構造化されているか又は未処理データ(例えば未処理テキスト)を含んでいるような状況に特に適している場合がある。かかる索引付けを実行する場合に、索引付き実体は典型的には、ステップ72で記憶されて後のアクセス、分析、写像及び分類に供する。また、上述のように、構造化された又は部分的に構造化された実体及び実体の部分についても、領域定義はかかる構造を用いることもできる(例えば実体内の既存の構造が領域定義の構造的システムに対応している場合)し、データを再構造化するか又はさらに構造化することもできるし、実体の既存のデータ構造を無視することもできる。
図2のステップ74では、領域定義、並びに関連付けされた規則及びアルゴリズムを、アクセスされたデータ実体に適用する。領域定義、並びに規則及びアルゴリズムに基づいて、特定のデータ実体を識別し、分析し、構造化し、写像し、分類する。尚、後にあらためて詳述するように、ステップ74で実行される特定の検索は、利用者によって指定され又は作成され得ることを特記しておく。すなわち、特定の検索のためのインタフェイスは、全般型ソース及びIKB内のソースのいずれのものでも、適当な検索インタフェイスを介して利用者によって定義され得る。この具現化形態では、検索インタフェイスは、得られた領域定義インタフェイスと本質的に同一であってよく、同様の軸及びラベルを含んでおり、これらの軸及びラベルは検索を実行するために利用者によって選択され得る。ステップ76では、領域定義及び規則の適用の結果を記憶する。ステップ78では、分析及び分類を提示しているインタフェイスのページ、並びに実際にデータ実体自体を提示する。かかる提示に基づいて、図2に示す上の方の処理ステップに戻る矢印によって示すように、領域定義及び属性、並びに領域定義に基づいて適用された規則及びアルゴリズムを変更することができる。
データ実体にアクセスしてデータ実体を扱う特定のステップ及び段階を図3に線図で示す。図3では、参照番号80によって全体的に示される実体処理ロジックが、領域定義(又は利用者によって定義された検索規準)、並びに定義に関連付けされた規則及びアルゴリズムに基づくデータ実体の分類で開始する。この分類は、参照番号82、84に示すような一対多写像及び分類を生ずる。当業者には認められるように、かかる写像は、従来の検索エンジン及びデータ・マイニング・ツールでは典型的に行なわれる訳ではない。すなわち、多くの異なる軸、ラベル及びこれらの実際様々なレベルが領域定義に含まれ得るので、関連付けされた属性、規則及びアルゴリズムと併せて、各々のデータ実体を1よりも多い軸及びラベルにおいて写像して分類することができる。このようにして、任意の一つのデータ実体を、領域定義の概念枠組の多くの異なる概念下位区分に写像することができる。この一対多写像及び分類は、後に行なわれるデータ実体の分析、比較及び考察の強力な基盤を提供する。
写像及び分類に続いて、図3のブロック86に示すように、データ実体の分析を行なうことができる。この場合にも、かかる分析は、利用者によって定義されるか又はアクセスされる規則及びアルゴリズムに基づくもの、並びに統計学的な分析手法に基づくものであってよい。例えば、文書を検索して分類する場合に、文書同士の間の対応、重なり及び区別を分析することができる。さらに、文書のカウント及び関連性のような単純な分析を、多数の規準、及び分類ステップにおいて実行される多対一写像に基づいて決定してもよい。次いで、ブロック88に示すように、分析結果及び分析画面を出力する。かかる画面は、本発明の手法を具現化するソフトウェア・パッケージの一部であってもよいし、利用者によって定義されていてもよい。
ステップ90では、分析結果及び分析画面が利用者によって検討される。検討は任意の適当な形態を取っていてよく、検索に続いて等のように直ちに行なわれてもよいし、任意の後の時刻に生じてもよい。この場合にも、検討は、ブロック92に示すように、個々の分析画面に対して行なわれる。検討に基づいて、利用者は、ブロック94に示すように、概念枠組の任意の部分を精密化することができる。かかる精密化は、領域定義及び領域定義の任意の部分の変更、適用される規則又はアルゴリズムの変更、並びに実行される分析の形式及び性質の変更等を含み得る。このように、本発明の手法は、データ実体を識別し、分析し、分類する柔軟性の高い対話型ツールを提供する。
上述のように、領域定義の概念枠組の範囲内で、軸及びラベルを下位分割して定義する多くの戦略を思量することができる。図4は、データ実体の一対多写像及び分類を展開する例示的な写像工程を示す。ここでの目的のために、参照番号96によって全体的に示される写像は、例示的な領域定義98に基づいて実行される。領域定義は、一連の軸22と、これらの軸に関連付けされたラベル24とを含んでいる。図4はまた、「概念的ズーム」が如何にして領域定義自体を通じて提供され得るかの一例を示している。図示の例では、第一の軸Iの属性26であってこの軸内のラベルIAの属性26が、後に現われる軸Aのラベル・レベル100において与えられている。すなわち、軸Aは軸IのラベルIAと同一である。ラベルIAの属性は軸Aのラベルと同じであるため、検索時に利用者によって選択されると、後に説明するように、返される検索結果は、ラベルIAの規準に対応付けされている幾つかのデータ実体を表わすばかりでなく、軸Aのラベルを参照することにより、何故これらの実体が選択され、写像され、分類されたかについてのさらに高いレベルの分解能又は粒度(granularity)を与える。
図4の参照番号102に示すように、特定のデータ実体が一連の属性を含むものと仮定する。テキスト型実体の場合には、これらの属性は単語又は句であってよい。すなわち、領域定義の属性によって定義される幾つかの単語又は句がデータ実体に見出される。次いで、参照番号96によって表わされる写像は、このデータ実体が、実体に見出される属性に対応する個々の軸、ラベル及びラベル属性に従って分類されることになることを示す。この場合には、軸レベル104において、実体は軸I、II及びAに従って分類される。さらに、ラベル・レベルにおいては、実体はラベルIA、IIB、IIC、AAa及びAAcにおいて分類される。さらにまた、付加的な軸Aによって与えられる「属性」レベルでの概念的ズームのため、実体は属性IAa及びIAcに関連付けされる。この具現化形態では、後述するように、これらの属性は返される検索結果に直接表示される訳ではない、。しかしながら、ラベルIAの属性を軸Aのラベル・レベル100に配置することにより、この付加的な分類が実行される。
図4に示す写像は、前述の本発明の手法の分類段階で実行される。尚、この分類は利用者選択型であってよいことを特記しておく。すなわち、後に説明するように、一旦、定義が確立されたら、全ての軸、ラベル及び属性に従って、識別される全ての実体を構造化し、写像し、分類することができる。但し、適当である場合には、利用者が所望の分類について軸及びラベルの幾つかのみを選択してもよい。しかしながら、一旦、分類が実行されたら、検索は、領域定義の概念枠組を構成する軸、ラベル及び属性の幾つか又は全てに対応する特定のデータ実体を識別するように行なわれ得る。この理由のため、データ実体の識別、構造化、写像及び分類には全ての軸、レベル及び属性を用いて、後の検索ではこれらの部分集合の利用者選択を可能にすると有利である場合がある。さらに、索引付け又は他のデータ処理手法を用いる場合には、全ての軸及びラベル、並びに関連付けされた属性を用いることにより、索引付けがこれら全てを網羅することが可能となり、これにより、後の検索及び分析を極めて容易にする。
前述のように、領域定義によって表わされる概念枠組は、広範なレベル、及びこれらのレベルの任意の概念下位区分を含み得る。図5は例示的な領域110を示しており、この場合には領域110は「超領域」と名付けられている。超領域との用語はここでは、領域自体を下位区分し得ることを示すために用いられている。すなわち、分類の概念分解において多くの異なるレベルを与えることができる。図示の実施形態では、超領域において領域112、114、116及び118を含む四つの領域が識別されている。これらの領域は互いに重なり合っていてもよい。すなわち、領域内の幾つかのラベル又は属性が他の領域にもある場合がある。但し、場合によっては領域同士の間に重なりがなくてもよい。図5に示すように、領域自体を超領域の軸と考えることもできる。次いで、さらにもう一つの概念的レベルにおいては、領域112について下位領域120によって示すように、各々の領域を下位領域に下位区分することもできる。すなわち、各々の領域が、当該領域内でデータ実体を明確に分類するように、概念的に下位区分されていてよい。究極的には、個々の軸が定義され、各々の軸毎にラベル、及び各々のラベル毎に属性を設ける。
領域によって定義される概念枠組に対するこの多段レベル型アプローチを図6にさらに詳細に示す。図6は実際に、分類及び分析の6段の別個のレベルを示している。第一のレベルL1では、超領域が定義される。この超領域110は典型的には、データ実体が見出される場自体である。当業者には認められるように、場は実際には、利用者によって定義された一つの抽象のレベルに過ぎない。超領域の範囲内には、図6のレベルL2に示すように、一連の領域112〜118がある。さらにまた、レベルL3〜L6によって表わされるように、各々の領域内で一つのレベルにある下位領域を識別することができ、続いて一連の軸を識別することができ、各々の軸が個々のラベルを有し、究極的には各々のラベルの属性を有する。このように、領域の定義について任意の数の概念レベルを定義することができる。次いで、データ実体の究極的な属性に基づいて、対応するレベル及び下位レベルに対する写像及び分類が達成される。
前述のように、本発明の手法は、領域の利用者定義及びその概念枠組を提供する。図7は、領域を定義するための例示的なコンピュータ・インタフェイス・ページを示す。例示のみのために述べると、この図示の具現化形態では、領域は、領域レベル、軸レベル、ラベル・レベル、及び関連付けされた属性のみを含んでいる。参照番号122によって示される領域定義ひな形(テンプレート)は、書誌データ区画124、主観的データ区画126、並びに軸及びラベルを列挙した分類データ区画128を含み得る。
書誌データ区画124が設けられる場合には、該区画124は、データ実体の識別を行なう幾つかの特徴を、対応する欄に与えることを可能にする。かかる書誌情報は典型的には、テキスト型でないデータ実体及び特徴の場合でも性質がテキスト型であることを特記しておく。かかる実体について、書誌情報は、一般的な出典、参考文献及び同様の情報を表わすことができる。例えば、実体欄130を、共にデータ実体を一意に識別するデータ実体識別欄132と共に設けることができる。また、データ実体をさらに詳細に識別するために標題欄134を設けることができる。利用者定義型としてよい追加欄136を設けてもよい。ブロック138及び140に示すように、データ実体のソース又は出所を表わすデータを与えてもよい。また、所望があれば、状態欄142のようなさらに他の情報を設けてもよい。最後に、文書の要約書等のような情報を受け取る等のために、一般概要欄144を設けてもよい。データ実体を検索し、分析し、写像し、分類する元となるデータベースを選択する等のために、選択146又は場の識別子を設けてもよい。当業者には認められるように、書誌区画124の例示的な欄はここでは例示のみのために掲げられている。この情報の一部又は全ては構造化されたデータ実体から入手可能であってもよいし、各欄が利用者によって記入されてもよい。さらに、欄の幾つかは、データ実体自体又は実体の部分の処理及び分析に際して初めて書きまれてもよい。例えば、かかる書誌情報は、特許文献のフロント・ページ、並びに書籍及び論文の書誌目録等のような文書の幾つかの区画に見出され得る。他の書誌データは、例えば画像ファイルのヘッダ、音声ファイルに関連付けされたテキスト部分、並びにテキスト・ファイル、画像ファイル及び音声ファイルに含まれる注釈等に見出され得る。
主観的データ区画126は、典型的には1又は複数の利用者によって入力される一連の主観的データの任意のものを含み得る。図示の例では、主観的データは、実体を識別する又は指定する欄148と、評者を識別する欄150とを含んでいる。主観的評点欄152を設けてもよい。図示の実施形態では、評者、専門家又は他の適格な人物によって判断されるデータ実体の何らかの品質を識別するために、さらにもう一つの欄154を設けてもよい。品質は、例えば利用者入力の関連性、又は他の品質を決める指標を含み得る。最後に、評者のコメントを受け入れるコメント欄156を含めてもよい。尚、主観的データ区画126におけるこれらの欄の幾つか又は全ては、利用者及び専門家によって記入されることができるが、これらの欄の幾つか又は全てが、コンピュータ・アルゴリズムを含めた自動式手法によって記入されてもよいことを特記しておく。
分類データ区画128は、図示の実施形態では、様々な軸及びラベル用の入力、並びに検索を起動してタスクを実行するための仮想的インタフェイス・ツール(例えばボタン)を含んでいる。図示の実施形態では、これらの区画は、領域定義に従ってデータ実体を検索し、分析し、構造化し、写像し、分類するために領域定義を送信する仮想的ボタン158を含んでいる。様々な結果又は追加のインタフェイス・ページを提示するための画面の選択を、ボタン160によって表わされているように設けてもよい。図7に示す具現化形態では、領域定義を構成する軸の一つ又は全てを利用者が選択することを可能にする一連の選択可能なブロック162が設けられている。同様に、各々のラベル毎に、利用者選択可能なブロック164が設けられている。見易くするために図7には示していないが、軸の全てが、多くの異なるラベルを含む可能性があり、また典型的には含む。領域定義に任意の数の軸を設けてよく、各々の軸に任意の数のラベルを設けてよい。最後に、個々の軸若しくはラベルの意味若しくは範囲を想起し易くするために、又は個々のラベルの属性を示すために、自動的に視覚化されるか利用者によって視覚化可能とされ得る(例えばマウスのボタン又は他のインタフェイス装置の選択によって)一連の識別子又はヒント窓166を設けてもよい。
軸及びラベルを識別して指定するために、一連の追加インタフェイスを設けることができる。例えば、図8は、軸、ラベル、及び各々のラベルについてのヒント・テキストを定義する例示的なインタフェイス168を示している。このインタフェイスでは、利用者は、欄170に軸の名称を、また欄172にこの軸について一連のラベル名を入力することができる。インタフェイス168はさらに、参照番号174に示すように利用者がヒント・テキストを入力するのを可能にすることができ、各々のラベルの意味又はこれらのラベルの範囲を利用者に想起させるためにこのヒント・テキストを利用するか又は表示することができる。同様のヒント・テキストを各々の軸に含めてもよいことは言うまでもない。前述のように、非テキスト型の軸、ラベル、並びに非テキスト型の特徴及び特性の属性のために、インタフェイス・ページは、記述用テキスト及びアイコン表現(例えばサムネイル表現)等を含み得る。
同様に、インタフェイス・ページは、利用者が各々のラベルの特定の属性を定義することを可能にするものであってよい。図9は、この目的のための例示的なインタフェイス・ページを示す。このページは、利用者のために、個々の軸、及び属性を指定すべきこの軸についてのラベルを表示する。図示の例では、これらの属性はテキスト文書の属性であって、欄176でのように、単語及び句が利用者によって列挙項目として定義され得るようにしている。正確な単語又は句のために、さらにもう一つの欄178が設けられている。インタフェイスの設計に応じて、利用者が特定の単語又は句を入力することを可能にするブロック180のような入力ブロックを設けることができ、ワイルドカードの単語若しくは句とすべきか、又は正確な単語若しくは句とすべきかを選択するために選択182のような選択を添えることができる。広範な他の属性入力インタフェイスが、様々な形式のデータ実体及びこの実体において遭遇することが予期される様々な形式のデータについて特に思量され得る。最後に、図9の参照番号184に全体的に示すように、属性を追加する、属性を削除する、及び属性を修正する等のためのその他の仮想的ツールと共にブロックを設けることもできる。
前述のように、本発明の手法を用いて、多様なデータ実体を識別し、分析し、構造化し、写像し、分類し、またさらに、これらのデータ実体を比較し、これらのデータ実体に対して他の分析機能を実行することができる。さらに、これらのデータ実体は、全般型ソースを含めて広範な資源から選択されてよい。さらに、これらのデータ実体は、前述のように、処理されてIKBに記憶されてよい。図10は、これらの動作の幾つかを実行する例示的なロジックを示す。
図10に示す例示的なロジック186は、参照番号188に示すように、データ実体の選択、分析及び分類のための1又は複数のひな形にアクセスすることから開始する。この具現化形態では、データ実体の初期選択及び分類のために、領域定義の全ての軸、ラベル及び属性をこのステップにおいて用いる。しかしながら、参照番号190に示すように、所望があれば、利用者が、データ実体の識別及び分類のための目標データベース又は資源をひな形から軸及びラベルと共に選択してもよい。ここでの文脈では、ステップ190で言及されているアクセスはデータ実体であり、アクセス目標は、実体が見出されるか又は実体が位置していると考えられる1又は複数の位置である。アクセス目標は、例えば公知のデータベース、公衆アクセス・データベース及びライブラリ、並びに加入型データベース及びライブラリ等を含み得る。例として述べると、知的財産権を検索するときには、かかるアクセス目標は、特許庁のデータベースを含み得る。もう一つの例として、医療診断画像を検索するときには、アクセス目標は、画像保管及び通信システム(PACS)のようなかかる画像の保管庫、又は他の保管庫を含み得る。この場合にも、この目的で任意の適当な資源を用いることができる。
ステップ190で選択された軸及びラベルに基づいて、ステップ192では、選択された属性にアクセスする。これらの属性は一般的には、利用者及び領域定義によって定義されたような選択された軸及びラベルに対応する。この場合にも、IKBへの収容等のためのデータ実体の初期分類については、全ての軸及びラベル、並びにこれらの関連付けされた属性を用いることができる。しかしながら、後の検索では、また初期検索においても所望があれば、軸及び/又はラベルの部分集合を検索規準として用いる場合に選択された属性のみを用いることができる。ステップ194では、選択された規則及びアルゴリズムにアクセスする。この場合にも、これらの規則及びアルゴリズムは、検索ひな形を介して利用者によって選択される検索規準等に応じて、全ての分析及び分類について、又は部分集合のみについて、作用を及ぼすことができる。最後に、ステップ196では、アクセス目標の場、データ実体自体若しくはデータ実体の部分、又は実体の索引付き形態に対してアクセスを行なう。このアクセスは典型的には、広域網のようなネットワーク、具体的にはインターネットによるものとなる。例として述べると、ステップ196では、実体からの未処理データにアクセスし、又は分割が利用可能である場合(例えば実体に存在する構造による)には実体の特定の部分にのみアクセスしてもよい。このようにして、特許のような知的財産権文書については、アクセスをフロント・ページ、要約書及び請求項等のような特定の下位区分に限定することができる。同様に、画像ファイルについては、書誌情報のみ、画像内容のみ、又はこれらの組み合わせにアクセスを行なうことができる。
後のアクセス、再分類及び分析等に備えてIKBにおいてデータ実体を分類したい場合には、一連の下位ステップを、図10の破線で囲ったようにして実行することができる。一般的には、これらのステップは、参照番号198に示すように、データの書き換え等のためのステップを含み得る。当業者には認められるように、本発明のツールは、広範なデータ、書式、内容、及び既知ではないかも知れない構造について具現化され得るので、データの書き換えをステップ198において行なうのが順当であろう。かかる書き換えは、再整形、区分、分割、並びに他の場合には、分析及び分類のためにデータを所望の書式にするように操作することを含み得る。所望があれば、実体はステップ200で索引付けされていてよい。かかる索引付けは、やはり当業者には認められるように、一般的には、データ実体を一連の区分又は部分に下位分割することを含んでおり、後の分析に備えて、各々の部分にタグ又は索引を付けた状態にする。かかる索引付けは、所望があれば実体の部分に対してのみ実行されてもよい。索引付けは、実行された場合にはステップ202において記憶されて、将来の検索のための索引付きデータ実体の遥かに高速なアクセス及び評価を可能にする。
所望があれば、「候補一覧」を用いて、速度を速めて特定のデータ実体の分類を促すことができる。かかる候補一覧を用いる場合に、候補一覧は典型的には、図10のステップ204に示すように予め生成される。候補一覧は一般的には、軸及びラベルを、目標とされるデータ実体の特に関心のある関連付けされた属性と共に含んでいる。実体に単語、句、画像特徴及び波形特徴等の存在のような幾つかの単純な規準がある場合には、候補一覧を用いて、IKBへの収容のためにデータ実体を迅速に選択することができる。かかる候補一覧を用いる場合には、ステップ206において、予め定義されている一覧をアクセスされるデータ実体に適用する。データ実体の性質及び具現化され得る有用なフィルタ処理に応じて、さらなるフィルタ処理及び検査を多様な方法で行なうことができる。例えば、図10に示すステップ208では、この工程は、冗長性を検査して幾つかの文書及び他のデータ実体をフィルタ処理することを要求し得る。例として述べると、IKBが既に確立されている場合には、ステップ208は、幾つかのレコード又はデータ実体がIKBに既に含まれているか否かの確認、及びIKBの冗長なレコードを排除するためのかかるデータ実体の除去を含み得る。同様に、レコードが、同じ基底的情報を本質的に表わしていることが判明した場合には、ステップ208においてこれらのレコードをフィルタ処理することができる。例えば知的財産権の例では、ステップ208において、特定の特許出願が特許として発行されており、所望があれば出願情報に対して特許情報を保持して古い情報を拒否してよいことが判明し得る。広範な検査及び確認を具現化することができる。
ステップ210では、データ実体を写像して分類する。写像及び分類はこの場合にも、軸、ラベル及び属性による領域定義に一般に従う。上述のように、ステップ210において行なわれる分類は一対多分類であり、任意の単一のデータ実体を1よりも多い対応する軸及びラベルにおいて分類することができる。ステップ210は、主観的情報及び注釈等の付加のような他の機能を含み得る。言うまでもなく、この形式の注釈、及び主観的評又は他の主観的入力の付加は、さらに後の段階で行なわれてもよい。ステップ210では、データ実体は、索引付け及び分類等と共に、IKBに記憶される。ここでの文脈では「IKB」との用語が用いられているが、この知識ベースは実際には、広範な形態を取り得ることが認められよう。IKBの特定の形態は、当該IKBが定義された特定のソフトウェア又はプラットフォームの指示に従っていてよい。本発明の手法は、IKBについて如何なる特定のソフトウェア又は形態にも限定されるものではない。
尚、IKBは一般的には分類情報を含むが、データ実体自体の全て若しくは一部、又は実体若しくは実体の部分の処理された(例えば索引付き又は構造化)形態を含み得ることを特記しておく。分類は、任意の適当な形態を取っていてよく、領域定義の構造的システムと、対応するデータ実体又は実体の部分との表形式の関連付けといった単純なものであってよい。
IKBの確立、又は一般的にはデータ実体の分類に続いて、ステップ214に示すように様々な検索を実行することができる。図10においてステップ194からステップ214に進む矢印は、ステップ214において行なわれる検索を、IKBに記憶されているデータ実体に対しても、又はIKBに記憶されていないデータ実体に対しても、実行し得ることを示すためのものである。すなわち、外部データベース、構造化されたデータ及び構造化されていないデータ等を含めてデータ実体の全般型ソースに対して検索を実行することができる。しかしながら、IKBが確立されている場合には、参照番号196において実行されるアクセスするステップは、IKBにアクセスしてステップ214におけるIKBのレコードを検索するステップに直接進む。次いで、ステップ216では、ステップ214で定義された検索、並びに関連付けされた規則及びアルゴリズムに基づいて、検索結果を提示する。この場合にも、これらの検索結果は、個々のデータ実体の分析を含めて広範な形態で提示されてもよいし、元の形態のデータ実体自体、又は何らかの強調を施された形態若しくは他の場合には操作された形態を含んでいてもよい。
検索結果、データ実体の選択、データ実体の分類又は領域定義若しくはその機能のその他任意の特徴の任意のもの又は全てに基づいて、領域定義、規則又は概念枠組の他の観点、及びこの概念枠組を分析するのに用いられるツールを、図10の参照番号94に全体的に示すように修正することができる。すなわち、例えば検索結果が包含過度又は包含不足であることが判明したら、領域定義を変更することができ、また同様に、データ実体の選択、データ実体の分類又は実体の分析に用いられる規則も変更することができる。同様に、分析がデータ実体同士の間で過剰な区別又は不十分な区別を設けるものと判明したら、これらの区別をステップ94で変更することができる。さらに、ある分野での発展等によって新たな概念的区別が認知され又は新たな属性が認知されたら、領域定義、並びに適用される規則及びアルゴリズム等の変更が生ずる。さらにまた、データ実体の分類について新たな規則及びアルゴリズムが開発され又は利用可能になったら、やはりステップ94での変更が生じ得る。かかる変更に基づいて工程全体を作り直すことができる。すなわち、付加的な検索を実行してもよいし、付加的なデータ実体をIKBに加えてもよいし、新たなIKBを生成してもよい。実際に、かかる変更は単に、IKBに既に存在しているデータ実体の再分類を生じ得る。
図11は、図10で述べた工程を、IKBを生成するために幾つかのテキスト・データ実体に適用したものとして線図で示す。図11の参照番号218で全体的に示されるIKB生成工程は、ひな形220で開始し、このひな形220は、領域を定義するのに用いられているひな形と全体的に類似しているか同一であってよい。上述のように、IKBの生成のための検索を、全ての軸、ラベル及びラベルの属性を含むように最初に定型化すると好ましい場合がある。しかしながら、所望があれば、ひな形は、図11のひな形220の拡大表示されたチェック・ボックス224によって示すように、軸又はラベルの幾つかを利用者が選択することを可能にするものであってもよい。次いで、軸及びラベルの幾つか又は全ての選択に基づいて、関連一覧226を用いることができる。関連一覧226は、図示の例では、特定のラベルの個々の属性の識別を、利用者定義型の特定の属性及び幾つかの選択規準と共に含み得る。例えば図11の図では、一例として、特定の属性はウェブ・ページ又は類似の技術分野に関わる単語である。図示の例での選択規準は、データ実体の識別に単語全体を用いるべきか単語全体よりも短い語を用いるべきか、参照番号234に示すように近接性評点を用いるべきか否か、及び参照番号236に示すように何らかの特定の閾値を用いるべきか否か等を含んでいる。当業者には明らかなように、テキスト型検索及び分類の場でも、多くのかかる選択規準を用いることができる。本発明の手法は、如何なるかかる選択規準にも限定されるものではない。さらに、属性の品質の形態で選択規準を用いることもできるし、或いはかかる規準を、選択及び分類工程に適用されるべき規則として具現化してもよいことを認められよう。
領域定義、又は利用者によって選択された領域定義の部分に基づいて、また用いられている場合には候補一覧のような入力に基づいて、図11の参照番号238によって示すように、データ実体の選択及び分類のために規則を適用する。図示の単純な例では、規則識別子240が様々な規則242と関連付けされている。さらに、図示の例では、規則の各々について関連性規準244を具現化することができる。前述のように、データ実体の選択及び分類のために所望の任意の規則を用いてよいことに留意されたい。テキスト文書の場合には、これらの規則は極く単純であってよい。しかしながら、より複雑な文書の場合、又はテキストと画像若しくはテキストと他形態のデータを分類目的で分析したい場合には、これらの規則は、テキストの選択及び分析のための規準と、画像のようなデータの他の部分の選択及び分析のための規準とを組み合わせたものであってよい。上でも議論したように、規則は選択及び分類工程を具現化したコードに含まれていてもよいし、コードにリンクされていてもよい。複雑なアルゴリズム、例えば画像分析及び分類のためのアルゴリズムが用いられる場合には、かかるアルゴリズムが過度に大規模になる場合もあるし、アルゴリズムへのリンクを最も効率的にして限定的にするように非常に控え目に用いられる場合もある。最後に、上でも述べたように、非テキスト文書では、選択及び分類の規則及びアルゴリズムは、軸、ラベル又は属性において参照される基本的な定義に対する何らかの許容性又は他の柔軟性を許すことにより、特徴の識別及び分類の両方を提供することができる。
次いで、領域定義、任意の候補一覧及び任意の規則等に基づいて、多様な可能なデータ実体246を含む全般型資源32にアクセスすることができる。次いで、領域定義、その属性及び規則は、参照番号248に示すように、IKBへの収容のためのこれら実体の部分集合の選択を可能にする。この具現化形態では、IKBへの収容のためにこれら実体を選択するばかりでなく、実行される場合には索引付け、並びに分析及びタグ付け等のような付加的なデータが実体に付随して、さらに詳細な分析、表現、選択及び検索等を可能にすると共に容易にする。
選択され分類されたデータ実体に対して行なわれる分析は、利用者の関心及びデータ実体の性質に応じて多岐にわたっていてよい。さらに、分類の前、分類の最中、及び初期分類の後でも、付加的な分析及び分類を実行することができる。図12は、データ実体の関心のある特徴の計算機支援式処理、分析及び分類のためのロジックを全体的に示す。参照番号250によって全体的に示されたこのロジックは、各々の実体に含まれるデータの取得から開始すると言える。前述のように、この工程は一般的には、かかる取得が先験的(ア・プリオリ)に実行されるものと仮定している。しかしながら、何らかの分析及び分類に基づいて、本発明の手法はまた、付加的なデータを取得することにより付加的なデータ実体を作成するように推奨することもできる。ステップ254では、上述のように、データにアクセスする。計算機支援式手法による後続の処理が、図12の参照番号256に全体的に示すようにデータのアクセスに続く。
前述のように、本発明の手法は、データ実体の計算機支援式検索、分析及び分類における動作の高レベルな統合を可能にする。これらの動作は一般的には、計算機支援式データ操作アルゴリズムによって、特に様々な形式のデータ実体を分析して分類するために実行される。幾つかのかかるアルゴリズムが開発されており、疾患の計算機支援式検出又は診断、及びデータの計算機支援式処理又は取得等のような様々な分野で比較的限定された用途に用いられている。しかしながら、本発明の手法では、新たに所在を突き止めたデータ実体を分析して分類するアルゴリズムと、IKBにおけるような既知の実体の後続の分析及び分類のためのアルゴリズムとの間の相互作用によって、さらに進んだレベルの統合性及び相互運用性が可能になる。この手法は、テキストと、画像及び音声ファイルと等のように、より複雑なデータ又はマルチメディア・データの先例のないアルゴリズムの組み合わせを利用している。
図12は、かかるアルゴリズムの相互運用性の全体像を掲げており、これらのアルゴリズムをここでの文脈では、計算機支援式データ操作アルゴリズム又はCAXと一般に呼ぶことができる。ここでの文脈でのかかるCAXアルゴリズムは、現状用いられているアルゴリズムに加えて構築することもできるし、付加的なデータ・ソース及びデータ実体、若しくはかかるデータ・ソース及びデータ実体を一体化したものを基礎として、又は特定形式のデータ実体の検索、分析及び分類のために、修正してもよいし全て構築してもよい。例えば図12の全体像では、CAXシステムの全体が、完全統合型システムに含まれ得る広範なステップ、工程又はモジュールを含むものとして図示されている。上述のように、かかる工程、機能又はモジュールの幾つか又は二、三のみが存在しているようなさらに限定された具現化形態も思量され得る。さらに、現状で想到される実施形態では、これらのアルゴリズム自体の適応構成又は最適化と、データ実体の分析及び分類のためのアルゴリズムによって管理されるデータによるデータ管理の適応構成又は最適化との両方を可能にするための情報を収集し得るようなCAXシステムをIKBの文脈において具現化することができる。個々のCAXアルゴリズムの様々な観点は、アルゴリズムに具現化されている規則若しくは工程を含めて変更してもよいし、或いは特定の規則を書いて、データ実体マイニング、分析及び分類工程時に呼び出してもよい。
多くのかかる計算機支援式データ操作アルゴリズムを思量することができるが、データ実体に対して特定の機能を実行する幾つかのかかるアルゴリズムを図12に示しており、これらの工程を参照番号256によって全体的に示す。図12にまとめたデータ操作ステップをさらに詳細に考察すると、ステップ258では、アクセスされたデータが、索引付け、冗長性検査、データの再整形及びデータの書き換え等のために全体的に処理される。当業者には認められるように、ステップ258において行なわれる特定の処理は、分析されているデータ実体の形式及び実行されている分析又は機能の形式に依存する。しかしながら、データ実体は、全般型ソース及びIKBを含めて上述したソースの任意のものから処理されてよいことを特記しておく。ステップ258では、同様に、データ実体の分析を行なう。この場合にも、かかる分析は、分析が行なわれるデータ実体の性質、実体内のデータ、及びアルゴリズムの性質に依存する。かかる処理では、例えば実体内又は実体間の幾つかの類似性又は差を識別することができる。次いで、かかるデータを提示のために表形式にしてカウントする等を行なうことができる。同様に、データ実体に対して統計学的な分析を実行して、実体内又は実体間の両方で関連性のような関係、類似度、又はその他任意の関心のある特徴を決定することができる。
かかる処理及び分析に続いて、ステップ260では、一般的な態様で関心のある特徴をセグメント分割して画定することができる。テキスト型データの特徴の認識は、特定の節及び術語を認識し、かかる節及び術語を強調して、文書の関係する部分を識別する等のように単純な動作を含み得る。画像データについては、かかる特徴セグメント分割は、特徴及び対象の境界又は輪郭の識別、コントラスト、輝度の識別、又は任意の数の画像型分析を含み得る。例えば医療文脈では、セグメント分割は、特定の解剖学的構造又は病状を画定し又は強調すること含み得る。但し、さらに一般的には、ステップ260において行なわれるセグメント分割は、データ同士の間の様々な関係及び相関範囲等を含めた任意の形式の特徴の境界を単純に見分けることを意図している。
かかるセグメント分割に続いて、ステップ262にまとめられているように、データにおいて特徴を識別することができる。かかる特徴識別は周知の手法に従って撮像データに対して行なわれ得るが、ステップ262で行なわれる特徴識別は、性質が遥かに幅広くてよいことに留意されたい。すなわち、本発明のシステムに統合され得るデータは広範囲であるため、特徴識別は、テキスト、画像、音声データ、又はかかるデータの組み合わせのようなデータの連合を含み得る。一般的には、特徴識別は、CAXアルゴリズムによって実行される工程にとって関心がある可能性のあるデータの間の任意の種類の相関の認識を含み得る。
ステップ266ではかかる特徴を分類する。かかる分類は典型的には、既知の条件について既知のプロファイルを有するセグメント分割された特徴におけるプロファイルの比較を含む。分類は一般的には、既知数のデータ・セットにおけるプロファイルを、考察されているデータ・セット又はデータ実体とマッチングさせるような属性、パラメータ設定及び値から得られるものであってよい。プロファイルは、ここでの文脈では、領域定義の軸及びラベル、又は所望があればこれらの部分集合についての属性の集合に対応していてよい。さらに、分類は一般的には、前述のような所望の規則及びアルゴリズムに基づいたものであってよい。これらのアルゴリズムは、この場合にも、領域定義並びに検索、分析及び分類ソフトウェアと同じソフトウェア・コードの一部であってもよいし、幾つかのアルゴリズムがソフトウェアにおける適当なリンクによって必要に応じて呼び出されてもよい。しかしながら、分類はまた、時間、空間及び人口等にわたる特定のデータ実体(1又は複数)についての傾向分析等によるノン・パラメトリックなプロファイル・マッチングに基づくものであってよい。
図12に示すように、分析及び分類中に実行される工程は、全般型資源32又は参照番号34に示すようなIKBに記憶されているデータ実体のいずれに基づくものであってもよい。図12にも示しているように、これらの工程は、前述した形式のひな形220を介した入力によって駆動され得る。分析及び分類の結果として、参照番号20に示すような表現が、利用者に対して一般的に示される。
データ実体の検索、識別、分析及び分類等のための本発明の手法は、決断工程を容易にすると共に強化することを特に意図している。これらの工程は、マーケティング決断、研究開発決断、技術開発決断、法的決断、財政投資決断、並びに臨床診断及び治療決断等のような広範囲の決断を含み得る。これらの決断及びその工程を図12の参照番号268にまとめている。前述のように、表現20に加えてこれらの意思決定工程に基づいて、分析及び分類アルゴリズム、データ実体及び領域定義等に対するさらなる精密化を図12の選択随意要素のブロック270に示すように施すのが順当であろう。当業者には認められるように、かかる精密化は、限定しないが、付加的なデータの取得、異なる条件下にあるデータの取得、データの特定の付加的な分析、データのさらに細かいセグメント分割又は異なるセグメント分割、特徴の代替的な識別、及びデータの代替的な分類等を含み得る。
前述のように、本発明の手法において、IKB等からのデータ実体の検索、並びにさらに詳細な識別及び分類を実行するために、付加的なインタフェイスを設けてもよい。図13は、IKBに記憶されている実体のようなデータ実体の検索を実行する全体像を示す。この全体像は、IKBの形成のためにデータ実体を検索して構造化した図11に示すものと類似していることが認められよう。図13に示す参照番号272によって全体的に示されている作業フローでも、軸及びラベルを含む領域定義の図形図を含む検索フォーム220をやはり用いる。この場合にも、属性、及び適当である場合には関連一覧を検索ひな形と組み合わせて、検索して分類したいデータ実体の特徴を定義することができる。このように、関連一覧226を用いて自動式検索及び分類を行なうことができる。次いで、利用者は、IKBを構成する構造化されたデータ実体において所在を突き止めたい特定の軸及びラベルを、記入済みひな形220を介して定義することができる。記入済みひな形、関連一覧226、及び参照番号238によって全体的に示されている規則に基づいて、IKBを検索する。すなわち、選択されて分類された実体248を検索して、検索に用いられた規準(ひな形、任意の関連一覧、及び適用可能な規則によって定義されたもの)に対応するデータ実体を識別し、適当である場合には再分類する。図13に示す実施形態では、検索結果は、検索ひな形に似たフォームを介して返される。しかしながら、ここで「フォーム画面」274として示されている表現では、各々のレコード又はデータ実体について所在を突き止めた軸及びラベルのみがひな形において強調されている。このようにすると、利用者は、分類手順において実行された一対多写像の根拠を速やかに識別することができる。一定数のかかるレコード276を返すことができ、各々のレコードは、所望があれば、前述のような書誌データ、主観的データ及び分類データ等を示す。
もう一つの具現化形態では、検索及び分析ステップにおいて所在を突き止めて構造化されたデータ実体に分類された特定の特徴又は属性についてデータ実体を強調することができる。図14は、一つのかかる具現化形態の例示的な作業フローを示す。参照番号278によって全体的に示されている図14のテキスト強調型具現化形態は、候補一覧280からの候補の特定の特徴の識別で開始することができる。参照番号282によって示される候補選択を一覧から行なって、個々の関心のある特徴を強調するために効率的な検索を行なうことができる。図14に示す具現化形態では、例えば文書ID欄284に対してテキスト検索を行ない、参照番号286に示すように単語を強調する。個々の単語は領域定義におけるラベルの個々の属性に対応することができ、このようにしてこれらの単語を図14の実体レコード画面288に示すように強調する。この具現化形態では、強調は、単語の色又は単語を包囲する背景色を変化させることにより行なうことができる。参照番号290、292及び294で示すように、異なる術語、又は例えば単一のラベル若しくは単一の軸に関連付けされた術語には、異なる強調を用いる。この場合にも、データ実体の分類(及び選択)の根拠は強調を参照することにより利用者に直ちに明らかとなる。当業者には認められるように、テキスト文書の比較的単純な例を図示しているが、同様の手法を広範なデータ実体形式に用いてよい。例えば、後に議論するように、画像データ、音声データ又は他のデータ、及びこれらの形式のデータの組み合わせを同様の態様で分析して強調することができる。例えば画像データを強調する場合には、関心のある特徴を包囲するブロック、関心のある特徴を指示するポインタ、及び関心のある特徴を指示する注釈等のような図形的手法を用いることができる。テキスト、画像、及び他の形式のデータを含むデータ実体を分析する場合には、これら強調するアプローチの組み合わせを用いればよい。
分析され分類されたデータ実体を評価するのに用いることのできるさらに他の表現としては、図15〜図22に示されたもののような様々な空間的表示等がある。図15に示す空間的表示(又はスプレイ)では、検索規準に対応しており検索規準に従って分類された一連のレコードのデータ中心型画面を視覚化している。空間的表示296は、領域定義の一対の軸298及び300を示すデータのマトリクス又はアレイの形態を取っている。表形式の概要302がこれらの軸及び各々の軸の個々のラベルに従っている。軸及び個々のラベルの交差部に対応するレコード又はデータ実体のカウント又は数が、カウント又はスコア数304によって示される。後にあらためて詳述するように、付加的な情報を各々の交差ブロックに表示してもよいことは言うまでもない。所望があれば、参照番号306に示すように、カウントをマウスでクリックするとドロップ・ダウン式のメニュー又は一覧を生成すること等により付加的な情報を表示してもよい。尚、図示の例は、多くの可能性の一つに留まることに留意されたい。他の可能性については後述し、システム設計者にとって利用可能な無数の選択肢の正式に一部となっている。この具現化形態では、例えば、列挙項目306からの個々の実体又はレコードに対し、付加的なリンクを設けて、レコード自体が列挙項目から利用可能となるようにすることもできる。列挙項目からのレコードの選択は、図13に示すもののようなフォーム画面、又は図14に示すような強調画面、又はデータ実体の全て若しくは一部の任意の同様の表現の表示を生じ得る。
空間的表示のさらに他の例を図16に示す。図16に示す表示は、レコード中心型空間的表示308と考えることができる。このレコード中心型表示は図15に示す表示と類似しているが、個々のデータ実体又はレコードの属性に対応するラベルの交差部を強調している。すなわち、例えば特定の知的財産権の所有会社のような特定の検索規準について返された一定数のレコードを、図16の右上がりの斜線で示すように、第一の色又は図形で強調することができる。第二の会社について返されたデータ実体に対応するレコードは、右下がりの斜線のような異なる態様で強調することができる。言うまでもなく、利用可能である場合には色のような他の図形的手法はさらに指示性があり分かり易い。この場合にも、強調は、交差ブロックの各々にある少なくとも一つのレコードが所在を突き止められたことを、強調された特徴(例えば所有会社)の各々について示すことができる。このように、空間的表示は、属性を有するものとして返されたデータ実体の間に交差が存在する位置、及びかかるレコードが返されなかった区域を容易に明らかにすることができる。このように、参照番号310及び312によって示す特定のレコード強調は、交差空間314での二つの中央ブロックの場合のように重なり合っていてもよく、各々のかかるブロック内の少なくとも一つのレコードが強調の一方の根拠又は他方の根拠に属することを示す。この場合にも、レコード列挙項目316のような付加的な図形的手法又は分析的手法を用いることができ、ここから特定のレコード又は画面にアクセスすることができる。
図17は、もう一つの空間的表示を示しており、この表示は異なる形式のレコード中心型表示と考えることができる。図17の表示では、軸298及び300がこの場合にも各々の軸毎に対応するラベルを付して示されている。次いで、各々のラベルの交差を示すブロックが与えられる。しかしながら、空間的表示の提示318では、各々の個々のレコード又はデータ実体毎に別々のブロックを与えることができる。かかるブロックを、参照番号320、322及び324に示す。次いで、構造化されたデータ実体の内容に基づいて、個々の交差ブロックは、あるレコードが軸ラベル属性を含んでいるか否かを指示することができる。例えば、図示のデータでは、データ実体320、322及び324は、ラベルIIAに対応する属性を共有していないが、実体322及び324はラベルIC/IIBにおいて交差を共有している。この場合にも、データの提示によって、データ実体の唯一性又は特殊性、及び類似性の識別が容易になる。
幾分類似した空間的表示を図18に示す。図18に示す形式の空間的表示は、特定の財産権の所有会社のような特定の関心のある特徴についてのものと考えることができる。その他任意の適当な特徴を表示を生成するために用いてよいことは言うまでもない。図示のように、軸及びラベルはこの場合にも、表形式形態で示されているが、参照番号320、322及び324に示すように、特定の関心のある特徴を個々の交差ブロックに呼び出している。例として述べると、会社比較の場合には、縦列320、322及び324の各々が、交差ブロックの各々において会社の各々によって所有されている権利の数に対応していてよい。従って、分析は、各々の所有会社の相対的な根拠に基づく強さ及び弱さを指示しており、観察者にとっては明らかである。例として述べると、図示の例では、会社322は、交差空間IC/IIBでは幾分優位に現われているが、交差空間IB/IIBでは会社320と共に弱く現われている。
空間的表示のさらにもう一つの説明例を図19に示す。図19は、異なる形式のレコード又はデータ実体中心型画面と考えることができる。この場合にも、軸298及び300が示されている。一定数のデータ実体又はレコード320、322及び324も、表形式形態で示されている。しかしながら、ここでは、軸298、300及び任意の付加的な軸330について、データ実体の内容に基づいて分類を行なった個々のラベルを、示されているような全ての対応と共に図示している。このようにして、利用者は、如何にして、また何故に幾つかのレコードが返されたのか、如何にして幾つかのレコードが構造化され分類されたのか、及び各々のデータ実体レコードの一対多写像の根拠を容易に見分けることができる。
空間的表示のさらにもう一つの例を図20に示す。図20の表現では、空間的表示332は、領域定義の各々の軸334に対応するタイル型図形空間に示されており、個々のラベル336が各々の軸について呼び出されている。各々のラベルは、ブロック又は区域338に表示されている。図示の例では、各々のラベルの属性に対応するデータ実体の数のカウント又は積算合計340がそれぞれのブロックに与えられている。参照番号342によって全体的に示された背景は、彩色されてもよいし、特定の図形を背景に用いて、個々のラベルの属性に対応するデータ実体のレベル又は数を示してもよい。さらに、図示の例では、挿入図344が掲げられており、知的財産権の所有会社のような特定の特徴に対応するデータ実体というような特殊な意味を有し得る。この場合にも、その他任意の適当な意味を背景又は挿入図344のいずれに付与してもよい。さらに、多くのかかる挿入図又は他の図形的ツールを用いて特殊な関心のある特徴を呼び出してもよい。
図示の例では、提示されたデータの理解を強化するために用いられる特定の色又は図形についての凡例346を掲げている。図示の例では、例えば、異なる色を特定のラベルの属性に対応するデータ実体の数に用いることができ、凡例の挿入図348にカバーを呼び出している。背景及び各々のラベルの挿入図の意味を説明するために、例えば参照番号350に示すような付加的な凡例を掲げてもよい。このようにして、様々な形式の図形を組み入れた極めて複雑で洗練されたデータ提示ツールを、構造化されたデータ実体の分類に基づく分析及び意思決定工程に用いることができる。適当である場合には、上述のように、データ実体レコード列挙項目352のような付加的な特徴を設けて、利用者が特定の軸、ラベル、属性又はその他任意の関心のある特徴に対応するデータ実体を「掘り下げる」ことを可能にしてもよい。
図21は、図20の基本的空間的表示に付加的な説明的図形を関連付けたものを示している。例えば図21の図では、所有会社数のようなカウント、又はその他任意の関心のある特徴によって個々のデータ実体を分類するための挿入図又はメニュー、図形及びリンク付き表示等のような幾つかの特定の特徴の図形的表現を示すことができる。例えば参照番号354の挿入図では、利用者は、データ実体の数を第一の軸Iの個々のラベルに対応する図形的書式356として表示することができる。図示のように、例えば関心のある会社(「会社1」)が個々のラベルIA〜IFに対応する一定数のデータ実体を有するものとして示されており、個々のデータ実体又はレコードのカウントが図形的棒グラフとして表示され、この棒グラフでは、軸358に沿って示されている各々の個々のラベルについてデータ実体の数又はカウントが示されている。カウントは、この例では棒360によって表わされ得る。同様に、次いで、図21の図形的表示362によって示すように、個々のラベルについて、異なる会社(例えば「Co1」、「Co2」、「Co3」)毎にデータ実体の数を表示することができる。次いで、会社指定を軸366に沿って示すことができ、棒368によってカウントが示される。そして、図形的表現364は、個々のラベルについて各々の会社によって所有されている権利の数の指標を与えている。この場合にも、その他任意の特徴をかかる分析及び表示のために提供してよい。
図22は、対話型コンピュータ・インタフェイスを介して具現化することのできるもののような分析され分類されたデータ実体の表現の対話型空間的表示の一例を示す。対話型表現370は、図示の例では、超領域374の最上位レベル画面を含んでいる。前述のように、かかる指定は幾分任意であってよく、データ実体について定義されているような分類のレベルを単に示すに過ぎない。図22に示すように、この超領域は幾つかの個々の領域376を含んでおり、各々の領域が一連の軸378を含んでいる。前述のように、超領域の定義及び領域の定義において、各々の軸が、構造データ実体を分析して分類するための個々の属性又は関心のある特徴と関連付けされている。次いで、図形的表現の超領域と共に提示されたら、画面380によって示すように、利用者は個々の領域又は軸まで「掘り下げる」ことができる。図示の具現化形態では、軸IAを選択することにより、画面380を生成し、この画面では選択された軸の個々のラベルが拡張された挿入表384に表示される。この挿入表は、参照番号386に示すようにラベルを示しており、これらのラベルに対応するデータ実体のカウント又は積算数のような付加的な情報を表示することができる(図22には示されていない)。この場合にも、図22の参照番号388によって示すように、ラベルの各々が属性に関連付けされている。属性はラベルと共に表示されてもされなくてもよいが、データ実体の選択及び分類が行なわれた根拠の指標として利用者にとってアクセス可能とすることができる。図22の具現化形態でも、他の領域の個々の軸は参照番号382に示すように収縮されていてよい。上のその他の空間的表示について述べたように、レコード列挙項目390のような他の図形を掲げて、利用者がデータ実体、データ実体の部分、及びデータ実体の概要等を観察することを可能にしてもよい。上でまとめたようなグラフ形式画面、表形式画面又は強調型画面のような他形式の図形的表現を提供してもよいことは言うまでもない。
以上の議論の全体にわたって述べたように、任意の適当な形式のデータ実体を検索し、分類し、分析するために本発明の手法を用いることができる。一般的には、テキスト実体、画像実体、音声実体、及びこれらの組み合わせを含めた幾つかの形式のデータ実体が現状で思量されている。すなわち、特定のテキストのみの実体の場合には、単語選択及び分類手法、並びに単語及びテキストに基づく手法を、図形的情報及び主観的情報等を示すテキストと共に用いることができる。画像実体の場合には、計算機支援式分析手法、計算機支援式特徴認識手法、及びセグメント分割、分類のための手法等を含めて広範な画像分析手法が利用可能である。
医療診断撮像におけるような特定の領域では、これらの手法はまた、画像データの評価を可能にして、可能性のある疾患状態を分析して分類する、疾患を診断する、治療を示唆する、画像データのさらに他の処理又は取得を示唆する、及び他の画像データの取得を示唆する等を行なうことができる。添付された書誌情報に存在するテキスト型情報のようなテキストと画像データとの組み合わせを含む画像において本発明の手法を用いることができる。当業者には明らかなように、医療撮像のような幾つかの環境では、標準的なDICOMヘッダのような画像データに添付されたヘッダは、ソース及び画像形式、日付、並びに人口統計学的情報等に関する実質情報を含み得る。本発明の手法に従ってこの情報の任意のもの及び全てを分析し、このようにして構造化して、分類及びさらに詳細な分析に供することができる。かかる分析及び分類に基づいて、データ実体を、構造化された形態、半構造化された形態又は構造化されていない形態で統合型知識ベース又はIKBのような知識ベースに記憶させることができる。当業者には明らかなように、本発明の手法は、このように、財務分析、疾患の認知、治療の認知、関心のある人口統計学の認知、目標市場の認知、リスクの認知のような目的での複合型データ・セットの統合型分析、又はデータ実体の間に存在している可能性があるが非常に複雑であるか不明瞭であるため他の場合であれば認知が難しいようなその他任意の相関付けを含めて、無数の有利な用法を可能にする。
図23、図24及び図25は、以上に述べた手法の画像データへの応用を示しており、特にテキスト・データに関連付けされた画像データを示す。図23に示すように、画像/テキスト実体処理システム392は、参照番号394に示すように、前述の手法の概略に全体的に従うが、画像ファイル及びテキスト・ファイルで開始することができる。この場合にも、これらのファイルに対応するデータ実体は、単一のファイルに含まれていてもよいし、多数のファイルに含まれていてもよいし、或いは画像データに基づく注釈等についてファイル同士の間にリンクを設けてもよい。次いで、一般的には、各々の実体は、テキスト・セグメント396及び画像セグメント398を含む。テキスト・セグメント396は、テキスト400の1又は複数の文字列の形態の構造化されたデータ、構造化されていないデータ又は主観的データを含み得る。画像セグメント398は、画像ヘッダ内のテキスト・データのような書誌データ402、及び画像内容データ404を含み得る。画像内容データは典型的には、画像ピクセル・データ、ボクセル・データ及びオーバレイ・データ等の形態となる。一般的には、画像データ404は、所望の再構成手法による視覚的画像406又は一連の表示用画像の再構成を可能にするのに概略十分なものであればよい。当業者には明らかなように、特定の再構成手法は一般的には、画像データの性質、及びデータを取得したイメージング・システムの形式等に従って選択され得る。
これらのデータ実体は前述の形式の処理システム14に供給される。一般的には、複合型データ実体に対して、前述の処理の全て、特に図10及び図12に関して説明した処理を実行することができる。これらの処理手法によれば、参照番号38に示すように、領域定義、及び領域定義によって定義される規則又はアルゴリズムに従って、テキスト内、画像内、及びテキストと画像との間の両方で特定の関心のある特徴をセグメント分割し、識別し、フィルタ処理し、処理し、分類する等を行なうことができる。次いで、複合型データ実体に対して行なわれる処理に基づいて、得られた構造化されたデータを任意の適当な記憶装置40に記憶することができ、参照番号34に示すような統合型知識ベース又はIKBを生成することができる。やはり前述したように、データ実体の各々に対して行なわれる一対多写像に基づいて、テキスト、画像又はこれら両方の個々の関心のある特徴について同様の検索を実行することができる。図23は複合型データ実体としてテキスト・ファイル及び画像ファイルを表わしているが、データ実体は、テキストと音声データ、音声データと画像データ、テキストと音声データと画像データ、若しくは波形データのようなさらに他の形式のデータ、又はその他任意の形式のデータを含み得ることを特記しておく。
複合型データ実体に対して行なわれる特定の画像/テキスト実体処理408を図24に全体的に示す。前述のように、テキスト・データ410(図24では強調画面で示す)及び画像データ412は、個々のテキスト規則及びアルゴリズム414、並びに個々の画像規則及びアルゴリズム416に従って分析され分類されている。但し、分類及び写像のための規則及びアルゴリズムの幾つかは、テキスト・データと画像データとに基づく規準を含み得ることを特記しておく。例えば、利用者は、画像データにおいて可視であるがテキスト分析によってのみ見分け得るような特定の被検体群についての関心のある特定の解剖学的特徴に格別の関心を抱く場合がある。かかる組み合わせ型分析は、強化型分類及び写像のための強力なツールを提供する。次いで、領域定義12に基づいて、図24のブロック210に示すように写像を行なって結果を与え、次いで、これらの結果をIKB34に記憶させることができる。
複合型データ実体の分析及び分類に加えて、図25に全体的に示すように、前述した手法の全てを、テキスト、画像、音声、及び他形式のデータを含む複合型データ実体に用いることができる。図25は、テキスト・データ単独について上で述べたものと同様のテキスト/画像組み合わせデータについての例示的なフォーム画面を示す。図25に示す画面420に掲げられている概要では、書誌情報が主観的情報及び分類情報と共に掲げられていてよく、全て参照番号422によって全体的に示されている。しかしながら、ここでは、参照番号424に示すもののような画像データの分析についての付加的な情報を画像表現と共に提供することができる。適当である場合には、実際の画像、注釈付き画像、又は付加的な主観的データ若しくは書誌データへのリンクを与えてもよいことは言うまでもない。
前述のように、本発明の手法は、分析及び分類が可能な任意の適当なデータ実体に応用され得る。一つの例示的な具現化形態では、この手法は、特許文献及び出願を調査し、分析し、構造化し、分類するのに応用される。かかる文書は、商用のコレクションから入手される場合は特に、頭書(例えば標題、要約書、フロント・ページ、請求項等)への文書の下位区分のような構造を含んでいる。関心のある文書の識別及び分類のためには、関連データ領域を先ず定義する。軸は、撮像モダリティ、幾つかの形式の画像についての臨床的用途、及び画像再構成手法等のように主題又は技術分野に関わっていていよい。次いで、各々の軸のラベルを軸トピックに下位分割して、技術的概念のマトリクスを形成する。次いで、単語、技術用語及び句等をラベルの属性として各々のラベルと関連付けする。近接性規準、及び単語全体又は部分単語規則等を含めて、類似した用語の認識のための規則及びアルゴリズムが確立され又は選択される。任意の適当なテキスト分析規則を用いることができる。
これらの領域定義及び規則に基づいて、入手可能なデータベースから特許ファイル及び特許出願ファイルにアクセスする。出願人及び発明者等の識別等のために、文書の構造を、かかる構造が領域定義として具現化されている場合には利用することができる。書誌データ・フィールドを記入する等のために、領域定義によって用いられない文書に存在する構造を利用することもできるし、領域定義に関係しないと看做されるのであればかかる構造を無視することもできる。一方、構造化されていない文書のデータを、全体的に構造化されていない区域(例えば章節テキスト、要約書テキスト等)に見出される文書の各節の用語を識別する等によって、構造化することもできる。後に行なわれる検索及び分類を容易にするために、文書に索引付けしてもよい。
次いで、文書を領域定義に写像して、一対多分類を確立する。この分類は、任意の特定の文書を多数の異なる軸/ラベル連合に配置することができる。次いで、文書に対して、特定の話題の組み合わせに関する文書、特定の法的権利保持者に譲渡された文書、及びこれらの組み合わせについての検索のような多くのリッチ形式の分析を実行することができる。関連付けされた用語及び属性を有する軸及びラベルのマトリクスは、膨大な数の文書の部分集合を、特定の検索における軸及び/又はラベルの適当な組み合わせの選択によって定義することを可能にする。
もう一つの例示的な具現化形態では、医療診断画像ファイルを分類することができる。かかるファイルは典型的には、画像データ及び書誌データの両方を含んでいる。医師による主観的データ及び注釈等が含まれている場合もある。この例では、利用者は、特定の解剖学的構造、特定の疾患状態、治療、人口統計学データ、及びその他任意の関心のある関連カテゴリに対応する軸を有する領域を定義することができる。この場合にも、ラベルが軸を論理的に下位分割し、属性が各々のラベル毎に指定される。テキスト・データの場合には、属性は、前の例で説明したように、用語、単語及び句等であってよい。しかしながら、画像データについては、画像データのアルゴリズム式分析のみを通じて識別可能な属性のように、一連の複雑で強力な属性を定義することができる。これらの属性の幾つかを計算機支援式診断(CAD)及び同様のプログラムによって分析することができる。前述のように、これらの属性は領域定義に埋め込まれていてもよいし、画像データを分析して分類したいときに必要に応じて呼び出されてもよい。
尚、この形式の具現化形態では、テキスト、画像、音声、波形及び他の形式のデータを独立に分析することもできるし、分類の複合的な組み合わせを定義することもできることを特記しておく。次いで、実体が一対多写像によって分類される場合には、リッチ型分析を実行して、画像データから見分けられる特定の特性又は疾患状態を呈し、他の方法ではテキスト・データ若しくは他のデータ又はかかるデータの組み合わせからのみ見分けられる幾つかの類似性又は対照を有する人口を突き止める等を行なう。
これらの例の両方で、任意の具現化形態において、前述の分析及び提示手法を用いることができ、特定の形式の実体に適応させることができる。例えば、特許のようなテキスト文書を、幾つかの関係する単語又は句を強調して強調画面に表示することができる。画像も、関心のある幾つかの特徴又は部位について色を変化させるか、又はポインタ及び囲み枠等のような図形的ツールの利用等を介して強調することができる。
前述のように、領域定義によって表わされる概念枠組は、実体の多様なデータ形式、特徴形式及び特性等に対する参照を含み得る。図26は、幾つかのかかる組み合わせを線図で示す。図26では、組み合わせ型マトリクスを参照番号424によって全体的に示す。すると、概念枠組は、一方での軸22、ラベル24、関連一覧(属性の)26として述べた特徴及び特性、並びにデータ実体32、246、248と、他方での様々な形式のデータとの間の交差を定義するものと考えることができる。図26では、データの形式又は性質は参照番号426によって全体的に示されており、データ実体において見出されるか又は存在する定義された特性(領域定義によって)は参照番号428によって表わされている。
図26に示すように、現状で思量されているデータ形式は、テキスト・データ430、画像データ432、音声データ434、動画データ436及び波形データ438を含む。しかしながら、データは、参照番号440によって示すようなこれらの組み合わせ、及びここには示していない他のデータ形式を含み得る。例えば、画像は、形態、表面、エッジ、テクスチャ、色、又は識別することができ(視覚的に又はアルゴリズムによって)任意の形式の参照を受けるその他任意の特定の特徴、並びにテキスト・データのような他のデータを含み得る。例えば幾つかの文脈では、かかるテキスト・データは、画像において可視であるか又は検出可能であってもよいし(注釈及び日付スタンプ等から)、他の文脈では、データは画像には現われないで、画像を再生するのに用いられる符号体系化されたファイルの一部であってもよい。同様に、特徴の特定の組み合わせが波形、音声データ及び動画データ等に存在していてもよい。
次いで、データ形式426と特性428との間に対応又は交差空間444が存在することを銘記しておくことは重要である。さらに、この交差空間は、領域定義及びデータ実体自体の両方で関心のある特徴又は特性を直接参照することによりリッチ化することができる。本発明の手法はこのようにして、テキストによる定義の制約から利用者を解放し、検索、分類、並びに固有の「形式特有語(type vernacular)」において見出される実際の特徴及び特性についての上で述べたその他機能の統合を強化する。
図27は、画像における特徴のこの形式の定義の一例を示す。図27に示すように、軸22は幾つかの画像ラベル446、448、450及び452を含んでいる。図示の例では、ラベル446は、円454の外観を全体的に有する。続くラベル448、450及び452はそれぞれ、円458の内部の1個の円、円462の内部の2個の円、及び円466の内部の3個の円という外観を有する。
図27はまた、各々のラベルに写像されるべきデータ実体について期待され又は受け入れられる属性の関連一覧26を表わしている。例えば、参照番号456で表わされているように、円454に全体的に類似した様々な形態及び外観を有する実体456は、ラベル446に写像され得る。同様に、ラベル448、450及び452の画像458、462及び466によって定義される他の画像又は画像特徴の変化形は、それぞれ変化形画像460、464及び468によって全体的に表わされているように、これらのラベルに写像され得る。
当業者には認められるように、多くの仮想的用途が、前述のような検索及び処理のために画像特性を直接定義する能力によって構成され得る。例えば、図示の実施形態では、医用画像を検索して、部位の数によって腫瘍発生について写像することができる。異なる文脈では、要素、解剖学的構造、物品、及び定義を与えられるその他任意の特徴を見出すことができる。かかる可能性は、少しだけ挙げると、武器、顔貌及び乗物等のような特徴を含めて任意の有用な特徴に拡張することができる。また、関連一覧を用いてラベルに対する所望の任意の変化形を含めるか又は除外して、対応する特徴の「語彙」を、やはり画像データ実体の「形式特有語」として実効的に作成し得ることを特記しておく。
図28及び図29はそれぞれ、波形ファイル及び音声ファイルについて、他の軸のラベルの同様の定義を表わしている。図28に示すように、ラベル470及び472を、例えば正常なEKG波形及び異常なEKG波形等に対応する波形474及び478について定義することができる。これらの波形の各々について、関連一覧は、参照番号476及び480によって全体的に表わされているように、関心のある目標波形の変化形である属性を含み得る。
同様に、図29に示すように、音声ラベル482及び484を音声486及び490について定義することができる。尚、音声は視覚的インタフェイスには容易には馴染まないので、領域及び実体と人間との相互作用を容易にするために波形又は任意のアイコン的表現を表示し得ることを特記しておく。実際には、この表現は、該当単語が音声データにおいて見出されるのであれば単にテキスト型術語(「癌」又は「スミス先生」等)を含んでいれば十分である。但し、音声ファイルの定義は、単語に対応する音声に一切限定されないことに留意されたい。寧ろ、定義及び認知を受ける一般に任意の音声又は音声の組み合わせを指定してよい。次いで、関心のある音声特徴の形態であってもよいし変化形であってもよい属性が、属性488及び492によって定義される。
実際の具現化形態では、かかる「形式特有語」型特徴の任意の組み合わせを、軸、ラベル及び属性について参照することができる。例えば、癌性腫瘍の検索において、軸は、「癌」という単語、又は任意の同語源の単語若しくは関連単語を含むテキスト実体の写像を生じ得るラベルを含み得るが、また、癌の形態を示すのに役立つ画像、及び癌に言及しているか癌を示している音声ファイル又は動画ファイルの写像を生じ得るラベルも含み得る。前述のように、同じラベル定義の範囲内の異なる「形式特有語」属性、及び異なる形式(例えば画像)を根本的に有するデータ実体において見出される一形式(例えばテキスト)の属性等について、より低いレベルの統合を用いてもよい。
説明のために述べると、以下は、かかる多形式領域定義を如何にして一つの医療診断文脈において用い得るかの一例である。肺疾患の評価において、2002年に国際労働機関(ILO)によって推奨された分類システムは、指針及び二組の規格フィルムを含んでいた。これらの規格フィルムは異なる形式及び異常度を表わしており、分類工程時に被検体フィルムと画像とを比較するために用いられる。このシステムは、炭坑労働者塵肺、硅肺症状及び石綿症を含めて異なる塵肺に関連付けされた特徴の性質及び範囲を記述することを目的とする。このシステムは、実質組織異常(小さい影及び大きい影)、胸膜変化、並びに他の関連する特徴又は場合によっては職業病肺疾患と混同される特徴を扱う。
このILO2002システムの表明では、読影者は先ず、フィルム品質を等級分けすることを求められる。次いで、形状及び大きさに従って小さい影をカテゴリー分けすることを求められる。小さい丸い影の大きさはp(1.5mmまで)、q(1.5mm〜3mm)又はr(3mm〜10mm)と特性分けされる。不規則な小さい影は幅によってs、t又はu(小さい丸い影と同じ大きさ)と分類される。小さい影の量(頻度)は4点の大範疇尺度(0〜3)で分類され、各々の大範疇が三つずつに分割されて、0/−〜3/+の12点尺度となっている。大きい影は、画像に存在する1cmよりも大きいあらゆる影と定義される。大きい影は、カテゴリーA(合計径が5cmを上回らない1又は複数の大きい影)、カテゴリーB(合計径が5cmよりも大きいが右上肺野相当域を上回らない大きい影)、又はカテゴリーC(Bよりも大きいもの)に分類される。胸膜異常も位置、幅、範囲及び石灰化度について評価される。最後に、胸部放射線画像のその他異常特徴についてコメントを加えることができる。
上述の領域定義手法、具体的には画像文脈においてはラベル及び属性の直接定義は、ILO2002システムを具現化するように医用画像をソートして分類するのに特に好適である。具体的には、影の様々な形態、大きさ及びカウントを、分類を直接の目的として、軸、ラベル又は属性として指定して表現することができる。また、上述のように、「概念的ズーム」を可能にするような領域を設計して、疾患発生の様々な形式及びカテゴリーを先ず認識し、次いで分析することができる。
もう一つの例示的な医療診断の具現化形態が、神経変性疾患の評価において考えられる。かかる障害は典型的には、検査の初期段階で検出することは困難である。一般的な診療では、SPECT及びPETのような何らかの撮像系列においてトレース剤を用いて、正常な被検体に対する認知能力の退行を指示する脳血流の変化又は大脳皮質野の代謝率の変化のいずれかを決定する。神経変性障害(NDD)の検出の主要要素は、年齢分けした正常データベースの開発である。但し、これら正常体に対する比較は、Talairach又はNMIのような標準化された領域においてのみ行なわれ得る。従って、位置合わせ手法を用いてデータをこの標準的な領域に写像しなければならない。
一旦、比較が行なわれたら、利用者に対し、疾患の診断を下すための解剖学的構造の統計学的偏差画像を表示する。このことは極めて特殊化された業務であり、高度に熟練した専門家によってのみ行なわれ得る。これらの専門家でも、疾患の重症度について主観的な判断を下し得るに留まる。例えば、一つのNDD(アルツハイマー症)についての重症度への疾患の分類は軽度、中程度又は重度である。最終的な判断は、偏差画像の判定に基づいて読影者によって下される。
前述の領域定義及び写像手法はここでも、NDDを潜在的に示している画像のための自動式又は半自動式読影システムの具現化に好適である。例えば、疾患又は疾患の相対的な段階の主観的診断について専門家によって現在参照されているものと同じ標準的な画像又は画像特徴を、軸、ラベル、属性又はこれらの組み合わせとして具現化することができる。さらに、患者の画像の特徴に基づく領域定義並びに後に行なわれる分析及び写像(診断)を、画像自体のコンテクスト又は特有語で行なうこともできる。
本書では本発明の幾つかの特徴のみを図示して説明したが、当業者には多くの改変及び変形が想到されよう。従って、特許請求の範囲は、本発明の要旨に含まれるような全ての改変及び変形を網羅するものと理解されたい。また、図面の符号に対応する特許請求の範囲中の符号は、単に本願発明の理解をより容易にするために用いられているものであり、本願発明の範囲を狭める意図で用いられたものではない。そして、本願の特許請求の範囲に記載した事項は、明細書に組み込まれ、明細書の記載事項の一部となる。
本発明の手法の諸観点によるデータ実体の識別、構造化、写像及び分類のシステムの全体像の線図である。 図1に示すもののようなシステムで用いることのできる例示的な領域定義ロジックの流れ図である。 領域定義に基づく実体処理ロジックの流れ図である。 図3のロジックを介して実行されるデータ実体の例示的な写像の線図である。 本発明の手法の諸観点に従って具現化することのできる関係する領域及び領域レベルの線図である。 データ実体の構造化、写像、分類及び分析を容易にするために具現化される多段レベルの領域定義の線図である。 本発明の手法の諸観点によるプログラムされたコンピュータと共に用いられる例示的な領域定義ひな形の図である。 図7のひな形によって定義される領域の軸及びラベルを定義する例示的なひな形の図である。 領域の軸及びラベルについてデータ実体属性を定義するための例示的なインタフェイスの図である。 データ実体の検索及び分類、並びにかかる検索及び分類に基づくIKBの確立の例示的なロジックを示す流れ図である。 本発明の手法による領域定義及び規則を用いて如何にして実体の集合をIKBに写像し得るかを示す線図である。 データ実体の分析及び分類のために実行することのできる幾つかの処理ステップを示す線図である。 IKBのような既知の場において関連のあるレコード又はデータ実体を識別する一つの例示的な工程を示す線図である。 概念枠組としての領域定義に基づいて強調したテキスト文書のような分析された一組のデータ実体の一つの例示的な図である。 一組のデータ実体に見出される属性又は領域定義の概念枠組の部分の間の対応を識別するように、一組のデータ実体に対して実行される分析のさらに他の図である。 特定の属性を有する実体の間の対応の重なり又は交差を示す一連のデータ実体の分析を示す例示的な図である。 領域定義、又は分析的枠組若しくは概念枠組の部分について、一連のレコード又はデータ実体に対して実行される分析を示すさらに他の例示的な図である。 所有者のような他の規準による分類を示す一連のデータ実体に対して実行される分析を示すさらに他の例示的な図である。 レコード自体(すなわちデータ実体)によるデータ実体の分析及び分類を示すさらに他の例示的な図である。 領域定義の概念枠組による実体の積算カウントを示す一連のデータ実体について分析されるデータを示すさらに他の例示的な図である。 図20に示したものと類似しているが、分析され分類されたデータ実体に基づいて得ることのできるデータの例示的な他の表示を示すデータ実体の例示的な分析を示すさらに他の図である。 領域定義及びこの領域定義と関連付けされた概念枠組に基づくデータ実体の分析及び分類のさらに他の対話型表現を示す線図である。 画像データ・ファイル及び関連付けされたテキスト・ファイルに対し、かかるファイルのIKBのようなデータベースの確立のために適用される領域定義、検索、分析、写像及び分類の手法を示す線図である。 本発明の手法の諸観点によるファイルの分類及び写像について、画像ファイル及びテキスト・ファイルの分析、写像及び分類のための例示的な作業フローのさらに他の線図である。 図23及び図24の各工程に従った画像ファイル及びテキスト・ファイルの分析の一連の概要の例示的な表示を示す図である。 データ実体において定義され、検索され、所在を突き止められ、写像され得る例示的な特徴形式又は特性形式のマトリクスを示す線図である。 画像及び画像内の特徴によって定義されるラベルを有する例示的な軸を示す線図である。 波形を参照することにより定義されるラベルを有する例示的な軸を示す同様の線図である。 音声特徴を参照することにより定義されるラベルを有する例示的な軸を示す同様の線図である。
符号の説明
10 データ実体写像システム
12 領域定義
14 処理システム
16 データ資源
18 編集自在型インタフェイス
20 画面
22 軸
24 ラベル
26 属性
28 構造化されたデータ実体
30 構造化されていないデータ実体
32 「全般型」ソース
34 統合型知識ベース(IKB)
36 他のソース
38 規則及びアルゴリズム
40 記憶装置
42 領域定義インタフェイス
44 規則定義インタフェイス
46 検索定義インタフェイス
48 結果視覚化インタフェイス
50 ワークステーション
52 ロジック
54 第一の段階
56 第二の段階
80 データ実体処理ロジック
96 写像
98 領域定義
100 ラベル・レベル
102 データ実体の属性
104 軸レベル
106 ラベル・レベル
108 「属性」レベル
110 超領域
112、114、116、118 領域
120 下位領域
122 領域定義ひな形
124 書誌データ区画
126 主観的データ区画
128 分類データ区画
130 実体フィールド
132 実体識別フィールド
134 標題フィールド
136 追加フィールド
138、140 データ実体の出典
142 状態フィールド
144 一般概要フィールド
146 選択
148 実体識別フィールド
150 評者識別フィールド
152 主観的評点フィールド
154 品質識別フィールド
156 コメント・フィールド
158 仮想的ボタン
160 選択ボタン
162 軸選択ブロック
164 ラベル選択ブロック
166 ヒント窓
168 インタフェイス
170 軸名称フィールド
172 ラベル・フィールド
174 ヒント・テキスト
176 単語の定義のためのフィールド
178 正確な単語の定義のためのフィールド
180 単語入力フィールド
182 選択
184 属性の削除及び修正ブロック
186 ロジック
218 IKB生成工程
220 ひな形
224 チェック・ボックス
226 関連一覧
228 属性の識別
230 特定の属性
232 単語全体か否かの選択規準
234 近接性評点
236 閾値
238 規則
240 規則識別子
242 規則
244 関連性規準
246 可能なデータ実体
248 データ実体の部分集合
250 ロジック
256 計算機支援式処理
272 作業フロー
274 フォーム画面
276 レコード
278 テキスト強調型具現化形態
280 候補一覧
282 候補選択
284 文書IDフィールド
286 強調された単語
288 実体レコード画面
290、292、294 強調
296 空間的表示
298、300 領域定義の軸
302 概要
304 スコア数
306 付加的情報
308 レコード中心型空間的表示
310、312 レコード強調
314 交差空間
316 レコード列挙項目
318 レコード中心型空間的表示
320、322、324 ブロック
326 関心のある特徴についての空間的表示
328 レコード又はデータ実体中心型空間的表示
330 付加的な軸
332 タイル型空間的表示
334 軸
336 ラベル
338 ブロック
340 データ実体の数
342 背景
344 挿入図
346 凡例
348 凡例の挿入図
350 付加的な凡例
352 データ実体レコード列挙項目
354 挿入図
356 図形的書式
358 軸
360 棒
362 異なる会社についての図形的表示
364 図形的表現
366 軸
368 棒
370 対話型表現
372 最上位レベル画面
374 超領域
376 領域
378 軸
380 画面
382 収縮させた軸
384 挿入表
386 ラベル
388 属性
390 レコード列挙項目
392 画像/テキスト実体処理システム
394 画像ファイル及びテキスト・ファイル
396 テキスト・セグメント
398 画像セグメント
400 テキスト
402 書誌データ
404 画像内容データ
406 視覚的画像
408 画像/テキスト実体処理
410 テキスト・データ
412 画像データ
414 テキスト規則及びアルゴリズム
416 画像規則及びアルゴリズム
420 フォーム画面
422 書誌情報、主観的情報、分類情報
424 (図25)画像データ
424 (図26)組み合わせ型マトリクス
426 データ形式
428 特性
430 テキスト・データ
432 画像データ
434 音声データ
436 動画データ
438 波形データ
440 組み合わせ
442 その他形式のデータ
444 交差空間
446、448、450、452 画像ラベル
454、458、462、466 円
456、460、464、468 変化形画像
470、472 ラベル
474、478 波形
476、480 属性
482、484 音声ラベル
486、490 音声
488、492 属性

Claims (6)

  1. 複数の分類軸(22)及び各々の軸について複数の分類ラベル(24)と、前記軸及びラベルに関連する属性(26)の関連一覧とを含んでいる領域(12)を定義するステップ(54、56)であって、少なくとも一つの軸、ラベル又は属性が、画像特徴(454)、波形特徴(474)、音声特徴(486)、動画特徴又はこれらの任意の組み合わせを含んでいる、定義するステップ(54、56)と、
    関心のある属性を潜在的に有する複数のデータ実体(28、30)にアクセスするステップ(70)と、
    前記関連一覧に基づいて前記軸及びラベルに対応する属性を有するデータ実体を識別するステップ(74)と、
    前記対応する属性に従って前記識別されたデータ実体を分類するステップ(82)と、
    を備えたデータ実体(28、30)を写像するコンピュータ具現化式方法。
  2. ラベル(24)が画像特徴(454)、波形特徴(474)、音声特徴(486)又は動画特徴により定義され、前記ラベルの属性は、前記アクセスされたデータ実体に潜在的に含まれる前記ラベル特徴の変化形(456、476、488)を含んでいる、請求項1に記載の方法。
  3. 多数のラベル(446、448、450、452)が、画像特徴(454)、波形特徴(474)、音声特徴(486)又は動画特徴を参照することにより一つの軸(22)について定義される、請求項1に記載の方法。
  4. 前記分類は、1よりも多いラベル又は軸に対するデータ実体(28、30)の一対多写像(84)を含んでいる、請求項1に記載の方法。
  5. 少なくとも一つのラベルに関連付けされる少なくとも属性が、データ実体のテキスト特徴(430)、画像特徴(432)、波形特徴(438)、音声特徴(434)及び動画特徴(436)の少なくとも二つについての属性を含んでいる、請求項1に記載の方法。
  6. 前記属性(26)は、医用画像の特徴を符号化しており、前記分類は、画像データから検出可能な疾患状態の分析を含んでいる、請求項1に記載の方法。
JP2006250279A 2005-09-30 2006-09-15 計算機支援式領域特定型実体写像の方法及びシステム Withdrawn JP2007102770A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/240,880 US20070078873A1 (en) 2005-09-30 2005-09-30 Computer assisted domain specific entity mapping method and system

Publications (1)

Publication Number Publication Date
JP2007102770A true JP2007102770A (ja) 2007-04-19

Family

ID=37451201

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006250279A Withdrawn JP2007102770A (ja) 2005-09-30 2006-09-15 計算機支援式領域特定型実体写像の方法及びシステム

Country Status (4)

Country Link
US (1) US20070078873A1 (ja)
EP (1) EP1770561A3 (ja)
JP (1) JP2007102770A (ja)
CN (1) CN1945581A (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4690683B2 (ja) * 2004-09-13 2011-06-01 株式会社東芝 超音波診断装置及び医用画像閲覧方法
US7610545B2 (en) * 2005-06-06 2009-10-27 Bea Systems, Inc. Annotations for tracking provenance
JP2007133808A (ja) * 2005-11-14 2007-05-31 Canon Inc 情報処理装置、コンテンツ処理方法、記憶媒体およびプログラム
JP5361174B2 (ja) * 2007-11-30 2013-12-04 キヤノン株式会社 表示制御装置、表示制御方法、およびプログラム
US10210234B2 (en) 2008-03-24 2019-02-19 Jda Software Group, Inc. Linking discrete dimensions to enhance dimensional analysis
KR100930617B1 (ko) * 2008-04-08 2009-12-09 한국과학기술정보연구원 다중 개체 중심적 통합 검색 시스템 및 방법
US8099299B2 (en) * 2008-05-20 2012-01-17 General Electric Company System and method for mapping structural and functional deviations in an anatomical region
US8180125B2 (en) * 2008-05-20 2012-05-15 General Electric Company Medical data processing and visualization technique
US8010381B2 (en) * 2008-05-20 2011-08-30 General Electric Company System and method for disease diagnosis from patient structural deviation data
US8430816B2 (en) * 2008-05-20 2013-04-30 General Electric Company System and method for analysis of multiple diseases and severities
US20090299990A1 (en) * 2008-05-30 2009-12-03 Vidya Setlur Method, apparatus and computer program product for providing correlations between information from heterogenous sources
US8290923B2 (en) * 2008-09-05 2012-10-16 Yahoo! Inc. Performing large scale structured search allowing partial schema changes without system downtime
US20100076952A1 (en) * 2008-09-05 2010-03-25 Xuejun Wang Self contained multi-dimensional traffic data reporting and analysis in a large scale search hosting system
US20100076979A1 (en) * 2008-09-05 2010-03-25 Xuejun Wang Performing search query dimensional analysis on heterogeneous structured data based on relative density
US8786873B2 (en) * 2009-07-20 2014-07-22 General Electric Company Application server for use with a modular imaging system
US20110129129A1 (en) * 2009-11-30 2011-06-02 General Electric Company System and method for integrated quantifiable detection, diagnosis and monitoring of disease using population related data for determining a disease signature
US20110129131A1 (en) * 2009-11-30 2011-06-02 General Electric Company System and method for integrated quantifiable detection, diagnosis and monitoring of disease using population related time trend data and disease profiles
US20110129130A1 (en) * 2009-11-30 2011-06-02 General Electric Company System and method for integrated quantifiable detection, diagnosis and monitoring of disease using population related time trend data
US8243882B2 (en) 2010-05-07 2012-08-14 General Electric Company System and method for indicating association between autonomous detector and imaging subsystem
CN101923561A (zh) * 2010-05-24 2010-12-22 中国科学技术信息研究所 一种文件自动分类方法
US8417709B2 (en) * 2010-05-27 2013-04-09 International Business Machines Corporation Automatic refinement of information extraction rules
CN101847161A (zh) * 2010-06-02 2010-09-29 苏州搜图网络技术有限公司 搜索网页的方法和建立数据库的方法
US8934685B2 (en) 2010-09-21 2015-01-13 General Electric Company System and method for analyzing and visualizing local clinical features
US8903198B2 (en) 2011-06-03 2014-12-02 International Business Machines Corporation Image ranking based on attribute correlation
US8538934B2 (en) * 2011-10-28 2013-09-17 Microsoft Corporation Contextual gravitation of datasets and data services
US10546057B2 (en) * 2011-10-28 2020-01-28 Microsoft Technology Licensing, Llc Spreadsheet program-based data classification for source target mapping
US20130166563A1 (en) * 2011-12-21 2013-06-27 Sap Ag Integration of Text Analysis and Search Functionality
JP5972570B2 (ja) * 2011-12-27 2016-08-17 東芝メディカルシステムズ株式会社 医用画像表示装置及び医用画像保管システム
US9223592B2 (en) 2012-08-09 2015-12-29 International Business Machines Corporation Configuring a system with various system components utilizing a configuration profile
US9342317B2 (en) * 2012-08-09 2016-05-17 International Business Machines Corporation Importing profiles for configuring specific system components into a configuration profile for the system
EP2932404A4 (en) * 2012-12-12 2016-08-10 Google Inc PROVIDING RESEARCH RESULTS BASED ON A COMPOSITION REQUEST
CN105468601A (zh) * 2014-08-21 2016-04-06 富泰华工业(深圳)有限公司 信息处理装置和信息处理系统及其信息处理方法
CN104537089B (zh) * 2015-01-05 2018-03-30 北京数码大方科技股份有限公司 计算机辅助设计中的标注数据可靠性检测方法及装置
US10380486B2 (en) * 2015-01-20 2019-08-13 International Business Machines Corporation Classifying entities by behavior
US10853689B2 (en) * 2017-10-09 2020-12-01 WebFurther, LLC Methods for more effectively moderating one or more images and devices thereof
US10685172B2 (en) 2018-05-24 2020-06-16 International Business Machines Corporation Generating a textual description of an image using domain-independent anomaly analysis
CN109165171B (zh) * 2018-08-10 2022-12-23 电子科技大学 自适应的快速数字波形成像方法
WO2021173826A1 (en) * 2020-02-25 2021-09-02 The Board Of Regents Of The University Of Texas System Systems and methods for screening and staging of pneumoconiosis
CN112598023B (zh) * 2020-12-02 2024-01-26 国网青海省电力公司海东供电公司 一种电网监控告警信息智能识别和自动映射方法和装置

Family Cites Families (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5019976A (en) * 1987-06-08 1991-05-28 New World Down Hole Tools Method and system for retrieving text associated with a reference image correspondence to a selected patient image
US5200993A (en) * 1991-05-10 1993-04-06 Bell Atlantic Network Services, Inc. Public telephone network including a distributed imaging system
US5251131A (en) * 1991-07-31 1993-10-05 Thinking Machines Corporation Classification of data records by comparison of records to a training database using probability weights
US5384862A (en) * 1992-05-29 1995-01-24 Cimpiter Corporation Radiographic image evaluation apparatus and method
US5537485A (en) * 1992-07-21 1996-07-16 Arch Development Corporation Method for computer-aided detection of clustered microcalcifications from digital mammograms
US6283761B1 (en) * 1992-09-08 2001-09-04 Raymond Anthony Joao Apparatus and method for processing and/or for providing healthcare information and/or healthcare-related information
US5359513A (en) * 1992-11-25 1994-10-25 Arch Development Corporation Method and system for detection of interval change in temporally sequential chest images
DE69432089T2 (de) * 1993-03-01 2004-02-12 Kabushiki Kaisha Toshiba, Kawasaki System zur Verarbeitung von medizinischen Daten zur Unterstützung der Diagnose
US6574357B2 (en) * 1993-09-29 2003-06-03 Shih-Ping Wang Computer-aided diagnosis method and system
US5452367A (en) * 1993-11-29 1995-09-19 Arch Development Corporation Automated method and system for the segmentation of medical images
US6206829B1 (en) * 1996-07-12 2001-03-27 First Opinion Corporation Computerized medical diagnostic and treatment advice system including network access
US6022315A (en) * 1993-12-29 2000-02-08 First Opinion Corporation Computerized medical diagnostic and treatment advice system including network access
US5560005A (en) * 1994-02-25 1996-09-24 Actamed Corp. Methods and systems for object-based relational distributed databases
US5574828A (en) * 1994-04-28 1996-11-12 Tmrc Expert system for generating guideline-based information tools
US5434932A (en) * 1994-07-28 1995-07-18 West Publishing Company Line alignment apparatus and process
US5519786A (en) * 1994-08-09 1996-05-21 Trw Inc. Method and apparatus for implementing a weighted voting scheme for multiple optical character recognition systems
US5786994A (en) * 1994-11-23 1998-07-28 Imation Corp. Performance monitoring system and method for a laser medical imager
US5790690A (en) * 1995-04-25 1998-08-04 Arch Development Corporation Computer-aided method for automated image feature analysis and diagnosis of medical images
US5911132A (en) * 1995-04-26 1999-06-08 Lucent Technologies Inc. Method using central epidemiological database
US6675384B1 (en) * 1995-12-21 2004-01-06 Robert S. Block Method and apparatus for information labeling and control
JP2706645B2 (ja) * 1995-12-27 1998-01-28 株式会社亀田医療情報研究所 医療計画支援システム並びに医療計画支援装置及び方法
US6678669B2 (en) * 1996-02-09 2004-01-13 Adeza Biomedical Corporation Method for selecting medical and biochemical diagnostic tests using neural network-related applications
US6272481B1 (en) * 1996-05-31 2001-08-07 Lucent Technologies Inc. Hospital-based integrated medical computer system for processing medical and patient information using specialized functional modules
US5815591A (en) * 1996-07-10 1998-09-29 R2 Technology, Inc. Method and apparatus for fast detection of spiculated lesions in digital mammograms
US6611630B1 (en) * 1996-07-10 2003-08-26 Washington University Method and apparatus for automatic shape characterization
US6173068B1 (en) * 1996-07-29 2001-01-09 Mikos, Ltd. Method and apparatus for recognizing and classifying individuals based on minutiae
US5987345A (en) * 1996-11-29 1999-11-16 Arch Development Corporation Method and system for displaying medical images
US6301378B1 (en) * 1997-06-03 2001-10-09 R2 Technology, Inc. Method and apparatus for automated detection of masses in digital mammograms
US6058322A (en) * 1997-07-25 2000-05-02 Arch Development Corporation Methods for improving the accuracy in differential diagnosis on radiologic examinations
US5999639A (en) * 1997-09-04 1999-12-07 Qualia Computing, Inc. Method and system for automated detection of clustered microcalcifications from digital mammograms
US6073042A (en) * 1997-09-25 2000-06-06 Siemens Medical Systems, Inc. Display of three-dimensional MRA images in which arteries can be distinguished from veins
US6820094B1 (en) * 1997-10-08 2004-11-16 Scansoft, Inc. Computer-based document management system
CA2233794C (en) * 1998-02-24 2001-02-06 Luc Bessette Method and apparatus for the management of medical files
US6024699A (en) * 1998-03-13 2000-02-15 Healthware Corporation Systems, methods and computer program products for monitoring, diagnosing and treating medical conditions of remotely located patients
US6067373A (en) * 1998-04-02 2000-05-23 Arch Development Corporation Method, system and computer readable medium for iterative image warping prior to temporal subtraction of chest radiographs in the detection of interval changes
US6282531B1 (en) * 1998-06-12 2001-08-28 Cognimed, Llc System for managing applied knowledge and workflow in multiple dimensions and contexts
JP2002521752A (ja) * 1998-07-24 2002-07-16 ジャーグ コーポレーション オブジェクト検索を実行するための分散コンピュータ・データベースシステム及びその方法
US6738499B1 (en) * 1998-11-13 2004-05-18 Arch Development Corporation System for detection of malignancy in pulmonary nodules
US6081267A (en) * 1998-11-19 2000-06-27 Columbia Scientific Incorporated Computerized apparatus and method for displaying X-rays and the like for radiological analysis and manipulation and transmission of data
US6424996B1 (en) * 1998-11-25 2002-07-23 Nexsys Electronics, Inc. Medical network system and method for transfer of information
US7450229B2 (en) * 1999-01-25 2008-11-11 Amnis Corporation Methods for analyzing inter-cellular phenomena
US20010034023A1 (en) * 1999-04-26 2001-10-25 Stanton Vincent P. Gene sequence variations with utility in determining the treatment of disease, in genes relating to drug processing
US6801645B1 (en) * 1999-06-23 2004-10-05 Icad, Inc. Computer aided detection of masses and clustered microcalcifications with single and multiple input image context classification strategies
EP1210684A4 (en) * 1999-08-09 2003-04-23 Univ Wake Forest COMPUTER METHOD AND PROCEDURE FOR CREATING MULTIMEDIA ELECTRONIC REPORTS
WO2001031502A1 (fr) * 1999-10-27 2001-05-03 Fujitsu Limited Dispositif et procede de classement et de rangement d'informations multimedia
US6440066B1 (en) * 1999-11-16 2002-08-27 Cardiac Intelligence Corporation Automated collection and analysis patient care system and method for ordering and prioritizing multiple health disorders to identify an index disorder
US20020069086A1 (en) * 1999-12-06 2002-06-06 Fracek Stephen P. Web linked database for tracking clinical activities and competencies and evaluation of program resources and program outcomes
US6701314B1 (en) * 2000-01-21 2004-03-02 Science Applications International Corporation System and method for cataloguing digital information for searching and retrieval
US20010041991A1 (en) * 2000-02-09 2001-11-15 Segal Elliot A. Method and system for managing patient medical records
US20010049674A1 (en) * 2000-03-30 2001-12-06 Iqbal Talib Methods and systems for enabling efficient employment recruiting
US20020016719A1 (en) * 2000-06-19 2002-02-07 Nemeth Louis G. Methods and systems for providing medical data to a third party in accordance with configurable distribution parameters
EP1320844A4 (en) * 2000-06-20 2005-12-14 Sdgi Holdings Inc ELECTRONIC PATIENT HEALTH CARE SYSTEM AND METHOD
US20020016718A1 (en) * 2000-06-22 2002-02-07 Rothschild Peter A. Medical image management system and method
US6678703B2 (en) * 2000-06-22 2004-01-13 Radvault, Inc. Medical image management system and method
TWI222039B (en) * 2000-06-26 2004-10-11 Iwane Lab Ltd Information conversion system
AUPQ842800A0 (en) * 2000-06-28 2000-07-20 Aivision Pty Ltd Flat screen vision testing
AU2001276991A1 (en) * 2000-07-20 2002-02-05 J. Alexander Marchosky Patient-controlled automated medical record, diagnosis, and treatment system andmethod
AU2001286901A1 (en) * 2000-08-30 2002-03-13 Healtheheart, Inc. Patient analysis and risk reduction system and associated methods including the use of patient monitored data
WO2002021426A1 (en) * 2000-09-07 2002-03-14 Healthetech, Inc. Portable computing apparatus particularly useful in a weight management program
US7024398B2 (en) * 2000-11-02 2006-04-04 Scientific Learning Corporation Computer-implemented methods and apparatus for alleviating abnormal behaviors
US7103205B2 (en) * 2000-11-24 2006-09-05 U-Systems, Inc. Breast cancer screening with ultrasound image overlays
US7556602B2 (en) * 2000-11-24 2009-07-07 U-Systems, Inc. Breast cancer screening with adjunctive ultrasound mammography
WO2002055735A2 (en) * 2000-11-27 2002-07-18 Diadexus Inc Compositions and methods relating to prostate specific genes and proteins
US6934698B2 (en) * 2000-12-20 2005-08-23 Heart Imaging Technologies Llc Medical image management system
US7024473B2 (en) * 2001-01-05 2006-04-04 Matsushita Electric Works, Ltd. Web server for communicating with one or more electronic devices through a gateway computer
EP1373896A2 (en) * 2001-03-12 2004-01-02 MonoGen, Inc. Cell-based detection and differentiation of disease states
US7386462B2 (en) * 2001-03-16 2008-06-10 Ge Medical Systems Global Technology Company, Llc Integration of radiology information into an application service provider DICOM image archive and/or web based viewer
US20030077576A1 (en) * 2001-03-20 2003-04-24 Joann Trial Use of monoclonal antibodies and functional assays for prediction of risk of opportunistic infection
AUPR464601A0 (en) * 2001-04-30 2001-05-24 Commonwealth Of Australia, The Shapes vector
US7099871B2 (en) * 2001-05-04 2006-08-29 Sun Microsystems, Inc. System and method for distributed real-time search
US7085693B2 (en) * 2001-06-19 2006-08-01 International Business Machines Corporation Manipulation of electronic media using off-line media
AU2002322360A1 (en) * 2001-06-28 2003-03-03 Mount Sinai School Of Medicine Of New York University Methods for diagnosing and treating a disease mediated by decreased mmp-2 function
US7130457B2 (en) * 2001-07-17 2006-10-31 Accuimage Diagnostics Corp. Systems and graphical user interface for analyzing body images
US6741730B2 (en) * 2001-08-10 2004-05-25 Visiongate, Inc. Method and apparatus for three-dimensional imaging in the fourier domain
US7158692B2 (en) * 2001-10-15 2007-01-02 Insightful Corporation System and method for mining quantitive information from medical images
US7054473B1 (en) * 2001-11-21 2006-05-30 R2 Technology, Inc. Method and apparatus for an improved computer aided diagnosis system
WO2003070102A2 (en) * 2002-02-15 2003-08-28 The Regents Of The University Of Michigan Lung nodule detection and classification
JP2003271665A (ja) * 2002-03-15 2003-09-26 Fuji Photo Film Co Ltd 検索用グラフィカル・ユーザ・インターフェイス
US7260773B2 (en) * 2002-03-28 2007-08-21 Uri Zernik Device system and method for determining document similarities and differences
US7295691B2 (en) * 2002-05-15 2007-11-13 Ge Medical Systems Global Technology Company, Llc Computer aided diagnosis of an image set
US20040078231A1 (en) * 2002-05-31 2004-04-22 Wilkes Gordon J. System and method for facilitating and administering treatment to a patient, including clinical decision making, order workflow and integration of clinical documentation
US7296020B2 (en) * 2002-06-05 2007-11-13 International Business Machines Corp Automatic evaluation of categorization system quality
US7139695B2 (en) * 2002-06-20 2006-11-21 Hewlett-Packard Development Company, L.P. Method for categorizing documents by multilevel feature selection and hierarchical clustering based on parts of speech tagging
US7191182B2 (en) * 2002-07-20 2007-03-13 Microsoft Corporation Containment hierarchy in a database system
US6904118B2 (en) * 2002-07-23 2005-06-07 General Electric Company Method and apparatus for generating a density map using dual-energy CT
US6574304B1 (en) * 2002-09-13 2003-06-03 Ge Medical Systems Global Technology Company, Llc Computer aided acquisition of medical images
US20040087838A1 (en) * 2002-10-31 2004-05-06 Mark Galloway Meridian linking diagnostic and treatment system and method for treatment of manifested and latent maladies using the same
US7244230B2 (en) * 2002-11-08 2007-07-17 Siemens Medical Solutions Usa, Inc. Computer aided diagnostic assistance for medical imaging
US6628743B1 (en) * 2002-11-26 2003-09-30 Ge Medical Systems Global Technology Company, Llc Method and apparatus for acquiring and analyzing cardiac data from a patient
US7406150B2 (en) * 2002-11-29 2008-07-29 Hologic, Inc. Distributed architecture for mammographic image acquisition and processing
CN1745390A (zh) * 2002-12-03 2006-03-08 美国西门子医疗解决公司 自动提取及处理患者病历中记帐信息的系统和方法
US7320000B2 (en) * 2002-12-04 2008-01-15 International Business Machines Corporation Method and apparatus for populating a predefined concept hierarchy or other hierarchical set of classified data items by minimizing system entrophy
US6765983B2 (en) * 2002-12-13 2004-07-20 General Electric Company Method and apparatus for imaging a region of dynamic tissue
US7333997B2 (en) * 2003-08-12 2008-02-19 Viziant Corporation Knowledge discovery method with utility functions and feedback loops
US7650195B2 (en) * 2005-10-27 2010-01-19 Honeywell Asca Inc. Automated tuning of large-scale multivariable model predictive controllers for spatially-distributed processes

Also Published As

Publication number Publication date
EP1770561A2 (en) 2007-04-04
CN1945581A (zh) 2007-04-11
US20070078873A1 (en) 2007-04-05
EP1770561A3 (en) 2009-04-29

Similar Documents

Publication Publication Date Title
JP2007102770A (ja) 計算機支援式領域特定型実体写像の方法及びシステム
JP5025488B2 (ja) ドメイン特定のデータ・エンティティ・マッピング方法及びシステム
WO2006065823A1 (en) Computer assisted domain specific entity mapping method and system
Gotz et al. Characterizing users’ visual analytic activity for insight provenance
Oliveira et al. Thematic content analysis: Is there a difference between the support provided by the MAXQDA® and NVivo® software packages
US20170277998A1 (en) System And Method For Providing Document Classification Suggestions
US20060136417A1 (en) Method and system for search, analysis and display of structured data
US20060136259A1 (en) Multi-dimensional analysis of medical data
US20060225000A1 (en) Graphical application interface using browser
US20080134060A1 (en) System for creating a graphical visualization of data with a browser
US20060224999A1 (en) Graphical visualization of data product using browser
US20060224983A1 (en) Graphical visualization of data using browser
US20060224974A1 (en) Method of creating graphical application interface with a browser
US8799286B2 (en) System and method for organizing and displaying of longitudinal multimodal medical records
US20060224972A1 (en) Graphical application interface with a browser
JP5587989B2 (ja) 観点別特許マップの提供方法
US20060224984A1 (en) Apparatus for creating graphical visualization of data with a browser
US20060224982A1 (en) Graphical application interface product using a browser
US20060224980A1 (en) Method of creating graphical visualizations of data with a browser
JP2005528681A (ja) 統合的マルチスケール3d画像文書化およびナビゲーションのための方法および装置
US20060224975A1 (en) System for creating a graphical application interface with a browser
Gaona-García et al. An exploratory study of user perception in visual search interfaces based on SKOS
Langenhan et al. The fingerprint of architecture-sketch-based design methods for researching building layouts through the semantic fingerprinting of floor plans
Gotz et al. Multifaceted visual analytics for healthcare applications
Jing et al. Graphical methods for reducing, visualizing and analyzing large data sets using hierarchical terminologies

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090910

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090910

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20100729