JP2009128962A - 情報検索装置および方法 - Google Patents
情報検索装置および方法 Download PDFInfo
- Publication number
- JP2009128962A JP2009128962A JP2007300068A JP2007300068A JP2009128962A JP 2009128962 A JP2009128962 A JP 2009128962A JP 2007300068 A JP2007300068 A JP 2007300068A JP 2007300068 A JP2007300068 A JP 2007300068A JP 2009128962 A JP2009128962 A JP 2009128962A
- Authority
- JP
- Japan
- Prior art keywords
- search
- tree structure
- attribute
- information
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
Abstract
【課題】検索結果を把握しやすく、また絞り込み検索も容易な態様で表示する。
【解決手段】記憶部12は属性付データを記憶する。属性付データとは、典型的には、属性およびその属性値の対である。入力部10は、情報検索システム100に対してユーザーが検索キーワードを入力する。情報検索部11は、入力部10から受け取った属性と属性値のペアを典型的にはand条件で検索する。構造生成部13は、検索結果から検索結果間の関係を導出する。木構造の一種である決定木を属性付データからID3アルゴリズム等で自動生成する。木構造は表示部14で表示される。
【選択図】図1
【解決手段】記憶部12は属性付データを記憶する。属性付データとは、典型的には、属性およびその属性値の対である。入力部10は、情報検索システム100に対してユーザーが検索キーワードを入力する。情報検索部11は、入力部10から受け取った属性と属性値のペアを典型的にはand条件で検索する。構造生成部13は、検索結果から検索結果間の関係を導出する。木構造の一種である決定木を属性付データからID3アルゴリズム等で自動生成する。木構造は表示部14で表示される。
【選択図】図1
Description
この発明は、情報検索技術に関する。
検索結果をユーザーにわかりやすく視覚化し、検索を支援する技術として次のような先行技術が挙げられる。
特許文献1では、類似する検索結果を自己組織化マップ(SOM)で表現することにより、特に検索結果の数が膨大であった場合でも、検索結果の閲覧をしやすくしている。
特許文献2は、検索式の論理関係をグラフィカルユーザインタフェース(GUI)で視覚化することにより、検索条件をユーザーに把握しやすくしている。
まず、情報検索を行った際に検索結果が複数存在した場合、リスト形式での提示ではユーザーが検索結果全体を把握できないという問題があった。これに対し、類似する検索結果を近くに表示する技術が提案されている。例えば特許文献1ではSOMを用いてこれを実現している。このように検索結果を類似した検索結果が2次元的に近くに配置されるように視覚化した場合、検索結果の大まかな傾向を把握するには有効である。しかし、その中から目的の情報(絞り込み条件)を得るための方策(論理関係)を提示するものではない。
また、検索式の設定に関しても、複数の検索語を用いて複雑な検索を行おうとする場合、検索語間の論理関係がわかりづらくなるという問題があった。これに対し、検索語間の論理関係を視覚化し、ユーザーに把握しやすくするという技術が提案されている。例えば、特許文献2では検索語間の関係をGUIを用いて視覚化することでユーザーの検索を支援しようとしている。しかし、このようなGUIを用いた場合でも、検索結果に対してさらに絞込みが必要である場合、検索結果間の関係が視覚化されないため、妥当な絞り込み条件(新たに追加する効果的な検索語、検索条件)がわかりづらいという課題があった。
なお、上述の従来技術やその問題点は、この発明の背景の一部を説明するためにのみ説明している。この発明は上述の従来技術や問題点に限定されるものではない点に留意されたい。
特開2004−213626号公報
特開2002−117056号公報
この発明は、以上の事情を考慮してなされたものであり、情報検索を行った際に検索結果が複数存在した場合に検索結果を絞り込むための条件を論理関係として視覚化することによって、ユーザーが検索結果全体を把握しやすくし、迅速に検索を行えるようにすることを目的とする。
この発明によれば、上述の目的を達成するために、特許請求の範囲に記載のとおりの構成を採用している。ここでは、発明を詳細に説明するのに先だって、特許請求の範囲の記載について補充的に説明を行なっておく。
すなわち、この発明の一側面によれば、上述の目的を達成するために、情報検索装置に:1または複数の検索キーを入力する入力手段と;検索対象の属性に検索キーを突き合わせて当該検索キーに適合する検索対象から成る検索結果を取得する検索手段と;検索結果に含まれる検索対象の属性から木構造を生成する木構造生成手段と;木構造に関連づけて検索結果を表示する表示手段とを設けるようにしている。
この構成によれば、検索結果を木構造で表示するためその結果が把握しやすく、また絞り込み検索も容易である。
検索結果の木構造に関連付けて集合の要素数を表示すれば、絞り込みの目安となる。
この構成において、上記検索手段は入力された検索キーのそれぞれと一致する属性をすべて有する検索対象から成る検索結果を取得してよい。
また、上記木構造生成手段は、検索結果に含まれる検索対象の属性のうち検索キーと一致する属性以外の属性から木構造を生成してよい。
また、上記木構造生成手段は、ID3学習アルゴリズムに従って決定木の木構造を生成してよい。
また、上記検索手段は、検索対象の属性に検索キーを突き合わせてスコアを算出し当該スコアが閾値を越える検索対象からなる検索結果を取得してよい。この場合、上記スコアは、例えば、一致した検索キーの重みの和である。上記木構造生成手段は、スコアが高い検索結果ほど少ない判断回数で到達できる決定木を生成してよい。
なお、この発明は装置またはシステムとして実現できるのみでなく、方法としても実現可能である。また、そのような発明の一部をソフトウェアとして構成することができることはもちろんである。またそのようなソフトウェアをコンピュータに実行させるために用いるソフトウェア製品もこの発明の技術的な範囲に含まれることも当然である。
この発明の上述の側面および他の側面は特許請求の範囲に記載され以下実施例を用いて詳述される。
この発明によれば、検索結果を木構造で表示するためその結果が把握しやすく、また絞り込み検索も容易である。
以下、この発明の実施例について説明する。
図1は、この発明の実施例の情報検索システム100を全体として示している。この情報検索システム100は典型的にはコンピュータシステム200に情報検索用のアプリケーションソフトウェア201をインストールして実現される。情報検索システム100の各手段は、コンピュータシステム200のハードウェア資源と基本入出力ソフトウェア、オペレーティングシステムおよび情報検索用のアプリケーションソフトウェア201等のソフトウェア資源とを協働させて実現される。
情報検索システム100は、1つのコンピュータシステムから実現されても良いし、複数のコンピュータシステムの組み合わせから実現されても良い。複数のコンピュータシステムは通信ネットワークにより接続されて良い。
図1において、情報検索システム100は、入力部10、情報検索部11、属性付きデータを記憶する記憶部12、構造生成部13、および表示部14を含んで構成される。
記憶部12は属性付データを記憶する。属性付データとは、典型的には、図3に例を示すようなデータであるが、これに限定されない。ABCDは検索対象の要素であり、abcd…zは属性名であり、1,0は属性値である。
入力部10は、情報検索システム100に対してユーザーが検索キーワードを入力するためのものである。検索キーワードは典型的には属性と属性値のペアであるが、これに限定されない。入力形式としては例えば図4に示すような3通りが考えられる。図4(a)の例は「a=1」を入力するものである。図4(b)は表形式のユーザインタフェースに「1」を入力するものである。図4(c)は、「aが1であった場合」等と文章で入力するものである。文章入力は解析されて属性(「a」)および属性値(「1」)が取り出される。
入力部10では、通常のキーワードの集合を入力してその論理和また論理積で検索を行なうものでも良い。
情報検索部11は、入力部10から受け取った属性と属性値のペアを典型的にはand条件で検索する。例えば、図3で示したような属性付データに対し図5(a)に示す検索条件を入力とした場合、図5(b)に示す通りA,B,Cが検索される。また、図6(a)に示す検索条件を入力とした場合、図6(b)に示す通りA,Bが検索される。
構造生成部13は、検索結果から検索結果間の関係を導出する。また、ユーザーがその関係を視覚的に把握しやすい、例えば木構造などの構造を生成する。木構造の一種である決定木を属性付データから自動生成するアルゴリズムの例としてはID3が挙げられる(『人工知能の基礎』西田豊明著、丸善株式会社発行、1999)。
ID3アルゴリズムの流れを以下に示す。なおここでは入力の独立変数をa1…anとおく、また取りうる出力は集合Dに格納されており集合Cに於いて、x∈ Dが起こる割合を px(C)で表すこととする。
[ステップ1]:ルートノードNを作成して全ての例題集合をNに所属させる。
[ステップ2]:もしNに所属する例題が全て同じ決定Xを与えるならNにXとラベル付けして処理を終了する。
[ステップ3]:例題集合Cに対する平均情報量を求める、即ち以下の式を計算する。
[ステップ4]:Cをある独立変数aiの値に応じて分割する。aiがv1 … vm のm通りの値を持つ場合は以下の通りに分割する。
[ステップ5]:分割したCijに応じて平均情報量を求める。
[ステップ6]:計算した平均情報量から独立変数aiの平均情報量の期待値Miを以下の式で求める。
[ステップ7]:Miが最大となる独立変数をakとする。
[ステップ8]:Nのラベルをakとして、Nの子ノードNjを作成し、それぞれにCkj を所属させる。
[ステップ9]:それぞれの子ノードに対してN=Nj,C=Ckjとして、ステップ2以下の操作を再帰的に行う。
[ステップ2]:もしNに所属する例題が全て同じ決定Xを与えるならNにXとラベル付けして処理を終了する。
[ステップ3]:例題集合Cに対する平均情報量を求める、即ち以下の式を計算する。
[ステップ8]:Nのラベルをakとして、Nの子ノードNjを作成し、それぞれにCkj を所属させる。
[ステップ9]:それぞれの子ノードに対してN=Nj,C=Ckjとして、ステップ2以下の操作を再帰的に行う。
図5(b)で示す検索結果から導出される検索結果間の関係を図7に示す。構造生成部13は、図5(b)で示す検索結果と整合する木構造の例を図8(a)および図8(b)に示す。検索結果に整合する木構造は一般に複数存在するが、典型的には、その生成アルゴリズムにより一意に特定される。
表示部14は、構造生成部13で導出された検索結果間の関係や木構造を検索結果として表示する。簡略化した表示態様は図7および図8に対応する。表示部14により表示される木構造のノードをユーザインタフェース手段を用いて指定して絞り込み検索対象とすることができる。絞り込み検索対象については当初の場合と同様に入力部10で絞り込みキーワード等を入力できる。
図2は、図1の実施例の動作例を説明するものであり、その動作の詳細は以下の通りである。
[ステップS10]:ユーザーが入力した検索条件を受け取る。
[ステップS11]:検索条件に合致する検索結果を得る。
[ステップS12]:検索結果が複数存在するかどうかを判別し、複数ならステップS13へ進み、そうでなければステップS15へ進む。
[ステップS13]:検索結果同士の関係について木構造を生成する。
[ステップS14]:生成された木構造を検索結果として表示する。そののちステップS16へ進み処理を終了する。
[ステップS15]:検索結果をそのまま表示して、ステップS16へ進み処理を終了する。
[ステップS16]:処理を終了する。
[ステップS11]:検索条件に合致する検索結果を得る。
[ステップS12]:検索結果が複数存在するかどうかを判別し、複数ならステップS13へ進み、そうでなければステップS15へ進む。
[ステップS13]:検索結果同士の関係について木構造を生成する。
[ステップS14]:生成された木構造を検索結果として表示する。そののちステップS16へ進み処理を終了する。
[ステップS15]:検索結果をそのまま表示して、ステップS16へ進み処理を終了する。
[ステップS16]:処理を終了する。
この実施例では、情報検索を行った際に検索結果が複数存在した場合に、検索結果の論理関係を構築し、木構造として視覚化する。したがって、検索結果全体を把握しやすくなり、また、絞り込み検索を適切に行える。
この実施例を実行例として、医療分野における画像診断のシーンに適用した例を以下に示す。画像診断は読影とも呼ばれ、CTやMRI等の画像特徴から体の中でどのような変化(出血しているか、悪性腫瘍ができているのか、など)が起きているのかを推察し、疑わしい疾患名を挙げる。病院内で読影を専門に行う医師は読影医と呼ばれる。
読影では一般的に複数の撮影方法で撮影された画像(T1強調、T2強調など)の、それぞれの特徴の組み合わせから、体内で起きている変化を推察する。例えば、T1強調像で高信号が見られた場合には高信号部は脂肪、出血、高淡白液体のいずれかである可能性が高いが、いずれであるかの判断は、他の撮影方法での画像を確認しなければ行うことができない。絞り込まれた信号変化の要因や病名から、そのいずれであるかを判別する診断は鑑別診断と呼ばれる。
熟練の読影医のように鑑別のポイントを知識として持っていれば問題ないが、知識をもっていなかった場合、読影医は教科書などを検索して、鑑別ポイントを求める。教科書は例えば(非特許文献『所見からせまる脳MRI 系統鑑別診断』土屋一洋・青木茂樹編、秀潤社、2001)などが用いられている。
実行例では、画像診断について鑑別診断の対象となる信号変化の要因や病名を検索対象とし、画像撮影方法および信号強度を属性名、属性値とした属性付データを用いる場合を考える。具体的な属性データの例を図9に示す。属性値の「1」は属性に対する該当あり、「0」がなしを表す。なお、表4の内容は例であり、医学的な正確さは保証しない。
検索条件として「T1強調像で高信号=1」を入力とした場合を考える。情報検索部11では、図10に示すような検索結果が得られる。
構造生成手段において図11に示すような検索結果間の関係や、図12(a)および図12(c)に示すような木構造が生成される。そして、表示部14を用いてこれらが検索結果として表示さる。
鑑別診断のシーンにおいて読影医が信号変化の要因や病名の検索を、本発明を用いて実施した場合、読影医は鑑別ポイントがどこであるかを視覚的に確認することができる。すなわち、診断を進めるにあたり、次にどこに着目する必要があるのかを即座に理解することが可能となる。
なお、この発明は特許請求の範囲の記載に基づいて決定されるものであり、実施例の具体的な構成、課題、および効果には限定されない。この発明は上述の実施例に限定されるものではなくその趣旨を逸脱しない範囲で種々変更が可能である。
例えば、情報検索部11において検索結果ごとのスコアを求め、これを用いて構造生成部13で木構造を生成することが考えられる。まず、情報検索部11において、検索結果についてスコアを求める機能を加える。例えば、図3に示したような属性付データに対して図5(a)に示した検索条件を入力した場合、図13に示すようなスコア付検索結果が得られるようにする。スコアは、以下の3通りが考えられる。
(1):入力された検索条件との一致度
(2):各要素固有の値
(3):(1)と(2)を演算した結果の値
(1):入力された検索条件との一致度
(2):各要素固有の値
(3):(1)と(2)を演算した結果の値
各要素固有の値とは、実施例において挙げた信号変化の要因や病名の危険度が考えられる。また、信号変化の要因であれば、過去の症例における出現確率が考えられる。
次に、構造生成手段において、スコアを用いて木構造を生成する機能を加える。例えば、情報検索手段において付与されたスコアが高いものに、より少ない判断回数で到達できるように木構造を生成するようにする。表2cでは要素Aがもっともスコアが高いため、検索結果としては図14に示すような木構造が優先的に選択される。
10 入力部
11 情報検索部
12 記憶部
13 構造生成部
14 表示部
100 情報検索システム
200 コンピュータシステム
201 ソフトウェア
11 情報検索部
12 記憶部
13 構造生成部
14 表示部
100 情報検索システム
200 コンピュータシステム
201 ソフトウェア
Claims (9)
- 1または複数の検索キーを入力する入力手段と、
検索対象の属性に検索キーを突き合わせて当該検索キーに適合する検索対象から成る検索結果を取得する検索手段と、
検索結果に含まれる検索対象の属性から木構造を生成する木構造生成手段と、
木構造に関連づけて検索結果を表示する表示手段とを有することを特徴とする情報検索装置。 - 上記検索手段は入力された検索キーのそれぞれと一致する属性をすべて有する検索対象から成る検索結果を取得する請求項1記載の情報検索装置。
- 上記木構造生成手段は、検索結果に含まれる検索対象の属性のうち検索キーと一致する属性以外の属性から木構造を生成することを特徴とする請求項1記載の情報検索装置。
- 上記木構造生成手段は、ID3学習アルゴリズムに従って決定木の木構造を生成する請求項3記載の情報検索装置。
- 上記検索手段は、検索対象の属性に検索キーを突き合わせてスコアを算出し当該スコアが閾値を越える検索対象からなる検索結果を取得する請求項1記載の情報検索装置。
- 上記スコアは、一致した検索キーの重みの和である請求項5記載の情報検索装置。
- 上記木構造生成手段は、スコアが高い検索結果ほど少ない判断回数で到達できる決定木を生成する請求項5または6記載の情報検索装置。
- 入力手段が、1または複数の検索キーを入力するステップと、
検索手段が、検索対象の属性に検索キーを突き合わせて当該検索キーに適合する検索対象から成る検索結果を取得するステップと、
木構造生成手段が、検索結果に含まれる検索対象の属性から木構造を生成するステップと、
表示手段が、木構造に関連づけて検索結果を表示するステップとを有することを特徴とする情報検索方法。 - コンピュータを
1または複数の検索キーを入力する入力手段、
検索対象の属性に検索キーを突き合わせて当該検索キーに適合する検索対象から成る検索結果を取得する検索手段、
検索結果に含まれる検索対象の属性から木構造を生成する木構造生成手段、
木構造に関連づけて検索結果を表示する表示手段として、
よして機能させるための情報検索用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007300068A JP2009128962A (ja) | 2007-11-20 | 2007-11-20 | 情報検索装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007300068A JP2009128962A (ja) | 2007-11-20 | 2007-11-20 | 情報検索装置および方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009128962A true JP2009128962A (ja) | 2009-06-11 |
Family
ID=40819865
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007300068A Pending JP2009128962A (ja) | 2007-11-20 | 2007-11-20 | 情報検索装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009128962A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016522494A (ja) * | 2013-05-20 | 2016-07-28 | マイクロソフト テクノロジー ライセンシング,エルエルシー | 自動カレンダリング |
-
2007
- 2007-11-20 JP JP2007300068A patent/JP2009128962A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016522494A (ja) * | 2013-05-20 | 2016-07-28 | マイクロソフト テクノロジー ライセンシング,エルエルシー | 自動カレンダリング |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10902588B2 (en) | Anatomical segmentation identifying modes and viewpoints with deep learning across modalities | |
US10529045B2 (en) | Information processing apparatus and information processing method | |
US9519866B2 (en) | Diagnosis support apparatus, method of controlling the same, and storage medium | |
CN109074869B (zh) | 医疗诊断支持装置、信息处理方法以及医疗诊断支持系统 | |
US20160132648A1 (en) | Data Processing System and Method for Computer-Assisted Coding of Natural Language Medical Text | |
US20200151186A1 (en) | Cognitive Computer Assisted Attribute Acquisition Through Iterative Disclosure | |
US9589049B1 (en) | Correcting natural language processing annotators in a question answering system | |
JP5340204B2 (ja) | 推論装置、その制御方法およびプログラム | |
CN107750383B (zh) | 用于显示语义分类的时间线的装置、系统和方法 | |
CN112216359B (zh) | 医疗数据校验方法、装置及电子设备 | |
US20150081714A1 (en) | Active Knowledge Guidance Based on Deep Document Analysis | |
CN111656453B (zh) | 用于信息提取的层次实体识别和语义建模框架 | |
WO2013074703A1 (en) | Iterative time series matrix pattern enhancer processor | |
US11527312B2 (en) | Clinical report retrieval and/or comparison | |
CN112214584A (zh) | 使用知识图利用实体关系来发现答案 | |
Cypko et al. | Visual verification of cancer staging for therapy decision support | |
CN113658175A (zh) | 一种征象数据的确定方法及装置 | |
US20190198157A1 (en) | Automatic Creation of Imaging Story Boards from Medical Imaging Studies | |
EP2608152A1 (en) | Medical imaging diagnosis apparatus and medical imaging diagnosis method for providing diagnostic basis | |
Wang et al. | New Job, New Gender? Measuring the Social Bias in Image Generation Models | |
JP2009128962A (ja) | 情報検索装置および方法 | |
JP4259179B2 (ja) | 文書分析方法及び装置及び文書分析プログラム及び文書分析プログラムを格納した記憶媒体 | |
CN115691769A (zh) | 用一个或多个单词注释医学成像数据的一部分的方法和装置 | |
CN117672440A (zh) | 基于神经网络的电子病历文本信息抽取方法及系统 | |
JP2006235971A (ja) | 画像参照装置及び画像分類検索方法 |