WO2013001678A1

WO2013001678A1 - 類似症例検索装置および関連度データベース作成装置並びに類似症例検索方法および関連度データベース作成方法

Info

Publication number: WO2013001678A1
Application number: PCT/JP2012/001141
Authority: WO
Inventors: 和豊高田; 近藤　堅司; 和紀小塚; 佳州佐藤
Original assignee: パナソニック株式会社
Priority date: 2011-06-30
Filing date: 2012-02-21
Publication date: 2013-01-03
Also published as: US9008390B2; US20140089000A1; JP5462414B2; JPWO2013001678A1

Abstract

類似症例検索装置（１００）は、関連度データベース（１０４）を参照することにより取得される、キーワード抽出部（１０６）が抽出したキーワードおよびキーワード属性取得部（１０７）が取得した当該キーワードの属性値の組合せと画像特徴抽出部（１０８）が抽出した各画像特徴量との関連度で、画像特徴抽出部（１０８）が抽出した各画像特徴量と、症例データベース（１０１）に記憶されている症例データに含まれる医用画像群から抽出される各画像特徴量とを重み付ける検索ベクトル生成部（１０９）と、重み付けられた画像特徴量同士を比較することにより、第１症例データに類似する第２症例データを症例データベース（１０１）から検索する類似症例検索部（１１０）とを備える。

Description

類似症例検索装置および関連度データベース作成装置並びに類似症例検索方法および関連度データベース作成方法

　本発明は、読影対象の症例に対して参考となる症例を自動的に提示する類似症例検索装置および、類似症例検索装置で用いられる関連度データベースを作成する関連度データベース作成装置に関する。

　近年、画像診断の分野では医用画像および読影レポートのデジタル化が進み、医師が大量のデータを共有することが容易になっている。ここで、読影レポートとは、医用画像に対して読影者が下した診断を示す文書データのことである。また、画像を保管および通信するシステムであるＰＡＣＳ（Ｐｉｃｔｕｒｅ　Ａｒｃｈｉｖｉｎｇ　ａｎｄ　Ｃｏｍｍｕｎｉｃａｔｉｏｎ　Ｓｙｓｔｅｍｓ）内に保管されている読影レポートは、互いに関連付けられて管理されており、保管されている過去の読影レポートの有効な二次利用が求められている。読影レポートの二次利用の一つとして、診断対象となる医用画像に対する類似症例を自動的に提示することが挙げられる。このことにより、診断に関する意思決定を支援する取組みが期待されている。

　このような類似症例の提示を実現する従来技術として、特許文献１では、データベースに保存されている読影レポートに対応する医用画像の画像特徴量と読影レポートに含まれるテキスト情報とを用いて類似症例を提示する方法が提案されている。具体的には、類似症例を検索する際、１次検索として類似の画像形態を示す読影レポートが検索される。その後、２次検索として、１次検索で検索された読影レポートのテキスト情報間において代表キーワードが抽出された後、抽出されたキーワードに対して予め応付けられた画像特徴量が選択され、選択された画像特徴量から症例間の類似度が算出される。読影レポートに記述されたテキスト情報は読影者が着目した観点を示している。すなわち、特許文献１に記載の方法では、予め画像とキーワードとの対応付けが行われていれば、読影者が着目した観点が反映された類似症例を提示することができる。

特開２００９－０９３５６３号公報

　しかし、特許文献１に記載の方法では、複数の医用画像に対して１つのテキストが付与された読影レポートについては、画像特徴量と読影レポートに含まれるキーワードとを対応付けることができない。このため、読影レポートに記述された読影者が着目した観点を反映した類似症例を提示できないという課題がある。

　複数の医用画像に対して１つのテキストが付与される診断の一例としては造影ＣＴ（Ｃｏｍｐｕｔｅｄ　Ｔｏｍｏｇｒａｐｈｙ）検査が挙げられる。造影ＣＴ検査では、患者に造影剤を投与する前後の時間帯で複数の画像を撮像する。読影医は、撮影された複数の画像を用いて、各時相の造影効果の遷移を見ることにより、読影レポートを作成する。

　このように作成された読影レポートには、全ての画像に対して付与されたキーワードと、特定の画像に対して付与されたキーワードとが混在する。具体的に、「肝細胞癌」などの疾病名に関するキーワードは、撮像された画像全体に対して付与されるキーワードである。一方、「濃染」または「低吸収」などの画像所見に関するキーワードは、特定の画像に対して付与されるキーワードである。これらのキーワードは混在して読影レポートに記述されるため、キーワードと各医用画像とを単純に対応づけることはできない。

　前述したように、読影レポートに記述されたテキスト情報は、読影者が着目した観点を示している。即ち、キーワードと各医用画像とが間違って対応付けられていた場合には、読影者が着目した観点を反映した類似症例を提示できない。

　そこで本発明は、上記課題を解決するものであって、複数の医用画像に対して１つの読影レポートが付与されている場合であっても、医師の着目点が反映された類似症例を簡便に検索することができる、類似症例検索装置および類似症例検索方法を提供することを目的とする。

　また、上記類似症例検索装置で用いられる関連度データベースを作成する関連度データベース作成装置および関連度データベース作成方法を提供することを目的とする。

　上記課題を解決するために、本発明のある局面に係る類似症例検索装置は、複数の第１医用画像を含む第１医用画像群と当該第１医用画像群を読影した結果が記載された１つの文書データである第１読影レポートとを含む第１症例データに類似する第２症例データを症例データベースより検索する類似症例検索装置であって、第１医用画像群から複数の画像特徴量を抽出する画像特徴抽出部と、前記第１読影レポートから、（ａ）医用画像の特徴を示す文字列である読影項目または（ｂ）医用画像に基づく読影者の診断結果である疾病名を、キーワードとして抽出するキーワード抽出部と、前記キーワード抽出部が取得したキーワードを含むセンテンスから、前記キーワードの付随概念を示す単語である属性値を取得するキーワード属性取得部と、キーワードおよび属性値の組合せと画像特徴量との関連度を記憶している関連度データベースを参照することにより取得される、前記キーワード抽出部が抽出したキーワードおよび前記キーワード属性取得部が取得した当該キーワードの属性値の組合せと前記画像特徴抽出部が抽出した各画像特徴量との関連度で、前記画像特徴抽出部が抽出した各画像特徴量と、前記症例データベースに記憶されている第２症例データに含まれる複数の第２医用画像である第２医用画像群から抽出される各画像特徴量とを重み付けすることにより、各々が、各画像特徴量を要素とする、前記第１医用画像群に対する検索ベクトルと前記第２医用画像群に対する検索ベクトルとを生成する検索ベクトル生成部と、前記第１医用画像群に対する検索ベクトルと、前記第２医用画像群に対する検索ベクトルとの類似度に基づいて、前記症例データベースに記憶されている第２症例データを検索する類似症例検索部とを備える。

　この構成によると、検索ベクトルの作成時に各画像特徴量に重み付けが行われる。このときに利用される重みは、第１読影レポートから抽出されるキーワードおよびそのキーワードの属性値の組合せと、各画像特徴量との関連度である。キーワードおよび属性値は、読影者が着目した観点を示す値である。このため、読影者が着目した観点を反映した類似症例を検索することができる。また、属性値は、キーワードの付随概念を示す。このため、属性値は、第１医用画像群のうちどの第１医用画像に基づいて対象読影レポートが記載されたかを知る手掛かりとなる。よって、複数の医用画像に対して１つのテキストが付与された症例に対しても、読影者が着目した観点を反映した類似症例を簡便に検索することができる。

　なお、本発明は、このような特徴的な処理部を備える類似症例検索装置として実現することができるだけでなく、類似症例検索装置に含まれる特徴的な処理部が実行する処理をステップとする類似症例検索方法として実現することができる。また、類似症例検索装置が備える特徴的な処理部としてコンピュータを機能させるためのプログラムとして実現することもできる。また、症例検索方法に含まれる特徴的なステップをコンピュータに実行させるプログラムとして実現することもできる。そして、そのようなプログラムを、ＣＤ－ＲＯＭ（Ｃｏｍｐａｃｔ　Ｄｉｓｃ－Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）等のコンピュータ読取可能な不揮発性の記録媒体やインターネット等の通信ネットワークを介して流通させることができるのは、言うまでもない。

　本発明によると、複数の読影対象画像に対して１つのテキストが付与された症例に対しても、読影者が着目した観点を反映した類似症例を簡便に検索することができる。

図１は、本発明の実施の形態１に係る類似症例検索装置の特徴的な機能構成を示すブロック図である。図２は、症例データベースに記憶されている症例データの一例を示す図である。図３は、キーワード辞書の一例を示す図である。図４は、属性辞書の一例を示す図である。図５は、関連度データベースの一例を示す図である。図６は、本発明の実施の形態１に係る類似症例検索装置が実行する全体的な処理の流れを示すフローチャートである。図７は、キーワード属性取得処理（図６のステップＳ１０３）の詳細な処理の流れを示すフローチャートである。図８は、出力部により出力媒体へ出力された画面の一例を示す図である。図９は、出力部により出力媒体へ出力された画面の一例を示す図である。図１０は、本発明の実施の形態２に係る関連度データベース作成装置の特徴的な機能構成を示すブロック図である。図１１は、本発明の実施の形態２に係る関連度データベース作成装置が実行する全体的な処理の流れを示すフローチャートである。図１２は、時相属性値と画像撮影時刻とを対応付けるデータテーブルの一例を示す図である。図１３は、キーワードと画像特徴量との間の相関比の概念図である。図１４は、本発明の実施の形態１に係る類似症例検索装置と実施の形態２に係る関連度データベース作成装置との構成上の関係を示す図である。図１５は、本発明の実施の形態３に係る関連度データベース作成装置の特徴的な機能構成を示すブロック図である。図１６は、本発明の実施の形態３に係る関連度データベース作成装置が実行する全体的な処理の流れを示すフローチャートである。図１７は、実施の形態１に係る類似症例検索装置または実施の形態２もしくは３に係る関連度データベース作成装置を実現するコンピュータシステムのハードウェア構成を示すブロック図である。

　以下、本発明の実施の形態について、図面を用いて詳細に説明する。なお、以下で説明する実施の形態は、いずれも本発明の好ましい一具体例を示すものである。以下の実施の形態で示される数値、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、本発明を限定する主旨ではない。本発明は、請求の範囲だけによって限定される。よって、以下の実施の形態における構成要素のうち、本発明の最上位概念を示す独立請求項に記載されていない構成要素については、本発明の課題を達成するのに必ずしも必要ではないが、より好ましい形態を構成するものとして説明される。

　本発明の実施の形態に係る類似症例検索装置は、超音波画像、ＣＴ画像、または核磁気共鳴画像等の医用画像の読影に際し、読影者が読影した画像症例に対する類似症例を検索する装置である。

　本発明のある実施態様に係る類似症例検索装置は、複数の第１医用画像を含む第１医用画像群と当該第１医用画像群を読影した結果が記載された１つの文書データである第１読影レポートとを含む第１症例データに類似する第２症例データを症例データベースより検索する類似症例検索装置であって、第１医用画像群から複数の画像特徴量を抽出する画像特徴抽出部と、前記第１読影レポートから、（ａ）医用画像の特徴を示す文字列である読影項目または（ｂ）医用画像に基づく読影者の診断結果である疾病名を、キーワードとして抽出するキーワード抽出部と、前記キーワード抽出部が取得したキーワードを含むセンテンスから、前記キーワードの付随概念を示す単語である属性値を取得するキーワード属性取得部と、キーワードおよび属性値の組合せと画像特徴量との関連度を記憶している関連度データベースを参照することにより取得される、前記キーワード抽出部が抽出したキーワードおよび前記キーワード属性取得部が取得した当該キーワードの属性値の組合せと前記画像特徴抽出部が抽出した各画像特徴量との関連度で、前記画像特徴抽出部が抽出した各画像特徴量と、前記症例データベースに記憶されている第２症例データに含まれる複数の第２医用画像である第２医用画像群から抽出される各画像特徴量とを重み付けすることにより、各々が、各画像特徴量を要素とする、前記第１医用画像群に対する検索ベクトルと前記第２医用画像群に対する検索ベクトルとを生成する検索ベクトル生成部と、前記第１医用画像群に対する検索ベクトルと、前記第２医用画像群に対する検索ベクトルとの類似度に基づいて、前記症例データベースに記憶されている第２症例データを検索する類似症例検索部とを備える。

　この構成によると、検索ベクトルの作成時に各画像特徴量に重み付けが行われる。このときに利用される重みは、第１読影レポートから抽出されるキーワードおよびそのキーワードの属性値の組合せと各画像特徴量との関連度である。キーワードおよび属性値は、読影者が着目した観点を示す値である。このため、読影者が着目した観点を反映した類似症例を検索することができる。また、属性値は、キーワードの付随概念を示す。このため、属性値は、第１医用画像群のうちどの第１医用画像に基づいて対象読影レポートが記載されたかを知る手掛かりとなる。よって、複数の医用画像に対して１つのテキストが付与された症例に対しても、読影者が着目した観点を反映した類似症例を簡便に検索することができる。

　好ましくは、前記キーワード属性取得部は、前記キーワード抽出部が取得したキーワードを含む周辺のテキストデータから、前記キーワードの属性値として、前記第１医用画像群に含まれる各第１医用画像の相対的な撮影時刻または撮影時刻帯を示す時相属性値を取得する。

　属性値として時相属性値を用いることにより、第１医用画像群のうちどの第１医用画像に基づいて対象読影レポートが記載されたかを知ることができる。このため、第１医用画像群に対して１つのテキストが付与された症例に対しても、読影者が着目した観点を反映した類似症例を検索することができる。

　また、前記キーワード属性取得部は、前記キーワード抽出部が取得したキーワードを含む周辺のテキストデータから、前記キーワードの属性値として、前記第１医用画像群に含まれる各第１医用画像における、前記キーワードが示す情報の有無を示す存在属性値を取得しても良い。

　ある第１医用画像において、読影項目が示す情報があるが、他の第１医用画像においては、読影項目が示す情報がない場合に、属性値として存在属性値を用いることにより、第１医用画像群のうちどの第１医用画像に基づいて対象読影レポートが記載されたかを知ることができる。このため、第１医用画像群に対して１つのテキストが付与された症例に対しても、読影者が着目した観点を反映した類似症例を検索することができる。

　また、前記キーワード属性取得部は、前記キーワード抽出部が取得したキーワードを含む周辺のテキストデータから、前記キーワードの属性値として、読影対象の臓器の部位を示す部位属性値を取得しても良い。

　複数の第１医用画像間で読影対象としている臓器の部位が異なる場合には、属性値として部位属性値を用いることにより、第１医用画像群のうちどの第１医用画像に基づいて対象読影レポートが記載されたかを知ることができる。このため、第１医用画像群に対して１つのテキストが付与された症例に対しても、読影者が着目した観点を反映した類似症例を検索することができる。

　また、上述の類似症例検索装置は、さらに、前記類似症例検索部が検索した第２症例データを外部に出力する出力部を備えても良い。

　好ましくは、前記出力部は、前記類似症例検索部が検索した第２症例データを、同類の疾病名ごとに分類して外部に出力する。

　読影者は類似症例の検索結果を用いて自身の診断結果（読影結果）に対して他の疾病名の可能性を検討する際、検索結果の各所見から自身の診断結果とは異なる疾病名表記を見つけ出す必要が生じる。検索結果に対して同類の疾病名で分類した表示を行うことにより、読影者は検索結果として提示された各症例の疾病名を簡単に確認することができるため、読影時間を短縮することが可能になる。

　また、前記類似症例検索部は、前記症例データベースに記憶されている第２症例データのうち、当該第２症例データが含む読影レポートに含まれる画像所見と確定診断結果とが一致する第２症例データのみを検索対象として、前記症例データベースに記憶されている第２症例データを検索し、前記画像所見は、前記第２症例データに含まれる前記第１医用画像群に対する読影者による診断結果であり、前記確定診断結果は、前記第２症例データに含まれる前記第１医用画像群に対する確定した診断結果であっても良い。

　前記画像所見は、前記症例データに含まれる前記第１医用画像に対する読影者による診断結果であり、前記確定診断結果は、前記症例データに含まれる前記第１医用画像に対する確定した診断結果である。症例データベースには、画像ノイズまたは撮影装置の特性により、画像だけからでは確定診断と一致する病変を指摘することができない医用画像が含まれる。このような医用画像のみからは病変を推定すること自体が困難である可能性が高く、類似症例データとして提示すると誤診のリスクが高まる可能性がある。逆に、画像所見と確定診断結果とが一致する症例データは、医用画像から確定診断結果と同じ病変を指摘できることを担保することができる症例データであり、類似症例として適切だと言える。よって、画像所見と確定診断結果とが一致する症例データのみを検索対象とすることにより、類似症例を参照することによる誤診リスクを低減することが可能になる。

　本発明の他の実施の形態に係る関連度データベース作成装置は、複数の医用画像から画像特徴量を抽出する画像特徴抽出部と、前記複数の医用画像から、前記画像特徴抽出部が抽出した画像特徴量の属性値を取得する画像特徴属性取得部と、読影者が前記複数の医用画像を読影した結果が記載された文書データである読影レポートから、（ａ）医用画像の特徴を示す文字列である読影項目または（ｂ）医用画像に基づく読影者の診断結果である疾病名を、キーワードとして抽出するキーワード抽出部と、前記キーワード抽出部が抽出したキーワードを含むセンテンスから、前記キーワードの属性値を取得するキーワード属性取得部と、前記読影レポートから抽出された前記キーワードおよび前記キーワードの属性値と、前記複数の医用画像から抽出された前記画像特徴量および前記画像特徴量の属性値とに基づいて、同一の属性値を有するキーワードおよび画像特徴量からなる組合せを生成する同属性データ生成部と、前記組合せから、キーワードと画像特徴量との間の関連度を算出することにより、キーワードおよび属性値の組合せと画像特徴量との関連度を示した関連度データベースを作成する関連度算出部とを備える。

　この構成によると、同一の属性値を有するキーワードと画像特徴量との間で関連度を算出している。このため、上述の類似症例検索装置で使用される、キーワードおよび属性値の組合せと画像特徴量との関連度を示した関連度データベースを作成することができる。

　好ましくは、前記キーワード属性取得部は、前記キーワード抽出部が取得したキーワードを含む周辺のテキストデータから、前記キーワードの属性値として、前記複数の医用画像の各々の相対的な撮影時刻または撮影時刻帯を示す時相属性値を取得する。

　属性値として時相属性値を用いることにより、複数の医用画像のうちどの医用画像に基づいて対象読影レポートが記載されたかを知ることができる関連度データベースを作成することができる。このため、上述の類似症例検索装置は、複数の医用画像に対して１つのテキストが付与された症例に対しても、読影者が着目した観点を反映した類似症例を検索することができる。

　また、前記キーワード属性取得部は、前記キーワード抽出部が取得したキーワードを含む周辺のテキストデータから、前記キーワードの属性値として、前記複数の医用画像の各々における、前記キーワードが示す情報の有無を示す存在属性値を取得しても良い。

　ある医用画像において、読影項目が示す情報があるが、他の医用画像においては、読影項目が示す情報がない場合に、属性値として存在属性値を用いることにより、複数の医用画像のうちどの医用画像に基づいて対象読影レポートが記載されたかを知ることができる関連度データベースを作成することができる。このため、上述の類似症例検索装置は、複数の医用画像に対して１つのテキストが付与された症例に対しても、読影者が着目した観点を反映した類似症例を検索することができる。

　複数の医用画像間で読影対象としている臓器の部位が異なる場合には、属性値として部位属性値を用いることにより、複数の医用画像のうちどの医用画像に基づいて対象読影レポートが記載されたかを知ることができる関連度データベースを作成することができる。このため、上述の類似症例検索装置は、複数の医用画像に対して１つのテキストが付与された症例に対しても、読影者が着目した観点を反映した類似症例を検索することができる。

　具体的には、前記画像特徴属性取得部は、医用画像の撮影時刻と時相属性値とを対応付けたデータテーブルを参照することにより、前記複数の医用画像の各々の撮影時刻から、前記画像特徴抽出部が抽出した画像特徴量の属性値として、時相属性値を取得しても良い。

　また、上述の関連度データベース作成装置は、さらに、症例データを記憶している症例データベースから、症例データに含まれる複数の医用画像および読影レポートを取得する読影対象取得部と、前記症例データベースが更新された場合に、前記読影対象取得部に前記症例データベースに記憶されている前記複数の医用画像および前記読影レポートを取得させる更新制御部とを備え、前記画像特徴抽出部は、前記読影対象取得部が取得した複数の医用画像から画像特徴量を抽出し、前記キーワード抽出部は、前記読影対象取得部が取得した読影レポートから、キーワードを抽出しても良い。

　この構成によると、症例データベースが更新された場合に、症例データベースから複数の医用画像および読影レポートが取得される。このため、キーワードおよび属性値の組合せと画像特徴量との関連度を示した関連度データベースが更新される。よって、上述の類似症例検索装置は、読影者が着目した観点を反映した類似症例を検索することができる。

　また、前記更新制御部は、前記症例データベースの更新時に、前記読影対象取得部に対して、前記症例データベースに含まれる全ての症例データに含まれる複数の医用画像および読影レポートを取得させても良い。

　また、前記更新制御部は、前記症例データベースに記憶されている全ての読影レポートに含まれるキーワードの出現頻度が閾値以下のキーワードを含む読影レポートと当該読影レポートに対応する複数の医用画像とを、前記症例データベースの更新時に、前記読影対象取得部に取得させても良い。

　出現頻度が少ないキーワードに対しては、関連度の不確実性が高いため、関連度は更新の必要が高い。このように、症例データベース内のキーワード頻度に応じて更新の可否を判定することにより、更新時の計算量を低減できるため、更新時間を短縮することができる。

　（実施の形態１）
　まず、実施の形態１～３で用いる用語を説明する。

　「画像特徴量」とは、医用画像から抽出される画像特徴量であり、医用画像における臓器や病変部分の形状に関するもの、輝度分布に関するものなどがある。画像特徴量として、例えば、非特許文献「根本，清水，萩原，小畑，縄野，“多数の特徴量からの特徴選択による乳房Ｘ線像上の腫瘤影判別精度の改善と高速な特徴選択法の提案”，　電子情報通信学会論文誌Ｄ－ＩＩ，　Ｖｏｌ．Ｊ８８－Ｄ－ＩＩ，　Ｎｏ．２，　ｐｐ．４１６－４２６，　２００５年２月」には、４９０種類の特徴量を用いることが記載されている。本実施の形態においても、医用画像の撮像に使用した医用画像撮影装置（モダリティ）または読影の対象臓器ごとに、予め定めた数十～数百種の画像特徴量を用いる。

　「キーワード」とは、以下に述べる「読影項目」および「疾病名」の何れかを示す。

　「読影項目」とは、本明細書では、「読影医が、読影対象の画像の特徴を言語化した文字列」と定義する。使用する医用画像撮影装置または対象臓器等により、読影項目として使用される用語はほぼ限定される。例えば、「読影項目」として、分葉状、棘状、不整形、境界明瞭、輪郭不明瞭、低濃度、高濃度、低吸収、高吸収、スリガラス状、石灰化、モザイク状、濃染、低エコー、高エコー、毛羽立ち、等が挙げられる。

　「疾病名」とは、医師（読影者）が医用画像やその他の検査を基に診断した疾病名のことである。例えば、「疾病名」として、肝細胞癌、嚢胞、血管腫、等が挙げられる。

　「属性」とは、各キーワードの付随概念を示す単語である。具体的には、時相属性、存在属性、部位属性の３種類に分類される。なお、「属性」は、画像特徴量からも取得される。

　時相属性とは、検査機器による撮像時間または造影剤を注入してから撮像するまでの時間（撮像タイミング）に対応付けられた概念である。例えば、造影ダイナミックＣＴ検査の場合では、動脈相または平衡相等が時相属性の属性値に該当する。つまり、時相属性の属性値は、複数の医用画像の各々の相対的な撮影時刻または撮影時刻帯を示す。

　存在属性とは、読影項目または疾病名のある／なしを示す概念である。存在属性の属性値は「存在」と「非存在」の２つが該当する。例えば、「濃染を認める」という文章は、「濃染」というキーワードが“存在する”という意味であり、「認める」は、属性値「存在」を示す文字列情報になる。また、「濃染は認められない」という文章は、「濃染」というキーワードが“存在しない”という意味であり、「認めない」は、属性値「非存在」を示す文字列情報になる。

　部位属性とは、臓器や臓器位置、臓器内の部分領域を示す概念である。例えば「肝臓」または「肝Ｓ１領域」等が部位属性の属性値に該当する。

　（実施の形態１：構成の説明）
　以下、本発明の実施の形態１に係る類似症例検索装置について、図面を用いて詳細に説明する。

　図１は、本発明の実施の形態１に係る類似症例検索装置の特徴的な機能構成を示すブロック図である。

　類似症例検索装置１００は、読影者の読影結果に応じた症例データ（以下、「症例」とも言う。）を検索する装置である。

　類似症例検索装置１００は、読影対象取得部１０５、キーワード抽出部１０６、キーワード属性取得部１０７、画像特徴抽出部１０８、検索ベクトル生成部１０９、類似症例検索部１１０、および出力部１１１を備える。類似症例検索装置１００は、外部の症例データベース１０１、キーワード辞書１０２、属性辞書１０３、関連度データベース１０４に接続される。

　以下、図１に示した、症例データベース１０１および類似症例検索装置１００の各構成要素の詳細について順に説明する。

　症例データベース１０１は、例えばハードディスクまたはメモリ等からなる記憶装置に記憶される。症例データベース１０１は、読影者に提示する読影対象の画像を示す複数の医用画像と、その複数の医用画像に対応する１つの読影レポートと、から構成される症例データを複数記憶しているデータベースである。ここで、医用画像とは、画像診断のために用いられる画像データであり、電子媒体に格納された画像データを示す。本明細書中では、画像データのことを単に画像とも言う。また、読影レポートとは、医用画像の読影結果に加え、画像診断後に行われる生検等の確定診断結果までを示す情報である。読影レポートは、文書データ（テキストデータ）である。生検とは、患部の一部を切り取って、顕微鏡などで調べる検査のことである。

　図２は、症例データベース１０１に記憶されている症例データを構成する、医用画像群２０としてのＣＴ画像および読影レポート２１の一例をそれぞれ示す図である。医用画像群２０は、複数の医用画像から構成されるものとする。読影レポート２１は、読影レポートＩＤ２２、画像ＩＤ２３、画像所見２４および確定診断結果２５を含む。

　読影レポートＩＤ２２は、読影レポート２１を識別するための識別子である。画像ＩＤ２３は、医用画像群２０を識別するための識別子である。画像所見２４は、画像ＩＤ２３の医用画像群２０に対する診断結果を示す情報である。つまり、画像所見２４は、読影項目および疾病名を含む、診断結果（読影結果）および診断理由（読影理由）を示す情報である。確定診断結果２５は、読影レポートＩＤ２２で示される患者の確定診断結果を示す。ここで確定診断結果とは、手術もしくは生検で得られた試験体の顕微鏡による病理検査、またはその他様々な手段によって、対象の患者の真の状態が何であったのかを明らかにした診断結果である。

　キーワード辞書１０２は、例えばハードディスクまたはメモリ等からなる記憶装置に記憶される。キーワード辞書１０２は、読影レポート２１から抽出されるキーワードを記憶しているデータベースである。図３は、キーワード辞書１０２の一例を示す図である。図３に示すように、キーワード辞書１０２には、キーワード３０がリスト形式で記憶されている。

　属性辞書１０３は、例えばハードディスクまたはメモリ等からなる記憶装置に記憶される。属性辞書１０３は、読影レポート２１から抽出される属性値および属性値に該当する対象ワードが記憶されたデータベースである。図４は、属性辞書１０３の一例を示す図である。図４に示すように、属性辞書１０３には、予め定められた属性４０および属性値４１に対する対象ワード４２が関連付けられた形式で記憶されている。例えば、医用画像群２０に含まれる各医用画像の撮影時刻を示す時相属性の属性値として、単純相、動脈相および平衡相が存在する。読影レポート２１内に動脈相または早期相などのワードが含まれている場合には、時相属性の属性値は動脈相である。また、読影レポート２１内に平衡相または後期相などのワードが含まれている場合には、時相属性の属性値は平衡相である。

　関連度データベース１０４は、例えばハードディスクまたはメモリ等からなる記憶装置に記憶されている。

　関連度データベース１０４は、読影レポート２１から抽出したキーワードおよび属性と医用画像群２０から抽出した画像特徴量との関連度を記憶しているデータベースである。図５は、関連度データベース１０４の一例を示す図である。図５に示すように、関連度データベース１０４は、読影レポート２１から抽出したキーワード５０および属性値５１の組合せと、画像特徴量５２との関連度とを記憶している。関連度が大きいほど両者の関連性が強いことを示している。

　読影対象取得部１０５は、症例データベース１０１から、読影者が診断を行った医用画像群２０および読影レポート２１を取得する。例えば、キーボードまたはマウス等から入力された情報をメモリ等に記憶する。そして、読影対象取得部１０５は、取得した医用画像群２０および読影レポート２１を、キーワード抽出部１０６および画像特徴抽出部１０８に出力する。

　キーワード抽出部１０６は、キーワード辞書１０２を参照することにより、読影対象取得部１０５が取得した読影レポート２１の中からキーワードを抽出し、抽出したキーワードと読影レポート２１とをキーワード属性取得部１０７に出力する。具体的なキーワード抽出方法については後述する。

　キーワード属性取得部１０７は、キーワード抽出部１０６から取得したキーワードおよび読影レポート２１と、属性辞書１０３とを用いて、キーワードに対する属性値を取得し、取得したキーワードおよび属性値の組合せを検索ベクトル生成部１０９に出力する。具体的なキーワード属性値取得方法については後述する。

　画像特徴抽出部１０８は、読影対象取得部１０５が取得した医用画像群２０に対して画像特徴量を算出し、算出した画像特徴量を検索ベクトル生成部１０９に出力する。具体的な画像特徴量算出方法については後述する。

　検索ベクトル生成部１０９は、キーワード属性取得部１０７から取得したキーワードおよび属性値の組合せ、画像特徴抽出部１０８から取得した画像特徴量、および関連度データベース１０４を用いて、検索ベクトルを生成する。検索ベクトル生成部１０９は、生成した検索ベクトルを、類似症例検索部１１０に出力する。検索ベクトルとは、関連度データベース１０４に示される画像特徴量の関連度を用いて重み付けされた画像特徴量を要素とするベクトルである。具体的な検索ベクトル生成方法については後述する。なお、検索ベクトルは、読影対象とされている症例（第１症例）の医用画像群である第１医用画像群と、症例データベース１０１に記憶されている症例（第２症例）の医用画像群である第２医用画像群との、それぞれについて生成される。

　類似症例検索部１１０は、検索ベクトル生成部１０９から取得した検索ベクトルを用いて、症例データベース１０１に記憶されている症例の中から、読影対象とされている第１症例と類似度の高い第２症例を検索する。類似症例検索部１１０は、検索された第２症例の読影レポートＩＤ２２を出力部１１１へ出力する。具体的な類似度の算出方法については後述する。

　出力部１１１は、類似症例検索部１１０から取得した読影レポートＩＤを、外部の出力媒体へ出力する。出力媒体は、例えば液晶ディスプレイまたはＣＲＴなどのモニタである。症例を外部に出力することにより、読影者は症例データを確認することができる。

　次に、以上のように構成された類似症例検索装置１００の動作について説明する。

　（実施の形態１：動作の説明）
　図６は、類似症例検索装置１００が実行する処理の全体的な流れを示すフローチャートである。

　まず、読影対象取得部１０５は、読影対象の複数の第１医用画像である第１医用画像群と、第１医用画像群に対する読影レポートである第１読影レポートを取得する。つまり、読影対象取得部１０５は、症例データベース１０１から読影者が診断した医用画像群２０および読影レポート２１を、第１医用画像群および第１読影レポートとしてそれぞれ取得する。読影対象取得部１０５は、取得した医用画像群２０（第１医用画像群）および読影レポート２１（第１読影レポート）を、画像特徴抽出部１０８およびキーワード抽出部１０６にそれぞれ出力する（ステップＳ１０１）。

　医用画像群２０と読影レポート２１の取得は、読影者の診断終了後に行えばよい。これにより、読影者は診断終了後、自動的に類似症例を確認することができる。

　また、読影対象取得部１０５は、既に症例データベース１０１に記憶されている症例であれば、読影者以外が診断した症例であっても、読影者が選択した任意の症例に対して、医用画像群２０と読影レポート２１とを取得してもよい。これにより、読影者以外の人が診断した症例を用いて類似症例を検索することができるため、カンファレンス等の読影時以外での利用が可能になる。

　次に、キーワード抽出部１０６は、読影対象取得部１０５から取得した読影レポート２１に対し、キーワード辞書１０２を参照することによりキーワードを抽出し、抽出したキーワード、および読影レポート２１をキーワード属性取得部１０７に出力する（ステップＳ１０２）。例えば、キーワード抽出部１０６は、図３に示されるキーワード辞書１０２を参照し、読影レポート２１中に「濃染」という単語が含まれていれば、「濃染」をキーワードとして抽出する。

　次に、キーワード属性取得部１０７は、キーワード抽出部１０６から取得したキーワードおよび読影レポート２１と、属性辞書１０３とを用いて、キーワードの属性値を取得する。キーワード属性取得部１０７は、キーワードおよび属性値の組合せを検索ベクトル生成部１０９に出力する（ステップＳ１０３）。

　図７はキーワード属性取得処理（図６のステップＳ１０３）の詳細な処理の流れを示すフローチャートである。

　まず、キーワード属性取得部１０７は、キーワード抽出部１０６から取得したキーワードの中から、１つのキーワードを選択する（ステップＳ２０１）。

　次に、キーワード属性取得部１０７は、キーワード抽出部１０６から取得した読影レポート２１の中から、ステップＳ２０１で選択されたキーワードを含むセンテンスを抽出する（ステップＳ２０２）。具体的なセンテンス抽出処理方法としては、例えば、選択したキーワードの前後に存在する“改行”や“。”などの句読点を抽出し、抽出した改行または句読点間の文書を１センテンスとして抽出すればよい。

　次に、キーワード属性取得部１０７は、ステップＳ２０２で抽出されたセンテンスの中から、ステップＳ２０１で選択されたキーワードの時相属性値を取得する（ステップＳ２０３）。具体的には、属性辞書１０３を参照することにより、ステップＳ２０２で抽出されたセンテンスの中から、時相属性に該当する対象ワードを抽出し、抽出した対象ワードに該当する時相属性値を取得する。例えば、図４に示す属性辞書１０３を用いて時相属性値を抽出する際、キーワード属性取得部１０７は、センテンス中に、動脈相または早期相などのワードが含まれている場合には、時相属性値として動脈相を取得する。

　なお、キーワード抽出部１０６が抽出したキーワードが疾病名に関する場合は、全ての時相を属性として付与してもよい。疾病名は全医用画像の情報に対して判断されたキーワードであることが自明のため、誤った属性付与を防ぐことができる。

　次に、キーワード属性取得部１０７は、ステップＳ２０２で抽出されたセンテンスの中から、ステップＳ２０１で選択されたキーワードの存在属性値を取得する（ステップＳ２０４）。具体的には、属性辞書１０３を参照することにより、ステップＳ２０２で抽出されたセンテンスの中から、存在属性に該当する対象ワードを抽出し、抽出した対象ワードに該当する存在属性値を取得する。

　なお、存在属性に該当する対象ワードがセンテンス中に記載されていない場合は、ステップＳ２０１で選択されたキーワードに「存在」の属性値を付与すればよい。読影レポートの中には体言止めで表記されているセンテンスが多く見られる。例えば、「肝Ｓ１領域に濃染。」と表記される場合は、濃染が「存在する」ことが前提であり、「ある」や「認める」などの存在を示すワードは省略される。一方、非存在の場合は、「肝Ｓ１領域に濃染なし。」のように、非存在に該当する対象ワードが付記される。よって、センテンス中に存在属性に該当する対象ワードが無い場合は、ステップＳ２０１で選択されたキーワードに「存在」の属性値を付与すればよい。

　次に、キーワード属性取得部１０７は、ステップＳ２０２で抽出されたセンテンスの中から、ステップＳ２０１で選択されたキーワードの部位属性値を取得する（ステップＳ２０５）。具体的には、属性辞書１０３を参照することにより、ステップＳ２０２で抽出されたセンテンスの中から、部位属性に該当する対象ワードを抽出し、抽出した対象ワードに該当する部位属性値を取得する（ステップＳ２０５）。

　なお、センテンス中に部位属性に該当する対象ワードが存在しない場合は、例えば、ステップＳ２０１で選択されたキーワードよりも前のセンテンスを逐次的に探索し、最初に検出した部位属性値を部位属性値として取得してもよい。例えば、「肝Ｓ１の早期相に濃染を認める。後期相ではｗａｓｈｏｕｔされている。」という文章があった場合、「ｗａｓｈｏｕｔ」というキーワードには部位属性値が存在しない。しかし、一つ前のセンテンスには「肝Ｓ１」という部位属性値が存在するため、「ｗａｓｈｏｕｔ」に部位属性値を付与することが可能になる。

　また、センテンス中に部位属性に該当する対象ワードが存在しない場合は、例えば、ステップＳ２０１で選択されたキーワードが属するパラグラフを選択し、選択したパラグラフ中で最も頻度の高い部位属性値を部位属性として取得してもよい。一般的に、複数の臓器について書かれた読影レポートには、各臓器に対する所見がパラグラフ単位で記述される。パラグラフ内で最も高頻度の部位属性値は臓器に該当するため、少なくとも正しい臓器名を部位属性値として取得することが可能になる。なお、パラグラフの検出は、例えば空白行または改行をパラグラフ間の区切りとして検出すればよい。

　次に、キーワード属性取得部１０７は、ステップＳ２０１で選択されたキーワードに対して、ステップＳ２０３～Ｓ２０５で取得した属性値を対応付ける（ステップＳ２０６）。例えば、ステップＳ２０１で「濃染」というキーワードが選択され、このキーワードを含むセンテンスが「肝Ｓ１に早期濃染を認める」であった場合には、ステップＳ２０３～Ｓ２０５では、時相属性値として「早期相」、存在属性値として「存在」、部位属性値として「肝Ｓ１」がそれぞれ取得される。このため、（濃染、早期相、存在、肝Ｓ１）というキーワードおよび属性値の組合せが作成される。

　最後に、キーワード属性取得部１０７は、キーワード抽出部１０６から取得したキーワードがステップＳ２０１で全て選択されたかを判定し、選択されていない場合にはステップＳ２０１へ戻り、選択されている場合には処理を終了する（ステップＳ２０７）。

　以上、ステップＳ２０１からステップＳ２０６の処理を行うことにより、ステップＳ１０３においてキーワードおよび属性値の組合せを取得することが可能になる。

　ここで、図６に示した類似症例検索装置１００の動作の説明に戻る。

　画像特徴抽出部１０８は、読影対象取得部１０５が取得した医用画像群２０から画像特徴量を抽出し、抽出した画像特徴量および医用画像群２０を検索ベクトル生成部１０９に出力する（ステップＳ１０４）。

　次に、検索ベクトル生成部１０９は、キーワード属性取得部１０７から取得したキーワードおよび属性値の組合せ、画像特徴抽出部１０８から取得した画像特徴量、ならびに関連度データベース１０４を用いて、医用画像群２０に対する検索ベクトルを生成し、類似症例検索部１１０に出力する（ステップＳ１０５）。具体的には、検索ベクトル生成部１０９は、キーワード属性取得部１０７から取得したキーワードおよび属性値の組合せに対する画像特徴量の関連度を、関連度データベース１０４から取得する。検索ベクトル生成部１０９は、取得した関連度を、当該画像特徴量に対する重みとして、画像特徴抽出部１０８から取得した画像特徴量にかけ合せることにより、画像特徴量の重み付けを行う。例えば、ステップＳ１０４において画像特徴量として平均輝度値、中心領域の平均輝度値、辺縁領域の平均輝度値をそれぞれ取得したとする。この際、取得した各画像特徴量の値をベクトル表現することで、（１００，５０，１５０）という画像特徴量ベクトルが生成される。同様に、関連度データベース１０４から取得した、平均輝度値、中心領域の平均輝度値、辺縁領域に対する関連度も（０．８，０．５，０．２）のようにベクトル表現することができる。このため、重み付けられた画像特徴量は、これらを要素ごとに掛け合わせた（８０，２５，３０）と計算される。このようにして算出されたベクトルが検索ベクトルとして生成される。なお、検索ベクトルは、読影対象とされている症例（第１症例）の医用画像群である第１医用画像群と、症例データベース１０１に記憶されている症例（第２症例）の医用画像群である第２医用画像群との、それぞれについて生成される。症例データベース１０１に記憶されている症例に対する、画像特徴量とキーワードおよび属性値とは、予め症例データベース１０１に登録されていてもよい。また、読影対象取得部１０５が症例データベース１０１に登録されている症例を取得し、画像特徴抽出部１０８、キーワード抽出部１０６およびキーワード属性取得部１０７が処理を行なうことにより、抽出または取得しても良い。

　次に、類似症例検索部１１０は、検索ベクトル生成部１０９から取得した検索ベクトルを用いて、症例データベース１０１に記憶されている症例の中から、読影対象とされている第１症例と類似度の高い第２症例を検索し、検索された第２症例の読影レポートＩＤ２２を出力部１１１へ出力する（ステップＳ１０６）。具体的な類似度の算出方法としては、例えば、検索ベクトル生成部１０９から取得した第１症例に含まれる第１医用画像群に対する検索ベクトルと、症例データベース１０１に記憶されている第２症例に含まれる第２医用画像群に対する検索ベクトルとの間のコサイン距離を、類似度として算出すればよい。

　最後に、出力部１１１は、類似症例検索部１１０から取得した読影レポートＩＤ２２に該当する症例データを、外部の出力媒体へ出力する（ステップＳ１０７）。

　図８は、出力部１１１により液晶ディスプレイ等の出力媒体の画面の一例を示す図である。図８に示すように、出力部１１１は、読影者の診断結果に対して、類似度の高い順に類似症例を提示する。

　なお、出力部１１１は、類似症例検索部１１０で検索された症例を同類の疾病名毎に分類して表示してもよい。図９は、図８の出力例に対して、検索結果を同類の疾病名毎に分類して表示した例である。読影者が類似症例の検索結果を用いて自身の診断結果に対して他の疾病名の可能性を検討する際、検索結果の各所見から自身の診断結果とは異なる疾病名表記を見つけ出す必要性が生じる。検索結果に対して同類の疾病名で分類した表示を行うことにより、読影者は検索結果として提示された各症例の疾病名を簡単に確認することができる。このため、読影時間を短縮することが可能になる。

　以上、図６に示すステップＳ１０１～Ｓ１０７の処理が実行されることにより、類似症例検索装置１００は、読影者の診断結果に対して読影者が着目した観点が反映された類似症例を簡便に検索することができる。

　また、読影対象取得部１０５は、必ずしも症例データベース１０１から医用画像群２０および読影レポート２１を取得する必要はない。例えば、読影対象取得部１０５は、他のシステムから、読影者が読影を行ったばかりの医用画像群２０および読影レポート２１を取得しても良い。

　また、類似症例検索装置１００は、症例データベース１０１に記憶されている症例データのうち、画像所見２４と確定診断結果２５とが一致する症例データのみを検索対象としても良い。症例データベース１０１には、画像ノイズまたは撮影装置の特性により、画像だけからでは確定診断と一致する病変を指摘することができない医用画像が含まれる。このような医用画像のみからは病変を推定すること自体が困難である可能性が高く、類似症例データとして提示すると誤診のリスクが高まる可能性がある。逆に、画像所見２４と確定診断結果２５とが一致する症例データは、医用画像から確定診断結果と同じ病変を指摘できることを担保することができる症例データであり、類似症例データとして適切だと言える。よって、画像所見２４と確定診断結果２５とが一致する症例データのみを検索対象とすることにより、誤診のリスクを低減することが可能になる。

　また、症例データベース１０１、キーワード辞書１０２、属性辞書１０３および関連度データベース１０４は、類似症例検索装置１００に備えられていてもよい。

　また、症例データベース１０１、キーワード辞書１０２、属性辞書１０３および関連度データベース１０４は、類似症例検索装置１００とネットワークを介して接続されたサーバ上に備えられてもよい。

　また、読影レポート２１は、医用画像群２０内に付属データとして含まれていてもよい。

　以上のように、本実施の形態に係る類似症例検索装置１００は、複数の読影画像に対して１つのテキストが付与された症例に対しても、読影者の診断結果に対して読影者が着目した観点が反映された類似症例を簡便に検索することができる。

　つまり、検索ベクトルの作成時に各画像特徴量に重み付けが行われる。このときに利用される重みは、第１症例に含まれる読影レポートから抽出されるキーワードおよびそのキーワードの属性値の組合せと、各画像特徴量との関連度である。キーワードおよび属性値は、読影者が着目した観点を示す値である。このため、読影者が着目した観点を反映した類似症例を検索することができる。また、属性値は、キーワードの付随概念を示す。このため、属性値は、第１医用画像群のうちどの第１医用画像に基づいて対象読影レポートが記載されたかを知る手掛かりとなるため、複数の医用画像に対して１つのテキストが付与された症例に対しても、読影者が着目した観点を反映した類似症例を検索することができる。

　（実施の形態２）
　次に、本発明の実施の形態２に係る関連度データベース作成装置について説明する。

　本実施の形態の関連度データベース作成装置は、症例データベース１０１から関連度データベース１０４を自動的に生成する特徴を有する。

　上述の実施の形態１に係る類似症例検索装置１００は、既に作成された関連度データベース１０４を用いた類似症例検索方法について述べた。しかし、関連度データベース１０４は、類似症例検索装置１００を使用する前に作成されている必要がある。

　そこで本実施の形態における関連度データベース作成装置は、症例データベース１０１から取得した医用画像および症例データを用いて、キーワードおよび属性値の組合せと画像特徴量との関連度を算出し、関連度データベース１０４に書き込む。

　これにより、関連度データベース作成装置は、類似症例検索装置１００を使用する前に関連度データベース１０４を自動的に作成することができる。

　以下、初めに図１０を参照しながら、関連度データベース作成装置の各構成について順に説明する。

　（実施の形態２：構成の説明）
　図１０は、本発明の実施の形態２に係る関連度データベース作成装置の特徴的な機能構成を示すブロック図である。

　図１０において、図１と同じ構成要素については同じ符号を付し、説明を繰り返さない。図１０に示す関連度データベース作成装置２００が図１に示す類似症例検索装置１００と相違する点は、画像特徴属性取得部２０１と、同属性データ生成部２０２と、関連度算出部２０３と、書込部２０４とを有する点である。

　画像特徴属性取得部２０１は、画像特徴抽出部１０８が抽出した画像特徴量に対応する属性値を取得し、同属性データ生成部２０２へ出力する。具体的な属性取得方法については後述する。

　次に、同属性データ生成部２０２は、キーワード属性取得部１０７から取得したキーワードおよび属性値と、画像特徴属性取得部２０１から取得した画像特徴および属性値を用い、同じ属性値を持つキーワードおよび画像特徴の組合せを作成し、関連度算出部２０３へ出力する。

　次に、関連度算出部２０３は、同属性データ生成部から取得したキーワードおよび画像特徴の組合せを用いて、同じ属性値を持つキーワードと画像特徴との関連度を算出し、書込部２０４へ出力する。具体的な関連度の算出方法は後述する。

　最後に、書込部２０４は、関連度算出部２０３から取得した関連度を、関連度データベース１０４に書き込む。

　次に、以上のように構成された関連度データベース作成装置２００の動作について説明する。

　（実施の形態２：動作の説明）
　図１１は、関連度データベース作成装置２００が実行する処理の全体的な流れを示すフローチャートである。Ｓ１０１～Ｓ１０４の処理は、図６に示したＳ１０１～Ｓ１０４と同じである。このため、その説明を繰り返さない。

　画像特徴属性取得部２０１は、画像特徴抽出部１０８から取得した画像特徴量に対応する属性値を取得し、取得した属性値を同属性データ生成部２０２に出力する（ステップＳ３０１）。具体的には、画像特徴属性取得部２０１は、時相属性値と部位属性値のいずれか又は両方を取得する。

　時相属性値の具体的な取得方法としては、図１２に示すように、予め読影画像の撮影時刻と時相属性値とを対応付けるデータテーブルを用意しておき、撮影時間に応じて時相属性の属性値を取得すればよい。例えば、読影画像の撮影開始時の時相属性値は「単純相」であり、撮影開始時を基準として１秒後から８０秒後までの間の撮影された別の読影画像の時相属性値は「動脈相」である。また、定期健診のようにルーチン化された検査であれば、読影画像が撮影された順番に合わせて「単純相」、動脈相」、「平衡相」のように時相属性値を取得してもよい。また、血管の輝度値などの画像特徴量から時相属性値を取得することもできる。

　また、部位属性値の具体的な取得方法としては、例えば、画像特徴抽出部１０８から取得した画像特徴量の抽出元となる読影画像に対して、非特許文献：「坂下，出口，北坂，森，末永，“ＣＴ値分布推定を用いた４時相腹部３次元ＣＴ像からの複数臓器領域の抽出手法”，電子情報通信学会技術研究報告，医用画像，Ｖｏｌ．１０６，Ｎｏ．１４５，ｐｐ．４９－５４，２００６年６月」等に記載の画像処理方法を用いることによって、画像特徴抽出部１０８から取得した画像特徴量に対する部位属性値を自動的に取得することができる。

　次に、同属性データ生成部２０２は、キーワード属性取得部１０７から取得したキーワードおよび属性値の組合せと、画像特徴属性取得部２０１が取得した画像特徴量および属性値の組合せを用いて、共通の属性値を持つ画像特徴量およびキーワードの組合せを作成する。同属性データ生成部２０２は、作成した組合せを関連度算出部２０３に出力する（ステップＳ３０２）。

　次に、関連度算出部２０３は、同属性データ生成部２０２から取得した組合せを用いて、画像特徴量とキーワードとの関連度を算出し、算出した関連度を書込部２０４へ出力する（ステップＳ３０３）。関連度の算出方法としては、例えば、画像特徴量とキーワードとの相関比を算出すればよい。以下、１対の画像特徴量とキーワードとの相関比の算出方法について詳細に説明する。

　相関比は、質的データと量的データとの間の相関関係を表す指標であり、以下の式１で表される。

　読影レポート中に、あるキーワードを含む場合および含まない場合の２カテゴリを考え、これを質的データとする。読影画像から抽出した、ある画像特徴量の値そのものを量的データとする。例えば、症例データベース１０１に含まれる全症例に対し、読影レポートを、あるキーワードおよび属性値の組合せを含むものまたは含まないものに区分する。ここでは、キーワード「濃染、動脈相」と画像特徴量「腫瘤内部の輝度平均値、動脈相」との相関比を求める方法について説明する。なお、キーワードおよび画像特徴量に属性値「動脈相」が含まれているが、これは、共通する属性値を示している。このため、キーワード「濃染、動脈相」と画像特徴量「腫瘤内部の輝度平均値、動脈相」との相関比を求めることは、キーワード「濃染」および属性値「動脈相」の組合せと画像特徴量「腫瘤内部の輝度平均値」との相関比を求めることと同じである。式１においては、カテゴリｉ＝１を「濃染、動脈相」を含むもの、カテゴリｉ＝２を「濃染、動脈相」を含まないものとする。読影レポートに「濃染、動脈相」を含む症例から抽出した腫瘤画像の「腫瘤内部の輝度平均値、動脈相」のｊ番目の観測値をｘ_１ｊとする。また、読影レポートに「濃染、動脈相」を含まない症例から抽出した腫瘤画像の「腫瘤内部の輝度平均値、動脈相」のｊ番目の観測値をｘ_２ｊとする。「濃染、動脈相」とは造影動脈相にてＣＴ値が上昇することを表すため、この場合、相関比が大きく（１に近く）なることが予想される。また、濃染は腫瘤の種類に依存し、腫瘤の大きさには依存しないため、キーワード「濃染、動脈相」と画像特徴量「腫瘤面積」との相関比は小さく（０に近く）なることが予想される。このようにして、属性値が共通する全てのキーワードと全ての画像特徴量との間の相関比が計算される。

　図１３に、キーワードおよび属性値の組合せと画像特徴量との間の相関比の概念図を示す。この図では、相関比を多値表現しており、キーワードと画像特徴量の間の実線の太さが相関比の大きさに相当している。例えば、造影早期相にてＣＴ値が上昇する「濃染、動脈相」と、動脈相における腫瘤内部の輝度平均（図１３では「動脈相　輝度平均」と略記）との相関が大きくなっている。

　相関比の値に着目することで、あるキーワードおよび属性値の組合せと相関の高い画像特徴量を特定することができる。実際には１つの症例には、複数の画像や複数の病変（腫瘤）が含まれる場合が多く、その場合は読影レポートには複数の病変に関する記載が含まれることになる。例えば、造影ＣＴ検査では、造影剤使用前や使用後の複数時刻におけるタイミングでＣＴ撮影を行う。そのため、スライス画像の集合が複数得られ、スライス画像の１つの集合には複数の病変（腫瘤）が含まれ、１つの病変からは複数の画像特徴量が抽出される。よって、（スライス画像集合数）×（１人の患者から検出された病変数）×（画像特徴量の種類数）の個数だけ画像特徴量が得られ、これら複数の画像特徴量と、１つの読影レポートから抽出された複数の読影項目や疾病名との相関関係を求める必要がある。

　以上、１対の画像特徴量とキーワード間の相関比の算出方法について説明した。

　ここで、図１１に示した関連度データベース作成装置２００の動作の説明に戻る。

　最後に、書込部２０４は、関連度算出部２０３から取得した関連度を、関連度データベース１０４へ書き込む（ステップＳ３０４）。

　以上のように、本実施の形態に係る関連度データベース作成装置２００は、症例データベース１０１から取得した症例データに含まれるキーワードと画像特徴量との関連度を算出することができるため、類似症例検索装置１００を使用する前に関連度データベース１０４を自動的に作成することができる。

　ここで、本発明の実施の形態１に係る類似症例検索装置１００と、実施の形態２に係る関連度データベース作成装置２００の構成上の関係を図１４に示す。図１４に示すように、類似症例検索装置１００と関連度データベース作成装置２００は、関連度データベース１０４、症例データベース１０１、キーワード辞書１０２、および属性辞書１０３を介して連結されている。

　（実施の形態３）
　次に、本発明の実施の形態３に係る関連度データベース作成装置について説明する。

　本実施の形態の関連度データベース作成装置は、症例データベース１０１から関連度データベース１０４を自動的に更新する特徴を有する。

　上述の実施の形態２に係る関連度データベース作成装置２００は、症例データベース１０１が与えられた際に関連度を自動的に算出する方法について述べた。ここで、症例データベース１０１は日々の診断の結果が蓄積され、逐次更新される特徴を持つ。関連度データベース１０４に存在しないキーワードを含んだ読影レポートが、症例データベース１０１に新しく追加された場合、新たに追加されたキーワードに対しては関連度が算出されていない。このため、このキーワードを使った検索を行うことができず、結果として類似症例検索装置１００において、読影者が着目した観点が反映された類似症例が検索できないという問題が生じる。

　そこで本実施の形態における関連度データベース作成装置は、症例データベース１０１の更新に応じて、新たにキーワードおよび属性値の組合せと画像特徴量との関連度を再計算し、関連度データベース１０４に書き込む。

　これにより、症例データベース１０１の更新された場合であっても、読影者が着目した観点が反映された類似症例を検索することができる。

　以下、初めに図１５を参照しながら、関連度データベース作成装置の各構成について順に説明する。

　（実施の形態３：構成の説明）
　図１５は、本発明の実施の形態３に係る関連度データベース作成装置の特徴的な機能構成を示すブロック図である。

　図１５において、図１０と同じ構成要素については同じ符号を付し、説明を繰り返さない。図１５に示す関連度データベース作成装置３００が図１０に示す関連度データベース作成装置２００と相違する点は、症例データベース１０１から取得した症例から、関連度データベース１０４を更新するか否かを判定する更新制御部３０１を有する点である。

　更新制御部３０１は、症例データベース１０１から取得した医用画像および症例データを用いて、関連度データベース１０４を更新するか否かを判定する。更新制御部３０１は、更新すると判定した場合は、関連度データベース１０４の更新を行う。一方、更新制御部３０１は、更新しないと判定した場合には、関連度データベース１０４の更新を行わない。具体的な判定方法については後述する。関連度データベース１０４を更新すると判定した場合には、更新制御部３０１は、読影対象取得部１０５に症例データベース１０１から症例を取得させる。

　次に、以上のように構成された関連度データベース作成装置３００の動作について説明する。

　（実施の形態３：動作の説明）
　図１６は、関連度データベース作成装置３００が実行する処理の全体的な流れを示すフローチャートである。図１６において、図１１と同じ処理については同じ符号を付し、説明を繰り返さない。

　更新制御部３０１は、症例データベース１０１から取得した症例データを用いて、関連度データベース１０４を更新するか否かを判定する。ここで、更新すると判定した場合は、ステップＳ１０１へ進む。一方、更新しないと判定した場合には、処理を終了する（ステップＳ４０１）。

　具体的な更新判定方法としては、例えば、症例データベース１０１の更新に合わせて逐次的に行えばよい。つまり、更新制御部３０１は、症例データベース１０１が更新された場合に、読影対象取得部１０５に対して、症例データベース１０１に含まれる全ての症例データに含まれる複数の医用画像および読影レポートを取得させる。

　また、他の更新判定方法としては、例えば、症例データベース１０１に存在するキーワードの出現頻度をカウントし、出現頻度が閾値以下のキーワードに対してのみ、症例データベース１０１が更新された場合に、関連度データベース１０４を更新してもよい。つまり、更新制御部３０１は、症例データベース１０１に記憶されている全ての読影レポートに含まれるキーワードの出現頻度が閾値以下のキーワードを含む読影レポートと当該読影レポートに対応する複数の医用画像とを、症例データベース１０１の更新時に、読影対象取得部１０５に取得させる。関連度データベース１０４には、キーワードごとに関連度が記憶されている。症例データベース１０１内に含まれるキーワードの出現頻度が十分に大きければ、既に十分な数のデータを用いて関連度が算出されたことになる。このような高頻度のキーワードが新しく追加された場合は、仮に再計算を行ったとしても値は大きく変化しないため、関連度の更新を行う必要性が低い。一方、出現頻度が少ないキーワードに対しては、関連度の不確実性が高いため、関連度は更新の必要が高い。このように、症例データベース内のキーワード頻度に応じて更新の可否を判定することにより、更新時の計算量を低減できるため、更新時間を短縮することができる。

　以上のように、本実施の形態に係る関連度データベース作成装置３００は、症例データベース１０１が更新された場合であっても、キーワードと画像特徴量との関連度を更新することができるため、読影者が着目した観点を反映した類似症例を検索することができる。

　以上、本発明に係る類似症例検索装置および関連度データベース作成装置について、実施の形態に基づいて説明したが、本発明は、これらの実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したもの、異なる実施の形態における構成要素を組み合わせて構築される形態なども、本発明の範囲内に含まれる。

　なお、上述の類似症例検索装置１００では、キーワード属性取得部１０７が、読影レポートから抽出されたキーワードに基づいて属性値を抽出している。しかし、キーワードに基づいて属性値を抽出することができない場合には、補助的に医用画像から属性値を取得するようにしても良い。この属性値の取得は、関連度データベース作成装置２００の画像特徴属性取得部２０１による属性値の取得と同様の方法により行われる。検索ベクトル生成部１０９は、キーワード属性取得部１０７が取得した属性値の代わりに、医用画像から取得された属性値を用いることにより検索ベクトルを生成し、類似症例検索部１１０が、生成された検索ベクトルを用いて類似症例を検索する。

　上記の類似症例検索装置または関連度データベース作成装置は、具体的には、マイクロプロセッサ、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ハードディスクドライブ、ディスプレイユニット、キーボードおよびマウスなどから構成されるコンピュータシステムとして構成されても良い。ＲＡＭまたはハードディスクドライブには、コンピュータプログラムが記憶されている。マイクロプロセッサが、コンピュータプログラムに従って動作することにより、類似症例検索装置または関連度データベース作成装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。

　図１７は、実施の形態１に係る類似症例検索装置または実施の形態２もしくは３に係る関連度データベース作成装置を実現するコンピュータシステムのハードウェア構成を示すブロック図である。

　類似症例検索装置または関連度データベース作成装置は、コンピュータ４３４と、コンピュータ４３４に指示を与えるためのキーボード４３６およびマウス４３８と、コンピュータ４３４の演算結果等の情報を提示するためのディスプレイ４３２と、コンピュータ４３４で実行されるプログラムを読み取るためのＣＤ－ＲＯＭ装置４４０および通信モデム（図示せず）とを含む。

　類似症例検索装置または関連度データベース作成装置が行う処理であるプログラムは、コンピュータで読取可能な記録媒体であるＣＤ－ＲＯＭ４４２に記憶され、ＣＤ－ＲＯＭ装置４４０で読み取られる。または、コンピュータネットワークを通じて通信モデム４５２で読み取られる。

　コンピュータ４３４は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）４４４と、ＲＯＭ４４６と、ＲＡＭ４４８と、ハードディスク４５０と、通信モデム４５２と、バス４５４とを含む。

　ＣＰＵ４４４は、ＣＤ－ＲＯＭ装置４４０または通信モデム４５２を介して読み取られたプログラムを実行する。ＲＯＭ４４６は、コンピュータ４３４の動作に必要なプログラムやデータを記憶する。ＲＡＭ４４８は、プログラム実行時のパラメータなどのデータを記憶する。ハードディスク４５０は、プログラムやデータなどを記憶する。通信モデム４５２は、コンピュータネットワークを介して他のコンピュータとの通信を行う。バス４５４は、ＣＰＵ４４４、ＲＯＭ４４６、ＲＡＭ４４８、ハードディスク４５０、通信モデム４５２、ディスプレイ４３２、キーボード４３６、マウス４３８およびＣＤ－ＲＯＭ装置４４０を相互に接続する。

　さらに、上記の類似症例検索装置または関連度データベース作成装置を構成する構成要素の一部または全部は、１個のシステムＬＳＩ（Ｌａｒｇｅ　Ｓｃａｌｅ　Ｉｎｔｅｇｒａｔｉｏｎ：大規模集積回路）から構成されているとしても良い。システムＬＳＩは、複数の構成部を１個のチップ上に集積して製造された超多機能ＬＳＩであり、具体的には、マイクロプロセッサ、ＲＯＭ、ＲＡＭなどを含んで構成されるコンピュータシステムである。ＲＡＭには、コンピュータプログラムが記憶されている。マイクロプロセッサが、コンピュータプログラムに従って動作することにより、システムＬＳＩは、その機能を達成する。

　さらにまた、上記の類似症例検索装置または関連度データベース作成装置を構成する構成要素の一部または全部は、類似症例検索装置または関連度データベース作成装置に脱着可能なＩＣカードまたは単体のモジュールから構成されているとしても良い。ＩＣカードまたはモジュールは、マイクロプロセッサ、ＲＯＭ、ＲＡＭなどから構成されるコンピュータシステムである。ＩＣカードまたはモジュールは、上記の超多機能ＬＳＩを含むとしても良い。マイクロプロセッサが、コンピュータプログラムに従って動作することにより、ＩＣカードまたはモジュールは、その機能を達成する。このＩＣカードまたはこのモジュールは、耐タンパ性を有するとしても良い。

　また、本発明は、上記に示す方法であるとしても良い。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしても良いし、前記コンピュータプログラムからなるデジタル信号であるとしても良い。

　さらに、本発明は、上記コンピュータプログラムまたは上記デジタル信号をコンピュータ読み取り可能な非一時的な記録媒体、例えば、フレキシブルディスク、ハードディスク、ＣＤ－ＲＯＭ、ＭＯ、ＤＶＤ、ＤＶＤ－ＲＯＭ、ＤＶＤ－ＲＡＭ、ＢＤ（Ｂｌｕ－ｒａｙ　Ｄｉｓｃ（登録商標））、半導体メモリなどに記録したものとしても良い。また、これらの非一時的な記録媒体に記録されている上記デジタル信号であるとしても良い。

　また、本発明は、上記コンピュータプログラムまたは上記デジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしても良い。

　また、本発明は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、上記メモリは、上記コンピュータプログラムを記憶しており、上記マイクロプロセッサは、上記コンピュータプログラムに従って動作するとしても良い。

　また、上記プログラムまたは上記デジタル信号を上記非一時的な記録媒体に記録して移送することにより、または上記プログラムまたは上記デジタル信号を上記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしても良い。

　本発明は、読影者の診断結果に対して類似症例を出力する類似症例検索装置等として利用可能である。また、本発明は当該類似症例検索装置が利用する関連度データベースを作成する関連度データベース作成装置等として利用可能である。

　　　２０　医用画像群
　　　２１　読影レポート
　　　２２　読影レポートＩＤ
　　　２３　画像ＩＤ
　　　２４　画像所見
　　　２５　確定診断結果
　　　３０　キーワード
　　　４０　属性
　　　４１、５１　属性値
　　　４２　対象ワード
　　　５０　キーワード
　　　５２　画像特徴量
　　１００　類似症例検索装置
　　１０１　症例データベース
　　１０２　キーワード辞書
　　１０３　属性辞書
　　１０４　関連度データベース
　　１０５　読影対象取得部
　　１０６　キーワード抽出部
　　１０７　キーワード属性取得部
　　１０８　画像特徴抽出部
　　１０９　検索ベクトル生成部
　　１１０　類似症例検索部
　　１１１　出力部
　　２００、３００　関連度データベース作成装置
　　２０１　画像特徴属性取得部
　　２０２　同属性データ生成部
　　２０３　関連度算出部
　　２０４　書込部
　　３０１　更新制御部

Claims

　複数の第１医用画像を含む第１医用画像群と当該第１医用画像群を読影した結果が記載された１つの文書データである第１読影レポートとを含む第１症例データに類似する第２症例データを症例データベースより検索する類似症例検索装置であって、
　第１医用画像群から複数の画像特徴量を抽出する画像特徴抽出部と、
　前記第１読影レポートから、（ａ）医用画像の特徴を示す文字列である読影項目または（ｂ）医用画像に基づく読影者の診断結果である疾病名を、キーワードとして抽出するキーワード抽出部と、
　前記キーワード抽出部が取得したキーワードを含むセンテンスから、前記キーワードの付随概念を示す単語である属性値を取得するキーワード属性取得部と、
　キーワードおよび属性値の組合せと画像特徴量との関連度を記憶している関連度データベースを参照することにより取得される、前記キーワード抽出部が抽出したキーワードおよび前記キーワード属性取得部が取得した当該キーワードの属性値の組合せと前記画像特徴抽出部が抽出した各画像特徴量との関連度で、前記画像特徴抽出部が抽出した各画像特徴量と、前記症例データベースに記憶されている第２症例データに含まれる複数の第２医用画像である第２医用画像群から抽出される各画像特徴量とを重み付けすることにより、各々が、各画像特徴量を要素とする、前記第１医用画像群に対する検索ベクトルと前記第２医用画像群に対する検索ベクトルとを生成する検索ベクトル生成部と、
　前記第１医用画像群に対する検索ベクトルと、前記第２医用画像群に対する検索ベクトルとの類似度に基づいて、前記症例データベースに記憶されている第２症例データを検索する類似症例検索部と
　を備える類似症例検索装置。
　前記キーワード属性取得部は、前記キーワード抽出部が取得したキーワードを含む周辺のテキストデータから、前記キーワードの属性値として、前記第１医用画像群に含まれる各第１医用画像の相対的な撮影時刻または撮影時刻帯を示す時相属性値を取得する
　請求項１に記載の類似症例検索装置。
　前記キーワード属性取得部は、前記キーワード抽出部が取得したキーワードを含む周辺のテキストデータから、前記キーワードの属性値として、前記第１医用画像群に含まれる各第１医用画像における、前記キーワードが示す情報の有無を示す存在属性値を取得する
　請求項１に記載の類似症例検索装置。
　前記キーワード属性取得部は、前記キーワード抽出部が取得したキーワードを含む周辺のテキストデータから、前記キーワードの属性値として、読影対象の臓器の部位を示す部位属性値を取得する
　請求項１に記載の類似症例検索装置。
　さらに、
　前記類似症例検索部が検索した第２症例データを外部に出力する出力部を備える
　請求項１～４のいずれか１項に記載の類似症例検索装置。
　前記出力部は、前記類似症例検索部が検索した第２症例データを、同類の疾病名ごとに分類して外部に出力する
　請求項５に記載の類似症例検索装置。
　前記類似症例検索部は、前記症例データベースに記憶されている第２症例データのうち、当該第２症例データが含む読影レポートに含まれる画像所見と確定診断結果とが一致する第２症例データのみを検索対象として、前記症例データベースに記憶されている第２症例データを検索し、
　前記画像所見は、前記第２症例データに含まれる前記第１医用画像群に対する読影者による診断結果であり、
　前記確定診断結果は、前記第２症例データに含まれる前記第１医用画像群に対する確定した診断結果である
　請求項１～６のいずれか１項に記載の類似症例検索装置。
　複数の医用画像から画像特徴量を抽出する画像特徴抽出部と、
　前記複数の医用画像から、前記画像特徴抽出部が抽出した画像特徴量の属性値を取得する画像特徴属性取得部と、
　読影者が前記複数の医用画像を読影した結果が記載された文書データである読影レポートから、（ａ）医用画像の特徴を示す文字列である読影項目または（ｂ）医用画像に基づく読影者の診断結果である疾病名を、キーワードとして抽出するキーワード抽出部と、
　前記キーワード抽出部が抽出したキーワードを含むセンテンスから、前記キーワードの属性値を取得するキーワード属性取得部と、
　前記読影レポートから抽出された前記キーワードおよび前記キーワードの属性値と、前記複数の医用画像から抽出された前記画像特徴量および前記画像特徴量の属性値とに基づいて、同一の属性値を有するキーワードおよび画像特徴量からなる組合せを生成する同属性データ生成部と、
　前記組合せから、キーワードと画像特徴量との間の関連度を算出することにより、キーワードおよび属性値の組合せと画像特徴量との関連度を示した関連度データベースを作成する関連度算出部と
　を備える関連度データベース作成装置。
　前記キーワード属性取得部は、前記キーワード抽出部が取得したキーワードを含む周辺のテキストデータから、前記キーワードの属性値として、前記複数の医用画像の各々の相対的な撮影時刻または撮影時刻帯を示す時相属性値を取得する
　請求項８に記載の関連度データベース作成装置。
　前記キーワード属性取得部は、前記キーワード抽出部が取得したキーワードを含む周辺のテキストデータから、前記キーワードの属性値として、前記複数の医用画像の各々における、前記キーワードが示す情報の有無を示す存在属性値を取得する
　請求項８に記載の関連度データベース作成装置。
　前記キーワード属性取得部は、前記キーワード抽出部が取得したキーワードを含む周辺のテキストデータから、前記キーワードの属性値として、読影対象の臓器の部位を示す部位属性値を取得する
　請求項８に記載の関連度データベース作成装置。
　前記画像特徴属性取得部は、医用画像の撮影時刻と時相属性値とを対応付けたデータテーブルを参照することにより、前記複数の医用画像の各々の撮影時刻から、前記画像特徴抽出部が抽出した画像特徴量の属性値として、時相属性値を取得する
　請求項８～１１のいずれか１項に記載の関連度データベース作成装置。
　さらに、
　症例データを記憶している症例データベースから、症例データに含まれる複数の医用画像および読影レポートを取得する読影対象取得部と、
　前記症例データベースが更新された場合に、前記読影対象取得部に前記症例データベースに記憶されている前記複数の医用画像および前記読影レポートを取得させる更新制御部とを備え、
　前記画像特徴抽出部は、前記読影対象取得部が取得した複数の医用画像から画像特徴量を抽出し、
　前記キーワード抽出部は、前記読影対象取得部が取得した読影レポートから、キーワードを抽出する
　請求項８～１２のいずれか１項に記載の関連度データベース作成装置。
　前記更新制御部は、前記症例データベースの更新時に、前記読影対象取得部に対して、前記症例データベースに含まれる全ての症例データに含まれる複数の医用画像および読影レポートを取得させる
　請求項１３に記載の関連度データベース作成装置。
　前記更新制御部は、前記症例データベースに記憶されている全ての読影レポートに含まれるキーワードの出現頻度が閾値以下のキーワードを含む読影レポートと当該読影レポートに対応する複数の医用画像とを、前記症例データベースの更新時に、前記読影対象取得部に取得させる
　請求項１３に記載の関連度データベース作成装置。
　コンピュータが、複数の第１医用画像を含む第１医用画像群と当該第１医用画像群を読影した結果が記載された１つの文書データである第１読影レポートとを含む第１症例データに類似する第２症例データを症例データベースより検索する類似症例検索方法であって、
　第１医用画像群から複数の画像特徴量を抽出する画像特徴抽出ステップと、
　前記第１読影レポートから、（ａ）医用画像の特徴を示す文字列である読影項目または（ｂ）医用画像に基づく読影者の診断結果である疾病名を、キーワードとして抽出するキーワード抽出ステップと、
　前記キーワード抽出ステップにおいて取得されたキーワードを含むセンテンスから、前記キーワードの付随概念を示す単語である属性値を取得するキーワード属性取得ステップと、
　キーワードおよび属性値の組合せと画像特徴量との関連度を記憶している関連度データベースを参照することにより取得される、前記キーワード抽出ステップにおいて抽出されたキーワードおよび前記キーワード属性取得ステップにおいて取得された当該キーワードの属性値の組合せと前記画像特徴抽出ステップにおいて抽出された各画像特徴量との関連度で、前記画像特徴抽出ステップにおいて抽出された各画像特徴量と、前記症例データベースに記憶されている第２症例データに含まれる複数の第２医用画像である第２医用画像群から抽出される各画像特徴量とを重み付けすることにより、各々が、各画像特徴量を要素とする、前記第１医用画像群に対する検索ベクトルと前記第２医用画像群に対する検索ベクトルとを生成する検索ベクトル生成ステップと、
　前記第１医用画像群に対する検索ベクトルと、前記第２医用画像群に対する検索ベクトルとの類似度に基づいて、前記症例データベースに記憶されている第２症例データを検索する類似症例検索ステップと
　を含む類似症例検索方法。
　複数の医用画像から画像特徴量を抽出する画像特徴抽出ステップと、
　前記複数の医用画像から、前記画像特徴抽出ステップにおいて抽出された画像特徴量の属性値を取得する画像特徴属性取得ステップと、
　読影者が前記複数の医用画像を読影した結果が記載された文書データである読影レポートから、（ａ）医用画像の特徴を示す文字列である読影項目または（ｂ）医用画像に基づく読影者の診断結果である疾病名を、キーワードとして抽出するキーワード抽出ステップと、
　前記キーワード抽出ステップにおいて抽出されたキーワードを含むセンテンスから、前記キーワードの属性値を取得するキーワード属性取得ステップと、
　前記読影レポートから抽出された前記キーワードおよび前記キーワードの属性値と、前記複数の医用画像から抽出された前記画像特徴量および前記画像特徴量の属性値とに基づいて、同一の属性値を有するキーワードおよび画像特徴量からなる組合せを生成する同属性データ生成ステップと、
　前記組合せから、キーワードと画像特徴量との間の関連度を算出することにより、キーワードおよび属性値の組合せと画像特徴量との関連度を示した関連度データベースを作成する関連度算出ステップと
　を含む関連度データベース作成方法。
　請求項１６に記載の類似症例検索方法に含まれる全てのステップをコンピュータに実行させるためのプログラム。
　請求項１７に記載の関連度データベース作成方法に含まれる全てのステップをコンピュータに実行させるためのプログラム。