WO2012111288A1

WO2012111288A1 - 類似症例検索装置および類似症例検索方法

Info

Publication number: WO2012111288A1
Application number: PCT/JP2012/000885
Authority: WO
Inventors: 和紀小塚; 和豊高田; 貴史續木
Original assignee: パナソニック株式会社
Priority date: 2011-02-14
Filing date: 2012-02-09
Publication date: 2012-08-23
Also published as: US20130044925A1; CN102985924A; JP5139603B2; US9111027B2; JPWO2012111288A1

Abstract

　類似症例検索装置（１）は、読影レポートからキーワードを抽出するキーワード抽出部（３）と、診断ツリーを記憶している診断ツリー記憶部（８）を参照することで、読影レポートに対応する対象診断フローをキーワードに基づいて抽出する診断ツリー解析部（４１）と、診断項目の難易度または病名の難易度に基づいて、診断ツリー記憶部（８）に記憶されている診断ツリーに含まれる複数の診断フローの中から対象診断フローに類似する類似診断フローを抽出する類似診断フロー抽出部（４２）と、症例データ記憶部（９）に記憶されている複数の症例データの中から類似診断フローに対応する症例データを検索する類似症例検索部（５）とを備える。

Description

類似症例検索装置および類似症例検索方法

　本発明は、医療情報システム分野において、医用画像と当該医用画像の読影レポートとを含む症例データを蓄積した症例データベースから、対象となる読影レポートに類似する症例データを検索する症例検索装置および症例検索方法に関する。

　近年、読影医による医用画像の読影や臨床医による診断を支援するために、過去に読影および診断された医用画像と、その読影結果および診断結果等とに関する情報をデータベースに蓄積する取り組みが盛んに行われている。また、医師が読影／診断対象の医用画像に類似する医用画像およびその医用画像の読影結果、診断結果等に関する情報を前述のデータベースから検索する類似症例検索システムが提案されている。

　従来の症例検索システムでは、読影／診断結果が記載された文書データ（以下、「読影レポート」と記載）がデータベースに多数保存されている。そこで、医師が入力した読影レポート（以下、「検索対象」と記載）内に含まれる文字列と類似する文字列を有する読影レポートがデータベースから検索される。そして、検索された読影レポートと医用画像とが検索結果として出力される（非特許文献１を参照）。

　このような従来の症例検索システムでは、読影レポート内に含まれる各キーワードの個数を要素として持つベクトルを用いて、読影レポートが検索される。具体的には、検索対象のベクトルとデータベース内の読影レポートのベクトルとの間の距離を計算することで、検索対象に対する、データベース内の各読影レポートの類似度を計算する。そして、計算された類似度が高い読影レポートを含む読影レポートを優先して検索する。

文書に基づく類似診療文書検索システム（生体医工学　４４（１）：１９９－２０６、２００６）

　上記従来の症例検索システムによれば、検索対象と文字列の一致率が高い読影レポートを、検索対象と類似する読影レポートとして検索することができる。

　しかしながら、検索対象と文字列の一致率が高い読影レポートを含む症例データを医師に提示するだけでは、現在診断中の症例に対して医学的にどれぐらい近いかは分からない。そのため、医師は、病名を決定できない場合が多い。そこで、医師は、他の検索キーワードを用いて検索した複数の症例データを用いて、検索対象の症状を診断している。つまり、従来の方法では、複数の症例データの中から適切な症例データを検索できない場合があるという課題がある。

　そこで、本発明は、上記従来の課題を解決するためになされたものであって、複数の症例データの中から適切な症例データを検索することができる類似症例検索装置を提供することを目的とする。

　本発明の一態様に係る類似症例検索装置は、医用画像を読影する際に診断の対象となる診断項目と、前記診断項目の症状を示す診断結果とが記載された文書データである読影レポートからキーワードを抽出するキーワード抽出部と、病名が決定されるまでの診断項目と当該診断項目の症状とを含む複数の診断フローがツリー構造で表された診断ツリーを記憶している診断ツリー記憶部を参照して、前記読影レポートに対応する診断フローである対象診断フローを前記キーワードに基づいて抽出する診断ツリー解析部と、診断項目の症状を判定する難しさの度合いである診断項目の難易度、または病名を決定する難しさの度合いである病名の難易度に基づいて、前記診断ツリー記憶部に記憶されている診断ツリーに含まれる複数の診断フローの中から前記対象診断フローに類似する類似診断フローを抽出する類似診断フロー抽出部と、症例データ記憶部に記憶されている複数の症例データの中から、前記類似診断フローに対応する症例データを検索する類似症例検索部とを備える。

　この構成により、難易度に基づいて抽出された類似診断フローを用いて、症例データを検索することができる。したがって、難易度が高い診断項目または病名に着目して、効果的に症例データを検索できるので、適切な症例データを検索することが可能となる。

　また、前記病名の難易度は、前記診断ツリーにおいて、同一の病名を含む診断フローの数が多いほど難易度が高くなるように計算されてもよい。また、前記診断項目の難易度は、前記診断ツリーにおける診断項目の症状の分岐数が多いほど難易度が高くなるように計算されてもよい。また、前記病名の難易度は、前記診断ツリーにおける診断項目の症状から分岐する病名の数が多いほど難易度が高くなるように計算されてもよい。また、前記病名の難易度は、病名ごとに予め定められた値であって病名の間違えやすさ示す値が大きいほど難易度が高くなるように計算されてもよい。

　これらの構成により、医師が診断に迷うような診断項目または病名の難易度を高くできるので、より適切な症例データを検索することができる。

　また、少なくとも２つの前記対象診断フローが抽出され、かつ、前記２つの対象診断フローが互いに異なる診断ツリーに含まれる場合に、前記類似診断フロー抽出部は、診断ツリーごとに前記類似診断フローを抽出してもよい。

　この構成により、複数の対象診断フローが抽出された場合であっても、類似診断フローを抽出することが可能となる。

　なお、本発明は、このような類似症例検索装置として実現することができるだけでなく、このような類似症例検索装置が備える特徴的な構成部の動作をステップとする類似症例検索方法として実現することができる。また、本発明は、類似症例検索方法に含まれる各ステップをコンピュータに実行させるプログラムとして実現することもできる。そして、そのようなプログラムは、ＣＤ－ＲＯＭ（Ｃｏｍｐａｃｔ　Ｄｉｓｃ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）等の非一時的な記録媒体あるいはインターネット等の伝送媒体を介して配信することができるのは言うまでもない。

　本発明によれば、難易度が高い診断項目または病名に着目して効果的に症例データを検索できるので、複数の症例データの中から適切な症例データを検索することが可能となる。

図１は、医師による医用画像の読影手順を示すフローチャートである。図２は、読影レポートの一例を示す図である。図３は、診断ツリーの一例を示す図である。図４は、難易度を説明するための図である。図５は、難易度を説明するための図である。図６は、難易度を説明するための図である。図７は、難易度を説明するための図である。図８は、難易度を説明するための図である。図９は、本発明の実施の形態における類似症例検索システムの機能構成を示すブロック図である。図１０は、キーワード抽出部の詳細な機能構成を示すブロック図である。図１１は、難易度評価部の詳細な機能構成を示すブロック図である。図１２は、類似症例検索部の詳細な機能構成を示すブロック図である。図１３は、本発明の実施の形態における類似症例検索システムの利用状態を示す図である。図１４は、本発明の実施の形態における類似症例検索システムによって行われる処理の流れを示すフローチャートである。図１５は、キーワード抽出部によって行われる処理の流れを示すフローチャートである。図１６は、難易度評価部によって行われる処理の流れを示すフローチャートである。図１７は、類似診断フロー抽出部によって行われる処理の流れを示すフローチャートである。図１８は、類似診断フロー抽出部によって行われる処理の流れを示すフローチャートである。図１９は、類似診断フロー抽出部によって行われる処理の流れを示すフローチャートである。図２０は、類似診断フロー抽出部によって行われる処理の流れを示すフローチャートである。図２１は、類似診断フロー抽出部によって行われる処理の流れを示すフローチャートである。図２２は、複数診断ツリーの変更方法を説明するための図である。図２３は、類似症例検索部によって行われる処理の流れを示すフローチャートである。図２４は、検索症例制御部によって行われる処理の流れを示すフローチャートである。図２５は、類似症例検索実験で使用した診断ツリーを示す図である。図２６は、類似症例検索実験の結果を示す図である。図２７は、類似症例検索実験の結果を示す図である。図２８は、類似症例検索実験の結果を示す図である。図２９は、類似症例検索実験の結果を示す図である。

　本発明の一態様に係る症例検索装置を説明する前に、まず、医師による一般的な医用画像の読影手順について、図１および図２を用いて簡単に説明する。図１は、医師による医用画像の読影手順を示すフローチャートである。また、図２は、読影レポートおよび医用画像の一例を示す図である。

　ここで使用する用語について簡単に説明する。「診断項目」とは、医用画像を読影する際に診断の対象となる病変の種類や部位を指す。「症状」とは、病変や部位の状態を指す。また、「診断結果」とは、医師が診断項目を診断することにより得られた、当該診断項目の症状を指す。

　また、「読影レポート」とは、診断項目と診断結果とが記載された文書データである。例えば、読影レポートに「腫瘤境界部は明瞭平滑である」との記載がある場合には、診断項目は「腫瘤境界部」であり、診断結果は「明瞭平滑」である。

　また、「病名」とは、各診断項目の診断結果に基づいて、医師が最終的に決定する疾患の名前を指す。また、「症例データ」とは、医用画像と読影レポートとを含むデータを指す。

　以下、医師の診断手順を、図１を用いて説明する。

　まず、医師は、診断対象となる医用画像（例えば、ＣＴ（Ｃｏｍｐｕｔｅｄ　Ｔｏｍｏｇｒａｐｈｙ）、あるいはＭＲＩ（Ｍａｇｎｅｔｉｃ　Ｒｅｓｏｎａｎｃｅ　Ｉｍａｇｉｎｇ）などにより得られる画像）を入手する（Ｓ００）。

　次に、医師は、医用画像を読影し、診断項目を診断する（Ｓ０１）。

　ここで、診断項目の症状を判定できなかった場合（Ｓ０２のＮｏ）、医師は現在読影している医用画像の診断項目および診断結果と類似している、過去に読影した医用画像の診断項目および診断結果を検索し（Ｓ０３）、検索結果を利用して診断項目を診断する（Ｓ０１）。

　一方、診断項目の症状を判定できた場合（Ｓ０２のＹｅｓ）、医師は、図２に示すように、診断項目および診断結果を読影レポートの所見欄に入力する。

　ここで、病名を決定するために必要な診断項目の診断を終了していない場合には（Ｓ０５のＮｏ）、再びステップＳ０１へ戻り、次の診断項目を診断する。

　一方、病名を決定するために必要な診断項目の診断をすべて終了している場合には（Ｓ０５のＮｏ）、医師は、病名を決定することが可能か否かを判断する（Ｓ０６）。

　ここで、病名を決定することが不可能な場合には（Ｓ０６のＮｏ）、医師は、過去の症例データの中から、現在読影している医用画像の診断項目および診断結果と類似する過去の症例データ（以下、「類似症例」という）を検索し（Ｓ０７）、検索結果を利用して病名を決定することが可能か否かを判断する。

　一方、病名を決定することが可能な場合には（Ｓ０６のＹｅｓ）、医師は、診断項目の診断結果に基づいて病名を決定する（Ｓ０８）。そして、医師は、図２に示すように、決定した病名を病名欄に入力する。

　医師は、以上のような手順で医用画像の読影を行う。このとき、診断項目の症状の診断や病名の決定について判断に迷う場合には、医師は、類似症例を検索する。そして、医師は、検索結果と、現在読影している医用画像とを比較することで、診断項目の診断または病名の決定のための手がかりを得ることができる。

　ここで、類似症例の検索について、より具体的に考えてみる。前述の医師の読影手順では、ステップＳ０３およびＳ０７において、類似症例の検索を行っている。具体的には、ステップＳ０３における類似症例の検索は、ステップＳ０２が診断項目の症状の判定が可能かどうかを判定する分岐ステップであるため、医師が、ある診断項目の診断に対して迷っていることを示している。一方、ステップＳ０７における類似症例の検索は、ステップＳ０６が病名を決定可能か否かを判定する分岐ステップであるため、医師が、診断項目の診断を終えた後に病名の決定に対して迷っていることを示している。これら読影手順における医師の状態について分析した結果、医師が類似症例の検索を必要とする状態とその原因は主に以下の５種類であると特定された。

　以下に、その５種類の原因を詳細に説明する。

　（１）診断項目を診断する際に、その診断項目の症状として判定可能な症状同士がよく似ている。

　医師が診断項目を診断する際に、その診断項目の症状として判定可能な症状同士が似ている場合には、その症状間の違いを見極めて、適切な症状を判定することが難しくなる。その結果、類似症例検索を必要とする可能性が高いと考えられる。

　（２）診断項目を診断する際に、その診断項目の症状として判定可能な症状の数が多い。

　医師が診断項目を診断する際に、その診断項目の症状として判定可能な症状が多数である場合には、どの症状であるかを判定することが難しくなる可能性が高い。その結果、類似症例検索を必要とする可能性が高いと考えられる。

　（３）病名を決定するために診断することが必要な診断項目の数が多い。

　病名を決定するために、多くの診断項目を診断しなければならない場合は、その診断項目の数に比例して病名を決定することが難しくなる。その結果、類似症例検索を必要とする可能性が高いと考えられる。

　（４）病名を決定するために診断することが必要な診断項目を全て診断しても、病名を決定することができない。

　医師は、診断項目を順番に診断して、病名の決定に至る。このとき、診断項目の診断を全て終え、診断すべき診断項目がないのに病名が１つに決まらない場合がある。つまり、診断項目の診断が終了しても、病名の選択肢が多く存在する場合がある。このような場合には、医師は、病名を決定することが難しい。したがって、類似症例検索を必要とする可能性が高いと考えられる。

　（５）１種類の診断項目を診断するだけでは、病名を決定できない。

　医師は、病名を決定するまでに、様々な種類の診断項目（形状・模様など）を診断する。この診断項目の種類数が多ければ多いほど病名を決定することが難しく、類似症例検索を必要とする可能性が高いと考えられる。

　上記５項目は全て、診断項目の診断または病名の決定のときに、医師がどれだけ迷うかという、症状の診断または病名の決定の難しさに関するものである。そのため、各診断項目や病名に対して医師がどれだけ迷うかを利用して、迷いやすい過去の症例データを提示することができれば、医師にとって有用であると考えられる。

　例えば、検索対象の読影レポート（症状Ａ）の類似症例を検索するときに、症状Ａを提示するだけでなく、診断項目に対して判定可能な複数の症状（例えば症状Ａ、Ｂ、Ｃ、Ｄ、Ｅ、Ｆ、Ｇ）のうち判定に迷う症状（例えば症状Ａ、Ｄ、Ｇのみ）を含む症例データを検索できれば医師にとって有用である。このとき、迷う症例（症状Ｄ、Ｇ）は、検索対象の文字列（症状Ａ）とは異なるため、従来技術における、読影レポート中の文字列の一致度合いによる類似症例の検索方法では検索できない。

　これらを鑑み、本願発明者らは、文字列の一致だけでなく、上記のように診断の難しさを利用して、類似症例を検索する方法を検討した。以降では、この診断の難しさを、診断の難易度または単に難易度と記載する。

　ここで、診断の難易度についてより詳しく説明する。診断の難易度とは、医師が診断項目を診断（症状と病名の判定）するときにどれぐらい症状の判定に迷うかを示す。例えば、難易度は、診断項目の症状が、症状Ａまたは症状Ｂであるかを判定することがどれぐらい難しいかを示す。また例えば、難易度は、病名が、病名Ｃまたは病名Ｄであるかを決定することがどれぐらい難しいかを示す。

　このような診断の難易度を利用して類似症例を検索することにより、医師が診断に迷う症例を検索することが可能となる。しかしながら、過去の読影レポートには、各診断項目の難易度は記載されていない。また、過去の症例に対して、これから医師に難易度を付与させることは困難である。したがって、診断の難易度は、読影レポート以外から決定する必要がある。

　そこで、本願発明者らは、医師の診断手順と診断の難易度との関係に着目した。医師が診断を行っている症例に対して、その診断の手順から難易度を抽出できれば、医師が診断に迷う症例を検索できる。以下では、診断手順から難易度を抽出する方法について述べる。

　まず、診断フローについて説明する。医師は、医学知識をもとに各診断項目の症状を判定している。医師は、この診断項目の症状の判定を複数回繰り返すことで、最終的な病名を決定している。このように、病名と、その病名が決定されるまでに診断されるべき診断項目およびその診断項目の症状とを診断フローと呼ぶ。

　具体的には、医師は、まず、予め定められた診断項目を診断する。例えば、乳房超音波診断を行う場合、はじめに医師は境界部の症状（境界が明瞭平滑／明瞭粗ぞう／不明瞭）を判定する。次に、医師は、境界部の診断結果に応じて、次の診断項目を診断する。例えば、境界部が明瞭平滑であれば、医師は、次に形状の診断を行う。また、境界部が明瞭粗ぞう、または不明瞭であれば、医師は、次に境界線の断裂の診断を行う。つまり、医師は、診断項目の診断結果に応じて、次に診断する診断項目を変化させながら診断項目を診断し、最後に病名を決定する。

　そのため、診断フローは、診断項目と症状とを組み合わせたツリー構造で表すことができる。また、この診断フローは、検査部位や診断画像の種類によって、ある程度予め定めることができる。したがって、このツリーは、医学書や過去症例から構築できる。以降では、この診断フローをツリー構造で表したものを診断ツリーと呼ぶことにする。

　また、一般的に、医師は１種類の診断ツリーから病名を決定することはなく、様々な角度から診断を繰り返して病名を決定する。そのため、ひとつの診断対象に対して複数種類の診断ツリー（形状に関する診断ツリー、テクスチャに関する診断ツリーなど）を組み合わせて診断を行っている場合が多い。ここで、乳房超音波診断の形状に対する診断ツリーの例を図３に示す。

　診断ツリーは、診断項目、症状の種類、病名の情報を持つ。診断ツリー中のあるひとつのフローを診断フローと呼ぶとすると、現在の読影レポートに記載された内容は、診断項目と診断結果、病名からなるため、診断ツリーを参照すれば、診断フローを特定できる。また、読影レポートに記載された診断フローが診断ツリーの中でどこにあるかが分かる。

　一方、診断ツリーは診断項目、症状の種類、病名の情報を持つため、ツリーの分岐情報とそれらの個数から上記の類似症例検索を必要する原因に対して、以下の指標により、それぞれ診断の難易度を算出できる。

　（１）に対する評価指標
　ある診断項目の症状として判定可能な症状同士がよく似ていることを評価するためには、その診断項目を判定した症状の先に同じ病名がどれだけ存在するかを見ればよい。例えば、図４のように診断項目ａを判定した後に、パターンＡとパターンＢとに同じ病名が多く存在する場合には、その症状はそれら病名を区別する要素にはなっていないと考えられる。したがって、症状同士には対象とする病名を大きく分けるような特徴がない、つまり、判定する症状同士が似ているため、その症状間の判定を行うのは難しくなると考えられる。そのため、診断ツリーからある診断項目下の病名数を計数することで難易度を評価する。

　（２）に対する評価指標
　診断ツリーから症状の種類が多いことを評価するためには、診断ツリー中の症状の種類数（診断項目に対する枝の数）を用いればよい。例えば、図３の形状という診断項目に対して、症状の個数（４個：不整形、多角形、分葉形、円・楕円）から難易度を評価する。図５のようにこの種類数が多いほど難易度が高い診断項目として評価する。

　（３）に対する評価指標
　診断ツリーから複数の診断項目を診断しても、病名が決定しないことを評価するためには、診断ツリーに含まれる診断項目数を用いればよい。図６のような診断ツリーに対して、実線矢印と点線矢印のフローを比較した場合には、診断する回数が多い実線の方が診断は難しく、難易度が高いと評価する。

　（４）に対する評価指標
　全ての診断項目を診断しても、病名が決定されない場合について説明する。図７のような診断ツリーがある場合に、矢印で示すように診断項目を診断したとする。このような場合、診断項目の診断を全て終えても、病名１、２、３の中からいずれかを決定しなければならない。このときには、診断ツリー中の病名数から難易度を評価すればよい。例えば、図７においては、病名１、２、３の病名数（３個）。図３においては、境界部が明瞭平滑、形状が不整形の診断ツリーに対する病名数（２個）から難易度を評価する。

　上記において、病名の個数が少ない場合でも、病名の選択が難しい場合が考えられる。このときには、病名ごとに、その病名の間違えやすさを評価する。ここで、病名の間違えやすさとは、読影レポートの結果に対して、後の診断でどれだけその読影結果が変更されたかを指標に計算する。例えば、医師の診断には大きく分けると、読影医による読影と臨床医による診断の２段階ある。このときに、読影時の病名と最終的に医師が決定した病名が異なる確率を間違えやすさとしてもよい。一方で、読影医による読影過程には、１次読影と２次読影があるが、この１次読影と２次読影の結果が異なる確率を病名の間違えやすさとしてもよい。以下では、これらをまとめて疾患データとして記載する。

　（５）に対する評価指標
　１つの診断項目の種類では、病名が決定しないことを評価するためには、読影レポートから項目数を抽出し、使用した診断ツリーの個数を計算すればよい。図８のように形状に関する診断ツリーと色に関する診断ツリーがある場合について説明する。このとき、それぞれ矢印のように診断を行い病名１に至ったとする。この場合には、読影レポートにはそれぞれの診断ツリーに関する文字列（例えば「項目ａ」など）が含まれている。したがって、読影レポートの文字列を解析し、各診断ツリーにあてはめることで診断ツリーをいくつ使用したかが分かる。また、この診断ツリーの個数が多いほど複雑な診断をしていることになり、難易度が高いと評価する。

　以下の実施の形態においては、使用した診断ツリーの個数から難易度を評価する手法ではなく、診断ツリーを組み合わせて提示する症例を効果的に変化できることを例に示す。

　このように上記の評価指標に対して、診断ツリーから上記項目の診断の難易度を推定できる。各難易度の算出については実施形態の説明時に詳しく説明する。

　これらのことから、本願発明者らは、読影レポートと診断フローを含む診断ツリーとから難易度を推定することで、目的とする類似症例検索が図れるとの着想に至った。

　以下、この着想に基づき構成した本発明の実施の形態について、図面を参照しながら説明する。なお、以下で説明する実施の形態は、いずれも本発明の好ましい一具体例を示す。つまり、以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置および接続形態、ステップ、ステップの順序などは、本発明の一例であり、本発明を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、本発明の最上位概念を示す独立請求項に記載されていない構成要素については、より好ましい形態を構成する任意の構成要素として説明される。

　（実施の形態）
　図９は、本実施の形態における類似症例検索システム１００の構成を示すブロック図である。図９に示すように、類似症例検索システム１００は、類似症例検索装置１と、入力部２と、類似症例表示部６と、読影支援データベース１０とを備える。

　（入力部２）
　入力部２は、医師が読影レポートを入力するための機器（例えば、キーボードあるいはマウスなど）である。入力部２は、医師が入力したテキストデータや選択結果をキーワード抽出部３に送付する。

　（類似症例表示部６）
　類似症例表示部６は、類似症例検索部５から症例データを受け取り、医師に提示する。類似症例表示部６は、例えばＰＣ（Ｐｅｒｓｏｎａｌ　Ｃｏｍｐｕｔｅｒ）用のディスプレイ、ＴＶ（Ｔｅｌｅｖｉｓｉｏｎ）、医療用読影モニタなどである。

　（類似症例検索装置１）
　類似症例検索装置１は、入力部２で入力された読影レポートと類似する症例データを、症例データ記憶部９から検索するための装置である。類似症例検索装置１は、キーワード抽出部３と、難易度評価部４と、類似症例検索部５とを備える。

　（キーワード抽出部３）
　キーワード抽出部３は、入力部２から読影レポートのテキストデータを受信し、テキストデータの中から医学用語、診断項目、診断結果に関わるキーワードを抽出し、難易度評価部４に送付する。つまり、キーワード抽出部３は、入力部２から読影レポートを受信し、受信した読影レポートからキーワードを抽出する。

　図１０は、キーワード抽出部３の詳細な機能構成を示すブロック図である。図１０に示すように、キーワード抽出部３は、文字列解析部３１と、文字列比較部３２とを備える。

　文字列解析部３１は、入力部２から受け取った読影レポートに対して、文字列解析を行い、名詞・助詞などを分類する。その後、文字列解析部３１は、解析済みの文字列を文字列比較部３２に送付する。

　文字列比較部３２は、文字列解析部３１で解析された文字列を受け取り、それらの文字列とキーワード辞書記憶部７に格納されている文字列とを比較し、一致する場合にはそのキーワード（以下、「文字列」ともいう）を難易度評価部４に送付する。

　（難易度評価部４）
　難易度評価部４は、キーワード抽出部３から抽出された文字列を受け取り、診断ツリー記憶部８からは診断ツリーを読み出す。難易度評価部４は、これらの文字列と診断ツリーとから診断項目の難易度を計算し、類似症例検索部５に送付する。

　図１１は、難易度評価部４の詳細な機能構成を示すブロック図である。図１１に示すように、難易度評価部４は、診断ツリー解析部４１と、類似診断フロー抽出部４２とを備えている。

　診断ツリー解析部４１は、診断ツリー記憶部８を参照して、入力部２に入力された読影レポートに対応する診断フローである対象診断フローを、キーワード抽出部３によって抽出されたキーワードに基づいて抽出する。

　具体的には、診断ツリー解析部４１は、キーワード抽出部３から受信した文字列と診断ツリー記憶部８内に格納された複数の診断ツリーの各々とを比較し、キーワードを含む診断ツリーを選択する。次に、診断ツリー解析部４１は、選択した診断ツリーと文字列とから、現在の読影レポートが前述の診断ツリーにおいて、読影レポートがどの診断フローに対応するかを解析する。そして、診断ツリー解析部４１は、診断ツリーと現在の読影レポートに対応するツリー内位置情報（対象診断フロー）とを類似診断フロー抽出部４２に送付する。

　類似診断フロー抽出部４２は、診断項目の難易度または病名の難易度に基づいて、診断ツリー記憶部８に記憶されている診断ツリーに含まれる複数の診断フローの中から対象診断フローに類似する類似診断フローを抽出する。具体的には、類似診断フロー抽出部４２は、例えば、対象診断フローに含まれる難易度が高い診断項目または病名を含む診断フローほど類似診断フローとして抽出されるように、複数の診断フローの中から類似診断フローを抽出する。

　より具体的には、類似診断フロー抽出部４２は、診断ツリーとツリー内位置情報とを受信し、現在の読影レポートに対応する対象診断フローに含まれる各診断項目の難易度を取得する。次に、類似診断フロー抽出部４２は、難易度が高い診断項目を含む診断フローを類似診断フローとして抽出し、類似症例検索部５に送付する。

　（類似症例検索部５）
　類似症例検索部５は、難易度評価部４から類似診断フローを受け取り、症例データ記憶部９の症例データの類似度を計算し、類似度が高い症例データを類似症例表示部６に送付する。つまり、類似症例検索部５は、症例データ記憶部９に記憶されている複数の症例データの中から、類似診断フローに対応する症例データを検索する。つまり、類似症例検索部５は、類似診断フローに従って診断された症例データを検索する。さらに、類似症例検索部５は、対象診断フローに従って診断された症例データも検索する。

　図１２は、類似症例検索部５の詳細な機能構成を示すブロック図である。図１２に示すように、類似症例検索部５は、検索症例制御部５１と、類似度評価部５２とを備える。

　検索症例制御部５１は、難易度評価部４から類似診断フローを受け取る。ここで、入力部２からの入力がなければ、検索症例制御部５１は、そのまま類似診断フローを類似度評価部５２に送付する。一方、入力部２からの入力がある場合には、検索症例制御部５１は、類似診断フローに重み付けして類似度評価部５２に類似診断フローを送付する。

　類似度評価部５２は、類似診断フローを受信し、症例データ記憶部９に記憶されている症例データの診断フローと類似診断フローとの類似度を計算する。次に類似度が高い症例データを類似症例表示部６に送付する。

　（読影支援データベース１０）
　読影支援データベース１０は、キーワード辞書記憶部７と、診断ツリー記憶部８と、症例データ記憶部９とを備える。

　（キーワード辞書記憶部７）
　キーワード辞書記憶部７は、キーワード抽出に用いる医学用語を記憶している。

　（診断ツリー記憶部８）
　診断ツリー記憶部８は、診断項目とその症状の種類などの診断フローに関する情報を格納している。つまり、診断ツリー記憶部８は、病名が決定されるまでの診断項目と当該診断項目の症状とを含む複数の診断フローがツリー構造で表された診断ツリーを記憶している。

　（症例データ記憶部９）
　症例データ記憶部９は、過去の読影レポートと診断に用いた医用画像を格納している。つまり、症例データ記憶部９は、読影レポートと医用画像との組である症例データを記憶している。

　（システムの利用形態）
　図１３は、本実施の形態における類似症例検索システム１００の利用形態を示す図である。

　類似症例検索システム１００は、類似症例検索装置１と、入力部２と、類似症例表示部６と、読影支援データベース１０とを備える。類似症例検索システム１００は、入力部２で入力された読影レポートに基づき、難易度評価を実現し、入力した読影レポートに対して診断の難易度が高い症例データを読影支援データベース１０から検索し、その結果を類似症例表示部６に提示する。

　次に、以上のように構成された類似症例検索システム１００における各種動作について説明する。

　（類似症例検索の処理の全体概要）
　図１４は、類似症例検索システム１００において行われる処理の流れを示すフローチャートである。図１４は、図１のステップＳ０３、Ｓ０７に対応する。

　（類似症例検索システムの処理フロー）
　（Ｓ１０：読影レポート入力）
　ステップＳ１０において、入力部２は、医師からの読影レポートの入力を受け付け、類似症例検索装置１に送付する。ここで、図２に示すような読影レポートに医師が「境界部は明瞭平滑であり、形状は不整形である。乳頭腺管癌の疑い。」と入力した場合を例にとり、具体的に説明する。ステップＳ１０においては、医師の入力である「境界部は明瞭平滑であり、形状は不整形である。乳頭腺管癌の疑い。」が類似症例検索装置１に送付される。

　（Ｓ１１：キーワード抽出）
　ステップＳ１１において、キーワード抽出部３は、読影レポートのテキストデータを受け取り、そのテキストデータから診断に関する文字列を抜き出し、難易度評価部４に送信する。以下、ステップＳ１１の詳細を、図１５を用いて説明する。

　ステップＳ３０において、キーワード抽出部３は、入力部２から受信した読影レポートを読み込む。

　ステップＳ３１において、文字列解析部３１は、入力部２から受け取った読影レポートに対して、文字列解析を行い、名詞・助詞などを分類する。その後、文字列解析部３１は、解析済みの文字列を文字列比較部３２に送付する。

　ステップＳ３２において、文字列比較部３２は、文字列解析部３１から解析済みの文字列を受信し、キーワード辞書記憶部７に記憶されている文字列と比較する。

　ステップＳ３３において、文字列比較部３２は、キーワード辞書記憶部７に記憶されている文字列の中で、文字列解析部３１から受信した文字列と一致する文字列のみを難易度評価部４に送付する。例えば、ステップＳ１０において「境界部は明瞭平滑であり、形状は不整形である。乳頭腺管癌の疑い。」という入力を受け付けた場合には、ステップＳ１１では、文字列解析部３１は、「境界部は明瞭平滑であり、形状は不整形である。」の中から文字列を解析する。例えば、文字列比較部３２は、「境界部／は／明瞭平滑／であり／、／形状／は／不整形／である／。乳頭腺管癌／の／疑い／。」のように文字列を分解する。そして、文字列解析部３１は、分解された文字列を、キーワード辞書記憶部７に記憶されている文字列（境界部、明瞭平滑、形状、不整形、乳頭腺管癌を持つ）と照らし合わせることにより、難易度評価部４に「境界部」、「明瞭平滑」、「形状」、「不整形」、「乳頭腺管癌」を送信する。

　（Ｓ１２：難易度評価）
　ステップＳ１２において、難易度評価部４は、キーワード抽出部３から抽出された文字列を受け取り、診断ツリー記憶部８から診断ツリーを受け取る。難易度評価部４は、これら文字列と診断ツリーとから診断項目の難易度を計算し、類似症例検索部５に送信する。以下、ステップＳ１２の詳細を図１６を用いて説明する。

　ステップＳ４０において、難易度評価部４は、キーワード抽出部３から受信した文字列を読み込む。

　ステップＳ４１において、診断ツリー解析部４１は、キーワード抽出部３から受信した文字列と診断ツリー記憶部８に格納された診断ツリーとを比較し、診断ツリーを選択する。つまり、診断ツリー解析部４１は、診断ツリー記憶部８を参照して、キーワード抽出部３によって抽出されたキーワードと一致する診断項目、症状、および病名を含む診断ツリーを特定する。

　ステップＳ４２において、診断ツリー解析部４１は、受信した文字列と選択した診断ツリーから、現在の読影レポートが診断ツリーに含まる複数の診断フローのうちどの診断フローに対応するかを解析する。そして、診断ツリー解析部４１は、診断ツリーと現在の読影レポートにおけるツリー内位置情報を類似診断フロー抽出部４２に送付する。つまり、診断ツリー解析部４１は、読影レポートに対応する診断フローを対象診断フローとして類似診断フロー抽出部４２に送付する。

　ステップＳ４３において、類似診断フロー抽出部４２は、診断ツリーとツリー内位置情報を受信し、現在の読影レポートに対する難易度を各診断項目について計算する。例えば、ステップＳ１１において、「境界部」、「明瞭平滑」、「形状」、「不整形」、および「乳頭腺管癌」がキーワードとして抽出された場合について考える。このとき、診断ツリー解析部４１は、「境界部」、「明瞭平滑」、「形状」、「不整形」、および「乳頭腺管癌」と、図３の診断ツリーの文字列を比較して、現在入力された読影レポートに対応する対象診断フローを抽出する。以降では、このように抽出された対象診断フローを用いて、難易度の評価について説明する。

　（Ｓ４３：診断ツリー内難易度評価）
　ステップＳ４３において、類似診断フロー抽出部４２は、類似診断フローを抽出する際に利用する難易度を計算する。

　（第１の難易度パターン：同一病名数から難易度を計算）
　なお、ステップＳ４３において、難易度は、診断項目に対する病名の一致数（同一病名数）から決定されてもよい。全ての診断項目を診断しても、病名が決定しない場合には診断が難しくなる。そのため、類似診断フロー抽出部４２は、診断項目の分岐下の病名がどれだけ一致しているかを基準に難易度を評価する。具体的には、類似診断フロー抽出部４２は、同一病名数が多い場合には難易度が高くなるように病名の難易度を評価し、少ない場合には難易度が低くなるように病名の難易度を評価する。つまり、類似診断フロー抽出部４２は、同一の病名を含む診断フローが多いほど難易度が高くなるように、病名の難易度を計算する。以下、ステップＳ４３の詳細を図１７を用いて説明する。

　ステップＳ７０において、類似診断フロー抽出部４２は、診断ツリーを読み込む。

　ステップＳ７１において、類似診断フロー抽出部４２は、検索対象のフローを計算する。

　ステップＳ７２において、類似診断フロー抽出部４２は、検索対象診断フロー（以下、検索対象フローともいう）の病名を記憶する。

　ステップＳ７３において、類似診断フロー抽出部４２は、読み込んだ診断ツリーの項目分岐数をカウントする。

　ステップＳ７４において、類似診断フロー抽出部４２は、項目分岐を読み込む。

　ステップＳ７５において、類似診断フロー抽出部４２は、分岐下に存在するステップＳ７２において記憶した病名と同一の病名数をカウントする。

　ステップＳ７６において、類似診断フロー抽出部４２は、同一病名数からその診断項目における難易度を計算する。

　ステップＳ７７は、全項目に対して病名数をカウントしたかを確認する分岐ステップであり、全項目のカウントが完了している場合には終了に進み、完了していない場合には、ステップＳ７４に進み同一病名数のカウントを続ける。

　図３を用いて、同一病名数から難易度を計算する場合の具体例について説明する。ここで、診断項目「形状」下の症状の種類「不整形」、「多角形」、「分葉形」に注目する。「不整形」下の病名としては、「乳頭腺管癌」、「充実腺管癌」がある。「多角形」下の病名としては、「充実腺管癌」、「粘液癌」、「髄様癌」がある。「分葉形」下の病名としては、「葉状腫瘍」、「線維腺腫」、「嚢胞」がある。このとき、「不整形」に対して難易度を評価すると、「多角形」下には「不整形」下にも存在する「充実腺管癌」という病名が含まれるため、これらの症状は間違えやすいので難易度が高いと評価する。一方、「分葉形」は、一致する病名がないため間違えにくいので、難易度が低いと評価する。

　（第２の難易度パターン：項目分岐数から難易度を計算）
　なお、ステップＳ４３において、難易度は、診断項目に対する症状の種類数（項目分岐数）から決定されてもよい。診断項目に対する症状の種類が多いときには診断が難しくなる。そのため、症状の数を基準に難易度を評価する。このとき、症状の種類が多い場合には難易度が高く、少ない場合には難易度が低いと評価する。つまり、診断項目の難易度は、診断ツリーにおける診断項目の症状の分岐数が多いほど難易度が高くなるように計算される。言い換えると、診断項目の難易度は、診断項目の症状として判定可能な症状の数が多いほど難易度が高くなるように計算される。以下、ステップＳ４３の詳細について図１８を用いて説明する。

　ステップＳ８０において、類似診断フロー抽出部４２は、診断ツリーを読み込む。

　ステップＳ８１において、類似診断フロー抽出部４２は、検索対象のフローを計算する。

　ステップＳ８２において、類似診断フロー抽出部４２は、診断ツリーの項目分岐数をカウントする。

　ステップＳ８３において、類似診断フロー抽出部４２は、項目分岐数をカウントする。

　ステップＳ８４において、類似診断フロー抽出部４２は、項目分岐数からその診断項目における難易度を計算する。

　ステップＳ８５は、全項目分岐に対して診断項目数をカウントしたかを確認する分岐で、全項目のカウントが完了している場合には終了に進み、完了していない場合には、ステップＳ８３に進み項目分岐数のカウントを続ける。

　図３において項目分岐数から難易度を計算する場合について考える。このとき、それぞれの症状の種類については同一の診断難易度であるとし、個数だけから難易度を決定する。例えば、図３においては診断項目「形状」下の症状の種類は「不整形」、「多角形」、「分葉形」、「円・楕円」の４種類存在する。一方、診断項目「不明瞭ｈａｌｏ（－）」下の症状の種類は「あり」、「なし」の２種類しか存在しない。このときには、診断項目が、「あり」、および「なし」のいずれであるかを判定するよりも、「不整形」、「多角形」、「分葉形」、および「円・楕円」のいずれであるかを判定する方が、難易度が高いと評価する。

　なお、病名の難易度も上記と同様に計算されてもよい。つまり、病名の難易度は、診断ツリーにおける診断項目の症状から分岐する病名の数が多いほど難易度が高くなるように計算されてもよい。具体的には、例えば図３において、最下段のブロック内に記載された病名の数が多いほど、病名の難易度が高くなるように計算されてもよい。

　（第３の難易度パターン：病名の間違えやすさから難易度を計算）
　なお、ステップＳ４３において、難易度は診断項目に対する病名の間違えやすさから決定されてもよい。診断項目において病名の間違いが多いときには診断が難しかったことが想定される。そのため、病名の間違えやすさを基準に難易度を評価する。具体的には、類似診断フロー抽出部４２は、病名ごとに予め定められた値であって病名の間違えやすさ示す値が大きいほど難易度が高くなるように計算する。

　このとき、病名の間違いが多い場合には難易度が高く、少ない場合には難易度が低いと評価する。以下、ステップＳ４３の詳細を図１９に示す。

　ステップＳ９０において、類似診断フロー抽出部４２は、診断ツリーを読み込む。

　ステップＳ９１において、類似診断フロー抽出部４２は、検索対象のフローを計算する。

　ステップＳ９２において、類似診断フロー抽出部４２は、検索対象の病名を抽出する。

　ステップＳ９３において、類似診断フロー抽出部４２は、ステップＳ９３で抽出した病名と診断ツリーの病名に対する疾患データを読み込む。

　ステップＳ９４において、類似診断フロー抽出部４２は、全診断フロー数をカウントする。

　ステップＳ９５において、類似診断フロー抽出部４２は、診断フローを読み込む。

　ステップＳ９６において、類似診断フロー抽出部４２は、疾患データを基に各診断フローにおける病名の難易度を評価する。

　ステップＳ９７は全診断フローに対して難易度を評価したかを確認する分岐ステップであり、全フローの評価が完了している場合には終了に進み、完了していない場合には、ステップＳ９５に進み難易度の評価を続ける。

　なお、ステップＳ４３において、病名の間違えやすさは、診断結果に対する病理検査の正解率から計算されてもよい。ここで、病理検査とは、腫瘤組織を採取する検査のことである。読影の診断結果だけでなく、治療の段階では腫瘤組織を採取する病理検査を行い、その組織を分析した結果、確定診断がなされる。この病理検査の結果と読影結果との一致率を正解率とする。

　なお、ステップＳ４３において、難易度は上記の複数の方法を組み合わせて計算してもよい。

　図３において病名の間違えやすさから難易度を計算する場合について考える。症状の種類「多角形」に注目すると、その下の病名には「充実腺管癌」、「粘液癌」、「髄様癌」の３種類がある。

　例えば、「充実腺管癌」と「髄様癌」の診断が難しく、「充実腺管癌」と「粘液癌」の診断は容易であるとする。以降では、検索したい病名が「充実腺管癌」であるときを例に説明する。まず、事前の処理として「充実腺管癌」など各病名に対して疾患データとして間違えやすさに相当する数値と病名を組み合わせて記憶しておく。検索時には、「充実腺管癌」という病名について疾患データを読み出す（例えば、「粘液癌」０．１、「髄様癌」０．７など）。これを検索文字列に対する類似度計算の重みとして使用することにより、「充実腺管癌」という文字列で検索した場合に、異なる文字列である「髄様癌」の類似度を上昇させることができる。

　（第４の難易度パターン：複数ツリーによりありえない診断フローを削除）
　ステップＳ４４において、類似診断フロー抽出部４２は、診断ツリー解析部４１が抽出した複数の診断ツリーを使用し、診断ツリーの組合せを評価することで、ありえない類似診断フローを削除し、有効な診断フローを抽出し、類似症例検索部５に送付する。

　複数の診断ツリーからの有効な診断フローの抽出は、複数の診断ツリーにおいて病名の組合せが存在するか否かを指標に行う。以下、ステップＳ４４の詳細について図２０を用いて説明する。

　ステップＳ１００において、類似診断フロー抽出部４２は、複数の診断ツリーを読み込む。

　ステップＳ１０１において、類似診断フロー抽出部４２は、検索対象フローと同一病名のフローを複数の診断ツリーから抽出する。

　ステップＳ１０２において、類似診断フロー抽出部４２は、同一病名のフローに対して複数の診断ツリーから類似難易度のフローを読み込む。

　ステップＳ１０３において、類似診断フロー抽出部４２は、ステップＳ１０１、Ｓ１０２で抽出したフローの病名の種類数をカウントする。

　ステップＳ１０４において、類似診断フロー抽出部４２は、病名別、診断ツリー別にフローに含まれる病名数をカウントする。

　ステップＳ１０５において、類似診断フロー抽出部４２は、全ての診断ツリーにおいてカウントがされた病名を有効な診断フローとして採用する。

　ステップＳ１０６は、全病名に対し評価したかを確認する分岐ステップであり、全病名に対し評価が完了している場合には終了に進み、完了していない場合には、ステップＳ１０３に進み評価を続ける。

　（第５の難易度パターン：複数ツリーと読影レポートにより表示する対象を変化）
　なお、ステップＳ４４において、読影レポートに記載された診断項目から使用する診断ツリーを変更してもよい。ここでは、先に述べた有効な診断フローの抽出方法を基に診断ツリーを変更する例について説明する。以下、ステップＳ４４において、診断ツリーを変更する詳細フローについて図２１を用いて説明する。

　ステップＳ１１０において、類似診断フロー抽出部４２は、読影レポートに記載された診断項目と病名を読み込む。

　ステップＳ１１１において、類似診断フロー抽出部４２は、ステップＳ１１０で抽出された診断項目が含まれる診断ツリーを選択して読み込む。

　ステップＳ１１２において、類似診断フロー抽出部４２は、検索対象フローと同一病名の診断フローを複数の診断ツリーから抽出する。

　ステップＳ１１３において、類似診断フロー抽出部４２は、同一病名のフローに対して複数の診断ツリーから類似診断フローを読み込む。

　ステップＳ１１４において、類似診断フロー抽出部４２は、ステップＳ１１２、Ｓ１１３で抽出したフローの病名の種類数をカウントする。

　ステップＳ１１５において、類似診断フロー抽出部４２は、病名別、診断ツリー別にフローに含まれる病名数をカウントする。

　ステップＳ１１６において、類似診断フロー抽出部４２は、全ての診断ツリーにおいてカウントがされた病名を有効な診断フローとして採用する。

　ステップＳ１１７は、全病名に対し評価したかを確認する分岐ステップであり、全病名に対し評価が完了している場合には終了に進み、完了していない場合には、ステップＳ１１４に進み評価を続ける。例えば、図２２のように複数の診断ツリーがある場合に、今、医師は形状に関して診断を行い、検索対象フローは「項目ａ－パターンＡ－項目ｂ－パターンＣ－病名２」であるとする。また、形状の診断ツリーでは病名１、２、３の診断が難しく、形状の診断ツリーでは病名２、３の診断が難しいとする。このとき、ステップＳ１１１では、現在診断中の診断フローを読み込み、ステップＳ１１２では現在診断しているフローと病名が一致する診断フロー（ここでは色に関する診断ツリーから）を診断フロー「項目ｃ－パターンＥ－項目ｄ－パターンＧ－病名２」を読み込む。ステップＳ１１３ではそれぞれの診断ツリーにおいて類似診断フローである「項目ａ－パターンＡ－項目ｂ－パターンＣ－病名１」、「項目ａ－パターンＡ－項目ｂ－パターンＣ－病名３」、「項目ｃ－パターンＥ－項目ｄ－パターンＧ－病名３」を読み込む。まとめると、以下のような診断フローが読み込まれる。

　　診断フロー１：「項目ａ－パターンＡ－項目ｂ－パターンＣ－病名１」（診断ツリー：形状）
　　診断フロー２：「項目ａ－パターンＡ－項目ｂ－パターンＣ－病名２」（診断ツリー：形状）
　　診断フロー３：「項目ａ－パターンＡ－項目ｂ－パターンＣ－病名３」（診断ツリー：形状）
　　診断フロー４：「項目ｃ－パターンＥ－項目ｄ－パターンＧ－病名２」（診断ツリー：色）
　　診断フロー５：「項目ｃ－パターンＥ－項目ｄ－パターンＧ－病名３」（診断ツリー：色）

　つまり、少なくとも２つの対象診断フローが抽出され、かつ、２つの対象診断フローが互いに異なる診断ツリーに含まれる場合に、類似診断フロー抽出部４２は、診断ツリーごとに類似診断フローを抽出する。

　このような診断フローに対して、ステップＳ１１４、Ｓ１１５では、形状ツリーと色ツリーに関して病名数をカウントする。これにより、例えば、病名１は形状ツリー側にしか存在しないので、現在検索中の診断フローとは他の診断フローを使用して総合的に診断した場合には類似とされないため、表示対象から外すといった変更ができる。以上のように、複数ツリーを組み合わせた評価により、表示対象を絞り込むことができる。

　（Ｓ４５：類似診断フロー抽出）
　ステップＳ４５において、類似診断フロー抽出部４２は、難易度に基づいて、検索対象と難易度が類似した診断フローを類似診断フローとして類似症例検索部５に送付する。具体的には、類似診断フロー抽出部４２は、難易度が高い診断項目または病名が含まれる診断フローほど類似診断フローとして抽出されるように、類似診断フローを抽出する。

　（Ｓ１３：類似症例検索）
　ステップＳ１３において、類似症例検索部５は、難易度評価部４から類似診断フローを受け取り、症例データ記憶部９に記憶されている各症例データの類似度を計算し、類似度が高い症例データを優先して類似症例表示部６に送付する。以下、ステップＳ１３の詳細を図２３を用いて説明する。

　ステップＳ５０において、類似症例検索部５は、難易度評価部４から受信した類似診断フローを読み込む。

　ステップＳ５１において、検索症例制御部５１は、入力部２から検索項目を受信し、検索項目を重み付けした類似診断フローを類似度評価部５２に送信する。以下、ステップＳ５１の詳細を図２４に示す。

　ステップＳ６０において、検索症例制御部５１は、類似診断フローを受信する。

　ステップＳ６１において、検索症例制御部５１は、入力部２からのユーザ入力を読み込む。

　ステップＳ６２は、入力部２においてユーザの入力があったかを判定する分岐ステップであり、入力がある場合はステップＳ６３へ進み、入力がない場合はステップＳ５２へ進む。

　ステップＳ６３において、検索症例制御部５１は、類似診断フロー内においてユーザ入力の文字列の有無、位置を検索する。

　ステップＳ６４において、検索症例制御部５１は、ユーザ入力の診断フロー内項目に対して重み付けを行う。この重み付けをすることにより、ユーザが検索したいと思った項目を優先的に検索することができる。重み付けについて計算方法の詳細は後述する実施例に記載する。

　ステップＳ５２において、類似度評価部５２は、ユーザ検索項目と類似診断フローとを受信し、症例データ記憶部９に格納されている読影レポートとの類似度を評価する。

　ステップＳ５３において、類似度評価部５２は、ステップＳ５２において類似度評価結果が上位の症例データに含まれる読影レポートと医用画像とを症例データ記憶部９から読み出す。

　ステップＳ５４において、類似度評価部５２は、症例データ記憶部９から読み出した症例データに含まれる読影レポートと医用画像とを類似症例表示部６に送付する。

　（Ｓ１４：類似症例表示）
　ステップＳ１４において、類似症例表示部６は、類似症例検索部５から症例データを受け取り、医師に提示する。類似症例表示部６は、例えばディスプレイ、ＴＶ、モニタなどである。

　以上のように、本実施の形態における類似症例検索システム１００によれば、難易度に基づいて抽出された類似診断フローを用いて、症例データを検索することができる。したがって、難易度が高い診断項目または病名に着目して、効果的に症例データを検索できるので、適切な症例データを検索することが可能となる。

　（実施例）
　以下では、実験のために簡単な読影レポートを作成し、類似度を評価した結果を示す。本実施例で用いた診断ツリーを図２５に示す。症状をパターンとして四角の枠内に記載し、診断項目は項目として記載した。複数の診断フローに同一の病名が存在する（例：パターンＤ、Ｅに病名Ｎが存在する）診断ツリーを用いた。また、今回の実験において、読影レポートには「項目ａはパターンＢ。項目ｃはパターンＧ。病名Ｓの疑い。」が記載されているとし、以下のキーワードが抽出されるとした。

（１）診断項目：「項目ａ」、「項目ｃ」
（２）症状：「パターンＢ」、「パターンＧ」
（３）病名：「病名Ｓ」

　実験では、２つの難易度の評価方法（同一病名数、病名の間違えやすさ）を用いて難易度評価を行った結果を示す。また、文字列の一致数を指標に類似度を計算する従来手法と本実施例の比較を行った。以下に手法とそのときに使用した評価式を示す。ここで、以下の式（１）を用いて、類似度Ｓｉｍを計算した。

　ここで、ｘは文字列の比較結果を示し、一致している場合には１を、不一致の場合には０をとる。また、ｆ_ｋ（ｗ，ｘ）は重み付けを行うか判別する関数である。ｘ、ｗがともに０のときに０をとり、それ以外は１をとる。

　（１）従来法（難易度評価なし、文字列の一致数を指標とした手法）
　（重み：従来法）

　（２）病名一致数による難易度
　本実験では、結果を分かりやすくするために、診断項目下に存在する病名の一致数として病名に一番近い診断結果である図２５のパターンＤ～Ｌに関して以下の式を適用した。なお、この計算は診断項目を遡ってパターンＡ～Ｃに適用してもよい。ここでｎ_ｘは分岐下にある病名の一致数であり、ｎ_ａは病名の総数を示す。例えば、パターンＤとパターンＥを比較する場合には、パターンＤ下には病名Ｍ、Ｎ、Ｏがあり、パターンＥ下には病名Ｐ、Ｎ、Ｏがある。したがって、Ｎ、Ｏが一致しているため、ｎ_ｘは２、総数ｎ_ａは６となり、その重みｗ_ｋは０．３３となる。

　（重み：病名一致数）

　（３）病名間違えやすさによる難易度
　本実験では、病名Ｓが一番間違えやすく、次に病名Ｔを間違えやすいとした。また、その間違えやすさの数値には式（４）を用いた。この数値は、病名ごとにあらかじめ決定してもよいし、データベースから自動的に決定してもよい。

　（重み：間違えやすさ）

　（類似度）：式（３）を使用

　（４）難易度（２）と難易度（３）の組み合わせ
　実験結果を図２６～図２９に示す。図には類似度の高い１０件について類似度と診断フローとを掲載した。ここで、診断項目１は診断項目ａを含む階層、症状１は項目ａに対する症状であり、パターンＡ、Ｂ、Ｃがこれに該当する。診断項目２はその症状下にある診断項目であり項目ｂ、ｃ、ｄのことをいう。症状２は項目ｂ、ｃ、ｄ下の症状を示す。以下では診断フローを「診断項目１－症状１－診断項目２－症状２－病名」と表記する。この表記法では検索対象となる読影レポートの診断フローは「ａ－Ｂ－ｃ－Ｇ－Ｓ」となる。

　（１）従来法（難易度評価なし、文字列の一致数を指標とした手法）
　従来法の実験結果を図２６に示す。文字列の一致数が類似度の指標であるため、例えば今回の検索対象読影レポート「ａ－Ｂ－ｃ－Ｇ－Ｓ」に対して、類似度が一番高いものは文字列が全て一致する「ａ－Ｂ－ｃ－Ｇ－Ｓ」であり、その類似度は１となる。また、５つの文字列中４つが一致する「ａ－Ｂ－ｃ－Ｇ－Ｔ」の類似度は０．８となる。このように、従来法では検索した診断フローと同じ症例データを検索できる。

　（２）病名一致数による難易度
　病名一致数による難易度評価の実験結果を図２７に示す。病名一致数を指標に難易度を評価すると、検索読影レポートの病名「病名Ｓ」と一致する病名数を各診断フローにおいて計算するため、病名Ｓが含まれる診断フローの類似度が上昇した。例えば、図２７において「ａ－Ｂ－ｃ－Ｈ－Ｓ」、「ａ－Ｂ－ｃ－Ｉ－Ｓ」の類似度が０．８から０．９に上昇した。そのため、本手法を使用すれば、検索している病名に至る診断フローを優先的に検索できる。つまり、難易度が高い病名である「病名Ｓ」を含む診断フローが類似診断フロートとして抽出される。

　（３）病名間違えやすさによる難易度
　病名間違えやすさによる難易度評価の実験結果を図２８に示す。病名間違えやすさを指標に難易度を評価すると、検索読影レポートの病名「病名Ｓ」が含まれる診断フローと同じ診断項目、症状で「病名Ｔ」が含まれる診断フローの類似度が上昇した。そのため、本手法を使用すれば、間違えやすい病名を含む診断フローを優先的に検索できる。つまり、対象診断フローに含まれる病名と間違えやすい病名を含む診断フローが類似診断フローとして抽出される。

　（４）難易度（２）と難易度（３）の組み合わせ
　難易度（２）と難易度（３）の組み合わせによる難易度評価の実験結果を図２９に示す。病名一致数と病名間違えやすさを組み合わせた場合には、文字列の一致数が少なくても、類似度が大きく上昇する診断フローが存在した。例えば、「ａ－Ｂ－ｃ－Ｈ－Ｔ」は従来の文字列の一致数では類似度が０．６であるが、今回提案した手法では類似度は０．９となる。したがって、本手法を使用すれば、検索している病名に至りやすく、間違えやすい病名を含む診断フローを優先的に検索できる。

　以上、説明した類似症例検索システムによれば、文字列が似ているという症例データだけでなく、対象となる読影レポートと間違えやすい症例データを提示することができ、医師の診断に対する確信度を上げることができる。

　例えば、現在診断中の読影レポートに「境界が明瞭平滑であり、形状は多角形であるため、充実腺管癌を疑う」と記載があるとき、図３のような診断ツリーが存在する場合を考える。

　このとき、先に述べたキーワード抽出部により、レポート記載内容から「境界」、「明瞭平滑」、「形状」、「多角形」、「充実腺管癌」などの項目が抽出され、診断ツリー内でこの記述に合う診断フロー「境界－明瞭平滑－形状－多角形－充実腺管癌」が検索対象として選ばれる。

　ここで、「不整形」、「多角形」が間違えやすいとする。また、「乳頭腺管癌」と「充実腺管癌」の診断が難しく、「充実腺管癌」と「粘液癌」の診断は容易であるとする。このとき、過去症例１「境界が明瞭平滑であり、形状は多角形であるため、粘液癌を疑う」、過去症例２「境界が明瞭平滑であり、形状は不整形であるため、乳頭腺管癌を疑う」、という過去症例のレポートがデータベース内にある場合を考える。医師は「乳頭腺管癌」と「粘液癌」の診断は容易であるため、過去症例１が検索結果として提示されても医師の参考にはならない。

　しかし、従来手法では文字列がどれだけ一致しているかが指標となるため、過去症例１と過去症例２を比較すると、過去症例１は「境界」、「明瞭平滑」、「形状」、「多角形」の４文字列が一致しているのに対して、過去症例１は「境界」、「明瞭平滑」、「形状」の３つ一致しているため、一致する文字列が多い過去症例１が類似症例として出力される。

　これに対して本発明では、文字列の一致数だけではなく、難易度を指標にするため、検索対象の文字列に含まれない「多角形」や「充実腺管癌」に対しても重みが計算され、類似度が上昇する。その結果、過去症例２が検索結果として提示されるため、医師は間違えやすい症例を比較しながら診断を行うことができる。

　以上、本発明の一態様に係る類似症例検索装置１について、実施の形態に基づいて説明したが、本発明は、これらの実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したもの、あるいは異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の範囲内に含まれる。

　例えば、入力部２は、あらかじめ用意した診断項目および症状を選択するためのテンプレートを利用して、医師から入力を受け付けてもよい。

　なお、入力部２は、上記テンプレートを症例データ記憶部９のデータから作成してもよい。

　なお、文字列解析部３１は、一般的なキーワード抽出手法（例えば、形態素解析によるキーワード抽出やＮ－ｇｒａｍによるキーワード抽出）を利用してもよい。

　なお、文字列比較部３２は、同義語辞書を用いてキーワードとの比較をしてもよい。

　なお、文字列比較部３２は、キーワード辞書記憶部７に記憶されているキーワードとの比較だけでなく、同義語辞書を用いて難易度評価のためのキーワードを統一するような変換処理をしてもよい。

　なお、入力された読影レポートに対応する診断ツリーは、診断項目だけでなく、患者の検査部位情報（胸部、腹部など）から決定されてもよい。

　なお、キーワード辞書記憶部７に記憶されているキーワードは、症例データ記憶部に記憶されている読影レポートを参照して作成されてもよい。

　なお、キーワード辞書記憶部７に記憶されているキーワードは、例えばＩＣＤ１０（国際疾病分類第１０版）などの疾病分類表から作成されてもよい。

　なお、診断ツリー記憶部８は症例ＤＢ内の読影レポートを参照して作成してもよい。

　なお、症例データ記憶部９に、診断終了後に現在の検索症例が追加されてもよい。

　なお、上記実施の形態において、類似診断フロー抽出部４２は、難易度を計算していたが、必ずしも難易度を計算する必要はない。例えば、類似診断フロー抽出部４２は、診断ツリー記憶部８から、診断項目または病名ごとに記憶されている難易度を読み出してもよい。

　また、上記実施の形態における類似症例検索装置１が備える構成要素の一部または全部は、１個のシステムＬＳＩ（Ｌａｒｇｅ　Ｓｃａｌｅ　Ｉｎｔｅｇｒａｔｉｏｎ：大規模集積回路）から構成されているとしてもよい。

　システムＬＳＩは、複数の構成部を１個のチップ上に集積して製造された超多機能ＬＳＩであり、具体的には、マイクロプロセッサ、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＲＡＭ（Ｒａｍｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）などを含んで構成されるコンピュータシステムである。前記ＲＯＭには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムに従って動作することにより、システムＬＳＩは、その機能を達成する。

　なお、ここでは、システムＬＳＩとしたが、集積度の違いにより、ＩＣ、ＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩと呼称されることもある。また、集積回路化の手法はＬＳＩに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。ＬＳＩ製造後に、プログラムすることが可能なＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）、あるいはＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。

　さらには、半導体技術の進歩又は派生する別技術によりＬＳＩに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。

　また、本発明は、このような特徴的な処理部を備える類似症例検索装置として実現することができるだけでなく、類似症例検索装置に含まれる特徴的な処理部をステップとする類似症例検索方法として実現することもできる。また、類似症例検索方法に含まれる特徴的な各ステップをコンピュータに実行させるコンピュータプログラムとして実現することもできる。そして、そのようなコンピュータプログラムを、ＣＤ－ＲＯＭ等のコンピュータ読取可能な記録媒体あるいはインターネット等の通信ネットワークを介して流通させることができるのは、言うまでもない。

　なお、本発明は上記の実施形態に限定されるものではない。

　本発明は、症例データ記憶部に格納された複数の症例データ（診断画像および読影レポート）を検索する類似症例検索装置として有用である。また、判断の構造がツリー化できるような分野（機構設計、裁判判例検索、特許検索など）において画像や図面に関連付けてテキストデータが格納されたデータベースから類似データを検索する他のシステムにおいても広く適用可能である。

　１　　類似症例検索装置
　２　　入力部
　３　　キーワード抽出部
　４　　難易度評価部
　５　　類似症例検索部
　６　　類似症例表示部
　７　　キーワード辞書記憶部
　８　　診断ツリー記憶部
　９　　症例データ記憶部
　１０　読影支援データベース
　３１　文字列解析部
　３２　文字列比較部
　４１　診断ツリー解析部
　４２　類似診断フロー抽出部
　５１　検索症例制御部
　５２　類似度評価部
　１００　類似症例検索システム

Claims

　医用画像を読影する際に診断の対象となる診断項目と、前記診断項目の症状を示す診断結果とが記載された文書データである読影レポートからキーワードを抽出するキーワード抽出部と、
　病名が決定されるまでの診断項目と当該診断項目の症状とを含む複数の診断フローがツリー構造で表された診断ツリーを記憶している診断ツリー記憶部を参照して、前記読影レポートに対応する診断フローである対象診断フローを前記キーワードに基づいて抽出する診断ツリー解析部と、
　診断項目の症状を判定する難しさの度合いである診断項目の難易度、または病名を決定する難しさの度合いである病名の難易度に基づいて、前記診断ツリー記憶部に記憶されている診断ツリーに含まれる複数の診断フローの中から前記対象診断フローに類似する類似診断フローを抽出する類似診断フロー抽出部と、
　症例データ記憶部に記憶されている複数の症例データの中から、前記類似診断フローに対応する症例データを検索する類似症例検索部とを備える
　類似症例検索装置。
　前記病名の難易度は、前記診断ツリーにおいて、同一の病名を含む診断フローの数が多いほど難易度が高くなるように計算される
　請求項１に記載の類似症例検索装置。
　前記診断項目の難易度は、前記診断ツリーにおける診断項目の症状の分岐数が多いほど難易度が高くなるように計算される
　請求項１または２に記載の類似症例検索装置。
　前記病名の難易度は、前記診断ツリーにおける診断項目の症状から分岐する病名の数が多いほど難易度が高くなるように計算される
　請求項１～３のいずれか１項に記載の類似症例検索装置。
　前記病名の難易度は、病名ごとに予め定められた値であって病名の間違えやすさを示す値が大きいほど難易度が高くなるように計算される
　請求項１～４のいずれか１項に記載の類似症例検索装置。
　少なくとも２つの前記対象診断フローが抽出され、かつ、前記２つの対象診断フローが互いに異なる診断ツリーに含まれる場合に、前記類似診断フロー抽出部は、診断ツリーごとに前記類似診断フローを抽出する
　請求項１～５のいずれか１項に記載の類似症例検索装置。
　前記類似診断フロー抽出部は、難易度が高い診断項目または病名を含む診断フローほど類似診断フローとして抽出されるように、前記診断ツリー記憶部に記憶されている診断ツリーに含まれる複数の診断フローの中から類似診断フローを抽出する
　請求項１～６のいずれか１項に記載の類似症例検索装置。
　医用画像を読影する際に診断の対象となる診断項目と、前記診断項目の症状を示す診断結果とが記載された文書データである読影レポートからキーワードを抽出するキーワード抽出ステップと、
　病名が決定されるまでの診断項目と当該診断項目の症状とを含む複数の診断フローがツリー構造で表された診断ツリーを記憶している診断ツリー記憶部を参照して、前記読影レポートに対応する診断フローである対象診断フローを前記キーワードに基づいて抽出する診断ツリー解析ステップと、
　診断項目の症状を判定する難しさの度合いである診断項目の難易度、または病名を決定する難しさの度合いである病名の難易度に基づいて、前記診断ツリー記憶部に記憶されている診断ツリーに含まれる複数の診断フローの中から前記対象診断フローに類似する類似診断フローを抽出する類似診断フロー抽出ステップと、
　症例データ記憶部に記憶されている複数の症例データの中から、前記類似診断フローに対応する症例データを検索する類似症例検索ステップとを含む
　類似症例検索方法。
　請求項８に記載の類似症例検索方法をコンピュータに実行させるためのプログラム。