JP2018077630A - 構造化データ作成装置及びその制御方法、コンピュータプログラム - Google Patents
構造化データ作成装置及びその制御方法、コンピュータプログラム Download PDFInfo
- Publication number
- JP2018077630A JP2018077630A JP2016218266A JP2016218266A JP2018077630A JP 2018077630 A JP2018077630 A JP 2018077630A JP 2016218266 A JP2016218266 A JP 2016218266A JP 2016218266 A JP2016218266 A JP 2016218266A JP 2018077630 A JP2018077630 A JP 2018077630A
- Authority
- JP
- Japan
- Prior art keywords
- information
- item
- report
- items
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】自然文を含む文書情報を構成する項目の間の関係や、関連する資料の間の関係の特定を支援することが可能な技術を提供する。【解決手段】自然文を含む文書情報に基づき、少なくとも1つの種類のいずれかにそれぞれあたる複数の項目と、当該複数の項目の間の論理的な関係を示す関係情報とを含む構造化データを作成する構造化データ作成装置は、文書情報を解析して、当該文書情報に含まれる複数の項目を含む中間データを作成し、文書情報を含む資料を用いてなされた議論に関する議論情報を取得し、議論情報から、複数の種類の項目と当該項目の間の関係情報とを含む仮データを作成し、中間データに含まれる項目と、仮データに含まれる項目との対応関係を決定し、決定された対応関係に基づいて、中間データに含まれる項目の間に関係情報を付与して構造化データを作成する。【選択図】 図4
Description
本発明は構造化データ作成装置及びその制御方法、コンピュータプログラムに関し、特に、診療と診断に資する情報の記録及び表示を行う技術に関する。
昨今では、情報システムの導入により、病院施設で扱われる情報は紙媒体ではなく電子的に記録・管理されており、日々大量のデータが医療情報として蓄積されている。この大量のデータをコンピュータが適切に理解することができれば、データ分析や機械学習などに二次利用することができる。
読影レポートも電子的に記録・管理されることが主流となっている。従来から、CTやMRI等の画像の観察結果である所見や、その所見から導かれる診断結果などが記載された読影レポートが作成されている。CTはComputed Tomographyの略称であり、MRIはMagnetic Resonance Imagingの略称である。従来の読影レポートは自然言語による自由記述である。この様な一般的な読影レポートでは、画像検査ごとにレポートが一つ作成され、その中には、所見、診断という記載欄がそれぞれ用意される。一回の読影で扱う情報においては、何か一つの項目だけを扱うことは珍しく複数の項目を扱うことが多い。その結果、所見及び診断の各々の記載欄には、複数の項目が記載されることとなる。
従来の読影レポートは、レポート全体の内容を俯瞰するのには適しているが、読影レポートに記載される複数の項目の中の特定の情報に素早くアクセスするには適していない。例えば、複数の所見が記載されている中から、ある診断の根拠となっている所見を特定するためには、各所見の記載内容に一通り目を通す必要がある。
ここで、レポートを構成する複数の項目間に予め関係付けがなされていれば、その関係をたどることで目的の情報に素早くアクセスすることが可能であり、多忙な医師の負担を減らすことができる。また、様々な判断を必要とする医療現場では、項目間の因果関係は特に重要である。特定の所見を根拠として特定の診断がなされている読影レポートをDB(Database)から検索したいというニーズを満たすためには、レポートを構成する項目間の関係を考慮に入れた検索処理を実行する必要がある。読影レポートに記載された情報をこの様な用途に二次利用する場合、コンピュータが情報を認識・処理することに備えて、どの項目同士が繋がっているかという情報を、項目間の関係情報を明確にした形式で管理する必要がある。
また、読影レポートを扱う際には、一つの読影レポートを構成する項目間の関係だけでなく、医師の診療・診断・治療計画の業務に資する他の資料との関係も重要である。医師は診療・診断・治療計画の作業を行う際に、参考となる資料を、院内に存在する膨大な資料の中から特定する必要がある。近年では、医師のそういった作業を支援するために、患者の資料を俯瞰的に表示できる製品が幾つか開発されている。それらは、資料を種別毎に時系列に並べて表示することで、資料の一覧性を高め、医師の資料選択の作業を効率化している。
一方で、多様な資料を一覧する際に、各資料間の関係も明確に理解できる形式で一覧表示できれば、医師が見たい資料に容易にたどり着くことができる。例えば、特定の読影レポートと関係のある資料として、その読影レポートに添付されている医用画像がある。添付されている画像にも様々な意味がある。例えば、診断の根拠となる画像や、診断の根拠となる画像であったが後にその診断が間違っていた画像など様々である。この様な資料間の関係を把握できる仕組みがあれば、読影レポートの内容を閲覧する際に、同時に確認すべき他の資料へ素早くアクセスして取得することができる。この様な用途に医療情報を二次利用する場合、コンピュータが情報を認識・処理することに備えて、読影レポートや検査レポートなどの資料間の繋がりを、資料間の関係性を明確にした形式で管理する必要がある。
診療に関する情報間の関係付けを行う構成が特許文献1に記載されている。特許文献1の構成では、患者の状態推移、及び診療内容を示す複数の時系列データにおいて、異なるデータ間の関係付けをユーザが明示的に行うことで、データ間の関係性を把握することを支援する。
読影レポートの作成においては、医療従事者であれば容易に理解できる記載項目間の関係に関しては、明示的に関係を示す役割を担う接続詞などの記載が省略されることが多い。人間であれば文章を解読することで大体の関係性を把握することは可能であるが、コンピュータが把握することは困難である。そのため、自然文で記載された自由文から、言語処理解析などにより自動で項目間の関係を特定することは難しく、読影レポートを構成する記載項目間の関係付けは、現状においては医師が手動で明示的に行わざるを得ない。これは、多忙な医師にとって負担となる作業であり、結果的に項目間の関係付けがなされないことにつながり得る。
また、病院内に蓄積されている資料間の関係性についても、資料が作成された日時に基づいて、各資料の時間軸上の関係性を示す仕組みしか現状では提供されていない。各資料に明示的に記載された情報に基づいて言語処理解析をすることで資料間の関係を特定することはある程度は可能であるが、医師の思考過程を反映した関係を特定することは困難である。例えば、医師がある診断を下すためのレポートを記載している際に、診断の根拠として目を通した全ての資料が、レポートに反映されるとは限らない。代表的な資料以外はレポートへの記載が省略されることもあり、その場合、記載が省略された資料を診断の根拠となった資料としてシステムが抽出することは困難な状態となる。このことから、各資料間の因果関係などを含む関係性を医師が俯瞰して把握できる仕組みを提供するためには、予め医師が各資料間の関係性を手動で付与して準備しておく必要がある。これは、多忙な医師にとって負担となる作業であり、結果的に資料間の関係付けがなされないことにつながり得る。
上述の課題を解決するために、医療情報間の関係性を自動で特定する仕組みが求められている。しかし、特許文献1の技術では、時系列データ間の関係をユーザが手動で明示的に付与する必要があり、上述の課題を解決することができない。
本発明は上記課題に鑑みなされたものであり、自然文を含む読影レポート等の文書情報を構成する項目の間の関係や、関連する資料の間の関係の特定を支援することが可能な技術を提供することを目的とする。
上記目的を達成するため、本発明による構造化データ作成装置は以下の構成を備える。即ち、
自然文を含む文書情報に基づき、少なくとも1つの種類のいずれかにそれぞれあたる複数の項目と、当該複数の項目の間の論理的な関係を示す関係情報とを含む構造化データを作成する構造化データ作成装置であって、
前記文書情報を解析して、当該文書情報に含まれる前記複数の項目を含む中間データを作成する中間データ作成手段と、
前記文書情報を含む資料を用いてなされた議論に関する議論情報を取得する取得手段と、
前記議論情報から、複数の種類の項目と当該項目の間の関係情報とを含む仮データを作成する仮データ作成手段と、
前記中間データに含まれる前記項目と、前記仮データに含まれる前記項目との対応関係を決定する決定手段と、
前記決定手段により決定された対応関係に基づいて、前記中間データに含まれる項目の間に関係情報を付与して構造化データを作成する構造化データ作成手段と
を備える。
自然文を含む文書情報に基づき、少なくとも1つの種類のいずれかにそれぞれあたる複数の項目と、当該複数の項目の間の論理的な関係を示す関係情報とを含む構造化データを作成する構造化データ作成装置であって、
前記文書情報を解析して、当該文書情報に含まれる前記複数の項目を含む中間データを作成する中間データ作成手段と、
前記文書情報を含む資料を用いてなされた議論に関する議論情報を取得する取得手段と、
前記議論情報から、複数の種類の項目と当該項目の間の関係情報とを含む仮データを作成する仮データ作成手段と、
前記中間データに含まれる前記項目と、前記仮データに含まれる前記項目との対応関係を決定する決定手段と、
前記決定手段により決定された対応関係に基づいて、前記中間データに含まれる項目の間に関係情報を付与して構造化データを作成する構造化データ作成手段と
を備える。
本発明によれば、自然文を含む文書情報を構成する項目の間の関係や、関連する資料の間の関係の特定を支援することが可能である。
以下、添付図面を参照して本発明の実施の形態を詳細に説明する。
<実施形態1>
(構造化データ作成システム)
本発明の一実施形態(実施形態1)に係る構造化データ作成装置は、例えば病院などの医療施設内に配置される。図1は構造化データ作成システムの構成を示す図である。構造化データ作成装置1は、読影医が読影対象の画像を閲覧し、構造化された読影レポートを作成するための装置である。また、構造化データ作成装置1は構造化されていない既存の読影レポートを構造化された読影レポートに変換し、構造化データとして管理できるようにする。なお、構造化された読影レポートとは、複数のレポート項目の間の論理的な関係を示す関係情報によって、従来の自然文による自由記述の読影レポートの内容を示すレポートである。レポート項目の詳細と、レポート項目間の関係情報の詳細は、図3を用いて後述する。以降では、構造化された読影レポートを、構造化レポートとも記す。また、構造化データとは、構造化レポートを構成するレポート項目と、レポート項目間の関係情報を、コンピュータが記録・処理できる形式に変換したものである。このように、構造化データ作成装置は、自然文を含む文書情報に基づき、少なくとも1つの種類のいずれかにそれぞれあたる複数の項目と、当該複数の項目の間の論理的な関係を示す関係情報とを含む構造化データを作成する。構造化データ作成装置1は院内ローカルエリアネットワーク10を介して院内システムと接続されている。院内システムとしては、例えば、HIS2、RIS3、医用画像撮影装置4、PACS5がある。なお、院内ローカルエリアネットワーク10は、LAN(Local Area Network)により実現されるが、情報を送受信可能ならば、有線・無線を問わずどのようなネットワークにより実現しても構わない。例えば、インターネット等の公衆回線を経由するネットワークにより実現してもよい。
(構造化データ作成システム)
本発明の一実施形態(実施形態1)に係る構造化データ作成装置は、例えば病院などの医療施設内に配置される。図1は構造化データ作成システムの構成を示す図である。構造化データ作成装置1は、読影医が読影対象の画像を閲覧し、構造化された読影レポートを作成するための装置である。また、構造化データ作成装置1は構造化されていない既存の読影レポートを構造化された読影レポートに変換し、構造化データとして管理できるようにする。なお、構造化された読影レポートとは、複数のレポート項目の間の論理的な関係を示す関係情報によって、従来の自然文による自由記述の読影レポートの内容を示すレポートである。レポート項目の詳細と、レポート項目間の関係情報の詳細は、図3を用いて後述する。以降では、構造化された読影レポートを、構造化レポートとも記す。また、構造化データとは、構造化レポートを構成するレポート項目と、レポート項目間の関係情報を、コンピュータが記録・処理できる形式に変換したものである。このように、構造化データ作成装置は、自然文を含む文書情報に基づき、少なくとも1つの種類のいずれかにそれぞれあたる複数の項目と、当該複数の項目の間の論理的な関係を示す関係情報とを含む構造化データを作成する。構造化データ作成装置1は院内ローカルエリアネットワーク10を介して院内システムと接続されている。院内システムとしては、例えば、HIS2、RIS3、医用画像撮影装置4、PACS5がある。なお、院内ローカルエリアネットワーク10は、LAN(Local Area Network)により実現されるが、情報を送受信可能ならば、有線・無線を問わずどのようなネットワークにより実現しても構わない。例えば、インターネット等の公衆回線を経由するネットワークにより実現してもよい。
HIS(Hospital Information System)2は、医療事務会計システム、診療予約システム、診療情報システムなどを含む包括的なシステムである。HIS2は電子カルテDB(Database)6や読影レポートDB7を有する。電子カルテDB6には、患者の診療情報を記録した電子カルテが保管される。読影レポートDB7には読影医が作成した読影レポートに関する情報が保管される。読影レポートに関する情報には、自然文による自由記述の読影レポート(以後、非構造化レポートと記す)の内容と、読影レポートに関する構造化データの一方もしくは両方が含まれる。RIS(Radiology Information System)3は、放射線機器による検査と治療の予約、検査結果の管理、材料在庫管理などを行うためのシステムである。なお、読影レポートDB7がRIS3によって管理される場合もある。医用画像撮影装置4はCT装置、MRI装置、超音波診断装置、PET装置等の総称である。CTはComputed Tomographyの略称であり、MRIはMagnetic Resonance Imagingの略称である。PETはPositron Emission Tomographyの略称である。PACS(Picture Archiving and Communication System)5は、医用画像撮影装置4によって撮影された医用画像を電子的に保存、検索、通信するためのシステムである。PACS5は医用画像の保存先として医用画像DB8を備える。辞書DB9には、構造化データ作成装置が、非構造化レポートから構造化データを作成する際に参照する辞書データが保存されている。
(構造化データ作成装置のハードウェア構成)
図2は、構造化データ作成装置1の具体的なハードウェア構成を示すブロック図である。入力デバイス11は、ユーザからの指示や操作、音声を入力する装置である。入力デバイス11は、マウスを含むポインティング装置やデジタイザ、マイク、センサ等であり、構造化データ作成装置1にユーザの指示を入力したり、ユーザの発言を音声データとして収集するため、ユーザの視線情報を収集するため等に用いられる。出力デバイス12は構造化データ作成装置1の状態や処理内容を表示するLED(Light Emitting Diode)や液晶パネル等である。CPU(Central Processing Unit)13は二次記憶装置15に保存されているコンピュータプログラムを一次記憶装置14に読み込む。更に、CPU13は読み込んだコンピュータプログラムを解釈・実行することで構造化データ作成装置1内の各種制御や計算、UI(User Interface)の表示を実施する。一次記憶装置14は主にRAM(Random Access Memory)などのメモリである。二次記憶装置15には構造化データ作成装置1を動作させるために必要なコンピュータプログラムが保存されている。二次記憶装置15は、例えばハードディスクやフラッシュメモリなどの記憶媒体がこれに当たるが、本実施形態は特定の記憶媒体に依存しないことは言うまでもない。一般的に一次記憶装置14の容量は二次記憶装置15の容量より小さく、一次記憶装置14に格納しきれないコンピュータプログラムやデータ等は二次記憶装置15に格納される。また、長時間記憶しなくてはならないデータ等も二次記憶装置15に格納される。通信IF(Interface)16は院内ローカルエリアネットワーク10に繋がっており、院内の各種システム/装置2〜5及び辞書DB9の間の通信インターフェースとして機能する。
図2は、構造化データ作成装置1の具体的なハードウェア構成を示すブロック図である。入力デバイス11は、ユーザからの指示や操作、音声を入力する装置である。入力デバイス11は、マウスを含むポインティング装置やデジタイザ、マイク、センサ等であり、構造化データ作成装置1にユーザの指示を入力したり、ユーザの発言を音声データとして収集するため、ユーザの視線情報を収集するため等に用いられる。出力デバイス12は構造化データ作成装置1の状態や処理内容を表示するLED(Light Emitting Diode)や液晶パネル等である。CPU(Central Processing Unit)13は二次記憶装置15に保存されているコンピュータプログラムを一次記憶装置14に読み込む。更に、CPU13は読み込んだコンピュータプログラムを解釈・実行することで構造化データ作成装置1内の各種制御や計算、UI(User Interface)の表示を実施する。一次記憶装置14は主にRAM(Random Access Memory)などのメモリである。二次記憶装置15には構造化データ作成装置1を動作させるために必要なコンピュータプログラムが保存されている。二次記憶装置15は、例えばハードディスクやフラッシュメモリなどの記憶媒体がこれに当たるが、本実施形態は特定の記憶媒体に依存しないことは言うまでもない。一般的に一次記憶装置14の容量は二次記憶装置15の容量より小さく、一次記憶装置14に格納しきれないコンピュータプログラムやデータ等は二次記憶装置15に格納される。また、長時間記憶しなくてはならないデータ等も二次記憶装置15に格納される。通信IF(Interface)16は院内ローカルエリアネットワーク10に繋がっており、院内の各種システム/装置2〜5及び辞書DB9の間の通信インターフェースとして機能する。
構造化データ作成装置1は、パーソナルコンピュータ(PC)やワークステーション(WS)等の汎用的な情報処理装置により実現されるが、組込みシステム等により実現してもよい。また、院内システムを構成するHIS2、RIS3、PACS5、電子カルテDB6、読影レポートDB7、医用画像DB8、辞書DB9等の機能の一部又は全部は、構造化データ作成装置1と同一の装置により実装してもよい。
(レポート)
図3は、本実施形態に係る構造化データ作成装置1で作成される構造化されたレポートの概念を表す図である。本実施形態に係る構造化データ作成装置1で作成されるレポートは、複数のレポート項目とレポート項目間の関係情報により構成される。
図3は、本実施形態に係る構造化データ作成装置1で作成される構造化されたレポートの概念を表す図である。本実施形態に係る構造化データ作成装置1で作成されるレポートは、複数のレポート項目とレポート項目間の関係情報により構成される。
図3において、枠71はレポート項目を表している。レポート項目は、その内容に応じて「部位」、「所見」、「診断」、「処置」の4種類に分類される。「部位」のレポート項目には、体の部位を特定することのできる文章や画像が入力される。「部位」のレポート項目へ入力される画像とは、例えば読影対象の画像のソフトコピー(画像データ)や、読影対象の画像へアクセスするためのアドレス情報である。ここで、画像を閲覧する際に適用する画像処理のパラメータ等を合わせて入力してもよい。「所見」のレポート項目には、一つの病変を説明する文章が入力される。「診断」のレポート項目には、一つの疾病を説明する文章が入力される。「処置」のレポート項目には、一つ以上の処置を説明する文章が入力される。
関係情報は、レポート項目間の関係性に応じて対応関係と因果関係の2種類に分類される。図3において、対応関係は直線72、因果関係は矢印線73である。因果関係は、2つのレポート項目が原因と結果という関係で結ばれていることを意味する。対応関係は、2つのレポート項目が因果関係以外の関係により相互に関係していることを意味する。図3では、矢印の根本が原因、矢印の先が結果に相当する。一つのレポート項目は、その種類や他のレポート項目との関係の有無にかかわらず、他の任意の複数のレポート項目と関係を持つことができる。したがって、レポート項目間の関係は、全体として多対多の関係を構成することができる。
例えば、図3の例では、部位1は所見1と一対一で対応関係を有している。診断1は、診断2及び診断3と一対多の因果関係を有しており、診断1は診断2、診断3の原因となっている。所見4は、部位3及び診断3と対応関係を有するとともに、所見5と自らが原因となる因果関係を有している。診断3は、診断1、所見3、及び、所見4と自らが結果となる因果関係を有するとともに、処置3及び処置4と自らが原因となる因果関係を有している。
(構造化データ作成装置の機能構成)
図4は、本実施形態に係る構造化データ作成装置1の主要な機能を示す機能構成図である。本実施形態では、図4に示す各機能要素は、構造化データ作成装置1のCPU13がコンピュータプログラムに基づき装置全体を制御することにより実現される。したがって、図4の各機能要素はその機能を実現するためのコンピュータプログラムとして提供することができる。もっとも、図4に示す機能要素の一部又は全部は専用のハードウェアにより実現してもよい。
図4は、本実施形態に係る構造化データ作成装置1の主要な機能を示す機能構成図である。本実施形態では、図4に示す各機能要素は、構造化データ作成装置1のCPU13がコンピュータプログラムに基づき装置全体を制御することにより実現される。したがって、図4の各機能要素はその機能を実現するためのコンピュータプログラムとして提供することができる。もっとも、図4に示す機能要素の一部又は全部は専用のハードウェアにより実現してもよい。
画像閲覧部101は、読影対象となる画像を、PACS5を介して医用画像DB8から読み出し、出力デバイス12に表示する。また、入力デバイス11を介したユーザ(読影医等)の操作に応じて、表示画像の変更、画像処理の適用等、画像閲覧に関する様々な処理を実行する。
レポート項目作成部102はレポート項目を作成し、レポート項目を一意に識別するIDと、レポート項目が属するレポートを一意に識別するためのレポートID、項目の種類を項目内容に自動的に付与して項目テーブル701に保存する。図5(a)は、構造化されたレポートを構成する項目のデータベース保存形式である項目テーブル701の一例を示している。図5(a)の例では、項目IDが「1」〜「6」のレポート項目はレポートIDが「1」のレポートを構成しており、項目IDが「7」〜「9」のレポート項目はレポートIDが「2」のレポートを構成している。項目IDが「1」「4」「7」のレポート項目の種類は「部位」であり、それぞれ画像が内容として関連付けられている。項目IDが「2」「5」「8」のレポート項目の種類は「所見」であり、項目IDが「3」「6」「9」のレポート項目の種類は「診断」である。これらのレポート項目の内容にはテキストデータ等の文書データが関連付けられている。
レポート項目内容編集部103は、レポート項目の内容を編集し、編集結果を記憶部112の項目テーブル701の該当箇所へ保存する。関係情報作成部104は、任意のレポート項目間の関係情報を作成する。関係情報は、関係情報を一意に識別するための関係IDと、2つのレポート項目のIDとその間の関係の種類で構成される。なお、関係情報作成部104では、レポート項目間の関係の種類を自動的に決定する。関係の種類の決定手法については、図8を用いて後述する。
関係情報保存部105は、関係情報作成部104で作成された関係情報を、記憶部112の関係テーブル702に保存する。図5(b)は、関係情報のデータベース保存形式である関係テーブル702の一例を示している。図5(b)の例では、関係IDが「1」「3」「6」の関係は対応関係を示し、関係IDが「2」「4」「5」「7」の関係は因果関係を示している。関係の種類が原因/結果の関係(即ち因果関係)である場合には、レポート項目ID1が原因、レポート項目ID2が結果となるように保存する。例えば、関係ID「2」の関係においては、項目ID「2」のレポート項目が原因、項目ID「3」のレポート項目が結果となる因果関係を表している。
記憶部112は項目テーブル701、関係テーブル702を一時的に記憶する。また、記憶部112は後述する発言情報取得部106、資料情報取得部107、辞書データ取得部108、レポート情報取得部111から取得した情報を一時的に記憶する。
関係情報提示部113は関係テーブル702の内容に従って、レポート項目間の関係を出力デバイス12に表示する。レポート保存部114は、項目テーブル701、関係テーブル702の内容を、構造化データとしてHIS2を介して読影レポートDB7へ保存する。なお、図5に示したテーブルの構成は一例であり、項目テーブル701、関係テーブル702と同等の情報を持つものであれば、構造化データの形式は問わない。例えば、構造化データの内容を、XML等で定義されたフォーマットに変換して保存してもよい。
上述した機能要素101〜105、及び機能要素112〜114を利用することにより、ユーザは構造化された読影レポートを手動で作成及び編集することができる。一方、機能要素106〜111は、ユーザが自由な形式で記述した非構造化レポートを、構造化されたレポートに変換するための機能要素である。本実施形態では、ユーザが構造化されたレポートを直接作成するのを支援するための処理と、機能要素106〜111が、非構造化レポートを、カンファレンスの場で議論された内容に応じて構造化レポートへ変換する処理について説明する。以下、非構造化レポートについて議論する場を医療カンファレンス(以降ではカンファ、カンファレンスとも記す)として説明する。
発言情報取得部106はカンファ中になされた発言内容に関する情報を取得する。後述するように、発言情報取得部106は、カンファ中になされた発言の音声として取得し、音声認識によりテキスト情報として発言の情報を取得する。資料情報取得部107はカンファ中に参照された資料に関する情報を取得する。辞書データ取得部108は、辞書DB9から辞書データを取得する。取得された情報はカンファ中に発言内容を取得する際や、レポート項目の作成、レポート項目間の関係情報の作成を実施する際に使用される。
図6は、辞書DB9から取得される辞書データの一例を示す図である。図6(a)、図6(b)、図6(c)は、それぞれ、部位、病変、疾患に関するキーワード情報の一例を示している。図6(d)は係り受け語に関するキーワード情報の一例を示している。図6(e)は「所見」に関する文に用いられやすい語尾、及び、「診断」に関する文に用いられやすい語尾の情報の一例を示している。図6の詳細な説明は後述する。
レポート情報取得部111は、読影レポートDB7に保存されている読影レポートに関する情報を取得する。対応関係決定部109及び関係情報反映部110は、レポート項目間の関係情報を特定する。対応関係決定部109は、自然文により記載された読影レポートから作成された構造化中間データと、読影レポートを用いたカンファレンスにおいて取得された情報に基づき作成された構造化仮データとの対応関係を決定する。関係情報反映部110は、対応関係決定部109により決定された対応関係に基づいて、中間データに含まれる項目の間に関係情報を付与して構造化データを作成する。
(GUI)
図7は、本実施形態に係る構造化データ作成装置1のGUI(Graphical User Interface)の概要を示す概略図である。図7は、レポート入力画面の一例を示している。医用画像閲覧画面131には、読影対象となる画像を表示する。医用画像閲覧画面131に対する操作を介して、画像閲覧部101の機能を実現して、医用画像を出力デバイス12に表示する。
図7は、本実施形態に係る構造化データ作成装置1のGUI(Graphical User Interface)の概要を示す概略図である。図7は、レポート入力画面の一例を示している。医用画像閲覧画面131には、読影対象となる画像を表示する。医用画像閲覧画面131に対する操作を介して、画像閲覧部101の機能を実現して、医用画像を出力デバイス12に表示する。
患者情報表示エリア132には、読影対象となる画像の被写体である患者の情報を表示する。例えば、患者ID、名前、年齢、過去の病歴等が患者情報に該当する。依頼情報表示エリア133には、依頼元の部門情報や依頼された検査、依頼医からの依頼内容を表示する。
レポート作成エリア134は、「部位」、「所見」、「診断」、「処置」のエリアに分割されており、各々に対応するレポート項目の内容を入力するためのレポート項目入力枠135と、入力枠を追加するための入力枠追加ボタン136を表示する。レポート項目入力枠135は一つのレポート項目と対応づいており、ユーザによるその内容の編集操作を受け付ける。レポート項目入力枠135に対する操作を介して、レポート項目内容編集部103の機能を実行して、レポートの内容をユーザが編集できるようにする。入力枠追加ボタン136が押下されると、レポート項目作成部102の機能を実行し、新規のレポート項目を作成する。さらに、作成したレポート項目に対応するレポート項目入力枠135を表示する。なお、入力枠追加ボタン136は項目の種類毎に用意され、押下されたボタンに応じて対応する種類のレポート項目を作成する。また、入力枠の追加は入力デバイス11を介したキー操作により行われてもよい。例えば、「所見」のレポート項目の内容を編集中にTABキーを押下することで、「診断」のレポート項目を作成してもよい。同様に、「所見」のレポート項目の内容を編集中にRETURNキーが2回連続で押下されたことに応じて、別の「所見」のレポート項目を作成してもよい。
レポート項目入力枠135は、入力デバイス11を介してユーザにより選択される。ユーザは複数の入力枠を同時に選択することもできる。選択した入力枠が他の入力枠へドラッグ&ドロップされると、ドラッグ元の入力枠に対応するレポート項目とドロップ先の入力枠に対応するレポート項目の間の関係付けが指示されたものとみなす。このとき、関係情報作成部104及び関係情報保存部105の処理を順次実行する。すなわち、ドラッグ元のレポート項目とドラッグ先のレポート項目との間の対応関係または因果関係を示す関係情報を作成して、保存する。図8を参照して後述するように、対応関係と因果関係のどちらを作成するかは、ドラッグ元のレポート項目の種類と、ドラッグ先のレポート項目の種類とに応じて決定される。
レポート作成エリア134において、関係情報提示部113は、レポート項目間の関係を、レポート項目入力枠135を結ぶ線として表示する。関係の種類が対応関係である場合には、入力枠同士を結ぶ単純な線として表示する。関係の種類が因果の関係である場合には、根拠となるレポート項目の入力枠から結果となるレポート項目の入力枠への矢印として表示する。
医用画像閲覧画面131からレポート作成エリア134へ画像がドラッグ&ドロップされると、レポート項目作成部102により「部位」のレポート項目を作成し、それに対応する入力枠を表示する。同時に、作成した「部位」のレポート項目と対応関係を持つ「所見」のレポート項目を作成し、その入力枠を表示する。また、医用画像閲覧画面131から、既に存在するレポート項目入力枠135へ画像がドラッグ&ドロップされると、画像のソフトコピーをドロップ先のレポート項目の内容として登録する。レポート保存ボタン137が押下されると、レポート保存部114によりレポートの内容を読影レポートDB7に保存する。
(関係情報作成処理)
図8は、関係情報作成部104において、レポート項目間の関係の種類を自動的に決定する処理(関係情報作成処理)の手順を表すフローチャートである。図8の各ステップはCPU13の制御に基づき実行される。ここでは一例として、入力枠のドラッグ&ドロップによりレポート項目間の関係付けが指示された場合について説明する。ドラッグ元のレポート項目、ドロップ先のレポート項目は共に複数選択されており、それぞれの集合におけるn番目のレポート項目をDRAG(n)、DROP(n)で参照できるとする。
図8は、関係情報作成部104において、レポート項目間の関係の種類を自動的に決定する処理(関係情報作成処理)の手順を表すフローチャートである。図8の各ステップはCPU13の制御に基づき実行される。ここでは一例として、入力枠のドラッグ&ドロップによりレポート項目間の関係付けが指示された場合について説明する。ドラッグ元のレポート項目、ドロップ先のレポート項目は共に複数選択されており、それぞれの集合におけるn番目のレポート項目をDRAG(n)、DROP(n)で参照できるとする。
S801では、変数iに0を代入する。S802では、変数KiにDRAG(i)の種類を代入する。S803では、変数jに0を代入する。S804では、変数KjにDROP(j)の種類を代入する。S805では、DRAG(i)の種類KiとDROP(j)の種類Kjを比較する。項目の種類が同じである場合(S805でYES)は、S806へ進む。異なる場合(S805でNO)は、S807へ進む。S806では、DRAG(i)とDROP(j)の関係を、DRAG(i)を原因、DROP(j)を結果とする因果関係であると決定する。そして、S814へ進む。
S807では、DRAG(i)の種類KiとDROP(j)の種類Kjのどちらか一方が「所見」であり、かつ他方が「診断」であるかどうかを判定する。一方が「所見」かつ他方が「診断」である場合(S807でYES)には、S808へ進む。それ以外の場合(S807でNO)はS809へ進む。S808では、DRAG(i)とDROP(j)の関係を決定する。すなわち、DRAG(i)とDROP(j)のうち、項目の種類が「所見」である方を原因、項目の種類が「診断」である方を結果とする因果関係として決定する。そして、S814へ進む。
S809では、DRAG(i)の種類KiとDROP(j)の種類Kjのどちらか一方が「診断」であり、かつ他方が「処置」であるかどうかを判定する。一方が「診断」かつ他方が「処置」である場合(S809でYES)には、S810へ進む。それ以外の場合(S809でNO)はS811へ進む。S810では、DRAG(i)とDROP(j)の関係を決定する。すなわち、DRAG(i)とDROP(j)のうち、項目の種類が「診断」である方を原因、項目の種類が「処置」である方を結果とする因果関係であるとして決定する。そして、S814へ進む。
S811では、DRAG(i)の種類KiとDROP(j)の種類Kjのどちらか一方が「部位」であり、かつ他方が「所見」であるかどうかを判定する。一方が「部位」かつ他方が「所見」である場合(S811でYES)には、S812へ進む。それ以外の場合(S811でNO)はS813へ進む。S812では、DRAG(i)とDROP(j)の関係を対応関係に決定する。そして、S814へ進む。S813では、DRAG(i)とDROP(j)の間に直接的な関係はないと判断し、関係情報を作成しない。そして、S814へ進む。
S814では、変数jに1を加算する。S815では、変数jとドロップ先のレポート項目の数を比較する。変数jがドロップ先のレポート項目の数以上である場合(S815でYES)には、S816へ進む。それ以外の場合(S815でNO)はS804へ進む。
S816では、変数iに1を加算する。S817では、変数iとドラッグ元のレポート項目の数を比較する。変数iがドラッグ元のレポート項目の数以上である場合(S817でYES)には、処理を終了する。それ以外の場合(S817でNO)はS802へ進む。
以上のように、本実施形態に係る構造化データ作成装置1では、「部位」、「所見」、「診断」、「処置」の間の関係を、例えばレポート項目間を直線及び矢印線で結ぶように表示する。これにより、「部位」、「診断」、「処置」のつながりに関する論理の流れを分かりやすく表現することが可能となる。また、レポート項目を別のレポート項目へドラッグ&ドロップしたことに応じて、レポート項目の種類に応じて項目間の関係を自動的に決定する。このため、ユーザは、レポート項目間の関係づけを容易に編集することが可能である。
(構造化データ作成処理)
次に、非構造化レポートの内容を医療カンファレンスで議論することを通じて、その非構造化レポートに関する構造化データを作成する処理(構造化データ作成処理)について説明する。本実施形態では「処置」の項目の構造化については記載を省略するが、「部位」「所見」「診断」の項目と同様の手法により、「処置」の項目も構造化することが可能である。
次に、非構造化レポートの内容を医療カンファレンスで議論することを通じて、その非構造化レポートに関する構造化データを作成する処理(構造化データ作成処理)について説明する。本実施形態では「処置」の項目の構造化については記載を省略するが、「部位」「所見」「診断」の項目と同様の手法により、「処置」の項目も構造化することが可能である。
図9は、本実施形態で一例として取り上げる非構造化レポートの一例を示す図である。図9に示すように、非構造化レポートは、読影医等のユーザが、撮影画像に基づき所見や診断結果について自由な形式で記載した文書データ(テキストデータ等)と、撮影画像を代表するキー画像を含んでいる。
本実施形態では、このような非構造化レポート(文書情報)をユーザが予め作成しておき、構造化データ作成装置1は、この非構造化レポートを解析して、非構造化レポートに含まれる複数の項目を含む中間データを作成する。一方で、ユーザは、この非構造化レポートをディスプレイ等の出力デバイス12に出力しながら、カンファレンスを行う。そして、カンファレンス中に参加者が発した発言内容や、出力デバイス12において注目された個所等に基づいて、複数の種類の項目と当該項目の間の関係情報とを含む構造化レポート(構造化仮データ)を作成する。ここで、参加者が発した発言内容は、参加者から出力された音声データを音声認識技術によりテキスト化し、そのテキスト内容を解析することで非構造化データに含まれるレポート項目間の関係を取得する。そして、中間レポートに含まれる項目と構造化仮データに含まれる項目との対応関係を決定して、中間データに項目間の関係情報を付与して構造化データを作成する。
このように、本実施形態では、自然文を含む文書情報から作成された項目のみを含む中間データに、その文書情報を用いてなされたカンファレンスにおける議論の内容を反映して構造化データを作成する。したがって、本実施形態によれば、ユーザは手間をかけることなく、文書情報に含まれる項目間の関係を構造化した構造化データを取得することができる。
図10は、構造化データ作成装置1が、カンファレンスを通じて、非構造化レポートから構造化データを作成する際の、処理手順の概要を示すフローチャートである。図10の各ステップはCPU13の制御に基づき実行される。S1001では、カンファレンスでの議論対象の非構造化レポートから、構造化中間レポートを作成する。構造化中間レポート(中間データ)とは、レポート項目間の関係情報の作成が未実施の、構造化された読影レポートである。カンファが開始すると、S1002で構造化レポートの作成に必要な情報をカンファ中に取得する。
カンファが終了すると、S1003では、S1002で取得した情報を用いて構造化中間レポートの項目間の関係付けを実施し、構造化レポートを作成する。S1004では、S1003で作成した構造化レポートの内容を確認するための画面を関係情報提示部113が表示し、ユーザからの修正を受け付ける。そして、ユーザからの修正を構造化データに反映したうえで、レポート保存部114が最終的な構造化データを読影レポートDB7に保存する。ユーザによる修正は、レポート項目作成部102、レポート項目内容編集部103、関係情報作成部104、関係情報保存部105の機能により、図7に示したUI上で実施する。以降では、S1001、S1002及びS1003の詳細について説明する。
図11はカンファレンスでの議論対象の非構造化レポートから、構造化レポートを作成するための手順を示す概念図である。非構造化レポート1101は、カンファレンスの議論対象の読影レポートであり、自然文により自由記載の形式で作成された読影レポートである。非構造化レポート1101は事前にユーザにより作成されており、カンファレンス実施前に、レポート情報取得部111によって、読影レポートDB7から取得される。S1111では構造化中間レポート(中間データ)1102が作成される。S1111は図10におけるS1001に対応する。
S1112では非構造化レポート1101についてカンファレンスで議論した際に、後述するS1113及びS1114での処理で必要となるカンファレンスでの発言に関する情報と、参照された資料に関する情報を収集する。S1112は図10におけるS1002に対応する。
図11に示したテーブル群1103は、S1112において収集された情報の概念図であり、テーブルA1131及びテーブルB1132により構成される。テーブルA1131はカンファにおける発言内容に関する情報を記録した結果を有する。テーブルA1131の具体的な構成例を図12のテーブル(a)に示す。テーブルA1131はカンファにおける発言内容を、少なくとも各発言がなされた時刻と発言が完了した時刻の情報と共に記録する。テーブルA1131の具体的な作成手順については図13を用いて後述する。
テーブルB1132はカンファ中に参照された資料に関する情報を記録した結果を有する。テーブルB1132の具体的な構成例を図12のテーブル(b)に示す。テーブルB1132はカンファ中に参照された資料に関して、少なくとも当該資料が注目され始めた時刻と、注目され終わった時刻、当該資料のどの部分が注目されていたかの情報を有する。更に、出力デバイス12がディスプレイであった場合に、当該資料が画面上のどの位置に配置されていたかの情報を有する。テーブルB1132の具体的な作成手順については図14を用いて後述する。
S1113及びS1114では、テーブル群1103の情報に基づいて構造化レポート(仮データ)1104を作成する。構造化レポート1104における一つの所見項目、または一つの診断項目は、テーブルA1131の発言内容の1つの行の内容により作成され、「部位」に関するレポート項目はテーブルB1132で参照された資料が具体的な部位項目の内容となる。S1113では、テーブルA1131及びテーブルB1132の情報を用いて、レポート1104における部位項目と所見項目の間に関係情報を作成する。S1114では、テーブルA1131及びテーブルB1132の情報を用いてレポート1104における所見項目と診断項目の間に関係情報を作成する。構造化レポートの項目の作成、及び項目間の関係付けの詳細な手順は後述する。
S1115では、構造化レポート1104における項目と、構造化中間レポート1102における項目を比較し、両レポートのどの項目同士が対応するのかの対応付けを行う。この対応付けに関する処理は、対応関係決定部109により実現される。なお、テーブル群1103は非構造化レポート1101について議論がなされるカンファ中に得られた情報である。故に、テーブル群1103に基づいて作成された構造化レポート1104と非構造化レポート1101から直接作成された構造化中間レポート1102には有意な相関がある。
S1116では、S1115の処理の結果に応じて、構造化レポート1104の関係情報を構造化中間レポート1102に反映させる。本処理は関係情報反映部110により実現される。上述のS1111〜S1116の処理により、非構造化レポート1101を構造化レポート1105に変換することができる。つまり、非構造化レポート1101の構造化データを作成することができる。
図11に示した手順において用いる辞書データについて、図6を参照して説明する。図6(a)は部位情報に関する辞書である。図6(a)に例示する辞書データでは、辞書に登録された「部位」に関する語彙が、図11の構造化中間レポート1102に記載されているか否かという情報を伴って記録されている。図11の例では、「部位」を示す語彙(用語)ごとに、「○」は構造化中間レポート1102に記載されていることを示し、「×」は構造化中間レポート1102に記載されていないことを示している。前述のように、本実施形態では、カンファレンスにおいて非構造化レポートを参照してなされた発言の音声データを取得し、その音声データを解析して、非構造化データに含まれるレポート項目の抽出や関係情報の取得を行う。辞書に登録されている情報に関する語彙については、音声データの波形の、予め多くのパターンの学習データを準備し、後述のS13202の文字列変換を精度よく実施できるように備えられている。
図6(b)(c)の辞書には、それぞれ「病変名」、「疾患名」に関する各語彙が、「部位」に関する辞書と同様の目的で、図11の構造化中間レポート1102に記載されているか否かの情報を伴って記録されている。すなわち、「病変名」、「疾患名」の語彙ごとに、「○」は構造化中間レポート1102に記載されていることを示し、「×」は記載されていないことを示している。なお、図6(a)〜(c)の辞書の各ワードに関して、構造化中間レポート1102に記載されているか否かという情報はS1111(図10のS1001)にて記録される。
図6(d)は、係り受け語に関する辞書であり、発言された音声から、発言の根拠を述べる箇所を特定するためのワードが登録されている。図6(d)に登録されているワードは辞書の中でA、B、Cの3種類に分類されている。種類Aの係り受けは、一つの文を、根拠について述べている部分と、その根拠により導かれた結論の部分に分離する。種類Aの係り受け語の前に根拠が述べられる。種類Bの係り受け語は、文と文を繋ぐ接続詞のうち、係り受け語の前に根拠が述べられるものである。したがって、種類A又は種類Bの係り受け語に相当する語彙が用いられたときは、その語彙の前に存在するレポート項目を根拠、その語彙の後に存在するレポート項目を結果とする関係情報を取得することができる。種類Cの係り受け語は、文と文を繋ぐ接続詞のうち、係り受け語の後に根拠が述べられるものである。したがって、種類Cの係り受け語に相当する語彙が用いられたときは、その語彙の後に存在するレポート項目を根拠、その語彙の前に存在するレポート項目を結果とする関係情報を取得することができる。
図6(e)は、「所見」と「診断」に関する文に其々用いられやすい、文中の述語部が登録されている。したがって、図6(e)の辞書において「所見」に対応するワードを含むレポート項目はその種類を「所見」と判定し、「診断」に対応するワードを含むレポート項目はその種類を「診断」と判定することができる。
●中間レポート作成(S1111)
次に、図10、図11を参照して概略を説明した構造化レポート作成処理の詳細な処理手順を説明する。まず、図11のS1111(図10のS1001に対応)にて非構造化レポート1101を構造化中間レポート(中間データ)1102に変換する処理の手順について説明する。前述のように、S1111では、自然文を含む文書情報を解析して、当該文書情報に含まれる前記複数の項目を含む中間データを作成する中間データ作成処理を行う。ここでは、文書情報に含まれる自然文を少なくとも1つの部分に区切り、各部分について、少なくとも1つの種類のいずれの項目にあたるかを、項目の種類に関する辞書データを参照して判定することにより、中間データを作成する。本処理はレポート項目作成部102により実施される。
次に、図10、図11を参照して概略を説明した構造化レポート作成処理の詳細な処理手順を説明する。まず、図11のS1111(図10のS1001に対応)にて非構造化レポート1101を構造化中間レポート(中間データ)1102に変換する処理の手順について説明する。前述のように、S1111では、自然文を含む文書情報を解析して、当該文書情報に含まれる前記複数の項目を含む中間データを作成する中間データ作成処理を行う。ここでは、文書情報に含まれる自然文を少なくとも1つの部分に区切り、各部分について、少なくとも1つの種類のいずれの項目にあたるかを、項目の種類に関する辞書データを参照して判定することにより、中間データを作成する。本処理はレポート項目作成部102により実施される。
部位項目は、非構造化レポート1101に添付されている資料から作成する。添付されている資料毎に、その資料を部位項目として作成する。また、所見項目及び診断項目は、非構造化レポート1101に記載の自然文を解析することで作成する。まず、自然文を、句点で区切る。
句点で区切られた結果、一つの文に図6(b)に登録されているワードが1つ含まれており、かつ、図6(c)に登録されているワードが1つも含まれていない場合、その文の内容を持つ所見項目を作成する。その際に、図6(b)に当該ワードが非構造化レポート1101に含まれていたということを辞書13(b)に記録する。すなわち、図6(b)の例では、一つの文に含まれているワードに対応する「病変名」が「×」として記録されていた場合は、その記録を「○」へ変更する。
句点で区切られた結果、一つの文に図6(b)または図6(c)に登録されているワードが1つも含まれておらず、かつ、大きさ・形状・濃度・質感に関連するワードが含まれる場合は、その文の内容を持つ所見項目を作成する。
句点で区切られた結果、一つの文に図6(c)に登録されているワードが1つ含まれており、かつ、図6(b)に登録されているワードが1つも含まれていない場合、その文の内容を持つ診断項目を作成する。その際に、図6(c)に当該ワードが非構造化レポート1101に含まれていたということを辞書13(c)に記録する。すなわち、図6(c)の例では、一つの文に含まれているワードに対応する「疾患名」が「×」として記録されていた場合は、その記録を「○」へ変更する。
句点で区切られた結果、一つの文に図6(b)または図6(c)に登録されているワードが、計2つ以上含まれている場合、自然言語解析の手法を使って、その文を複数の文字列に区切る。具体的には、一つの文に図6(b)または図6(c)に登録されているワードが最大で計1つとなるように区切る。文中において主語述語の関係を持つ部分は同じ文字列に含まれることを優先したうえで、”接続詞”及び”助詞”を区切りの境界として区切る。文が区切られた結果作成された文字列の中に、図6(b)に登録されているワードが含まれている場合は、その文字列の内容を持つ所見項目を作成する。その際に、図6(b)に当該ワードが非構造化レポート1101に含まれていたということを辞書13(b)に記録する。すなわち、そのワードに対応する「病変名」が「×」として記録されていた場合は、その記録を「○」へ変更する。文が区切られた結果作成された文字列の中に、図6(c)に登録されているワードが含まれている場合は、その文字列の内容を持つ所見項目を作成する。その際に、図6(c)に当該ワードが非構造化レポート1101に含まれていたということを辞書13(c)に記録する。すなわち、そのワードに対応する「疾患名」が「×」として記録されていた場合は、その記録を「○」へ変更する。
●テーブル作成(S1112)
次に、図11のS1112(図10のS1002に対応)にて、カンファレンスにおける発言内容を収集してテーブルA1131を作成する処理について、図13を参照して説明する。S1112では、文書情報を含む資料を用いてなされたカンファレンス(議論)に関する議論情報を取得する。ここで、議論情報には、議論においてなされた発言に関する発言情報と、議論において参照された資料に関する資料情報とが含まれる。この発言情報には発言の内容とその発言がなされた時刻とが含まれ、資料情報には、参照された資料の対象(資料の識別情報、資料の注目位置の情報等)と、その参照がなされた時刻とが含まれる。図13は、図11のS1112にてテーブルA1131を作成する処理の手順を示すフローチャートである。この処理は、CPU13の制御に基づき発言情報取得部106により実施される。
次に、図11のS1112(図10のS1002に対応)にて、カンファレンスにおける発言内容を収集してテーブルA1131を作成する処理について、図13を参照して説明する。S1112では、文書情報を含む資料を用いてなされたカンファレンス(議論)に関する議論情報を取得する。ここで、議論情報には、議論においてなされた発言に関する発言情報と、議論において参照された資料に関する資料情報とが含まれる。この発言情報には発言の内容とその発言がなされた時刻とが含まれ、資料情報には、参照された資料の対象(資料の識別情報、資料の注目位置の情報等)と、その参照がなされた時刻とが含まれる。図13は、図11のS1112にてテーブルA1131を作成する処理の手順を示すフローチャートである。この処理は、CPU13の制御に基づき発言情報取得部106により実施される。
図13の左側のフローチャートはカンファ中に参加者により発言された言葉を音声として認識し、文字データに変換して出力する処理の手順を示している。図13の右側のフローチャートは、左側のフローチャートの処理により出力された文字データからテーブルA1131の各行を作成する処理の手順を示している。
まず、図13の左側のフローについて説明する。S1301では入力デバイス11を用いて音声のアナログデータを取得する。この時、アナログデータが取得された時刻情報も同時に取得する。入力デバイスとしては、例えば、マイク等が使用される。S1302では、S1301で取得した音声のアナログデータを、文字列に変換する。その際、発言情報取得部106は、辞書データ取得部108により取得した図6(a)〜(d)に示す医療辞書及び係り受け語に関する辞書を用いて、少なくとも必要な情報に関する文字列変換の精度が良くなるようにすることができる。また、医療に関するワードの情報を有する医療辞書や根拠を表す係り受けワードに関する情報を有する係り受け辞書に含まれるワードの音声データを予め学習しておくことで、音声認識によりワードを精度よく取得することができる。S1303ではS1302で生成した文字列を、S1301で取得した時刻情報にもとづいて、文字列に対応する発言がなされた時刻情報と共に所定の出力ファイルに出力する。
S1304では、カンファレンスが終了しているか否かを判定し、カンファレンスが終了していない場合(S1304でNO)はS1301〜S1303の処理を続行する。カンファレンスが終了していた場合(S1304でYES)は、S1301〜S1303の処理を終了する。
次に、図13の右側のフローについて説明する。図13の右側の処理は、図13の左側のフローの処理が終了してから実行してもよいし、左側のフローの処理と並行して実行してもよい。
S1305では、S1303で出力された文字列データを、時間的な間、及び図6(d)に例示した係り受けに関するワードを境に、複数の文字列に区切る。S1306及びS1307では、S1305で複数の文字列の境界の検出に利用した係り受けのワードを、作成された複数の文字列のうち、適切な文字列に加える処理を実施している。より具体的には、種類Aのワードはそのワードの直前の文字列に(S1306)、種類B、Cのワードはそのワードの直後の文字列に加える(S1307)。例えば、「○○○なので△△△ですね」という文字列が与えられた場合、「なので」は係り受けに関するワード(図6(d))にあたる。そのため、S1305では、この文字列を「なので」を境に、「○○○」「なので」「△△△ですね」の3つに分解する。そして、「なので」は種類Aのワードにあたるので、S1306において「なので」をその直前の文字列「○○○」に加えて、「○○○なので」という文字列にまとめる処理を行う。同様に、例えば、「○○○ですね。なぜなら△△△」という文字列が与えられたときは、S1305でこの文字列を「○○○ですね。」「なぜなら」「△△△」の3つに分解し、S1307で「○○○ですね。」「なぜなら△△△」とまとめることになる。
S1308では、S1305〜S1307で作成された各文字列の開始時刻及び終了時刻を特定する。文字列の開始時刻とはその文字列の基となった発言が開始された時刻であり、終了時刻とは発言が終了した時刻である。これはS1303で出力された文字列データに付与された時刻データを基に特定する。S1309では、S1305〜S1307で作成された各文字列を、S1308で特定された各文字列の開始時刻・終了時刻と共にテーブルA1131の一つの行として、テーブルA1131を作成する。つまり、一つの文字列から、テーブルA1131の一つの行が作成される。
次に、図11のS1112(図10のS1002に対応)にて、カンファレンス注目された資料の情報に基づいてテーブルB1132を作成する処理について、図14を参照して説明する。図14は、図11のS1112にてテーブルB1132を作成する処理の手順を示すフローチャートである。この処理は、CPU13の制御に基づき資料情報取得部107により実施される。
図14の左側のフロー図では、カンファレンスを通して、資料が出力デバイス12に表示されたことを検知し(S1401)、更に表示が終了したことを検知する(S1402)。資料が表示された際(S1401でYES)には、出力デバイス12がディスプレイであった場合は、資料が画面上のどの位置に表示されたのかの情報を取得する(S1404)。更に、表示された資料を、カンファレンスで注目対象となる資料の候補とみなし、別スレッドでの監視対象として登録する(S1405)。なお、S1402で資料の表示が終了したことを検知した場合(S1402でYES)には、その資料をカンファレンスで注目対象となる資料の候補から解除する(S1406)。
S1403ではカンファレンスが終了したか否かを判断する。カンファレンスが終了していない場合(S1403でNO)、S1401とS1402の処理を再度実施する。カンファレンスが終了した場合(S1403でYES)、図14に示すフロー図の全ての処理を終了する。
カンファレンスで注目対象となる資料の候補となった資料に対しては、図14の真ん中のフロー図により、資料に対するイベントの監視を開始する。監視対象となった資料が注目された際には(S1407〜S1409)、テーブルB1132を更新する処理を開始する(S1411〜S1413)。なお、資料が注目されたことは、発表者がポインティング装置を用いて資料を明示的に指し示すこと(S1407)や、参加者の視線が資料に向けられたこと(S1408)や、資料を注目することを示唆する発言があったこと(S1409)により判断する。ここで、ポインティング装置には、例えば、マウスやレーザポインタ等が含まれる。
資料が注目された際のテーブルB1132を更新する処理(S1411〜S1413)は、図14の右側のフローに示す手順で実施される。S1414では、注目された資料、資料の画面配置、及び資料のどの部分が注目されているかを特定し、それと一致する行がテーブルB1132に既に存在するか否かをサーチし、終了時刻のカラムが最も遅い行を抽出する。
S1415では、S1414で抽出した行の終了時刻と、今回注目対象が注目されている時刻とを比較することにより、その資料が連続して注目されていたものか、注目が開始されたばかりなのかを判定する。この判定は、例えば、抽出した行の終了時刻が、現在日時からX秒以内の場合か否かを算出することで実現できる。Xの具体的な値は、カンファレンスの状況に応じて、チューニングして最適値を予め設定しておくことができる。
連続して注目されていた場合(S1415でYES)は、抽出した行の終了時刻を現在時刻に更新し(S1416)、処理を終了する。注目が開始されたばかりの場合(S1415でNO)は、テーブルB1132に新規の行を作成する(S1417)。テーブルB1132に新規の行を追加する際には、”開始時刻”カラムと”終了時刻”カラムに現在時刻を設定する。”種別”カラムには、S1411〜S1413のいずれの経路でS1416に到達したかを識別する情報を設定する。すなわち、マウスのポインタ指示に応じて(S1407でYES)カラムを追加した場合は「マウス」の種別を設定する。視線の検知に応じて(S1408でYES)カラムを追加した場合は「視線」の種別を設定する。発言の検知に応じて(S1409でYES)カラムを追加した場合は「発言」の種別を設定する。”資料”カラムには注目されている資料を特定する情報を設定する。”注目位置”カラムには、注目されている資料のどの部分が注目されているのかを特定する情報を設定する。”画面配置”カラムには、注目されている資料が、ディスプレイのどの位置に表示されているかを特定する情報を設定する。なお、どの資料のどの部分が注目されているかを検知する手法は、例えば、特開2015−118448号公報に記載されている。そこで、本実施形態においても特開2015−118448号公報に記載の手法を活用することができる。
●テーブルに基づく構造化レポート作成(S1113、S1114)
次に、図11におけるS1113及びS1114の処理により取得されたカンファレンスの情報に基づいて構造化レポート(仮データ)を作成する処理について、図15を参照して説明する。図15は、カンファレンスから得られた情報に基づいて構造化レポートを作成する処理の手順を示すフローチャートである。本処理は、CPU13の制御に基づきレポート項目作成部102、関係情報作成部104により実施される。
次に、図11におけるS1113及びS1114の処理により取得されたカンファレンスの情報に基づいて構造化レポート(仮データ)を作成する処理について、図15を参照して説明する。図15は、カンファレンスから得られた情報に基づいて構造化レポートを作成する処理の手順を示すフローチャートである。本処理は、CPU13の制御に基づきレポート項目作成部102、関係情報作成部104により実施される。
仮データの作成では、発言情報及び資料情報から、項目の種類に関する辞書データを参照して、いずれかの種類にあたる項目を抽出し、抽出された各項目の間の関係情報を、項目の種類ないし係り受け語に関する辞書データを参照して決定する。より具体的には、発言の内容から抽出された項目と、当該発言と同一の時間帯に参照された資料の対象から抽出された項目との間に関係があるとして、関係情報を決定する。
S1501では、テーブルA1131及びテーブルB1132の情報に基づいて、構造化中間レポートを作成する。部位項目は、テーブルB1132から作成する。テーブルB1132の一行毎に”資料”カラムの資料を部位項目として作成する。なお、同じ資料を基に作成され、なおかつ基となった資料の注目箇所も同じ部位項目が複数あった場合は、一つの部位項目のみを作成して共通の部位項目として扱ってもよい。
所見項目及び診断項目は、テーブルA1131から作成する。テーブルA1131の一行毎に”発言内容”カラムの内容をチェックし、図6(b)と図6(c)に示した医療辞書に登録されている「病変名」または「疾患名」を含むかを判定する。”発言内容”カラムに「病変名」が含まれる場合は、その”発言内容”カラムの内容を所見項目として作成する。”発言内容”カラムに疾患名が含まれる場合は、その”発言内容”カラムの内容を診断項目として作成する。なお、所見項目及び診断項目は、図6(e)に示した医療辞書に登録されているワードで区別できることが多い。そのため、必要に応じて図6(b)、図6(c)、及び図6(e)の各辞書を組み合わせて所見項目を作成するか、診断項目を作成するかを決定してもよい。
テーブルA1131の行のうち、所見項目にも診断項目にも分類されなかった行については、大きさ・形状・濃度・質感に関連するワードを含む行は「所見」についての発言であると判断し、その行の内容を持つ所見項目を作成する。その他の項目は診断項目とする。なお、上記のような処理の後にどの項目に分類すべきか不明だったレポート項目は、種別が不明な項目として別途分類するようにしてもよい。
S1502では、「所見」の内容が発言された時間帯に注目されていた対象を特定する。注目対象の特定は、テーブルB1132を参照して、「所見」の内容が発言された時間帯に対応する資料、注目位置、画面配置を参照して行う。そして、発言された「所見」の内容によって作成された所見項目と、特定された対象である資料により作成された部位項目の間に対応関係の関係情報を作成する。
S1503〜S1505ではS1501で作成された構造化中間レポートを構成する全ての診断項目について、その診断項目と関係付く項目を特定する。まずS1503において、S1501において作成された構造化中間レポートの中から一つの診断項目(Z)を選択する。次に、S1502において、その診断項目と対応関係または因果関係を有するレポート項目を特定し、診断項目と特定されたレポート項目とを関係づける。診断項目と関係付くレポート項目を特定するための処理の詳細は、図16を参照して後述する。次に、S1505において、構造化中間レポートに含まれる全ての診断項目についてS1504の処理を行ったか否かを判定する。全ての診断項目について処理を行っていない場合(S1505でNO)はS1503へ戻って、未選択の診断項目についてS1504の処理を行う。全ての診断項目について処理を行った場合(S1505でYES)は処理を終了する。
●関係付く項目の特定(S1504)
次に、S1504において診断項目と関係づけるべきレポート項目を特定する処理の詳細について、図16を参照して説明する。図16は構造化レポート1104を構成する一つの診断項目(Z)と関係付く項目を特定するための処理手順を示すフローチャートである。
次に、S1504において診断項目と関係づけるべきレポート項目を特定する処理の詳細について、図16を参照して説明する。図16は構造化レポート1104を構成する一つの診断項目(Z)と関係付く項目を特定するための処理手順を示すフローチャートである。
S1601では、診断項目(Z)に図6(d)に記載の辞書に登録されたワードがあるか否かを判定する。すなわち、診断項目として分類されたレポート項目の内容に、種類A、種類B、種類Cのいずれかにあたるワードが含まれるか否かを判定する。含まれていない場合(S1601でNO)、S1602に進む。
S1602では、診断項目(Z)が作成される際に基となったテーブルA1131の行Xを特定する。続いて、行Xの開始時刻カラムの値よりも、終了時刻カラムの値が小さい行の中から、行Xの開始カラムの値と最も近い終了時刻カラムの値を持つ、所見項目の基となった行Yを特定する。そして、行Yの発言がなされていた際の注目対象をテーブルB1132から特定し、その注目対象が、行Xが発言されていた際の注目対象に含まれているか否かを判定する。含まれていた場合(S1602でYES)はS1603に進む。S1603では、診断項目(Z)と行Xが基となって作成された所見項目の間に関係情報を作成する。
S1604では、診断項目(Z)が作成される際に基となったテーブルA1131の行Xを特定し、行Xの開始時刻カラムの値を取得する。次に、行Xの開始時刻カラムの値と比較して、終了時刻カラムの値が最も直近の行YをテーブルA1131から取得する。行Yが、所見項目が作成された際の基となる行であり、行Yの発言に図6(d)の種類Aの係り受けワードが含まれるか否かを判定する。含まれていた場合(S1604でYES)、S1605に進む。S1605では、行Yが基となり作成された所見項目の間に関係情報を作成する。
S1606では、診断項目(Z)が作成される際に基となったテーブルA1131の行Xを特定し、行Xの発言内容に図6(d)の種類Bの係り受けワードが含まれるか否かを判定する。含まれていた場合(S1606でYES)、S1607に進む。S1607では、行Xの開始時刻カラムの値よりも、終了時刻カラムの値が小さい行の中から、最も行Xの開始カラムの値と近い終了時刻カラムの値を持つ、所見項目の基となった行Yを特定する。そして、診断項目(Z)と行Yを基に作成された所見項目の間に関係情報を作成する。
S1608では、診断項目(Z)が作成される際に基となったテーブルA1131の行Xを特定し、行Xの終了時刻カラムの値を取得する。そして、行Xの終了時刻カラムの値よりも開始時刻カラムの値が大きく、かつ行Xの終了時刻カラムの値ともっとも近い開始時刻カラムの値を持つ行YをテーブルA1131から特定する。そして、行Yの発言内容が図6(c)の種類Bの係り受けワードを含むか否かを判定する。含む場合(S1608でYES)、S1609に進む。S1609では、行Yを基に作成された項目が「所見」か、「診断」かを判定する。所見項目であった場合(S1609で「所見」)S1610に進み、診断項目であった場合(S1609で「診断」)S1611へ進む。S1610では、行Yを基に作成された項目と所見項目(Z)の間に関係情報を作成する。S1611では行Yを基に作成された診断項目と診断項目(Z)が「原発」(原発癌)と「転移」(転移癌)の関係にあるか否かを判定する。「原発」と「転移」の関係であれば(S1611でYES)、S1612に進む。S1612では、行Yを基に作成された診断項目と診断項目(Z)の間に、関係情報を付ける。
なお、S1601〜S1603、S1604〜S1605、S1606〜S1607、及び、S1608〜S16012の各処理は、それぞれ診断項目(Z)に対して実行する。これにより診断項目(Z)に対して複数の項目が関係づけるべき項目として特定されたときは、特定された複数の項目の各々に対応する関係情報を生成する。この場合、診断項目(Z)には一対多の関係が形成されることになる。一方、上記の処理により診断項目と関係づける対象がいずれも特定されなかった場合は、その診断項目には関係情報を生成しない。
なお、診断項目と関係付く項目を特定する手法として、特開2009−193157号公報に記載の手法を用いてもよい。特開2009−193157号公報の手法では、疾患の種類毎に、どの資料をどの画面領域に表示するかを予め登録したテーブルを用いて、自動で資料を適切な画面領域に表示する。つまり、議論する疾患の種類に応じて参照する資料の画面位置が決まっている。逆に、注目されている資料が画面のどの領域に表示されているかを判定すれば、どの疾患名について議論がなされているかを特定することができる。そこで、本実施形態においては、各診断項目から疾患名を抽出し、その疾患名を議論する際に参照される資料がどの画面領域に表示されるかを特開2009−193157号公報の手法により特定する。そして、その診断項目が作成された基となるテーブルA1131の行から、その診断項目が議論されていた時間帯を取得し。その時間帯の近傍で前述の特定された画面領域に表示されていた資料をテーブルB1132から特定し、その資料を基に作成された部位項目と対応関係を持つ所見項目を、診断項目と関係付ける項目として決定する。
また、図16において、診断項目(Z)と関係付くと特定された所見項目だけでなく、その所見項目を含むグル―プに所属する所見項目及び診断項目との間にも同時に関係付けを行ってもよい。例えば、テーブルA1131の行と行の時間間隔が近い行を同じグループに所属する発言とみなす。具体的には、第一の行の”終了時刻”カラムの値と、第二の行の”開始時刻”カラムの値の差がY秒以内であるか否かを算出し、Y秒以内であれば第一の行と第二の行は同じグループであると判定する。Yの具体的な値は、発表者が誰であるのか、カンファレンスの状況に応じて、チューニングして最適値を用いることができる。
このように、本実施形態では、発言と発言の間隔が所定の大きさ以上となる箇所や、根拠を表す係り受けワード等を発言内容を分割する境界とし、分割された発言内容を其々一つの所見エントリまたは診断エントリとする。さらに、所見エントリが作成される基となった発言内容が発言された時間帯に参照されていた資料または注目箇所に対応する部位エントリを特定し、所見エントリと部位エントリの間にリンクを作成する。
また、得られた発言内容から、根拠を論じているエントリと、根拠を論じているエントリから導かれる結果を論じているエントリを特定する。そして、根拠を論じているエントリが所見エントリであり、その根拠を論じているエントリから導かれる結果を論じているエントリが診断である場合に、それらのエントリ間にリンクを作成する。
さらに、所見エントリ及び診断エントリが作成される基となった発言内容が発言された時刻に参照されていた資料または注目箇所を其々特定し、参照されていた資料または注目箇所が同じであった場合に所見エントリと診断エントリの間にリンクを作成する。したがって、本実施形態によれば、カンファレンスに関する情報に基づき、構造化データを作成するのに有効な情報を取得することができる。
●構造化中間レポートの対応づけ(S1115)
次に、図11のS1115において、非構造化データから生成された構造化中間レポート(中間データ)と、非構造化データからカンファでの発言や注目対象等を基に生成された構造化レポート(仮データ)とを対応付ける処理の詳細を説明する。この処理は、図10のS1003に対応する。本処理はCPU13の制御に基づき対応関係決定部109により実施される。S1115では、対応関係決定部109が構造化レポート1104と構造化中間レポート1102を構成する項目の対応関係を決定する。なお、ここで述べる「対応関係」とは、複数のレポート項目が一定の関連性を有するという意味の対応関係とは異なり、構造化レポート1104の項目が構造化中間レポート1102の項目に相当することを意味する。S1115では、同一の種類の同一の値を有する、中間データに含まれる項目と、仮データに含まれる項目とはこのような対応関係を有すると決定する。
次に、図11のS1115において、非構造化データから生成された構造化中間レポート(中間データ)と、非構造化データからカンファでの発言や注目対象等を基に生成された構造化レポート(仮データ)とを対応付ける処理の詳細を説明する。この処理は、図10のS1003に対応する。本処理はCPU13の制御に基づき対応関係決定部109により実施される。S1115では、対応関係決定部109が構造化レポート1104と構造化中間レポート1102を構成する項目の対応関係を決定する。なお、ここで述べる「対応関係」とは、複数のレポート項目が一定の関連性を有するという意味の対応関係とは異なり、構造化レポート1104の項目が構造化中間レポート1102の項目に相当することを意味する。S1115では、同一の種類の同一の値を有する、中間データに含まれる項目と、仮データに含まれる項目とはこのような対応関係を有すると決定する。
まず、「部位」の項目の対応関係について説明する。部位項目の対応関係は、部位項目が作成させた基となる資料の実体が同じか否かで決定する。また、CTやMRI等の「部位」を特定できる資料を基に作成された部位項目に関しては、部位項目の実態である医用画像のDICOM情報も利用して対応関係にあるか否かを決定する。例えば、同じDICOM画像を基に作成された部位項目ではない場合でも、同じ「部位」に関する資料であれば対応関係にあるとする。DICOM情報を基に対応関係の有無を決定する手順を説明する。
まず、構造化レポート1104と構造化中間レポート1102の其々に記載された部位項目について、DICOM情報から部位情報を表す情報を抽出する。その結果、同じ「部位」を示していると判定された場合、その部位項目同士は対応関係にある。複数の候補がある場合、部位エントリに付与されたアノテーション等の他の情報も含めたうえで対応関係を決定する。例えば、構造化中間レポート1102の「部位」の項目である医用画像にROI(Region Of Interest)が付与されていた場合、ROIの部分がその医用画像の注目箇所となる。一方、構造化レポート1104の「部位」の項目である医用画像に関しては、それが作成された元の情報であるテーブルA1131の”注目位置”欄の情報が、その医用画像の注目位置となる。両者の注目位置が最も同じ位置の部位項目同士を対応関係があるとする。
次に、「所見」の項目の対応関係について説明する。所見項目の対応付けは、所見項目が有する「部位」と病変の属性の値を比較することで実現する。まず、構造化レポート1104と構造化中間レポート1102の各所見項目から「部位」を表すワードと病変を表すワードを各項目の属性として抽出する。そして、「部位」と病変の属性値がレポート1104とレポート1102の所見項目間で一致した場合、それらの所見項目は対応関係にあるとする。なお、「部位」及び病変に関するワードを抽出する際には、図6(a)及び(b)の辞書に登録されているワードを検索することとなる。
構造化レポート1104の所見項目の内容に「部位」の属得値が省略されて記載されていない場合は、その所見項目と関係付けられている部位項目の情報(例えばDICOM情報)を代用する。また、所見項目のうち、図6(b)に登録されているキーワードを一つも含まない項目については所見項目が有する「部位」に関する情報と、大きさ・形状・濃度・質感に関連するワードを、マッチングのキーとして対応関係を決定する。
なお、所見エントリに部位を表すワードが存在しない場合は、所見エントリとの間にリンクがある部位エントリから部位を表すワードを推定するようにしてもよい。あるいは、診断エントリに含まれる疾患名を表すワードが存在しない場合、議論目的に応じて予め疾患名毎に設定された参照資料の配置位置や、発言された際に参照されていた資料の配置位置に基づき、診断エントリに記載ない疾患名を推定してもよい。
次に、「診断」の項目の対応付けについて説明する。診断項目の対応付けは、診断項目が有する疾患名を比較することで実現する。構造化レポート1104と構造化中間レポート1102の診断項目から疾患名を表すワードを抽出し、その抽出した疾患名がレポート1104とレポート1102の診断項目間で一致した場合、それらの診断項目は対応関係にあるとする。なお、疾患名のワードを抽出する際には、図6(c)の辞書に登録されているワードを検索することとなる。
●構造化中間レポートに対する関係情報作成(S1116)
次に、図11のS1115の処理が完了した後、図11のS1116にて、構造化中間レポート1102の項目間に関係情報を作成する処理について説明する。S1116では、仮データ(構造化レポート)に含まれる項目の間の関係情報を、当該仮データに含まれる項目と対応関係を有する中間データ(構造化中間レポート)に含まれる項目の間に付与することにより、構造化データを作成する。本処理は、CPU13の制御に基づき関係情報反映部110、関係情報作成部104により実行される。
次に、図11のS1115の処理が完了した後、図11のS1116にて、構造化中間レポート1102の項目間に関係情報を作成する処理について説明する。S1116では、仮データ(構造化レポート)に含まれる項目の間の関係情報を、当該仮データに含まれる項目と対応関係を有する中間データ(構造化中間レポート)に含まれる項目の間に付与することにより、構造化データを作成する。本処理は、CPU13の制御に基づき関係情報反映部110、関係情報作成部104により実行される。
関係情報反映部110は、構造化レポート1104を構成するレポート項目のうち、S1115で対応関係決定部109により構造化レポート1104と対応関係があると判定されたレポート項目を抽出する。抽出された構造化レポート1104のレポート項目間に関係情報がある場合、その関係情報を持つ抽出されたレポート項目と対応関係がある構造化中間レポート1102の当該レポート項目間にも同様の関係情報を作成する。例えば、構造化レポート1104のレポート項目1とレポート項目2が、それぞれ構造化中間レポートのレポート項目aとレポート項目bと対応関係があるとする。更に、構造化レポート1104のレポート項目1とレポート項目2の間に、レポート項目2を”原因”としレポート項目1を”結果”とする因果関係があったとする。この場合、関係情報反映部110は、構造化中間レポート1102のレポート項目aとレポート項目bの間に、レポート項目bを”原因”としレポート項目aを”結果”とする因果関係を作成する。構造化中間レポート1102の関係情報は、関係情報反映部110の指示により、関係情報作成部104及び関係情報保存部105により作成される。
なお、前述の説明においては、構造化中間レポート1102の項目に対応する構造化レポート1104の項目間の関係情報のみを構造化中間レポート1102に反映する例を示した。しかし、本実施形態はその様な構成に限られるものではない。例えば、構造化レポート1104を構成するレポート項目で、構造化中間レポート1102のレポート項目に対応関係がないレポート項目の取り扱いを変更してもよい。つまり、構造化レポート1104にしか記載されていない内容のレポート項目を、構造化中間レポート1102に新規作成したうえで、関係情報反映部110の機能を実現してもよい。
また、図11の手順で作成された構造化レポートをレポート保存部114が読影レポートDB7に保存する際には、レポート項目の発生経路を明確にした形式で保存してもよい。つまり、保存される各レポート項目が、S1111で作成された項目なのか、構造化レポート1104にしか存在しない内容のレポート項目がレポート1102に追加されたものなのか、を区別できる形式で保存してもよい。
また、本実施形態では、構造化中間レポート1102の項目間の関係情報を、構造化中間レポート1102を構成する項目と構造化レポート1104を構成する項目との対応関係に基づいて作成した。しかし、非構造化レポート1101に図6(d)の係り受け語に関する辞書に登録されている因果関係を示すワードが省略されていない場合、カンファレンスの発言から項目間の関係を決定するよりも精度が高くなることもあり得うる。その様な場合においては、対応関係決定部109及び関係情報反映部110の機能を用いることなく、非構造化レポート1101に記載された係り受けの情報を用いて、構造化中間レポート1102の項目間の関係情報を直接作成してもよい。
以上のように、本実施形態の構造化データ作成装置1は、自然文を含む文書情報(読影レポート等の非構造化データ)を解析して、その文書情報に含まれる複数の項目を含む中間データを作成する。一方で、この文書情報を含む資料を用いてなされた議論に関する議論情報を取得し、議論情報から、複数の種類の項目と当該項目の間の関係情報とを含む仮データを作成する仮データ作成処理を行う。そして、中間データに含まれる項目と、仮データに含まれる項目との対応関係を決定し、決定された対応関係に基づいて、中間データに含まれる項目の間に関係情報を付与して構造化データを作成する。したがって、ユーザは、文書情報を参照したカンファレンス等の議論を行うだけで文書情報に対応する構造化データを取得することができ、文書情報を構成する項目の間の関係を容易に特定することができる。
また、構造化データ作成装置1は、このようにして作成された構造化データを当該構造化データに含まれる項目をその種類、及び、項目の間の関係を識別可能に示して、表示装置(出力デバイス12等)に表示させる表示制御を行う。したがって、ユーザは、構造化データの内容を一見して把握することができる。さらに、ユーザからの修正を受け付け、ユーザの指示に基づき作成された構造化データを修正することで、ユーザは誤り等を修正して所望の構造化データを取得することができる。また、作成された構造化データを記憶装置に記憶させる記憶制御を行うことで、構造化データを再利用することが可能となる。
また、構造化中間レポートのエントリと対応していると判定されなかった構造化仮データのエントリ、及び、構造化仮データのエントリ間のリンクの情報を構造化データにマージしたうえでDBに保存してもよい。これにより、カンファレンスにおいて議論されたトピックを構造化データからマージして、反映させることができる。また、構造化中間レポートのエントリと対応していると判定されなかった構造化仮データのエントリ、及び該構造化仮データのエントリ間のリンクの情報を、その他の構造化データと区別可能な形式でDBに保存してもよい。これにより、カンファレンスにおいてのみ議論された内容とそうでない内容を区別することができる。
<実施形態2>
本実施形態では、カンファレンスで得られる情報に基づいて作成した構造化データが、構造化対象の非構造化レポート1101に関する既存の構造化データと整合性があるかを確認し、その結果を記録する構成について説明する。図17は本実施形態における構造化データ作成装置1の機能構成図である。図17では、実施形態1で図4を参照して説明した構造化データ作成装置1の機能構成に加えて、整合性確認部115を有する。整合性確認部115は構造化データに関する整合性のチェックを行う。図4の構成と共通する機能要素については詳細な説明を省略する。
本実施形態では、カンファレンスで得られる情報に基づいて作成した構造化データが、構造化対象の非構造化レポート1101に関する既存の構造化データと整合性があるかを確認し、その結果を記録する構成について説明する。図17は本実施形態における構造化データ作成装置1の機能構成図である。図17では、実施形態1で図4を参照して説明した構造化データ作成装置1の機能構成に加えて、整合性確認部115を有する。整合性確認部115は構造化データに関する整合性のチェックを行う。図4の構成と共通する機能要素については詳細な説明を省略する。
ある非構造化レポート1101について、図11に示した手順で構造化レポートを作成したとする。なお、本実施形態では、構造化対象の非構造化レポートを図9に記載のレポートとし、図11に示した手順により図18に示す構造化レポートが作成された場合の例を説明する。図18に記載の構造化レポートの構造化データは読影レポートDB7に保存されている。この読影レポート(構造化レポート)は、読影を依頼した依頼医の手に渡り、依頼医は読影レポートの内容を読む。レポートを読んだ依頼医は、左耳下腺深葉から傍咽頭間隙にかけて腫瘤があり、多形腺腫か神経原性腫瘍の疑いがあることを把握する。また、読影医は、多形腺腫であるのか神経原性腫瘍であるのかを絞り込むために精査する処置を、読影医から推奨されていることを把握する。依頼医は、読影医からの推奨に従い、多形腺腫であるのか神経原性腫瘍であるのかを絞り込むための検査を実施し、検査結果が検査レポートとして纏められ、その検査レポートは依頼医に提供される。検査レポートによると、左耳下腺深葉から傍咽頭間隙にかけて腫瘤があり、多形腺腫でも神経原性腫瘍でもなく、別の疾患であることが分かった。以降では、このような経緯の後にその事実をカンファレンスにて関係者に報告するシーンを一例として想定する。
図19は検査後のカンファレンス(以後、2回目のカンファと記す)で取得された情報をもとに、非構造化レポート1101を構造化して得られた読影レポートの一例を示す図である。図19(a)では、検査前に行われたカンファレンス(以後、一回目のカンファと記す)で作成された図18に記載の構造化データに加え、2回目のカンファで作成されたレポート項目1904〜1907が作成されている。部位項目1904は、多形腺腫か神経原性腫瘍のどちらであるかを絞り込むために実施した検査の結果がまとめられた検査レポートである。診断項目1905と診断項目1906は、検査レポート1904から分かった内容を依頼医が2回目のカンファにて「多形腺腫ではありませんでした。」「神経原性腫瘍でもありませんでした。」と発言したことから其々作成された項目である。診断項目1907は、検査レポート1904から分かった内容である「○○であると確定しました。」という依頼医の発言から作成された項目である。なお、○○は疾患名であるとする。
2回目のカンファにおける依頼医の発表について順を追って説明する。依頼医はまず検査レポート1904を表示し、検査レポートに記載の内容を説明した。依頼医は、次に、部位項目1901のもととなった医用画像を表示し、「左耳下腺深葉から傍咽頭間隙の腫瘤が認められていましたが、」といい、「多形腺腫ではありませんでした。」「神経原性腫瘍でもありませんでした。」と前回の結果を否定した。その後、検査の結果として「○○であると確定しました。」と第一回のカンファ後に分かった事実を述べた。
1回目のカンファで作成された診断項目1902と2回目のカンファで作成された診断項目1905は互いに矛盾・対立しており、一つの読影レポートの構造化データとしては不整合な状態であるといえる。また、1回目のカンファで作成された診断項目1903と2回目のカンファで作成された診断項目1906も互いに矛盾・対立しており、一つの読影レポートの構造化データとしては不整合な状態であると言える。整合性確認部115はこの様な不整合な構造化データを検出し、不整合であることを記録する。整合性確認部115は、診断項目の内容を自然言語解析の手法を使って、キーワードとそのキーワードに主語述語の関係を持つ述語の抽出を行い、その解析結果を一時的に記憶する。ここでキーワードとは疾患を表すワードのことであり、具体的には図6(c)の辞書に登録されているワードである。
整合性確認部115は、さらに、述語部に当たる係り受け情報を解析して、キーワードが肯定的に使われているか、否定的に使われているかを判定し、この結果も一時的に記憶する。例えば、「肺癌の可能性を疑います。」という文からは、「肺癌の可能性を[肺癌] →疑います 肯定」の様に、[肺癌]がキーワードであり、「疑います」が肯定の係り受けであるという解析結果を抽出する。整合性確認部115は非構造化レポート1101に関する全ての診断項目についてキーワードと係り受けを抽出し、同じキーワードであり、肯定・否定が異なる係り受けを持つ診断項目の組を検出する。
本実施形態の場合、診断項目1902と診断項目1905が同じ疾患名のキーワード[多形腺腫]を持ち、かつそれぞれが肯定と否定の係り受けである「疑い」と「ではありませんでした。」を持つため、不整合と検出される。診断項目1903と診断項目1906では、同じ疾患名のキーワード「神経原性腫瘍」を持ち、かつ其々が肯定と否定の係り受けである「疑い」と「ではありませんでした。」を持つため、不整合と検出される。関係情報作成部104と関係情報保存部105は、不整合であると判定された項目間に不整合の関係を作成し、その関係を非構造化レポート1101の構造化データに追記する。つまり、項目間の不整合の関係がレポート保存部114によって読影レポートDB7に保存される。
なお、図19(a)で説明した状況を、別の形式でDBに記録してもよい。図19(b)は、図19(a)で説明した2回目のカンファで取得された情報をもとに、非構造化レポート1101を構造化して得られた構造化レポートを示す図である。図19(b)では、図19(a)の診断項目1905と診断項目1906がなく、代わりにマーク1908とマーク1909がある。図19(a)の状況は、診断項目1903と診断項目1906が、それぞれ診断項目1902と診断項目1903の内容を否定していると解釈することもできる。図19(b)の構造化レポートはその解釈を反映した構造化レポートであり、マーク1908とマーク1909は、診断項目1902と診断項目1903の内容が否定されたということを示している。整合性確認部115は、非構造化レポート1101に関する全ての診断項目についてキーワードと係り受けを抽出し、同じキーワードであり肯定・否定が異なる係り受けをもつ診断項目の組を検出する。そして、時刻的に先に作成された診断項目の内容が、時刻的に後に作成された診断項目によって否定されたと解釈する。レポート保存部114は否定された診断項目に、例えば、否定されたというタグ情報を付けえで、該診断項目を読影レポートDB7に保存する。
なお、前述では診断項目についての整合性チェックを行ったが、所見項目についても同様の手法でチェックを行いその結果を記録してもよい。また、整合性確認部115による整合性チェックを、上述した図11のS1115の処理で構造化レポート1104と構造化中間レポート1102の間で対応関係があると判定された診断項目に対して実施してもよい。つまり、対応関係決定部109によって対応づけられた構造化レポート1104の診断項目と構造化中間レポート1102の診断項目の間の整合性をチェックする。構造化レポート1104の診断項目に記載されている疾患名と、構造化中間レポート1102の診断項目の間診断項目に記載されている疾患名が同じ対応付けがなされたとしても、係り受けの肯定・否定が異なる場合がある。その場合は、S1115で対応付けをしたうえで、記載内容に不整合があったという情報を、後々に二次利用できるように読影レポートDB7に記録する。
上記のように、本実施形態では、文書情報に基づき作成された第1の構造化データと、その文書情報と同一の文書情報に基づき作成された第2の構造化データとの整合性を確認する。そして、第2の構造化データを、第1の構造化データと整合しない項目ないし関係情報を識別可能に記憶装置に記憶させる。したがって、ユーザは、あるカンファレンスに基づき構造化データを取得した後に、再度カンファレンスを行って内容の修正を伴う議論を行った場合、その修正を識別可能な形で構造化データに反映させることができる。また、第2の構造化データを、第1の構造化データと整合しない項目ないし関係情報を識別可能に表示装置に表示させることで、ユーザは、表示内容を閲覧することで修正個所を容易に把握することができる。
<実施形態3>
本実施形態では、実施形態1及び実施形態2に記載した項目間の関係情報を用いて、資料間の関係情報を作成する実施形態について記載する。図20は、本実施形態における構造化データ作成装置1の機能構成図である。本実施形態の構造化データ作成装置1は実施形態2で図17を参照して説明した構造化データ作成装置1の機能構成に加え、資料間リンク作成部116を持つ。図4、図17の構成と共通する機能要素については詳細な説明を省略する。
本実施形態では、実施形態1及び実施形態2に記載した項目間の関係情報を用いて、資料間の関係情報を作成する実施形態について記載する。図20は、本実施形態における構造化データ作成装置1の機能構成図である。本実施形態の構造化データ作成装置1は実施形態2で図17を参照して説明した構造化データ作成装置1の機能構成に加え、資料間リンク作成部116を持つ。図4、図17の構成と共通する機能要素については詳細な説明を省略する。
(資料間リンク作成)
資料間リンク作成部116は、非構造化レポートの構造化データに基づいて、患者の資料間に関係情報を保持するリンクを作成する。また、本実施形態における関係情報提示部113は、資料間リンク作成部116によって作成されたリンクが保持する関係情報を出力デバイス12に表示する。患者の資料間に作成されたリンクは、患者の資料を一覧表示する際などに、医師が資料と資料の関係性を把握することを支援する。それにより、医師が所望の資料に効率よくアクセスすることを可能にする。資料間に作成されたリンクの利用例は後述する。
資料間リンク作成部116は、非構造化レポートの構造化データに基づいて、患者の資料間に関係情報を保持するリンクを作成する。また、本実施形態における関係情報提示部113は、資料間リンク作成部116によって作成されたリンクが保持する関係情報を出力デバイス12に表示する。患者の資料間に作成されたリンクは、患者の資料を一覧表示する際などに、医師が資料と資料の関係性を把握することを支援する。それにより、医師が所望の資料に効率よくアクセスすることを可能にする。資料間に作成されたリンクの利用例は後述する。
本実施形態において、資料間リンク作成部116は、実施形態1及び実施形態2で記載した項目間の関係と同様の関係情報を持つリンクを、患者の資料間に作成する。資料間リンク作成部116は主に4つのパターンのリンクを作成する。
1つ目のパターンとして、資料間リンク作成部116は、部位項目と所見項目の間の対応関係と同様の関係情報を持つリンクを資料間に作成する。資料間リンク作成部116は非構造化レポートに関する構造化データを構成する所見項目と対応関係にある部位項目を抽出する。そして、非構造化レポートと、抽出した部位項目の実体である資料の間に、リンクを作成する。ここで作成されるリンクは、部位項目の実体である資料が、非構造化レポートの「所見」を介して非構造化レポートと関係があるという情報を保持する。
2つ目のパターンとして、資料間リンク作成部116は、所見項目と診断項目間の因果関係と同様の関係情報を持つリンクを、資料間に作成する。資料間リンク作成部116は、非構造化レポートに関する構造化データを構成する診断項目と間接的に関係付く部位項目を抽出する。そして、非構造化レポートと、抽出した部位項目の実体である資料の間に、リンクを作成する。ここで作成されるリンクは、部位項目の実体である資料が、非構造化レポートの診断を介して非構造化レポートと関係があるという情報を保持する。
3つ目のパターンとして、資料間リンク作成部116は、診断項目と診断項目の間の原発と転移に関する因果関係と同様の関係情報を持つリンクを、資料間に作成する。資料間リンク作成部116は、非構造化レポートに関する構造化データを構成する診断項目のうち、原発と転移の因果関係を持つ診断項目のセットを特定する。そして、資料間リンク作成部116は、特定した診断項目に間接的に関係付く部位項目を抽出する。そして、資料間リンク作成部116は、抽出した部位項目の実体である資料の間に、リンクを作成する。ここで作成されるリンク情報は、原発と転移という因果関係を保持する。
4つ目のパターンとして、資料間リンク作成部116は非構造化レポートと、非構造化レポートを構成する部位項目との参照関係と同様の関係情報を持つリンクを、資料間に作成する。なお、参照関係とは非構造化レポートを扱う際に、参照された資料のことを意味する。資料間リンク作成部116は、非構造化レポートに関する構造化データを構成する部位項目のうちどの所見項目とも関係付けされていない部位項目を抽出する。そして、非構造化レポートと、抽出した部位項目の実体である資料の間に、リンクを作成する。ここで作成されるリンクは、部位項目の実体である資料が、非構造化レポートを取り扱っている際に参照されたという情報を保持する。
(部位項目特定)
ここで、上記の1つ目〜4つ目のパターン毎に、リンクを作成する資料に対応する部位項目を特定する手順を示す。部位項目を特定する際には、図21に記載の関数SelectItemを使用する。図21は、関数SelectionItemの内容をフローチャートにより模式的に示した図である。関数SelectItemは、引数に指定した項目ID(テーブル701の”項目ID”カラムの情報)に基づいて、それに紐づく部位項目を決定する。以降では、関数SelectItemの詳細について述べる。なお、ITEM(x)でレポートIDがxのレポート項目を参照することができる。また、RELATION(x)で、関係IDがxの関係情報を参照することができる。
ここで、上記の1つ目〜4つ目のパターン毎に、リンクを作成する資料に対応する部位項目を特定する手順を示す。部位項目を特定する際には、図21に記載の関数SelectItemを使用する。図21は、関数SelectionItemの内容をフローチャートにより模式的に示した図である。関数SelectItemは、引数に指定した項目ID(テーブル701の”項目ID”カラムの情報)に基づいて、それに紐づく部位項目を決定する。以降では、関数SelectItemの詳細について述べる。なお、ITEM(x)でレポートIDがxのレポート項目を参照することができる。また、RELATION(x)で、関係IDがxの関係情報を参照することができる。
S2101では変数KiにITEM(i)の種類を代入する。なお、変数iは関数SelectItemの引数であり、その実態はレポート項目の項目IDの値である。S2102では変数jに1を代入する。S2103では変数mにRELATION(j)のレポート項目ID1を代入し、更に、変数KmにITEM(m)の種類を代入する。S2104では、変数nにRELATION(j)のレポート項目ID2を代入し、変数KnにITEM(n)の種類を代入する。
S2105では項目IDがnのレポート項目の種類Knと、項目IDがiのレポート項目の種類Kiを比較する。同じであれば(S2105でYES)S2106に進み、異なれば(S2105でNO)S2111に進む。S2106では、項目IDがmのレポート項目の種類Kmが「部位」であり、かつ、項目IDがnのレポート項目の種類Knが「所見」であるかを判定する。判定値が真であれば(S2106でYES)S2107に進み、判定値が偽であれば(S2106でNO)S2109に進む。S2107では、ITEM(m)をリンクを付与する資料の対象の部位項目とした上で、S2108に進む。
S2109では、項目IDがmのレポート項目の種類Kmが「所見」であり、かつ、項目IDがnのレポート項目の種類Knが「診断」であるかを判定する。判定値が真であれば(S2109でYES)S2108に進み、判定値が偽であれば(S2109でNO)S2110に進む。S2110では、項目IDがmのレポート項目の種類Kmが「診断」であり、かつ、項目IDがnのレポート項目の種類Knが「処置」であるかを判定する。判定値が真であれば(S2110でYES)S2108に進み、判定値が偽であれば(S2110でNO)S2111に進む。S2108では、関数SelectItemを、項目ID値であるmを引数にして実行する。つまり、関数SelectItemを再帰的に呼び出す。
S2111では、変数jを1だけインクリメントする。S2112では変数jの値が、関係テーブルのレコード数よりも大きいかを判定する。判定の結果が偽の場合(S2112でNO)は、S2103に戻り、上述の処理を再度繰り返す。S2112の判定結果が真の場合(S2112でYES)、関数SelectItemを終了する。
次に、1つ目のパターンで特定すべき部位項目の決定手順を示す。まず、項目テーブル701から、非構造化レポートのレポートID情報を用いて、非構造化レポートに関係する行を絞り込む。そして、絞り込まれた行のうち、”種類”カラムが「所見」の行の項目IDを抽出する。次に、抽出された項目IDを引数として、関数SelectItemを実行する。つまり、抽出された項目IDの数だけ、関数SelectItemを実行することとなる。関数SelectItemを実行した結果、S2107でリンクを付与する対象とされた項目が、特定されるべき部位項目である。
2つ目のパターンで特定すべき部位項目の決定手順を示す。まず、項目テーブル701から、非構造化レポートのレポートID情報を用いて、非構造化レポートに関係する行を絞り込む。そして、絞り込まれた行のうち、”種類”カラムが「診断」の行の項目IDを抽出する。次に抽出された項目IDを引数として、関数SelectItemを実行する。つまり、抽出された項目IDの数だけ、関数SelectItemを実行することとなる。関数SelectItemを実行した結果、S2107でリンクを付与する対象とされた項目が、特定されるべき部位項目である。
3つ目のパターンで特定すべき部位項目の決定手順を示す。まず、関係テーブル702から、”種類”カラムが因果関係の行を抽出する。次に、抽出した行の”レポートID1”カラムと”レポートID2”カラムに記載の項目IDが共に非構造化レポートに含まれる項目IDであることを、項目テーブル701を基に確認する。また、抽出した行の”レポートID1”カラムと”レポートID2”カラムに記載の項目IDが共に診断項目であることを、項目テーブル701の”種類”カラムと照らし合わせることで確認する。これらの条件を満たした関係テーブル702の行の”レポート項目ID1”カラムと”レポート項目ID2”カラムに記載の項目IDが、原発と転移の関係を持つ診断項目の項目IDである。”レポート項目ID1”カラムに記載の項目IDを引数にして関数SelectItemを実行した結果、S2107でリンクを付与する対象とされた項目が、特定されるべき原発の診断に間接的に関係付く部位項目である。”レポート項目ID2”カラムに記載の項目IDを引数にして関数SelectItemを実行した結果、S2170でリンクを付与する対象とされた項目が、特定されるべき転移の診断項目に間接的に関係付く部位項目である。
4つ目のパターンで特定すべき部位項目の決定手順を示す。まず、項目テーブル701から、非構造化レポートのレポートID情報を用いて、非構造化レポートに関係する行を絞り込む。そして、絞り込まれた行のうち、”種類”カラムが「部位」の行の項目IDを抽出する。次に、関係テーブル702を参照し、抽出した項目IDが関係テーブル702に登録されているか否かを判定する。登録されていない項目IDが特定すべき部位項目の項目IDである。
(画面表示例)
資料間に作成されたリンクの利用の一例として、患者の資料をマトリクス形式で一覧表示する際の効果的な画面表示を説明する。ここでは、実施形態2に記載した図19(b)の状況を例として説明する。なお、本例では、画面効率の観点から、上述の2つ目のパターンのリンクを持つ場合は、2つ目のパターンのリンクの表示のみを実施し、上述の1つ目のパターンのリンクの表示は省略している。
資料間に作成されたリンクの利用の一例として、患者の資料をマトリクス形式で一覧表示する際の効果的な画面表示を説明する。ここでは、実施形態2に記載した図19(b)の状況を例として説明する。なお、本例では、画面効率の観点から、上述の2つ目のパターンのリンクを持つ場合は、2つ目のパターンのリンクの表示のみを実施し、上述の1つ目のパターンのリンクの表示は省略している。
図22(a)は、患者の資料を表示するアイコンを、資料の種別毎にマトリクス形式で一覧表示した図である。縦軸は資料種別、横軸は時間の情報を持つ。図22(a)は、実施形態2で説明した1回目のカンファから得られた情報に基づいて作成された構造化データと、マトリクス形式で一覧表示された各資料の対応関係も示している。資料2201は非構造化レポート1101に対応する。資料2202は非構造化レポート1101の構造化データを構成する図19(b)に記載の部位項目1901に対応する。資料2203は非構造化レポート1101の構造化データを構成する図19(b)に記載の部位項目1910に対応する。
図22(b)は、図22(a)のマトリクス表示において、資料2201のアイコンをマウスオーバーした際の、マトリクス表示画面である。マトリクス表示された資料のアイコンをマウスオーバーすると、マウスオーバーされたアイコンが示す資料とリンクで結ばれた資料のアイコンの間に、線が引かれている。このアイコン間の線は、関係情報提示部113により表示される。ここで、本例では、関係情報提示部113は、上述の1つ目のパターンの場合は、実線で資料のアイコン間を結ぶ。また、関係情報提示部113は、上述の2つ目のパターンの場合は、診断を介して非構造化レポートと関係を持つ部位項目の実体のアイコンから、非構造化レポート1101に向かう実矢印線で資料のアイコン間を結ぶ。また、関係情報提示部113は、上述の3つ目のパターンの場合は、原発に関する資料アイコンから、転移に関する資料アイコンに向かう実矢印線で資料のアイコン間を結ぶ。また、関係情報提示部113は、上述の4つ目のパターンの場合は、点線で資料のアイコン間を結ぶ。
図22(b)においては、非構造化レポート1101の構造化データにおいて、図19の部位項目1901は2つの「診断」1902、1903と間接的に関係付いている(図19参照)。故に、部位項目1901の実体である資料のアイコン2202から、非構造化レポートのアイコン2201に向かって、実矢印線が2本(実矢印線2211及び実矢印線2212)繋がっている。また、非構造化レポート1101の構造化データにおいて、部位項目1910は1つの「診断」と間接的に関係付いている。故に、部位項目1910の実体である資料のアイコン2203から、非構造化レポートのアイコン2201に向かって、実矢印線2213が繋がっている。
図23(a)は、実施形態2で説明した二回目のカンファ後の患者の資料のマトリクス表示である。また、図23(a)は実施形態2で説明した二回目のカンファから得られた情報に基づいて作成された構造化データと、マトリクス形式で一覧表示された各資料の対応関係も示している。資料2301は非構造化レポート1101の構造化データを構成する図19(b)に記載の部位項目1904に対応する。
図23(b)は、図23(a)のマトリクス表示において、資料2102をマウスオーバーした際の、マトリクス表示画面である。構造化データに診断項目2315が追加されたため、部位項目1901の資料の実体であるアイコン2202から非構造化レポート1101のアイコン2201に向かう実矢印線2311がマトリクス表示に追加されている。また、部位項目1904がどの所見項目とも関係付かずに非構造化レポート1101の構造化データとして存在している。故に、マトリクス上にて、資料アイコン2301と資料アイコン2201の間に参照の関係を示す点線が表示されている。また、2回目のカンファでは、1回目のカンファで作成された部位項目1901に間接的に関係付く診断項目の2つの内容が否定されている。それを示すマークとして、マトリクス上にマーク2313及びマーク2314が表示されている。このマークによって、前述の実矢印線2211及び実矢印線2212が否定されていることをマトリクス上で明示している。
なお、本実施形態では、上述の1つ目のパターンにおいて、同じ所見項目を介して非構造化レポートと関係付けられている資料群をグループとして管理・表示してもよい。同様に、上述の2つ目のパターンにおいて、同じ診断項目を介して非構造化レポートと関係付けられている資料群をグループとして管理・表示してもよい。また、本実施形態では患者の資料をマトリクス形式で一覧表示する際に資料間の関係を表示したが、その様な場合以外であっても資料間の関係を表示して資料の把握性を高められることは言うまでもない。 以上のように、文書情報を含む資料を用いてなされた議論に関する議論情報から仮データを作成する際に使用した資料の間の関係を示すリンク情報を、当該資料から抽出された項目の間について決定された関係情報に基づいて作成するリンク作成を行う。したがって、本実施形態によれば、文書情報から構造化データを作成するだけでなく、その文書情報に関係する資料の関係を自動的に特定することが可能となる。また、このような資料を、資料の間の関係をリンク情報に基づき識別可能に示して、表示装置に表示させることで、ユーザは、資料間の関係を容易に把握することができる。
上記のように、本発明の各実施形態においては、少なくとも部位情報を有する部位エントリと、所見情報を有する所見エントリと、診断情報を有する診断エントリと、前記エントリ間の関係情報を有するリンクにより構成される構造化データを作成する。ここで、自然文により記載された読影レポートを議論する際に得られる情報を利用して、該読影レポートに関する構造化データの作成を支援する。したがって、読影レポートを構成する項目間の関係性、及び病院内に蓄積されている資料間の関係性を、特段の作業負担を要することなく、医療カンファレンスで得られた情報を利用して特定することができる。
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
1:構造化データ作成装置、2:HIS、3:RIS、4:医用画像撮影装置、5:PACS、6:電子カルテDB、7:読影レポートDB、8:医用画像DB、9:辞書DB、10:院内ローカルエリアネットワーク
Claims (20)
- 自然文を含む文書情報に基づき、少なくとも1つの種類のいずれかにそれぞれあたる複数の項目と、当該複数の項目の間の論理的な関係を示す関係情報とを含む構造化データを作成する構造化データ作成装置であって、
前記文書情報を解析して、当該文書情報に含まれる前記複数の項目を含む中間データを作成する中間データ作成手段と、
前記文書情報を含む資料を用いてなされた議論に関する議論情報を取得する取得手段と、
前記議論情報から、複数の種類の項目と当該項目の間の関係情報とを含む仮データを作成する仮データ作成手段と、
前記中間データに含まれる前記項目と、前記仮データに含まれる前記項目との対応関係を決定する決定手段と、
前記決定手段により決定された対応関係に基づいて、前記中間データに含まれる項目の間に関係情報を付与して構造化データを作成する構造化データ作成手段と
を備えることを特徴とする構造化データ作成装置。 - 前記中間データ作成手段は、前記文書情報に含まれる自然文を少なくとも1つの部分に区切り、当該少なくとも1つの部分の各々について、前記少なくとも1つの種類のいずれの項目にあたるかを、項目の種類に関する辞書データを参照して判定することにより、前記中間データを作成することを特徴とする請求項1に記載の構造化データ作成装置。
- 前記議論情報には、前記議論においてなされた発言に関する発言情報と、前記議論において参照された資料に関する資料情報とが含まれることを特徴とする請求項1又は2に記載の構造化データ作成装置。
- 前記発言情報には、発言の内容とその発言がなされた時刻とが含まれることを特徴とする請求項3に記載の構造化データ作成装置。
- 前記資料情報には、参照された前記資料の対象と、その参照がなされた時刻とが含まれることを特徴とする請求項4に記載の構造化データ作成装置。
- 前記資料情報には、前記参照された資料の対象として、資料の識別情報と資料の注目位置の情報とが含まれることを特徴とする請求項5に記載の構造化データ作成装置。
- 前記仮データ作成手段は、
前記発言情報及び前記資料情報から、項目の種類に関する辞書データを参照して、前記少なくとも1つの種類のいずれかにあたる項目を抽出し、
前記抽出された各項目の間の関係情報を、項目の種類ないし係り受け語に関する辞書データを参照して決定する
ことにより前記仮データを作成することを特徴とする請求項6に記載の構造化データ作成装置。 - 前記仮データ作成手段は、前記発言の内容から抽出された項目と、当該発言と同一の時間帯に参照された前記資料の対象から抽出された項目との間に関係があるとして、前記関係情報を決定することを特徴とする請求項7に記載の構造化データ作成装置。
- 前記関係情報が示す項目の間の論理的な関係には、2つの項目が原因と結果との関係を有することを示す因果関係と、当該因果関係以外の関係により2つの項目が相互に関係していることを示す関係とが含まれることを特徴とする請求項1から8のいずれか1項に記載の構造化データ作成装置。
- 前記決定手段は、同一の種類の同一の値を有する、前記中間データに含まれる前記項目と、前記仮データに含まれる前記項目とは対応関係を有すると決定することを特徴とする請求項1から9のいずれか1項に記載の構造化データ作成装置。
- 前記構造化データ作成手段は、前記仮データに含まれる項目の間の関係情報を、当該仮データに含まれる項目と対応関係を有する前記中間データに含まれる項目の間に付与することにより、前記構造化データを作成することを特徴とする請求項1から10のいずれか1項に記載の構造化データ作成装置。
- 前記構造化データ作成手段により作成された前記構造化データをユーザの指示に基づき修正する修正手段をさらに備えることを特徴とする請求項1から11のいずれか1項に記載の構造化データ作成装置。
- 前記構造化データ作成手段により作成された前記構造化データを、当該構造化データに含まれる項目をその種類、及び、項目の間の関係を識別可能に示して、表示手段に表示させる表示制御手段をさらに備えることを特徴とする請求項1から12のいずれか1項に記載の構造化データ作成装置。
- 前記構造化データ作成手段により作成された前記構造化データを記憶手段に記憶させる記憶制御手段をさらに備えることを特徴とする請求項13に記載の構造化データ作成装置。
- 前記文書情報に基づき作成された第1の前記構造化データと、当該文書情報と同一の文書情報に基づき作成された第2の前記構造化データとの整合性を確認する確認手段をさらに備え、
前記記憶制御手段は、前記第2の構造化データを、前記第1の構造化データと整合しない項目ないし関係情報を識別可能に前記記憶手段に記憶させる
ことを特徴とする請求項14に記載の構造化データ作成装置。 - 前記表示制御手段は、前記第2の構造化データを、前記第1の構造化データと整合しない項目ないし関係情報を識別可能に前記表示手段に表示させることを特徴とする請求項15に記載の構造化データ作成装置。
- 前記仮データ作成手段が前記仮データを作成する際に使用した前記資料の間の関係を示すリンク情報を、当該資料から抽出された前記項目の間について決定された前記関係情報に基づいて作成するリンク作成手段をさらに備えることを特徴とする請求項7又は8に記載の構造化データ作成装置。
- 前記仮データ作成手段が前記仮データを作成する際に使用した前記資料を、該資料の間の関係を前記リンク情報に基づき識別可能に示して、表示手段に表示させる表示制御手段をさらに備えることを特徴とする請求項17に記載の構造化データ作成装置。
- 自然文を含む文書情報に基づき、少なくとも1つの種類のいずれかにそれぞれあたる複数の項目と、当該複数の項目の間の論理的な関係を示す関係情報とを含む構造化データを作成する構造化データ作成装置の制御方法であって、
前記文書情報を解析して、当該文書情報に含まれる前記複数の項目を含む中間データを作成する中間データ作成工程と、
前記文書情報を含む資料を用いてなされた議論に関する議論情報を取得する取得工程と、
前記議論情報から、複数の種類の項目と当該項目の間の関係情報とを含む仮データを作成する仮データ作成工程と、
前記中間データに含まれる前記項目と、前記仮データに含まれる前記項目との対応関係を決定する決定工程と、
前記決定工程により決定された対応関係に基づいて、前記中間データに含まれる項目の間に関係情報を付与して構造化データを作成する構造化データ作成工程と
を備えることを特徴とする構造化データ作成装置の制御方法。 - コンピュータを請求項1から18のいずれか1項に記載の構造化データ作成装置が備える各手段として機能させるためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016218266A JP2018077630A (ja) | 2016-11-08 | 2016-11-08 | 構造化データ作成装置及びその制御方法、コンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016218266A JP2018077630A (ja) | 2016-11-08 | 2016-11-08 | 構造化データ作成装置及びその制御方法、コンピュータプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018077630A true JP2018077630A (ja) | 2018-05-17 |
Family
ID=62150496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016218266A Pending JP2018077630A (ja) | 2016-11-08 | 2016-11-08 | 構造化データ作成装置及びその制御方法、コンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2018077630A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111986750A (zh) * | 2020-07-27 | 2020-11-24 | 北京天健源达科技股份有限公司 | 一种电子病历模板结构化检测方法 |
JP2021157799A (ja) * | 2020-03-27 | 2021-10-07 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 医療衝突の検出方法、装置、電子デバイス及び記憶媒体 |
WO2022158173A1 (ja) * | 2021-01-20 | 2022-07-28 | 富士フイルム株式会社 | 文書作成支援装置、文書作成支援方法及びプログラム |
JP7501883B1 (ja) | 2023-12-15 | 2024-06-18 | 株式会社オプテック | カルテ作成支援装置及びカルテ作成支援方法 |
-
2016
- 2016-11-08 JP JP2016218266A patent/JP2018077630A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021157799A (ja) * | 2020-03-27 | 2021-10-07 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 医療衝突の検出方法、装置、電子デバイス及び記憶媒体 |
JP7186255B2 (ja) | 2020-03-27 | 2022-12-08 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 医療衝突の検出方法、装置、電子デバイス及び記憶媒体 |
CN111986750A (zh) * | 2020-07-27 | 2020-11-24 | 北京天健源达科技股份有限公司 | 一种电子病历模板结构化检测方法 |
CN111986750B (zh) * | 2020-07-27 | 2023-12-26 | 北京天健源达科技股份有限公司 | 一种电子病历模板结构化检测方法 |
WO2022158173A1 (ja) * | 2021-01-20 | 2022-07-28 | 富士フイルム株式会社 | 文書作成支援装置、文書作成支援方法及びプログラム |
JP7501883B1 (ja) | 2023-12-15 | 2024-06-18 | 株式会社オプテック | カルテ作成支援装置及びカルテ作成支援方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10628476B2 (en) | Information processing apparatus, information processing method, information processing system, and storage medium | |
US8046358B2 (en) | Context-based information retrieval | |
CA3133689A1 (en) | An explainable ai (xai) platform for computational pathology | |
CN108475538A (zh) | 用于将第三方应用集成在图像解读工作流中的结构化发现对象 | |
US10013727B2 (en) | Information processing apparatus and information processing method | |
US8352416B2 (en) | Diagnostic report search supporting apparatus and diagnostic report searching apparatus | |
JP2015524107A (ja) | 患者情報を臨床基準にマッチングするシステム及び方法 | |
CN116344071A (zh) | 用于整合临床护理的信息学平台 | |
JP2018077630A (ja) | 構造化データ作成装置及びその制御方法、コンピュータプログラム | |
JP4891597B2 (ja) | 医用画像診断システム、及び放射線科情報システムサーバ | |
JP6667240B2 (ja) | 装置、方法、システム及びプログラム。 | |
CN102667786A (zh) | 协议引导的成像流程 | |
JP2006155002A (ja) | レポート作成支援システム | |
US10440246B2 (en) | System for enabling remote annotation of media data captured using endoscopic instruments and the creation of targeted digital advertising in a documentation environment using diagnosis and procedure code entries | |
JP6711676B2 (ja) | 医用レポート作成装置及びその制御方法、医用レポート作成システム、並びに、プログラム | |
US10521909B2 (en) | Information processing system, information processing method, and program | |
US11062448B2 (en) | Machine learning data generation support apparatus, operation method of machine learning data generation support apparatus, and machine learning data generation support program | |
JP2008090644A (ja) | 医用レポート作成システム、医用レポート作成方法 | |
JP2008264167A (ja) | 画像リスト表示装置、画像リスト表示方法、及び画像リスト表示プログラム | |
JP2012198928A (ja) | データベースシステム、プログラム、及びレポート検索方法 | |
JP2018109798A (ja) | 情報処理装置、システム、情報処理方法およびプログラム | |
US20140321773A1 (en) | Image-based data retrieval | |
JP5578889B2 (ja) | 読影レポート作成支援装置、及び、読影レポート作成支援方法 | |
JP2017033518A (ja) | 装置、方法、システム及びプログラム | |
JP6579849B2 (ja) | 読影レポート作成支援システム、読影レポート作成支援方法、及び読影レポート作成支援プログラム |