JP4955197B2 - レセプトファイル生成システム - Google Patents

レセプトファイル生成システム Download PDF

Info

Publication number
JP4955197B2
JP4955197B2 JP2004259900A JP2004259900A JP4955197B2 JP 4955197 B2 JP4955197 B2 JP 4955197B2 JP 2004259900 A JP2004259900 A JP 2004259900A JP 2004259900 A JP2004259900 A JP 2004259900A JP 4955197 B2 JP4955197 B2 JP 4955197B2
Authority
JP
Japan
Prior art keywords
medical
text data
receipt
dictionary
dictionary table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2004259900A
Other languages
English (en)
Other versions
JP2006079189A (ja
Inventor
真也 木村
Original Assignee
株式会社日本医療データセンター
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日本医療データセンター filed Critical 株式会社日本医療データセンター
Priority to JP2004259900A priority Critical patent/JP4955197B2/ja
Publication of JP2006079189A publication Critical patent/JP2006079189A/ja
Application granted granted Critical
Publication of JP4955197B2 publication Critical patent/JP4955197B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Description

本発明は、ファイルを生成する技術に関する。
病院などの医療機関では、医師が、傷病名、投薬、注射、検査、手術などの医療行為の内容(以下、「診療内容」という)をカルテに記入する。近年、多くの医療機関にレセプトコンピュータと呼ばれる処理装置(「医事コンピュータ」ともいう)が導入されており、医療機関の担当者は、カルテをもとに診療内容をレセプトコンピュータに入力して、レセプトコンピュータに記憶されたフォーマットで診療報酬明細書(以下、「レセプト」という)を作成する。また病院だけではなく、薬局においてもレセプトコンピュータの普及が進んでいる。医療機関は、レセプトを、診療報酬請求書(以下、「請求書」という)とともに各都道府県単位の社会保険診療報酬支払基金に提出する。支払基金は、投薬、注射、手術などの請求点数に誤りがないかを点検し、審査委員会が、支払基金にて点検された請求書およびレセプトを審査する。このような審査を終えたレセプトに基づいて、診療報酬額が決定される。健康保険組合などの保険者は、審査を経たレセプトを二次審査し、支払基金などを通じて医療機関に診療報酬を支払う一方で、診療内容に疑問のあるものについては審査委員会に対して再審査を請求する。
特許第3139485号明細書
近年、財政赤字の問題もあり、保険者が二次審査を強化している。医療機関の手違いなどにより誤った請求がなされることもあるため、それを二次審査により見つけて再審査にかけることで、過剰な診療報酬の支払を避けることを目的としている。しかしながら、一方で、レセプトの点検には医学的な専門知識が要求されるため、保険者の誤解に基づいた再審査請求が行われることもある。近頃、規制緩和の一環として、健康保険組合が、レセプトの審査・支払業務を医療機関に対して直接行うことも可能となった。利害が相反する保険者と医療機関とが直接交渉することになるため、いずれかの誤解に基づく無用なトラブルが発生する事態も考えられる。
一般にレセプトは紙ベースで受け渡されることが多い。レセプトは、患者に施された医療行為を表現するものであり、複数月さらには複数年にまたがった患者のレセプトの情報は、その患者の時系列的な傷病履歴を表現する。保険者側で患者個人の傷病履歴をまとめることができれば、その傷病履歴を解析して、個々の患者の健康管理にも役立てることができる。紙ベースのレセプトをテキスト化することで、患者の傷病履歴をデータとして効率的に管理できるとともに、患者に継続して施された診療行為が適切なものであるかをチェックすることも可能となる。
我が国は、統計法に基づく統計調査や、医学的分類として医療機関における診療録の管理等に利用することを目的として、ICD−10に準拠した「疾病、傷害及び死因分類」を作成している。「疾病、傷害及び死因分類」に示される用語は、傷病名について我が国の医療業界で統一的に用いられることが好ましく、全てのカルテないしはレセプトが、「疾病、傷害及び死因分類」の用語を用いて作成されることで、本来意図する統計調査や、診療録の管理等を効率的に行うことが可能となる。
しかしながら、医療業界では慣例的に、1つの傷病や医薬品などが、複数の呼び名で表現されることがある。その他、検査名や医薬品の投与量単位の表現などについても同様である。傷病名に関して、上記した「疾病、傷害及び死因分類」に基づく用語を「標準語」と呼び、同意の他の用語を「方言」と呼ぶ場合、方言の使用は何も特別なことではなく、医師によっては、使用している用語が方言であることの意識すらないこともある。現在、方言を統一化して、標準語を使用していこうという業界の流れはあるが、その意識が全ての医師に浸透するはずはなく、医師ごと、またはレセプトコンピュータごとに、使い慣れた方言を使用し続けている現状がある。また、医療機関の種類によっても方言を使用する事情が存在し、例えば小規模な診療所や専門病院などでは、無理に標準語を使用することが管理業務を非効率にすることもある。
一方で、レセプトを審査する立場からすると、用語が統一されていなければ、傷病名や医薬品名などを容易に理解できず、効率的な審査が阻害される。そのため、紙レセプトの内容を単にテキスト化しただけでは、全ての方言を理解する技量をもつ人間しかレセプトのチェックはできないことになる。また、患者が複数の医療機関にかかった場合に、医療機関ごとに用語が統一されていなければ、レセプトのテキストデータから患者個人の健康管理に役立つ情報を抽出することも容易でなく、さらには全ての患者のデータを用いた統計的な処理を行うこともできない。
そこで本発明は、方言として存在する同義語に標準語を対応付ける技術を提供し、利便性の高いデータファイルを生成することを目的とする。
上記課題を解決するために、本発明のある態様は、レセプトファイルを生成するシステムに関する。この態様のレセプトファイル生成システムは、標準語となる医療関係用語と、その識別コードおよび属性情報とを対応付けたマスタテーブルを格納するマスタテーブル格納部と、医療関係用語として標準語と同じ意味を表す同義語を、該標準語の識別コードに対応付けた辞書テーブルを格納する辞書テーブル格納部と、レセプトをテキスト化したデータファイルに含まれるテキストデータを抽出するテキストデータ処理部と、抽出されたテキストデータを、辞書テーブルにおいて検索するマッチング処理部と、マッチング処理部により、辞書テーブルにテキストデータが医療関係用語として記憶されていることが判明した場合に、識別コードをもとに、該テキストデータをマスタテーブルの標準語に対応付けたレセプトファイルを生成するレセプトファイル生成部とを備える。医療関係用語とは、医療に関する用語(名前)であり、医療行為を表現する用語だけでなく、医薬品名なども含み、特にレセプトの表記に使用される用語を意味する。具体的に、医療関係用語は、傷病名、医薬品名、医薬品の投与量単位、医療材料名、診療行為名などの用語を含む。標準語と同じ意味を表す同義語は、標準語以外の同義語(方言)を含む。同義語には、標準語自身が含まれてもよく、この場合には辞書テーブルに標準語も含まれることになるので、マッチング処理部は、辞書テーブルを検索することで、標準語を探し出すことができる。なお、辞書テーブルに標準語が含まれない場合は、マッチング処理部がマスタテーブルを検索することで、標準語を探し出すことができる。
このレセプトファイル生成システムによると、標準語以外の同義語を、標準語に対応付けたレセプトファイルを生成することができる。このシステムにより生成されたレセプトファイルを利用すると、標準語をキーとして、統計処理や個人の健康管理などの様々なデータ処理を行うことが可能となる。
マッチング処理部は、辞書テーブルにテキストデータが医療関係用語として記憶されていない場合に、そのテキストデータを、不明データとして所定の格納領域に記憶させる。一旦、不明データとして記憶させることで、そのデータを、後にマスタテーブルや辞書テーブルの拡張に利用することが可能となる。
このレセプトファイル生成システムは、辞書テーブルに記憶されておらず、且つ通常使用されない文字列を、標準語の識別コードに対応付けた一時辞書テーブルを格納する一時辞書テーブル格納部をさらに備え、レセプトファイル生成部は、一時辞書テーブルをもとに、文字列のテキストデータを、マスタテーブルの標準語に対応付けたレセプトファイルを生成する。辞書テーブルに記憶されておらず、且つ通常使用されない文字列としては、例えば、誤入力された表現や、特定の医療機関のみで用いられる隠語的表現など、一般には用いられない異例的な表現が該当する。そのような文字列であっても、文字列自体を保存しながら、マスタテーブルに記憶されている標準語に対応付けたレセプトファイルを生成することで、もとのレセプトの内容を維持しながら、有用性の高いレセプトファイルを生成することが可能となる。
レセプトファイル生成部は、辞書テーブルに記憶されておらず、且つ通常使用されない文字列のテキストデータについて一時辞書テーブルに記憶した対応関係を所定の期間に限って利用して、レセプトファイルを生成してもよい。所定の期間に限って利用させることで、その文字列と同じ医療関係用語が後に登場した場合であっても、レセプトファイルの有用性を維持することができる。
マスタテーブル格納部および辞書テーブル格納部のそれぞれは、マスタテーブルおよび辞書テーブルのそれぞれを、医療関係用語の種類ごとに格納する。例えば、傷病名、医薬品名など、医療関係用語の種類ごとにマスタテーブルおよび辞書テーブルを作成することで、それぞれのテーブルの更新、管理、保守などを容易に実行できる。
このレセプトファイル生成システムは、文字列を、参照する辞書テーブルの種類に対応付けた振分テーブルを格納する振分テーブル格納部をさらに備え、マッチング処理部は、振分テーブルを参照して、抽出されたテキストデータに対して参照する辞書テーブルを特定してもよい。マッチング処理部は、振分テーブルを参照することで、辞書テーブルの特定に要する時間を短縮できる。
このレセプトファイル生成システムは、文字列と、その文字列を区切って分解した複数の医療関係用語に対応付けた分解テーブルを格納する分解テーブル格納部をさらに備え、テキストデータ処理部は分解テーブルを参照して、文字列のテキストデータを医療関係用語ごとに分解したテキストデータを抽出してもよい。分解テーブルを利用することで、テキストデータ処理部は、文字列から効率的に医療関係用語を抽出することが可能となる。
このレセプトファイル生成システムは、複数の文字列を結合して生成される医療関係用語をリスト化した結合テーブルを格納する結合テーブル格納部をさらに備え、テキストデータ処理部は結合テーブルを参照して、複数の文字列のテキストデータを結合したテキストデータを抽出してもよい。結合テーブルを利用することで、例えば、1つの医療関係用語において間に空白が挿入されているものや、1つの医療関係用語が改行されて複数段にまたがって記載されているものを、1つの医療関係用語として効率的に抽出することが可能となる。
マッチング処理部は、抽出されたテキストデータと、マスタテーブルまたは辞書テーブルに記憶された医療関係用語との一致性を判断し、一致しない部分が数量表現である場合に、その数量表現を、マスタテーブルまたは辞書テーブルに記憶された医療関係用語に含まれる数量表現と対応付けるべきものと判断してもよい。辞書テーブルにテキストデータが示す表現が存在しない場合であっても、マッチング処理部が自律的にテキストデータと登録済の医療関係用語との紐付けを行うことで、人的処理の負担を低減することができる。
本発明の別の態様は、カルテファイルを生成するシステムに関する。この態様のカルテファイル生成システムは、標準語となる医療関係用語と、その識別コードおよび属性情報とを対応付けたマスタテーブルを格納するマスタテーブル格納部と、医療関係用語として標準語と同じ意味を表す同義語を、該標準語の識別コードに対応付けた辞書テーブルを格納する辞書テーブル格納部と、電子カルテのデータファイルに含まれるテキストデータを抽出するテキストデータ処理部と、抽出されたテキストデータを、辞書テーブルにおいて検索するマッチング処理部と、マッチング処理部により、辞書テーブルにテキストデータが医療関係用語として記憶されていることが判明した場合に、識別コードをもとに、該テキストデータをマスタテーブルの標準語に対応付けたカルテファイルを生成するファイル生成部とを備える。医療関係用語とは、医療に関する用語(名前)であり、医療行為を表現する用語だけでなく、医薬品名なども含み、ここでは特にカルテの表記に使用される用語を意味する。具体的に、医療関係用語は、傷病名、医薬品名、医薬品の投与量単位、医療材料名、診療行為名などの用語を含む。標準語と同じ意味を表す同義語は、標準語以外の同義語(方言)を含む。同義語には、標準語自身が含まれてもよく、この場合には辞書テーブルに標準語も含まれることになるので、マッチング処理部は、辞書テーブルを検索することで、標準語を探し出すことができる。なお、辞書テーブルに標準語が含まれない場合は、マッチング処理部がマスタテーブルを検索することで、標準語を探し出すことができる。
このカルテファイル生成システムによると、標準語以外の同義語を、標準語に対応付けたカルテファイルを生成することができる。標準語に対応づけたカルテファイルを生成することで、複数の病院のカルテにおける医療関係用語を実質的に統一化することが可能となる。
本発明のさらに別の態様は、標準語となる用語と、その識別コードおよび属性情報とを対応付けたマスタテーブルを格納するマスタテーブル格納部と、標準語と、標準語と同じ意味を表す同義語とを、該標準語の識別コードに対応付けた辞書テーブルを格納する辞書テーブル格納部と、データファイルに含まれるテキストデータを抽出するテキストデータ処理部と、抽出されたテキストデータを、辞書テーブルにおいて検索するマッチング処理部と、マッチング処理部により、辞書テーブルにテキストデータが記憶されていることが判明した場合に、識別コードをもとに、該テキストデータをマスタテーブルの標準語に対応付けたデータファイルを生成するファイル生成部とを備える。
このファイル生成システムによると、標準語以外の同義語(方言)を、標準語に対応付けたファイルを生成することができ、したがって、標準語をキーとして、ファイルを用いた様々なデータ処理を行うことが可能となる。
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
本発明によると、標準語と標準語以外の同義語とを対応付けたファイルを生成することができる。
図1は、本発明の実施例におけるレセプト処理フローを示す。このレセプト処理フローは、1つの主体により実行されてもよく、複数の主体により協働して実行されてもよい。通常は、複数の主体で明確な役割分担を行い、全体として1つのレセプト処理システムを実現するケースが多いと考えられる。図1に示すレセプト処理フローでは、医療機関または支払基金などから提供される紙レセプトをデータ化し、統計処理などのデータ加工に適したレセプトファイルを効率的に生成する手順を表現している。以下に示す各ステップは、人手が介在することもあるが、多くはシステムによるコンピュータ処理により実行される。
本実施例のレセプト処理フローは、仕分け作業(S10)、紙レセプトのイメージ化(S12)、OCR処理(S14)、パンチ処理(S16)、論理チェック処理(S18)、対応チェック処理(S20)、テキストデータ分解処理(S22)、テキストデータ結合処理(S23)、分解テーブル、結合テーブルの更新(S24)、辞書テーブルの読出し(S26)、マッチング処理(S28)、マスタテーブル、辞書テーブルの更新(S30)、一時辞書テーブル生成(S32)、レセプトファイル生成(S34)、データ加工(S36)の処理ステップに分けることができる。
(1)仕分け作業
仕分け作業(S10)では、入院レセプト、入院外レセプト、調剤レセプトなどの紙媒体に印刷された各帳票を仕分けする。この仕分け作業は、一般には人手により行われるが、後続のS12のイメージ化の際に、コンピュータ処理により自動的に実行されてもよい。
(2)紙レセプトのイメージ化
紙レセプトのイメージ化(S12)では、仕分けされた紙レセプトをスキャナにより読み込んで、イメージデータに変換する。ここでは、スキャナに紙レセプトを連続入力しながら、入力中の画像をディスプレイにリアルタイムに表示し、オペレータがスキャニング状況を確認する。紙レセプトが裏面で入力されたような場合には、画像認識処理により自動的にスキャニングを停止し、オペレータにその旨を通知する。また、用紙方向が上下逆のような場合にも、オペレータにその旨を通知する。以上により、向きの揃った紙レセプトのイメージデータを生成する。なお、スキャナのCPUに、画像認識機能だけでなく、レセプト仕分け機能を追加することで、紙レセプトのイメージ化を行いながら、同時に仕分け処理を行って、イメージデータを、レセプトの種類ごとのフォルダに格納していく。
(3)OCR処理
OCR処理(S14)では、レセプトのイメージデータから光学的文字認識により文字を読み取る。レセプトの上部には、被保険者記号番号や患者の氏名などの個人情報が記載されており、その下方には、傷病名や、投薬、注射などの診療情報、使用した医薬品とその使用量を示す診療明細が記載されている。本明細書では、レセプトの個人情報以外の情報を薬歴情報と呼ぶ。レセプトの薬歴情報は、レセプトの個人情報により、特定の個人と結び付けられることによって秘密に保護されるべきものであり、その取扱いには十分な注意が必要となる。そのため、OCR処理の前段階として、まず、個人情報画像と薬歴画像とを切り離す。
最初にレセプトの個人情報画像をOCR処理によりテキスト化し、暗号技術によりユニークコードに変換する。続いて、このユニークコードを、レセプトの薬歴画像の画像データに結合する。これにより、オペレータは、この結合されたデータをみても個人を特定することができず、一方で、暗号化した個人情報と診療明細情報とを紐付けできる。次に、薬歴画像をOCR処理によりテキスト化する。テキスト化されたデータは、所定の形式で項目(フィールド)に分類されてファイル化される。このOCR処理では、高い文字認識率を実現することが好ましい。
(4)パンチ処理
パンチ処理(S16)では、OCR処理でテキスト化できなかった箇所または誤ったテキスト化がなされた箇所を、パンチャが入力または修正する。OCR処理の精度が高くなるほどパンチャの作業量は減ることになり、したがって、紙レセプトのデータ化にかかるトータルコストを抑えることが可能となる。
S10〜S16のステップは、テキストデータ生成システムにより実行される。紙レセプトのテキストデータはファイルとしてまとめられ、このデータファイルが、S18以降の処理を実行するレセプトファイル生成システムに引き渡される。
(5)論理チェック処理
論理チェック処理(S18)では、テキスト化されたデータの論理チェックを行う。コンピュータが論理チェックを実行し、レセプト中の論理的なエラーを検出する。論理的なエラーとは、例えば患者の誕生日が未来の日付になっているような誤りである。
(6)対応チェック処理
対応チェック処理(S20)では、データファイルにおけるテキストデータ間の対応関係をチェックする。ここでは、例えば、診療開始日と2回目以降の診療日との前後関係が逆であったり、薬歴の摘要欄に医薬品名が存在するものの、使用量が存在しなかったりという誤りをチェックする。また、数字が入力されるべき項目に、文字が入力されているような誤りもチェックする。コンピュータは、データ間の対応関係を予め保持しておき、この対応関係の適合の可否を判断することで、対応関係のエラーを検出する。検出されたエラーは、オペレータに通知される。オペレータはエラー内容を見て、正しい内容に修正する。コンピュータは、データ間の対応関係だけでなく、レセプト間の対応関係もチェックしてよい。例えば、調剤レセプトがあるのに、医科レセプトが存在しない場合、コンピュータは、その旨をオペレータに通知する。
(7)テキストデータ分解処理
テキストデータ分解処理(S22)では、テキスト化された文字列を分類して区分けする。例えば、医科レセプトの摘要欄データを、医薬品、医療材料、診療行為に分類し、さらに医薬品、医療材料、診療行為の複数項目が1行のテキストデータとして存在している場合に、それらを項目ごとに分解する。具体的には、文字列に含まれるカンマや空白(ブランク)、改行などを検出して、文字列を医療関係用語ごとに区分けしていく。また、連続した文字列と、その文字列を複数の医療関係用語に対応付けた分解テーブルを参照して、文字列を医療関係用語に分解してもよい。例えば、傷病名と医薬品名が連続した文字列としてテキスト化されている場合に、分解テーブルは、その文字列を、傷病名と医薬品名とに対応付けて記憶している。
(8)テキストデータ結合処理
テキストデータ結合処理(S23)では、テキストデータ分解処理(S22)において空白や改行などにより分解された文字列のうち、医療関係用語として抽出されなかった文字列同士を結合して、1つの医療関係用語を抽出する。このとき、複数の文字列を結合して生成される医療関係用語をリスト化した結合テーブルを参照する。例えば、1つの医薬品名が、間に空白を入れてテキスト化されている場合に、結合テーブルは、その医薬品名を保持して記憶しており、分解処理された複数の文字列を結合することで結合テーブルに保持した医薬品名と一致した場合には、その複数の文字列を結合して、1つの医薬品名を抽出する。
(9)分解テーブル、結合テーブルの更新
分解テーブル、結合テーブルの更新処理(S24)では、S22のテキストデータ分解処理において分解できなかったテキストデータを、医療関係用語ごとに区分けして、分解テーブルの拡張を行い、また、S23のテキストデータ結合処理において結合できなかった複数のテキストデータを1つの医療関係用語として結合して、結合テーブルの拡張を行う。この作業は人手によって行われる。
オペレータは、S22において区分け不能な文字列を複数の医療関係用語に分解して、分解テーブルの登録内容を適宜補充していく。特に、大規模な医療機関で利用されるレセプトコンピュータは、独自の仕様でカスタマイズされていることがある。そのため、レセプトによっては、複数の医薬品名が連続して記入されたり、また傷病名と医薬品名とが連続して記入されていることもある。オペレータはこのような文字列を見つけると、対応する医療関係用語ごとに区分けして、分解テーブルの登録内容を増やしていく。これにより、次回実行するテキストデータの分解処理の信頼性を、前回よりも確実に高めることができ、処理時間を短縮することができる。
また、オペレータは、S23において結合できなかった医療関係用語を結合テーブルに適宜登録していく。医療関係用語の文字数は様々であるが、特に長い文字列となる医療関係用語については、間に空白が挿入されたり、摘要欄において改行されて記入されることが多い。基本的に、テキストデータはS22において空白部分や改行部分で分解されるが、この分解処理では、本来1つの医療関係用語であるにもかかわらず、それが不必要に分解されて1つの医療関係用語として特定できない結果を招くこともある。そのような場合の対応として、オペレータは、分解処理される1つの医療関係用語を結合テーブルに登録しておき、S23における結合処理の精度を高めていく。結合テーブルを適宜更新していくことで、テキストデータの抽出処理の信頼性を前回よりも高めることができ、処理時間を短縮することができる。
(10)辞書テーブルの読出
辞書テーブルの読出処理(S26)では、格納部に記憶されている辞書テーブルを読み出す。医療関係用語には同じ意味を表す表現が複数存在することがあり、例えば、傷病名の「虫垂炎」、「盲腸」、「アッペ」は全て同じ傷病を意味する。用語の不統一は、後の統計処理などを実行する際の阻害要因となるため、レセプトファイル生成システムでは、レセプトデータの有効利用を図るべく、複数の同義語のうちの一つを「標準語」として設定し、標準語以外の同義語を「方言」と設定して取り扱うこととしている。標準語は、その識別コードおよび属性情報に対応付けられて、マスタテーブルに記憶されている。以下に、マスタテーブルと辞書テーブルとの関係を示す。
マスタテーブルは、システムで標準語として採用する傷病名、医薬品名などの医療関係用語と、その医療関係用語の識別コード、およびその属性情報とを対応付けて生成される。例えば傷病名に関していえば、「疾病、傷害及び死因分類」に分類されている傷病名を標準語として設定してもよい。識別コードは、マスタテーブルと辞書テーブルとを紐付けするために用いられ、レセプトファイル生成システムにおいて独自に設定したものを用いてもよい。また、医療業界に各種存在するコード体系における識別コードを、マスタテーブルと辞書テーブルの紐付け用の識別コードとして転用してもよい。
具体的に、傷病名「虫垂炎」を標準語と設定する場合、マスタテーブルは、「虫垂炎」を、その識別コードおよびその属性情報と対応付けて記憶する。属性情報は、虫垂炎のICD分類などの情報を含む。医薬品名や他の区分のマスタテーブルについても同様に、標準語、識別コードおよび属性情報とが対応付けられる。医薬品名の属性情報は、薬価(保険点数)を含む。マスタテーブルは、傷病名を標準化した傷病マスタテーブル、医薬品を標準化した医薬品マスタテーブルなど、複数の区分に対して作成されている。
辞書テーブルは、医療関係用語として標準語と同じ意味を表す同義語を、標準語の識別コードに対応付けることで生成される。同義語は、標準語以外の同義語(方言)を含み、また標準語自身を含んでもよい。具体的には、「虫垂炎」の識別コードに対して、「虫垂炎」、「盲腸」、「アッペ」を対応付けて記憶するのが辞書テーブルである。ここで、虫垂炎は標準語であり、盲腸、アッペは方言である。辞書テーブルは、マスタテーブルに対応して、傷病名を辞書化した傷病辞書テーブル、医薬品を辞書化した医薬品辞書テーブルなど、複数の区分に対して作成されている。
(11)マッチング処理
マッチング処理(S28)では、項目ごとに分解されたテキストデータと、読み出した辞書テーブルのデータとのマッチングをとる。テキストデータが辞書テーブルに登録されたデータと一致する場合、そのデータに対応付けられている識別コードを読み出し、続くレセプトファイル生成処理に引き渡す。
なお、虫垂炎を表現する盲腸、アッペ以外の別の名前がテキストデータとして記述されている場合、この新しい名前は辞書テーブルに登録されていないため、コンピュータは、その名前を虫垂炎の方言として認識できない。辞書テーブルに対応する名前が存在しない場合、その名前を不明データとして所定の格納領域に記憶し、その旨がオペレータに出力される。
(12)マスタテーブル、辞書テーブル更新
マスタテーブル、辞書テーブルの更新(S30)では、まず、オペレータが、不明データとして所定の格納領域に記憶された名前を確認する。この確認作業は、不明データが発生する度に行ってもよく、また複数の不明データがまとまった段階で行ってもよい。オペレータは、不明データが虫垂炎の新しい呼び名であることを判断すると、その呼び名を虫垂炎の方言として追加し、辞書テーブルを更新する。なお、新薬がでた場合、または新しい傷病が発生した場合、オペレータは、新たな医療関係用語に識別コードを設定して、マスタテーブルおよび辞書テーブルを更新する。
(13)一時辞書テーブル生成
一時辞書テーブル生成処理(S32)では、一時的に利用される辞書テーブルを生成する。テキストデータが誤記であったり、ある医療機関でのみ使用される特殊な表現であるような場合、オペレータは、そのテキストデータで示す文字列を、標準語の識別コードと対応付ける一時辞書テーブルを生成する。一時辞書テーブルは、例えば当月に限って利用される。
(14)レセプトファイル生成
レセプトファイル生成処理(S34)では、テキストデータ中の方言や特殊な表現を標準語に紐付けたレセプトファイルを生成する。具体的にレセプトファイルでは、テキストデータ中の表現に対して、マスタテーブルで使用する標準語の識別コードをリンクさせる。このレセプトファイルは、もとの紙レセプトに記入されていた内容をそのまま残し、含まれる方言や特殊な表現については、辞書テーブルを参照することで、標準語に対応付けて構成される。
(15)データ加工
データ加工処理(S36)では、生成したレセプトファイルをもとに、統計的な処理や、予測医学など、ユーザのニーズに合わせた様々な処理を実行する。これは、レセプトファイル中の医療関係用語が標準語に紐付けされていることで可能となり、標準語の識別コードをキーとして、様々なデータ加工が可能となる。また、各レセプトファイルは、患者個人にも紐付けされているため、患者の傷病履歴の把握や、予測医療が可能となる。S18〜S36のステップは、レセプトファイル生成システムにより実行される。
図2は、本発明の実施例におけるレセプト処理システム1を示す。レセプト処理システム1は、紙レセプトのイメージデータから文字を読み取ってテキストデータを生成するテキストデータ生成システム2と、テキストデータ生成システム2において生成されたテキストデータから方言などを標準語に紐付けしたレセプトファイルを生成するレセプトファイル生成システム3を備える。テキストデータ生成システム2は、図1における紙レセプトのイメージ化処理(S12)からパンチ処理(S16)までの処理ステップを実行する。また、レセプトファイル生成システム3は、論理チェック処理(S18)からデータ加工処理(S36)までの処理ステップを実行する。テキストデータ生成システム2およびレセプトファイル生成システム3は、同一の主体により管理、運営されてもよく、また別主体が提携することで共同運営されてもよい。
本実施例におけるレセプト処理システム1の機能は、テキストデータ生成システム2およびレセプトファイル生成システム3において、CPU、メモリ、メモリにロードされたプログラムなどによって実現される。プログラムは、テキストデータ生成システム2およびレセプトファイル生成システム3に内蔵されていてもよく、また記録媒体に格納された形態で外部から供給されるものであってもよい。したがってこれらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者に理解されるところである。
図3は、テキストデータ生成システム2の構成を示す。テキストデータ生成システム2は、イメージデータ生成部10、OCR部12、入力部16、ディスプレイ18、ドライブ装置20および格納部22を備える。入力部16は、テキストデータ生成システム2の入力インタフェースであり、例えばキーボードや、マウスなどのポインティングデバイスなどにより構成される。入力部16は、例えばディスプレイ18に設けられるタッチパネルとして構成されてもよい。ドライブ装置20は、DVDやCDなどの記憶媒体30のデータ書込および/またはデータ読出を行う装置である。
イメージデータ生成部10はスキャナであり、紙レセプトを入力されて、紙レセプトのイメージデータ(レセプト画像)を生成する。イメージデータは、個人情報を記入された個人情報画像と、全画像から個人情報画像を除いた薬歴画像に分けられる。オペレータがディスプレイ18を見ながら、入力部16のポインティングデバイスを用いてレセプト画像の範囲指定をすることで、個人情報画像と薬歴画像とが分割されてもよい。
図4は、診療報酬明細書(レセプト)のイメージデータを示す。このレセプトは、医科レセプトの一例である。レセプト画像32は、一点鎖線33の上方にある個人情報画像34と、下方にある薬歴画像36とに分けられる。薬歴画像36には、医薬品、医療材料、診療行為などが記述された摘要欄38が存在する。
摘要欄38において、左端の数字は、診療区分コードを示し、アスタリスクは、同時処方であることを示す。1つのアスタリスクでブロック化される医薬品、医療材料、診療行為の一群は、同時処方された医薬品、医療材料、診療行為であることを意味し、保険点数に関して言えば、単純にそれぞれを加算した額となるのではなく、減額の対象となる。右端の数字は、回数を示し、その左にある「×」の左側の数字は、点数を示す。「点数×回数」により、そのブロックの保険点数が定まる。点数の左側にある文字列のうち、同時処方欄または診療区分コードに含まれない文字列は、医薬品名、医療材料名、診療行為名を示す。
図3に戻って、OCR部12は、まず個人情報画像34から光学的文字認識による文字の読み取りを行う。個人情報画像34の読み取り結果は暗号化され、薬歴画像36に対応付けられる。
次に、OCR部12は、薬歴画像36から光学的文字認識による文字の読み取りを行う。薬歴画像36のうち、摘要欄38は、使用した医薬品、診療行為などの保険点数を表記しており、支払金額に直接関係するところである。そのため、OCR部12は、精度よく摘要欄38を読み取れることが必要となる。
OCR部12において読み取られた薬歴画像36のテキストデータが、ディスプレイ18に表示され、オペレータ(パンチャ)は、表示されたテキストデータを修正する。OCR部12の文字認識率が高いほどオペレータの作業負担が軽くなり、紙レセプトのテキスト化にかかるコストを低くできる。
図5は、摘要欄38を文字認識して、項目ごとに分類して生成したデータファイルの表示例を示す。パンチャは、ディスプレイ18に表示されるデータファイルと、もとの摘要欄38の画像とを見比べながら、入力部16を操作して、データファイルのデータ修正を行う。図5には、文字認識がうまくできた例を示しているが、文字の誤認識がある場合は、パンチャが適宜修正していく。
パンチャによる修正が終了したデータファイルは、格納部22に格納される。ドライブ装置20は、レセプトのデータファイルを記憶媒体30に記録する。記憶媒体30は、レセプトファイル生成システム3に引き渡される。
図6は、レセプトファイル生成システム3の構成を示す。レセプトファイル生成システム3は、テキストデータ処理部50、マッチング処理部52、レセプトファイル生成部54、論理チェック処理部55、対応チェック処理部56、データ加工部58、入力部60、ディスプレイ62、参照テーブル格納部64、データ格納部66およびドライブ装置68を備える。入力部60は、レセプトファイル生成システム3の入力インタフェースであり、例えばキーボードや、マウスなどのポインティングデバイスなどにより構成される。入力部60は、例えばディスプレイ18に設けられるタッチパネルとして構成されてもよい。ドライブ装置68は、DVDやCDなどの記憶媒体30のデータ書込および/またはデータ読出を行う装置である。テキストデータ生成システム2およびレセプトファイル生成システム3とが一体のレセプト処理システム1として構成される場合、入力部、ディスプレイ、ドライブ装置、格納部などの構成が共用されてもよい。参照テーブル格納部64は、マスタテーブル格納部70、辞書テーブル格納部72、一時辞書テーブル格納部74、分解テーブル格納部76、結合テーブル格納部77、振分テーブル格納部78を備えて構成される。
レセプトのデータファイルを記録した記憶媒体30がドライブ装置68に挿入され、データファイルがデータ格納部66に書き込まれる。論理チェック処理部55が、データ格納部66からデータファイルを読み出し、テキスト化されたデータの論理チェックを行う。例えば、患者の誕生日が未来日付となっている場合、論理チェック処理部55は、そのエラーを検出して、オペレータに通知する。オペレータは、その通知を受けて、エラー部分を修正する。
対応チェック処理部56は、テキストデータ間の対応関係をチェックする。図5を参照して、医療材料名「画像記録用フィルム(1)半切1枚」と、点数(2238)、回数(1)とは、互いに対応付けられるべきデータであるが、図5のデータファイルでは異なる行に存在する。そのため、対応チェック処理部56は、これらが同じ行となるように修正する。「超音波検査(断層撮影法)・胸腹部」と、その点数(550)、回数(1)についても同様である。
このようなチェックを実行するために、対応チェック処理部56は、データ項目の対応関係を予め保持しておく。この対応関係は、データ格納部66に記憶されていてもよい。例えば、図5に示す摘要欄のデータでは、「同」欄、「薬名等」欄、「点数」欄、「回数」欄のデータ項目がそれぞれ対応付けられて存在する必要があり、これらの対応関係が満たされていない場合には、対応チェック処理部56が、データエラーを検出する。検出されたエラーは、ディスプレイ62を通じてオペレータに通知される。オペレータはエラー内容を見て、データ同士を正しい対応関係に修正する。さらに対応チェック処理部56は、既述したように、診療開始日と2回目以降の診療日との前後関係が逆であったり、数字が入力されるべき項目に文字が入力されているような誤りもチェックする。以上の論理チェックおよび対応チェックを行うことで、データファイルに含まれるエラーを取り除くことができる。
テキストデータ処理部50が、データファイルに含まれるテキストデータを分類して区分けし、最終的に生成するレセプトファイルのデータ項目まで分解したテキストデータを抽出する。例えば、医科レセプトの摘要欄データを、医薬品、医療材料、診療行為に分類し、さらに医薬品、医療材料、診療行為の複数項目が1行のテキストデータとして存在している場合に、それらを所期の項目ごとに分解する。また、医薬品として記されている内容が、医薬品名と量とを示す場合も、これらを分解する処理を行う。例えば、図5に示す「ルプラック錠4mg1錠」は、ルプラック錠4mg(医薬品名)と1錠(量)とに分解される。まず、テキストデータ処理部50は、文字列に含まれるカンマや空白(ブランク)を検出して、文字列を医療関係用語ごとに区分けする。このとき、診療区分コードをもとに文字列を区分けしてもよい。
本実施例において、テキストデータ処理部50は、分解テーブルを参照することで、文字列のテキストデータを分解し、文字列から医療関係用語のテキストデータを抽出してもよい。分解テーブルは、分解テーブル格納部76に格納されており、連続した文字列を、その文字列を区切って分解した複数の医療関係用語に対応付けている。この対応付けは、図1のS24に関して説明したようにオペレータにより予め作成されており、複数の医療関係用語が繋がって表記された新たな文字列が登場した場合には、オペレータが、その文字列を医療関係用語に分解して、分解テーブルを逐次作成していく。これにより、以後のタイミングで同じ文字列が登場した場合、分解テーブルを参照することで、テキストデータ処理部50が、文字列を適切な医療関係用語に分解できる。分解されたデータは所定のファイルに記録される。
なお、このファイルには、アスタリスクにより特定される1ブロックの関係が損なわれることなく記録される。既述したように、アスタリスクは、減額対象となる同時処方を示すものであるため、1ブロックの関係を保つことで、保険点数との対応関係を維持できる。図5において、1つのアスタリスクに検査方法「シンチグラム(全身)(骨)」と、医療材料「画像記録用フィルム(1)半切1枚」とが対応付けられているが、この検査方法と医療材料に対して、2338×1の保険点数が算出されており、したがって、これらの関係を維持した状態で、分解されたデータがファイルに記録される必要がある。
テキストデータ処理部50により抽出された文字列が登録された医療関係用語であるか否かを判断するために、マッチング処理部52は、振分テーブル格納部78に登録された医療関係用語を参照する。振分テーブルは、全ての種類の辞書テーブルに格納されている全ての医療関係用語と、参照する辞書テーブルの種類とを対応づけて構成されている。したがって、マッチング処理部52は、振分テーブルを参照することで、テキストデータ処理部50により抽出された文字列が医療関係用語であるか否かを判断することができ、さらに、医療関係用語である場合に、参照するべき辞書テーブルを特定することが可能となる。これにより、後述するマッチング処理を実行する際に、全ての種類の辞書テーブルに関して抽出した文字列の検索を行うよりも、振分テーブルをもとに辞書を特定することで、マッチング処理時間を短縮することが可能となる。マッチング処理の詳細については後述する。抽出した文字列が医療関係用語でない場合には、テキストデータ処理部50が、その文字列に対して結合処理を行う。
テキストデータ処理部50は、振分テーブルを用いて抽出したテキストデータを医療関係用語として確定した後、医療関係用語として抽出できなかったテキストデータを結合する処理を行う。レセプトは、基本的に、読みやすさのために医療関係用語ごとに空白が挿入されることが多いが、上記したように、場合によっては複数の医療関係用語が連続して記述されることもあり、また逆に、1つの長い医療関係用語などについては間に空白を挿入されることもある。このようなケースでは、テキストデータ処理部50が、1つの医療関係用語を、複数のテキストデータとして一旦抽出することになるが、これらは結合処理されて、1つの医療関係用語として抽出されることが好ましい。
そのために、結合テーブル格納部77が、複数の文字列を結合して生成される医療関係用語をリスト化した結合テーブルを保持する。このリスト化は、図1のS24に関して説明したように予めオペレータにより実行されており、振分テーブルに登録されておらず、且つ空白や改行などにより複数に分割された医療関係用語が新たに登場した場合には、オペレータがその医療関係用語をリストに加えて、結合テーブルを逐次作成していく。
テキストデータ処理部50は、振分テーブルに登録されていなかった複数のテキストデータのうち、連続して抽出したものを結合する。1つの医療関係用語が空白や改行などにより分割されて抽出される際、これらは、連続したテキストデータとして抽出されることになる。そのため、テキストデータ処理部50は、連続して抽出したテキストデータを一旦結合してみて、結合したテキストデータが結合テーブルに登録されている医療関係用語であるか否かを調査する。このとき、結合するテキストデータの数は2つ以上であればよく、その数は問わない。連続して抽出されたテキストデータを結合して結合テーブルを調査した結果、結合テーブルに登録されている医療関係用語であることが判断されると、テキストデータ処理部50は、その結合したテキストデータを医療関係用語として抽出する。マッチング処理部52は、振分テーブルを参照して、その医療関係用語に対して参照するべき辞書テーブルを特定する。
なお、マッチング処理部52が、結合したテキストデータを振分テーブルを参照することで、医療関係用語であるか否かの判断を行ってもよい。一方、上記したように結合テーブルを利用する場合には、結合テーブルに登録されているデータ量が振分テーブルよりも多くないために、振分テーブルを利用して結合したテキストデータが医療関係用語であるか否かを判断する場合と比較して、処理時間を短縮することができる。
マスタテーブル格納部70は、レセプトファイル生成システム3において採用する傷病名や医薬品などの名前の標準語を、その識別コードおよび属性情報と対応付けたマスタテーブルを格納する。識別コードは、標準語を特定するための唯一のコードであり、レセプトファイル生成システム3における独自のコードであってよい。傷病に対しては任意の一つの識別コードを割り当ててよいが、医薬品に対しては、時間とともに薬価が変更されることがあるため、属性情報に変更があるたびに新たな識別コードを割り当ててもよい。なお、識別コードを固定とする場合は、マスタテーブルのバージョン管理を行うことで、薬価の変更に対応することも可能である。
属性情報は、医療関係用語の種類に応じて様々なものが存在し、医療業界で各種存在するコード体系における識別コードを含んでもよい。例えば、マスタテーブルは、傷病名「虫垂炎」を、虫垂炎を特定するICD−10コードや、ICD分類に対応付けて記憶する。このICD分類は、「消化器系の疾患」である。医薬品名についても同様であり、医薬品の場合は、属性情報として保険点数などをもつ。マスタテーブルは、傷病名を標準化した傷病マスタテーブル、医薬品名を標準化した医薬品マスタテーブルなど、複数の区分に対して作成されている。
辞書テーブル格納部72は、標準語とその方言とを、標準語の同義語として標準語の識別コードに対応付けた辞書テーブルを格納する。本実施例では、「虫垂炎」という傷病の標準語に対して、「盲腸」、「アッペ」を方言としているが、「虫垂炎」、「アッペ」、「盲腸」を、マスタテーブルにおける「虫垂炎」の識別コードに対応付けて記憶したのが辞書テーブルである。辞書テーブルは、マスタテーブルに対応して、傷病名を辞書化した傷病辞書テーブル、医薬品を辞書化した医薬品辞書テーブルなど、複数の区分に対して作成されている。
図7は、一つの医薬品に対して生成された辞書テーブルおよびマスタテーブルの登録内容を示す。辞書テーブルには、マスタテーブルのバージョン、医薬品名、医薬品コードとが対応付けて登録されている。図示のとおり、同一の医薬品を表現する用語が複数存在し、それぞれの医薬品名が、同一の医薬品コード(識別コード)に対応付けられている。マスタテーブルには、医薬品名、医薬品コードに対応付けて、様々な属性情報が登録されている。ここで、属性情報は、薬価(保険点数)、全体量、濃度、単位、単位量、製造メーカなどである。
マッチング処理部52が、テキストデータ処理部50において抽出されたテキストデータを、振分テーブルにより特定される辞書テーブルから検索してマッチング処理を行う。具体的に、マッチング処理部52が、辞書テーブルを検索して、当該テキストデータの医療関係用語が記憶されているか否かを判断する。なお、本実施例では、振分テーブルを参照することで、抽出したテキストデータが医療関係用語であることが判定されているため、辞書テーブルには、そのテキストデータが存在していることになる。例えば、テキストデータが「塩酸エフェドリン注射液 (4%1ml)」である場合、マッチング処理部52は、同一の医療関係用語が医薬品辞書テーブルに存在していることを判断し、医薬品コードを読み出して、レセプトファイル生成部54に通知する。レセプトファイル生成部54は、この通知を受けると、医薬品コードをもとに、テキストデータ「塩酸エフェドリン注射液 (4%1ml)」を標準語「塩酸エフェドリン注射液4%1ml」に対応付けてレセプトファイルを生成する。例えば、レセプトファイル生成部54は、このテキストデータと医薬品コード(100000014741)とを対応付けたレセプトファイルを生成してもよく、また、マスタテーブルにおける塩酸エフェドリン注射液のデータアドレスと対応付けたレセプトファイルを生成してもよい。いずれにしても、レセプトファイル生成部54は、医薬品コードをもとにテキストデータをマスタテーブルの標準語に対応付けて、レセプトファイルを生成する。
なお、テキストデータが、辞書テーブルに含まれない「塩酸エフェドリン注射液4%1ml」を表現する他の方言である場合、マッチング処理部52は、その名前を「塩酸エフェドリン注射液4%1ml」の方言として認識できない。辞書テーブルに対応する名前が存在しない場合、マッチング処理部52は、そのテキストデータを、不明データとしてデータ格納部66の所定の格納領域に記憶させる。
オペレータは、所定の格納領域に記憶された名前を見て、これが塩酸エフェドリン注射液4%1mlの別の呼び名であることを判断すると、辞書テーブルを更新して、塩酸エフェドリン注射液4%1mlの方言として追加する。このとき、図7に示すように、新たな方言と医薬品コード(100000014741)とを対応付けて追加登録する。なお、新しい傷病が発生した場合、または新薬がでた場合は、本来であればマッチング処理の前にマスタテーブルが更新されているべきであるが、そのテーブル更新が間に合わなかった場合であれば、オペレータが、マスタテーブルおよび辞書テーブルを適宜更新していく。
医薬品の場合には、特に数量表現について、レセプト上で比較的自由な表現がなされることが多い。テキストデータ「塩酸エフェドリン注射液4%1ml1A」に対して、テキストデータ処理部50は、「塩酸エフェドリン注射液4%1ml1A」を、「塩酸エフェドリン注射液4%1ml」(医薬品名)、「1」(数量)、「A」(単位)とに分解する。このとき、「A」(単位)の表現が「アンプル」を示すものであることをオペレータが判断すると、「塩酸エフェドリン注射液4%1ml1A」を辞書テーブルに追加する。図7の辞書テーブルは、このようにしてオペレータにより追加された塩酸エフェドリン注射液4%1ml1Aを含んだ状態を示す。
一方、「塩酸エフェドリン注射液4%1ml1A」についての辞書テーブルが作成されていない場合、マッチング処理部52が、この対応関係を自律的に判断してもよい。マッチング処理部52は、抽出されたテキストデータとマスタテーブルまたは辞書テーブルに記憶された医療関係用語との一致性を判断し、一致しない部分が数量表現である場合に、その数量表現を、マスタテーブルまたは辞書テーブルに記憶された医療関係用語に含まれる数量表現と対応付けるべきものと判断する。
具体的に、マッチング処理部52は、「塩酸エフェドリン注射液4%1ml」を含む医療関係用語をマスタテーブルにおいて探索する。このとき、先に辞書テーブルを検索して医薬品コードを特定してから、マスタテーブルを参照しにいってもよい。マッチング処理部52は、マスタテーブルに含まれる塩酸エフェドリン注射液4%1mlのデータ内容を参照して、塩酸エフェドリン注射液4%1mlの数量表現の単位が「1管」であることを認識する。マッチング処理部52は、「塩酸エフェドリン注射液4%1ml1A」の2番目の「1」については、数字であるため数量の表現であることを認識し、「A」については、分類が不明な表現であるが、数字に続く文字であることから、単位表現であることを推測する。この推測に基づき、マッチング処理部52は、「A」が「管」を表現するものであることを認識し、「1A」が、「1管」に対応することを判断する。以上により、マッチング処理部52は、テキストデータの示す表現が辞書テーブルに登録されていなくとも、数量表現の方言を標準語に対応付けることができ、レセプトファイル生成部54は、「塩酸エフェドリン注射液4%1ml1A」に、医薬品コード(100000014741)を対応付けたレセプトファイルを生成することが可能となる。
また、所定の格納領域に記憶された名前が特殊な表現の場合、オペレータは、所定の期間に限り利用される辞書テーブル(一時辞書テーブル)を作成する。特殊な表現とは、既述のように辞書テーブルに記憶されておらず、且つ通常使用されない文字列を意味する。例えば、塩酸エフェドリン注射液4%1mlの一般的な別の呼び名としては分類することができず、ある医療機関においてのみ使用されている表現であったり、または、医療関係用語の単なる誤記である場合に、オペレータは、その文字列を特殊な表現として分類し、一時辞書テーブルを作成する。
一時辞書テーブルは、所定の期間、例えばその月に限って使用される辞書であり、作成されると一時辞書テーブル格納部74に記憶される。医薬品名「塩酸エフェドリン注射液4%1ml」に対して、テキストデータが「塩酸エファドリン注射液4%1ml」との誤記がなされている場合、他に選択肢がなく、明らかに「塩酸エフェドリン注射液4%1ml」の誤記であることが判明するのであれば、その月限りの辞書として、「塩酸エファドリン注射液4%1ml」を正式な呼び名「塩酸エフェドリン注射液4%1ml」に紐付けさせる。また、ある医療機関においてのみ使用されている特殊な表現も同様であり、オペレータにより標準語に紐付けされる。このように、一時辞書テーブルは、特殊な表現をマスタテーブルに記憶されている標準語の識別コードに対応付けて作成される。レセプトファイル生成システム3では、レセプトの記入事項の誤りなどの特殊表現を修正するのではなく、その特殊表現に対して標準語の識別コードを対応付けることで、レセプトの記入事項を保存しながら、統一的な処理を可能とするデータとして取扱うこととする。
医薬品の場合、基本的に名前付けが自由であり、特にカタカナの組合せであることが多いため、当月では類似した呼び名の医薬品が存在していなくても、翌月には、「塩酸エファドリン注射液4%1ml」に一致する医薬品が新薬として登場する可能性もある。そのため、誤記などの特殊な表現と認められる名前については、方言として辞書テーブルに登録するのではなく、一時限りの辞書として利用するために一時辞書テーブルに登録して、一時辞書テーブル格納部74に格納する。レセプトファイル生成部54は、一時辞書テーブルを参照して、特殊な表現を示すテキストデータをマスタテーブルの標準語に対応付けたレセプトファイルを生成する。
以上のように、レセプトファイル生成部54は、テキストデータ中の方言や特殊な表現を標準語に紐付けしたレセプトファイルを生成する。このレセプトファイルは、もとの紙レセプトに記入されていた内容をそのまま残し、含まれる方言や特殊表現については、辞書テーブルまたは一時辞書テーブルを参照することで標準語に対応付けられている。
レセプトファイルには様々な利用方法がある。例えば、統計的な処理や、使用される医薬品の動向など、研究者や医薬品メーカにとって有用なデータ処理に利用することができる。さらに、暗号化した個人情報に対応付けてレセプトファイルを作成するため、個人の時系列的な診療履歴を把握することができ、適切な医療行為が施されているかのチェックも可能となる。また予測医学も可能であり、患者の健康維持のためのデータとしても活用できる。これらの処理は、データ加工部58により実行される。
上記した実施例では、辞書テーブルを振分テーブルを用いて選択する例について説明したが、別の方法として、振分テーブルを利用せずに、マッチング処理部52が、全ての種類の辞書テーブルを参照して、対応する医療関係用語を検索してもよい。
また上記した振分テーブルを使うよりも、さらに検索時間を短縮するために、振分テーブル格納部78が、標準語およびその方言に特徴的な文字列を、参照する辞書テーブルの種類に対応付けた振分テーブルを格納してもよい。塩酸エフェドリン注射液4%1mlに関して言えば、この振分テーブルは、全ての方言において共通となる文字列「エフェドリン注射液」を、参照する辞書テーブル、すなわち医薬品辞書テーブルに対応付けている。マッチング処理部52は、振分テーブルを参照することで、参照する辞書テーブルとして医薬品辞書テーブルを特定することが可能となる。振分テーブルのデータ量を少なくすることで、振分テーブルの検索時間を短縮することができ、ひいてはマッチング処理時間を短縮することが可能となる。
図8は、標準語への対応付けを行う処理フローを示す。このフローでは、医薬品名を例とする。
まず、テキストデータを分解して、医薬品名を抽出する(S102)。マッチング処理部52は、この医薬品名を辞書テーブルにおいて検索し(S104)、辞書テーブルに医薬品名として記憶されていることが判明した場合には(S104のY)、レセプトファイル生成部54がそのテキストデータを医薬品コードと対応付けて、テキストデータをマスタテーブルの標準語に対応付けたレセプトファイルを生成する(S106)。
辞書テーブルに登録されていない場合(S104のN)、マッチング処理部52は、この医薬品名を、不明データとしてデータ格納部66の所定の格納領域に記憶させる。オペレータは、この医薬品名を確認して、新薬であると判断した場合には(S108のY)、その医薬品名をマスタテーブルおよび辞書テーブルに追加し(S110)、標準語を医薬品名に対応付けたレセプトファイルを生成する。
新薬でない場合であって(S108のN)、ある標準語に対する新たな方言である場合には(S112のY)、オペレータは、この医薬品名を辞書テーブルに追加し、レセプトファイル生成部54が、対応する標準語を医薬品名に対応付けたレセプトファイルを生成する(S114)。
新たな方言でもなく(S112のN)、特殊表現である場合には(S116のY)、オペレータが、この医薬品名を一時辞書テーブルに追加し、レセプトファイル生成部54が、対応する標準語を、特殊表現された医薬品名に対応付けたレセプトファイルを生成する(S118)。特殊表現でない場合には(S116のN)、エラーメッセージがオペレータに通知される。
以上、本発明を実施例をもとに説明した。これらの実施例は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
本実施例では、レセプトファイル生成システム3が、医療関係用語の標準語と方言とを対応付けたレセプトファイルを生成するものとして説明した。例えば、本技術は、レセプトだけでなく、例えば電子カルテなどのテキスト化されたカルテに対して、医療関係用語の標準語と方言とを対応付けたカルテファイルを生成するカルテファイル生成システムとしても利用することが可能である。カルテファイル生成システムにおいては、本実施例における対象をカルテに置換することで対応することができ、複数間の病院間での医療関係用語の統一に大きく貢献することが可能である。また、このシステムは、医療関係用語だけでなく、同義語が多く存在する分野において好適に適用することができ、有用に機能する。例えば、法曹業界において弁護士が作成する契約書などの書類を統一的に管理するために、同じ意味を表すために使用される法曹用語を標準語と方言とに分類し、方言を標準語に対応付けたデータファイルを生成することで、書類の検索を容易にすることも可能となる。
実施例におけるレセプト処理フローを示す図である。 実施例におけるレセプト処理システムを示す図である。 テキストデータ生成システムの構成を示す図である。 診療報酬明細書(レセプト)のイメージデータを示す図である。 摘要欄を文字認識して、項目ごとに分類して生成したデータファイルの表示例を示す図である。 レセプトファイル生成システムの構成を示す図である。 一つの医薬品に対して生成された辞書テーブルおよびマスタテーブルの登録内容を示す図である。 標準語への対応付けを行う処理フローを示す図である。
符号の説明
1・・・レセプト処理システム、2・・・テキストデータ生成システム、3・・・レセプトファイル生成システム、10・・・イメージデータ生成部、12・・・OCR部、16・・・入力部、18・・・ディスプレイ、20・・・ドライブ装置、22・・・格納部、30・・・記憶媒体、32・・・レセプト画像、34・・・個人情報画像、36・・・薬歴画像、38・・・摘要欄、50・・・テキストデータ処理部、52・・・マッチング処理部、54・・・レセプトファイル生成部、55・・・論理チェック処理部、56・・・対応チェック処理部、58・・・データ加工部、60・・・入力部、62・・・ディスプレイ、64・・・参照テーブル格納部、66・・・データ格納部、68・・・ドライブ装置、70・・・マスタテーブル格納部、72・・・辞書テーブル格納部、74・・・一時辞書テーブル格納部、76・・・分解テーブル格納部、77・・・結合テーブル格納部、78・・・振分テーブル格納部。

Claims (5)

  1. 標準語となる医療関係用語と、その識別コードおよび属性情報とを対応付けたマスタテーブルを格納するマスタテーブル格納部と、
    医療関係用語として標準語と同じ意味を表す同義語を、該標準語の識別コードに対応付けた第1の辞書テーブルを格納する第1の辞書テーブル格納部と、
    レセプトのデータファイルに含まれるテキストデータを抽出するテキストデータ処理部と、
    前記抽出されたテキストデータを、第1の辞書テーブルにおいて検索するマッチング処理部と、
    前記マッチング処理部により、第1の辞書テーブルに前記テキストデータが医療関係用語として記憶されていることが判明した場合に、識別コードをもとに、該テキストデータをマスタテーブルの標準語に対応付けたレセプトファイルを生成するレセプトファイル生成部と、
    記マッチング処理部により、第1の辞書テーブルに前記テキストデータが医療関係用語として記憶されていないことが判明した場合に、該テキストデータを標準語の識別コードに対応付けて作成された、第2の辞書テーブルを格納する第2の辞書テーブル格納部と、
    前記テキストデータ処理部により、カンマ、空白、または改行に基づいて分解されたテキストデータであって、前記マッチング処理部により第1の辞書テーブルに医療関係用語として記憶されていないことが判明したテキストデータのうち、連続するものを結合した結合テキストデータを、標準語の識別コードに対応付けて作成された結合テーブルを格納する結合テーブル格納部と、を備え、
    前記レセプトファイル生成部は、前記第2の辞書テーブルを用いて、前記第1の辞書テーブルに記憶されていない前記テキストデータを、マスタテーブルの標準語に対応付けて前記レセプトファイルを生成し、
    前記レセプトファイル生成部は、前記結合テーブルを用いて、結合テキストデータを、マスタテーブルの標準語に対応付けて、前記レセプトファイルを生成することを特徴とするレセプトファイル生成システム。
  2. 前記レセプトファイル生成部は、前記第2の辞書テーブルに記憶した対応関係を所定の期間に限って利用して、レセプトファイルを生成することを特徴とする請求項1に記載のレセプトファイル生成システム。
  3. マスタテーブル格納部および第1の辞書テーブル格納部のそれぞれは、マスタテーブルおよび第1の辞書テーブルのそれぞれを、医療関係用語の種類ごとに格納することを特徴とする請求項1または2に記載のレセプトファイル生成システム。
  4. 文字列を、参照する辞書テーブルの種類に対応付けた振分テーブルを格納する振分テーブル格納部をさらに備え、
    前記マッチング処理部は、振分テーブルを参照して、抽出されたテキストデータに対して参照する辞書テーブルを特定することを特徴とする請求項3に記載のレセプトファイル生成システム。
  5. 前記マッチング処理部は、前記抽出されたテキストデータと、マスタテーブルまたは第1の辞書テーブルに記憶された医療関係用語との一致性を判断し、一致しない部分が数量表現である場合に、その数量表現を、マスタテーブルまたは第1の辞書テーブルに記憶された医療関係用語に含まれる数量表現と対応付けるべきものと判断することを特徴とする請求項1から4のいずれかに記載のレセプトファイル生成システム。
JP2004259900A 2004-09-07 2004-09-07 レセプトファイル生成システム Active JP4955197B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004259900A JP4955197B2 (ja) 2004-09-07 2004-09-07 レセプトファイル生成システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004259900A JP4955197B2 (ja) 2004-09-07 2004-09-07 レセプトファイル生成システム

Publications (2)

Publication Number Publication Date
JP2006079189A JP2006079189A (ja) 2006-03-23
JP4955197B2 true JP4955197B2 (ja) 2012-06-20

Family

ID=36158625

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004259900A Active JP4955197B2 (ja) 2004-09-07 2004-09-07 レセプトファイル生成システム

Country Status (1)

Country Link
JP (1) JP4955197B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5256631B2 (ja) * 2007-03-15 2013-08-07 富士通株式会社 レセプト修正支援プログラム、レセプト修正支援装置、及びレセプト修正支援方法
JP4599455B1 (ja) * 2009-09-10 2010-12-15 社団法人国民健康保険中央会 画面処理システムおよびプログラム
KR101380459B1 (ko) * 2012-02-28 2014-04-08 주식회사 유비케어 비급여 코드 표준화 장치 및 방법
JP6657945B2 (ja) * 2015-12-28 2020-03-04 セイコーエプソン株式会社 制御サーバー、情報処理システム、及び、制御サーバーの制御方法
JP6800054B2 (ja) * 2017-03-07 2020-12-16 Kddi株式会社 情報管理装置
US11562143B2 (en) 2017-06-30 2023-01-24 Accenture Global Solutions Limited Artificial intelligence (AI) based document processor
US20190006027A1 (en) * 2017-06-30 2019-01-03 Accenture Global Solutions Limited Automatic identification and extraction of medical conditions and evidences from electronic health records
US10489502B2 (en) 2017-06-30 2019-11-26 Accenture Global Solutions Limited Document processing
US11003796B2 (en) 2017-06-30 2021-05-11 Accenture Global Solutions Limited Artificial intelligence based document processor
JP7436213B2 (ja) 2019-07-11 2024-02-21 聡子 鈴木 医薬品名称特定システム、医薬品名称特定方法、処理装置、及びコンピュータプログラム
JP6652675B1 (ja) * 2019-07-11 2020-02-26 聡子 鈴木 医薬品名称特定システム、医薬品名称特定方法、処理装置、及びコンピュータプログラム
CN110349639B (zh) * 2019-07-12 2022-01-04 之江实验室 一种基于通用医疗术语库的多中心医疗术语标准化系统
CN113591772B (zh) * 2021-08-10 2024-01-19 上海杉互健康科技有限公司 医疗信息结构化识别录入的方法、系统、设备及存储介质

Also Published As

Publication number Publication date
JP2006079189A (ja) 2006-03-23

Similar Documents

Publication Publication Date Title
US20220020495A1 (en) Methods and apparatus for providing guidance to medical professionals
US11101024B2 (en) Medical coding system with CDI clarification request notification
Mo et al. Desiderata for computable representations of electronic health records-driven phenotype algorithms
US10095761B2 (en) System and method for text extraction and contextual decision support
US20190006027A1 (en) Automatic identification and extraction of medical conditions and evidences from electronic health records
US7657521B2 (en) System and method for parsing medical data
Veronin et al. The irony of MedWatch and the FAERS database: an assessment of data input errors and potential consequences
US6778994B2 (en) Pharmacovigilance database
US8700589B2 (en) System for linking medical terms for a medical knowledge base
Zhou et al. Using Medical Text Extraction, Reasoning and Mapping System (MTERMS) to process medication information in outpatient clinical notes
JP4811383B2 (ja) 電子カルテシステム
JP4955197B2 (ja) レセプトファイル生成システム
RU2697764C1 (ru) Итерационное построение разделов истории болезни
JP5279982B2 (ja) 電子カルテ装置
Mahajan et al. Toward understanding clinical context of medication change events in clinical narratives
Dietrich et al. Adverse events in twitter-development of a benchmark reference dataset: results from IMI WEB-RADR
WO2014197669A1 (en) Methods and apparatus for providing guidance to medical professionals
Fraczkowski et al. Nurse workarounds in the electronic health record: an integrative review
JP2005316967A (ja) 電子カルテ装置
Kennell Jr et al. Clinical informatics researcher's desiderata for the data content of the next generation electronic health record
Nair et al. Automated clinical concept-value pair extraction from discharge summary of pituitary adenoma patients
JP2005316971A (ja) 電子カルテ装置
JP4516809B2 (ja) 添付文書適応症コード変換方法
JP2004348271A (ja) 治験データ出力装置、治験データ出力方法及び治験データ出力プログラム
JP4087873B2 (ja) 電子カルテシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060612

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090706

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100202

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100208

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20100312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120116

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120315

R150 Certificate of patent or registration of utility model

Ref document number: 4955197

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150323

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250