JP4955197B2

JP4955197B2 - レセプトファイル生成システム

Info

Publication number: JP4955197B2
Application number: JP2004259900A
Authority: JP
Inventors: 真也木村
Original assignee: 株式会社日本医療データセンター
Priority date: 2004-09-07
Filing date: 2004-09-07
Publication date: 2012-06-20
Anticipated expiration: 2024-09-07
Also published as: JP2006079189A

Description

本発明は、ファイルを生成する技術に関する。

病院などの医療機関では、医師が、傷病名、投薬、注射、検査、手術などの医療行為の内容（以下、「診療内容」という）をカルテに記入する。近年、多くの医療機関にレセプトコンピュータと呼ばれる処理装置（「医事コンピュータ」ともいう）が導入されており、医療機関の担当者は、カルテをもとに診療内容をレセプトコンピュータに入力して、レセプトコンピュータに記憶されたフォーマットで診療報酬明細書（以下、「レセプト」という）を作成する。また病院だけではなく、薬局においてもレセプトコンピュータの普及が進んでいる。医療機関は、レセプトを、診療報酬請求書（以下、「請求書」という）とともに各都道府県単位の社会保険診療報酬支払基金に提出する。支払基金は、投薬、注射、手術などの請求点数に誤りがないかを点検し、審査委員会が、支払基金にて点検された請求書およびレセプトを審査する。このような審査を終えたレセプトに基づいて、診療報酬額が決定される。健康保険組合などの保険者は、審査を経たレセプトを二次審査し、支払基金などを通じて医療機関に診療報酬を支払う一方で、診療内容に疑問のあるものについては審査委員会に対して再審査を請求する。
特許第３１３９４８５号明細書

近年、財政赤字の問題もあり、保険者が二次審査を強化している。医療機関の手違いなどにより誤った請求がなされることもあるため、それを二次審査により見つけて再審査にかけることで、過剰な診療報酬の支払を避けることを目的としている。しかしながら、一方で、レセプトの点検には医学的な専門知識が要求されるため、保険者の誤解に基づいた再審査請求が行われることもある。近頃、規制緩和の一環として、健康保険組合が、レセプトの審査・支払業務を医療機関に対して直接行うことも可能となった。利害が相反する保険者と医療機関とが直接交渉することになるため、いずれかの誤解に基づく無用なトラブルが発生する事態も考えられる。

一般にレセプトは紙ベースで受け渡されることが多い。レセプトは、患者に施された医療行為を表現するものであり、複数月さらには複数年にまたがった患者のレセプトの情報は、その患者の時系列的な傷病履歴を表現する。保険者側で患者個人の傷病履歴をまとめることができれば、その傷病履歴を解析して、個々の患者の健康管理にも役立てることができる。紙ベースのレセプトをテキスト化することで、患者の傷病履歴をデータとして効率的に管理できるとともに、患者に継続して施された診療行為が適切なものであるかをチェックすることも可能となる。

我が国は、統計法に基づく統計調査や、医学的分類として医療機関における診療録の管理等に利用することを目的として、ＩＣＤ−１０に準拠した「疾病、傷害及び死因分類」を作成している。「疾病、傷害及び死因分類」に示される用語は、傷病名について我が国の医療業界で統一的に用いられることが好ましく、全てのカルテないしはレセプトが、「疾病、傷害及び死因分類」の用語を用いて作成されることで、本来意図する統計調査や、診療録の管理等を効率的に行うことが可能となる。

しかしながら、医療業界では慣例的に、１つの傷病や医薬品などが、複数の呼び名で表現されることがある。その他、検査名や医薬品の投与量単位の表現などについても同様である。傷病名に関して、上記した「疾病、傷害及び死因分類」に基づく用語を「標準語」と呼び、同意の他の用語を「方言」と呼ぶ場合、方言の使用は何も特別なことではなく、医師によっては、使用している用語が方言であることの意識すらないこともある。現在、方言を統一化して、標準語を使用していこうという業界の流れはあるが、その意識が全ての医師に浸透するはずはなく、医師ごと、またはレセプトコンピュータごとに、使い慣れた方言を使用し続けている現状がある。また、医療機関の種類によっても方言を使用する事情が存在し、例えば小規模な診療所や専門病院などでは、無理に標準語を使用することが管理業務を非効率にすることもある。

一方で、レセプトを審査する立場からすると、用語が統一されていなければ、傷病名や医薬品名などを容易に理解できず、効率的な審査が阻害される。そのため、紙レセプトの内容を単にテキスト化しただけでは、全ての方言を理解する技量をもつ人間しかレセプトのチェックはできないことになる。また、患者が複数の医療機関にかかった場合に、医療機関ごとに用語が統一されていなければ、レセプトのテキストデータから患者個人の健康管理に役立つ情報を抽出することも容易でなく、さらには全ての患者のデータを用いた統計的な処理を行うこともできない。
そこで本発明は、方言として存在する同義語に標準語を対応付ける技術を提供し、利便性の高いデータファイルを生成することを目的とする。

上記課題を解決するために、本発明のある態様は、レセプトファイルを生成するシステムに関する。この態様のレセプトファイル生成システムは、標準語となる医療関係用語と、その識別コードおよび属性情報とを対応付けたマスタテーブルを格納するマスタテーブル格納部と、医療関係用語として標準語と同じ意味を表す同義語を、該標準語の識別コードに対応付けた辞書テーブルを格納する辞書テーブル格納部と、レセプトをテキスト化したデータファイルに含まれるテキストデータを抽出するテキストデータ処理部と、抽出されたテキストデータを、辞書テーブルにおいて検索するマッチング処理部と、マッチング処理部により、辞書テーブルにテキストデータが医療関係用語として記憶されていることが判明した場合に、識別コードをもとに、該テキストデータをマスタテーブルの標準語に対応付けたレセプトファイルを生成するレセプトファイル生成部とを備える。医療関係用語とは、医療に関する用語（名前）であり、医療行為を表現する用語だけでなく、医薬品名なども含み、特にレセプトの表記に使用される用語を意味する。具体的に、医療関係用語は、傷病名、医薬品名、医薬品の投与量単位、医療材料名、診療行為名などの用語を含む。標準語と同じ意味を表す同義語は、標準語以外の同義語（方言）を含む。同義語には、標準語自身が含まれてもよく、この場合には辞書テーブルに標準語も含まれることになるので、マッチング処理部は、辞書テーブルを検索することで、標準語を探し出すことができる。なお、辞書テーブルに標準語が含まれない場合は、マッチング処理部がマスタテーブルを検索することで、標準語を探し出すことができる。

このレセプトファイル生成システムによると、標準語以外の同義語を、標準語に対応付けたレセプトファイルを生成することができる。このシステムにより生成されたレセプトファイルを利用すると、標準語をキーとして、統計処理や個人の健康管理などの様々なデータ処理を行うことが可能となる。

マッチング処理部は、辞書テーブルにテキストデータが医療関係用語として記憶されていない場合に、そのテキストデータを、不明データとして所定の格納領域に記憶させる。一旦、不明データとして記憶させることで、そのデータを、後にマスタテーブルや辞書テーブルの拡張に利用することが可能となる。

このレセプトファイル生成システムは、辞書テーブルに記憶されておらず、且つ通常使用されない文字列を、標準語の識別コードに対応付けた一時辞書テーブルを格納する一時辞書テーブル格納部をさらに備え、レセプトファイル生成部は、一時辞書テーブルをもとに、文字列のテキストデータを、マスタテーブルの標準語に対応付けたレセプトファイルを生成する。辞書テーブルに記憶されておらず、且つ通常使用されない文字列としては、例えば、誤入力された表現や、特定の医療機関のみで用いられる隠語的表現など、一般には用いられない異例的な表現が該当する。そのような文字列であっても、文字列自体を保存しながら、マスタテーブルに記憶されている標準語に対応付けたレセプトファイルを生成することで、もとのレセプトの内容を維持しながら、有用性の高いレセプトファイルを生成することが可能となる。

レセプトファイル生成部は、辞書テーブルに記憶されておらず、且つ通常使用されない文字列のテキストデータについて一時辞書テーブルに記憶した対応関係を所定の期間に限って利用して、レセプトファイルを生成してもよい。所定の期間に限って利用させることで、その文字列と同じ医療関係用語が後に登場した場合であっても、レセプトファイルの有用性を維持することができる。

マスタテーブル格納部および辞書テーブル格納部のそれぞれは、マスタテーブルおよび辞書テーブルのそれぞれを、医療関係用語の種類ごとに格納する。例えば、傷病名、医薬品名など、医療関係用語の種類ごとにマスタテーブルおよび辞書テーブルを作成することで、それぞれのテーブルの更新、管理、保守などを容易に実行できる。

このレセプトファイル生成システムは、文字列を、参照する辞書テーブルの種類に対応付けた振分テーブルを格納する振分テーブル格納部をさらに備え、マッチング処理部は、振分テーブルを参照して、抽出されたテキストデータに対して参照する辞書テーブルを特定してもよい。マッチング処理部は、振分テーブルを参照することで、辞書テーブルの特定に要する時間を短縮できる。

このレセプトファイル生成システムは、文字列と、その文字列を区切って分解した複数の医療関係用語に対応付けた分解テーブルを格納する分解テーブル格納部をさらに備え、テキストデータ処理部は分解テーブルを参照して、文字列のテキストデータを医療関係用語ごとに分解したテキストデータを抽出してもよい。分解テーブルを利用することで、テキストデータ処理部は、文字列から効率的に医療関係用語を抽出することが可能となる。

このレセプトファイル生成システムは、複数の文字列を結合して生成される医療関係用語をリスト化した結合テーブルを格納する結合テーブル格納部をさらに備え、テキストデータ処理部は結合テーブルを参照して、複数の文字列のテキストデータを結合したテキストデータを抽出してもよい。結合テーブルを利用することで、例えば、１つの医療関係用語において間に空白が挿入されているものや、１つの医療関係用語が改行されて複数段にまたがって記載されているものを、１つの医療関係用語として効率的に抽出することが可能となる。

マッチング処理部は、抽出されたテキストデータと、マスタテーブルまたは辞書テーブルに記憶された医療関係用語との一致性を判断し、一致しない部分が数量表現である場合に、その数量表現を、マスタテーブルまたは辞書テーブルに記憶された医療関係用語に含まれる数量表現と対応付けるべきものと判断してもよい。辞書テーブルにテキストデータが示す表現が存在しない場合であっても、マッチング処理部が自律的にテキストデータと登録済の医療関係用語との紐付けを行うことで、人的処理の負担を低減することができる。

本発明の別の態様は、カルテファイルを生成するシステムに関する。この態様のカルテファイル生成システムは、標準語となる医療関係用語と、その識別コードおよび属性情報とを対応付けたマスタテーブルを格納するマスタテーブル格納部と、医療関係用語として標準語と同じ意味を表す同義語を、該標準語の識別コードに対応付けた辞書テーブルを格納する辞書テーブル格納部と、電子カルテのデータファイルに含まれるテキストデータを抽出するテキストデータ処理部と、抽出されたテキストデータを、辞書テーブルにおいて検索するマッチング処理部と、マッチング処理部により、辞書テーブルにテキストデータが医療関係用語として記憶されていることが判明した場合に、識別コードをもとに、該テキストデータをマスタテーブルの標準語に対応付けたカルテファイルを生成するファイル生成部とを備える。医療関係用語とは、医療に関する用語（名前）であり、医療行為を表現する用語だけでなく、医薬品名なども含み、ここでは特にカルテの表記に使用される用語を意味する。具体的に、医療関係用語は、傷病名、医薬品名、医薬品の投与量単位、医療材料名、診療行為名などの用語を含む。標準語と同じ意味を表す同義語は、標準語以外の同義語（方言）を含む。同義語には、標準語自身が含まれてもよく、この場合には辞書テーブルに標準語も含まれることになるので、マッチング処理部は、辞書テーブルを検索することで、標準語を探し出すことができる。なお、辞書テーブルに標準語が含まれない場合は、マッチング処理部がマスタテーブルを検索することで、標準語を探し出すことができる。

このカルテファイル生成システムによると、標準語以外の同義語を、標準語に対応付けたカルテファイルを生成することができる。標準語に対応づけたカルテファイルを生成することで、複数の病院のカルテにおける医療関係用語を実質的に統一化することが可能となる。

本発明のさらに別の態様は、標準語となる用語と、その識別コードおよび属性情報とを対応付けたマスタテーブルを格納するマスタテーブル格納部と、標準語と、標準語と同じ意味を表す同義語とを、該標準語の識別コードに対応付けた辞書テーブルを格納する辞書テーブル格納部と、データファイルに含まれるテキストデータを抽出するテキストデータ処理部と、抽出されたテキストデータを、辞書テーブルにおいて検索するマッチング処理部と、マッチング処理部により、辞書テーブルにテキストデータが記憶されていることが判明した場合に、識別コードをもとに、該テキストデータをマスタテーブルの標準語に対応付けたデータファイルを生成するファイル生成部とを備える。

このファイル生成システムによると、標準語以外の同義語（方言）を、標準語に対応付けたファイルを生成することができ、したがって、標準語をキーとして、ファイルを用いた様々なデータ処理を行うことが可能となる。

なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。

本発明によると、標準語と標準語以外の同義語とを対応付けたファイルを生成することができる。

図１は、本発明の実施例におけるレセプト処理フローを示す。このレセプト処理フローは、１つの主体により実行されてもよく、複数の主体により協働して実行されてもよい。通常は、複数の主体で明確な役割分担を行い、全体として１つのレセプト処理システムを実現するケースが多いと考えられる。図１に示すレセプト処理フローでは、医療機関または支払基金などから提供される紙レセプトをデータ化し、統計処理などのデータ加工に適したレセプトファイルを効率的に生成する手順を表現している。以下に示す各ステップは、人手が介在することもあるが、多くはシステムによるコンピュータ処理により実行される。

本実施例のレセプト処理フローは、仕分け作業（Ｓ１０）、紙レセプトのイメージ化（Ｓ１２）、ＯＣＲ処理（Ｓ１４）、パンチ処理（Ｓ１６）、論理チェック処理（Ｓ１８）、対応チェック処理（Ｓ２０）、テキストデータ分解処理（Ｓ２２）、テキストデータ結合処理（Ｓ２３）、分解テーブル、結合テーブルの更新（Ｓ２４）、辞書テーブルの読出し（Ｓ２６）、マッチング処理（Ｓ２８）、マスタテーブル、辞書テーブルの更新（Ｓ３０）、一時辞書テーブル生成（Ｓ３２）、レセプトファイル生成（Ｓ３４）、データ加工（Ｓ３６）の処理ステップに分けることができる。

（１）仕分け作業
仕分け作業（Ｓ１０）では、入院レセプト、入院外レセプト、調剤レセプトなどの紙媒体に印刷された各帳票を仕分けする。この仕分け作業は、一般には人手により行われるが、後続のＳ１２のイメージ化の際に、コンピュータ処理により自動的に実行されてもよい。

（２）紙レセプトのイメージ化
紙レセプトのイメージ化（Ｓ１２）では、仕分けされた紙レセプトをスキャナにより読み込んで、イメージデータに変換する。ここでは、スキャナに紙レセプトを連続入力しながら、入力中の画像をディスプレイにリアルタイムに表示し、オペレータがスキャニング状況を確認する。紙レセプトが裏面で入力されたような場合には、画像認識処理により自動的にスキャニングを停止し、オペレータにその旨を通知する。また、用紙方向が上下逆のような場合にも、オペレータにその旨を通知する。以上により、向きの揃った紙レセプトのイメージデータを生成する。なお、スキャナのＣＰＵに、画像認識機能だけでなく、レセプト仕分け機能を追加することで、紙レセプトのイメージ化を行いながら、同時に仕分け処理を行って、イメージデータを、レセプトの種類ごとのフォルダに格納していく。

（３）ＯＣＲ処理
ＯＣＲ処理（Ｓ１４）では、レセプトのイメージデータから光学的文字認識により文字を読み取る。レセプトの上部には、被保険者記号番号や患者の氏名などの個人情報が記載されており、その下方には、傷病名や、投薬、注射などの診療情報、使用した医薬品とその使用量を示す診療明細が記載されている。本明細書では、レセプトの個人情報以外の情報を薬歴情報と呼ぶ。レセプトの薬歴情報は、レセプトの個人情報により、特定の個人と結び付けられることによって秘密に保護されるべきものであり、その取扱いには十分な注意が必要となる。そのため、ＯＣＲ処理の前段階として、まず、個人情報画像と薬歴画像とを切り離す。

最初にレセプトの個人情報画像をＯＣＲ処理によりテキスト化し、暗号技術によりユニークコードに変換する。続いて、このユニークコードを、レセプトの薬歴画像の画像データに結合する。これにより、オペレータは、この結合されたデータをみても個人を特定することができず、一方で、暗号化した個人情報と診療明細情報とを紐付けできる。次に、薬歴画像をＯＣＲ処理によりテキスト化する。テキスト化されたデータは、所定の形式で項目（フィールド）に分類されてファイル化される。このＯＣＲ処理では、高い文字認識率を実現することが好ましい。

（４）パンチ処理
パンチ処理（Ｓ１６）では、ＯＣＲ処理でテキスト化できなかった箇所または誤ったテキスト化がなされた箇所を、パンチャが入力または修正する。ＯＣＲ処理の精度が高くなるほどパンチャの作業量は減ることになり、したがって、紙レセプトのデータ化にかかるトータルコストを抑えることが可能となる。

Ｓ１０〜Ｓ１６のステップは、テキストデータ生成システムにより実行される。紙レセプトのテキストデータはファイルとしてまとめられ、このデータファイルが、Ｓ１８以降の処理を実行するレセプトファイル生成システムに引き渡される。

（５）論理チェック処理
論理チェック処理（Ｓ１８）では、テキスト化されたデータの論理チェックを行う。コンピュータが論理チェックを実行し、レセプト中の論理的なエラーを検出する。論理的なエラーとは、例えば患者の誕生日が未来の日付になっているような誤りである。

（６）対応チェック処理
対応チェック処理（Ｓ２０）では、データファイルにおけるテキストデータ間の対応関係をチェックする。ここでは、例えば、診療開始日と２回目以降の診療日との前後関係が逆であったり、薬歴の摘要欄に医薬品名が存在するものの、使用量が存在しなかったりという誤りをチェックする。また、数字が入力されるべき項目に、文字が入力されているような誤りもチェックする。コンピュータは、データ間の対応関係を予め保持しておき、この対応関係の適合の可否を判断することで、対応関係のエラーを検出する。検出されたエラーは、オペレータに通知される。オペレータはエラー内容を見て、正しい内容に修正する。コンピュータは、データ間の対応関係だけでなく、レセプト間の対応関係もチェックしてよい。例えば、調剤レセプトがあるのに、医科レセプトが存在しない場合、コンピュータは、その旨をオペレータに通知する。

（７）テキストデータ分解処理
テキストデータ分解処理（Ｓ２２）では、テキスト化された文字列を分類して区分けする。例えば、医科レセプトの摘要欄データを、医薬品、医療材料、診療行為に分類し、さらに医薬品、医療材料、診療行為の複数項目が１行のテキストデータとして存在している場合に、それらを項目ごとに分解する。具体的には、文字列に含まれるカンマや空白（ブランク）、改行などを検出して、文字列を医療関係用語ごとに区分けしていく。また、連続した文字列と、その文字列を複数の医療関係用語に対応付けた分解テーブルを参照して、文字列を医療関係用語に分解してもよい。例えば、傷病名と医薬品名が連続した文字列としてテキスト化されている場合に、分解テーブルは、その文字列を、傷病名と医薬品名とに対応付けて記憶している。

（８）テキストデータ結合処理
テキストデータ結合処理（Ｓ２３）では、テキストデータ分解処理（Ｓ２２）において空白や改行などにより分解された文字列のうち、医療関係用語として抽出されなかった文字列同士を結合して、１つの医療関係用語を抽出する。このとき、複数の文字列を結合して生成される医療関係用語をリスト化した結合テーブルを参照する。例えば、１つの医薬品名が、間に空白を入れてテキスト化されている場合に、結合テーブルは、その医薬品名を保持して記憶しており、分解処理された複数の文字列を結合することで結合テーブルに保持した医薬品名と一致した場合には、その複数の文字列を結合して、１つの医薬品名を抽出する。

（９）分解テーブル、結合テーブルの更新
分解テーブル、結合テーブルの更新処理（Ｓ２４）では、Ｓ２２のテキストデータ分解処理において分解できなかったテキストデータを、医療関係用語ごとに区分けして、分解テーブルの拡張を行い、また、Ｓ２３のテキストデータ結合処理において結合できなかった複数のテキストデータを１つの医療関係用語として結合して、結合テーブルの拡張を行う。この作業は人手によって行われる。

オペレータは、Ｓ２２において区分け不能な文字列を複数の医療関係用語に分解して、分解テーブルの登録内容を適宜補充していく。特に、大規模な医療機関で利用されるレセプトコンピュータは、独自の仕様でカスタマイズされていることがある。そのため、レセプトによっては、複数の医薬品名が連続して記入されたり、また傷病名と医薬品名とが連続して記入されていることもある。オペレータはこのような文字列を見つけると、対応する医療関係用語ごとに区分けして、分解テーブルの登録内容を増やしていく。これにより、次回実行するテキストデータの分解処理の信頼性を、前回よりも確実に高めることができ、処理時間を短縮することができる。

また、オペレータは、Ｓ２３において結合できなかった医療関係用語を結合テーブルに適宜登録していく。医療関係用語の文字数は様々であるが、特に長い文字列となる医療関係用語については、間に空白が挿入されたり、摘要欄において改行されて記入されることが多い。基本的に、テキストデータはＳ２２において空白部分や改行部分で分解されるが、この分解処理では、本来１つの医療関係用語であるにもかかわらず、それが不必要に分解されて１つの医療関係用語として特定できない結果を招くこともある。そのような場合の対応として、オペレータは、分解処理される１つの医療関係用語を結合テーブルに登録しておき、Ｓ２３における結合処理の精度を高めていく。結合テーブルを適宜更新していくことで、テキストデータの抽出処理の信頼性を前回よりも高めることができ、処理時間を短縮することができる。

（１０）辞書テーブルの読出
辞書テーブルの読出処理（Ｓ２６）では、格納部に記憶されている辞書テーブルを読み出す。医療関係用語には同じ意味を表す表現が複数存在することがあり、例えば、傷病名の「虫垂炎」、「盲腸」、「アッペ」は全て同じ傷病を意味する。用語の不統一は、後の統計処理などを実行する際の阻害要因となるため、レセプトファイル生成システムでは、レセプトデータの有効利用を図るべく、複数の同義語のうちの一つを「標準語」として設定し、標準語以外の同義語を「方言」と設定して取り扱うこととしている。標準語は、その識別コードおよび属性情報に対応付けられて、マスタテーブルに記憶されている。以下に、マスタテーブルと辞書テーブルとの関係を示す。

マスタテーブルは、システムで標準語として採用する傷病名、医薬品名などの医療関係用語と、その医療関係用語の識別コード、およびその属性情報とを対応付けて生成される。例えば傷病名に関していえば、「疾病、傷害及び死因分類」に分類されている傷病名を標準語として設定してもよい。識別コードは、マスタテーブルと辞書テーブルとを紐付けするために用いられ、レセプトファイル生成システムにおいて独自に設定したものを用いてもよい。また、医療業界に各種存在するコード体系における識別コードを、マスタテーブルと辞書テーブルの紐付け用の識別コードとして転用してもよい。

具体的に、傷病名「虫垂炎」を標準語と設定する場合、マスタテーブルは、「虫垂炎」を、その識別コードおよびその属性情報と対応付けて記憶する。属性情報は、虫垂炎のＩＣＤ分類などの情報を含む。医薬品名や他の区分のマスタテーブルについても同様に、標準語、識別コードおよび属性情報とが対応付けられる。医薬品名の属性情報は、薬価（保険点数）を含む。マスタテーブルは、傷病名を標準化した傷病マスタテーブル、医薬品を標準化した医薬品マスタテーブルなど、複数の区分に対して作成されている。

辞書テーブルは、医療関係用語として標準語と同じ意味を表す同義語を、標準語の識別コードに対応付けることで生成される。同義語は、標準語以外の同義語（方言）を含み、また標準語自身を含んでもよい。具体的には、「虫垂炎」の識別コードに対して、「虫垂炎」、「盲腸」、「アッペ」を対応付けて記憶するのが辞書テーブルである。ここで、虫垂炎は標準語であり、盲腸、アッペは方言である。辞書テーブルは、マスタテーブルに対応して、傷病名を辞書化した傷病辞書テーブル、医薬品を辞書化した医薬品辞書テーブルなど、複数の区分に対して作成されている。

（１１）マッチング処理
マッチング処理（Ｓ２８）では、項目ごとに分解されたテキストデータと、読み出した辞書テーブルのデータとのマッチングをとる。テキストデータが辞書テーブルに登録されたデータと一致する場合、そのデータに対応付けられている識別コードを読み出し、続くレセプトファイル生成処理に引き渡す。

なお、虫垂炎を表現する盲腸、アッペ以外の別の名前がテキストデータとして記述されている場合、この新しい名前は辞書テーブルに登録されていないため、コンピュータは、その名前を虫垂炎の方言として認識できない。辞書テーブルに対応する名前が存在しない場合、その名前を不明データとして所定の格納領域に記憶し、その旨がオペレータに出力される。

（１２）マスタテーブル、辞書テーブル更新
マスタテーブル、辞書テーブルの更新（Ｓ３０）では、まず、オペレータが、不明データとして所定の格納領域に記憶された名前を確認する。この確認作業は、不明データが発生する度に行ってもよく、また複数の不明データがまとまった段階で行ってもよい。オペレータは、不明データが虫垂炎の新しい呼び名であることを判断すると、その呼び名を虫垂炎の方言として追加し、辞書テーブルを更新する。なお、新薬がでた場合、または新しい傷病が発生した場合、オペレータは、新たな医療関係用語に識別コードを設定して、マスタテーブルおよび辞書テーブルを更新する。

（１３）一時辞書テーブル生成
一時辞書テーブル生成処理（Ｓ３２）では、一時的に利用される辞書テーブルを生成する。テキストデータが誤記であったり、ある医療機関でのみ使用される特殊な表現であるような場合、オペレータは、そのテキストデータで示す文字列を、標準語の識別コードと対応付ける一時辞書テーブルを生成する。一時辞書テーブルは、例えば当月に限って利用される。

（１４）レセプトファイル生成
レセプトファイル生成処理（Ｓ３４）では、テキストデータ中の方言や特殊な表現を標準語に紐付けたレセプトファイルを生成する。具体的にレセプトファイルでは、テキストデータ中の表現に対して、マスタテーブルで使用する標準語の識別コードをリンクさせる。このレセプトファイルは、もとの紙レセプトに記入されていた内容をそのまま残し、含まれる方言や特殊な表現については、辞書テーブルを参照することで、標準語に対応付けて構成される。

（１５）データ加工
データ加工処理（Ｓ３６）では、生成したレセプトファイルをもとに、統計的な処理や、予測医学など、ユーザのニーズに合わせた様々な処理を実行する。これは、レセプトファイル中の医療関係用語が標準語に紐付けされていることで可能となり、標準語の識別コードをキーとして、様々なデータ加工が可能となる。また、各レセプトファイルは、患者個人にも紐付けされているため、患者の傷病履歴の把握や、予測医療が可能となる。Ｓ１８〜Ｓ３６のステップは、レセプトファイル生成システムにより実行される。

図２は、本発明の実施例におけるレセプト処理システム１を示す。レセプト処理システム１は、紙レセプトのイメージデータから文字を読み取ってテキストデータを生成するテキストデータ生成システム２と、テキストデータ生成システム２において生成されたテキストデータから方言などを標準語に紐付けしたレセプトファイルを生成するレセプトファイル生成システム３を備える。テキストデータ生成システム２は、図１における紙レセプトのイメージ化処理（Ｓ１２）からパンチ処理（Ｓ１６）までの処理ステップを実行する。また、レセプトファイル生成システム３は、論理チェック処理（Ｓ１８）からデータ加工処理（Ｓ３６）までの処理ステップを実行する。テキストデータ生成システム２およびレセプトファイル生成システム３は、同一の主体により管理、運営されてもよく、また別主体が提携することで共同運営されてもよい。

本実施例におけるレセプト処理システム１の機能は、テキストデータ生成システム２およびレセプトファイル生成システム３において、ＣＰＵ、メモリ、メモリにロードされたプログラムなどによって実現される。プログラムは、テキストデータ生成システム２およびレセプトファイル生成システム３に内蔵されていてもよく、また記録媒体に格納された形態で外部から供給されるものであってもよい。したがってこれらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者に理解されるところである。

図３は、テキストデータ生成システム２の構成を示す。テキストデータ生成システム２は、イメージデータ生成部１０、ＯＣＲ部１２、入力部１６、ディスプレイ１８、ドライブ装置２０および格納部２２を備える。入力部１６は、テキストデータ生成システム２の入力インタフェースであり、例えばキーボードや、マウスなどのポインティングデバイスなどにより構成される。入力部１６は、例えばディスプレイ１８に設けられるタッチパネルとして構成されてもよい。ドライブ装置２０は、ＤＶＤやＣＤなどの記憶媒体３０のデータ書込および／またはデータ読出を行う装置である。

イメージデータ生成部１０はスキャナであり、紙レセプトを入力されて、紙レセプトのイメージデータ（レセプト画像）を生成する。イメージデータは、個人情報を記入された個人情報画像と、全画像から個人情報画像を除いた薬歴画像に分けられる。オペレータがディスプレイ１８を見ながら、入力部１６のポインティングデバイスを用いてレセプト画像の範囲指定をすることで、個人情報画像と薬歴画像とが分割されてもよい。

図４は、診療報酬明細書（レセプト）のイメージデータを示す。このレセプトは、医科レセプトの一例である。レセプト画像３２は、一点鎖線３３の上方にある個人情報画像３４と、下方にある薬歴画像３６とに分けられる。薬歴画像３６には、医薬品、医療材料、診療行為などが記述された摘要欄３８が存在する。

摘要欄３８において、左端の数字は、診療区分コードを示し、アスタリスクは、同時処方であることを示す。１つのアスタリスクでブロック化される医薬品、医療材料、診療行為の一群は、同時処方された医薬品、医療材料、診療行為であることを意味し、保険点数に関して言えば、単純にそれぞれを加算した額となるのではなく、減額の対象となる。右端の数字は、回数を示し、その左にある「×」の左側の数字は、点数を示す。「点数×回数」により、そのブロックの保険点数が定まる。点数の左側にある文字列のうち、同時処方欄または診療区分コードに含まれない文字列は、医薬品名、医療材料名、診療行為名を示す。

図３に戻って、ＯＣＲ部１２は、まず個人情報画像３４から光学的文字認識による文字の読み取りを行う。個人情報画像３４の読み取り結果は暗号化され、薬歴画像３６に対応付けられる。

次に、ＯＣＲ部１２は、薬歴画像３６から光学的文字認識による文字の読み取りを行う。薬歴画像３６のうち、摘要欄３８は、使用した医薬品、診療行為などの保険点数を表記しており、支払金額に直接関係するところである。そのため、ＯＣＲ部１２は、精度よく摘要欄３８を読み取れることが必要となる。

ＯＣＲ部１２において読み取られた薬歴画像３６のテキストデータが、ディスプレイ１８に表示され、オペレータ（パンチャ）は、表示されたテキストデータを修正する。ＯＣＲ部１２の文字認識率が高いほどオペレータの作業負担が軽くなり、紙レセプトのテキスト化にかかるコストを低くできる。

図５は、摘要欄３８を文字認識して、項目ごとに分類して生成したデータファイルの表示例を示す。パンチャは、ディスプレイ１８に表示されるデータファイルと、もとの摘要欄３８の画像とを見比べながら、入力部１６を操作して、データファイルのデータ修正を行う。図５には、文字認識がうまくできた例を示しているが、文字の誤認識がある場合は、パンチャが適宜修正していく。

パンチャによる修正が終了したデータファイルは、格納部２２に格納される。ドライブ装置２０は、レセプトのデータファイルを記憶媒体３０に記録する。記憶媒体３０は、レセプトファイル生成システム３に引き渡される。

図６は、レセプトファイル生成システム３の構成を示す。レセプトファイル生成システム３は、テキストデータ処理部５０、マッチング処理部５２、レセプトファイル生成部５４、論理チェック処理部５５、対応チェック処理部５６、データ加工部５８、入力部６０、ディスプレイ６２、参照テーブル格納部６４、データ格納部６６およびドライブ装置６８を備える。入力部６０は、レセプトファイル生成システム３の入力インタフェースであり、例えばキーボードや、マウスなどのポインティングデバイスなどにより構成される。入力部６０は、例えばディスプレイ１８に設けられるタッチパネルとして構成されてもよい。ドライブ装置６８は、ＤＶＤやＣＤなどの記憶媒体３０のデータ書込および／またはデータ読出を行う装置である。テキストデータ生成システム２およびレセプトファイル生成システム３とが一体のレセプト処理システム１として構成される場合、入力部、ディスプレイ、ドライブ装置、格納部などの構成が共用されてもよい。参照テーブル格納部６４は、マスタテーブル格納部７０、辞書テーブル格納部７２、一時辞書テーブル格納部７４、分解テーブル格納部７６、結合テーブル格納部７７、振分テーブル格納部７８を備えて構成される。

レセプトのデータファイルを記録した記憶媒体３０がドライブ装置６８に挿入され、データファイルがデータ格納部６６に書き込まれる。論理チェック処理部５５が、データ格納部６６からデータファイルを読み出し、テキスト化されたデータの論理チェックを行う。例えば、患者の誕生日が未来日付となっている場合、論理チェック処理部５５は、そのエラーを検出して、オペレータに通知する。オペレータは、その通知を受けて、エラー部分を修正する。

対応チェック処理部５６は、テキストデータ間の対応関係をチェックする。図５を参照して、医療材料名「画像記録用フィルム（１）半切１枚」と、点数（２２３８）、回数（１）とは、互いに対応付けられるべきデータであるが、図５のデータファイルでは異なる行に存在する。そのため、対応チェック処理部５６は、これらが同じ行となるように修正する。「超音波検査（断層撮影法）・胸腹部」と、その点数（５５０）、回数（１）についても同様である。

このようなチェックを実行するために、対応チェック処理部５６は、データ項目の対応関係を予め保持しておく。この対応関係は、データ格納部６６に記憶されていてもよい。例えば、図５に示す摘要欄のデータでは、「同」欄、「薬名等」欄、「点数」欄、「回数」欄のデータ項目がそれぞれ対応付けられて存在する必要があり、これらの対応関係が満たされていない場合には、対応チェック処理部５６が、データエラーを検出する。検出されたエラーは、ディスプレイ６２を通じてオペレータに通知される。オペレータはエラー内容を見て、データ同士を正しい対応関係に修正する。さらに対応チェック処理部５６は、既述したように、診療開始日と２回目以降の診療日との前後関係が逆であったり、数字が入力されるべき項目に文字が入力されているような誤りもチェックする。以上の論理チェックおよび対応チェックを行うことで、データファイルに含まれるエラーを取り除くことができる。

テキストデータ処理部５０が、データファイルに含まれるテキストデータを分類して区分けし、最終的に生成するレセプトファイルのデータ項目まで分解したテキストデータを抽出する。例えば、医科レセプトの摘要欄データを、医薬品、医療材料、診療行為に分類し、さらに医薬品、医療材料、診療行為の複数項目が１行のテキストデータとして存在している場合に、それらを所期の項目ごとに分解する。また、医薬品として記されている内容が、医薬品名と量とを示す場合も、これらを分解する処理を行う。例えば、図５に示す「ルプラック錠４ｍｇ１錠」は、ルプラック錠４ｍｇ（医薬品名）と１錠（量）とに分解される。まず、テキストデータ処理部５０は、文字列に含まれるカンマや空白（ブランク）を検出して、文字列を医療関係用語ごとに区分けする。このとき、診療区分コードをもとに文字列を区分けしてもよい。

本実施例において、テキストデータ処理部５０は、分解テーブルを参照することで、文字列のテキストデータを分解し、文字列から医療関係用語のテキストデータを抽出してもよい。分解テーブルは、分解テーブル格納部７６に格納されており、連続した文字列を、その文字列を区切って分解した複数の医療関係用語に対応付けている。この対応付けは、図１のＳ２４に関して説明したようにオペレータにより予め作成されており、複数の医療関係用語が繋がって表記された新たな文字列が登場した場合には、オペレータが、その文字列を医療関係用語に分解して、分解テーブルを逐次作成していく。これにより、以後のタイミングで同じ文字列が登場した場合、分解テーブルを参照することで、テキストデータ処理部５０が、文字列を適切な医療関係用語に分解できる。分解されたデータは所定のファイルに記録される。

なお、このファイルには、アスタリスクにより特定される１ブロックの関係が損なわれることなく記録される。既述したように、アスタリスクは、減額対象となる同時処方を示すものであるため、１ブロックの関係を保つことで、保険点数との対応関係を維持できる。図５において、１つのアスタリスクに検査方法「シンチグラム（全身）（骨）」と、医療材料「画像記録用フィルム（１）半切１枚」とが対応付けられているが、この検査方法と医療材料に対して、２３３８×１の保険点数が算出されており、したがって、これらの関係を維持した状態で、分解されたデータがファイルに記録される必要がある。

テキストデータ処理部５０により抽出された文字列が登録された医療関係用語であるか否かを判断するために、マッチング処理部５２は、振分テーブル格納部７８に登録された医療関係用語を参照する。振分テーブルは、全ての種類の辞書テーブルに格納されている全ての医療関係用語と、参照する辞書テーブルの種類とを対応づけて構成されている。したがって、マッチング処理部５２は、振分テーブルを参照することで、テキストデータ処理部５０により抽出された文字列が医療関係用語であるか否かを判断することができ、さらに、医療関係用語である場合に、参照するべき辞書テーブルを特定することが可能となる。これにより、後述するマッチング処理を実行する際に、全ての種類の辞書テーブルに関して抽出した文字列の検索を行うよりも、振分テーブルをもとに辞書を特定することで、マッチング処理時間を短縮することが可能となる。マッチング処理の詳細については後述する。抽出した文字列が医療関係用語でない場合には、テキストデータ処理部５０が、その文字列に対して結合処理を行う。

テキストデータ処理部５０は、振分テーブルを用いて抽出したテキストデータを医療関係用語として確定した後、医療関係用語として抽出できなかったテキストデータを結合する処理を行う。レセプトは、基本的に、読みやすさのために医療関係用語ごとに空白が挿入されることが多いが、上記したように、場合によっては複数の医療関係用語が連続して記述されることもあり、また逆に、１つの長い医療関係用語などについては間に空白を挿入されることもある。このようなケースでは、テキストデータ処理部５０が、１つの医療関係用語を、複数のテキストデータとして一旦抽出することになるが、これらは結合処理されて、１つの医療関係用語として抽出されることが好ましい。

そのために、結合テーブル格納部７７が、複数の文字列を結合して生成される医療関係用語をリスト化した結合テーブルを保持する。このリスト化は、図１のＳ２４に関して説明したように予めオペレータにより実行されており、振分テーブルに登録されておらず、且つ空白や改行などにより複数に分割された医療関係用語が新たに登場した場合には、オペレータがその医療関係用語をリストに加えて、結合テーブルを逐次作成していく。

テキストデータ処理部５０は、振分テーブルに登録されていなかった複数のテキストデータのうち、連続して抽出したものを結合する。１つの医療関係用語が空白や改行などにより分割されて抽出される際、これらは、連続したテキストデータとして抽出されることになる。そのため、テキストデータ処理部５０は、連続して抽出したテキストデータを一旦結合してみて、結合したテキストデータが結合テーブルに登録されている医療関係用語であるか否かを調査する。このとき、結合するテキストデータの数は２つ以上であればよく、その数は問わない。連続して抽出されたテキストデータを結合して結合テーブルを調査した結果、結合テーブルに登録されている医療関係用語であることが判断されると、テキストデータ処理部５０は、その結合したテキストデータを医療関係用語として抽出する。マッチング処理部５２は、振分テーブルを参照して、その医療関係用語に対して参照するべき辞書テーブルを特定する。

なお、マッチング処理部５２が、結合したテキストデータを振分テーブルを参照することで、医療関係用語であるか否かの判断を行ってもよい。一方、上記したように結合テーブルを利用する場合には、結合テーブルに登録されているデータ量が振分テーブルよりも多くないために、振分テーブルを利用して結合したテキストデータが医療関係用語であるか否かを判断する場合と比較して、処理時間を短縮することができる。

マスタテーブル格納部７０は、レセプトファイル生成システム３において採用する傷病名や医薬品などの名前の標準語を、その識別コードおよび属性情報と対応付けたマスタテーブルを格納する。識別コードは、標準語を特定するための唯一のコードであり、レセプトファイル生成システム３における独自のコードであってよい。傷病に対しては任意の一つの識別コードを割り当ててよいが、医薬品に対しては、時間とともに薬価が変更されることがあるため、属性情報に変更があるたびに新たな識別コードを割り当ててもよい。なお、識別コードを固定とする場合は、マスタテーブルのバージョン管理を行うことで、薬価の変更に対応することも可能である。

属性情報は、医療関係用語の種類に応じて様々なものが存在し、医療業界で各種存在するコード体系における識別コードを含んでもよい。例えば、マスタテーブルは、傷病名「虫垂炎」を、虫垂炎を特定するＩＣＤ−１０コードや、ＩＣＤ分類に対応付けて記憶する。このＩＣＤ分類は、「消化器系の疾患」である。医薬品名についても同様であり、医薬品の場合は、属性情報として保険点数などをもつ。マスタテーブルは、傷病名を標準化した傷病マスタテーブル、医薬品名を標準化した医薬品マスタテーブルなど、複数の区分に対して作成されている。

辞書テーブル格納部７２は、標準語とその方言とを、標準語の同義語として標準語の識別コードに対応付けた辞書テーブルを格納する。本実施例では、「虫垂炎」という傷病の標準語に対して、「盲腸」、「アッペ」を方言としているが、「虫垂炎」、「アッペ」、「盲腸」を、マスタテーブルにおける「虫垂炎」の識別コードに対応付けて記憶したのが辞書テーブルである。辞書テーブルは、マスタテーブルに対応して、傷病名を辞書化した傷病辞書テーブル、医薬品を辞書化した医薬品辞書テーブルなど、複数の区分に対して作成されている。

図７は、一つの医薬品に対して生成された辞書テーブルおよびマスタテーブルの登録内容を示す。辞書テーブルには、マスタテーブルのバージョン、医薬品名、医薬品コードとが対応付けて登録されている。図示のとおり、同一の医薬品を表現する用語が複数存在し、それぞれの医薬品名が、同一の医薬品コード（識別コード）に対応付けられている。マスタテーブルには、医薬品名、医薬品コードに対応付けて、様々な属性情報が登録されている。ここで、属性情報は、薬価（保険点数）、全体量、濃度、単位、単位量、製造メーカなどである。

マッチング処理部５２が、テキストデータ処理部５０において抽出されたテキストデータを、振分テーブルにより特定される辞書テーブルから検索してマッチング処理を行う。具体的に、マッチング処理部５２が、辞書テーブルを検索して、当該テキストデータの医療関係用語が記憶されているか否かを判断する。なお、本実施例では、振分テーブルを参照することで、抽出したテキストデータが医療関係用語であることが判定されているため、辞書テーブルには、そのテキストデータが存在していることになる。例えば、テキストデータが「塩酸エフェドリン注射液（４％１ｍｌ）」である場合、マッチング処理部５２は、同一の医療関係用語が医薬品辞書テーブルに存在していることを判断し、医薬品コードを読み出して、レセプトファイル生成部５４に通知する。レセプトファイル生成部５４は、この通知を受けると、医薬品コードをもとに、テキストデータ「塩酸エフェドリン注射液（４％１ｍｌ）」を標準語「塩酸エフェドリン注射液４％１ｍｌ」に対応付けてレセプトファイルを生成する。例えば、レセプトファイル生成部５４は、このテキストデータと医薬品コード（１００００００１４７４１）とを対応付けたレセプトファイルを生成してもよく、また、マスタテーブルにおける塩酸エフェドリン注射液のデータアドレスと対応付けたレセプトファイルを生成してもよい。いずれにしても、レセプトファイル生成部５４は、医薬品コードをもとにテキストデータをマスタテーブルの標準語に対応付けて、レセプトファイルを生成する。

なお、テキストデータが、辞書テーブルに含まれない「塩酸エフェドリン注射液４％１ｍｌ」を表現する他の方言である場合、マッチング処理部５２は、その名前を「塩酸エフェドリン注射液４％１ｍｌ」の方言として認識できない。辞書テーブルに対応する名前が存在しない場合、マッチング処理部５２は、そのテキストデータを、不明データとしてデータ格納部６６の所定の格納領域に記憶させる。

オペレータは、所定の格納領域に記憶された名前を見て、これが塩酸エフェドリン注射液４％１ｍｌの別の呼び名であることを判断すると、辞書テーブルを更新して、塩酸エフェドリン注射液４％１ｍｌの方言として追加する。このとき、図７に示すように、新たな方言と医薬品コード（１００００００１４７４１）とを対応付けて追加登録する。なお、新しい傷病が発生した場合、または新薬がでた場合は、本来であればマッチング処理の前にマスタテーブルが更新されているべきであるが、そのテーブル更新が間に合わなかった場合であれば、オペレータが、マスタテーブルおよび辞書テーブルを適宜更新していく。

医薬品の場合には、特に数量表現について、レセプト上で比較的自由な表現がなされることが多い。テキストデータ「塩酸エフェドリン注射液４％１ｍｌ１Ａ」に対して、テキストデータ処理部５０は、「塩酸エフェドリン注射液４％１ｍｌ１Ａ」を、「塩酸エフェドリン注射液４％１ｍｌ」（医薬品名）、「１」（数量）、「Ａ」（単位）とに分解する。このとき、「Ａ」（単位）の表現が「アンプル」を示すものであることをオペレータが判断すると、「塩酸エフェドリン注射液４％１ｍｌ１Ａ」を辞書テーブルに追加する。図７の辞書テーブルは、このようにしてオペレータにより追加された塩酸エフェドリン注射液４％１ｍｌ１Ａを含んだ状態を示す。

一方、「塩酸エフェドリン注射液４％１ｍｌ１Ａ」についての辞書テーブルが作成されていない場合、マッチング処理部５２が、この対応関係を自律的に判断してもよい。マッチング処理部５２は、抽出されたテキストデータとマスタテーブルまたは辞書テーブルに記憶された医療関係用語との一致性を判断し、一致しない部分が数量表現である場合に、その数量表現を、マスタテーブルまたは辞書テーブルに記憶された医療関係用語に含まれる数量表現と対応付けるべきものと判断する。

具体的に、マッチング処理部５２は、「塩酸エフェドリン注射液４％１ｍｌ」を含む医療関係用語をマスタテーブルにおいて探索する。このとき、先に辞書テーブルを検索して医薬品コードを特定してから、マスタテーブルを参照しにいってもよい。マッチング処理部５２は、マスタテーブルに含まれる塩酸エフェドリン注射液４％１ｍｌのデータ内容を参照して、塩酸エフェドリン注射液４％１ｍｌの数量表現の単位が「１管」であることを認識する。マッチング処理部５２は、「塩酸エフェドリン注射液４％１ｍｌ１Ａ」の２番目の「１」については、数字であるため数量の表現であることを認識し、「Ａ」については、分類が不明な表現であるが、数字に続く文字であることから、単位表現であることを推測する。この推測に基づき、マッチング処理部５２は、「Ａ」が「管」を表現するものであることを認識し、「１Ａ」が、「１管」に対応することを判断する。以上により、マッチング処理部５２は、テキストデータの示す表現が辞書テーブルに登録されていなくとも、数量表現の方言を標準語に対応付けることができ、レセプトファイル生成部５４は、「塩酸エフェドリン注射液４％１ｍｌ１Ａ」に、医薬品コード（１００００００１４７４１）を対応付けたレセプトファイルを生成することが可能となる。

また、所定の格納領域に記憶された名前が特殊な表現の場合、オペレータは、所定の期間に限り利用される辞書テーブル（一時辞書テーブル）を作成する。特殊な表現とは、既述のように辞書テーブルに記憶されておらず、且つ通常使用されない文字列を意味する。例えば、塩酸エフェドリン注射液４％１ｍｌの一般的な別の呼び名としては分類することができず、ある医療機関においてのみ使用されている表現であったり、または、医療関係用語の単なる誤記である場合に、オペレータは、その文字列を特殊な表現として分類し、一時辞書テーブルを作成する。

一時辞書テーブルは、所定の期間、例えばその月に限って使用される辞書であり、作成されると一時辞書テーブル格納部７４に記憶される。医薬品名「塩酸エフェドリン注射液４％１ｍｌ」に対して、テキストデータが「塩酸エファドリン注射液４％１ｍｌ」との誤記がなされている場合、他に選択肢がなく、明らかに「塩酸エフェドリン注射液４％１ｍｌ」の誤記であることが判明するのであれば、その月限りの辞書として、「塩酸エファドリン注射液４％１ｍｌ」を正式な呼び名「塩酸エフェドリン注射液４％１ｍｌ」に紐付けさせる。また、ある医療機関においてのみ使用されている特殊な表現も同様であり、オペレータにより標準語に紐付けされる。このように、一時辞書テーブルは、特殊な表現をマスタテーブルに記憶されている標準語の識別コードに対応付けて作成される。レセプトファイル生成システム３では、レセプトの記入事項の誤りなどの特殊表現を修正するのではなく、その特殊表現に対して標準語の識別コードを対応付けることで、レセプトの記入事項を保存しながら、統一的な処理を可能とするデータとして取扱うこととする。

医薬品の場合、基本的に名前付けが自由であり、特にカタカナの組合せであることが多いため、当月では類似した呼び名の医薬品が存在していなくても、翌月には、「塩酸エファドリン注射液４％１ｍｌ」に一致する医薬品が新薬として登場する可能性もある。そのため、誤記などの特殊な表現と認められる名前については、方言として辞書テーブルに登録するのではなく、一時限りの辞書として利用するために一時辞書テーブルに登録して、一時辞書テーブル格納部７４に格納する。レセプトファイル生成部５４は、一時辞書テーブルを参照して、特殊な表現を示すテキストデータをマスタテーブルの標準語に対応付けたレセプトファイルを生成する。

以上のように、レセプトファイル生成部５４は、テキストデータ中の方言や特殊な表現を標準語に紐付けしたレセプトファイルを生成する。このレセプトファイルは、もとの紙レセプトに記入されていた内容をそのまま残し、含まれる方言や特殊表現については、辞書テーブルまたは一時辞書テーブルを参照することで標準語に対応付けられている。

レセプトファイルには様々な利用方法がある。例えば、統計的な処理や、使用される医薬品の動向など、研究者や医薬品メーカにとって有用なデータ処理に利用することができる。さらに、暗号化した個人情報に対応付けてレセプトファイルを作成するため、個人の時系列的な診療履歴を把握することができ、適切な医療行為が施されているかのチェックも可能となる。また予測医学も可能であり、患者の健康維持のためのデータとしても活用できる。これらの処理は、データ加工部５８により実行される。

上記した実施例では、辞書テーブルを振分テーブルを用いて選択する例について説明したが、別の方法として、振分テーブルを利用せずに、マッチング処理部５２が、全ての種類の辞書テーブルを参照して、対応する医療関係用語を検索してもよい。

また上記した振分テーブルを使うよりも、さらに検索時間を短縮するために、振分テーブル格納部７８が、標準語およびその方言に特徴的な文字列を、参照する辞書テーブルの種類に対応付けた振分テーブルを格納してもよい。塩酸エフェドリン注射液４％１ｍｌに関して言えば、この振分テーブルは、全ての方言において共通となる文字列「エフェドリン注射液」を、参照する辞書テーブル、すなわち医薬品辞書テーブルに対応付けている。マッチング処理部５２は、振分テーブルを参照することで、参照する辞書テーブルとして医薬品辞書テーブルを特定することが可能となる。振分テーブルのデータ量を少なくすることで、振分テーブルの検索時間を短縮することができ、ひいてはマッチング処理時間を短縮することが可能となる。

図８は、標準語への対応付けを行う処理フローを示す。このフローでは、医薬品名を例とする。
まず、テキストデータを分解して、医薬品名を抽出する（Ｓ１０２）。マッチング処理部５２は、この医薬品名を辞書テーブルにおいて検索し（Ｓ１０４）、辞書テーブルに医薬品名として記憶されていることが判明した場合には（Ｓ１０４のＹ）、レセプトファイル生成部５４がそのテキストデータを医薬品コードと対応付けて、テキストデータをマスタテーブルの標準語に対応付けたレセプトファイルを生成する（Ｓ１０６）。

辞書テーブルに登録されていない場合（Ｓ１０４のＮ）、マッチング処理部５２は、この医薬品名を、不明データとしてデータ格納部６６の所定の格納領域に記憶させる。オペレータは、この医薬品名を確認して、新薬であると判断した場合には（Ｓ１０８のＹ）、その医薬品名をマスタテーブルおよび辞書テーブルに追加し（Ｓ１１０）、標準語を医薬品名に対応付けたレセプトファイルを生成する。

新薬でない場合であって（Ｓ１０８のＮ）、ある標準語に対する新たな方言である場合には（Ｓ１１２のＹ）、オペレータは、この医薬品名を辞書テーブルに追加し、レセプトファイル生成部５４が、対応する標準語を医薬品名に対応付けたレセプトファイルを生成する（Ｓ１１４）。

新たな方言でもなく（Ｓ１１２のＮ）、特殊表現である場合には（Ｓ１１６のＹ）、オペレータが、この医薬品名を一時辞書テーブルに追加し、レセプトファイル生成部５４が、対応する標準語を、特殊表現された医薬品名に対応付けたレセプトファイルを生成する（Ｓ１１８）。特殊表現でない場合には（Ｓ１１６のＮ）、エラーメッセージがオペレータに通知される。

以上、本発明を実施例をもとに説明した。これらの実施例は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。

本実施例では、レセプトファイル生成システム３が、医療関係用語の標準語と方言とを対応付けたレセプトファイルを生成するものとして説明した。例えば、本技術は、レセプトだけでなく、例えば電子カルテなどのテキスト化されたカルテに対して、医療関係用語の標準語と方言とを対応付けたカルテファイルを生成するカルテファイル生成システムとしても利用することが可能である。カルテファイル生成システムにおいては、本実施例における対象をカルテに置換することで対応することができ、複数間の病院間での医療関係用語の統一に大きく貢献することが可能である。また、このシステムは、医療関係用語だけでなく、同義語が多く存在する分野において好適に適用することができ、有用に機能する。例えば、法曹業界において弁護士が作成する契約書などの書類を統一的に管理するために、同じ意味を表すために使用される法曹用語を標準語と方言とに分類し、方言を標準語に対応付けたデータファイルを生成することで、書類の検索を容易にすることも可能となる。

実施例におけるレセプト処理フローを示す図である。実施例におけるレセプト処理システムを示す図である。テキストデータ生成システムの構成を示す図である。診療報酬明細書（レセプト）のイメージデータを示す図である。摘要欄を文字認識して、項目ごとに分類して生成したデータファイルの表示例を示す図である。レセプトファイル生成システムの構成を示す図である。一つの医薬品に対して生成された辞書テーブルおよびマスタテーブルの登録内容を示す図である。標準語への対応付けを行う処理フローを示す図である。

符号の説明

１・・・レセプト処理システム、２・・・テキストデータ生成システム、３・・・レセプトファイル生成システム、１０・・・イメージデータ生成部、１２・・・ＯＣＲ部、１６・・・入力部、１８・・・ディスプレイ、２０・・・ドライブ装置、２２・・・格納部、３０・・・記憶媒体、３２・・・レセプト画像、３４・・・個人情報画像、３６・・・薬歴画像、３８・・・摘要欄、５０・・・テキストデータ処理部、５２・・・マッチング処理部、５４・・・レセプトファイル生成部、５５・・・論理チェック処理部、５６・・・対応チェック処理部、５８・・・データ加工部、６０・・・入力部、６２・・・ディスプレイ、６４・・・参照テーブル格納部、６６・・・データ格納部、６８・・・ドライブ装置、７０・・・マスタテーブル格納部、７２・・・辞書テーブル格納部、７４・・・一時辞書テーブル格納部、７６・・・分解テーブル格納部、７７・・・結合テーブル格納部、７８・・・振分テーブル格納部。

Claims

標準語となる医療関係用語と、その識別コードおよび属性情報とを対応付けたマスタテーブルを格納するマスタテーブル格納部と、
医療関係用語として標準語と同じ意味を表す同義語を、該標準語の識別コードに対応付けた第１の辞書テーブルを格納する第１の辞書テーブル格納部と、
レセプトのデータファイルに含まれるテキストデータを抽出するテキストデータ処理部と、
前記抽出されたテキストデータを、第１の辞書テーブルにおいて検索するマッチング処理部と、
前記マッチング処理部により、第１の辞書テーブルに前記テキストデータが医療関係用語として記憶されていることが判明した場合に、識別コードをもとに、該テキストデータをマスタテーブルの標準語に対応付けたレセプトファイルを生成するレセプトファイル生成部と、
前記マッチング処理部により、第１の辞書テーブルに前記テキストデータが医療関係用語として記憶されていないことが判明した場合に、該テキストデータを標準語の識別コードに対応付けて作成された、第２の辞書テーブルを格納する第２の辞書テーブル格納部と、
前記テキストデータ処理部により、カンマ、空白、または改行に基づいて分解されたテキストデータであって、前記マッチング処理部により第１の辞書テーブルに医療関係用語として記憶されていないことが判明したテキストデータのうち、連続するものを結合した結合テキストデータを、標準語の識別コードに対応付けて作成された結合テーブルを格納する結合テーブル格納部と、を備え、
前記レセプトファイル生成部は、前記第２の辞書テーブルを用いて、前記第１の辞書テーブルに記憶されていない前記テキストデータを、マスタテーブルの標準語に対応付けて前記レセプトファイルを生成し、
前記レセプトファイル生成部は、前記結合テーブルを用いて、結合テキストデータを、マスタテーブルの標準語に対応付けて、前記レセプトファイルを生成することを特徴とするレセプトファイル生成システム。
前記レセプトファイル生成部は、前記第２の辞書テーブルに記憶した対応関係を所定の期間に限って利用して、レセプトファイルを生成することを特徴とする請求項１に記載のレセプトファイル生成システム。
マスタテーブル格納部および第１の辞書テーブル格納部のそれぞれは、マスタテーブルおよび第１の辞書テーブルのそれぞれを、医療関係用語の種類ごとに格納することを特徴とする請求項１または２に記載のレセプトファイル生成システム。
文字列を、参照する辞書テーブルの種類に対応付けた振分テーブルを格納する振分テーブル格納部をさらに備え、
前記マッチング処理部は、振分テーブルを参照して、抽出されたテキストデータに対して参照する辞書テーブルを特定することを特徴とする請求項３に記載のレセプトファイル生成システム。
前記マッチング処理部は、前記抽出されたテキストデータと、マスタテーブルまたは第１の辞書テーブルに記憶された医療関係用語との一致性を判断し、一致しない部分が数量表現である場合に、その数量表現を、マスタテーブルまたは第１の辞書テーブルに記憶された医療関係用語に含まれる数量表現と対応付けるべきものと判断することを特徴とする請求項１から４のいずれかに記載のレセプトファイル生成システム。