JP6773400B2 - 帳票認識装置、帳票認識システム、帳票認識システムのプログラム、帳票認識システムの制御方法、帳票認識システムプログラムを搭載した記録媒体 - Google Patents

帳票認識装置、帳票認識システム、帳票認識システムのプログラム、帳票認識システムの制御方法、帳票認識システムプログラムを搭載した記録媒体 Download PDF

Info

Publication number
JP6773400B2
JP6773400B2 JP2015192895A JP2015192895A JP6773400B2 JP 6773400 B2 JP6773400 B2 JP 6773400B2 JP 2015192895 A JP2015192895 A JP 2015192895A JP 2015192895 A JP2015192895 A JP 2015192895A JP 6773400 B2 JP6773400 B2 JP 6773400B2
Authority
JP
Japan
Prior art keywords
information
attribute
prescription
area
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015192895A
Other languages
English (en)
Other versions
JP2016071898A (ja
Inventor
啓延 辻
啓延 辻
洋祐 辻
洋祐 辻
亮太 加島
亮太 加島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Media Co Ltd
Original Assignee
Media Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Media Co Ltd filed Critical Media Co Ltd
Publication of JP2016071898A publication Critical patent/JP2016071898A/ja
Application granted granted Critical
Publication of JP6773400B2 publication Critical patent/JP6773400B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、帳票認識に係り、特に、歯科や医科における処方箋を自動的に認識することのできる帳票認識装置、帳票認識システム、帳票認識システムのプログラム、帳票認識システムの制御方法、帳票認識システムプログラムを搭載した記録媒体に関する。
帳票、特に処方箋に関する歯科や医科治療の分野においては、医師が診断した後に必要な処方について処方箋を発行し、これを薬局に持ち込み、必要な医薬を処方してもらうようになっている。現在、一般の薬局では、持ち込まれた処方箋を薬局の人間が視認したうえでシステムに手入力するか、限定的な認識技術により処理している。
また、処方箋には、医師が患者を診察しながら急いで筆記する場合もあり、乱筆のものも多くある。そのため、上記の限定的な認識技術では、誤認識が多いことが否めない。そのため、一部では、パソコン等の電子的装置を応用して、処方箋をプリンタ等により印刷することが行われている。
一方、医薬は、当然のことながら、誤読した医薬が処方された場合、時には人命に関わる大事に至る恐れもある。
たとえば、特許文献1には、処方箋走査部20にて処方箋の撮像を行ってその画像イメージからデータ処理部30にて処方箋データを得る処方箋受付装置10において、画像イメージに二次元コードが有るときにはそれを処方箋データに変換し、二次元コードの無いときは画像イメージに文字認識を施して処方箋データへの変換を行うが、その際、医療機関を特定し処方箋形式を選定して画像イメージを分割処理し、更に分割イメージと変換欄との対比表示や、分割イメージと校正欄との対比表示も行うことで、処方箋データ入力を能率良く行えるようにする、とする技術思想が開示されている。
しかし、特許文献1では、定型的な処方箋形式に限定されるため、任意の処方箋形式に対応できない。また、処方箋内の文字の認識そのものについては特に従前のものと変わりがないため、誤認識をなくすということまでは実現されていない。
従来の帳票、特に処方箋に関する読取システムの中には、当システム導入時の事前学習作業に多大な工数を取られているものもある。処方箋テンプレートごとに、文字認識の対象となる欄を人の入力により指定し、それぞれの欄の出力結果の意味するところをソフトウェアに学習させる必要があるためである。また、指定した各認識対象の欄の文字認識処理についても、OCR(光学式文字読取装置の省略表記)の認識結果を都度補正し、置換させるための人による教師学習が必要である。この作業には、OCRの認識精度を高めるために、医療機関ごとに数千枚もの処方箋を学習させる必要がある。これらの学習については、導入後も処方箋レイアウト変更などに伴い同様の学習が必要であり、メンテナンスコストも負担になっている。
これに加えて、上記現状のシステムでは、処方箋の学習には薬局から実際に使用される処方箋の原本を提供してもらう必要があり、患者の個人情報の扱いという観点でも、最小限のサンプル提供で作業が終わるようにしたい、という要請と相反する仕様となっていると言わざるを得ない。このため、テンプレートの登録やOCRの学習作業にかかる工数の兼ね合いで、認識できる処方箋の形式が限定されており、この点が広く利用されるための妨げになっている。
また、特許文献2には、処方箋走査部20にて処方箋の撮像を行ってその画像イメージからOCR等技術を応用してデータ処理部30にて処方箋データを得る処方箋受付装置10において、各種薬品名を含む薬品マスターと画像イメージから得た処方箋データとを比較し、その結果を文字列置換テーブルに反映する技術思想が開示されている。
しかし、特許文献2では、特定の文字列に対する誤りを訂正すことに限定した技術思想の開示であり、薬品名そのものの誤認識をなくすという技術的思想は開示されておらず、さらに薬品名以外の処方箋に記載された文字列を正確に認識する技術的思想に至っていない。
特開2006−120020号公報 特開2007−164274号公報
本発明は、上記の問題点を踏まえ、帳票、特に処方箋の文字を正確に認識することの可能な、処方箋認識装置、システム、プログラム、方法、及び処方箋認識プログラムを搭載した記録媒体を提供することを課題とする。
より具体的には、帳票、特に処方箋を例に本発明を説明すると、
・処方箋内の「処方欄」における文字認識率を向上でき、
・処方箋のフォーマット登録・変更作業を簡易化でき、
・様々なプリンタで印字された処方箋を読み取れる
以上、処方箋を例に説明したが、本発明は、処方箋以外の、例えば、商取取引、公的文書等、あらゆる帳票への応用を可能とする、
帳票認識装置、帳票認識システム、帳票認識システムのプログラム、帳票認識システムの方法、及び帳票認識プログラムを搭載した記録媒体を提供することを課題とする。
かかる課題を解決するため、本発明に係る帳票認識装置は、帳票を含む一定形式の書類の罫線及び/もしくは枠情報を認識し、該認識された罫線及び/もしくは枠情報に係る領域を確定する領域確定部と、前記領域確定手段によって確定された領域のうちの特定の領域について、該領域内の文字を撮像してデジタル情報に還元し、前記還元されたデジタル情報にマッチする文字情報をデジタル情報―文字情報対応データベースから抽出して対応文字情報を得る領域内文字認識部と、前記領域内文字認識手段によって得られる文字情報のうち項目名情報と推定される情報に係る属性を推定及び/もしくは規定し、属性と該属性に属すことが想定可能な項目情報の一覧とを対応させた属性―属性内可能項目データベースから前記推定及び/もしくは規定された属性に対応する属性―属性内可能項目データベースを選定する属性対応項目選定部と、前記領域内文字認識手段によって得られる文字情報のうち項目名情報と推定される情報に係る以外の文字情報について、前記属性対応項目選定手段によって選定された属性―属性内可能項目データベース内に格納された項目情報のうち類似度の高いものを選定する近接項目選定部と、前記近接項目選定手段で選定された前記類似度の高い項目情報の妥当性を検証して前記文字情報に対応する情報を確定する文字情報確定部とを備えて構成され、さらに、前記領域確定部と前記領域内文字認識部と前記属性対応項目選定部と前記類似項目選定部と前記文字情報確定部とにより認識した帳票特の書式に関し、同一の帳票パターンに対し複数の処方表記パターンを対応付ける手段と、前記対応付けた結果に関する情報を第1の記憶として格納する手段とを備える。また、前記領域確定部と前記領域内文字認識部と前記属性対応項目選定部と前記類似項目選定部と前記文字情報確定部とにより認識した帳票に関し、罫線、手書き文字および印刷文字情報をデジタル情報として認識した結果のうち少なくとも1つを表示する手段と、前記表示したデジタル情報を修正する手段と、前記修正した結果に関する情報を第2の記憶として格納する手段とをさらに備える。
また、上記課題を解決するために、本発明に係る帳票認識システムは、帳票を含む一定形式の書類の罫線及び/もしくは枠情報を認識する枠線認識装置と、前記枠線認識装置によって認識された罫線及び/もしくは枠情報に係る領域を確定する領域確定手段と、前記領域確定手段によって確定された領域のうちの特定の領域について、該領域内の文字を撮像してデジタル情報に還元し、前記還元されたデジタル情報にマッチする文字情報をデジタル情報―文字情報対応データベースから抽出して対応文字情報を得る領域内文字認識手段と、前記領域内文字認識手段によって得られる文字情報のうち項目名情報と推定される情報に係る属性を推定及び/もしくは規定し、属性と該属性に属すことが想定可能な項目情報の一覧とを対応させた属性―属性内可能項目データベースから前記推定及び/もしくは規定された属性に対応する属性―属性内可能項目データベースを選定する属性対応項目選定手段と、前記領域内文字認識手段によって得られる文字情報のうち項目名情報と推定される情報に係る以外の文字情報について、前記属性対応項目選定手段によって選定された属性―属性内可能項目データベース内に格納された項目情報のうち類似度の高いものを選定する近接項目選定手段と、前記近接項目選定手段で選定された前記類似度の高い項目情報の妥当性を検証して前記文字情報に対応する情報を確定する文字情報確定手段とを備えて構成され、さらに、前記領域確定部と前記領域内文字認識部と前記属性対応項目選定部と前記類似項目選定部と前記文字情報確定部とにより認識した帳票の書式に関し、同一の帳票パターンに対し複数の処方表記パターンを対応付ける手段と、前記対応付けた結果に関する情報を第1の記憶として格納する手段とを備える。また、前記領域確定部と前記領域内文字認識部と前記属性対応項目選定部と前記類似項目選定部と前記文字情報確定部とにより認識した帳票に関し、罫線、手書き文字および印刷文字情報をデジタル情報として認識した結果のうち少なくとも1つを表示する手段と、前記表示したデジタル情報を訂正する手段と、前記修正した結果に関する情報を第2の記憶として格納する手段とをさらに備える。
更に、上記課題を解決するために、本発明に係る帳票認識方法は、帳票を含む一定形式の書類の罫線及び/もしくは枠情報を認識し、該認識された罫線及び/もしくは枠情報に係る領域を確定する領域確定ステップと、前記確定された領域のうちの特定の領域について、該領域内の文字を撮像してデジタル情報に還元し、前記還元されたデジタル情報にマッチする文字情報をデジタル情報―文字情報対応データベースから抽出して対応文字情報を得る領域内文字認識ステップと、前記得られた文字情報のうち項目名情報と推定される情報に係る属性を推定及び/もしくは規定し、属性と該属性に属すことが想定可能な項目情報の一覧とを対応させた属性―属性内可能項目データベースから前記推定及び/もしくは規定された属性に対応する属性―属性内可能項目データベースを選定する属性対応項目選定ステップと、前記得られた文字情報のうち項目名情報と推定される情報に係る以外の文字情報について、前記属性対応項目選定手段によって選定された属性―属性内可能項目データベース内に格納された項目情報のうち類似度の高いものを選定する近接項目選定ステップと、前記選定された前記類似度の高い項目情報の妥当性を検証して前記文字情報に対応する情報を確定する文字情報確定ステップとを備えて構成され、さらに、前記領域確定部と前記領域内文字認識部と前記属性対応項目選定部と前記類似項目選定部と前記文字情報確定部とにより認識した帳票の書式に関し、同一の帳票パターンに対し複数の処方表記パターンを対応付けるステップと、前記対応付けた結果に関する情報を第1の記憶として格納するステップとを備える。また、前記領域確定部と前記領域内文字認識部と前記属性対応項目選定部と前記類似項目選定部と前記文字情報確定部とにより認識した帳票に関し、罫線、手書き文字および印刷文字情報をデジタル情報として認識した結果のうち少なくとも1つを表示するステップと、前記表示したデジタル情報を修正するステップと、前記修正した結果に関する情報を第2の記憶として格納するステップとをさらに備える。
また更に、上記課題を解決するために、本発明に係る帳票認識プログラムは、コンピュータを、帳票を含む一定形式の書類の罫線及び/もしくは枠情報を認識し、該認識された罫線及び/もしくは枠情報に係る領域を確定する領域確定手段と、前記領域確定手段によって確定された領域のうちの特定の領域について、該領域内の文字を撮像してデジタル情報に還元し、前記還元されたデジタル情報にマッチする文字情報をデジタル情報―文字情報対応データベースから抽出して対応文字情報を得る領域内文字認識手段と、前記領域内文字認識手段によって得られる文字情報のうち項目名情報と推定される情報に係る属性を推定及び/もしくは規定し、属性と該属性に属すことが想定可能な項目情報の一覧とを対応させた属性―属性内可能項目データベースから前記推定及び/もしくは規定された属性に対応する属性―属性内可能項目データベースを選定する属性対応項目選定手段と、前記領域内文字認識手段によって得られる文字情報のうち項目名情報と推定される情報に係る以外の文字情報について、前記属性対応項目選定手段によって選定された属性―属性内可能項目データベース内に格納された項目情報のうち類似度の高いものを選定する近接項目選定手段と、前記近接項目選定手段で選定された前記類似度の高い項目情報の妥当性を検証して前記文字情報に対応する情報を確定する文字情報確定手段と、として動作させる構成を備え、さらに、前記領域確定部と前記領域内文字認識部と前記属性対応項目選定部と前記類似項目選定部と前記文字情報確定部とにより認識した帳票の書式に関し、同一の帳票パターンに対し複数の表記パターンを対応付ける手段と、前記対応付けた結果に関する情報を第1の記憶として格納する手段と、として動作させることを備える。また、前記領域確定部と前記領域内文字認識部と前記属性対応項目選定部と前記類似項目選定部と前記文字情報確定部とにより認識した帳票に関し、罫線、手書き文字および印刷文字情報をデジタル情報として認識した結果のうち少なくとも1つを表示する手段と、前記表示したデジタル情報を修正する手段と、前記修正した結果に関する情報を第2の記憶として格納する手段としてさらに動作させることを備える。ただし、ここでいう「枠」とは、すべてを罫線に囲まれた閉領域のみならず、一部罫線が欠落している、あるいはまったく罫線に囲まれない領域についても、要件を満たす場合には「枠」と認識するものとする。さらに、「帳票」とは、「処方箋」に代表される、情報表記のための書類を指し、また、「帳票パターン」とは、「処方箋パターン」に代表される、情報表記のための概要形式を指すものとする。
本発明に係る帳票認識装置、帳票認識システム、帳票認識システムのプログラム、帳票認識システムの方法、及び帳票認識プログラムを搭載した記録媒体では、帳票の罫線等を踏まえて特定領域を認識し、こうして認識された領域内の文字について、表題(例えば摘要欄の摘要名)を認識し、認識された摘要名に最も適合し得る項目名リストの中から、文字認識された品名を特定することができることから、帳票の文字認識における誤認識をもっとも低減することが可能となる。
より具体的には、本発明によれば、
・帳票テンプレートの自動認識による、テンプレート登録作業の簡易化が達成される、
・品名欄に記載された品名、用法の認識精度を向上させ、OCR学習作業にかかる工数を大幅に削減できる、
・本発明に係る画像処理技術を用いることで現状のシステムでは認識できない帳票形式に対応させることができる、
・様々なプリンタで印字された帳票の認識を可能にする、
という本願独自の効果が奏される。
本発明の一実施形態に係る帳票認識システム全体の機能ブロック図である。 本発明の一実施形態に係る管理システムの構成図である。 本発明の一実施形態に係る営業店システムの構成図である。 本発明の一実施形態に係る処方箋例図である。 本発明の一実施形態に係る罫線情報データテーブルである。 本発明の一実施形態に係る処方箋閉領域情報データテーブルである。 本発明の一実施形態に係る処方箋パターンデータテーブルである。 本発明の一実施形態に係る処方箋読取情報データテーブルである。 本発明の一実施形態に係る処方詳細である。 本発明の一実施形態に係る処方表記パターン一覧である。 本発明の一実施形態に係る処方箋認識システム処理概要図である。 本発明の一実施形態に係る水平線部例図である。 本発明の一実施形態に係る画素値取得概略図である。 本発明の一実施形態に係る角度中央値処理概略図である。 本発明の一実施形態に係る分散処理1概略図である。 本発明の一実施形態に係る分散処理2概略図である。 本発明の一実施形態に係る水平垂直画素合計概略図である。 本発明の一実施形態に係るフォーム比較概略図である。 本発明の一実施形態に係る分割領域調整概略図である。
以下、図面を参照し、本発明の一実施形態にかかる帳票認識装置、帳票認識システム、帳票認識システムのプログラム、帳票認識システムの方法、及び帳票認識プログラムを搭載した記録媒体の概要について、特に処方箋を例に説明する。なお、以下では本発明の目的を達成するための説明に必要な範囲を模式的に示し、本発明の該当部分の説明に必要な範囲を主に説明することとし、説明を省略する箇所については公知技術によるものとする。
本願は、以下の手順にしたがって処方箋認識を行う。
1.処方箋用紙登録
a.記入枠の自動設定
i.スキャンした未記入/記入済処方箋用紙から、罫線を認識する。
ii.罫線情報を利用して傾きを補正する。
iii.罫線を除去した画像に対して文字認識を行い、「氏名」「保険者番号」など、記入枠のラベル文字列を抽出する。
iv.罫線の情報とラベル文字列の位置から、記入枠の位置と種類を推定する。推定できなかったもの、間違えたものはユーザーが修正する。
b.位置合わせ特徴の抽出
i.処方箋用紙の位置合わせを行うための特徴として、未記入状態の処方箋用紙の水平・垂直ヒストグラムを算出する(登録に記入済処方箋用紙が使用された場合は、aで設定された情報を基に、記入枠内を自動的に白紙化してから算出する)。
c.候補絞り込み特徴の抽出
i.処方箋用紙領域の縦横比、ヒストグラム、格子点等、容易に計算・比較が出来る特徴を、候補を絞り込むための特徴として計算する。
d.マッチング特徴の抽出
i.画像内の処方箋用紙領域を矩形状に細分割し、記入枠と一致しない部分だけを取り出す。
ii.iで取り出したそれぞれの矩形部分に対し、色、ヒストグラム、平均、分散等の特徴を計算する。
2.処方箋用紙認識
a.処方箋用紙登録と同様に罫線を認識し、傾き補正を行う。
b.処方箋用紙登録と同様に位置合わせ特徴、候補絞り込特徴の計算を行う。
c.登録されている各処方箋用紙に対して、候補絞り込み特徴による比較を行い、差異が一定の閾値を超えないものだけを候補として抽出する。
d.c.の結果の各フォームに対し、位置合わせ特徴による位置合わせとマッチング特徴による比較を行い、差異が一定の閾値を超えないものを認識結果として出力する。
3.処方内容認識
a.OCR認識結果の補正
i.OCRによって誤認識されやすい文字同士を、一つの類として類別することで、類似文字への誤認識の影響を軽減させる。
ii.trigramによる誤認識文字補正(処方内容については、「葛」と「湯」の間には「根」という文字しか来ないなどということがわかるため、「根」を誤認識したとしても補正したり、いくつかのパターンに限定できる)。
b.薬品名の認識
薬品名を認識するにおいては、薬剤名の辞書を備えて、当該辞書にある薬剤と類似性の高い文字列を探索し確定する、というアルゴリズムを用いることで薬品名の認識における認識率を向上させている。
c.分量の認識
i.OCRの認識結果から、[数値][単位]となっている部分を分量候補として抜き出す。
ii.b.で認識した薬品に最も近い分量候補を、その薬品の分量とする。
d.用法の認識
i.用法に使用される語句に対し、使用頻度や重要性の観点からランク付けを行い、語句に対して点数を割り当てる。
ii.i.で設定した点数を基に、OCRの認識結果の各行に対して点数を付ける。
iii.点数が一定の閾値を超えた行を用法断片とする。
iv.用法断片に隣接する行の点数が正の場合は、その行も用法断片とする。ただし、用法断片と行の間に直線上のものが存在する場合は含めない。
v.用法断片がそれ以上拡張できなくなった時点で、その用法断片を用法とする。
ただし、薬品名、分量などと判定される部分は除外する。
本発明の一実施形態に係る処方箋認識システムの概要について、以下、図面を参照して、本願を実施するための形態について説明する。図1は、本願の一実施形態に係る処方箋認識システムの構成概要を示す機能ブロック図である。本発明の一実施形態に係る処方箋認識システムは、ネットワーク10を介して管理システム20、営業店システム30とが結び付いて構成される。その他、必要に応じて、関連機関システム202等とネットワーク10を介して接続し、必要に応じて、システム構成をいわゆるクラウドコンピューティングにより構成してもかまわない。また、例えば、管理システム20から営業店システム30に対し、必要とされるソフトウェア等をインストールしてもかまわない。なお、関連機関システム202として、例えば、厚生労働省所管務に関するデータベースシステム、各地都道府県医療関連システム、日本薬局方による薬品名関するデータベースシステム等、本願による処方箋認識システムに関連する各システムが含まれるものとする。
次に、図2に従って管理システム20の詳細を説明する。同図に示すように、管理システム20は、管理装置データベース(以下、「管理装置DB」という。)21、管理装置サーバ22、管理出力装置23、管理入力装置24、管理装置インターフェース26を備えて構成されている。管理装置サーバ22は、プロセッサ等により処方箋認識システムの管理に関するデータの処理を行い、管理装置DB21は管理および処方箋認識システムの情報等のデータを記憶する。管理出力装置23は、ディスプレイ、プリンタ等を備えて構成され、必要に応じて各種情報を出力する。また、管理入力装置24は、キーボード、バーコードリーダ、スキャナ等を備えて構成され、必要に応じて情報の入力を行うが、情報の入力を可能とするすべての装置を含むものとする。なお、管理システム20は最終的に処方箋認識システムとしての業務遂行が可能であれば、単独でも複数のシステムから構成されていてもかまわない。
次に、図3に従って営業店システム30の詳細を説明する。同図に示すように、例えば薬局のような具体的に処方箋読み取り業務を行う営業店システム30は、営業店装置メモリ31、営業店装置プロセッサ32、営業店出力装置33、営業店入力装置34、営業店装置インターフェース36を備えて構成されている。営業店装置プロセッサ32は、例えば管理システム20から送られる情報等を処理し、例えば営業店出力装置33に情報を表示する。営業店出力装置33は、ディスプレイ、プリンタ等を備えて構成され、必要に応じて各種情報を出力する。また、営業店入力装置34は、キーボード、バーコードリーダ、スキャナ等を備えて構成され、必要に応じて操作者は情報の入力を行うが、情報の入力を可能にするすべての装置を含むものとする。営業店入力装置34では、必要に応じてキーボード等から入力処理を行って、例えば営業店出力装置33に表示し、必要に応じて、操作者により営業店入力装置34から入力された情報等を、営業店装置インターフェース36を介して管理システム20に送信する。管理システム20では送信された情報に従って、処方箋認識システムの管理処理を行い、さらなる情報を必要とする場合には、営業店システム30から、操作者によりさらなる情報入力が行われるものとする。このように操作者は営業店システム30を操作して、処方箋認識システムにより処方箋の読み込みを行う。
以上、本発明の一実施形態の概要および構成を示した。なお、管理システム20および営業店システム30以外の各システムにおいても、プロセッサ、メモリ等(いずれも図示せず)を有する場合には、管理システム20および営業店システム30と同様に、必要に応じて各種情報処理を行うものとする。次に、本発明の詳細および動作について説明する。
まず、本願において読み取る処方箋の例を、図4の処方箋例図40に示す。処方箋は、厚生労働省令等に従って作成され、処方箋例図40はその一例である。処方箋例図40の上部には、処方箋であることを示す「処方箋(または処方せん)」という表記が処方箋欄401に明記され、さらに公費負担者番号等を示す処方箋番号欄41、患者の情報を示す患者情報欄42、具体的な処方内容を示す処方欄43、備考を示す備考欄44、調剤に関する情報を示す調剤関連欄45、医療機関情報を示す医療機関情報欄46等から構成される。処方箋は、処方箋を発行する医療機関等においてはあらかじめ記入必須項目印刷等により作成され、この処方箋用紙に必要事項を記入するか、あるいは、処方箋を発行する医療機関等において処方内容等がパソコン等の入力部(図示せず)から入力され、これら入力情報を処方箋として印刷する他に、例えば罫線等を含む記入必須項目も含めた帳票として印刷する等の工程により、作成される。なお、これら処方箋は、必要とされる項目等について規定されているものの、あらかじめ定まった書式が設定されているわけではなく、例えば処方箋を発行するシステムを構築する会社、企業体、あるいは医師会、地方公共団体等の指定により、さまざまな様式が存在し得る。本願においては、あらゆる処方箋の様式に対応することを目標とし、入手可能ならば、あらかじめ処方箋の様式に従ったサンプル等を入手し、これを読み取ってもかまわない。また、前記処方箋という文字列を例えばOCRにより読み取って識別して、処方箋の表記がどの位置に存在するか、あるいは文字そのものの方向を識別することにより、処方箋の先頭部分、天地等を識別してもかまわない。
次に、例えば書式解析エンジン(Format Generator System:FGS)により、例えば帳票に含まれる罫線で囲まれた領域である「閉領域」を自動認識する方法について、図4に示す処方箋例図40および図5に示す罫線情報データテーブル50に従って説明するが、まず、読み取った処方箋に罫線に関する情報を格納する罫線情報データテーブル50について説明する。罫線情報データテーブル50は、罫線データテーブルを管理する罫線情報管理欄51、各罫線の情報を格納する、罫線1情報欄5201、罫線2情報欄5202、罫線3情報欄5203、・・・等を備えている。また、罫線情報管理欄51は、順番に1、2、3、と連番を付番する番号欄511、さらに開始終了欄5101、XY欄5102を備え、またさらに開始欄51011は、開始X欄512、開始Y欄513、終了欄51012は、終了X欄514、終了Y欄515、・・・等を、さらに備えて構成される。なお、罫線情報データテーブル50は、例えば営業店装置メモリ31に格納されたプログラムに従って営業店装置プロセッサ32により、関連する情報から算出した情報、または、営業店出力装置33のディスプレイに表示する罫線情報データテーブル設定画面(図示せず)に従って、例えば営業店システム30の営業店入力装置34のキーボードから操作者により入力された情報を、営業店装置メモリ31に格納されたプログラムに従い、営業店装置プロセッサ31により、営業店装置メモリ31上に格納するものとする。また、罫線情報データテーブル設定画面(図示せず)は、罫線情報データテーブル50と同一形式を有するものとする。さらに、必要に応じて、罫線情報データテーブル50の内容に従った罫線情報データテーブル表示画面(図示せず)を、例えば営業店システム30の営業店出力装置33、管理システム20の管理出力装置23に表示するものとする。また、罫線情報データテーブル表示画面(図示せず)は、罫線情報データテーブル50と同一形式を有するものとする。なお、罫線情報データテーブル50は、管理システム20側で作成および/もしくは入力し、メモリに格納してもかまわない。さらに、営業店システム30側で入力、格納した情報を、例えばネットワーク10を介して、管理システム20側に送信してもかまわないし、管理システム20側で作成および/もしくは入力し、メモリに格納した情報を、営業店システム30側に送信してもかまわない。
前記の通り構成された罫線情報データテーブル50に関し、罫線情報管理欄51の、番号欄511には例えば「番号」、開始欄51011には例えば「開始」、終了欄51012には例えば「終了」、開始X欄512には例えば「X」、開始Y欄513には例えば「Y」、終了X欄514には例えば「X」、終了Y欄515には例えば「Y」という情報をそれぞれ格納する。なお、X軸は、例えば処方箋例図40を見た場合の横方向とし、縦方向をY軸とする。次に、罫線1情報欄5201、罫線2情報欄5202、罫線3情報欄5203、・・・等の番号欄511には、順番に例えば「1」、「2」、「3」、・・・という情報をそれぞれ格納する。次に、罫線1情報欄5201、罫線2情報欄5202、罫線3情報欄5203、・・・等の、開始X欄512、開始Y欄513、終了X欄514、終了Y欄515等へ格納する各情報の算出方法を以下に示す。まず、例えば営業店システム30上に展開されたプログラムに従って、営業店装置プロセッサ32等により制御される営業店入力装置34に接続された例えばスキャナ(図示せず)により処方箋を読み取り、読み取った情報(図示せず)を、例えば営業店装置メモリ31に格納する。次に、前記読み取った処方箋の罫線および/もしくは枠(以降、単に罫線と表示する)から閉領域を自動認識し、各閉領域の位置関係と閉領域内の文字列を、例えば、後述の通りOCR認識によって、各閉領域が処方箋のどの欄にあたるかを自動的に抽出し、前記処方箋を読み取った情報から、後述の通り傾きを補正する。次に、読み取った処方箋に関する情報から、処方箋の様式が、例えば処方箋例図40によるものとすると、最初にX軸方向の罫線に関し、例えば罫線端411から罫線端4198に引かれた罫線の検出処理を行い、さらに、前記検出された罫線において、罫線端411から罫線端412に関し、例えば罫線端411の位置を示すX方向の座標が、例えばミリ単位(以下同様)で4.229、Y方向の座標が、例えば15.857、罫線端412の位置を示すX方向の座標が、例えば23.257、Y方向の座標が、例えば15.857であった場合、罫線1情報欄5201の、開始X欄512に例えば「4.229」、開始Y欄513に例えば「15.857」、終了X欄514に例えば「23.257」、終了Y欄515に例えば「15.857」という情報をそれぞれ格納する。同様に、罫線端413から罫線端414に引かれた罫線に関し検出処理を行い、罫線2情報欄5202の、開始X欄512に例えば「4.229」、開始Y欄513に例えば「24.314」、終了X欄514に例えば「23.257」、終了Y欄515に例えば「24.314」という情報をそれぞれ格納する。さらに、Y軸方向の罫線に関しても、罫線端411から罫線端413に引かれた罫線に関し検出処理を行い、罫線3情報欄5203の、開始X欄512に例えば「4.229」、開始Y欄513に例えば「15.857」、終了X欄514に例えば「4.229」、終了Y欄515に例えば「24.314」という情報をそれぞれ格納する。同様に、罫線端413から罫線端414に関し、罫線4情報欄5204の、開始X欄512に例えば「23.257」、開始Y欄513に例えば「15.857」、終了X欄514に例えば「23.257」、終了Y欄515に例えば「24.314」という情報をそれぞれ格納する。ただし、罫線が1つも検出できなかった場合には、例えば罫線1情報欄5201の開始X欄512と開始Y欄513と、終了欄51012の終了X欄514と終了Y欄515とのすべてに、例えば「0」という情報を格納して、罫線が検出できなかったことを示すものとする。また、罫線検出できなかった場合の傾き補正は、例えば「処方箋(または処方せん)」の文字列を検出し、この文字列の傾きから補正を行ってもかまわない。なお、前記罫線の検出に関し、例えばスキャナにおいて処方箋を読み取ったときに、許容範囲以上に傾いて読取ったことにより、検出することが困難であるときは、スキャナから読み取る処理を再度行ってもかまわない。なお、前記各種検出処理等は、例えば営業店システム30上に展開されたプログラムに従って、営業店装置プロセッサ32等で処理するものとする。また、同様な処理を、管理システム20で行っても、かまわない。さらに、その結果を、例えばネットワーク10を介して、営業店システム30へ送信してもかまわない。また、同様な処理を、管理システム20で行っても、かまわない。さらに、その結果を、例えばネットワーク10を介して、営業店システム30へ送信してもかまわない。
前記の通り罫線情報データテーブル50に格納した、例えば罫線1情報欄5201、罫線2情報欄5202、罫線3情報欄5203、罫線3情報欄5203に関する情報は、処方箋例図40の罫線端411、罫線端412、罫線端413、罫線端414により規定される矩形状を示している。ここで、例えば罫線端411の近傍点を設定し、前記近傍点から全方位に伸ばした例えば直線が、前記罫線端411、罫線端412、罫線端413、罫線端414により規定される矩形状の2つの罫線に、前記近傍点の一方の2点において同時に交わる場合には、前記近傍点は、前記規定された矩形状のなかに存在しないこととなる。一方、前記直線が前記近傍点を挟む2点において矩形状の罫線と必ず交わる場合は、この近傍点は矩形状のなかの存在することとなる。このように、前記矩形状のなかに存在する近傍点同士を関連付けることで、例えば処方箋に含まれる罫線で囲まれた領域である「閉領域」を自動認識することができる。これら閉領域は、例えば罫線情報データテーブル50のある罫線情報欄から、連続する4つの罫線情報のうち、番号欄511の一連の番号のなかから関連する4つの番号のうち一番若い番号の情報を閉領域の上部に関する情報、二番目に若い情報を閉領域の下部に関する情報、三番目に若い情報を閉領域の左端に関する情報、四番目に若い情報を閉領域の右端に関する情報と定義することで、罫線と閉領域とを関連付けることが可能となる。また、例えば、読み取った処方箋の罫線に、例えば欠損がある、あるいはスキャナによる読み取り時に正しく読み取れなかった等により、罫線が途切れていると認識した場合でも、前記切れたと判断した罫線部分の長さが一定以下であった場合、これを連続しているものと判断し、閉領域の認識を行ってもかまわない。あるいは、前記4つの罫線の組み合わせにより矩形が形成されない場合にも、例えば1本の罫線を途中で途切れていて2本または、それ以上の罫線として検出していることも想定し、平領域の認識を行ってもかまわない。以上、罫線情報データテーブル50に係る領域確定に関する説明を行った。
前記の通り、読み取った処方箋の罫線に関する情報を罫線情報データテーブル50に格納した後、次に前記罫線情報データテーブル50から、処方箋閉領域情報データテーブル60を作成するが、以下に、処方箋閉領域情報データテーブル60について説明する。処方箋閉領域情報データテーブル60は、処方箋閉領域情報データテーブルを管理する処方箋閉領域情報管理欄61、読み取った処方箋の閉領域情報を格納する、閉領域1情報欄6201、閉領域2情報欄6202、閉領域3情報欄6203、・・・等を備えている。また、罫線閉領域情報管理欄61は、順番に1、2、3、と連番を付番する番号欄611、中央X欄612、中央Y欄613等を、さらに備えて構成される。なお、処方箋閉領域情報データテーブル60は、例えば営業店装置メモリ31に格納されたプログラムに従って営業店装置プロセッサ32により、関連する情報から算出した情報、または、営業店出力装置33のディスプレイに表示する処方箋閉領域情報データテーブル設定画面(図示せず)に従って、例えば営業店システム30の営業店入力装置34のキーボードから操作者により入力された情報を、営業店装置メモリ31に格納されたプログラムに従い、営業店装置プロセッサ31により、営業店装置メモリ31上に格納するものとする。また、処方箋閉領域情報データテーブル設定画面(図示せず)は、処方箋閉領域情報データテーブル60と同一形式を有するものとする。さらに、必要に応じて、処方箋閉領域情報データテーブル60の内容に従った処方箋閉領域情報データテーブル表示画面(図示せず)を、例えば営業店システム30の営業店出力装置33、管理システム20の管理出力装置23に表示するものとする。また、処方箋閉領域情報データテーブル表示画面(図示せず)は、処方箋閉領域情報データテーブル60と同一形式を有するものとする。なお、処方箋閉領域情報データテーブル60は、管理システム20側で作成および/もしくは入力し、メモリに格納してもかまわない。さらに、営業店システム30側で入力、格納した情報を、例えばネットワーク10を介して、管理システム20側に送信してもかまわないし、管理システム20側で作成および/もしくは入力し、メモリに格納した情報を、営業店システム30側に送信してもかまわない。
なお、前記の通り構成された処方箋閉領域情報データテーブル60に関し、処方箋閉領域情報管理欄61の、番号欄611には例えば「番号」、中央X欄612には例えば「中央X」、中央Y欄613には例えば「中央Y」という情報をそれぞれ格納する。次に、閉領域1情報欄6201、閉領域2情報欄6202、閉領域3情報欄6203、・・・等の番号欄611には、順番に例えば「1」、「2」、「3」、・・・という情報を格納する。次に、中央X欄612、中央Y欄613等へ格納する各情報の算出方法を以下に示す。例えば、番号欄611に格納した例えば「1」に該当する閉領域1情報欄6201の中央X欄612の「13.743」は、罫線端411と罫線端412のX軸方向の中間点を示し、罫線1情報欄5201の開始X欄512に格納した「4.229」と、終了X欄514に格納した「23.257」の平均値、
(4.229 + 23.257) ÷ 2 = 13.743
を格納した結果を示す。
次に、該閉領域のY軸方向における中央値である、中央Y欄613の「20.086」は、罫線端411と罫線端413Y軸方向の中間点を示し、罫線3情報欄5203の開始X欄512に格納した「15.857」と、終了X欄514に格納した「24.314」の平均値、
(15.857 + 24.314) ÷ 2 = 20.086
を格納した結果を示す。以下同様に、閉領域2情報欄6202、閉領域3情報欄6203、・・・等の中央X欄612、中央Y欄613にも、各閉領域の中央値を格納する。このように、処方箋閉領域情報データテーブル60は、読み取った処方箋の閉領域の中央値を格納するとともに、該処方箋に関する閉領域情報が、例えば番号94まで存在している場合には、該処方箋の閉領域が94個存在することを示している。また、罫線が1つも検出できなかった場合や閉領域が1つも認識されなかった場合には、例えば処方箋全体を1つの枠と認識して、例えば閉領域1情報欄6201の中央X欄612と中央Y欄613とに、例えば「0」という情報を格納して、閉領域が認識できなかったことを示すものとする。なお、前記検出等処理は、例えば営業店システム30上に展開されたプログラムに従って、営業店装置プロセッサ32等で処理するものとする。また、同様な処理を、管理システム20で行っても、かまわない。さらに、その結果を、例えばネットワーク10を介して、営業店システム30へ送信してもかまわない。その他、処方箋閉領域情報データテーブル60の詳細等に関しては、例えば罫線情報データテーブル50に準ずるものとする。
一方、本願においては、処方箋認識システムによって読み取った処方箋のフォーマットパターンに関しては、前記サンプル書式を含む新規パターンごとにデータテーブルに格納する。新規パターンの読み取りは、読み取ることが想定されるパターンを処方箋認識システムにより事前に読み取らせる場合もあるが、事前に読み取ったパターンによらない実際の処方箋に関しても、新規パターンの場合はその都度、データテーブルを追加して、このデータテーブルにその情報を格納するものとする。これらパターンに関する情報を格納する処方箋パターンデータテーブル70について、図7に従って説明する。処方箋パターンデータテーブル70は、処方箋のどのパターンに関する情報であること示す処方箋パターン欄71、処方箋パターンデータテーブルを管理する処方箋パターン管理欄72、読み取った処方箋に含まれる閉領域の情報を格納する、閉領域1情報欄7301、閉領域2情報欄7302、閉領域3情報欄7303、・・・等を備えている。また、番号欄721、中央X欄722、中央Y欄723、各閉領域が何の項目に関する情報を格納する項目内容欄724等を、さらに備えて構成される。なお、処方箋パターンデータテーブル70は、例えば営業店装置メモリ31に格納されたプログラムに従って営業店装置プロセッサ32により、関連する情報から算出した情報、または、営業店出力装置33のディスプレイに表示する処方箋パターンデータテーブル設定画面(図示せず)に従って、例えば営業店システム30の営業店入力装置34のキーボードから操作者により入力された情報を、営業店装置メモリ31に格納されたプログラムに従い、営業店装置プロセッサ31により、営業店装置メモリ31上に格納するものとする。また、処方箋パターンデータテーブル設定画面(図示せず)は、処方箋パターンデータテーブル70と同一形式を有するものとする。さらに、必要に応じて、処方箋パターンデータテーブル70の内容に従った処方箋パターンデータテーブル表示画面(図示せず)を、例えば営業店システム30の営業店出力装置33、管理システム20の管理出力装置23に表示するものとする。また、処方箋パターンデータテーブル表示画面(図示せず)は、処方箋パターンデータテーブル70と同一形式を有するものとする。なお、処方箋パターンデータテーブル70は、管理システム20側で作成および/もしくは入力し、メモリに格納してもかまわない。さらに、営業店システム30側で入力、格納した情報を、例えばネットワーク10を介して、管理システム20側に送信してもかまわないし、管理システム20側で作成および/もしくは入力し、メモリに格納した情報を、営業店システム30側に送信してもかまわない。
次に、処方箋パターンデータテーブル70に格納する情報の詳細について、「処方箋パターンA」に関する情報を例に説明する。まず、処方箋パターン欄71には、パターンに関する情報であること示す、例えば「処方箋パターン:A」、処方箋パターン管理欄72の番号欄721には例えば「番号」、項目内容欄724には例えば「項目内容」という情報をそれぞれ格納する。次に、閉領域1情報欄7301、閉領域2情報欄7302、閉領域3情報欄7303、・・・等の番号欄721には、順番に例えば「1」、「2」、「3」、・・・という情報を格納するが、中央X欄722、中央Y欄723等へ格納する各情報の算出方法は、処方箋閉領域情報データテーブル60の閉領域1情報欄6201の中央X欄612、中央Y欄613の計算方法に準ずるものとして、各閉領域の中央値を格納する。このように、処方箋閉領域情報データテーブル60と同様に処方箋パターンデータテーブル70においても、読み取った処方箋の閉領域の中央値を格納するとともに、該処方箋に関する閉領域情報が、例えば番号94まで存在している場合には、該処方箋の閉領域が94個存在することを示す。このように、閉領域を認識して、前記の通り処方箋を読み取った情報(図示せず)から、罫線を消去することにより、以下のOCR等による文字認識を行う領域を想定することが可能となる効果の他に、例えば閉領域を誤って認識しており、実は複数の閉領域と認識している部分が1つの閉領域であった場合にはOCR等による文字認識を行っても、処方箋として意味のある文字列が読み取れないこととなるが、そのような場合には、対象とする閉領域の周辺を含めてOCR等による文字認識を行うことにより、確かな文字列を読み取ることが可能となる。また、閉領域1情報欄7301の項目内容欄724には、例えば該閉領域に予め記入された文字を文字認識方法である例えばOCR等で読み取ったときに公費負担者番号と認識した場合には、該項目内容欄に、例えば「公費負担者番号」という情報を格納する。以下同様に、閉領域1情報欄7301、閉領域2情報欄7302、閉領域3情報欄7303、・・・等の項目内容欄724にも、例えばOCRで読み取った情報を格納するものとする。なお、項目内容欄724に格納する文字列は、例えば厚生労働省、医師会、地方公共団体等によりあらかじめ設定された項目内容を、例えばネットワーク10を介して関連機関システム202等に問い合わせて例えば一覧表(図示せず)を作成し、これと照合することで読み取り精度の向上を図ってもかまわない。このように、処方箋パターンデータテーブル70は、読み取った処方箋の閉領域の中央値と、該閉領域に記入された内容に関する情報を格納するとともに、処方箋閉領域情報データテーブル60と同様に、該処方箋に関する閉領域情報が、例えば番号94まで存在している場合には、該処方箋の閉領域が94個存在することを示す。また、前記に示すように閉領域が認識されず、例えば閉領域1情報欄6201の中央X欄612と中央Y欄613とに、例えば「0」という情報が格納されている場合には、該当する読み取った処方箋のナマ画像と処方箋パターンデータテーブル70とを、例えば、営業店システム30の営業店装置インターフェース36に接続されたディスプレイ(図示せず)等に、並列して表示し、例えば操作者により、両者を比較して精査し、例えば項目欄724に格納した項目内容に誤りがある場合には、例えば操作者によって修正を行い、さらに、処方箋パターンデータテーブル70の各項目内容が記述された処方箋上の位置と、読み取った処方箋のナマ画像より、処方箋の位置関係を、例えばタッチペン等により画面を指し示して関連付け、正しい処方箋パターンデータテーブルとする処理を行ってもかまわない。なお、前記OCRを含む、前記検出、算出等の各処理は、例えば営業店システム30上に展開されたプログラムに従って、営業店装置プロセッサ32等で処理し、その結果を例えばネットワーク10を介して、管理システム20へ送信してもかまわない。また、同様な処理を、管理システム20で行っても、かまわない。さらに、その結果を、例えばネットワーク10を介して、営業店システム30へ送信してもかまわない。その他、処方箋パターンデータテーブル70の詳細等に関しては、例えば処方箋閉領域情報データテーブル60、罫線情報データテーブル50に準ずるものとする。
このように、処方箋のパターン別に読み取った情報を格納する処方箋パターンデータテーブル70は、例えば処方箋のパターンが5種類であった場合には、5パターン分の処方箋パターンデータテーブル70が存在し、それぞれの処方箋パターン欄71には、どのパターンに関する情報であること示す、例えば「処方箋パターン:A」、「処方箋パターン:B」、「処方箋パターン:C」、・・・、という情報格納することとなるが、これら過去に識別した処方箋のフォーマットに関する情報と、前記処方箋閉領域情報データテーブル60の情報を突合せることにより、今回読み取った処方箋がすでにフォーマットパターンとして登録済かどうか確認し、もし登録済である場合には、該当する処方箋パターンデータテーブル70に準じた処方箋フォーマットとして、該閉領域に含まれる文字情報を例えばOCR等により識別するときに、処方箋パターンデータテーブル70の項目内容欄724等の情報を参考にしてもかまわない。また、前記突合せによるフォーマット照合は、例えば番号欄621と番号欄721の何番まで情報が存在する、各閉領域の中央に関する数値がどこまで類似しているか等を勘案して行うものとする。さらに、例えば前記処方箋閉領域の縦横比、ヒストグラム、格子点数、色等の特徴を抽出して、これらを点数化し、前記突合せにより一致している特徴の点数の合計をすることにより、どのバターンに近いか判断してもかまわない。また、今回読み取った処方箋が、いままでに読み取ったことのない処方箋パターンによるものである場合には、この処方箋パターンに関する情報を、新規の処方箋パターンデータテーブル70として作成し、例えば営業店装置メモリ31上に格納するものとする。ただし、この新規の処方箋パターンデータテーブルの登録に関しては、例えば営業店システム30の営業店出力装置33に、新規の処方箋パターンデータテーブルであることを表示(図示せず)した上で、操作者の同意を得てから格納する処理としてもよい。なお、前記OCRを含む、前記検出、算出等の各処理等およびデータテーブルへの格納の詳細等に関しては、例えば罫線情報データテーブル50、処方箋閉領域情報データテーブル60に準ずるものとする。
前記の通り、今回読み取った処方箋が、例えば事前に読み取った処方箋パターンと同一であったと判定し、その処方箋パターンが図4に示す処方箋例図40に準ずると判定したとする。次に、前記の通り処方箋を読み取った情報(図示せず)から、罫線を消去し、さらに、例えば罫線端411、罫線端412、罫線端4198、罫線端4199に囲まれた閉領域は、例えば図7に示す処方箋パターンデータテーブル70の閉領域1情報欄7301に格納した情報に従うものとすると、該閉領域には、公費負担者番号と印刷されている。このように、事前に読み取った処方箋パターンが合致した処方箋に記載された情報を格納する、処方箋読取情報データテーブル80について、図8に従って説明する。処方箋読取情報データテーブル80は、処方箋読取情報データテーブルを管理する処方箋読取情報管理欄81、読み取った処方箋の各情報を格納する、処方箋内容1情報欄8201、処方箋内容2情報欄8202、処方箋内容3情報欄8203、・・・等を備えている。また、処方箋読取情報管理欄81は、順番に1、2、3、と連番を付番する番号欄811、項目内容欄812、読取情報欄813等を、さらに備えて構成される。なお、処方箋読取情報データテーブル80は、例えば営業店装置メモリ31に格納されたプログラムに従って営業店装置プロセッサ32により、関連する情報から算出した情報、または、営業店出力装置33のディスプレイに表示する処方箋閉領域情報データテーブル設定画面(図示せず)に従って、例えば営業店システム30の営業店入力装置34のキーボードから操作者により入力された情報を、営業店装置メモリ31に格納されたプログラムに従い、営業店装置プロセッサ31により、営業店装置メモリ31上に格納するものとする。また、処方箋読取情報データテーブル設定画面(図示せず)は、処方箋読取情報データテーブル80と同一形式を有するものとする。さらに、必要に応じて、処方箋読取情報データテーブル80の内容に従った処方箋読取情報データテーブル表示画面(図示せず)を、例えば営業店システム30の営業店出力装置33、管理システム20の管理出力装置23に表示するものとする。また、処方箋読取情報データテーブル表示画面(図示せず)は、処方箋読取情報データテーブル80と同一形式を有するものとする。なお、処方箋読取情報データテーブル80は、管理システム20側で作成および/もしくは入力し、メモリに格納してもかまわない。さらに、営業店システム30側で入力、格納した情報を、例えばネットワーク10を介して、管理システム20側に送信してもかまわないし、管理システム20側で作成および/もしくは入力し、メモリに格納した情報を、営業店システム30側に送信してもかまわない。
前記の通り構成された処方箋読取情報データテーブル80に関し、処方箋読取情報管理欄81の、番号欄811には例えば「番号」、項目内容欄812には例えば「項目内容」、読取情報欄813には例えば「読み取り情報」という情報をそれぞれ格納する。次に、処方箋内容1情報欄8201、処方箋内容2情報欄8202、処方箋内容3情報欄8203、・・・等の番号欄811には、順番に例えば「1」、「2」、「3」、・・・という情報を格納し、項目内容欄812には、後述する読取情報欄813に格納する項目内容の名称を格納する。具体的には、例えば前記の通り読み取った処方箋が処方箋パターンAに準じている場合、処方箋パターンAに関する処方箋パターンデータテーブル70の項目内容欄724の情報を格納する。ただし、例えば図4の患者情報欄42に示す「患者」欄は、さらに「氏名」欄、「生年月日」欄等の具体的な項目が続いているため、特に処方箋読取情報データテーブル80に「患者」という情報を格納する必要はないが、例えば処方箋内容3情報欄8203の項目内容欄812には、例え「患者氏名」、例えば処方箋内容4情報欄8204の項目内容欄812には、例えば「患者生年月日」という情報を格納する。以下同様に、処方箋内容5情報欄8205、処方箋内容6情報欄8206、・・・等の項目内容欄812に、情報を格納するものとする。
以上、処方箋読取情報データテーブル80の項目内容欄812に該当する項目内容を格納すると、次に、読取情報欄813には、前記の通り処方箋を読み取った情報(図示せず)から罫線を消去し、記載された処方箋の例えばOCRにより読み取った情報を解析して、例えば、前記項目内容と前記近傍の文字列との整合性を、例えば前記項目内容と項目内容の具体的な表記として使用される可能性の高い単語等とを対応付けたデータテーブル(図示せず)に従って検索して、親和性のある文字列を抽出し、その結果を格納する。例えば処方箋内容1情報欄8201では、解析した結果が6713128であったなら、例えば「6713128」、処方箋内容1情報欄8202では、解析した結果が1234567であったなら、例えば「1234567」、処方箋内容1情報欄8203では、解析した結果が本郷太郎であったなら、例えば「本郷 太郎」という情報をそれぞれ格納する。以下同様に、各読取情報欄813に、解析に従って情報を格納する。なお、前記罫線検出、関連する情報からの算出等の各処理は、例えば営業店システム30上に展開されたプログラムに従って、営業店装置プロセッサ32等で処理し、その結果を例えばネットワーク10を介して、管理システム20へ送信してもかまわない。また、同様な処理を、管理システム20で行っても、かまわない。さらに、その結果を、例えばネットワーク10を介して、営業店システム30へ送信してもかまわない。その他、処方箋読取情報データテーブル80の詳細等に関しては、例えば罫線情報データテーブル50、処方箋閉領域情報データテーブル60、処方箋パターンデータテーブル70に準ずるものとする。
次に、図4の処方欄43に示す閉領域に記載された情報を、例えば図8の処方箋内容21情報欄8221の読取情報欄813に格納する処理について説明する。処方箋内容21情報欄8221の項目内容欄812に「処方」と格納するが、読取情報欄813には処方箋においてもっとも重要な処方内容を読み取って解析し格納する。この処方箋の処方欄43に記載されている情報の一例を、図9に示す、処方詳細情報90に従って説明する。処方詳細情報90は、図4に示す処方欄43の一部分を示しており、変更不可欄9431、処方詳細欄9432等を備えている。また、処方詳細欄9432には、具体的な処方詳細を示す、例えば、ケフラール細粒小児用100mg94321、(100mg 1g)94322、(剤形変更不可)94324、・・・等を、さらに備えて構成される。なお、例えば「ケフラール細粒小児用100mg」等の下にある下線および「薬剤」、「分量」、「補足」等は、後述の説明のために追記したもので、実際の処方箋には記載されていないものとする。また、処方詳細欄9432の読み取りは、以下余白94329を読み取ることにより終了としてもかまわない。なお、処方詳細情報90は、前記の通り、例えば営業店システム30上に展開されたプログラムに従って、営業店装置プロセッサ32等に制御される、営業店入力装置34に接続された例えばスキャナ(図示せず)により処方箋を読み取り、前記読み取った情報(図示せず)を、例えば営業店装置メモリ31に格納した結果と基本的に同一である。
前記の通り読み取った処方詳細に関する文字情報に対して、まず例えばスキャナ等で読み取って解析したデジタル情報を得た後、前記デジタル情報にマッチする文字情報をデジタル情報―文字情報対応データベース(図示せず)から抽出した対応文字情報により領域内文字認識を行うことにより、OCR認識処理を行う。なお、例えば薬剤名や用法については例えばネットワーク10を介して、例えば関連機関システム202である厚生労働省所管務に関するデータベースシステム、各地都道府県医療関連システム、日本薬局方による薬品名関するデータベースシステム等、本願による処方箋認識システムに関連する各システムと、例えば営業店システム30と接続して、前記各システムのデータベース(図示せず)等に格納された、薬品名、用法等と、前記OCR認識結果と照合して、処方箋としての読み取り精度の向上をはかるとともに、この結果を前記デジタル情報―文字情報対応データベース(図示せず)に格納してもかまわない。また、属性対応項目を選定する処理として、前記領域内文字認識によって得られる文字情報のうち項目名情報と推定される情報に係る属性を推定及び/もしくは規定し、属性と該属性に属すことが想定可能な項目情報の一覧とを対応させた属性―属性内可能項目データベース(図示せず)から前記推定及び/もしくは規定された属性に対応する属性―属性内可能項目データベースを選定する。さらに、類似項目選定処理として、前記領域内文字認識によって得られる文字情報のうち項目名情報と推定される情報に係る以外の文字情報について、前記属性対応項目選定手段によって選定された属性―属性内可能項目データベース(図示せず)内に格納された項目情報のうち類似度の高いものを選定する類似項目を選定しても、かまわない。このようにして読み取った情報は、例えば、一般名称薬剤は、「般」の表示のついている薬剤名、一般名称コードしか存在しない薬剤についても、対応可能とする。なお、前記属性―属性内可能項目データベース(図示せず)につても、前記デジタル情報―文字情報対応データベース(図示せず)と同様、例えば関連機関システム202である厚生労働省所管務に関するデータベースシステム、各地都道府県医療関連システム、日本薬局方による薬品名関するデータベースシステム等、本願による処方箋認識システムに関連する各システムと、例えば営業店システム30と接続して、前記各システムのデータベース(図示せず)等に格納された各種情報と照合し、この結果を前記属性―属性内可能項目データベース(図示せず)に格納してもかまわない。
具体的には、読み取った処方箋の処方欄43に記載されたい処方内容が、図9に示す、処方詳細90の通りであったとして説明する。処方詳細90は、変更不可欄9431、処方詳細欄9432等を備えて構成され、処方箋例図40に示す処方箋全体のうち、特に処方欄の部分を示している。まず、処方詳細欄9432のケフラール細粒小児用100mg94321の下線の下に表記された「薬剤」という表記は、前記ケフラール細粒小児用100mg94321を薬剤として認識したことを示し、以下同様に、「分量」、「力価」、「補足」、「用法」、「日数」等も、例えば薬事法に関するデータベース等との照合の結果によるものとする。また後述のように、例えば(100mg 1g)94322を省略可能な記載として読み取らない処理を行ってもかまわない。
次に、処方箋欄43を読み取るための処理速度向上および/もしくは精度向上のため、このように処方箋パターンごとに定められた特有の処方表記方法を格納する、処方表記パターン一覧100について、図10に従って説明する。まず、処方表記パターン一覧100は、処方表記パターン一覧を管理する処方表記パターン管理欄101、読み取った処方表記方法の各情報を格納する、処方表記パターン1情報欄10201、処方表記パターン2情報欄10202、処方表記パターン3情報欄10203、・・・等を備えている。また、処方表記パターン管理欄101は、処方箋パターン欄1011、読取フォーマット欄1012等を、さらに備えて構成される。なお、処方表記パターン一覧100は、例えば営業店装置メモリ31に格納されたプログラムに従って営業店装置プロセッサ32により、関連する情報から算出した情報、または、営業店出力装置33のディスプレイに表示する処方表記パターン一覧設定画面(図示せず)に従って、例えば営業店システム30の営業店入力装置34のキーボードから操作者により入力された情報を、営業店装置メモリ31に格納されたプログラムに従い、営業店装置プロセッサ31により、営業店装置メモリ31上に格納するものとする。また、処方表記パターン一覧設定画面(図示せず)は、処方表記パターン一覧100と同一形式を有するものとする。さらに、必要に応じて、処方表記パターン一覧100の内容に従った処方表記パターン一覧表示画面(図示せず)を、例えば営業店システム30の営業店出力装置33、管理システム20の管理出力装置23に表示するものとする。また、処方表記パターン一覧表示画面(図示せず)は、処方表記パターン一覧100と同一形式を有するものとする。なお、処方表記パターン一覧100は、管理システム20側で作成および/もしくは入力し、メモリに格納してもかまわない。さらに、営業店システム30側で入力、格納した情報を、例えばネットワーク10を介して、管理システム20側に送信してもかまわないし、管理システム20側で作成および/もしくは入力し、メモリに格納した情報を、営業店システム30側に送信してもかまわない。
前記の通り構成された処方表記パターン一覧100に関し、処方表記パターン管理欄101の、処方箋パターン欄1011には例えば「処方箋パターン」、読取フォーマット欄1012には例えば「読取フォーマット」という情報をそれぞれ格納する。次に、処方表記パターン1情報欄10201、処方表記パターン2情報欄10202、処方表記パターン3情報欄10203、・・・等の処方箋パターン欄1011には、該当するそれぞれの処方箋パターンを示す例えば「A」、「B」、「C」、・・・という情報を格納し、読取フォーマット欄1012には、具体的な処方箋表記パターンを格納する。例えば処方表記パターン1情報欄10201の処方箋パターンAの処方表記パターンとして、例えば「(薬剤/[力価]/分量/[補足]/用法/日数/)+」という情報を格納する。以下同様に、処方表記パターン2情報欄10202、処方表記パターン3情報欄10203、・・・等の読取フォーマット欄1012に、情報を格納するものとする。なお、これら読取フォーマット欄1012に格納する読取フォーマットは、該当する処方詳細欄9432に記載されたフォーマットを、例えばOCRによって読み取り、その結果から、どのようなフォーマットによるかを識別し格納するものとする。なお、例えば処方箋パターンAに対し、複数の処方表記バターンが存在する場合、すなわち同一の処方箋パターンAを例えばA病院とB病院で使用し、それぞれに処方表記パターンが異なる場合には、例えば処方表記パターン21情報欄10221の処方箋パターン欄1011に「A」と格納し、例えば処方表記パターン1情報欄10201の読み取りパターンと異なる処方表記パターンを読取フォーマット欄1012に格納するものとする。これにより、同一処方箋パターンに対し、複数の処方表記パターンが存在する場合にも対処可能とする。
このように格納した情報は、以下のような処方格納表記を有していることを示している。例えば処方表記パターン1情報欄10201の処方箋パターンAの処方表記パターンとして、(「薬剤/[力価]/分量/[補足]/用法/日数」)+」という情報を格納するが、「薬剤」は、最初に記載される項目が薬剤名であることを示し、「/」という情報は、項目の区切りを示すが以下同様とする。次に、「[力価]」は、次の項目が力価内容であることを示すが、力価を囲む「[]」は、この項目が省略可能であることを示す。なお、省略可能であるかどかは、例えば同じ処方箋パターンAでありながら、例えば力価という項目が省略されている処方箋を読み取ったあり、あるいは前記関連機関システムへ問い合わせることにより判定してもかまわない。以下同様に、分量、[補足]、用法、日数についても、それぞれの項目内容と省略可能かどうかを示すものとする。さらに、表記パターンの項目の先頭と末尾に記載する「()」という情報は、()に挟まれた各項目が一連の処方であることを示し、「+」は、()に挟まれた各項目が繰り返されることを意味する。次に、例えば処方表記パターン2情報欄10202の処方箋パターンBの処方表記パターンの、(「薬剤//分量/・・・」という情報は、最初の「薬剤」は前記同様薬剤名であることを示し、「/」という情報は、項目の区切りを示すが、次に記載される「//」は、該当パターンにおいては、この項目が常に省略されることを示している。なお、常に省略されるかどかは、例えば同じ処方箋パターンBでありながら、該当する項目が常に省略されているか、あるいは前記関連機関システムへ問い合わせることにより判定してもかまわない。以下処方箋パターンAと同様に、他の処方箋パターンに関しても表記パターンを示すものとする。また、処方表記パターンは、従来の処方パターンにおける処方表記パターンに準拠しないパターンを読み取った場合には、その都度処方表記パターン一覧100に追加するものとする。なお、前記各処理は、例えば営業店システム30上に展開されたプログラムに従って、営業店装置プロセッサ32等で処理し、その結果を例えばネットワーク10を介して、管理システム20へ送信してもかまわない。また、同様な処理を、管理システム20で行っても、かまわない。さらに、その結果を、例えばネットワーク10を介して、営業店システム30へ送信してもかまわない。その他、処方表記パターン一覧100の詳細等に関しては、例えば罫線情報データテーブル50、処方箋閉領域情報データテーブル60、処方箋パターンデータテーブル70、処方箋読取情報データテーブル80に準ずるものとする。このように、処方表記パターンに関し、図10の処方表記パターン一覧100に従って説明を行ったが、実際の処方箋読み取り処理においては、まず読み取った処方箋処方箋パターンのどれに合致するか照合し、合致する処方箋パターンが見つかった場合には、同一処方箋パターンに複数の処方表記パターンが存在するかどうか、例えば処方表記パターン一覧100の内容を精査し、例えば1つの処方表記パターンが登録されていれば、その読み取りフォーマットに従って、処方の詳細を読み取ものとする。また、複数の処方表記パターンが存在する場合には、複数の処方表記パターンのどれに合致するか、照合するものとする。なお、このような照合は、例えば登録されている処方に関する読み取りフォーマットの全体の項目数により把握する、あるいは「[]」で示される省略可能項目の出現する場所を照合して判断しても、かまわない。さらに、例えば図4に示す処方箋例図40の医療機関情報欄46別に、処方箋パターンと処方表記パターンとの組合せを一覧表(図示せず)によって管理し、この情報に基づいて、処方の項目を読み取るものとする。また、対応する処方表記パターンが多数となる等の理由から、前記処方表記パターン一覧100を参照することで、処理速度が落ちる等不具合のある場合には、前記処方表記パターン一覧100を参照する処理を行わなくともかまわない、あるいは、新規の処方表記パターンを読み取った場合でも、例えば操作者の判断により、新規登録の処理を行わなくてもよい。
以上、本願における、図4に示す処方箋例図40の罫線情報から閉領域を自動認識し、各閉領域の位置関係と閉領域内の文字列のOCR認識によって、各閉領域が処方箋のどの欄にあたるかを自動的に抽出する方法について説明し、次に、図9に示すように、処方欄を切り出した画像を取得し、OCR認識を行う方法について説明した。なお本願では、薬剤名や用法等を正確にOCR認識することが可能であるが、システム的にはさらに、薬剤名や用法等について前記関連機関システムへ問い合わせることにより、より的確な判定を可能とする。このように処方箋を読み取った結果は、最終的に読み取った処方箋と同様な形式により表示する。表示は、例えば処方箋例図40に示した、処方箋の例示と同様な形式によるものとする。ただし、前記最終的に読み取った情報は、処方箋の主要情報を、例えば罫線、手書き文字、印刷文字情報を含め、デジタル情報として認識した結果に従っている。なお、前記デジタル情報として認識した結果に従った画像と、前記の通り営業店装置プロセッサ32等により制御される営業店入力装置34に接続された例えばスキャナ(図示せず)により処方箋を読み取り、読み取った情報(図示せず)を、例えば営業店装置メモリ31に格納した処方箋のナマ画像とを、例えば、営業店システム30の営業店装置インターフェース36に接続されたディスプレイ(図示せず)等に、並列して表示し、例えば操作者により、両者を比較して精査し、もしデジタル情報に間違い等があった場合には、修正を行うものとし、修正内容に関する情報を別途データテーブル(図示せず)として例えば営業店装置メモリ31に格納する。また、前記修正に関しては、前記処方箋のナマ画像の読み取り後、前記デジタル情報として認識する処理がすべて終了する以前においても修正対応可能としてもよい。また、例えば操作者により修正が行われた場合には、関連する、例えば、処方箋例図40、罫線情報データテーブル50、処方箋閉領域情報データテーブル60、処方箋パターンデータテーブル70、処方箋読取情報データテーブル80、処方表記パターン一覧100等の変更、追加等の処理を行ってもかまわない。さらに、例えば、ある営業店システムにおいて、取り扱う処方箋が限られた医療機関等に限定され、処方箋パターン、処方バターンも限られる場合には、例えば医療機関名と、該当する医療機関が発行する処方箋の処方箋パターンと処方パターンとの対応をデータテーブル(図示せず)にまとめ、例えば処方箋に記載された医療機関名を最初にOCR等により読み取って認識するか、あるいは操作者により、医療機関名等を、例えば営業店システム30の営業店入力装置34のキーボード等から入力することにより、まず特定の処方箋パターンおよび処方パターンによる処方箋であるとして読み取り処理を行ってもかまわない。なお、前記に示す並列表示および修正関する各処理は、例えば営業店システム30上に展開されたプログラムに従って、営業店装置プロセッサ32等で処理し、その結果を例えばネットワーク10を介して、管理システム20へ送信してもかまわない。また、同様な処理を、管理システム20で行っても、かまわない。さらに、その結果を、例えばネットワーク10を介して、営業店システム30へ送信してもかまわない。
次に、本願における処方箋認識システム処理概要図110について、図11に従って説明する。処方箋認識システム処理概要図110は、FGS111、フォーム情報112、FES113、HWS114、ARS115、HCS116から構成される。以下、処方箋認識システム処理概要図110に従ってFGS111、FES113の構成とFGS111の処理内容について説明する。
初めにFGS113の処理内容について説明する。FGSは、以下の三つの処理からなるが、まず、新規処方箋読み取りに関し、新規画面ファイル入力待ち1111とフォーム情報読み込み・更新1112を行い、次にフォーム情報とのマッチング1113を行う。
以下、
0.傾き補正11131により、傾き補正処理を行う
1.画像的特徴の抽出11132により、画像的特徴の抽出・比較:画像から、画像的な特徴を抽出し、既知のフォームの特徴と比較する。
2.フォーム情報の抽出11133により、画像から、罫線・活字等を認識し、FES113の編集データの元となるデータを作成する。
次に、各々の処理フロー・考慮事項について示す。
0.傾き補正
この処理は前処理として行う。全ての画像について行うことになるため、できるかぎり処理を軽量化する。本願の処理による傾き補正のために抽出した水平線部の例を、処方箋に対する適用例ではないが、図12に示す。
<水平線の抽出>
処理内容は次の通りである。
・枠線等の線分は、画像背景よりもずっと暗いと仮定し、水平方向に暗い画素を探索する。
・暗い画素が水平方向に一定数以上連続している部分を、水平の線分と仮定し、その始端座標を取得する。
次に、図13に示すように、枠線1301の始端座標1303から、線分1302(図示せず)の角度を変えた線分13021〜13023上の画素値の合計を繰り返し取得し、枠線1301と線分13021〜13023の重ならない画素値の合計が最も小さく(暗く)なったときの角度を記録する。
このような処理を複数の水平線分について行い、算出された角度群の中央値を正しい角度とする。処理が比較的軽量となる利点がある。ただし、枠線1401の線幅に対し、線分14021〜14022の幅が細い場合、正しい角度が求められない場合がある。この模様を図14に示す。対策としては、枠線の線幅を検出し、線分1402(図示せず)の形状を変更する。
上記の代替案として、次の技術思想がある。
<分散を利用する(処方箋に対する適用例はないが、図15、図16に技術的思想の概要を示す。)>
処理内容としては、水平方向の画素値の合計を各行ごとに計算する。罫線は暗いため、傾きがあるときは、起伏が少ない。
この場合、
・各行の画素値の合計を要素として、水平な画像では、各行の画素値の合計の起伏が大きくなると仮定して、隣接する水平画素合計値について二乗距離を計算する。
・画像を微小に回転させて、上記の処理を繰り返し、二乗距離が最大となる角度を正しい角度とする。
ということを行う。こうすることで、横書きの文字列についても同様の傾向が出るため、罫線のないような文書画像にも適用可能となるという利点を生ずる。処理が重いという課題もある。大きな傾きの補正をする場合には処理時間が大きくなるため、非常に傾いているような画像については対応せず、FES113でオペレーターが補正し、再度FGS111に送るものとする。
出願人において実験した限りでは、正しくスキャンした場合は、傾きは1°以内に収まる。
<画像的特徴の抽出・比較>
比較処理を軽量化するために、複数の画像的特徴を取得する。
1−1.候補絞り込み用画像特徴
既知フォーム全てとマッチング処理をすると、非常に処理時間が大きくなることが予想されるため、対象候補の既知フォームを絞り込むために使用する。
・位置合わせ用画像特徴、マッチング用特徴から抽出可能な値(平均値、分散等)
・ドキュメントの縦横比
・水平成分、垂直成分の割合
・格子点の数
絞込みの特徴の抽出に時間がかかると、元も子もないため、どの程度まで絞り込めば十分かを検証して決定する。
1‐2.位置合わせ用画像特徴(処方箋に対する適用例はないが、図17に技術的思想の概要を示す。)
マッチングの前処理として、既知フォームの特徴抽出に用いた画像と、入力画像とのマッチング用特徴量算出の位置を合わせるために使用する。
・各行の水平方向の画素合計値
・各列の垂直方向の画素合計値
1−3.マッチング用画像特徴
既知フォームと現在のフォームとを比較するために使用する。比較対象の既知フォームごとに、位置合わせを行い、生成しなおすことになる。FES113処理時に、一致したとされる既知フォーム上で、似ていない部分がどこにあるかを視覚的に表示できるような比較結果を残せる特徴の取り方をするため、以下のような手順で処理を行う。
まず、既知フォームのマッチング用画像特徴は、FES113でのフォーム登録時、画像をX軸1801、Y軸1802について一定数で自動的に分割、手書き領域1803〜1805を除いた、各分割領域での画像特徴を抽出して登録しておく。(図18参照)
次に、入力画像に対して、位置合わせ用画像特徴を用いて、比較対象の既知フォームのマッチング用特徴と合うように分割領域を調整する。分割領域が一定以上、ずれている(1901)か、歪んでいる場合は、NGとし、比較対象を次の既知フォームへ移す。最後に、各分割領域のマッチング用画像特徴を取得し、比較する。(図19参照)
この結果、以下のようにマッチング結果は、例えば画面表示される。
・正しいフォームと比較した場合:前記マッチング用画像特徴が異なる前記各分割領域が少数表示される。
・異なるフォームと比較した場合:前記マッチング用画像特徴が異なる前記各分割領域が多数表示される。
なお、各分割領域の表示は、例えば認識しやすい色により、一目に認識できるようにする。
上のようにフォーム認識失敗時や、類似のフォームの際、目で確認すべき部分が直感的にわかるようにする。マッチング用の画像特徴については、以下の二通りの処理から選択して処理するものとする。
・RGB各色の平均値
・エッジ(隣接画素間の輝度差)のパターン
すなわち、システムで、手書き領域内の情報のみを取得すればいいケースでは、活字・罫線情報を必要としないため、FES113での入力も行われない。その場合、FES113の確認画面表示時に重畳表示するデータが無くなってしまう。それを避けるため、既知フォームの登録に使用した画像については、確認・重畳表示用に残して置くこととする。
以上、処方箋を例に説明したが、本願は、処方箋に書かれた文字を正確に認識することを可能にするものであるため、医科、歯科のみならず、処方箋以外の、例えば、商取取引、公的文書等、定型フォームに文字入力されたものを用いるあらゆる産業において、利用可能性を有する。

Claims (10)

  1. 帳票を含む一定形式の書類の罫線及び/もしくは枠情報を認識し、該認識された罫線及び/もしくは枠情報に係る領域を、傾き補正処理を行った上で確定する領域確定部と、
    前記領域確定部によって確定された領域のうちの特定の領域について、該領域内の文字を撮像してデジタル情報に還元し、前記還元されたデジタル情報にマッチする文字情報をデジタル情報―文字情報対応データベースから抽出して対応文字情報を得る領域内文字認識部と、
    前記領域内文字認識部によって得られる文字情報のうち項目名情報と推定される情報に係る属性を推定及び/もしくは規定し、属性と該属性に属すことが想定可能な項目情報の一覧とを対応させた属性―属性内可能項目データベースから前記推定及び/もしくは規定された属性に対応する属性―属性内可能項目データベースを選定する属性対応項目選定部と、
    前記領域内文字認識部によって得られる文字情報のうち項目名情報と推定される情報に係る以外の文字情報について、前記属性対応項目選定部によって選定された属性―属性内可能項目データベース内に格納された項目情報のうち類似度の高いものを選定する類似項目選定部と、
    前記類似項目選定部で選定された前記類似度の高い項目情報の妥当性を検証して前記文字情報に対応する情報を確定する文字情報確定部と、
    前記領域確定部と前記領域内文字認識部と前記属性対応項目選定部と前記類似項目選定部と前記文字情報確定部とにより認識した帳票の書式に関し、
    認識した帳票パターンと処方表記パターンとを変更させるための手段と、
    同一の帳票パターンに対し複数の処方表記パターンを対応付ける手段と、
    前記対応付けた結果に関する情報を第1の記憶として格納する手段と、
    前記第1の記憶として格納した情報を表示する手段と
    を備えることを特徴とする帳票認識装置。
  2. 帳票を含む一定形式の書類の罫線及び/もしくは枠情報を認識する枠線認識装置と、
    前記枠線認識装置によって認識された罫線及び/もしくは枠情報に係る領域を、傾き補正処理を行った上で確定する領域確定手段と、
    前記領域確定手段によって確定された領域のうちの特定の領域について、該領域内の文字を撮像してデジタル情報に還元し、前記還元されたデジタル情報にマッチする文字情報をデジタル情報―文字情報対応データベースから抽出して対応文字情報を得る領域内文字認識手段と、
    前記領域内文字認識手段によって得られる文字情報のうち項目名情報と推定される情報に係る属性を推定及び/もしくは規定し、属性と該属性に属すことが想定可能な項目情報の一覧とを対応させた属性―属性内可能項目データベースから前記推定及び/もしくは規定された属性に対応する属性―属性内可能項目データベースを選定する属性対応項目選定手段と、
    前記領域内文字認識手段によって得られる文字情報のうち項目名情報と推定される情報に係る以外の文字情報について、前記属性対応項目選定手段によって選定された属性―属性内可能項目データベース内に格納された項目情報のうち類似度の高いものを選定する類似項目選定手段と、
    前記類似項目選定手段で選定された前記類似度の高い項目情報の妥当性を検証して前記文字情報に対応する情報を確定する文字情報確定手段と、
    前記領域確定手段と前記領域内文字認識手段と前記属性対応項目選定手段と前記類似項目選定手段と前記文字情報確定手段とにより認識した帳票の書式に関し、
    認識した帳票パターンと処方表記パターンとを変更させるための手段と、
    同一の帳票パターンに対し複数の処方表記パターンを対応付ける手段と、
    前記対応付けた結果に関する情報を第1の記憶として格納する手段と、
    前記第1の記憶として格納した情報を表示する手段と
    を備えることを特徴とする帳票認識システム。
  3. 帳票を含む一定形式の書類の罫線及び/もしくは枠情報を認識し、該認識された罫線及び/もしくは枠情報に係る領域を、傾き補正処理を行った上で確定する領域確定ステップと、
    前記確定された領域のうちの特定の領域について、該領域内の文字を撮像してデジタル情報に還元し、前記還元されたデジタル情報にマッチする文字情報をデジタル情報―文字情報対応データベースから抽出して対応文字情報を得る領域内文字認識ステップと、
    前記得られた文字情報のうち項目名情報と推定される情報に係る属性を推定及び/もしくは規定し、属性と該属性に属すことが想定可能な項目情報の一覧とを対応させた属性―属性内可能項目データベースから前記推定及び/もしくは規定された属性に対応する属性―属性内可能項目データベースを選定する属性対応項目選定ステップと、
    前記得られた文字情報のうち項目名情報と推定される情報に係る以外の文字情報について、前記属性対応項目選定ステップによって選定された属性―属性内可能項目データベース内に格納された項目情報のうち類似度の高いものを選定する類似項目選定ステップと、
    前記選定された前記類似度の高い項目情報の妥当性を検証して前記文字情報に対応する情報を確定する文字情報確定ステップと、
    前記領域確定ステップと前記領域内文字認識ステップと前記属性対応項目選定ステップと前記類似項目選定ステップと前記文字情報確定ステップとにより認識した帳票の書式に関し、
    認識した帳票パターンと処方表記パターンとを変更させるためのステップと、
    同一の帳票パターンに対し複数の処方表記パターンを対応付けるステップと、
    前記対応付けた結果に関する情報を第1の記憶として格納するステップと、
    前記第1の記憶として格納した情報を表示するステップと
    を備えることを特徴とする帳票認識方法。
  4. コンピュータを、
    帳票を含む一定形式の書類の罫線及び/もしくは枠情報を認識し、該認識された罫線及び/もしくは枠情報に係る領域を、傾き補正処理を行った上で確定する領域確定手段と、
    前記領域確定手段によって確定された領域のうちの特定の領域について、該領域内の文字を撮像してデジタル情報に還元し、前記還元されたデジタル情報にマッチする文字情報をデジタル情報―文字情報対応データベースから抽出して対応文字情報を得る領域内文字認識手段と、
    前記領域内文字認識手段によって得られる文字情報のうち項目名情報と推定される情報に係る属性を推定及び/もしくは規定し、属性と該属性に属すことが想定可能な項目情報の一覧とを対応させた属性―属性内可能項目データベースから前記推定及び/もしくは規定された属性に対応する属性―属性内可能項目データベースを選定する属性対応項目選定手段と、
    前記領域内文字認識手段によって得られる文字情報のうち項目名情報と推定される情報に係る以外の文字情報について、前記属性対応項目選定手段によって選定された属性―属性内可能項目データベース内に格納された項目情報のうち類似度の高いものを選定する類似項目選定手段と、
    前記類似項目選定手段で選定された前記類似度の高い項目情報の妥当性を検証して前記文字情報に対応する情報を確定する文字情報確定手段と、
    前記領域確定手段と前記領域内文字認識手段と前記属性対応項目選定手段と前記類似項目選定手段と前記文字情報確定手段とにより認識した帳票の書式に関し、
    認識した帳票パターンと処方表記パターンとを変更させるための手段と、
    同一の帳票パターンに対し複数の処方表記パターンを対応付ける手段と、
    前記対応付けた結果に関する情報を第1の記憶として格納する手段と、
    前記第1の記憶として格納した情報を表示する手段と
    として動作させることを特徴とする帳票認識プログラム。
  5. 請求項記載のプログラムを搭載した記録媒体。
  6. 前記領域確定部と前記領域内文字認識部と前記属性対応項目選定部と前記類似項目選定部と前記文字情報確定部とにより認識した帳票に関し、
    罫線、手書き文字および印刷文字情報をデジタル情報として認識した結果のうち少なくとも1つを表示する手段と、
    前記表示したデジタル情報を修正する手段と、
    前記修正した結果に関する情報を第2の記憶として格納する手段と、
    前記第2の記憶として格納した情報を表示する手段と
    をさらに備えることを特徴とする請求項記載の帳票認識装置。
  7. 前記領域確定手段と前記領域内文字認識手段と前記属性対応項目選定手段と前記類似項目選定手段と前記文字情報確定手段とにより認識した帳票に関し、
    罫線、手書き文字および印刷文字情報をデジタル情報として認識した結果のうち少なくとも1つを表示する手段と、
    前記表示したデジタル情報を修正する手段と、
    前記修正した結果に関する情報を第2の記憶として格納する手段と、
    前記第2の記憶として格納した情報を表示する手段と
    をさらに備えることを特徴とする請求項記載の帳票認識システム。
  8. 前記領域確定ステップと前記領域内文字認識ステップと前記属性対応項目選定ステップと前記類似項目選定ステップと前記文字情報確定ステップとにより認識した帳票に関し、
    罫線、手書き文字および印刷文字情報をデジタル情報として認識した結果のうち少なくとも1つを表示するステップと、
    前記表示したデジタル情報を修正するステップと、
    前記修正した結果に関する情報を第2の記憶として格納するステップと、
    前記第2の記憶として格納した情報を表示するステップと
    をさらに備えることを特徴とする請求項記載の帳票認識方法。
  9. コンピュータを、
    前記領域確定手段と前記領域内文字認識手段と前記属性対応項目選定手段と前記類似項目選定手段と前記文字情報確定手段とにより認識した帳票に関し、
    罫線、手書き文字および印刷文字情報をデジタル情報として認識した結果のうち少なくとも1つを表示する手段と、
    前記表示したデジタル情報を修正する手段と、
    前記修正した結果に関する情報を第2の記憶として格納する手段と、
    前記第2の記憶として格納した情報を表示する手段と
    としてさらに動作させることを備えることを特徴とする請求項記載の帳票認識プログラム。
  10. 請求項記載のプログラムを搭載した記録媒体。
JP2015192895A 2014-09-30 2015-09-30 帳票認識装置、帳票認識システム、帳票認識システムのプログラム、帳票認識システムの制御方法、帳票認識システムプログラムを搭載した記録媒体 Active JP6773400B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014201656 2014-09-30
JP2014201656 2014-09-30

Publications (2)

Publication Number Publication Date
JP2016071898A JP2016071898A (ja) 2016-05-09
JP6773400B2 true JP6773400B2 (ja) 2020-10-21

Family

ID=55867116

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015192895A Active JP6773400B2 (ja) 2014-09-30 2015-09-30 帳票認識装置、帳票認識システム、帳票認識システムのプログラム、帳票認識システムの制御方法、帳票認識システムプログラムを搭載した記録媒体

Country Status (1)

Country Link
JP (1) JP6773400B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3249560A1 (de) * 2016-05-25 2017-11-29 Pharmatechnik GmbH & Co. KG Computergestütztes verfahren und vorrichtung zur automatischen rezeptabrechnung
CN107220648B (zh) * 2017-04-11 2018-06-22 平安科技(深圳)有限公司 理赔单据的字符识别方法及服务器
JP2020154997A (ja) * 2019-03-22 2020-09-24 富士ゼロックス株式会社 情報処理装置及びプログラム
JP6870876B1 (ja) * 2020-08-24 2021-05-12 株式会社メディコンフィア 処方箋読み取りプログラムおよび処方箋読み取り装置
KR102276491B1 (ko) * 2020-09-16 2021-07-13 주식회사 스마트 잭 시약병 특징을 이용한 영상분석 시약정보 수집 방법 및 장치
JP7378830B2 (ja) 2021-06-08 2023-11-14 NeoX株式会社 処方箋二次元コード生成システム
JP7377565B2 (ja) 2022-01-05 2023-11-10 キャディ株式会社 図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2713622B2 (ja) * 1989-11-20 1998-02-16 富士通株式会社 表形式文書読取装置
JP3375766B2 (ja) * 1994-12-27 2003-02-10 松下電器産業株式会社 文字認識装置
JPH08329187A (ja) * 1995-06-06 1996-12-13 Oki Electric Ind Co Ltd 文書読取装置
JP4117648B2 (ja) * 2003-06-11 2008-07-16 農工大ティー・エル・オー株式会社 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置
JP5738559B2 (ja) * 2010-09-07 2015-06-24 株式会社プリマジェスト 保険業務処理システム及び保険業務処理方法
JP2014182477A (ja) * 2013-03-18 2014-09-29 Fuji Xerox Co Ltd プログラム及び帳票処理装置

Also Published As

Publication number Publication date
JP2016071898A (ja) 2016-05-09

Similar Documents

Publication Publication Date Title
JP6773400B2 (ja) 帳票認識装置、帳票認識システム、帳票認識システムのプログラム、帳票認識システムの制御方法、帳票認識システムプログラムを搭載した記録媒体
US8660294B2 (en) Form data extraction without customization
US8781229B2 (en) System and method for localizing data fields on structured and semi-structured forms
JP6517666B2 (ja) 物品管理装置、その方法、及びそのプログラム
CN108875737B (zh) 一种纸质处方单据中检测复选框是否勾选的方法及系统
US20070090177A1 (en) Electronic document management system, medical information system, method for printing sheet of chart paper, and sheet of chart paper
JP6859977B2 (ja) 画像処理装置、画像処理システム、画像処理方法およびプログラム
KR100570224B1 (ko) 전표정의데이터 작성방법 및 전표처리장치
CN108597565B (zh) 一种基于ocr与命名实体提取技术的临床队列数据协同校验方法
JP7437837B2 (ja) 仮想セルを用いたocrベースの文書分析システム及び方法
JP7444495B2 (ja) Ocrベース文書分析システム及び方法
EP3757881A1 (en) Documentation determination device and documentation determination program
JP2018081451A (ja) 情報処理装置およびその制御方法
KR101486495B1 (ko) 사후 광학 문자 인식 처리에서의 형상 클러스터링 기법
JP4853073B2 (ja) 帳票分類処理システム、電子媒体レセプトの作成方法および納入方法
JP2008003739A (ja) 入力修正方法、追記情報処理方法、追記情報処理装置、およびプログラム
JP6784273B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP7111143B2 (ja) 画像処理装置、画像処理方法およびプログラム
JPH09167176A (ja) 保険証入力装置および方法
JP2010204906A (ja) 帳票読取装置および帳票読取方法
US8218913B1 (en) Identifying a front page in media material
JP6028566B2 (ja) プログラム、表示制御方法及び表示制御装置
JP5757299B2 (ja) 帳票設計装置、帳票設計方法、及び、帳票設計プログラム
JP4693825B2 (ja) 情報処理装置およびプログラム
JP4318311B2 (ja) 帳票並びに帳票処理装置および帳票処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180926

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190806

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20191007

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200421

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200901

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201001

R150 Certificate of patent or registration of utility model

Ref document number: 6773400

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250