JP2016200899A - Information processing apparatus, information processing method, and program - Google Patents
Information processing apparatus, information processing method, and program Download PDFInfo
- Publication number
- JP2016200899A JP2016200899A JP2015079233A JP2015079233A JP2016200899A JP 2016200899 A JP2016200899 A JP 2016200899A JP 2015079233 A JP2015079233 A JP 2015079233A JP 2015079233 A JP2015079233 A JP 2015079233A JP 2016200899 A JP2016200899 A JP 2016200899A
- Authority
- JP
- Japan
- Prior art keywords
- document
- document image
- image
- attribute
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、情報処理装置、情報処理方法及びプログラムに関する。 The present invention relates to an information processing apparatus, an information processing method, and a program.
近年、病院等の医療機関において情報化が進み、患者の診断情報を管理する電子カルテを導入する機関が増えている。電子カルテ上には、患者の診断履歴、投薬情報、手術情報、患部画像、単純X線画像等が一元管理され、データの共有や再利用が簡単にできるようになってきている。また、近年のストレージの大容量化によって、院内で利用する文書や、CT、MRI、単純X線等のデジタル画像を大量にストレージに格納できるようになった。 In recent years, computerization has progressed in medical institutions such as hospitals, and an increasing number of institutions have introduced electronic medical records that manage patient diagnosis information. On the electronic medical record, patient diagnosis history, medication information, surgery information, affected area images, simple X-ray images, and the like are centrally managed, and data can be easily shared and reused. In addition, with the recent increase in storage capacity, documents used in the hospital and digital images such as CT, MRI, and simple X-rays can be stored in large amounts in the storage.
しかしながら、電子カルテ等基幹システムが電子化されている病院においてもなお院内には紙文書が存在している。このような病院においては、生成される紙文書のうち保存が必要なものは電子化し、文書種別や患者情報を属性値として付与して文書管理システムや電子カルテで保存するという運用をしている。中規模以上の病院では、一日に数千枚の紙文書スキャンが発生することもあり、紙文書を電子化するための人員を割いていることも珍しくない。 However, even in hospitals where the core system such as electronic medical records is digitized, paper documents still exist in the hospital. In such hospitals, generated paper documents that need to be stored are digitized, and document types and patient information are assigned as attribute values and stored in a document management system or electronic medical record. . In hospitals of medium or larger scale, thousands of paper document scans may occur every day, and it is not uncommon to have personnel to digitize paper documents.
このような紙文書のスキャン読み取り作業を支援する試みとして、特許文献1には、スキャンにより得られた文書画像から文字認識により文書タイトル等を抽出してユーザに提示し、目視確認及び修正の上、登録する技術が開示されている。また、特許文献2には、1次元バーコードや2次元コードを用いて紙文書に文書種別や患者情報を印字し、スキャンにより得られた文書画像からバーコードを読み取って文書種別や患者情報を復元する技術が開示されている。
As an attempt to support such a scan reading operation of a paper document,
しかしながら、文字認識をベースとする方法では、文書によっては十分な認識精度が得られないという問題がある。また、紙文書にQRコード(登録商標)を印字する方法は文字認識に比べ認識精度で有利であるが、スキャン読み取り対象の情報を紙文書に印字する装置を備えている必要がある。このため、印字のための装置を備えていない病院や診療所から発行された紙文書に対応できない。また、QRコードの読み取りに失敗する可能性もある。 However, a method based on character recognition has a problem that sufficient recognition accuracy cannot be obtained depending on a document. In addition, a method of printing a QR code (registered trademark) on a paper document is more advantageous in recognition accuracy than character recognition, but it is necessary to have a device for printing information to be scanned and read on a paper document. For this reason, it is not possible to deal with paper documents issued from hospitals or clinics that do not have a printing device. In addition, there is a possibility that reading the QR code may fail.
文書画像の認識処理を利用しつつ、文書画像の正しい属性値を推定することを目的とする。 An object is to estimate a correct attribute value of a document image while using a document image recognition process.
そこで、本発明は、情報処理装置であって、文書画像群に属する複数の文書画像それぞれに対する認識処理により、前記文書画像の属性値を抽出する認識手段と、認識条件にしたがい認識処理に成功したか否かを判定する結果判定手段と、前記文書画像の文書タイプを特定する文書タイプ特定手段と、前記文書画像群に属する前記文書画像の中から、前記認識処理に成功したと判定され、かつ特定された文書タイプが参照タイプの前記文書画像を参照画像として特定する参照画像特定手段と、前記参照画像特定手段により特定された前記文書画像の前記属性値に基づいて、前記認識処理に失敗したと判定された前記文書画像の前記属性値を推定する推定手段とを有することを特徴とする。 Therefore, the present invention is an information processing apparatus, and by recognition processing for each of a plurality of document images belonging to a document image group, the recognition means for extracting the attribute value of the document image and the recognition processing succeeded according to the recognition conditions. A result determination unit that determines whether or not, a document type identification unit that identifies a document type of the document image, a determination that the recognition process has been successful from the document images belonging to the document image group, and Based on the attribute value of the document image specified by the reference image specifying means for specifying the document image whose reference type is the reference type as the reference image, the recognition processing has failed. And estimating means for estimating the attribute value of the document image determined as.
本発明によれば、文書画像の正しい属性値を推定することができる。 According to the present invention, a correct attribute value of a document image can be estimated.
以下、本発明の実施形態について図面に基づいて説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
(第1の実施形態)
図1は、第1の実施形態に係る文書管理システム100を示す図である。文書管理システム100は、紙媒体から文書画像を生成し、文書画像内に示された属性値を抽出し、文書画像と属性値とを紐付けて登録、管理する。文書管理システム100は、読取装置110と、情報処理装置の一例としてのサーバ装置120と、クライアント装置130とを有しており、これらの装置は、有線又は無線のネットワーク140を介して通信接続されている。なお、本実施形態においては、文書管理システム100が、医療文書を示す文書画像を管理する場合を例に説明する。
(First embodiment)
FIG. 1 is a diagram illustrating a
読取装置110は、紙文書をスキャンして文書画像を生成する。読取装置110は、例えば、オートドキュメントフィーダ(以下ADF)という自動給紙機構を備えたスキャナ装置である。また、他の例としては、読取装置110は、紙文書を撮影するデジタルカメラであってもよい。読取装置110は、文書画像生成部111と送受信部112とを有している。文書画像生成部111は、入力された紙文書を電子的に読み取り(スキャンし)、1枚の紙文書から1つの文書画像を生成する。送受信部112は、ネットワーク140を介して、外部装置とデータの送受信を行う。ユーザによって読取装置110に複数の紙原稿がセットされると、紙原稿は1ページずつ不図示のスキャナ部に送られる。そして、文書画像生成部111は、スキャナ部の画像読取処理の結果に基づいて、複数の紙原稿それぞれに対する、複数の文書画像を生成する。なお、本実施形態においては、複数の紙文書からなる紙文書群がまとめてスキャンされ、これに対応して、複数の文書画像を含む文書画像群が生成されるものとする。文書画像群は、送受信部112によりサーバ装置120に送信される。
The
サーバ装置120は、読取装置110により生成された文書画像を登録、管理する。サーバ装置120は、送受信部121と、属性値抽出部122と、属性パターン特定部123と、属性値推定部124と、画像管理部125と、修正管理部126と、参照タイプテーブル生成部127と、を有している。送受信部121は、ネットワーク140を介して、外部装置とデータの送受信を行う。送受信部121は、例えば読取装置110から文書画像群を受信する。属性値抽出部122は、文書画像群に含まれる各文書画像から認識技術を用いて文字やバーコードで表された属性値を抽出する。属性パターン特定部123は、文書画像群の属性パターンを特定する。属性パターンは、文書画像群に含まれる複数の文書画像が示す属性値に関する特徴を示す情報である。属性値推定部124は、属性パターンに基づいて、文書画像群の属性値を推定する。画像管理部125は、文書画像の登録、管理を行う。修正管理部126は、属性値抽出部122により得られた属性値の修正等を行い、修正処理に係る履歴情報を記録する。参照タイプテーブル生成部127は、修正処理に係る履歴情報に基づいて、参照タイプテーブルを生成する。なお、参照タイプテーブル、及び参照タイプテーブルを生成する処理については、後述する。
The
クライアント装置130は、読取装置110により生成された文書画像や、文書画像の属性値をユーザがチェックするための手段を提供する。クライアント装置130は、表示処理部131と、指示受付部132と、送受信部133と、を有している。表示処理部131は、文書画像等を表示画面に表示する。指示受付部132は、ユーザから入力された指示を受け付ける。送受信部133は、ネットワーク140を介して、外部装置とデータの送受信を行う。なお、文書管理システム100の構成は、本実施形態に限定されるものではない。他の例としては、サーバ装置120とクライアント装置130は、一体に設けられていてもよい。
The
図2は、サーバ装置120のハードウェア構成を示す図である。サーバ装置120は、CPU201と、ROM202と、RAM203と、HDD204と、表示部205と、入力部206と、ネットワークI/F部207とを有している。CPU201は、ROM202に記憶された制御プログラムを読み出して各種処理を実行する。RAM203は、CPU201の主メモリ、ワークエリア等の一時記憶領域として用いられる。HDD204は、画像データや各種プログラム等各種情報を記憶する。なお、後述するサーバ装置120の機能や処理は、CPU201がROM202又はHDD204に格納されているプログラムを読み出し、このプログラムを実行することにより実現されるものである。
FIG. 2 is a diagram illustrating a hardware configuration of the
表示部205は、各種情報を表示する。入力部206は、キーボードやマウスを有し、ユーザによる各種操作を受け付ける。ネットワークI/F部207は、ネットワークを介して画像形成装置等の外部装置との通信処理を行う。なお、読取装置110、クライアント装置130のハードウェア構成は、図2を参照しつつ説明したサーバ装置120のハードウェア構成とほぼ同様である。但し、読取装置110は、文書画像を電子的に読み取るスキャナ部をさらに備えているものとする。
The
図3は、サーバ装置120による文書画像登録処理を示すフローチャートである。文書画像登録処理は、読取装置110から受信した文書画像群に含まれる文書画像を登録する処理である。なお、本実施形態においては、読取装置110が医療文書を入力原稿として、医療文書に対応する文書画像を生成し、一連のスキャン動作により得られた複数の文書画像を文書画像群としてサーバ装置120に送信するものとする。文書画像登録処理において、サーバ装置120は、文字認識技術により文書画像から文書種別、患者識別情報(患者ID)としての患者名、診療科識別情報(診療科ID)としての診療科名の属性値を抽出する。そして、サーバ装置120は、抽出した属性値をユーザが目視確認した上で文書画像と属性値とを対応付けて登録する。なお、文書種別、患者名(患者ID)、診療科名(診療科ID)を属性種別、各属性種別の値を属性値と称することとする。なお、各属性値は、英数字等を組み合わせてユニークに採番した文字列であってもよい。
FIG. 3 is a flowchart showing document image registration processing by the
以下、図3を参照しつつ、文書画像登録処理の概略について説明し、各処理の詳細については後述する。S301において、送受信部121は、ネットワーク140を介して読取装置110から文書画像群を受信する。S301において受信した文書画像群を処理対象として、以下の処理が行われる。すなわち、S301に続いて、S302において、属性値抽出部122は、S301において受信した文書画像群に含まれる複数の文書画像それぞれに対し、文字認識処理を行うことにより、文書画像の属性値を抽出する。本実施形態においては、属性値抽出部122は、文書種別、患者ID及び診療科名の属性値を抽出する。
Hereinafter, the outline of the document image registration process will be described with reference to FIG. 3, and details of each process will be described later. In step S <b> 301, the transmission /
次に、S303において、属性パターン特定部123は、ステップS301において受信した文書画像群の属性パターンを特定する。次に、S304において、属性値推定部124は、属性値抽出処理(S302)において得られた属性値に基づいて、認識処理に失敗したと判定された文書画像を含む、文書画像群の一部の文書画像に対し、属性値抽出結果よりも正確な属性値を推定する。
In step S303, the attribute
S304の処理が完了すると、送受信部121は、処理対象の文書画像と、抽出された属性値及び推定された属性値をクライアント装置130に送信する。この処理は、認識結果及び推定結果を出力する出力処理の一例である。クライアント装置130では、表示処理部131が、文書画像と属性値とを表示部205に表示する。ユーザは、表示内容を確認し、適宜、推定された属性値に対する修正指示を入力し、また文書画像の登録指示を入力する。指示受付部132が修正指示を受け付けると、送受信部133は、サーバ装置120に修正指示を送信する。また、指示受付部132が登録指示を受け付けると、送受信部133は、サーバ装置120に登録指示を送信する。
When the process of S304 is completed, the transmission /
S305において、修正管理部126は、送受信部121がクライアント装置130から修正指示を受信したか否かを判定する。修正管理部126は、修正指示を受け付けた場合には(S305でYes)、処理をS306へ進める。修正管理部126は、修正指示を受け付けなかった場合には(S305でNo)、処理をS307へ進める。S306において、修正管理部126は、修正指示に従い、属性値を修正する。次に、S307において、画像管理部125は、送受信部121が登録指示を受信したか否かを判定する。画像管理部125は、登録指示を受信した場合には(S307でYes)、処理をS308へ進める。画像管理部125は、登録指示を受信しなかった場合には(S307でNo)、処理をS305へ進める。
In step S <b> 305, the
S308において、修正管理部126は、修正履歴を記録する。なお、修正が行われなかった場合には、修正がなかったことを示す情報を修正履歴として記録する。次に、S309において、画像管理部125は、文書画像を属性値に対応付けて、HDD204等の記憶部に登録する。以上で、文書登録処理が完了する。
In S308, the
以上のように、本実施形態に係る文書管理システム100は、スキャンした文書から認識処理により抽出した属性値だけでなく、抽出した属性値から推定した属性値をユーザに提示することができる。そして、文書管理システム100は、ユーザが目視確認し、正しい属性値に修正した上で、文書画像に正しい属性値を付与して登録することができる。
As described above, the
図4は、図3を参照しつつ説明した属性値抽出処理(S302)における詳細な処理を示すフローチャートである。属性値抽出処理において、属性値抽出部122は、文書種別、患者ID及び診療科IDを文字認識により抽出し、抽出元の文書画像と、属性値とを対応付ける。図4に示す処理は、1つの属性値に対する属性値抽出処理であり、属性値抽出部122は、抽出すべき属性値の数だけ、属性値抽出処理を実行することにより、上記3つの属性値を抽出し、3つの属性値を抽出元の1つの文書画像に対応付ける。
FIG. 4 is a flowchart showing detailed processing in the attribute value extraction processing (S302) described with reference to FIG. In the attribute value extraction process, the attribute
S401において、属性値抽出部122は、処理対象の文書画像群から1つの文書画像を処理対象として選択する。次に、S402において、属性値抽出部122は、抽出対象の属性値が含まれる可能性が高い領域を属性領域として抽出する。属性領域を抽出する処理には、既知の文書レイアウト解析技術や文字認識技術を利用することができる。例えば、文書種別についは、一般に文書タイトル(文書種別)は文書の上部にあり本文よりもフォントサイズが大きいという知識を利用することができる。すなわち、属性値抽出部122は、文書レイアウト解析により文書画像内の文字領域の塊を文字矩形として抽出し、抽出された文字矩形の座標値やサイズから文書タイトルらしさを計算して属性領域を抽出する。また、患者名や診療科名は、それらが記載されていることを示すラベル「患者名:」「診療科名:」等の直後に記載されている可能性が高いという知識を利用することができる。すなわち、属性値抽出部122は、文書内から文字認識により上記のラベルを抽出し、直後に出現する文字矩形領域を属性領域として抽出すればよい。
In step S401, the attribute
次に、S403において、属性値抽出部122は、属性領域が抽出されたか否かの判定を行う。属性値抽出部122は、属性領域が抽出できた場合には(S403でYes)、処理をS406へ進める。属性値抽出部122は、属性領域が抽出できなかった場合には(S403でNo)、処理をS404へ進める。S404において、属性値抽出部122は、認識処理に失敗したと判定する。次に、S405において、属性値抽出部122は、処理対象の文書画像の属性種別に対して属性値「Unknown」を設定する。例えば、患者IDを処理対象としている場合には、属性値抽出部122は、文書画像の患者IDの属性種別に対して、属性値「Unknown」を設定する。
Next, in S403, the attribute
一方、S406において、属性値抽出部122は、属性領域の文字列矩形画像に対して文字認識処理により、文字列情報を生成する。ここで、文字列情報は属性値であり、S406の処理は、文書画像群に属する複数の文書画像それぞれに対する認識処理により、文書画像の属性値を抽出する認識処理の一例である。次に、S407において、属性値抽出部122は、抽出した文字列情報が抽出対象の属性種別に対して定められた特徴条件を満たすか否かを判定する。ここで、特徴条件とは、抽出された文字列が辞書に登録されていることである。ここで、辞書は、特徴的に出現する文字列が登録されたものであり、サーバ装置120のHDD204等に予め記憶されているものとする。属性値抽出部122は、S406において抽出された文字列情報と辞書に登録された登録文字列との間で部分文字列マッチングを行い、マッチング結果に応じて、特徴条件を満たすか否かを判定する。
On the other hand, in S <b> 406, the attribute
例えば、文書種別の例では、辞書に、「問診票」、「同意書」、「説明書」、「診療情報提供書」等医療文書のタイトルに頻出する単語が予め登録されているものとする。そして、属性値抽出部122は、文字列情報に辞書に登録されている単語が存在する場合に、特徴条件を満たすと判定し、存在しない場合に特徴条件を満たさないと判定する。また、診療科IDの例では、辞書に、「脳神経外科」、「整形外科」、「呼吸器内科」、「循環器内科」、「眼科」、「皮膚科」等の病院の診療科名が頻出する単語として登録されているものとする。
For example, in the document type example, it is assumed that words frequently appearing in the titles of medical documents such as “inquiry form”, “consent form”, “instructions”, “medical information provision form” are registered in the dictionary in advance. . The attribute
また、他の例としては、属性値抽出部122は、文字列情報が、抽出対象の属性種別が示す文字数や文字の種類等の特徴条件を満たすか否かを判定してもよい。また、属性種別として数値やアルファベットを用いた患者IDを利用する場合には、適用先の病院の患者IDの文字種(数値、アルファベット)や文字数のパターンを特徴条件として予め登録しておいてもよい。
As another example, the attribute
次に、S408において、属性値抽出部122は、文字列情報が特徴条件を満たす場合には(S408でYes)、処理をS409へ進める。属性値抽出部122は、文字列情報が特徴条件を満たさない場合には(S408でNo)、処理をS404へ進める。S409において、属性値抽出部122は、認識処理に成功したと判定する。次に、S410において、文字列情報を処理対象の文書画像の属性種別に対する属性値として設定する。次に、S411において、属性値抽出部122は、処理対象の文書画像群に含まれるすべての文書画像に対し、S401〜S410の処理を行ったか否かを判定する。属性値抽出部122は、すべての文書画像に対する処理が終了している場合には(S411でYes)、属性値抽出処理を終了する。属性値抽出部122は、未処理の文書画像が存在する場合には(S411でNo)、処理をS401へ進める。このように、属性値抽出部122は、属性領域が存在すること(S403)、認識により得られた文字列情報が特徴条件を満たすこと(S408)を認識条件として、認識条件に従い認識処理に成功したか否かを判定する。すなわち、S403、S408、S404、S409の処理は、認識条件に従い認識処理に成功したか否かを判定する結果判定処理の一例である。
Next, in S408, the attribute
図5は、図3を参照しつつ説明した属性パターン判定処理(S303)において判定される属性パターンの説明図である。図5(a)に示すように、病棟等では、患者毎に文書管理される場合が多い。例えば、患者フォルダ500には、病棟に入院している患者に対応する医療文書が患者毎にファイリングされて管理されている。このようなケースにおいては、患者フォルダ500に入れられた紙文書群がADFを利用した連続スキャンにより、一括して電子化されることが多い。これにより、紙文書群に対応する文書画像群501が得られる。502は、文書画像群501の各文書画像の属性値である。例えば、文書画像群501に含まれる文書画像510の、文書種別の属性値は「紹介状」511であり、患者IDの属性値は「山田太郎」512であり、診療科IDの属性値は「耳鼻科」513である。図5(a)に示すように、患者フォルダ500の紙文書群から得られた文書画像群501においては、患者IDの属性種別に対し、同一の属性値が連続して出現する傾向がある。
FIG. 5 is an explanatory diagram of attribute patterns determined in the attribute pattern determination process (S303) described with reference to FIG. As shown in FIG. 5A, documents are often managed for each patient in a ward or the like. For example, in the
また、図5(b)に示すように、病院内の受付等では、文書種別毎に文書管理される場合が多い。例えば、問診票トレイ520には、受付で複数の患者により記入された問診票がすべて管理されている。このようなケースにおいては、問診票トレイ520に入れられた紙文書群に対応する文書画像群521において、文書種別の同一の属性値が連続して出現する傾向がある。また、図5(c)に示すように、病院内の各診療科等では、特定の診療科名の医療文書が管理される場合が多い。例えば、耳鼻科の診療科トレイ530には、耳鼻科内で利用する紙文書が管理されている。このようなケースにおいては、診療科トレイ530に入れられた紙文書群に対応する文書画像群531において、診療科IDの同一の属性値が連続して出現する傾向がある。
Further, as shown in FIG. 5B, in the hospital reception or the like, there are many cases where documents are managed for each document type. For example, in the
このように、文書画像群に属する複数の文書画像の属性値はランダムではなく、スキャン順に相当する配列順において一定の傾向を示すものである。本実施形態に係る属性パターン特定部123は、処理対象の文書画像が患者ID連続パターン、文書種別連続パターン、診療科ID連続パターンの3つの属性パターンのいずれかを判定する。ここで、患者ID連続パターンは、図5(a)を参照しつつ説明したように患者IDの同一属性値が連続するパターンである。文書種別連続パターンは、図5(b)を参照しつつ説明したように、文書種別の同一属性値が連続するパターンである。診療科ID連続パターンは、図5(c)を参照しつつ説明したように、診療科IDの同一属性値が連続するパターンである。
As described above, the attribute values of a plurality of document images belonging to the document image group are not random, and show a certain tendency in the arrangement order corresponding to the scan order. The attribute
図6は、図3を参照しつつ説明した属性パターン判定処理(S303)における詳細な処理を示すフローチャートである。ここでは、図7(a)に示すスキャンジョブJ1の文書画像群700の文書画像dI(t1)〜dI(t8)を処理対象とする場合を例に説明する。なお、処理対象の文書画像群700に含まれる複数の文書画像は、スキャンによる生成順に対応した配列順に並んでいるものとする。図7(a)には、説明の便宜上、文書画像の属性値のうち、属性種別「患者ID」の属性値のみを示している。
FIG. 6 is a flowchart showing detailed processing in the attribute pattern determination processing (S303) described with reference to FIG. Here, a case where the document images dI (t1) to dI (t8) of the
S601において、属性パターン特定部123は、属性種別を設定し、処理対象の文書画像群中の文書画像の、設定された属性種別に対応する属性値を処理対象として特定する。以下、患者IDの属性種別が設定された場合を例に説明する。この場合、図7(a)の例においては、属性種別「患者ID」(att_P)とその属性値とが処理対象として特定される。
In step S601, the attribute
次に、S602において、属性パターン特定部123は、処理対象の複数の文書画像の配列順において、S601において設定された属性種別の同一の属性値が連続する確率、即ち連続確率を算出する。具体的には、属性パターン特定部123は、(式1)により連続確率を算出する。また、f(X、Y)は、次式により算出される。
図7を参照しつつ、連続確率算出処理(S602)について具体的に説明する。図7(a)は、連続入力されたスキャンジョブJ1から得られた文書画像群700を示す図である。文書画像群700の各文書画像は、同一スキャンジョブ内で読み取られた順に管理される。このスキャン順を文書画像の配列順とする。文書画像群700の配列順を、1番目から順に、dI(t1)、dI(t2)、・・・、dI(tn)で表す。また、701には、各文書画像の患者IDを示す属性att_Pを示している。文書画像dI(tn)に対応する属性値をatt_P(tn)で表す。また、702には、各文書画像の属性値を示している。
The continuous probability calculation process (S602) will be specifically described with reference to FIG. FIG. 7A is a diagram showing a
例えば、図7(a)に示す文書画像群700においては、(式2)により、配列順において隣接する文書画像の属性値が同じ値であれば「1」、異なる値であれば「0」が算出される。図7(a)の例では、属性種別「患者ID」の属性値att_P(t1)とatt_P(t2)はいずれも「山田太郎」である。このため、「1」が算出される。一方、属性値att_P(t2)とatt_P(t3)は異なるため、「0」が算出される。文書画像群700においては、属性値の数nは8個、連続する属性値の数は5個である。したがって、(式1)より、連続確率「0.71」が算出される。
P(att_P)=5/(8−1)=0.71
For example, in the
P (att_P) = 5 / (8-1) = 0.71
一方、図7(b)に示すスキャンジョブJ2の文書画像群710においては、属性値の数nは8個、連続する属性値の数は0個である。したがって、(式1)より、連続確率「0」が算出される。
P(att_P)=0/(8−1)=0
On the other hand, in the
P (att_P) = 0 / (8-1) = 0
このように、(式1)は、連続する属性値が多い程高い値を示す。1つの文書画像群において、ある属性種別の属性値がすべて異なる値である場合には、連続確率は、最小値「0」となり、すべて同じ値である場合には、連続確率は最大値「1」となる。 Thus, (Expression 1) indicates a higher value as the number of consecutive attribute values increases. If the attribute values of a certain attribute type are all different values in one document image group, the continuous probability is the minimum value “0”, and if all are the same value, the continuous probability is the maximum value “1”. "
次に、S603において、属性パターン特定部123は、連続確率が閾値以上か否かを判定する。属性パターン特定部123は、連続確率が閾値以上の場合には(S603でYes)、処理をS604へ進める。S604において、属性パターン特定部123は、処理対象の文書群の属性パターンが、属性種別に対応する連続パターンであると判定する。例えば、患者IDの属性種別を処理対象としている場合には、患者ID連続パターンと判定する。一方、S603において、属性パターン特定部123は、連続確率が閾値未満の場合には(S603でNo)、処理対象とする属性種別に対応する連続パターンではないと判定し、属性パターン判定処理を終了する。ここで、S601〜S604の処理は、属性値の連続性に基づいて、属性パターンを特定する属性パターン特定処理の一例である。
In step S <b> 603, the attribute
属性値抽出部122は、処理対象の文書画像群の3つの属性種別それぞれを処理対象として、図6に示す処理を実行することにより、文書画像群の属性パターンを判定する。これにより、1つの文書画像群に対し、1又は2以上の属性パターンが特定される。
The attribute
図8は、図3を参照しつつ説明した属性値推定処理(S304)における詳細な処理を示すフローチャートである。S801において、属性値推定部124は、属性パターン特定処理(S303)において処理対象の文書画像群に対して特定された属性パターンにおいて連続する属性種別を推定対象として設定する。以下、推定対象が患者IDの属性種別である場合を例に説明する。 FIG. 8 is a flowchart showing detailed processing in the attribute value estimation processing (S304) described with reference to FIG. In step S <b> 801, the attribute value estimation unit 124 sets, as an estimation target, consecutive attribute types in the attribute pattern specified for the document image group to be processed in the attribute pattern specification process (S <b> 303). Hereinafter, a case where the estimation target is the attribute type of the patient ID will be described as an example.
次に、S802において、属性値推定部124は、処理対象の文書画像群の属性パターンに基づいて、参照タイプを特定する。ここで、参照タイプとは、推定対象の属性種別の属性値の認識率が高い文書タイプである。図9は、参照タイプテーブルの一例を示す図である。参照タイプテーブル900は、例えば、HDD104等に記憶されているものとする。参照タイプテーブル900は、属性パターンにおいて連続する属性種別と、参照タイプとして設定されている文書タイプとを対応付けて記憶している。すなわち、S802の処理は、属性パターンに基づいて、文書画像群の参照タイプを特定する参照タイプ特定処理の一例である。患者ID連続パターンにおいては、図9の参照タイプテーブル900から、患者IDの属性種別に対応する、「A」、「B」、「F」の文書タイプが参照タイプとして特定される。 In step S <b> 802, the attribute value estimation unit 124 identifies a reference type based on the attribute pattern of the document image group to be processed. Here, the reference type is a document type having a high recognition rate of the attribute value of the attribute type to be estimated. FIG. 9 is a diagram illustrating an example of the reference type table. It is assumed that the reference type table 900 is stored in the HDD 104 or the like, for example. The reference type table 900 stores attribute types consecutive in the attribute pattern in association with document types set as reference types. That is, the process of S802 is an example of a reference type specifying process that specifies the reference type of the document image group based on the attribute pattern. In the patient ID continuous pattern, the document types “A”, “B”, and “F” corresponding to the attribute type of the patient ID are specified as reference types from the reference type table 900 of FIG.
次に、S803において、属性値推定部124は、文書画像群の複数の文書画像の中から第1の参照画像を検索する。ここで、第1の参照画像とは、推定対象の属性種別の属性値を推定する際に、同種別の属性値を参照する文書画像である。ここで、図10を参照しつつ第1の参照画像検索処理(S803)について詳述する。 In step S <b> 803, the attribute value estimation unit 124 searches for a first reference image from a plurality of document images in the document image group. Here, the first reference image is a document image that refers to the attribute value of the same type when estimating the attribute value of the attribute type to be estimated. Here, the first reference image search process (S803) will be described in detail with reference to FIG.
図10は、第1の参照画像検出処理(S803)における詳細な処理を示すフローチャートである。S1001において、属性値推定部124は、処理対象の文書画像群の複数の文書画像のうち配列順が1番目の文書画像を処理対象として設定する。以下、処理対象の文書画像を対象画像と称する。次に、S1002において、属性値推定部124は、属性値抽出処理(S302)において、対象画像の認識処理に成功したか否かを判定する。なお、成功している場合には、対象画像の推定対象の文書種別に対し、属性値が対応付けられている。また、失敗している場合には、対象画像の推定対象の文書種別に対し「Unknown」が対応付けられている。属性値推定部124は、認識処理に成功している場合には(S1002でYes)、処理をS1003へ進める。属性パターン特定部123は、認識処理に失敗している場合には(S1002でNo)、処理をS1007へ進める。
FIG. 10 is a flowchart showing detailed processing in the first reference image detection processing (S803). In step S <b> 1001, the attribute value estimation unit 124 sets a document image with the first arrangement order as a processing target among a plurality of document images in the processing target document image group. Hereinafter, the document image to be processed is referred to as a target image. In step S <b> 1002, the attribute value estimation unit 124 determines whether the target image recognition process has succeeded in the attribute value extraction process (S <b> 302). In the case of success, the attribute value is associated with the document type to be estimated of the target image. In addition, when it has failed, “Unknown” is associated with the document type of the estimation target of the target image. If the recognition process is successful (Yes in S1002), the attribute value estimation unit 124 advances the process to S1003. If the recognition process has failed (No in S1002), the attribute
S1003において、属性値推定部124は、対象画像の特徴量を算出する。属性値推定部124は、例えば、対象画像を解析してテキスト領域と図表領域、背景領域を抽出し、抽出されたそれぞれの領域の割合を示すレイアウト特徴を求める。属性値推定部124はさらに、テキスト領域に占めるひらがな及びカタカナ、漢字、アルファベット、数字の割合を示すテキスト特徴、図表領域の色のRGB成分の割合のベクトル表現を求める。そして、属性値推定部124は、これらに基づいて特徴量を算出する。なお、特徴量算出処理については、例えば、特開2006−318219号公報を参照することができる。なお、特徴量は、文書画像の特徴を示すものであればよく、特徴量の具体的な種類、特徴量を算出するための処理は、実施形態に限定されるものではない。 In S1003, the attribute value estimation unit 124 calculates the feature amount of the target image. For example, the attribute value estimation unit 124 analyzes the target image to extract a text area, a chart area, and a background area, and obtains a layout feature indicating the ratio of each extracted area. The attribute value estimation unit 124 further obtains a text representation indicating the ratio of hiragana, katakana, kanji, alphabet, and numbers in the text area, and a vector representation of the ratio of the RGB component of the color of the chart area. Then, the attribute value estimation unit 124 calculates a feature amount based on these. For the feature amount calculation processing, for example, Japanese Patent Laid-Open No. 2006-318219 can be referred to. It should be noted that the feature amount only needs to indicate the feature of the document image, and the specific type of feature amount and the processing for calculating the feature amount are not limited to the embodiment.
次に、S1004において、属性値推定部124は、文書タイプテーブルを参照し、特徴量に基づいて、文書タイプを特定する。図11は、文書タイプテーブルの一例を示す図である。文書タイプテーブル1100は、例えば、HDD104等に記憶されているものとする。文書タイプテーブル1100は、文書タイプと特徴量とを対応付けて記憶している。文書タイプには、病院内で使用される文書タイプが予め登録される。文書タイプには、例えば、病院内で使用するすべての文書のフォーマットが、異なる文書タイプとして登録されているものとする。また、他の例としては、類似するフォーマットや種別のフォーマットを複数の文書タイプにグルーピングし、文書タイプには、各グループの文書タイプが登録されてもよい。また、他の例としては、既知の文書分類技術や文書クラスタリング技術を用いて類似する文書を分類し、文書タイプには、それぞれの分類項目が文書タイプとして登録されてもよい。特徴量には、対応する文書タイプの文書画像の特徴量ベクトルを特徴量としてされている。 In step S1004, the attribute value estimation unit 124 refers to the document type table and identifies the document type based on the feature amount. FIG. 11 is a diagram illustrating an example of a document type table. The document type table 1100 is assumed to be stored in the HDD 104, for example. The document type table 1100 stores document types and feature amounts in association with each other. In the document type, a document type used in the hospital is registered in advance. In the document type, for example, all document formats used in the hospital are registered as different document types. As another example, similar formats or types of formats may be grouped into a plurality of document types, and the document types of each group may be registered in the document types. As another example, similar documents may be classified using a known document classification technique or document clustering technique, and each classification item may be registered as a document type in the document type. The feature quantity includes a feature quantity vector of a document image of a corresponding document type as a feature quantity.
属性値推定部124は、文書タイプテーブル1100の特徴量と、S1003において算出した特徴量の類似度を算出し、類似度が閾値以上となる文書タイプを対象画像の文書タイプとして特定する。なお、属性値推定部124は、類似度が最大となる文書タイプを対象画像の文書タイプとして特定してもよい。ここで、S1004の処理は、文書画像の文書タイプを特定する文書タイプ特定処理の一例である。 The attribute value estimation unit 124 calculates the similarity between the feature amount of the document type table 1100 and the feature amount calculated in S1003, and specifies the document type with the similarity equal to or greater than the threshold as the document type of the target image. Note that the attribute value estimation unit 124 may specify the document type having the maximum similarity as the document type of the target image. Here, the process of S1004 is an example of a document type specifying process for specifying the document type of the document image.
次に、S1005において、属性値推定部124は、対象画像の文書タイプが参照タイプか否かを確認する。属性値推定部124は、対象画像の文書タイプが参照タイプの場合には(S1005でYes)、処理をS1006へ進める。属性パターン特定部123は、対象画像の文書タイプが参照タイプでない場合には(S1005でNo)、処理をS1007へ進める。S1006において、属性値推定部124は、対象画像を第1の参照画像に設定し、第1の参照画像検索処理を終了する。S1007において、属性値推定部124は、文書画像群の配列順において、対象画像の次の文書画像が存在するか否かを確認する。属性値推定部124は、次の文書画像が存在する場合には(S1007でYes)、処理をS1008へ進める。属性値推定部124は、次の文書画像が存在しない場合には(S1007でNo)、処理をS1009へ進める。
In step S1005, the attribute value estimation unit 124 checks whether the document type of the target image is a reference type. If the document type of the target image is the reference type (Yes in S1005), the attribute value estimation unit 124 advances the process to S1006. If the document type of the target image is not the reference type (No in S1005), the attribute
S1008において、属性値推定部124は、次の文書画像を新たな処理対象に設定し、処理をS1002へ進める。S1009において、属性値推定部124は、第1の参照画像は存在しないと判定し、第1の参照画像検索処理を終了する。このように、第1の参照画像検索処理(S803)において、文書画像群の文書画像のうち、認識処理に成功し、かつ参照タイプの文書画像で、かつ配列順が最も前の文書画像が第1の文書画像として特定される。すなわち、S803の処理は、文書画像群に属する文書画像の中から、認識処理に成功したと判定され、かつ特定された文書タイプが参照タイプの文書画像の中から、さらに配列順に基づいて、参照画像として特定する参照画像特定処理の一例である。 In step S1008, the attribute value estimation unit 124 sets the next document image as a new processing target, and advances the processing to step S1002. In step S1009, the attribute value estimation unit 124 determines that the first reference image does not exist, and ends the first reference image search process. As described above, in the first reference image search process (S803), among the document images in the document image group, the document image that has been successfully recognized and is the reference type document image and that has the earliest arrangement order is the first. Specified as one document image. In other words, the process of S803 determines that the recognition process is successful from the document images belonging to the document image group, and the specified document type is referred to from the reference-type document images based on the arrangement order. It is an example of the reference image specific process specified as an image.
図8に戻り、S803の処理の後、S804において、属性値推定部124は、S803において第1の参照画像が検出されたか否かを判定する。属性値推定部124は、第1の参照画像が検出された場合には(S804でYes)、処理をS805へ進める。属性値推定部124は、第1の参照画像が検出されなかった場合には(S804でNo)、属性推定処理(S304)を終了する。S805において、属性値推定部124は、第1の参照画像に設定された文書画像以降の配列順の文書画像を検索対象として、第2の参照画像を検索する。ここで、第2の検索画像は、第1の参照画像と同様に、推定対象の属性種別の属性値を推定する際に、同種別の属性値を参照する文書画像である。S805における処理は、S803における処理とほぼ同様である。ただし、S805においては、属性値推定部124は、図10に示すS1001において、第1の参照画像の次の配列順の文書画像を処理対象に設定する。そして、属性値推定部124は、認識処理に成功し、かつ文書タイプが参照タイプの文書画像を第2の参照画像として特定する。 Returning to FIG. 8, after the processing of S803, in S804, the attribute value estimation unit 124 determines whether or not the first reference image is detected in S803. If the first reference image is detected (Yes in S804), the attribute value estimation unit 124 advances the process to S805. If the first reference image is not detected (No in S804), the attribute value estimation unit 124 ends the attribute estimation process (S304). In step S <b> 805, the attribute value estimation unit 124 searches for the second reference image by using the document images in the order of arrangement after the document image set as the first reference image as a search target. Here, like the first reference image, the second search image is a document image that refers to the attribute value of the same type when estimating the attribute value of the attribute type to be estimated. The process in S805 is almost the same as the process in S803. However, in S805, the attribute value estimation unit 124 sets a document image in the arrangement order next to the first reference image as a processing target in S1001 illustrated in FIG. Then, the attribute value estimation unit 124 identifies a document image having a successful recognition process and a reference document type as the second reference image.
次に、S806において、124は、S805において第2の参照画像が検出されたか否かを判定する。属性値推定部124は、第2の参照画像が検出された場合には(S806でYes)、処理をS807へ進める。属性値推定部124は、第2の参照画像が検出されなかった場合には(S806でNo)、属性推定処理(S304)を終了する。S807において、属性値推定部124は、第1の参照画像と第2の参照画像の患者IDの属性種別の属性値を比較する。次に、S808において、属性値推定部124は、両属性値が一致する場合には(S808でYes)、処理をS809へ進める。 Next, in S806, 124 determines whether a second reference image has been detected in S805. If the second reference image is detected (Yes in S806), the attribute value estimation unit 124 advances the process to S807. If the second reference image is not detected (No in S806), the attribute value estimation unit 124 ends the attribute estimation process (S304). In S807, the attribute value estimation unit 124 compares the attribute value of the attribute type of the patient ID of the first reference image and the second reference image. Next, in S808, when the two attribute values match (Yes in S808), the attribute value estimation unit 124 advances the process to S809.
S809において、属性値推定部124は、文書画像群の配列順において、第1の参照画像と第2の参照画像の間に位置する文書画像を推定対象の文書画像として設定する。そして、属性値推定部124は、推定対象の文書画像に対し、一致した属性値を推定結果として対応付ける。そして、属性値推定部124は、処理をS811へ進める。また、S810において、属性値推定部124は、文書画像群の配列順において、第1の参照画像と第2の参照画像の間に位置する文書画像を推定対象の文書画像として設定する。そして、属性値推定部124は、推定対象の文書画像に対し、第1の参照画像及び第2の参照画像それぞれの推定対象の属性値を推定結果として対応付ける。そして、属性値推定部124は、処理をS811へ進める。S811において、属性値推定部124は、第2の参照画像を第1の参照画像に設定し、処理をS805へ進める。なお、処理対象の文書画像群に対して、複数の属性パターンが特定されている場合には、サーバ装置120は、各属性パターンにおいて連続する属性種別を推定対象に設定し、図8に示す属性値推定処理を実行するものとする。なお、本実施形態においては、このように、属性値推定部124は、推定対象の文書画像よりも配列順が前の文書画像と、推定対象の文書画像よりも配列順が後の文書画像と、を参照画像として特定するものとする。
In step S809, the attribute value estimation unit 124 sets a document image positioned between the first reference image and the second reference image in the document image group arrangement order as a document image to be estimated. Then, the attribute value estimation unit 124 associates the matched attribute value with the estimation target document image as the estimation result. Then, the attribute value estimation unit 124 advances the process to S811. In S810, the attribute value estimation unit 124 sets a document image located between the first reference image and the second reference image in the document image group arrangement order as a document image to be estimated. Then, the attribute value estimation unit 124 associates the estimation target attribute values of the first reference image and the second reference image as estimation results with the estimation target document image. Then, the attribute value estimation unit 124 advances the process to S811. In S811, the attribute value estimation unit 124 sets the second reference image as the first reference image, and the process proceeds to S805. When a plurality of attribute patterns are specified for the document image group to be processed, the
図12は、属性値推定処理(S304)の説明図である。1200は、スキャンジョブJ1の文書画像群である。1201には、各文書画像の属性を示し、1202には属性値を示している。図12の例においては、説明の便宜上、患者IDとして患者名に替えて患者番号を属性値として示している。1210は、各文書画像に対して、属性値抽出処理(S301)において抽出された属性値を示している。文書画像群1200のうち、文書画像dI(t1)、dI(t3)、dI(t6)、dI(t8)は、認識に成功したと判断され、かつ文書タイプが参照タイプの文書画像であるものとする。一方、文書画像dI(t2)、dI(t4)、dI(t5)、dI(t7)は、認識に成功したと判断され、かつ文書タイプが参照タイプの文書画像、以外の文書であるものとする。
FIG. 12 is an explanatory diagram of the attribute value estimation process (S304).
以上の前提において、属性値推定処理(S304)における詳細な処理を具体的に説明する。この場合、S803において、属性値推定部124は、認識処理に成功し、かつ文書タイプが参照タイプの文書画像のうち、配列順において最初に位置する文書画像dI(t1)を第1の参照画像に設定する。第1の参照画像が存在するため(S804でYes)、属性値推定部124は、処理をS805へ進める。そして、S805において、属性値推定部124は、認識処理に成功し、かつ文書タイプが参照タイプの文書画像のうち、文書画像dI(t1)より後の配列順の文書画像dI(t3)を第2の参照画像に設定する。第2の参照画像が存在するため(S806でYes)、属性値推定部124は、処理をS807へ進める。 Based on the above assumptions, detailed processing in the attribute value estimation processing (S304) will be specifically described. In this case, in S803, the attribute value estimation unit 124 succeeds in the recognition processing, and among the document images whose document type is the reference type, the document image dI (t1) that is first positioned in the arrangement order is the first reference image. Set to. Since the first reference image exists (Yes in S804), the attribute value estimation unit 124 advances the process to S805. In step S805, the attribute value estimation unit 124 selects the document image dI (t3) in the order of arrangement after the document image dI (t1) among the document images having the recognition process and the document type being the reference type. 2 reference image. Since the second reference image exists (Yes in S806), the attribute value estimation unit 124 advances the process to S807.
そして、S807において、属性値推定部124は、文書画像dI(t1)と文書画像dI(t3)の患者ID、att_P(t1)とatt_P(t3)を比較する。患者IDは両方とも「123456」で等しいため(S808でYes)、属性値推定部124は、処理をS809へ進める。S809において、属性値推定部124は、文書画像dI(t1)と文書画像dI(t3)の属性値「123456」を、文書画像dI(t1)と文書画像dI(t3)の間の文書画像dI(t2)の属性値として推定する。なお、文書画像dI(t3)に対しては抽出結果が得られているものとする。このように、属性値推定部124は、抽出結果が得られている場合にも、正しい属性値を推定し、推定結果を文書画像に対応付けるものとする。 In step S807, the attribute value estimation unit 124 compares the patient IDs att_P (t1) and att_P (t3) of the document image dI (t1) and the document image dI (t3). Since both the patient IDs are equal to “123456” (Yes in S808), the attribute value estimation unit 124 advances the process to S809. In step S809, the attribute value estimation unit 124 determines the attribute value “123456” of the document image dI (t1) and the document image dI (t3), and the document image dI between the document image dI (t1) and the document image dI (t3). Estimated as the attribute value of (t2). It is assumed that an extraction result has been obtained for the document image dI (t3). As described above, the attribute value estimation unit 124 estimates the correct attribute value even when the extraction result is obtained, and associates the estimation result with the document image.
その後、S811において、属性値推定部124は、文書画像dI(t3)を第1の参照画像に設定し、処理をS805へ進め、文書画像dI(t6)を第2の参照画像に設定する。その後、属性値推定部124は、処理をS807へ進め、両属性値を比較する。両属性値は一致しないので、処理をS810へ進める。S810において、属性値推定部124は、文書画像dI(t1)と文書画像dI(t3)の間の文書画像dI(t4)、文書画像dI(t5)を推定対象の文書画像として設定する。そして、属性値推定部124は、文書画像dI(t3)の属性値「123456」及び文書画像dI(t6)の属性値「654321」それぞれを、推定対象の文書画像の推定結果として、推定対象の文書画像に対応付ける。これにより、認識に失敗したと判定され、「Unknown」が設定された文書画像に対して、正しい属性値を推定し、これを対応付けることができる。 Thereafter, in S811, the attribute value estimation unit 124 sets the document image dI (t3) as the first reference image, advances the processing to S805, and sets the document image dI (t6) as the second reference image. Thereafter, the attribute value estimation unit 124 advances the process to S807 and compares both attribute values. Since both attribute values do not match, the process proceeds to S810. In S810, the attribute value estimation unit 124 sets the document image dI (t4) and the document image dI (t5) between the document image dI (t1) and the document image dI (t3) as the estimation target document image. Then, the attribute value estimation unit 124 uses the attribute value “123456” of the document image dI (t3) and the attribute value “654321” of the document image dI (t6) as the estimation result of the estimation target document image. Associate with document image. Thereby, it is determined that the recognition has failed, and a correct attribute value can be estimated and associated with the document image in which “Unknown” is set.
さらに、属性値推定処理(S304)の後、送受信部121は、文書画像と、属性値抽出処理(S302)の抽出結果1210と、属性値推定処理(S304)の推定結果1220と、を対応付けて、クライアント装置130に送信する。そして、クライアント装置130は、図12に示すように、文書画像と、抽出結果1210と、推定結果1220とを対応付けて、表示部205に表示する。これにより、ユーザは、抽出結果だけでなく、推定結果を確認し、文書画像の属性値の登録や修正を行うことができる。
Further, after the attribute value estimation process (S304), the transmission /
図13は、クライアント装置130の表示処理部131により表示される確認画面の一例を示す図である。確認画面1300は、クライアント装置130が文書画像、抽出結果及び推定結果を受信した後に表示される。1301は、処理対象の文書画像群の文書画像を表示する領域である。文書画像は、ユーザが内容を確認するために十分なサイズで表示される。1302,1303,1304は、1301に表示されている文書画像から属性値抽出処理(S302)において抽出された属性値を示す領域である。1302は、抽出された文書種別を編集可能な状態で表示する領域である。1303は、抽出された患者IDを編集可能な状態で表示する領域である。1304は、抽出された診療科IDを編集可能な状態で表示する領域である。
FIG. 13 is a diagram illustrating an example of a confirmation screen displayed by the display processing unit 131 of the
1305,1306は、同一の文書画像群に含まれる複数の文書画像のサムネイルを表示する領域である。1305は、抽出された属性値がユーザにより確認され、文書画像とその属性値とが既に登録されている文書画像を示すサムネイル画像である。1306は、抽出した属性値の確認が完了していない文書画像、すなわち未登録の文書画像を示すサムネイル画像である。登録済み文書画像のサムネイル画像1305には、未登録文書画像のサムネイル画像1306と区別するためのチェックマークアイコンが表示される。
1307は、属性値推定処理(S304)の推定結果を示す領域である。1307が選択されると、指示受付部132は、1307に表示中の属性値への修正指示を受け付ける。なお、図13においては、1つの属性値に対して1つの推定結果のみを示しているが、複数の推定結果が得られた場合には、複数の推定結果を表示してもよい。1308は、1301に表示されている文書画像の登録指示を入力するためのボタンである。すなわち、1308が選択されると、指示受付部132は、表示中の文書画像及び属性値の登録指示を受け付ける。
確認画面1300は、ユーザがクライアント装置130上でスキャン情報を登録するアプリケーションを立ち上げた際に表示される。なお、初期状態においては、処理対象の文書画像群のうち、1番目の配列順の文書画像が1301に表示され、1番目の文書画像の属性値が1302,1303,1304に表示される。図13の例では、文書種別の抽出結果には属性値の抽出に失敗したことを示す「Unknown」が表示されており、患者IDには正しい患者ID「山田太郎」が、診療科には正しい診療ID「耳鼻咽喉科」が表示されている。さらに、図13の例では、1302の抽出結果に対し、推定結果が存在するため、1307に推定結果が、「修正候補」という見出しのリスボックスで表示される。
The
1302,1303,1304に表示されている属性値が、1301に表示されている文書画像中に表示される属性値と異なる場合は、ユーザは、それぞれの領域に表示されている属性値を編集して書き換える。さらに、ユーザがリストボックス1307内の修正候補「問診票」を選択することにより、1302の内容「Unknowm」を1307の内容「問診票」に書き変えることもできる。
When the attribute values displayed in 1302, 1303, and 1304 are different from the attribute values displayed in the document image displayed in 1301, the user edits the attribute values displayed in the respective areas. And rewrite. Further, when the user selects a correction candidate “interview form” in the
ユーザが、1302、1303、1304に表示されている属性値に誤りがないことを確認して登録ボタン1308を押下したとする。この場合、1306に表示されていた未登録であることを示す、1301の文書画像に対応する文書サムネイルの表示状態は、登録済みであることを示す1305の表示状態へ移行する。さらに、1301には、次の配列順の文書画像が表示され、ユーザは、未登録の文書画像をすべて確認、登録するまで、同様の確認作業を繰り返す。
Assume that the user confirms that the attribute values displayed in 1302, 1303, and 1304 are correct and presses the
このように、文書画像から認識技術によって抽出した属性値だけでなく、推定結果としての属性値をユーザに提示し、ユーザが確認した上で登録させることにより、文書画像に誤った属性値が付与されるリスクを減らすことができる。また、認識技術により抽出に失敗した属性値に対して他の属性値を推奨し、ユーザに選択させることにより、ユーザの編集操作の負荷を低減させることができる。 In this way, not only the attribute value extracted from the document image by the recognition technique but also the attribute value as the estimation result is presented to the user, and the user confirms and registers the attribute value, thereby giving the document image an incorrect attribute value. The risk of being lost. In addition, it is possible to reduce the load of the user's editing operation by recommending other attribute values for the attribute values that have failed to be extracted by the recognition technique and causing the user to select them.
また、このとき、送受信部133は、1301に表示されている文書画像の登録指示をサーバ装置120に送信する。そして、サーバ装置120は、登録指示を受信すると、図3に示す文書画像登録処理において、処理をS308へ進める。さらに、サーバ装置120は、S308において、確認画面1300におけるユーザによる修正の有無と、修正後の属性値とを、文書画像に対応付けて修正履歴として記録する。
At this time, the transmission /
図14は、修正履歴テーブルのデータ構成の一例を示す図である。修正履歴テーブル1400は、リレーショナルデータベースのテーブルである。修正履歴テーブル1400は、例えばHDD204等の記憶部に格納されている。1401は、各文書画像を示す文書画像名が格納される列である。1402は、文書画像が属する文書画像群の属性パターンを示す列である。1403は、文書タイプを示す列である。文書タイプは、文書画像のレイアウトの特徴等から判定され格納される。1404は、属性値抽出処理(S302)において抽出された属性値としての患者IDを格納する列である。なお、ここでは、図12に対応して患者IDとして患者番号を示している。1405は、属性値抽出処理(S302)において抽出された属性値に対する修正の有無と、修正後の属性値とを格納する列である。すなわち、修正がなく属性値抽出処理(S302)において抽出された属性値が文書画像に対応付けて登録された場合には、「修正なし」が格納される。また、修正が行われた場合には、修正後の患者IDが格納される。なお、図14には、患者IDの修正履歴のみを示しているが、サーバ装置120は、文書種別、診療科IDに対しても同様のテーブルを記憶しているものとする。
FIG. 14 is a diagram illustrating an example of a data structure of the correction history table. The revision history table 1400 is a relational database table. The correction history table 1400 is stored in a storage unit such as the
図15は、参照タイプテーブル生成部127による参照タイプテーブル生成処理を示すフローチャートである。参照タイプテーブル生成部127は、参照タイプテーブル生成処理において、修正履歴テーブル1400から参照タイプテーブル900を生成する。S1501において、参照タイプテーブル生成部127は、未処理の属性パターンを1つ設定する。次に、S1502において、参照タイプテーブル生成部127は、登録済みの文書画像のうち、設定された属性パターンの文書画像を処理対象として設定する。そして、参照タイプテーブル生成部127は、文書タイプ毎に、対象とする文書タイプのすべての文書画像に対する、「修正なし」の修正情報が記録されている文書画像の割合を算出する。図14の例においては、文書タイプAを対象とした場合、対象の文書タイプ(文書タイプA)のすべての文書画像の数が2、「修正なし」の文書画像の数が2であり、修正なしの割合は1となる。一方、文書タイプBを対象とした場合、対象の文書タイプ(文書タイプB)のすべての文書画像の数が2、「修正なし」の文書画像の数が0であり、修正なしの割合は0となる。また、文書タイプCでは、修正なしの割合は0.5となる。
FIG. 15 is a flowchart showing reference type table generation processing by the reference type
次に、S1503において、参照タイプテーブル生成部127は、修正なしの割合が閾値以上の文書タイプを参照タイプとして決定する。次に、S1504において、参照タイプテーブル生成部127は、すべての属性パターンに対してS1501〜S1503の処理を行ったか否かを判定する。参照タイプテーブル生成部127は、未処理の属性パターンが存在する場合には(S1504でYes)、処理をS1501へ進める。参照タイプテーブル生成部127は、未処理の属性パターンが存在しない場合には(S1504でNo)、処理をS1505へ進める。S1505において、参照タイプテーブル生成部127は、各属性パターンにおいて連続する属性種別と、各属性パターンに対してS1503において決定した参照タイプとを対応付けた参照タイプテーブル900を生成する。以上で、参照テーブル生成処理が完了する。
In step S <b> 1503, the reference type
以上のように、本実施形態にかかる文書管理システム100によれば、文書画像の認識処理を利用しつつ、文書画像の正しい属性値を推定することができる。すなわち、文書管理システム100は、認識処理による抽出に失敗した属性値についても正しい値を推定し、これをユーザに提示することができる。また、文書管理システム100は、認識処理により抽出された属性値についても、誤りの可能性を推定し、これをユーザに提示することができる。したがって、ユーザは、文書登録時には、表示画面に表示された抽出結果及び推定結果の中から、正しい属性値を選択する操作を行うだけでよく、ユーザによる編集作業の負荷を軽減することができる。
As described above, according to the
なお、第1の実施形態に係る文書管理システム100の第1の変更例としては、サーバ装置120の属性値抽出部122は、文字認識に替えて、1次元又は2次元のバーコードに対する認識処理により、属性値を抽出することとしてもよい。
As a first modification of the
次に、第2の変更例について説明する。例えば、受付や診療科等文書が生成される際にオンデマンドで文書をスキャンする分散スキャン環境が考えられる。このような環境においては、サーバ装置120の属性パターン特定部123は、スキャンに利用されたデバイス、スキャンが行われた場所、又はスキャンが行われた部署に基づいて、画像文書群の属性パターンを特定してもよい。
Next, a second modification example will be described. For example, there may be a distributed scanning environment in which a document is scanned on demand when a document such as a reception or a department is generated. In such an environment, the attribute
具体的には、送受信部121は、読取装置110から文書画像群と共に、文書画像群の関連情報を取得する。ここで、関連情報には、スキャンに利用されたデバイス、スキャンが行われた場所又はスキャンが行われた部署が示されているものとする。またサーバ装置120は、関連情報と属性パターンとを対応付ける属性パターンテーブルを記憶部に記憶しているものとする。そして、属性パターン特定部123は、この属性パターンテーブルを参照し、関連情報から属性パターンを特定する。さらに、サーバ装置120は、過去に処理対象とした文書画像群の関連情報と、文書画像群に対する属性パターンの特定結果とを対応付けて履歴として記録しておき、この履歴情報に基づいて、属性パターンテーブルを生成してもよい。
Specifically, the transmission /
また、第3の変更例としては、サーバ装置120の属性値抽出部122が認識処理の成否を判定するための認識条件は実施形態に限定されるものではない。属性値抽出部122は、例えば、認識精度が閾値以上の場合に成功と判定するという認識条件に従い、認識結果の成否を判定してもよい。
As a third modification, the recognition condition for the attribute
また、第4の変更例としては、クライアント装置130は、サーバ装置120から文書画像、抽出結果及び推定結果を受信した後に、これらの情報を表示すればよく、そのための具体的な表示態様等は実施形態に限定されるものではない。図16は、第4の変更例に係る確認画面を示す図である。確認画面1600において、1601は、処理対象の文書画像群に属する文書画像を表示する領域である。図16(a)においては、領域1601には、2つの文書画像1602,1603が表示されているが、領域1601に表示される文書画像の数は特に限定されるものではない。本例においては、ユーザ操作に応じて、領域1601に表示する文書画像を切り替えることができる。また、領域1601には、各文書画像1602,1603それぞれに対応付けて、各文書画像1602,1603のスキャン日時1604,1605が表示されている。
Further, as a fourth modification example, the
さらに、文書画像1602,1603のうち、文字認識に用いられた領域、すなわち属性領域は、マーカ表示される。文字画像1602においては、患者IDが認識された領域1606、診療科IDが認識された領域1607及び文書種別が認識された1608がマーカ表示されている。同様に、文書画像1603においても、患者IDが認識された領域1609、診療科IDが認識された領域1610及び文書種別が認識された16011がマーカ表示されている。なお、本例においては、属性領域をマーカ表示することとしたが、表示処理部131は、属性領域を他の領域と識別可能に表示すればよく、そのための具体的な処理は実施形態に限定されるものではない。他の例としては、表示処理部131は、属性領域の外枠を表示してもよい。また、患者IDが認識された領域1606,1609、診療科IDが認識された領域1607,1610及び文書種別が認識された1608,1611をそれぞれ異なる表示形態で強調することとしてもよい。例えば、患者IDが認識された領域1606,1609は赤色のマーカが引かれたように強調する。これに対し、診療科IDが認識された領域1607,1610は青色のマーカが引かれたように強調し、文書種別が認識された1608,1611は黄色のマーカが引かれたように強調する。このようにすれば、操作者は一見して患者ID、診療科ID、文書種別を容易に区別することが可能となる。
Further, in the
ユーザにより領域1601に表示中のいずれかの文書画像が選択されると、選択された文書画像には、選択中であることを示すチェックマークが表示される。図16の例では、文書画像1602が選択され、文書画像1602上に、チェックマーク1612が表示されている。1620は、選択中の文書画像に対する認識結果を表示する認識結果領域である。認識結果領域1620には、患者ID、診療科ID及び文書種別の認識結果1621,1622,1623が表示されている。
When one of the document images displayed in the
また、1630は、選択中の文書画像に対する登録情報を表示する登録情報領域である。登録情報領域1630の表示内容を図16(b)に示す。登録情報領域1630には、患者ID欄1631、診療科ID欄1634及び文書種別欄1635が表示されている。各欄1631〜1635には、初期値として各項の認識結果が表示されるものとする。ユーザは、各欄の内容を確認し、誤りがある場合には、正しい情報を入力することができる。
さらに、患者ID欄1631に対応する検索ボタン1632が表示され、ユーザは、検索ボタン1632を選択することにより、他の患者IDの検索を行うことができる。また、患者ID欄1631に対応付けて患者情報1633が表示されている。患者情報1633は、患者ID欄1631に表示される患者IDに対応付けられている患者情報である。なお、クライアント装置130は、初期値として、又はユーザ操作に応じて患者IDが患者ID欄1631に表示されると、表示された患者IDをサーバ装置120に送信する。サーバ装置120は、患者IDと患者情報を対応付けた患者DBを有しており、受信した患者IDに対応する患者情報をクライアント装置130に送る。そして、クライアント装置130は、受信した患者情報を患者情報1633として表示する。なお、患者DBは、サーバ装置120以外の不図示の装置が備えるものとしてもよい。この場合、クライアント装置は、患者DBを備える装置から患者情報を取得すればよい。
Further, a
日時欄1636には、「日時を指定する」のチェック欄1637と、「スキャン日時を使う」のチェック欄1638が表示されている。ユーザは、いずれかを選択することができる。さらに、ユーザは、「日時を指定する」のチェック欄1637を選択した場合には、入力欄1638に日時を入力する。コメント欄1640には、ユーザが自由に情報を入力することができる。登録ボタン1641が選択されると、登録情報領域1630の表示内容が登録される。
In the date /
さらに、図17に示すように、拡大枠1700により文書画像の一部が指定されると、右上の領域1701に拡大枠1700内の文書画像が拡大表示される。これにより、ユーザは、文書画像の内容をより詳しく確認することができる。また、認識結果を示すマーカ表示が行われた状態で文書画像が拡大されるため、細かい箇所の認識結果の適否を操作者は容易に把握することが可能となる。例えば、患者IDの末尾一文字にマーカ表示がされてない場合には操作者は認識ミスと判断することができる。
Further, as shown in FIG. 17, when a part of the document image is designated by the
なお、図17に示す例では、領域1701は図16における認識結果領域1620と同じ位置に設けられているが認識結果領域1620と異なる位置に設けることとしてもよい。例えば、領域1701を認識結果領域1620の横方向または縦方向に並べて表示させることとしてもよいし、領域1701をポップアップウインドウに表示させることとしてもよい。認識結果領域1620の表示内容と領域1701に表示される拡大された文書画像を見比べることにより、文書画像における文字が小さい場合においても認識結果の適否を操作者は容易に把握することが可能となる。
In the example illustrated in FIG. 17, the
また、第5の変更例としては、文書管理システム100は、複数ページに渡る文書を処理対象としてもよい。図18(a)は、1つの文書が複数ページに渡る文書を含む文書群に対する確認画面を示す図である。ここで、文書画像1800,1801は、いずれも、患者ID「123456」、診療科「耳鼻咽喉科」、文書種別「問診票」の認識結果が得られているものとする。また、文書画像1802,1802は、いずれも、患者ID「654321」、診療科「耳鼻咽喉科」、文書種別「同意書」の認識結果が得られているものとする。この場合、ユーザは、属性の等しい文書画像1800,1801を選択した上で、登録情報領域1630の表示内容の一括登録指示を入力することができる。この場合、サーバ装置120は、クライアント装置130を介して、文書画像1800,1801に対する一括登録指示を受信する。そして、サーバ装置120は、一括登録指示に従い、文書画像1800,1801それぞれに対し、登録情報領域1630の表示内容を対応付けて登録する。
Further, as a fifth modification example, the
また、ユーザが誤って属性値の異なる文書画像1800,1802を選択した上で一括登録指示を入力する場合も考えられる。この場合、サーバ装置120は、文書画像1800と文書画像1802の認識結果が異なることから、登録内容に誤りがあると推定する。そして、サーバ装置120は、誤りの可能性がある属性種別をクライアント装置130に送信する。これに対し、クライアント装置130は、誤りの可能性があることを示す情報を表示する。図18(b)は、患者ID及び文書種別に誤りの可能性がある場合の認識結果領域1620における表示例を示す図である。文書画像1800,1802の認識結果において、患者ID及び文書種別が異なっている。そこで、表示処理部131は、一括登録指示に係る患者IDと共に、「患者IDが誤っている可能性があります」といった誤りの可能性をユーザに通知する情報を表示する。さらに、一括登録指示に係る文書種別と共に、「文書種別が誤っている可能性があります」といった通知情報を表示する。これにより、ユーザは、誤りの可能性を確認することができる。
It is also conceivable that the user erroneously selects
なお、図18(b)に示す例では、診療科の認識結果の表示は省略しているが、図16の認識結果領域1620と同様に診療科の認識結果を表示することとしてもよい。また、登録しようとする複数の文書画像間において診療科の認識結果が異なる場合には「診療科が誤っている可能性があります」等の警告を表示することとしてもよい。なお、警告が表示された場合であっても登録ボタン1641を用いて文書画像を登録できるようにしてもよいし、登録を禁止することとしてもよい。また、異なる患者IDの文書画像が選択されている場合には、図16に示した認識結果領域1620にはスキャン日時が新しい文書画像の認識結果を表示することとしてもよいし、スキャン日時が古い文書画像の認識結果を表示することとしてもよい。なお、異なる患者IDの文書画像が選択されている場合には、登録情報領域1630に、患者ID欄1631等にスキャン日時が新しい文書画像の認識結果を表示することとしてもよいし、スキャン日時が古い文書画像の認識結果を表示することとしてもよい。
In the example shown in FIG. 18B, the display of the recognition result of the medical department is omitted, but the recognition result of the medical department may be displayed as in the
<その他の実施形態>
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給する。そして、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。
<Other embodiments>
The present invention can also be realized by executing the following processing. That is, software (program) that realizes the functions of the above-described embodiments is supplied to a system or apparatus via a network or various storage media. Then, the computer (or CPU, MPU, etc.) of the system or apparatus reads and executes the program.
以上、上述した各実施形態によれば、文書画像の正しい属性値を推定することができる。 As mentioned above, according to each embodiment mentioned above, the correct attribute value of a document image can be estimated.
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。 The preferred embodiments of the present invention have been described in detail above, but the present invention is not limited to such specific embodiments, and various modifications can be made within the scope of the gist of the present invention described in the claims.・ Change is possible.
110 読取装置
120 サーバ装置
130 クライアント装置
122 属性値抽出部
124 属性値推定部
110
Claims (10)
認識条件にしたがい認識処理に成功したか否かを判定する結果判定手段と、
前記文書画像の文書タイプを特定する文書タイプ特定手段と、
前記文書画像群に属する前記文書画像の中から、前記認識処理に成功したと判定され、かつ特定された文書タイプが参照タイプの前記文書画像を参照画像として特定する参照画像特定手段と、
前記参照画像特定手段により特定された前記文書画像の前記属性値に基づいて、前記認識処理に失敗したと判定された前記文書画像の前記属性値を推定する推定手段と
を有することを特徴とする情報処理装置。 Recognition means for extracting attribute values of the document image by recognition processing for each of the plurality of document images belonging to the document image group;
A result judging means for judging whether or not the recognition processing is successful according to the recognition condition;
Document type specifying means for specifying the document type of the document image;
A reference image specifying means for determining, from the document images belonging to the document image group, that the recognition process has been successful, and specifying the document image of which the specified document type is a reference type as a reference image;
And estimating means for estimating the attribute value of the document image determined to have failed in the recognition process based on the attribute value of the document image specified by the reference image specifying means. Information processing device.
前記属性パターンに基づいて、前記文書画像群の前記参照タイプを特定する参照タイプ特定手段と
をさらに有し、
前記参照画像特定手段は、前記参照タイプ特定手段により特定された前記参照タイプの前記文書画像を前記参照画像として特定することを特徴とする請求項1に記載の情報処理装置。 Attribute pattern specifying means for specifying an attribute pattern based on continuity of attribute values of the document image group;
A reference type specifying unit for specifying the reference type of the document image group based on the attribute pattern;
The information processing apparatus according to claim 1, wherein the reference image specifying unit specifies the document image of the reference type specified by the reference type specifying unit as the reference image.
前記認識手段は、前記文書画像の前記属性値として、文書種別、患者識別情報及び診療科識別情報のうち少なくとも1つを抽出することを特徴とする請求項1乃至5何れか1項に記載の情報処理装置。 The document image is an image showing a medical document,
6. The device according to claim 1, wherein the recognizing unit extracts at least one of a document type, patient identification information, and clinical department identification information as the attribute value of the document image. Information processing device.
文書画像群に属する複数の文書画像それぞれに対する認識処理により、前記文書画像の属性値を抽出する認識ステップと、
認識条件にしたがい認識処理に成功したか否かを判定する結果判定ステップと、
前記文書画像の文書タイプを特定する文書タイプ特定ステップと、
前記文書画像群に属する前記文書画像の中から、前記認識処理に成功したと判定され、かつ特定された文書タイプが参照タイプの前記文書画像を参照画像として特定する参照画像特定ステップと、
前記参照画像特定ステップにおいて特定された前記文書画像の前記属性値に基づいて、前記認識処理に失敗したと判定された前記文書画像の前記属性値を推定する推定ステップと
を含むことを特徴とする情報処理方法。 An information processing method executed by an information processing apparatus,
A recognition step of extracting attribute values of the document image by a recognition process for each of the plurality of document images belonging to the document image group;
A result determination step for determining whether or not the recognition process is successful according to the recognition condition;
A document type specifying step for specifying a document type of the document image;
A reference image specifying step of determining, from among the document images belonging to the document image group, that the recognition processing has been successful, and specifying the document image whose specified document type is a reference type as a reference image;
An estimation step of estimating the attribute value of the document image determined to have failed in the recognition process based on the attribute value of the document image specified in the reference image specifying step. Information processing method.
文書画像群に属する複数の文書画像それぞれに対する認識処理により、前記文書画像の属性値を抽出する認識手段と、
認識条件にしたがい認識処理に成功したか否かを判定する結果判定手段と、
前記文書画像の文書タイプを特定する文書タイプ特定手段と、
前記文書画像群に属する前記文書画像の中から、前記認識処理に成功したと判定され、かつ特定された文書タイプが参照タイプの前記文書画像を参照画像として特定する参照画像特定手段と、
前記参照画像特定手段により特定された前記文書画像の前記属性値に基づいて、前記認識処理に失敗したと判定された前記文書画像の前記属性値を推定する推定手段と
して機能させるためのプログラム。 Computer
Recognition means for extracting attribute values of the document image by recognition processing for each of the plurality of document images belonging to the document image group;
A result judging means for judging whether or not the recognition processing is successful according to the recognition condition;
Document type specifying means for specifying the document type of the document image;
A reference image specifying means for determining, from the document images belonging to the document image group, that the recognition process has been successful, and specifying the document image of which the specified document type is a reference type as a reference image;
A program for functioning as an estimation unit that estimates the attribute value of the document image determined to have failed in the recognition processing based on the attribute value of the document image specified by the reference image specifying unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015079233A JP2016200899A (en) | 2015-04-08 | 2015-04-08 | Information processing apparatus, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015079233A JP2016200899A (en) | 2015-04-08 | 2015-04-08 | Information processing apparatus, information processing method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016200899A true JP2016200899A (en) | 2016-12-01 |
Family
ID=57424377
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015079233A Pending JP2016200899A (en) | 2015-04-08 | 2015-04-08 | Information processing apparatus, information processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016200899A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019095848A (en) * | 2017-11-17 | 2019-06-20 | 富士ゼロックス株式会社 | Document processing apparatus and program |
JP2021005317A (en) * | 2019-06-27 | 2021-01-14 | キヤノン株式会社 | Image processing apparatus, method for controlling the same, and program |
WO2023209809A1 (en) * | 2022-04-26 | 2023-11-02 | 日本電気株式会社 | Information processing device, information processing method, information processing system, and recording medium |
-
2015
- 2015-04-08 JP JP2015079233A patent/JP2016200899A/en active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019095848A (en) * | 2017-11-17 | 2019-06-20 | 富士ゼロックス株式会社 | Document processing apparatus and program |
JP2021005317A (en) * | 2019-06-27 | 2021-01-14 | キヤノン株式会社 | Image processing apparatus, method for controlling the same, and program |
US11800024B2 (en) | 2019-06-27 | 2023-10-24 | Canon Kabushiki Kaisha | Image processing apparatus having checking image data erroneous recognition, method for control the same, and storage medium |
JP7446724B2 (en) | 2019-06-27 | 2024-03-11 | キヤノン株式会社 | Image processing device, its control method and program |
WO2023209809A1 (en) * | 2022-04-26 | 2023-11-02 | 日本電気株式会社 | Information processing device, information processing method, information processing system, and recording medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11868717B2 (en) | Multi-page document recognition in document capture | |
JP5989333B2 (en) | Medical system | |
US11328504B2 (en) | Image-processing device for document image, image-processing method for document image, and storage medium on which program is stored | |
JP6859977B2 (en) | Image processing equipment, image processing systems, image processing methods and programs | |
US20170099403A1 (en) | Document distribution system, document distribution apparatus, information processing method, and storage medium | |
US9311529B2 (en) | Image processing apparatus, image processing method, and non-transitory computer readable medium | |
US20170301092A1 (en) | Information processing system, information processing method, and program | |
US11010604B2 (en) | Documentation determination device and documentation determination program | |
JP2016200899A (en) | Information processing apparatus, information processing method, and program | |
JP6252614B2 (en) | Information processing apparatus, information processing system, information processing method, program, and storage medium | |
US20150227690A1 (en) | System and method to facilitate patient on-boarding | |
US11605219B2 (en) | Image-processing device, image-processing method, and storage medium on which program is stored | |
JP6579849B2 (en) | Interpretation report creation support system, interpretation report creation support method, and interpretation report creation support program | |
JP6610034B2 (en) | Information processing apparatus and information processing program | |
US20220292857A1 (en) | Information processing apparatus, information processing method, and recording medium | |
JP6917688B2 (en) | Form reader, form reading method, program, and form reading system | |
JP5356905B2 (en) | Document management apparatus, image reading apparatus, document management system, document management method, and program | |
JP2016091375A (en) | Information processing device and control method thereof | |
JP4321109B2 (en) | Form processing system, management server, correction device, and program | |
JP5962489B2 (en) | Medical image management system and image reading apparatus | |
JP2009230450A (en) | Document attribute information register and program | |
JP6804338B2 (en) | Report creation device, report creation system, and print confirmation program | |
JP2024068871A (en) | Drawing Management System | |
JP2023081564A (en) | Information representation pattern generation device and method | |
JP6547500B2 (en) | Image processing apparatus and image processing program |