JP6771906B2 - Information processing device and its control method and program - Google Patents

Information processing device and its control method and program Download PDF

Info

Publication number
JP6771906B2
JP6771906B2 JP2016043928A JP2016043928A JP6771906B2 JP 6771906 B2 JP6771906 B2 JP 6771906B2 JP 2016043928 A JP2016043928 A JP 2016043928A JP 2016043928 A JP2016043928 A JP 2016043928A JP 6771906 B2 JP6771906 B2 JP 6771906B2
Authority
JP
Japan
Prior art keywords
document data
information
flow definition
correction
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016043928A
Other languages
Japanese (ja)
Other versions
JP2017162033A5 (en
JP2017162033A (en
Inventor
小林 雄二
雄二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2016043928A priority Critical patent/JP6771906B2/en
Publication of JP2017162033A publication Critical patent/JP2017162033A/en
Publication of JP2017162033A5 publication Critical patent/JP2017162033A5/ja
Application granted granted Critical
Publication of JP6771906B2 publication Critical patent/JP6771906B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報処理装置及びその制御方法及びプログラムに関するものである。 The present invention relates to an information processing device and its control method and program.

文書に対する作業手順に従い各種業務の達成を図る文書処理ワークフローが広く用いられている。特に紙媒体に記載された文書情報をコンピュータシステムに取り込む文書処理ワークフローは文書認識技術の精度向上につれ一般オフィスワークから金融業、流通業、医療等の活用領域が拡大している。紙文書を用いた文書処理ワークフローにおいては、記載内容を自動認識して業務遂行に必要な情報を抽出する必要がある。抽出情報に誤りがあると業務が達成されなかったり、あるいは業務効率を著しく低下させてしまうため、自動認識結果を目視で確認し、誤りがあれば修正する業務も不可欠となっている。そのような目視確認、修正業務にかかる作業者の負担、時間を軽減するため、必要な場合のみ確認をするよう制御する文書ワークフローシステムも提案されている。特許文献1には文字認識結果の類似度と確信度とを比較し、人手による確認の要否を判定する技術が開示されている。また、文字認識などを自動処理する場合、実際に存在する語彙などを知識データとして保持し、知識データと照合することで認識精度を高める方式が考案されている。そのような知識参照による自動認識システムである特許文献2には、修正された文字認識の結果に基づき知識データの更新を行うことにより、誤りの修正結果を学習する方式が開示されている。 A document processing workflow that aims to achieve various tasks according to the work procedure for a document is widely used. In particular, the document processing workflow for importing document information written on paper media into a computer system is expanding its application area from general office work to financial industry, distribution industry, medical care, etc. as the accuracy of document recognition technology is improved. In a document processing workflow using a paper document, it is necessary to automatically recognize the description contents and extract information necessary for business execution. If there is an error in the extracted information, the work will not be achieved or the work efficiency will be significantly reduced. Therefore, it is indispensable to visually check the automatic recognition result and correct any mistake. In order to reduce the burden and time of workers involved in such visual confirmation and correction work, a document workflow system that controls confirmation only when necessary has also been proposed. Patent Document 1 discloses a technique for comparing the similarity and certainty of character recognition results and determining the necessity of manual confirmation. Further, in the case of automatically processing character recognition or the like, a method has been devised in which vocabulary or the like that actually exists is retained as knowledge data and collated with the knowledge data to improve recognition accuracy. Patent Document 2, which is an automatic recognition system based on such knowledge reference, discloses a method of learning an error correction result by updating knowledge data based on the corrected character recognition result.

特開2003−346080号公報Japanese Unexamined Patent Publication No. 2003-346080 特許2985813号公報Japanese Patent No. 2985813

上述した従来技術は、ワークフロー処理結果の修正が必要か否かを判別したり、認識結果の確からしさを高めるために知識データベースを更新することができる。しかしながら、学習処理として更新すべき知識データベースは認識候補を特定するための知識データ更新処理として既定されている。そのため、文書処理ワークフロー全体で学習効果を得るために、いずれの処理を実行しなければならないかについて言及されない。 The above-mentioned prior art can determine whether or not the workflow processing result needs to be modified, and can update the knowledge database in order to increase the certainty of the recognition result. However, the knowledge database to be updated as a learning process is defined as a knowledge data update process for identifying recognition candidates. Therefore, it is not mentioned which process must be performed in order to obtain the learning effect in the entire document processing workflow.

本発明は、文書処理を複合的に組み合わせて構成する文書処理ワークフローにおいて、修正されたワークフロー処理結果を参照して、次のワークフローを実行できるようにすることを目的とする。 An object of the present invention is to enable the next workflow to be executed by referring to the modified workflow processing result in a document processing workflow composed of a complex combination of document processing.

この課題を解決するため、例えば本発明の情報処理装置は以下の構成を備える。すなわち、
文書データに処理する情報処理装置であって、
処理対象の文書データと、当該文書データに対して行われる複数種類の処理とそれぞれの処理の順序を記述したフロー定義文書データとを入力する入力手段と、
前記フロー定義文書データに記述された順序に従った全処理を実行する実行手段と、
該実行手段による実行結果の誤りを、ユーザからの指示に従って修正する修正手段と、
前記フロー定義文書データに記述された処理の順序に対して逆の順に処理を実行し、各処理による処理の結果が前記修正手段による修正内容となるための情報を生成し、当該情報を記憶する記憶手段と、
前記記憶手段に記憶された情報に従った処理を実行させるための記述を前記フロー定義文書データに追加した新たなフロー定義文書データを、前記入力手段による入力対象として、生成する生成手段とを有する。
In order to solve this problem, for example, the information processing apparatus of the present invention has the following configuration. That is,
An information processing device that processes document data
An input means for inputting document data to be processed, a plurality of types of processing performed on the document data, and flow definition document data describing the order of each processing.
An execution means for executing all processes in the order described in the flow definition document data, and
A correction means for correcting an error in the execution result by the execution means according to an instruction from the user, and a correction means.
The processing is executed in the reverse order of the processing order described in the flow definition document data, information is generated so that the result of the processing by each processing becomes the correction content by the correction means, and the information is stored. Memories and
It has a generation means for generating new flow definition document data in which a description for executing a process according to the information stored in the storage means is added to the flow definition document data as an input target by the input means. ..

本発明によれば、文書処理ワークフローにて、ジョブの結果を修正した際に、同種の文書処理ジョブにおいてもユーザの修正結果を反映させることを可能にする。 According to the present invention, when the result of a job is modified in the document processing workflow, it is possible to reflect the modification result of the user in the same type of document processing job.

フロー制御装置のハードウェア構成の一例を示す図。The figure which shows an example of the hardware composition of the flow control device. フロー制御装置の機能ブロック構成図。Functional block configuration diagram of the flow control device. ジョブ実行制御モニタの一例を示す図。The figure which shows an example of a job execution control monitor. フロー定義文書の一例を示す図。The figure which shows an example of the flow definition document. フロー実行結果修正の一例を示す図。The figure which shows an example of flow execution result correction. フロー実行結果修正の一例を示す図。The figure which shows an example of flow execution result correction. フロー実行結果修正の一例を示す図。The figure which shows an example of flow execution result correction. フロー実行結果修正の一例を示す図。The figure which shows an example of flow execution result correction. フロー実行結果修正の記述例を示す図。The figure which shows the description example of the flow execution result correction. フロー制御装置の処理手順を示すフローチャート。A flowchart showing a processing procedure of a flow control device. 修正結果を再生可能とする処理手順を示すフローチャート。A flowchart showing a processing procedure for making the correction result reproducible. (a)は再生モードで情報抽出処理を実行する場合の入力の一例を示す図、(b)は記述例を示す図。(A) is a diagram showing an example of input when the information extraction process is executed in the reproduction mode, and (b) is a diagram showing a description example. (a)は再生モードで文字認識処理を実行する場合の入力の一例を示す図、(b)は記述例を示す図。(A) is a diagram showing an example of input when executing character recognition processing in the playback mode, and (b) is a diagram showing a description example. 修正テーブルの一例を示す図。The figure which shows an example of the correction table. 第2の実施形態における文書処理フロー定義文書の一例を示す図。The figure which shows an example of the document processing flow definition document in 2nd Embodiment.

以下、添付図面に従って本発明に係る実施形態を詳細に説明する。 Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings.

[第1実施形態]
図1は、本実施形態を適用する文書処理フロー制御装置(情報処理装置)100のハードウェア構成の一例を示す図である。ROM102には、CPU101が実行することになるプログラムを格納している。CPU101はROM102に格納されている制御プログラムを実行することにより、文書処理フロー制御装置100を制御する。CPU101がこのプログラムを実行することにより、後述する文書処理フロー制御装置100のソフトウェア構成及びフローチャートに示す各処理が実現される。RAM103は、各構成要素からの各種データを一時記憶する。また、RAM103は、CPU101が実行するプログラムを展開するための記憶領域としても利用される。文書処理部104は、CPU101からの指示に応じて文書処理フロー制御の処理を行う。表示部105は、液晶パネル等で構成され、文書処理部104の処理結果を表示する。通信部106はネットワークインターフェース(NIC)であり、ネットワーク上の他の装置とLANケーブル等を介した通信を可能とする。バス107は、上述したCPU101乃至通信部106の各機器間のデジタル信号を伝達する。
[First Embodiment]
FIG. 1 is a diagram showing an example of a hardware configuration of a document processing flow control device (information processing device) 100 to which this embodiment is applied. The ROM 102 stores a program to be executed by the CPU 101. The CPU 101 controls the document processing flow control device 100 by executing the control program stored in the ROM 102. By executing this program by the CPU 101, each process shown in the software configuration and the flowchart of the document processing flow control device 100 described later is realized. The RAM 103 temporarily stores various data from each component. The RAM 103 is also used as a storage area for developing a program executed by the CPU 101. The document processing unit 104 performs document processing flow control processing in response to an instruction from the CPU 101. The display unit 105 is composed of a liquid crystal panel or the like, and displays the processing result of the document processing unit 104. The communication unit 106 is a network interface (NIC), and enables communication with other devices on the network via a LAN cable or the like. The bus 107 transmits a digital signal between the devices of the CPU 101 and the communication unit 106 described above.

以上の構成要素を有する文書処理フロー制御装置100のCPU101は、後述するフローチャートの各処理を実行する。 The CPU 101 of the document processing flow control device 100 having the above components executes each process of the flowchart described later.

図2は、CPU101がROM102に格納されたプログラムを実行する際の、文書処理フロー制御装置100の機能ブロック構成図である。図示の各構成要素201乃至207は、プログラムを実行したCPU101が行うものであるが、これらの一部がハードウェアにより実現しても構わない。 FIG. 2 is a functional block configuration diagram of the document processing flow control device 100 when the CPU 101 executes a program stored in the ROM 102. Each of the components 201 to 207 shown in the figure is performed by the CPU 101 that executes the program, but some of them may be realized by hardware.

図2に示すように、文書処理フロー制御装置100は、ジョブ管理部201、ジョブ入力部202、ジョブ表示部203、ジョブ実行部204、ジョブ実行結果修正部205、修正結果再生部206、記憶部207を有する。記憶部207は、文書処理フロー制御装置100の文書処理フロー定義文書のほか、文書処理ジョブの状態、処理中の入出力の情報を記憶する。 As shown in FIG. 2, the document processing flow control device 100 includes a job management unit 201, a job input unit 202, a job display unit 203, a job execution unit 204, a job execution result correction unit 205, a correction result reproduction unit 206, and a storage unit. Has 207. The storage unit 207 stores the document processing flow definition document of the document processing flow control device 100, the state of the document processing job, and the input / output information during processing.

ジョブ入力部202は、不図示の入力源から、文書処理のワークフロー(以降、「文書処理フロー」とも記載する)を定義したフロー定義文書と処理対象となる入力データを入力し、文書処理ジョブとして文書処理ジョブ管理部201に供給する。入力源は特に問わないが、処理対象のデータはユーザがイメージスキャナを介して帳票の読取を行わせ、フロー定義文書はユーザが指定するものとして説明する。ジョブ管理部201は、入力したジョブを記憶管理するものである。そして、ジョブ管理部201は、入力ジョブの実行順を制御し、ジョブ表示部203によりジョブの実行状態をユーザに通知するとともに、ユーザからのジョブの実行、修正確認の指示を受け付ける。ジョブ実行部204は文書処理フロー定義文書に記憶される文書処理フローの実行順に従い、文書処理を実行する。ジョブ実行結果修正部205はジョブ実行部204の処理結果をジョブ表示部203に表示し、必要に応じてユーザの修正指示を受け付け、ジョブ実行結果を修正する。修正結果再生部206はジョブ実行結果修正部205で修正された結果を再現可能とするよう再生する処理を実行する。 The job input unit 202 inputs a flow definition document defining a document processing workflow (hereinafter, also referred to as “document processing flow”) and input data to be processed from an input source (not shown) as a document processing job. It is supplied to the document processing job management unit 201. The input source is not particularly limited, but the data to be processed is explained assuming that the user reads the form through the image scanner and the flow definition document is specified by the user. The job management unit 201 stores and manages the input job. Then, the job management unit 201 controls the execution order of the input jobs, notifies the user of the job execution status by the job display unit 203, and receives instructions from the user to execute the job and confirm the correction. The job execution unit 204 executes document processing according to the execution order of the document processing flow stored in the document processing flow definition document. The job execution result correction unit 205 displays the processing result of the job execution unit 204 on the job display unit 203, receives a user's correction instruction as necessary, and corrects the job execution result. The correction result reproduction unit 206 executes a process of reproducing the correction result by the job execution result correction unit 205 so as to be reproducible.

図3は、文書処理フロー制御装置100における、ジョブ表示部203が表示部105に表示するジョブ一覧の操作画面の一例を示す図である。図示において、参照符号300は、文書処理ジョブ実行制御モニタ表示を行うウインドウである。参照符号301は、ジョブ管理部201の制御対象となっているジョブを識別するジョブ識別番号である。参照符号302はジョブ識別番号301で識別されるジョブの実行状態を示すジョブステータスである。ジョブステータスには、以下の種類がある。
・入力ジョブが未実行である「実行待ち」
・ジョブ実行部204による実行中で処理が完了していない「実行中」
・処理フローを完了しジョブ実行結果修正部205による結果の確認修正が完了していない「確認待ち」
・ジョブ実行結果の修正確認が完了し、修正が生じなかった状態である「完了」
・ジョブ実行結果の修正が生じ、修正結果を再生可能にする処理を実行中である「再生フロー実行中」
・再生可能となったことを示す「再生完了」
上記の種類が識別可能に表示されることで、ユーザは各ジョブの状態を認識することができる。
FIG. 3 is a diagram showing an example of an operation screen of the job list displayed on the display unit 105 by the job display unit 203 in the document processing flow control device 100. In the figure, reference numeral 300 is a window for displaying a document processing job execution control monitor. Reference numeral 301 is a job identification number that identifies a job that is the control target of the job management unit 201. Reference numeral 302 is a job status indicating the execution status of the job identified by the job identification number 301. There are the following types of job status.
-"Waiting for execution" where the input job has not been executed
-"Running", which is being executed by the job execution unit 204 and the processing is not completed.
-"Waiting for confirmation" where the processing flow is completed and the confirmation and correction of the result by the job execution result correction unit 205 is not completed.
-"Complete", which is a state in which the correction confirmation of the job execution result is completed and no correction has occurred.
-The job execution result has been modified, and the process to make the modified result reproducible is being executed. "Reproduction flow is being executed."
-"Playback completed" indicating that playback is possible
By displaying the above types in an identifiable manner, the user can recognize the status of each job.

参照符号303は、ジョブの実行を取り消す中止ボタン305、実行待ち状態ジョブを即時実行する実行ボタン304を含む指示入力部である。ユーザが、この指示入力部を、不図示のマウスなどのポインティングデバイスで指示(クリック)することで、該当するジョブの実行、中止を指示することができる。なお、ジョブステータスが「完了」または「再生完了」のジョブの場合、そのジョブの実行、中止はできないため、指示入力部303には、実行ボタン304、中止ボタン305は表示されない。参照符号306は、ジョブ識別番号301のいずれかを表示領域内のクリック操作等により指定した場合、当該ジョブにおける入力画像のサムネイル画像を表示する。図示においては、指定されたジョブ識別番号“00182938”のサムネイル画像が表示される。 Reference numeral 303 is an instruction input unit including a stop button 305 for canceling the execution of the job and an execution button 304 for immediately executing the job in the execution waiting state. The user can instruct (click) the instruction input unit with a pointing device such as a mouse (not shown) to execute or cancel the corresponding job. In the case of a job whose job status is "completed" or "reproduction completed", the execution button 304 and the stop button 305 are not displayed on the instruction input unit 303 because the job cannot be executed or canceled. When any one of the job identification numbers 301 is specified by a click operation or the like in the display area, the reference code 306 displays a thumbnail image of the input image in the job. In the illustration, a thumbnail image of the designated job identification number “00182938” is displayed.

図4は文書処理フロー定義を指定するフロー定義文書の一例を示す図である。フロー定義文書はXML(eXtensible Markup Language)で記述され、<process_flow>がフロー定義文書全体を表す構造化要素である。<process>は実行する文書処理種別を指定する構造化要素であり、order属性で実行順が指定される。また、parameters属性で実行時のパラメータを指定することができる。図4ではinformation extractionの実行時は抽出情報を指定するpatient−id、document−type、department−nameの3種を指定する定義となっている。<process>要素によって指定される文書処理種別はジョブ実行部204が保持する文書処理サービスに対応するラベルである。ジョブ実行部204は文書処理種別に示されるラベルに対する文書処理サービスとを対応させ実行する。 FIG. 4 is a diagram showing an example of a flow definition document that specifies a document processing flow definition. The flow definition document is described in XML (eXtensible Markup Language), and <process_flow> is a structured element representing the entire flow definition document. <process> is a structured element that specifies the document processing type to be executed, and the execution order is specified by the orderer attribute. In addition, run-time parameters can be specified in the parameters attribute. In FIG. 4, when the information extension is executed, it is defined to specify three types, patient-id, document-type, and departure-name, which specify extraction information. The document processing type specified by the <process> element is a label corresponding to the document processing service held by the job execution unit 204. The job execution unit 204 executes the document processing service in association with the label indicated by the document processing type.

以下、図4の文書処理フロー定義文書に基づく、文書処理フロー制御を説明する。この文書フロー制御では、イメージスキャナで読み取ったレイアウト非定型の医療帳票の画像から、患者識別情報(patient−id)、文書種別情報(document−type)、文書の帰属診療科名(department−name)を抽出する。 Hereinafter, document processing flow control based on the document processing flow definition document of FIG. 4 will be described. In this document flow control, patient identification information (patient-id), document type information (document-type), and document belonging clinical department name (department-name) are used from the image of a medical form with a non-standard layout read by an image scanner. Is extracted.

図9は文書処理フロー制御装置における文書処理フロー実行制御の一例を示すフローチャートである。このフローチャートに係るプログラムは、CPU101が実行するものであるが、図2の構成に基づき説明する。 FIG. 9 is a flowchart showing an example of document processing flow execution control in the document processing flow control device. The program related to this flowchart is executed by the CPU 101, and will be described based on the configuration of FIG.

なお、記憶部207には、ジョブ入力部202により、複数の文書処理ジョブが既に入力され、ジョブ管理部201によって管理されているものとする。また、ジョブ入力部202は、処理対象の帳票画像が入力される度に、その帳票画像に対してユニークなジョブ識別番号を発行しているものとする。 It is assumed that a plurality of document processing jobs have already been input to the storage unit 207 by the job input unit 202 and are managed by the job management unit 201. Further, it is assumed that the job input unit 202 issues a unique job identification number for the form image each time the form image to be processed is input.

S900にて、ジョブ管理部201は、記憶部207にキューイングされている未実行ジョブを取得し、当該ジョブのジョブステータスを「実行待ち」から「実行中」に更新する。ジョブ表示部203は、ジョブステータスの更新に応じて表示画面を更新する。そして、S910にて、ジョブ管理部201は、取得した未実行のジョブに対する文書処理フロー定義文書を記憶部207より取得する。そして、ジョブ管理部201は、取得した情報をジョブ実行部204に渡し、ジョブの実行を行わせる。 In S900, the job management unit 201 acquires an unexecuted job queued in the storage unit 207, and updates the job status of the job from "waiting for execution" to "executing". The job display unit 203 updates the display screen according to the update of the job status. Then, in S910, the job management unit 201 acquires the document processing flow definition document for the acquired unexecuted job from the storage unit 207. Then, the job management unit 201 passes the acquired information to the job execution unit 204 to execute the job.

S920にて、ジョブ実行部204は、文書処理フロー定義文書の、先頭の<process>要素の文書処理を実行する。図4の文書処理フロー定義によれば、文字領域抽出(character extraction)の処理が、order属性1の最初の処理として記述されている。それ故、ジョブ実行部204は、入力した帳票の画像データの全域にわたって文字抽出処理を実行することになる。そして、ジョブ実行部204は、入力した帳票の画像データと、処理結果の出力データ(ここでは抽出した文字画像データ)とを、ジョブ識別番号に対応づけて、記憶部207に一時記憶する。 In S920, the job execution unit 204 executes the document processing of the first <process> element of the document processing flow definition document. According to the document processing flow definition of FIG. 4, the processing of character region extraction is described as the first processing of the order attribute 1. Therefore, the job execution unit 204 executes the character extraction process over the entire area of the input form image data. Then, the job execution unit 204 temporarily stores the input form image data and the processing result output data (here, the extracted character image data) in the storage unit 207 in association with the job identification number.

S930にて、ジョブ実行部204は、文書処理フロー定義に記載された全処理手順を実行したかどうかを判定し、全手順実行完了であればS940へ、未実行の文書処理があればS920へループし、次の文書処理を実行する。図4の文書処理フロー定義では文字領域抽出処理の次「order属性2」の文字認識(character recognition)がある。よって、ジョブ実行部204は、2回目のS920にて、先に抽出した文字画像に対する文字認識処理を実行する。この際、文書処理ジョブ実行部204は、文字認識対象の文字画像と文字認識結果(文字コード)とを、ジョブ識別番号と対応付けて記憶部207に一時記憶する。次いで、3回目のS920にて、「order属性3」の情報抽出(information extraction)の処理も同様に行う。図4のフロー定義文書によれば、ジョブ実行部204は、文字認識結果を受けて、文字認識結果である文字列から、患者識別情報(patient−id)を抽出する。更に、ジョブ実行部204は、文書種別情報(document−type)、文書の帰属診療科名(department−name)も抽出することになる。ジョブ実行部204は、文字認識結果と、抽出した患者識別情報(patient−id)、文書種別情報(document−type)、文書の帰属診療科名(department−name)を、ジョブ識別番号と対応づけて記憶部207に記憶する。この抽出を終えると次に行うべき処理がないので、ジョブ実行部204は処理を終える。このとき、ジョブ実行部204は、文書処理ジョブ管理部201に、該当するジョブの終了を通知する。 In S930, the job execution unit 204 determines whether or not all the processing procedures described in the document processing flow definition have been executed, and if all the procedures have been executed, go to S940, and if there is unexecuted document processing, go to S920. Loop and perform the next document processing. In the document processing flow definition of FIG. 4, there is character recognition (charactor recognition) of "order attribute 2" next to the character area extraction process. Therefore, the job execution unit 204 executes the character recognition process for the previously extracted character image in the second S920. At this time, the document processing job execution unit 204 temporarily stores the character image to be recognized and the character recognition result (character code) in the storage unit 207 in association with the job identification number. Next, in the third S920, the information extraction (information extraction) process of the "order attribute 3" is also performed in the same manner. According to the flow definition document of FIG. 4, the job execution unit 204 receives the character recognition result and extracts the patient identification information (patient-id) from the character string which is the character recognition result. Further, the job execution unit 204 also extracts the document type information (document-type) and the name of the clinical department to which the document belongs (department-name). The job execution unit 204 associates the character recognition result with the extracted patient identification information (patient-id), document type information (document-type), and document belonging clinical department name (department-name) with the job identification number. It is stored in the storage unit 207. When this extraction is completed, there is no processing to be performed next, so the job execution unit 204 finishes the processing. At this time, the job execution unit 204 notifies the document processing job management unit 201 of the end of the corresponding job.

S940に処理が進むのは、S900で取得したジョブの文書処理フロー実行が終了した場合である。そのため、ジョブ管理部201は、ユーザによる修正確認の実行指示の待機状態とするため、当該ジョブのジョブステータスを「実行中」から「確認待ち」に更新し、確認処理実行指示がされるまで待機する。ジョブ表示部203は、このステータス更新を受けて、表示画面を更新する。 The processing proceeds to S940 when the document processing flow execution of the job acquired in S900 is completed. Therefore, the job management unit 201 updates the job status of the job from "running" to "waiting for confirmation" in order to put the user in the waiting state for the execution instruction of the correction confirmation, and waits until the confirmation process execution instruction is given. To do. The job display unit 203 updates the display screen in response to this status update.

S950で、ジョブ管理部201は、図3に示す文書処理ジョブ実行制御モニタから当該ジョブの結果確認実行指示がされたかどうかを判定する。図3においてジョブ識別番号“00182938”のジョブステータス「確認待ち」になっていて、ユーザが、このジョブに対して「実行」をクリックしたとする。この場合、ジョブ識別番号“00182938”に対する確認処理が実行される。そのため、ジョブ管理部201は、ユーザが指示したジョブ識別番号“00182938”をジョブ実行結果修正部205に渡し、修正を行わせる。 In S950, the job management unit 201 determines whether or not the result confirmation execution instruction of the job is given from the document processing job execution control monitor shown in FIG. In FIG. 3, it is assumed that the job status of the job identification number “00182938” is “waiting for confirmation” and the user clicks “execute” for this job. In this case, the confirmation process for the job identification number “00182938” is executed. Therefore, the job management unit 201 passes the job identification number “00182938” instructed by the user to the job execution result correction unit 205 to make corrections.

S960にて、ジョブ実行結果修正部205は、ジョブ表示部203を制御し、ユーザが指定した文書処理ジョブ結果の修正を行うための編集画面を表示し、修正処理を行う。図5はその表示画面の例である。そして、S970にて、ジョブ実行結果修正部205は修正、並びに、確認処理を行う。ジョブ実行結果修正部205による修正確認の処理の詳細は、図5乃至図8A,Bを用いて後述する。 In S960, the job execution result correction unit 205 controls the job display unit 203, displays an edit screen for correcting the document processing job result specified by the user, and performs the correction process. FIG. 5 is an example of the display screen. Then, in S970, the job execution result correction unit 205 corrects and confirms. Details of the correction confirmation process by the job execution result correction unit 205 will be described later with reference to FIGS. 5 to 8A and 8B.

S980にて、ジョブ管理部201は、S970における修正確認の結果、修正結果を次回フロー実行に反映させるための再生処理が必要か否かを判定する。再生処理とは、一度行った文書処理フローに含まれる文書処理に対して修正結果を記憶させる処理である。次に再び文書処理をした時には、記憶された修正結果を出力(再生)する。図8Bに示す文書処理フロー実行結果の修正文書(又は編集情報)の<result>要素にchange属性が“1”となっているものがあれば、再生処理が必要である。また、change属性を持つ<result>要素がなければ、結果の確認のみで修正はされなかったと判定され、再生処理は不要となりジョブステータスを「確認待ち」から「完了」に更新して文書処理フロー制御の実行を終了する。 In S980, the job management unit 201 determines, as a result of the correction confirmation in S970, whether or not a reproduction process for reflecting the correction result in the next flow execution is necessary. The reproduction process is a process of storing the correction result for the document process included in the document processing flow once performed. The next time the document is processed again, the stored correction result is output (reproduced). If any of the <result> elements of the modified document (or editing information) of the document processing flow execution result shown in FIG. 8B has the change attribute of "1", the reproduction processing is required. In addition, if there is no <result> element with the change attribute, it is determined that the correction was not made only by checking the result, the playback process is unnecessary, and the job status is updated from "waiting for confirmation" to "completed" and the document processing flow. End the execution of control.

再生処理が必要と判定された場合、S990において、ジョブ管理部201は、修正結果再生部206に対し、修正結果を次回フロー実行に反映させるための再生処理の実行を要求する。かつ、ジョブ管理部201は、該当するジョブステータスを「確認待ち」から「再生完了」に更新して文書処理フロー制御の実行を終了する。修正結果再生部206によるS990の修正結果再生処理の詳細は図10を用いて後述する。 When it is determined that the reproduction process is necessary, in S990, the job management unit 201 requests the modification result reproduction unit 206 to execute the reproduction process for reflecting the modification result in the next flow execution. In addition, the job management unit 201 updates the corresponding job status from "waiting for confirmation" to "reproduction completed" and ends the execution of the document processing flow control. The details of the correction result reproduction processing of S990 by the correction result reproduction unit 206 will be described later with reference to FIG.

次に、S960における、実施形態におけるジョブ実行結果修正部205による修正処理を説明する。図5は文書処理ジョブ結果の修正を行うための編集画面の一例である。図示において、参照符号500はジョブ実行結果の確認および修正を行う編集画面を表示するウインドウである。参照符号501は、図3で確認実行指示された修正確認対象のジョブ識別番号を表示する領域である。参照符号502は、当該ジョブの処理対象帳票画像の全体を縮小画像で表示し、帳票画像の一部分503を、表示領域504に拡大表示される。表示領域504に表示されるのが、どの位置かを確認するため、縮小帳票画像の一部分503がハッチング表示される。 Next, the correction process by the job execution result correction unit 205 in the embodiment in S960 will be described. FIG. 5 is an example of an edit screen for correcting the document processing job result. In the figure, reference numeral 500 is a window for displaying an edit screen for confirming and correcting the job execution result. Reference numeral 501 is an area for displaying the job identification number of the correction confirmation target for which confirmation execution instruction is given in FIG. Reference numeral 502 displays the entire processing target form image of the job as a reduced image, and a part 503 of the form image is enlarged and displayed in the display area 504. A part 503 of the reduced form image is hatched and displayed in order to confirm which position is displayed in the display area 504.

詳細は以下の説明から明らかになるが、図5は、ジョブ実行部204が文書種別情報(document−type)として、本来の意図通りに“検査報告書”を抽出した例を示している。そして、図5は、ジョブ実行部204が患者情報(patient−id)として“123456”を抽出すべきところ誤って検査IDの“3579090”を抽出し、帰属診療科名(department−name)として“胸腹部検診センター”を抽出すべきところ誤って“総合診療科”を抽出した場合を示している。 The details will be clarified from the following description, but FIG. 5 shows an example in which the job execution unit 204 extracts the “inspection report” as the document type information (document-type) as originally intended. Then, in FIG. 5, the job execution unit 204 erroneously extracts the examination ID “3579090” where “123456” should be extracted as the patient information (patient-id), and “department-name” as the belonging clinical department name (department-name). It shows the case where "general clinical department" is mistakenly extracted where "chest and abdomen examination center" should be extracted.

図5に示すように、3つの出力結果(患者番号、文書種別、診療科)の情報が、処理対象の画像のどこに描出されているかを簡単に把握可能とするため、それぞれに矩形枠505、506、507が表示される。 As shown in FIG. 5, in order to make it possible to easily grasp where the information of the three output results (patient number, document type, clinical department) is drawn in the image to be processed, the rectangular frame 505 and the respective are respectively. 506 and 507 are displayed.

参照符号508は処理結果である抽出情報の属性(又は項目名)、参照符号509が抽出情報の値を表示する領域である。抽出結果表示領域509の特定のセル領域をクリック等により指定すると、対応する矩形領域表示とともに強調表示される。図5においては患者番号が“3579090”のセルと、矩形領域507が対応関係にある抽出結果として強調表示される。参照符号510は抽出結果を修正する際の入力領域である。また、参照符号511は他の抽出候補がある場合に表示されるアイコンであり、クリックすると候補リストがアイコン下に表示され選択可能となる。そして、参照符号512は完了ボタンであり、ユーザは、確認・修正操作を完了させるときに押下することになる。 Reference numeral 508 is an attribute (or item name) of the extraction information which is the processing result, and reference numeral 509 is an area for displaying the value of the extraction information. When a specific cell area of the extraction result display area 509 is specified by clicking or the like, it is highlighted together with the corresponding rectangular area display. In FIG. 5, the cell with the patient number “3579090” and the rectangular area 507 are highlighted as the corresponding extraction results. Reference numeral 510 is an input area for modifying the extraction result. Further, reference numeral 511 is an icon displayed when there are other extraction candidates, and when clicked, a candidate list is displayed below the icon and can be selected. The reference code 512 is a completion button, and the user presses the button when completing the confirmation / correction operation.

図6は図5の候補表示アイコン511をクリックした場合の表示例である。他の候補結果があれば、このアイコン511をクリックすると、その候補が表示され、その1つを選択することで、修正結果入力欄510に選択した候補が表示される。図示では、患者情報の他の候補“123456”が候補リスト602として表示されており、この候補をクリックすることで、患者番号に対応した編集結果入力欄510を更新できる。また、このとき、修正結果入力欄510の1つが文字入力用カーソルが点滅している(図示では、患者番号に対応する変数結果入力欄510)。ユーザは、不図示のキーボード等から、文字の挿入、削除などの編集操作が可能となる。また、患者番号として認識した矩形領域507がハイライト表示されるが、これは誤った領域であり、それ故、領域指定用カーソル601をマウス操作で移動し、正しい矩形領域600を指定することも可能である。図示の場合、矩形領域600が、本来の患者番号を示しているので、ユーザは矩形領域600の対角の2点を領域指定用カーソル601で設定する。正しい矩形領域600を設定しなおしたときに、ジョブ実行結果修正部205は該当する位置の文字認識結果(記憶部207に格納されている)をサーチし、その結果を修正結果入力欄510に表示する。なお、この正しい領域を設定した場合に、ユーザは、キーボード等から直接正しい患者番号“123456”を、修正結果入力欄510に入力しても構わない。上記のように、候補リスト602による操作、修正対象の抽出結果を選択した状態での領域指定用カーソル601による矩形領域の再設定、或いは、編集結果入力欄510へのダイレクト入力のいずれでも、患者情報を修正できる。 FIG. 6 is a display example when the candidate display icon 511 of FIG. 5 is clicked. If there are other candidate results, clicking this icon 511 will display the candidates, and by selecting one of them, the selected candidate will be displayed in the correction result input field 510. In the illustration, another candidate "123456" of the patient information is displayed as the candidate list 602, and by clicking this candidate, the edit result input field 510 corresponding to the patient number can be updated. At this time, the character input cursor is blinking in one of the correction result input fields 510 (in the figure, the variable result input field 510 corresponding to the patient number). The user can perform editing operations such as inserting and deleting characters from a keyboard (not shown) or the like. Also, the rectangular area 507 recognized as the patient number is highlighted, but this is an incorrect area. Therefore, the area designation cursor 601 may be moved by mouse operation to specify the correct rectangular area 600. It is possible. In the illustrated case, since the rectangular area 600 indicates the original patient number, the user sets two diagonal points of the rectangular area 600 with the area designation cursor 601. When the correct rectangular area 600 is reset, the job execution result correction unit 205 searches for the character recognition result (stored in the storage unit 207) at the corresponding position, and displays the result in the correction result input field 510. To do. When this correct area is set, the user may directly input the correct patient number “123456” into the correction result input field 510 from the keyboard or the like. As described above, either the operation by the candidate list 602, the resetting of the rectangular area by the area designation cursor 601 with the extraction result to be corrected selected, or the direct input to the edit result input field 510, the patient You can correct the information.

図7は出力結果となるべき矩形領域を指定して、処理結果を修正する場合の他の例を示す。図7において、診療科として抽出された結果「総合診療科」が誤っているが、他候補表示されていないため、矩形領域指定カーソル701により、矩形領域702の対角の2点を設定する。矩形領域702が確定すると、ジョブ実行結果修正部205は指定領域の文字認識処理を実行し、結果を修正結果入力欄510に表示する。 FIG. 7 shows another example in which the processing result is modified by designating the rectangular area to be the output result. In FIG. 7, although the “general clinical department” is incorrect as a result of being extracted as a clinical department, other candidates are not displayed. Therefore, two diagonal points of the rectangular area 702 are set by the rectangular area designation cursor 701. When the rectangular area 702 is determined, the job execution result correction unit 205 executes character recognition processing in the designated area and displays the result in the correction result input field 510.

図8Aは文書処理フロー実行結果修正の処理を完了させた状態を示している。図5乃至図7の操作により、文書処理フロー実行結果のうち、患者番号、診療科が修正され、修正結果入力欄に入力されており、抽出結果の最終確認結果に対応する矩形領域枠801、802、803が表示される。この状態でユーザが「完了ボタン」を押下することで、実行結果修正部206による修正の処理が終了する。 FIG. 8A shows a state in which the process of correcting the execution result of the document processing flow is completed. By the operation of FIGS. 5 to 7, the patient number and the clinical department are corrected in the document processing flow execution result and entered in the correction result input field, and the rectangular area frame 801 corresponding to the final confirmation result of the extraction result, 802 and 803 are displayed. When the user presses the "done button" in this state, the correction process by the execution result correction unit 206 ends.

図8Bは図8Aで完了ボタンが押下された際に、実行結果修正部206が生成した文書処理フロー実行結果の修正文書の例である。この修正文書verified_resultはresut要素として、修正あるいは確認完了された処理結果の領域座標、データ種別とその値の組が格納される。また、処理結果に修正があった場合、resut要素にchange属性が付加される。 FIG. 8B is an example of a document processing flow execution result correction document generated by the execution result correction unit 206 when the completion button is pressed in FIG. 8A. This modified document verified_result stores the region coordinates of the modified or confirmed processing result, the data type, and the set of the values as the reset element. Further, when the processing result is modified, the change attribute is added to the reset element.

図10は、図9のS990における修正結果再生部206の処理の動作フローチャートである。以下、同図を参照して、修正結果再生部206の処理を説明する。 FIG. 10 is an operation flowchart of the processing of the correction result reproduction unit 206 in S990 of FIG. Hereinafter, the processing of the correction result reproduction unit 206 will be described with reference to the figure.

S1000にて、修正結果再生部206は、文書処理フローの実行結果確認が行われたジョブの文書処理フロー定義から処理手順を取得する。S1010にて、修正結果再生部206は、処理手順の末尾、すなわち、図4のprocess要素におけるorder属性が最大の処理からorder属性の降順に、S1020で処理を順次実行する。 In S1000, the correction result reproduction unit 206 acquires the processing procedure from the document processing flow definition of the job for which the execution result of the document processing flow has been confirmed. In S1010, the modification result reproduction unit 206 sequentially executes the processing in S1020 at the end of the processing procedure, that is, in descending order of the order attribute from the processing in which the order attribute in the process element of FIG. 4 is maximum.

S1020にて、修正結果再生部206は、S1010で取得した処理を通常の文書処理実行とは異なる結果を記憶するための再生モードで実行する。この再生モードでは、修正結果再生部206は、各処理は指定される入力データを処理した結果に、同じく指定される出力結果が含まれるか否かを判定する。そして、含まれていれば、修正結果再生部206は、出力すべき結果となるよう、記憶部207に記憶されている文書処理結果の修正情報を記憶するテーブル(以下、修正テーブル)に記憶する。この修正テーブルについては、図13を用いて後述する。文書処理実行時には修正テーブルに記憶されたパターンが存在すれば、記憶されたパターンを出力する。 In S1020, the correction result reproduction unit 206 executes the process acquired in S1010 in a reproduction mode for storing a result different from the normal document processing execution. In this reproduction mode, the modification result reproduction unit 206 determines whether or not each process includes the output result also specified in the result of processing the specified input data. Then, if it is included, the correction result reproduction unit 206 stores the correction information of the document processing result stored in the storage unit 207 in a table (hereinafter referred to as a correction table) so as to obtain a result to be output. .. This modification table will be described later with reference to FIG. When the document processing is executed, if the pattern stored in the modification table exists, the stored pattern is output.

S1030にて、修正結果再生部206は、図8Bの修正結果文書に記載されたすべての出力が再生可能となるよう修正テーブルに記憶されたと判定した場合、本処理を終了する。再生可能とならない修正結果があれば処理をS1040に進む。 When the correction result reproduction unit 206 determines in S1030 that all the outputs described in the correction result document of FIG. 8B are stored in the correction table so as to be reproducible, the present process is terminated. If there is a correction result that cannot be reproduced, the process proceeds to S1040.

S1040において、修正結果再生部206は、S1000で取得された処理手順のすべてを終了したか否かを判定する。終了したと判定した場合は、処理をS1050へ進め、否の場合、つまり、未実行の処理があれば、S1020へループし、再生モードで実行する。 In S1040, the correction result reproduction unit 206 determines whether or not all the processing procedures acquired in S1000 have been completed. If it is determined that the process is completed, the process proceeds to S1050, and if not, that is, if there is an unexecuted process, the process loops to S1020 and is executed in the playback mode.

S1050にて、修正結果再生部206は、すべての修正結果が再生可能となっていないが、処理手順のすべてを完了したならば、再生可能となっていない修正結果を修正テーブルに記憶して終了する。 In S1050, the correction result reproduction unit 206 stores all the correction results that are not reproducible in the correction table and ends when all the processing procedures are completed. To do.

図11(a)および(b)は修正結果再生部206が、再生モードで情報抽出処理を実行する場合に参照する入力情報の例を示している。情報抽出処理は文書画像中の特定文字列をレイアウト情報も考慮して抽出するため、修正結果再生部206は、文字認識結果である文字列データと、その領域座標情報を入力とする。図11(b)は、図11(a)に示す文書画像から抽出された文字認識結果を格納した入力情報である。region要素が1つの文字領域における文字認識結果であり、id属性1、2、…、8のregion要素がそれぞれ図11(a)の参照符号1101、1102、…、1108に対応している。図11(b)において途中省略しているが、id属性3、4、5、6、7についても図11(a)のそれぞれの矩形表示領域に対応する。一方,図11(a)に記載される「胸腹部検診センター」は文字領域として認識されておらず,対応する文字情報が図11(b)に格納されない。各region要素には複数の文字認識結果char要素を格納でき、cand属性で識別される。例えば,region要素idが1の文字認識結果はcand属性1の「検査報告書」,cand属性2の「倹査報告書」の2つの候補文字列が格納されている。これら入力データに基づき、修正結果データである図8Bが再生可能となるよう、修正テーブルへ登録する。図8Bの場合、修正結果のresult要素のidが2である「検査報告書」、idが3である「123456」については入力情報に選択肢1101、1104として含まれている。このため、情報抽出処理での修正結果再生が可能といえるが、修正結果のresult要素のidが1である「胸腹部健診センター」は入力情報に選択肢として含まれていないため、情報抽出処理の処理対象とならず、修正結果再生はできない。 11 (a) and 11 (b) show an example of the input information referred to when the correction result reproduction unit 206 executes the information extraction process in the reproduction mode. Since the information extraction process extracts a specific character string in the document image in consideration of the layout information, the correction result reproduction unit 206 inputs the character string data which is the character recognition result and the area coordinate information thereof. FIG. 11B is input information storing the character recognition result extracted from the document image shown in FIG. 11A. The region element is the character recognition result in one character area, and the region elements of id attributes 1, 2, ..., 8 correspond to the reference codes 1101, 1102, ..., 1108 of FIG. 11 (a), respectively. Although omitted in the middle in FIG. 11B, the id attributes 3, 4, 5, 6 and 7 also correspond to the respective rectangular display areas in FIG. 11A. On the other hand, the "chest and abdomen examination center" shown in FIG. 11 (a) is not recognized as a character area, and the corresponding character information is not stored in FIG. 11 (b). A plurality of character recognition result char elements can be stored in each region element, and are identified by the can attribute. For example, the character recognition result having the region element id 1 stores two candidate character strings, that is, the "inspection report" of the cand attribute 1 and the "inspection report" of the cand attribute 2. Based on these input data, the correction result data, FIG. 8B, is registered in the correction table so that it can be reproduced. In the case of FIG. 8B, the “inspection report” in which the id of the result element of the correction result is 2 and the “123456” in which the id is 3 are included in the input information as options 1101 and 1104. Therefore, it can be said that the correction result can be reproduced in the information extraction processing, but since the "chest and abdomen medical examination center" in which the id of the result element of the correction result is 1 is not included as an option in the input information, the information extraction processing The correction result cannot be reproduced because it is not processed by.

図12(a)及び(b)は、修正結果再生部206が、再生モードで文字認識処理を実行する場合に参照する入力情報の例を示す。文字認識処理は文書画像中の文字が描画された領域内の字形パターンを認識して文字コード列を出力するため、文字が描画された領域座標を入力とする。図12(b)は図12(a)に示す文書画像から抽出された文字描画領域座標を格納した入力情報である。region要素が1つの文字描画領域であり、id属性1、2、8のregion要素がそれぞれ図11(a)の参照符号1101、1102、1108に対応している。図12(b)において途中省略しているが、id属性3、4、5、6、7についても図12(a)のそれぞれの文字描画領域に対応する。これら入力データに基づき、修正結果データである図8Bが再生可能となるよう、修正テーブルへ登録する。図12(a)の場合、修正結果のresult要素のidが2である「検査報告書」、idが3である「123456」については入力情報に選択肢1201、1204として含まれている。このため、文字認識処理での修正結果再生が可能といえるが、修正結果のresult要素のidが1である「胸腹部健診センター」は入力情報に選択肢として含まれていないため、文字認識処理の処理対象とならず、修正結果再生はできない。 12 (a) and 12 (b) show an example of input information referred to when the correction result reproduction unit 206 executes the character recognition process in the reproduction mode. Since the character recognition process recognizes the character pattern in the area where the characters in the document image are drawn and outputs the character code string, the area coordinates where the characters are drawn are input. FIG. 12B is input information storing the character drawing area coordinates extracted from the document image shown in FIG. 12A. The region element is one character drawing area, and the region elements of id attributes 1, 2 and 8 correspond to the reference codes 1101, 1102 and 1108 of FIG. 11 (a), respectively. Although omitted in the middle of FIG. 12B, the id attributes 3, 4, 5, 6 and 7 also correspond to the respective character drawing areas of FIG. 12A. Based on these input data, the correction result data, FIG. 8B, is registered in the correction table so that it can be reproduced. In the case of FIG. 12A, the “inspection report” in which the id of the result element of the correction result is 2 and the “123456” in which the id is 3 are included in the input information as options 1201 and 1204. Therefore, it can be said that the correction result can be reproduced by the character recognition processing, but since the "chest and abdomen medical examination center" in which the id of the result element of the correction result is 1 is not included as an option in the input information, the character recognition processing It is not processed and the correction result cannot be reproduced.

図13は修正結果を再生可能とするために記憶される修正テーブルの一例を示す図である。修正テーブルはRAM103に保持したり、通信部106を介して不図示の外部記憶装置に保持したり、あるいはバス107に接続された不図示の外部記憶装置に保持するよう構成される。 FIG. 13 is a diagram showing an example of a correction table stored to make the correction result reproducible. The modification table is configured to be held in the RAM 103, held in an external storage device (not shown) via the communication unit 106, or held in an external storage device (not shown) connected to the bus 107.

フィールド1300は入力データ識別情報であり、記憶対象の入力画像データを保持した保存場所のURL(Universal Resource Locator)を格納する。フィールド1301、1302、1303、1304は入力データにおける特定の矩形領域のX座標、Y座標、領域の高さを表すピクセル数、領域の幅を表すピクセル数をそれぞれ格納する。フィールド1306は、フィールド1301乃至1304が示す特定領域を構成する画像データであり、画像を構成する画素データ配列、または画素データ配列から算出された特徴量データ配列などを格納し、フィールド1305はそのデータサイズを格納する。フィールド1307は、フィールド1301乃至1304が示す特定領域に描画されている内容のデータ属性であり、本実施形態においては「患者番号」、「文書種別」、「診療科」のいずれかが格納される。フィールド1308は、フィールド1301乃至1304が示す特定領域に描画されている内容を格納する。 The field 1300 is input data identification information, and stores the URL (Universal Resource Locator) of the storage location that holds the input image data to be stored. The fields 1301, 1302, 1303, and 1304 store the X coordinate and Y coordinate of a specific rectangular area in the input data, the number of pixels representing the height of the area, and the number of pixels representing the width of the area, respectively. The field 1306 is image data constituting a specific area indicated by the fields 1301 to 1304, and stores the pixel data array constituting the image, the feature amount data array calculated from the pixel data array, and the like, and the field 1305 is the data. Store the size. The field 1307 is a data attribute of the content drawn in the specific area indicated by the fields 1301 to 1304, and in the present embodiment, any one of "patient number", "document type", and "clinical department" is stored. .. The field 1308 stores the content drawn in the specific area indicated by the fields 1301 to 1304.

以上説明したように、本第1実施形態によれば、帳票画像に対するジョブ(予め設定された項目の文字列抽出に至る処理)に対するユーザによる修正(編集)結果を、次回のジョブの実行時に優先させることになる。例えば、レイアウトが異なるが、同じ目的の帳票画像を入力した場合、その中に「胸腹部検診センター」があれば、それが文書の帰属診療科名(department−name)として抽出されるようになる。 As described above, according to the first embodiment, the result of modification (editing) by the user for the job (process leading to the extraction of the character string of the preset item) for the form image is prioritized when the next job is executed. Will let you. For example, if a form image with a different layout but the same purpose is input, and if there is a "chest and abdomen examination center" in it, it will be extracted as the department name (department-name) of the document. ..

[第2実施形態]
上記の第1実施形態では、文書処理フロー定義に基づき実行した処理結果がユーザが望んでいなかった場合に修正を行い、その修正結果を次回の文書処理フロー実行時に再生するよう、フロー定義された処理を逆順に実行することにより修正結果を記憶した。
[Second Embodiment]
In the first embodiment described above, the flow is defined so that the processing result executed based on the document processing flow definition is corrected when the user does not want it, and the correction result is reproduced at the next document processing flow execution. The correction result was memorized by executing the processing in reverse order.

本第2実施形態では、修正結果を再生実行するよう文書処理のフロー定義文書を再定義することにより修正結果の記憶を行う。 In the second embodiment, the correction result is stored by redefining the flow definition document of the document processing so that the correction result is reproduced and executed.

図14は、修正結果を再生するために実行すべき再生記憶処理を記載した文書処理フロー定義文書の一例を示している。処理順定義をするprocess要素は図4と同様であるが、再生記憶処理定義部であるfeedback要素が追加される。feedback要素は図8Bの修正結果要素によって再生記憶処理を実行する処理を格納する。result_typeは修正結果要素を示し、regionであれば、図8Bにおけるregion要素に対応する。process要素は指定のresult_typeに対する再生記憶処理のために実行する処理を格納する。図4における文書処理フロー定義と同様、order属性を付加して複数の処理を連結することもできる。 FIG. 14 shows an example of a document processing flow definition document that describes the reproduction storage process to be executed in order to reproduce the correction result. The process element that defines the processing order is the same as in FIG. 4, but the feedback element that is the reproduction storage processing definition unit is added. The feedback element stores a process of executing the reproduction storage process according to the modification result element of FIG. 8B. result_type indicates a modification result element, and if it is a region, it corresponds to the region element in FIG. 8B. The process element stores the process to be executed for the reproduction storage process for the specified result_type. Similar to the document processing flow definition in FIG. 4, a plurality of processes can be concatenated by adding an orderer attribute.

図14を用いた修正結果再生処理においては、処理手順取得後、修正結果に含まれる修正結果要素を再生記憶する処理をfeedback要素から取得して実行することで、修正結果の再生記憶が実行される。 In the correction result reproduction processing using FIG. 14, after the processing procedure is acquired, the correction result reproduction storage is executed by acquiring and executing the processing for reproducing and storing the correction result element included in the correction result from the feedback element. To.

[第3実施形態]
第1、第2実施形態においては、修正結果を再生するための記憶情報を無条件に格納するように構成することで、同種のワークフロージョブの修正結果の再現を図っている。一方、再生記憶情報を活用することにより他のジョブの結果が変わってしまう可能性が考慮される。そこで、過去実行した文書処理ジョブを蓄積し、再生記憶情報を適用して蓄積ジョブを再実行して、修正結果が得られる比率が一定所定値以上になる場合のみ、当該再生記憶情報を残し、そうでなければ当該再生記憶情報を削除する。また、再生記憶情報を削除した場合、図3のジョブステータス302に「再生不能」を表示ステータスとして追加するように構成する。
[Third Embodiment]
In the first and second embodiments, the modification result of the same type of workflow job is reproduced by configuring the storage information for reproducing the modification result to be unconditionally stored. On the other hand, the possibility that the results of other jobs may change by utilizing the regenerated memory information is considered. Therefore, the document processing jobs executed in the past are accumulated, the reproduction storage information is applied, and the accumulation job is re-executed, and the reproduction storage information is left only when the ratio for obtaining the correction result becomes a certain predetermined value or more. If not, the reproduction storage information is deleted. Further, when the reproduction storage information is deleted, "unreproducible" is added as a display status to the job status 302 of FIG.

(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
(Other Examples)
The present invention is also realized by executing the following processing. That is, software (program) that realizes the functions of the above-described embodiment is supplied to the system or device via a network or various storage media, and the computer (or CPU, MPU, etc.) of the system or device reads the program. This is the process to be executed.

100…文書処理フロー制御装置、101…CPU、102…ROM、103…RAM、104…文書処理部、105…表示部、106…通信部、107…バス、201…ジョブ管理部、202…ジョブ入力部、203…ジョブ表示部、204…ジョブ実行部、205…ジョブ実行結果修正部、206…修正結果再生部、207…記憶部 100 ... Document processing flow control device, 101 ... CPU, 102 ... ROM, 103 ... RAM, 104 ... Document processing unit, 105 ... Display unit, 106 ... Communication unit, 107 ... Bus, 201 ... Job management unit, 202 ... Job input Unit, 203 ... Job display unit, 204 ... Job execution unit, 205 ... Job execution result correction unit, 206 ... Correction result playback unit, 207 ... Storage unit

Claims (10)

文書データに処理する情報処理装置であって、
処理対象の文書データと、当該文書データに対して行われる複数種類の処理とそれぞれの処理の順序を記述したフロー定義文書データとを入力する入力手段と、
前記フロー定義文書データに記述された順序に従った全処理を実行する実行手段と、
該実行手段による実行結果の誤りを、ユーザからの指示に従って修正する修正手段と、
前記フロー定義文書データに記述された処理の順序に対して逆の順に処理を実行し、各処理による処理の結果が前記修正手段による修正内容となるための情報を生成し、当該情報を記憶する記憶手段と、
前記記憶手段に記憶された情報に従った処理を実行させるための記述を前記フロー定義文書データに追加した新たなフロー定義文書データを、前記入力手段による入力対象として、生成する生成手段と
を有することを特徴とする情報処理装置。
An information processing device that processes document data
An input means for inputting document data to be processed, a plurality of types of processing performed on the document data, and flow definition document data describing the order of each processing .
An execution means for executing all processes in the order described in the flow definition document data, and
A correction means for correcting an error in the execution result by the execution means according to an instruction from the user, and a correction means.
The processing is executed in the reverse order of the processing order described in the flow definition document data, information is generated so that the result of the processing by each processing becomes the correction content by the correction means, and the information is stored. Memories and
It has a generation means for generating a new flow definition document data in which a description for executing a process according to the information stored in the storage means is added to the flow definition document data as an input target by the input means. An information processing device characterized by this.
前記フロー定義文書データには、文字領域の抽出処理、抽出した文字領域の文字認識処理、並びに、認識された文字で構成される文字列を設定された種類を示す情報として抽出する抽出処理を表す記述が含まれ、The flow definition document data represents an extraction process of a character area, a character recognition process of the extracted character area, and an extraction process of extracting a character string composed of recognized characters as information indicating a set type. The description is included,
前記修正手段は、The correction means
前記抽出処理で抽出された文字列が、設定された種類を示す正しい文字列か誤った文字列か、並びに、誤った文字列であれば正しい文字列を指定する指定手段を含み、The character string extracted by the extraction process includes a correct character string or an incorrect character string indicating the set type, and a specifying means for designating the correct character string if the character string is incorrect.
前記記憶手段は、The storage means
前記設定された種類と、前記文書データにおける前記指定手段で指定された正しい文字列が存在する領域を示す情報を記憶するStores information indicating the set type and the area in which the correct character string specified by the designated means in the document data exists.
ことを特徴とする請求項1に記載の情報処理装置。The information processing apparatus according to claim 1.
前記入力手段は、イメージスキャナで文書を読み取って得たイメージデータを前記文書データとして入力することを特徴とする請求項1又は2に記載の情報処理装置。The information processing apparatus according to claim 1 or 2, wherein the input means inputs image data obtained by reading a document with an image scanner as the document data. 前記入力手段は、フロー定義文書データを記憶管理するための管理手段から、ユーザが指定したフロー定義文書データを入力するThe input means inputs the flow definition document data specified by the user from the management means for storing and managing the flow definition document data.
ことを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。The information processing device according to any one of claims 1 to 3, wherein the information processing device is characterized by the above.
文書データに処理する情報処理装置であって、An information processing device that processes document data
処理対象の文書データと、当該文書データに対して行われる複数種類の処理とそれぞれの処理の順序を記述したフロー定義文書データとを入力する入力手段と、An input means for inputting document data to be processed, a plurality of types of processing performed on the document data, and flow definition document data describing the order of each processing.
前記フロー定義文書データに記述された順序に従った全処理を実行する実行手段と、An execution means for executing all processes in the order described in the flow definition document data, and
該実行手段による実行結果の誤りを、ユーザからの指示に従って修正する修正手段と、A correction means for correcting an error in the execution result by the execution means according to an instruction from the user, and a correction means.
前記フロー定義文書データに記述された処理の結果が前記修正手段による修正内容となるための情報を生成し、当該情報を記憶する記憶手段と、A storage means for generating information for the result of the process described in the flow definition document data to be the correction content by the correction means and storing the information, and a storage means for storing the information.
前記記憶手段に記憶された情報に従った処理を実行させるための記述を前記フロー定義文書データに追加した新たなフロー定義文書データを、前記入力手段による入力対象として、生成する生成手段とA generation means for generating new flow definition document data in which a description for executing a process according to the information stored in the storage means is added to the flow definition document data as an input target by the input means.
を有することを特徴とする情報処理装置。An information processing device characterized by having.
前記フロー定義文書データには、文字領域を抽出する処理、当該抽出で得た文字領域の文字認識処理、抽出すべき情報の種類に従った文字列を選択する処理が含まれ、The flow definition document data includes a process of extracting a character area, a character recognition process of the character area obtained by the extraction, and a process of selecting a character string according to the type of information to be extracted.
前記修正手段は、前記処理対象の文書データにおける、正しい文字列が存在する正しい領域を指定する手段を含み、 The correction means includes means for designating the correct area in which the correct character string exists in the document data to be processed.
前記記憶手段は、前記正しい領域を特定する座標情報を記憶するThe storage means stores coordinate information that identifies the correct area.
ことを特徴とする請求項5に記載の情報処理装置。The information processing apparatus according to claim 5.
前記記憶手段は、前記座標情報を、抽出すべき情報の種類と関連付けて記憶するThe storage means stores the coordinate information in association with the type of information to be extracted.
ことを特徴とする請求項6に記載の情報処理装置。The information processing apparatus according to claim 6.
文書データを処理する情報処理装置の制御方法であって、
処理対象の文書データと、当該文書データに対して行われる複数種類の処理とそれぞれの処理の順序を記述したフロー定義文書データとを入力する入力工程と、
前記フロー定義文書データに記述された順序に従った全処理を実行する実行工程と、
該実行工程による実行結果の誤りを、ユーザからの指示に従って修正する修正工程と、
前記フロー定義文書データに記述された処理の順序に対して逆の順に処理を実行し、各処理による処理の結果が前記修正工程による修正内容となるための情報を生成し、当該情報を記憶する記憶工程と、
前記記憶工程で記憶された情報に従った処理を実行させるための記述を前記フロー定義文書データに追加した新たなフロー定義文書データを、前記入力工程による入力対象として、生成する生成工程と
を有することを特徴とする情報処理装置の制御方法。
A control method for an information processing device that processes document data .
An input process for inputting document data to be processed, a plurality of types of processing performed on the document data, and flow definition document data describing the order of each processing .
An execution process that executes all processes in the order described in the flow definition document data, and
A correction step of correcting an error in the execution result by the execution process according to an instruction from the user ,
The processing is executed in the reverse order of the processing order described in the flow definition document data, information is generated so that the result of the processing by each processing becomes the correction content by the correction step, and the information is stored. Memory process and
It has a generation step of generating new flow definition document data in which a description for executing a process according to the information stored in the storage step is added to the flow definition document data as an input target by the input step. A control method for an information processing device, which is characterized in that.
文書データに処理する情報処理装置の制御方法であって、It is a control method of an information processing device that processes document data.
処理対象の文書データと、当該文書データに対して行われる複数種類の処理とそれぞれの処理の順序を記述したフロー定義文書データとを入力する入力工程と、An input process for inputting document data to be processed, a plurality of types of processing performed on the document data, and flow definition document data describing the order of each processing.
前記フロー定義文書データに記述された順序に従った全処理を実行する実行工程と、An execution process that executes all processes in the order described in the flow definition document data, and
該実行工程による実行結果の誤りを、ユーザからの指示に従って修正する修正工程と、A correction step of correcting an error in the execution result by the execution process according to an instruction from the user,
前記フロー定義文書データに記述された処理の結果が前記修正工程による修正内容となるための情報を生成し、当該情報を記憶する記憶工程と、A storage process for generating information for the result of the process described in the flow definition document data to be the content of the correction by the correction step and storing the information,
前記記憶工程で記憶された情報に従った処理を実行させるための記述を前記フロー定義文書データに追加した新たなフロー定義文書データを、前記入力工程による入力対象として、生成する生成工程とA generation step of generating new flow definition document data in which a description for executing a process according to the information stored in the storage step is added to the flow definition document data as an input target by the input step.
を有することを特徴とする情報処理装置の制御方法。A method for controlling an information processing device, which comprises.
コンピュータに実行させることで、前記コンピュータに、請求項8又は9に記載の情報処理装置の制御方法が有する各工程を実行させるためのプログラム。 A program for causing the computer to execute each step of the control method of the information processing apparatus according to claim 8 or 9 .
JP2016043928A 2016-03-07 2016-03-07 Information processing device and its control method and program Active JP6771906B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016043928A JP6771906B2 (en) 2016-03-07 2016-03-07 Information processing device and its control method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016043928A JP6771906B2 (en) 2016-03-07 2016-03-07 Information processing device and its control method and program

Publications (3)

Publication Number Publication Date
JP2017162033A JP2017162033A (en) 2017-09-14
JP2017162033A5 JP2017162033A5 (en) 2019-04-11
JP6771906B2 true JP6771906B2 (en) 2020-10-21

Family

ID=59857999

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016043928A Active JP6771906B2 (en) 2016-03-07 2016-03-07 Information processing device and its control method and program

Country Status (1)

Country Link
JP (1) JP6771906B2 (en)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005266925A (en) * 2004-03-16 2005-09-29 Toshiba Solutions Corp Form reader, program and form reading method by form reader
JP5353476B2 (en) * 2009-06-24 2013-11-27 富士ゼロックス株式会社 Document transmission apparatus, document transmission program, and document flow system
JP2012190357A (en) * 2011-03-11 2012-10-04 Murata Mach Ltd Image processing device, image processing method and program
JP5961196B2 (en) * 2014-01-29 2016-08-02 京セラドキュメントソリューションズ株式会社 Electronic device and workflow generation program
JP2016015007A (en) * 2014-07-02 2016-01-28 株式会社リコー Information processing apparatus, information processing system, information processing method, and program

Also Published As

Publication number Publication date
JP2017162033A (en) 2017-09-14

Similar Documents

Publication Publication Date Title
US7979849B2 (en) Automatic model-based testing
KR101076867B1 (en) Automatic image capture for generating content
US20170212732A1 (en) Multi-technology visual integrated data management and analytics development and deployment environment
JP5267732B2 (en) Web page control method, computer system, and program
JP2007026316A (en) Image management device, image-managing computer program and recording medium recording the same
EP3113016A1 (en) Tracing dependencies between development artifacts in a development project
JP4826120B2 (en) Business specification creation support system and method
JP2016009423A (en) Information processing device, method for controlling information processing device, and program
JP6771906B2 (en) Information processing device and its control method and program
JPH11305998A (en) Computer system
JP6336922B2 (en) Business impact location extraction method and business impact location extraction device based on business variations
CN113807698A (en) Work order generation method and device, electronic equipment and readable storage medium
JP6552162B2 (en) Information processing apparatus, information processing method, and program
JP4867229B2 (en) Information processing apparatus and program
JP4683535B2 (en) Job net management system
JP2020009169A (en) Information processing system and program for supporting attachment of note
JP4357226B2 (en) Form definition device, form definition method, and form definition program
JP2001273125A (en) Method and system for automatically generating source program, and program recording medium therefor
JP2007034807A (en) Information processor and program
JP2002298081A (en) Optical character recognition device and field definition method of document reading definition body
JP7395934B2 (en) Information processing device and program
JP2007034806A (en) Information processor and program
JP2008009966A (en) Device and method for setting business process
JP2009064347A (en) Work support information display, and work support information display method
CN112306333A (en) Data filling method and device

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190304

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190304

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200131

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200330

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200831

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200930

R151 Written notification of patent or utility model registration

Ref document number: 6771906

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151