JP2009187352A - Document data verification method and document data verification support system - Google Patents

Document data verification method and document data verification support system Download PDF

Info

Publication number
JP2009187352A
JP2009187352A JP2008027518A JP2008027518A JP2009187352A JP 2009187352 A JP2009187352 A JP 2009187352A JP 2008027518 A JP2008027518 A JP 2008027518A JP 2008027518 A JP2008027518 A JP 2008027518A JP 2009187352 A JP2009187352 A JP 2009187352A
Authority
JP
Japan
Prior art keywords
document data
verification
image
information
terminal device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008027518A
Other languages
Japanese (ja)
Inventor
Masashi Matsumoto
政志 松本
Noriyuki Kashima
則幸 鹿島
Yoshiyuki Tsuruta
義幸 鶴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FOREX CO Ltd
Original Assignee
FOREX CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FOREX CO Ltd filed Critical FOREX CO Ltd
Priority to JP2008027518A priority Critical patent/JP2009187352A/en
Publication of JP2009187352A publication Critical patent/JP2009187352A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Character Discrimination (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To improve the accuracy of verification and to stabilize the processing speed of the verification. <P>SOLUTION: By comparing an image of unprocessed document data and an image of processed document data simultaneously with reading and comparing information on the processed document data by voice for verification, the accuracy of the verification is improved and the processing speed of the verification is stabilized. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、個人または法人が扱う、例えば、申述書、診断書、口座振替依頼書、納品書、請求書または各種個人情報が記載されている名簿等の種々の手書きされた帳票(原票)をコンピュータ等の端末装置で扱える電子化された情報として扱えるように変換する際に、手書き帳票と電子化(テキスト化)情報とが同一内容であるか否か(差異の有無)の正誤の判断としての検証を行い、該検証の精度及び処理スピードの向上と、該処理スピードの安定化とを図るための文書データ検証方法と、該方法を用いることにより検証作業を支援する文書データ検証支援システムとに関するものである。   The present invention deals with various handwritten forms (original documents) such as a written list, a medical certificate, an account transfer request document, an invoice, an invoice, or a list on which various personal information is described, which is handled by an individual or a corporation. When converting so that it can be handled as computerized information that can be handled by a terminal device such as a computer, whether or not the handwritten form and the digitized (text) information have the same content (whether there is a difference) A document data verification method for improving the accuracy and processing speed of the verification, and stabilizing the processing speed, and a document data verification support system for supporting verification work by using the method, It is about.

個人または法人が扱う、例えば、申述書、診断書、口座振替依頼書、納品書、請求書または各種個人情報が記載されている名簿等の種々の手書きされた原票を含む帳票(以下、手書き文書データという)を、コンピュータ等の端末装置で扱えるように電子化(テキスト化)する方法としては、例えば、スキャナー等の読み取り手段を用いて前記手書き文書データの情報を画像としてイメージ表示(処理前文書データの画像)した後に、該イメージ表示した画像から文字を識別して文書に変換するテキスト化処理(OCRを用いた変換処理)する方法、または文字入力担当の作業者(入力担当者)等が入力用端末装置を用いて手書き文書データに記載された情報を確認しながら該情報に基づいて文書を入力する方法等がある。   For example, a form containing various handwritten original forms such as a written statement, a medical certificate, an account transfer request form, an invoice, an invoice, or a list containing various personal information (hereinafter referred to as a handwritten document) As a method of digitizing (data) so that it can be handled by a terminal device such as a computer, for example, the information of the handwritten document data is displayed as an image using a reading means such as a scanner (document before processing). A method of text conversion (conversion processing using OCR) that identifies characters from the displayed image and converts them into a document, or a character input worker (input person) or the like There is a method of inputting a document based on the information while confirming information described in the handwritten document data using an input terminal device.

従来、このような手書き文書データの情報をテキスト化処理する技術としては、例えば、入力依頼者側が、手書き又は印刷された文書全体のイメージデータを、イメージ上で、複数の部分イメージ情報に分割して断片化し、その際、断片化された単独の部分イメージ情報自体からは、有意味な情報を導き出すことが不可能とされるまで断片化を行い、インターネットを利用して入力業務を望む利用者が、端末から、前記部分イメージ情報のテキスト入力を行う情報入力システムであって、インターネット上に、前記有意味な情報を導き出すことが不可能とされるまでに断片化された前記部分イメージ情報を個別に公開する手段を備え、前記利用者には、インターネット上に公開された、前記有意味な情報を導き出すことが不可能とされるまでに断片化された部分イメージ情報の中から、個別に選択して入力自在としてなる、ことを特徴とする情報入力システムがある(特許文献1参照)。   Conventionally, as a technique for converting the information of such handwritten document data into text, for example, the input requester side divides image data of the entire handwritten or printed document into a plurality of partial image information on the image. In this case, users who want to perform input work using the Internet after performing fragmentation until it becomes impossible to derive meaningful information from the fragmented single partial image information itself Is an information input system for inputting text of the partial image information from a terminal, and the partial image information fragmented until it is impossible to derive the meaningful information on the Internet. Means for individually publishing, until it is impossible for the user to derive the meaningful information published on the Internet From among the fragmented image parts information, as input freely selected individually, it is the information input system according to claim (see Patent Document 1).

このような方法を用いて手書き文書データをテキスト化した文書(以下、処理後文書データという)においては、前記手書き文書データ(または処理前文書データ)と前記処理後文書データの情報とが完全に一致していることが好ましいが、OCRの精度や入力担当者による入力ミス等により、これら手書き文書データと処理後文書データとの情報において差異が生じることがある。   In a document obtained by converting handwritten document data into text using such a method (hereinafter referred to as processed document data), the handwritten document data (or preprocessed document data) and the information of the processed document data are completely Although they preferably match, there may be a difference in information between the handwritten document data and the post-processed document data due to the accuracy of OCR, input mistakes by the person in charge of input, or the like.

そのため、前記手書き文書データと処理後文書データとにおいて差異が生じているか否かを検証することによって、処理後文書データにおける情報の正誤判断をし、これら手書き文書データと処理後文書データとの情報を完全に一致させることが求められる。   Therefore, by verifying whether or not there is a difference between the handwritten document data and the processed document data, correctness of information in the processed document data is determined, and information between the handwritten document data and the processed document data is determined. Are required to match completely.

このような2つの文書データにおける差異の発生を減少させて入力データ等の処理後文書データの情報の精度維持・向上を図る方法としては、例えば、第一の入力担当者と第二の入力担当者とによって2度入力作業を行うベリファイ方式と、突合(コンペアー)後に差異部分(アンマッチ部)を第三者により比較・検証して差異部分を修正する第三者検証方式とがある。   As a method for reducing the occurrence of such difference between two document data and maintaining and improving the accuracy of post-processed document data information such as input data, for example, a first input person and a second input person There are a verification method in which an operator performs input work twice, and a third-party verification method in which a difference portion (unmatch portion) is compared and verified by a third party after a match (compare), and the difference portion is corrected.

このベリファイ方式においては、2度目に入力する入力担当者に、入力内容の判断及び確認を行う検証作業を一任することになるため、2度目に入力する入力担当者のスキル及び判断のレベルによって、精度の誤差が生じてしまうことがあるという問題点がある。   In this verification method, since the verification work for judging and confirming the input contents is entrusted to the input person who inputs the second time, depending on the skill and judgment level of the input person who inputs the second time, There is a problem that an error in accuracy may occur.

一方、第三者検証方式においては、コンペアー後に第三者による検証を行う方式であるが、この第三者(検証担当者)は入力担当者とは異なる人物が担当するため、入力担当者とは異なる視点で手書き文書データまたは処理前文書データと、処理後文書データとの情報を比較し検証作業を行うことになることから、前記ベリファイ方式と比較して検証作業の精度が向上することが期待される。   On the other hand, the third-party verification method is a method in which verification is performed by a third party after comparison. Since this third party (verification person) is in charge of a person different from the input person, Since the verification work is performed by comparing information between the handwritten document data or the pre-processing document data and the post-processing document data from a different viewpoint, the accuracy of the verification work may be improved as compared with the verification method. Be expected.

従来、この種の検証方法としては、シミュレータを用いて1又は2以上の設計データを1又は2以上のテストケースで検証する検証作業を支援するための検証作業支援システムであって、前記テストケースを特定するために必要な基本情報の入力を受け付ける基本情報入力手段と、前記基本情報入力手段で入力された基本情報を含むテンプレートファイルを生成するテンプレートファイル生成手段と、前記テストケース以外の事項を特定するために必要な個別情報の入力を受け付ける個別情報入力手段と、前記テンプレートファイルから基本情報を読み出し、その基本情報に前記個別情報入力手段で入力された個別情報を追加することにより前記検証作業に必要なパラメータファイルを生成するパラメータファイル生成手段と、前記パラメータファイルに従って前記シミュレータを起動しながら前記検証作業を実行する検証作業実行手段とを備えたことを特徴とする検証作業支援システム(特許文献2参照)があり、更に同種の技術としては、例えば、特許文献3または特許文献4等がある。   Conventionally, as this kind of verification method, a verification work support system for supporting verification work for verifying one or more design data using one or more test cases using a simulator, the test case Basic information input means for receiving input of basic information necessary to specify the template, template file generation means for generating a template file including the basic information input by the basic information input means, and items other than the test case Individual information input means for receiving input of individual information necessary for identification, and the verification operation by reading the basic information from the template file and adding the individual information input by the individual information input means to the basic information Parameter file generating means for generating a parameter file necessary for There is a verification work support system (see Patent Document 2) characterized by comprising verification work execution means for executing the verification work while activating the simulator in accordance with a file. Document 3 or Patent Document 4 is available.

特開2007−183985号公報JP 2007-183985 A 特開2007−172444号公報JP 2007-172444 A 特開2006−243892号公報JP 2006-243892 A 特開2007−115289号公報JP 2007-115289 A

しかしながら、前記第三者検証方式は、前述のようにベリファイ方式よりも高精度の検証作業が期待されているが、しかしながら実際の現場作業において、検証担当者が手書き文書データまたは検証用端末装置に表示される処理前文書データと、処理後文書データとの画像情報のみを比較して検証する、即ち、視覚から得られる情報のみにより入力仕様を比較し判断・確認した場合には、前記ベリファイ方式と比較してもその精度にあまり大差がないことがあり、前記ベリファイ方式と同様の問題が発生してしまう可能性があるという問題点を有する。   However, the third-party verification method is expected to perform verification work with higher accuracy than the verification method as described above. However, in the actual on-site work, the person in charge of the verification uses the handwritten document data or the verification terminal device. When verifying by comparing only the image information of the pre-processed document data and the post-processed document data to be displayed, that is, when the input specifications are compared and judged / confirmed only by information obtained visually, the verification method is used. There is a case where there is not much difference in accuracy even when compared with the above, and there is a possibility that the same problem as the verify method may occur.

また、これら検証作業においては、1日あたり数百件〜数千件の作業をすることがあるが、このような多数件の検証作業を検証担当者が連続的に行った場合には、検証作業が単調な作業であることから、前記検証担当者の意欲が時間の経過とともに低下して、単位時間あたりの検証件数(処理スピード)が低下する傾向があり、更に、検証の精度(品質)を維持することも困難になることがあるのである。   In addition, these verification operations may involve hundreds to thousands of operations per day. If the verification person continuously performs such a large number of verification operations, Since the work is monotonous, the willingness of the person in charge of verification tends to decrease with time, the number of verifications per unit time (processing speed) tends to decrease, and the accuracy of verification (quality) It can also be difficult to maintain.

このように、検証作業は、最終的には人による確認作業に頼らざるを得ないことから、視覚による検証作業だけでは、その精度を向上させることは困難である。   As described above, since the verification work ultimately has to rely on human confirmation work, it is difficult to improve the accuracy by visual verification work alone.

従って、検証の精度をより向上させると共に、検証の処理スピードを安定化させるということに解決しなければならない課題を有している。   Therefore, there is a problem to be solved by further improving the accuracy of verification and stabilizing the processing speed of verification.

上記した従来例の課題を解決する具体的手段として本発明に係る第1の発明として、2つの文書データのそれぞれに記載された情報を検証用端末装置を用いて比較することにより、これら文書データにおける差異の有無の検証作業ができるようにする文書データ検証方法であって、前記2つの文書データは、手書き文書データの情報をイメージ表示した画像である処理前文書データの画像と、該画像から文字を識別して文書に変換するテキスト化処理または前記手書き文書データに基づいて入力用端末装置を用いて文書を入力した処理後文書データの画像とであり、前記処理前文書データの画像と処理後文書データの画像とを比較する処理と、該処理後文書データの情報を音声により読み上げて比較する処理とを同時に処理して検証することを特徴とする文書データ検証方法を提供するものである。   As specific means for solving the problems of the conventional example described above, as the first invention according to the present invention, the information described in each of the two document data is compared using a verification terminal device. A document data verification method that enables verification of the presence / absence of a difference in the image data, wherein the two document data include an image of pre-processed document data that is an image display of handwritten document data information, and A text conversion process for identifying a character and converting it into a document, or an image of post-process document data in which a document is input using an input terminal device based on the handwritten document data. A process for comparing the image of the post-document data with a process for reading out and comparing the information of the post-process document data by voice and verifying them simultaneously. There is provided a document data verification method according to claim.

また、第2の発明として、2つの文書データのそれぞれに記載された情報を検証用端末装置を用いて比較することにより、これら文書データにおける差異の有無の検証作業ができるようにすることを支援するための文書データ検証支援システムであって、前記2つの文書データは、手書き文書データの情報をイメージ表示した画像である処理前文書データの画像と、該画像から文字を識別して文書に変換するテキスト化処理または前記手書き文書データに基づいて入力用端末装置を用いて文書を入力した処理後文書データの画像とであり、前記検証用端末装置を用いる比較は、前記処理前文書データの画像と処理後文書データの画像とによる比較と、該処理後文書データの情報を音声により読み上げる音読による比較とを併用して同時処理することにより検証することを特徴とする文書データ検証支援システムを提供するものである。   In addition, as a second invention, by comparing information described in each of two document data using a verification terminal device, it is possible to verify whether there is a difference in the document data. In this case, the two document data are converted into a document by identifying an image of pre-processed document data, which is an image obtained by displaying handwritten document data information, and characters from the image. And the processed document data image obtained by inputting the document using the input terminal device based on the handwritten document data, and the comparison using the verification terminal device is the image of the unprocessed document data. And the comparison of the processed document data with the image and the comparison by reading aloud the information of the processed document data by voice are simultaneously processed. There is provided a document data verification support system characterized by verifying by.

この第2の発明において、前記イメージ表示した画像による比較手段は、前記音読による比較手段により文書データの情報を読み上げるタイミングと同期させて前記イメージ表示した画像の読み上げ部分をマーカー表示すること;前記音読は、一定速度であること;前記一定速度は、予め可変・調整できること;前記検証用端末装置は、前記文書データを管理するデータ管理サーバにネットワークを介して接続されており、該データ管理サーバに接続する複数の検証用端末装置で検証作業ができるようにすること;を付加的な要件として含むものである。   In the second aspect of the invention, the comparing means using the image-displayed image displays a marker on the read-out portion of the image-displayed image in synchronism with the timing when the information of the document data is read out by the comparing means based on the reading aloud; The constant speed can be varied and adjusted in advance; the verification terminal device is connected to a data management server that manages the document data via a network, and the data management server It is included as an additional requirement that a verification operation can be performed by a plurality of verification terminal devices to be connected.

本発明に係る文書データ検証方法と文書データ検証支援システムとにおいては、2つの文書データのそれぞれに記載された情報を検証用端末装置を用いて比較することにより、これら文書データにおける差異の有無の検証作業ができるようにすることを支援するための文書データ検証支援システムであって、前記2つの文書データは、手書き文書データの情報をイメージ表示した画像である処理前文書データの画像と、該画像から文字を識別して文書に変換するテキスト化処理または前記手書き文書データに基づいて入力用端末装置を用いて文書を入力した処理後文書データの画像とであり、前記検証用端末装置を用いる比較は、前記処理前文書データの画像と処理後文書データの画像とによる比較と、該処理後文書データの情報を音声により読み上げる音読による比較とを併用して同時処理することにより検証する構成であるため、検証用端末装置により可変可能な一定速度(一定リズム)で自動的に読み上げられる音声という聴覚情報が、恰もメトロノームやペースメーカー様の作用を有するようになって検証処理スピードが安定化すると共に、視覚情報と聴覚情報という性質の異なる2つの情報を用いて検証作業を行うことができるようになるため、視覚情報のみで検証作業を行う場合と比較して検証の精度を向上させることができるようになるという優れた効果を奏する。   In the document data verification method and the document data verification support system according to the present invention, by comparing the information described in each of the two document data using the verification terminal device, whether or not there is a difference between the document data A document data verification support system for supporting verification work, wherein the two document data include an image of pre-processed document data that is an image of information on handwritten document data, A text conversion process for identifying characters from an image and converting them into a document, or an image of processed document data obtained by inputting a document using an input terminal device based on the handwritten document data, and using the verification terminal device The comparison is made by comparing the image of the pre-processed document data with the image of the post-processed document data, and the information of the post-processed document data by voice Because it is a configuration that verifies by performing simultaneous processing together with comparison by reading aloud, the auditory information that is automatically read out at a constant speed (constant rhythm) that can be varied by the terminal device for verification, Since it has a pacemaker-like action, the verification processing speed is stabilized, and verification work can be performed using two types of information, visual information and auditory information. There is an excellent effect that the accuracy of verification can be improved as compared with the case of performing verification work.

次に、本発明を具体的な実施の形態に基づいて詳しく説明する。
本発明に係る文書データ検証方法及び文書データ検証支援システムを図1乃至図5を用いて説明する。図1に、本発明に係る文書データ検証支援システムを構築するためのネットワークの構成の一例の概略図を示してある。なお、文書データ検証支援システムを用いて検証作業をする場合には、複数の検証担当者が検証できるようにするためにネットワークを利用することが好ましいため、ネットワークを利用する方法について説明するが、必ずしもネットワークを利用しなければならないというものではなく、1台以上の単独の検証用端末装置を用いるだけであっても良い。
Next, the present invention will be described in detail based on specific embodiments.
A document data verification method and a document data verification support system according to the present invention will be described with reference to FIGS. FIG. 1 shows a schematic diagram of an example of a network configuration for constructing a document data verification support system according to the present invention. In the case of performing verification work using the document data verification support system, it is preferable to use a network so that a plurality of persons in charge of verification can perform verification. The network does not necessarily have to be used, and only one or more independent verification terminal devices may be used.

ネットワーク1は、例えば、データ管理サーバ2と、音声認識サーバ3と、検証用端末装置4とから構成され、それぞれが通信可能な状態で接続されている。なお、音声認識サーバ3は、必ずしも独立したサーバとして設ける必要はなく、例えば、データ管理サーバ2または検証用端末装置4が音声認識サーバ3の機能を兼用する構成であっても良い。   The network 1 includes, for example, a data management server 2, a voice recognition server 3, and a verification terminal device 4, which are connected in a communicable state. Note that the voice recognition server 3 does not necessarily have to be provided as an independent server. For example, the data management server 2 or the verification terminal device 4 may be configured to also function as the voice recognition server 3.

データ管理サーバ2には、図面には示していないが複数の入力用端末装置が接続されており、該入力用端末装置により入力または作成された各種データがデータ管理サーバ2内に記憶され、該データ管理サーバ2に接続された入力用端末装置または検証用端末装置4等で前記データを利用できるようになっている。   Although not shown in the drawing, a plurality of input terminal devices are connected to the data management server 2, and various data input or created by the input terminal device are stored in the data management server 2, The data can be used by the input terminal device or the verification terminal device 4 connected to the data management server 2.

前記入力用端末装置では、入力担当者が直接入力、またはOCR変換処理により、手書き文書データをテキスト化、即ち検証用端末装置4を含むの端末装置等で利用可能な電子化情報に変換処理を行って処理後文書データを作成している。なお、入力用端末装置と検証用端末装置4とは、兼用であっても良い。   In the input terminal device, the person in charge of input directly inputs or converts the handwritten document data into text by OCR conversion processing, that is, conversion processing to electronic information that can be used in a terminal device including the verification terminal device 4. To create post-processed document data. The input terminal device and the verification terminal device 4 may be shared.

データ管理サーバ2の記憶装置には、前記処理後文書データと、該処理後文書データの元のデータであり前記手書き文書データをスキャナー等の読み取り手段を用いてその画像データを端末装置に取り込んでイメージ表示可能なデータである処理前文書データとが記憶され、これら2つの文書データは検証用端末装置4を用いて検証作業をする際に、該検証用端末装置4の表示画面に、例えば、画面の左右分割または上下分割で同時にイメージ表示されるようになっている。   The storage device of the data management server 2 captures the processed document data and the original data of the processed document data, and the handwritten document data into the terminal device using reading means such as a scanner. Pre-processing document data that is image displayable data is stored, and these two document data are displayed on the display screen of the verification terminal device 4 when the verification operation is performed using the verification terminal device 4, for example, The image is displayed at the same time by dividing the screen horizontally.

音声認識サーバ3では、データ管理サーバ2に記憶された処理後文書データを読み込んだ後、該処理後文書データに含まれるテキスト情報を音声情報に変換できる所定の音声変換プログラム等を用いることによって前記処理後文書データを音声情報に変換処理し、該変換処理した音声情報を記憶している。   The speech recognition server 3 reads the processed document data stored in the data management server 2 and then uses a predetermined speech conversion program that can convert text information included in the processed document data into speech information. The processed document data is converted into audio information, and the converted audio information is stored.

次に、文書データ検証支援システムを使用する場合の処理の流れを図2のフローチャートを用いて説明する。まず、f1として検証の対象となる手書き文書データを用意し、該手書き文書データをスキャナー等の読み取り手段を用いて入力用端末装置で扱えるように取り込み、手書き文書データのイメージ画像データである処理前文書データを作成f2する。   Next, the flow of processing when using the document data verification support system will be described with reference to the flowchart of FIG. First, handwritten document data to be verified is prepared as f1, the handwritten document data is captured so that it can be handled by an input terminal device using a reading unit such as a scanner, and processed before image processing is image data of handwritten document data. Create document data f2.

そして、前記入力用端末装置を使用し、手書き文書データのイメージ画像データ(処理前文書データ)をOCR変換処理する、または入力担当者がキーボード等の入力手段を使用して前記手書き文書データの情報を直接入力することによって、処理後文書データを作成f3する。   Then, using the input terminal device, the image data of the handwritten document data (preprocessed document data) is subjected to OCR conversion processing, or the person in charge of input uses the input means such as a keyboard to obtain information on the handwritten document data. Is directly input to create post-processed document data f3.

これら処理前文書データと処理後文書データとは、データ管理サーバ2に記憶f4され、該データ管理サーバ2にネットワーク接続する所定の検証用端末装置4等が読み出し可能な状態で管理される。つまり、ネットワークを介してデータ管理サーバ2に接続されている任意且つ複数の検証用端末装置4で検証作業を同時に行うことができるのである。   These pre-processed document data and post-processed document data are stored in the data management server 2 and are managed so as to be readable by a predetermined verification terminal device 4 connected to the data management server 2 over the network. That is, the verification work can be simultaneously performed by any and a plurality of verification terminal devices 4 connected to the data management server 2 via the network.

データ管理サーバ2では、任意で、前記記憶された処理前文書データと処理後文書データとの情報から、これらデータ2つの文書データにおけるテキスト文字の差異部分のデータを抽出する処理f5、例えば、異なる複数のプログラムを用いたOCR変換処理を行ってその差異部分のデータを抽出する処理等を行い、該抽出された差異部分のデータを別途データ管理サーバ2に記憶する処理f6を行っても良く、この場合は、後に検証担当者が検証する項目・部分を少なくできて、検証作業を容易にすることができるようになる。   In the data management server 2, optionally, a process f5 for extracting the data of the difference part of the text character in the two document data from the information of the stored pre-process document data and post-process document data, for example, different A process f6 of performing an OCR conversion process using a plurality of programs and extracting the data of the difference part, etc., and storing the extracted data of the difference part in the data management server 2 may be performed. In this case, it is possible to reduce the number of items / parts to be verified later by the person in charge of verification, and to facilitate the verification work.

音声認識サーバ3では、データ管理サーバ2に記憶された前記処理後文書データ(または前記差異部分のデータ、以下処理後文書データの処理と同様であるため差異部分のデータという記載については省略する)を読み込んだ後、該処理後文書データのテキスト情報を音声情報に変換できる所定の音声変換プログラムを用いることによって、前記処理後文書データを音声情報に変換処理(音声合成処理)するf7。なお、前記音声変換プログラムでは、前記処理後文書データに含まれる漢字については、例えば、全て音読み(おんよみ)もしくは訓読みの何れかに変換される、または漢字の候補を音読みする等のように、その変換方法を設定することができるものである。更に、検証の精度をより向上させるために、一度音読みした後に再度訓読みする等の設定ができるようにしても良い。   In the speech recognition server 3, the post-processed document data stored in the data management server 2 (or the difference part data, which is the same as the process of the post-processed document data, and hence the description of the difference part data is omitted). , The processed document data is converted into voice information (voice synthesis process) by using a predetermined voice conversion program that can convert the text information of the processed document data into voice information f7. In the voice conversion program, for example, all the kanji characters included in the processed document data are converted into either reading (onyomi) or kanji reading, or reading kanji candidates. The conversion method can be set. Further, in order to further improve the accuracy of verification, it may be possible to perform settings such as reading aloud once and then reading again.

検証用端末装置4では、データ管理サーバ2から検証すべき処理前文書データと処理後文書データとの情報を読み込み、図3乃至図5に示したように、該検証用端末装置4の表示画面の右側に処理前文書データのイメージ画像6を表示し、左側に処理後文書データのイメージ画像7を表示する。このとき、検証用端末装置4では、前記処理後文書データに対応する音声情報を音声認識サーバ3から読み込み、前記2つの文書データの検証時に前記音声情報を利用できる状態にしている。   The verification terminal device 4 reads the information of the pre-processing document data and the post-processing document data to be verified from the data management server 2 and displays the display screen of the verification terminal device 4 as shown in FIGS. The image image 6 of the pre-processed document data is displayed on the right side, and the image image 7 of the post-processed document data is displayed on the left side. At this time, the verification terminal device 4 reads the voice information corresponding to the processed document data from the voice recognition server 3 so that the voice information can be used when the two document data are verified.

検証担当者は、検証用端末装置4の表示画面に表示された処理前文書データのイメージ画像6と、処理後文書データのイメージ画像7との2つの文書データ画像のそれぞれに記載された情報を視認により比較・確認して、これら2つの文書データにおける差異の有無の検証作業を行う(イメージ表示した画像による比較)が、この際、検証用端末装置4に接続されたヘッドホンまたはスピーカー等の音声出力手段からは、前記処理後文書データに対応する音声情報が読み上げられる、即ち前記処理後文書データの情報が音声で音読(おんどく)されるため、検証用端末装置4の表示画面に表示される2つの文書データを視認により比較し検証する方法と、処理後文書データの情報を音声により読み上げる音読によって処理前文書データと処理後文書データとを比較し検証する方法との2つの検証を同時に処理f8することになるのである。   The person in charge of the verification stores information described in each of the two document data images, that is, the image image 6 of the pre-processing document data and the image image 7 of the post-processing document data displayed on the display screen of the verification terminal device 4. Comparison / confirmation by visual inspection is performed to verify whether there is a difference between the two document data (comparison using an image displayed). At this time, sound from headphones or speakers connected to the verification terminal device 4 is used. From the output means, voice information corresponding to the processed document data is read out, that is, the information of the processed document data is read aloud by voice and displayed on the display screen of the verification terminal device 4. The two document data are visually compared and verified, and the pre-processed document data and the process are read out by reading out the information of the processed document data by voice. It become possible to simultaneously process f8 two verification of the method for verifying compares the document data.

ここで、前記検証用端末装置4を用いて読み上げられる音読のスピードは、検証担当者の経験・能力によって予め可変・調整した後に設定できるようになっており、この予め設定されたスピードで自動的に読み上げられる、即ち、検証担当者に応じた一定速度(一定リズム)で自動的に読み上げがされるようになるのである。   Here, the speed of reading aloud using the verification terminal device 4 can be set after being adjusted and adjusted in advance according to the experience and ability of the person in charge of verification, and automatically at this preset speed. That is, it is automatically read out at a constant speed (a constant rhythm) according to the person in charge of verification.

そして、前記視覚情報と、聴覚情報とを併用して同時処理する検証f8によって、処理後文書データに誤りが確認されなかった場合には、その処理後文書データを確認済みの最終データテキストファイルとしてデータ管理サーバ2に記憶させ、また、処理後文書データに誤りが確認された場合には、該誤ったデータを修正しf10、この修正した処理後文書データを最終データテキストファイルとしてデータ管理サーバ2に記憶させることにより、より精度の高いデータとして利用できるようになるのである。   If no error is confirmed in the processed document data by the verification f8 in which the visual information and the auditory information are processed at the same time, the processed document data is used as a confirmed final data text file. When an error is confirmed in the processed document data stored in the data management server 2, the erroneous data is corrected f10, and the corrected processed document data is used as the final data text file in the data management server 2 By storing the data, it can be used as data with higher accuracy.

このように、視覚情報による検証作業と、聴覚情報による検証作業との性質の異なる検証作業を同時に行うことができるようになるため、視覚情報のみで検証作業を行う場合と比較して、検証担当者における検証の精度を向上させることができるようになると共に、前記聴覚情報が一定速度で提供されるため、該聴覚情報が恰もメトロノームやペースメーカー様の作用を有し、一定のスピードで検証作業がされるようになる、即ち検証処理スピードが安定化するようになるのである。更に、処理後文書データの情報の音読は、検証用端末装置4によって行われるため、検証担当者を増やす必要がないことから、人的コストが増加するようなことはないのである。   In this way, verification work with different properties of visual information and auditory information can be performed at the same time. The accuracy of verification in a person can be improved, and the auditory information is provided at a constant speed. Therefore, the auditory information has a metronome or pacemaker-like action, and verification work can be performed at a constant speed. That is, the verification processing speed is stabilized. Furthermore, since the information of the processed document data is read aloud by the verification terminal device 4, it is not necessary to increase the number of persons in charge of verification, so that the human cost does not increase.

また、前記イメージ表示した画像による比較と、前記音読による比較とを行う際、該音読している情報を読み上げるタイミングと同期させて前記イメージ表示した画像の読み上げ部分をマーカー表示する、即ち、図3に示したように、例えば、検証用端末装置4の表示画面において前記イメージ表示した画像(処理前文書データと処理後文書データとの2つの文書データ)内の「氏名」の項目の情報を音読して読み上げる際には「氏名」の項目を、また、図4に示したように、例えば、「傷病名」の項目の情報を音読して読み上げる際には「傷病名」の項目を、例えば、あわせ囲み線、カーソルまたはアンダーライン等のマーカー6a、7aで表示することによって読み上げ部分が表示画面上のどの部分であるかを示すのである。   Further, when the comparison by the image displayed image and the comparison by the reading aloud are performed, the reading portion of the image displayed image is displayed as a marker in synchronization with the timing of reading the information read aloud, that is, FIG. As shown in FIG. 4, for example, the information of the item “name” in the image (two document data of pre-processing document data and post-processing document data) displayed on the display screen of the verification terminal device 4 is read aloud. For example, when reading aloud, the “name” item, and as shown in FIG. 4, for example, when reading out the information of the “injury name” item aloud, the “injury name” item, for example, These are displayed with markers 6a and 7a such as an enclosing line, a cursor, or an underline to indicate which part on the display screen is the reading-out part.

このように、音読による比較手段により文書データの情報を読み上げるタイミングと同期させてイメージ表示した画像の読み上げ部分をマーカー6a、7aで表示することにより、例えば、経験の少ない検証担当者が検証作業をする場合であっても、文書データの情報の読み上げがイメージ表示した画像内のどの部分であるのかを迷ったり、間違えたりするということがなくなって、検証の精度を向上させることができるのである。   In this way, by displaying the read-out portion of the image displayed in synchronism with the reading-out timing of the document data information by the comparison means by reading aloud with the markers 6a and 7a, for example, a verification person with little experience performs verification work. Even in this case, it is possible to improve the accuracy of verification because it is no longer possible to get confused or mistaken about which part of the image data is read out.

また、検証作業によって処理後文書データの情報が正しいと確認された場合には、図5に示したように、前記処理前文書データの情報内の各項目毎に検証済みを示すマーカー6bを表示するようにしても良い。   Further, when it is confirmed that the information of the processed document data is correct by the verification work, as shown in FIG. 5, a marker 6b indicating that verification has been completed is displayed for each item in the information of the pre-processed document data. You may make it do.

本発明に係る文書データ検証支援システムをネットワークを用いて構築した場合を示す概略図である。It is the schematic which shows the case where the document data verification assistance system which concerns on this invention is constructed | assembled using the network. 同文書データ検証支援システムの処理方法を示すフローチャートである。It is a flowchart which shows the processing method of the document data verification assistance system. 同文書データ検証支援システムにおける検証用端末装置の表示画面の一例であり、読み上げ部分を示すマーカーが氏名の項目を指した状態である。It is an example of the display screen of the verification terminal device in the document data verification support system, and a marker indicating a reading portion indicates a name item. 同文書データ検証支援システムにおける検証用端末装置の表示画面の一例であり、読み上げ部分を示すマーカーが傷病名の項目を指した状態である。It is an example of the display screen of the verification terminal device in the document data verification support system, and the marker indicating the read-out portion is in the state pointing to the item of the name of the disease. 同文書データ検証支援システムにおける検証用端末装置の表示画面の一例であり、検証済みを示すマーカーが表示された状態である。It is an example of a display screen of a verification terminal device in the document data verification support system, in a state in which a marker indicating verification is displayed.

符号の説明Explanation of symbols

1 ネットワーク
2 データ管理サーバ
3 音声認識サーバ
4 検証用端末装置
6 処理前文書データのイメージ画像
6a 処理前文書データのイメージ画像内の項目を指すマーカー
6b 検証済みを示すマーカー
7 処理後文書データのイメージ画像
7a 処理後文書データのイメージ画像内の項目を指すマーカー
DESCRIPTION OF SYMBOLS 1 Network 2 Data management server 3 Voice recognition server 4 Terminal apparatus 6 for verification Image image 6a of document data before processing 6a Marker 6b which points out the item in the image image of document data before processing Image 7 of document data after processing Image 7a Marker indicating item in image of processed document data

Claims (6)

2つの文書データのそれぞれに記載された情報を検証用端末装置を用いて比較することにより、これら文書データにおける差異の有無の検証作業ができるようにする文書データ検証方法であって、
前記2つの文書データは、手書き文書データの情報をイメージ表示した画像である処理前文書データの画像と、該画像から文字を識別して文書に変換するテキスト化処理または前記手書き文書データに基づいて入力用端末装置を用いて文書を入力した処理後文書データの画像とであり、
前記処理前文書データの画像と処理後文書データの画像とを比較する処理と、該処理後文書データの情報を音声により読み上げて比較する処理とを同時に処理して検証すること
を特徴とする文書データ検証方法。
A document data verification method that enables verification of the presence / absence of differences in document data by comparing information described in each of two document data using a verification terminal device,
The two document data are based on an image of pre-processed document data that is an image of information on handwritten document data and text conversion processing that identifies characters from the image and converts them into a document or the handwritten document data. An image of post-processing document data obtained by inputting a document using an input terminal device;
A process for comparing the image of the pre-processed document data with the image of the post-processed document data and the process of reading out and comparing the information of the post-processed document data by voice at the same time and verifying the document Data validation method.
2つの文書データのそれぞれに記載された情報を検証用端末装置を用いて比較することにより、これら文書データにおける差異の有無の検証作業ができるようにすることを支援するための文書データ検証支援システムであって、
前記2つの文書データは、手書き文書データの情報をイメージ表示した画像である処理前文書データの画像と、該画像から文字を識別して文書に変換するテキスト化処理または前記手書き文書データに基づいて入力用端末装置を用いて文書を入力した処理後文書データの画像とであり、
前記検証用端末装置を用いる比較は、前記処理前文書データの画像と処理後文書データの画像とによる比較と、該処理後文書データの情報を音声により読み上げる音読による比較とを併用して同時処理することにより検証すること
を特徴とする文書データ検証支援システム。
A document data verification support system for assisting in verifying whether or not there is a difference in the document data by comparing information described in each of the two document data using a verification terminal device Because
The two document data are based on an image of pre-processed document data that is an image of information on handwritten document data and text conversion processing that identifies characters from the image and converts them into a document or the handwritten document data. An image of post-processing document data obtained by inputting a document using an input terminal device;
The comparison using the verification terminal device is a simultaneous processing using a combination of the image of the pre-processed document data and the image of the post-process document data and a comparison by reading aloud the information of the post-process document data. Document data verification support system characterized by verifying by doing.
前記イメージ表示した画像による比較手段は、
前記音読による比較手段により文書データの情報を読み上げるタイミングと同期させて前記イメージ表示した画像の読み上げ部分をマーカー表示すること
を特徴とする請求項2に記載の文書データ検証支援システム。
The comparing means by the displayed image is:
The document data verification support system according to claim 2, wherein the read-out portion of the displayed image is displayed as a marker in synchronization with the timing of reading out the document data information by the reading means by means of reading aloud.
前記音読は、
一定速度であること
を特徴とする請求項2または3に記載の文書データ検証支援システム。
The reading aloud is
The document data verification support system according to claim 2 or 3, wherein the document data verification support system has a constant speed.
前記一定速度は、
予め可変・調整できること
を特徴とする請求項4に記載の文書データ検証支援システム。
The constant speed is
The document data verification support system according to claim 4, wherein the document data verification support system can be adjusted and adjusted in advance.
前記検証用端末装置は、
前記文書データを管理するデータ管理サーバにネットワークを介して接続されており、
該データ管理サーバに接続する複数の検証用端末装置で検証作業ができるようにすること
を特徴とする請求項2に記載の文書データ検証支援システム。
The verification terminal device includes:
Connected to a data management server for managing the document data via a network;
The document data verification support system according to claim 2, wherein verification work can be performed by a plurality of verification terminal devices connected to the data management server.
JP2008027518A 2008-02-07 2008-02-07 Document data verification method and document data verification support system Pending JP2009187352A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008027518A JP2009187352A (en) 2008-02-07 2008-02-07 Document data verification method and document data verification support system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008027518A JP2009187352A (en) 2008-02-07 2008-02-07 Document data verification method and document data verification support system

Publications (1)

Publication Number Publication Date
JP2009187352A true JP2009187352A (en) 2009-08-20

Family

ID=41070516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008027518A Pending JP2009187352A (en) 2008-02-07 2008-02-07 Document data verification method and document data verification support system

Country Status (1)

Country Link
JP (1) JP2009187352A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107885483A (en) * 2017-11-07 2018-04-06 广东欧珀移动通信有限公司 Method of calibration, device, storage medium and the electronic equipment of audio-frequency information
JP2020067808A (en) * 2018-10-24 2020-04-30 日本電気株式会社 Processing system, processing method, and program

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04336684A (en) * 1991-05-14 1992-11-24 Canon Inc Method and device for document processing

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04336684A (en) * 1991-05-14 1992-11-24 Canon Inc Method and device for document processing

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107885483A (en) * 2017-11-07 2018-04-06 广东欧珀移动通信有限公司 Method of calibration, device, storage medium and the electronic equipment of audio-frequency information
CN107885483B (en) * 2017-11-07 2021-03-02 Oppo广东移动通信有限公司 Audio information verification method and device, storage medium and electronic equipment
JP2020067808A (en) * 2018-10-24 2020-04-30 日本電気株式会社 Processing system, processing method, and program

Similar Documents

Publication Publication Date Title
CN106648690B (en) Automatic code generation method and device
CN106326888B (en) Image recognition method and device
US9979721B2 (en) Method, server, client and system for verifying verification codes
US10963760B2 (en) Method and apparatus for processing information
US20170011732A1 (en) Low-vision reading vision assisting system based on ocr and tts
US20050228683A1 (en) Integrated use of a portable image capture device into a workflow process
CN111666746A (en) Method and device for generating conference summary, electronic equipment and storage medium
RU2571396C2 (en) Method and system for verification during reading
CN104346035A (en) Indicating automatically corrected words
CN104462043A (en) Quick self-help form filling system and quick self-help form filling method
US10354132B2 (en) System and method for generating a virtual assistant
JP2009187352A (en) Document data verification method and document data verification support system
CN113255505A (en) Certificate photo generation method, device, equipment and storage medium
JP2016528594A (en) Electronic document creation and retrieval method and non-transitory computer-readable recording medium
US9870197B2 (en) Input information support apparatus, method for supporting input information, and computer-readable recording medium
JP6988101B2 (en) Information processing equipment, programs and information processing methods
CN110580905B (en) Identification device and method
JP6822261B2 (en) Information processing equipment, programs and information processing methods
JP2010139843A (en) Voice information collection device, and method and program for the same
JP2004110378A (en) Object-oriented development supporting method and device
JP2017111678A (en) Idea extraction support system
JP6372577B2 (en) Presentation support method, presentation support program, and presentation support apparatus
WO2020158374A1 (en) Compliance determination device, and method therefor
JP2007004429A (en) Document processor
JP6613671B2 (en) Information processing device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120911

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130205