JP4992820B2 - Data processing apparatus, computer program thereof, and data processing method - Google Patents

Data processing apparatus, computer program thereof, and data processing method Download PDF

Info

Publication number
JP4992820B2
JP4992820B2 JP2008125499A JP2008125499A JP4992820B2 JP 4992820 B2 JP4992820 B2 JP 4992820B2 JP 2008125499 A JP2008125499 A JP 2008125499A JP 2008125499 A JP2008125499 A JP 2008125499A JP 4992820 B2 JP4992820 B2 JP 4992820B2
Authority
JP
Japan
Prior art keywords
document
data
modification
primary
importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008125499A
Other languages
Japanese (ja)
Other versions
JP2009276873A (en
Inventor
豊 今井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008125499A priority Critical patent/JP4992820B2/en
Publication of JP2009276873A publication Critical patent/JP2009276873A/en
Application granted granted Critical
Publication of JP4992820B2 publication Critical patent/JP4992820B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Storage Device Security (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、コンピュータプログラムに対応して文書データを処理するデータ処理装置に関し、特に、契約書などの文書データの改変を検出して利用者に警告するデータ処理装置、そのコンピュータプログラムおよびデータ処理方法に関する。   The present invention relates to a data processing apparatus that processes document data in correspondence with a computer program, and in particular, a data processing apparatus that detects a modification of document data such as a contract and warns a user, the computer program, and a data processing method therefor About.

現在、利用者が専門業者と各種の契約を実行する場合、いわゆる契約書を作成することで契約している。この契約書は、いわゆる紙媒体に印刷や手書きで作成されることもあり、電子署名を利用するなどして電子データで作成されることもある。   Currently, when a user executes various contracts with a specialist, the contract is made by creating a so-called contract. The contract may be created on a so-called paper medium by printing or handwriting, or may be created by electronic data using an electronic signature.

現在、上述のような契約書の作成を電子的に支援するデータ処理装置として各種の提案がある(例えば、特許文献1,2参照)。
特開2002−074206号公報 特開2004−070704号公報
Currently, there are various proposals as data processing devices that electronically support the creation of contracts as described above (see, for example, Patent Documents 1 and 2).
JP 2002-074206 A Japanese Patent Laid-Open No. 2004-070704

しかし、従来は契約書の作成を電子的に支援するデータ処理装置しか提案されていない。一方、契約書などは専門用語が羅列されていることが多々あり、一般的な利用者には難解である。このため、契約書などの一次文書が悪意の専門家に改変されて二次文書となっても、これを一般的な利用者が認識することが困難である。   However, conventionally, only a data processing apparatus that electronically supports the creation of a contract has been proposed. On the other hand, technical terms are often listed in contracts and the like, which is difficult for general users. For this reason, even if a primary document such as a contract is changed to a malicious expert to become a secondary document, it is difficult for a general user to recognize it.

本発明は上述のような課題に鑑みてなされたものであり、一次文書に対する二次文書の改変部分を重要度とともに利用者に一目で確認させることができるデータ処理装置、そのコンピュータプログラムおよびデータ処理方法、を提供するものである。   The present invention has been made in view of the above-described problems, and a data processing apparatus capable of allowing a user to confirm at a glance the modified part of the secondary document with respect to the primary document together with the importance, the computer program thereof, and the data processing Method.

本発明のデータ処理装置は、原本である一次文書データと改変された可能性がある二次文書データとを取得する文書取得手段と、取得された一次文書データと二次文書データとの文書記載内容を認識する記載認識手段と、認識された文書記載内容により一次文書データと二次文書データとを比較して文書改変部分を検出する改変検出手段と、認識された文書記載内容により一次文書データと二次文書データとの少なくとも一方の文書種別を判定する種別判定手段と、文書改変部分の重要度判定ルールを文書種別ごとに記憶するルール記憶手段と、検出された文書改変部分の改変重要度合を判定された文書種別に対応した重要度判定ルールで個々に判定する重要度判定手段と、検出された文書改変部分を判定された改変重要度合とともに出力する改変出力手段と、を有する。   The data processing apparatus of the present invention includes document acquisition means for acquiring original primary document data and possibly modified secondary document data, and document description of the acquired primary document data and secondary document data Description recognition means for recognizing contents, modification detection means for comparing the primary document data and the secondary document data based on the recognized document description contents, and detecting a document modification portion; and primary document data based on the recognized document description contents Classification determination means for determining at least one document type of the document data and secondary document data, rule storage means for storing the importance determination rule of the document modification part for each document type, and the degree of modification importance of the detected document modification part The importance determination means for individually determining the importance by the importance determination rule corresponding to the determined document type, and outputting the detected document modification portion together with the determined modification importance. It has a modified output means, a.

本発明のコンピュータプログラムは、原本である一次文書データと改変された可能性がある二次文書データとを取得する文書取得処理と、取得された一次文書データと二次文書データとの文書記載内容を認識する記載認識処理と、認識された文書記載内容により一次文書データと二次文書データとを比較して文書改変部分を検出する改変検出処理と、認識された文書記載内容により一次文書データと二次文書データとの少なくとも一方の文書種別を判定する種別判定処理と、文書改変部分の重要度判定ルールを文書種別ごとに記憶するルール記憶処理と、検出された文書改変部分の改変重要度合を判定された文書種別に対応した重要度判定ルールで個々に判定する重要度判定処理と、検出された文書改変部分を判定された改変重要度合とともに出力する改変出力処理と、をデータ処理装置に実行させる。   A computer program according to the present invention includes a document acquisition process for acquiring original primary document data and possibly modified secondary document data, and document descriptions of the acquired primary document data and secondary document data A recognition process for recognizing the document, a modification detection process for comparing the primary document data and the secondary document data based on the recognized document description, and detecting a document modification part; and the primary document data based on the recognized document description A type determination process for determining at least one document type of the secondary document data, a rule storage process for storing the importance determination rule of the document modification part for each document type, and a modification importance level of the detected document modification part. The importance determination process for individually determining by the importance determination rule corresponding to the determined document type, and the modification importance degree for which the detected document modification part is determined Executing the modified output process of outputting, to the data processing device.

本発明のデータ処理方法は、原本である一次文書データと改変された可能性がある二次文書データとを取得する文書取得動作と、取得された一次文書データと二次文書データとの文書記載内容を認識する記載認識動作と、認識された文書記載内容により一次文書データと二次文書データとを比較して文書改変部分を検出する改変検出動作と、認識された文書記載内容により一次文書データと二次文書データとの少なくとも一方の文書種別を判定する種別判定動作と、文書改変部分の重要度判定ルールを文書種別ごとに記憶するルール記憶動作と、検出された文書改変部分の改変重要度合を判定された文書種別に対応した重要度判定ルールで個々に判定する重要度判定動作と、検出された文書改変部分を判定された改変重要度合とともに出力する改変出力動作と、を有する。   The data processing method according to the present invention includes a document acquisition operation for acquiring original primary document data and possibly modified secondary document data, and document description of the acquired primary document data and secondary document data Description recognition operation for recognizing contents, modification detection operation for detecting a document modification portion by comparing primary document data and secondary document data based on recognized document description contents, and primary document data based on recognized document description contents Type determination operation for determining at least one of the document type and secondary document data, rule storage operation for storing the document modification portion importance determination rule for each document type, and the modification importance level of the detected document modification portion Outputs the importance judgment operation for individually judging by the importance judgment rule corresponding to the document type judged and the detected document modification part together with the judged modification importance degree. A modified output operation and, the.

なお、本発明の各種の構成要素は、その機能を実現するように形成されていればよく、例えば、所定の機能を発揮する専用のハードウェア、所定の機能がコンピュータプログラムにより付与されたデータ処理装置、コンピュータプログラムによりデータ処理装置に実現された所定の機能、これらの任意の組み合わせ、等として実現することができる。   It should be noted that the various components of the present invention need only be formed so as to realize their functions. For example, dedicated hardware that exhibits a predetermined function, data processing in which a predetermined function is provided by a computer program It can be realized as an apparatus, a predetermined function realized in the data processing apparatus by a computer program, an arbitrary combination thereof, or the like.

また、本発明の各種の構成要素は、個々に独立した存在である必要もなく、複数の構成要素が一個の部材として形成されていること、一つの構成要素が複数の部材で形成されていること、ある構成要素が他の構成要素の一部であること、ある構成要素の一部と他の構成要素の一部とが重複していること、等を許容する。   In addition, the various components of the present invention do not have to be individually independent, a plurality of components are formed as a single member, and a single component is formed of a plurality of members. That a certain component is a part of another component, a part of a certain component overlaps a part of another component, and the like.

また、本発明のデータ処理方法は、複数の動作を順番に記載してあるが、その記載の順番は複数の動作を実行する順番を限定するものではない。このため、本発明のデータ処理方法を実施するときには、その複数の動作の順番は内容的に支障しない範囲で変更することができる。   Moreover, although the data processing method of this invention has described several operation | movement in order, the order of description does not limit the order which performs several operation | movement. For this reason, when implementing the data processing method of this invention, the order of the several operation | movement can be changed in the range which does not interfere in content.

さらに、本発明のデータ処理方法は、複数の動作が個々に相違するタイミングで実行されることに限定されない。このため、ある動作の実行中に他の動作が発生すること、ある動作の実行タイミングと他の動作の実行タイミングとの一部ないし全部が重複していること、等でもよい。   Furthermore, the data processing method of the present invention is not limited to the case where a plurality of operations are executed at different timings. For this reason, another operation may occur during execution of a certain operation, or a part or all of the execution timing of a certain operation and the execution timing of another operation may overlap.

また、本発明で云うデータ処理装置は、コンピュータプログラムを読み取って対応する処理動作を実行できるように、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disc Drive)、I/F(Interface)ユニット、等の汎用デバイスで構築されたハードウェア、所定の処理動作を実行するように構築された専用の論理回路、これらの組み合わせ、等として実施することができる。   The data processing apparatus according to the present invention can read a computer program and execute a corresponding processing operation, so that a CPU (Central Processing Unit), a ROM (Read Only Memory), a RAM (Random Access Memory), a HDD (Hard). Disc drive), hardware constructed with general-purpose devices such as I / F (Interface) units, etc., dedicated logic circuits constructed to execute predetermined processing operations, combinations thereof, etc. it can.

なお、本発明でコンピュータプログラムに対応した各種動作をデータ処理装置に実行させることは、各種デバイスをデータ処理装置に動作制御させることなども意味している。   In the present invention, causing the data processing apparatus to execute various operations corresponding to the computer program also means causing the data processing apparatus to control operations of the various devices.

例えば、データ処理装置に各種データを記憶させることは、データ処理装置に固定されているHDD等の情報記憶媒体にCPUが各種データを格納すること、データ処理装置に交換自在に装填されているCD−R(Compact Disc−Recordable)等の情報記憶媒体にCPUがCDドライブで各種データを格納すること、等を許容する。   For example, storing various data in the data processing apparatus means that the CPU stores various data in an information storage medium such as an HDD fixed to the data processing apparatus, or a CD that is exchangeably loaded in the data processing apparatus. The CPU allows various data to be stored in a CD drive in an information storage medium such as -R (Compact Disc-Recordable).

さらに、本発明で云う「データを記憶する」とは、本発明の装置が、少なくともデータを記憶する機能を有することを意味している。このため、本発明の装置がコンシューマにより新規に登録されるデータを記憶することの他、サプライヤにより製造時に登録されたデータを記憶して出荷後にはコンシューマにより新規のデータが登録されないことも許容する。   Furthermore, “store data” in the present invention means that the apparatus of the present invention has at least a function of storing data. For this reason, in addition to storing data newly registered by the consumer, the device of the present invention also stores data registered at the time of manufacture by the supplier, and allows new data not to be registered by the consumer after shipment. .

本発明のデータ処理装置では、原本である一次文書データと改変された可能性がある二次文書データとを文書取得手段が取得する。すると、取得された一次文書データと二次文書データとの文書記載内容を記載認識手段が認識する。この認識された文書記載内容により改変検出手段が一次文書データと二次文書データとを比較して文書改変部分を検出する。また、認識された文書記載内容により一次文書データと二次文書データとの少なくとも一方の文書種別を種別判定手段が判定する。文書改変部分の重要度判定ルールをルール記憶手段が文書種別ごとに記憶するので、検出された文書改変部分の改変重要度合を判定された文書種別に対応した重要度判定ルールで重要度判定手段が個々に判定する。検出された文書改変部分を判定された改変重要度合とともに改変出力手段が出力するので、利用者は一次文書に対する二次文書の改変部分を重要度とともに一目で確認することができる。   In the data processing apparatus of the present invention, the document acquisition unit acquires the primary document data that is the original and the secondary document data that may be altered. Then, the description recognition unit recognizes the document description contents of the acquired primary document data and secondary document data. Based on the recognized document description, the alteration detection means compares the primary document data and the secondary document data to detect the document alteration portion. Further, the type determination unit determines at least one document type of the primary document data and the secondary document data based on the recognized document description. Since the rule storage unit stores the importance determination rule of the document modification part for each document type, the importance determination unit is based on the importance determination rule corresponding to the document type for which the modification importance of the detected document modification part is determined. Judge individually. Since the modification output unit outputs the detected document modification part together with the determined modification importance level, the user can confirm the modification part of the secondary document with respect to the primary document at a glance together with the importance level.

本発明の実施の一形態を図面を参照して以下に説明する。本実施の形態のデータ処理システム1000は、図1および図2に示すように、サービス業者の少なくとも一個のデータ処理装置100と利用者ごとの複数のユーザ操作端末200とを有し、これらが現行のインターネットや次世代のNGN(Next Generation Network)などの通信ネットワークINで接続されている。   An embodiment of the present invention will be described below with reference to the drawings. As shown in FIGS. 1 and 2, the data processing system 1000 according to the present embodiment has at least one data processing device 100 of a service provider and a plurality of user operation terminals 200 for each user, and these are the current ones. And a communication network IN such as the next generation NGN (Next Generation Network).

そして、本実施の形態のデータ処理装置100は、原本である一次文書データFDDと改変された可能性がある二次文書データSDDとを取得する文書取得部110と、取得された一次文書データFDDと二次文書データSDDとの文書記載内容を認識する記載認識部120と、認識された文書記載内容により一次文書データFDDと二次文書データSDDとを比較して文書改変部分DCPを検出する改変検出部130と、認識された文書記載内容により一次文書データFDDと二次文書データSDDとの少なくとも一方の文書種別する種別判定部140と、文書改変部分DCPの重要度判定ルールIJRを文書種別ごとに記憶するルール記憶部150と、検出された文書改変部分DCPの改変重要度合CIRを判定された文書種別に対応した重要度判定ルールIJRで個々に判定する重要度判定部160と、検出された文書改変部分DCPを判定された改変重要度合CIRとともに出力する改変出力部170と、を有する。   The data processing apparatus 100 according to the present embodiment includes a document acquisition unit 110 that acquires primary document data FDD that is an original and secondary document data SDD that may be altered, and acquired primary document data FDD. Recognizing part 120 for recognizing document description contents of secondary document data SDD and modification for detecting document modification portion DCP by comparing primary document data FDD and secondary document data SDD according to the recognized document description contents The detection unit 130, the type determination unit 140 that classifies at least one of the primary document data FDD and the secondary document data SDD according to the recognized document description, and the importance determination rule IJR of the document modification portion DCP for each document type Corresponding to the document type for which the rule storage unit 150 stored in the file and the modification importance degree CIR of the detected document modification part DCP are determined. Has a significance determination unit 160 to determine individually significance determination rule IJR, and the modified output unit 170 for outputting with detected is determined document modifying moiety DCP was altered importance degree CIR, the.

より具体的には、データ処理装置100は、サービス業者のサーバ装置などからなり、例えば、ユーザ操作端末200で利用されるウェブサイト(図示せず)を通信ネットワークINに開設することなどに利用される。   More specifically, the data processing device 100 includes a server device of a service provider, and is used, for example, for opening a website (not shown) used in the user operation terminal 200 in the communication network IN. The

ユーザ操作端末200は、利用者に利用されるパーソナルコンピュータや携帯電話端末などからなり、例えば、データ処理装置100で通信ネットワークINに開設されているウェブサイトを利用することなどに使用される。   The user operation terminal 200 includes a personal computer or a mobile phone terminal used by a user, and is used, for example, for using a website established in the communication network IN by the data processing apparatus 100.

そこで、本実施の形態のデータ処理装置100は、文書改変を検出して重要度を判定するウェブサイトを有償や無償で通信ネットワークINに開設する。このため、データ処理装置100の文書取得部110は、利用者のユーザ操作端末200から通信ネットワークINを経由して一次文書データFDDと二次文書データSDDとを受信する。改変出力部170は、文書改変部分DCPを判定された改変重要度合CIRとともに通信ネットワークINを経由してユーザ操作端末200に返信する。   Therefore, the data processing apparatus 100 according to the present embodiment opens a website on the communication network IN for a fee or free of charge to detect document modification and determine the importance. Therefore, the document acquisition unit 110 of the data processing apparatus 100 receives the primary document data FDD and the secondary document data SDD from the user operation terminal 200 of the user via the communication network IN. The modification output unit 170 returns the document modification part DCP to the user operation terminal 200 via the communication network IN together with the determined modification importance degree CIR.

このデータ処理装置100のルール記憶部150は、詳細には後述するが、少なくとも一つが文書改変部分DCPである複数の特定重要表記IIMを関連させた重要度判定ルールIJRを記憶している。そこで、重要度判定部160は、検出された複数の文書改変部分DCPを重要度判定ルールIJRで関連させて改変重要度合CIRを判定する。   As will be described in detail later, the rule storage unit 150 of the data processing apparatus 100 stores an importance determination rule IJR that associates a plurality of specific important notations IIM, at least one of which is a document modification part DCP. Therefore, the importance determination unit 160 determines the modification importance degree CIR by associating the detected plurality of document modification portions DCP with the importance determination rule IJR.

また、改変検出部130は、検出された文書改変部分DCPを内包する少なくとも一文部分文章を一次文書データFDDと二次文書データSDDから抽出する。そこで、改変出力部170は、抽出された一次文書データFDDと二次文書データSDDとの一文部分文章を要約した改変要約文章を生成して文書改変部分DCPとともに出力する。   Further, the modification detection unit 130 extracts at least one sentence part sentence including the detected document modification part DCP from the primary document data FDD and the secondary document data SDD. Therefore, the modification output unit 170 generates a modified summary sentence that summarizes the first sentence partial text of the extracted primary document data FDD and secondary document data SDD, and outputs the modified summary sentence together with the document modification part DCP.

さらに、改変出力部170は、文書改変部分DCPを判定された改変重要度合CIRに対応して二次文書データSDDで強調表現した改変強調データを生成して出力する。また、改変出力部170は、文書改変部分DCPが各々検出された複数の一文部分文章を判定された改変重要度合CIRでソートして出力する。   Furthermore, the modification output unit 170 generates and outputs modification emphasis data in which the document modification part DCP is emphasized and expressed by the secondary document data SDD corresponding to the determined modification importance degree CIR. Further, the modification output unit 170 sorts and outputs a plurality of one-sentence partial sentences in which the document modification parts DCP are respectively detected by the determined modification importance degree CIR.

本実施の形態のデータ処理装置100は、コンピュータ装置の主体であるCPUをハードウェアとして有し、このCPUに、ROM、RAM、HDD、通信I/F、等の各種デバイスがハードウェアとして接続されている(図示せず)。   The data processing apparatus 100 according to the present embodiment includes a CPU that is the main component of a computer apparatus as hardware, and various devices such as ROM, RAM, HDD, and communication I / F are connected to the CPU as hardware. (Not shown).

本実施の形態のデータ処理装置100では、ROM、RAM、HDD、等のハードウェアが情報記憶媒体に相当し、これらの少なくとも一個にCPUのためのコンピュータプログラムおよびリソースがソフトウェアとして格納されている。   In the data processing apparatus 100 of the present embodiment, hardware such as ROM, RAM, HDD, and the like corresponds to an information storage medium, and at least one of them stores a computer program and resources for the CPU as software.

このようなソフトウェアはデータ処理装置100に事前にインストールされており、データ処理装置100の起動時にCPUに読み取られる。このようにCPUが適正なコンピュータプログラムを読み取って各種処理を実行することにより、本実施の形態のデータ処理装置100は、前述のような各部110〜170が各種機能として論理的に実現されている。   Such software is installed in the data processing apparatus 100 in advance, and is read by the CPU when the data processing apparatus 100 is activated. As described above, when the CPU reads an appropriate computer program and executes various processes, in the data processing apparatus 100 of the present embodiment, the above-described units 110 to 170 are logically realized as various functions. .

文書取得部110および改変出力部170は、CPUがコンピュータプログラムに対応して通信I/Fのデータ通信を動作制御する機能などに相当する。ルール記憶部150は、CPUがコンピュータプログラムに対応して認識するHDDの記憶エリアなどに相当する。その他の各部120〜は、CPUがコンピュータプログラムに対応して所定のデータ処理を実行する機能などに相当する。   The document acquisition unit 110 and the modified output unit 170 correspond to a function in which the CPU controls the data communication of the communication I / F corresponding to the computer program. The rule storage unit 150 corresponds to a storage area of an HDD recognized by the CPU corresponding to a computer program. Each of the other units 120 to corresponds to a function of the CPU executing predetermined data processing corresponding to the computer program.

このようなコンピュータプログラムは、例えば、原本である一次文書データFDDと改変された可能性がある二次文書データSDDとを取得する文書取得処理と、取得された一次文書データFDDと二次文書データSDDとの文書記載内容を認識する記載認識処理と、認識された文書記載内容により一次文書データFDDと二次文書データSDDとを比較して文書改変部分DCPを検出する改変検出処理と、認識された文書記載内容により一次文書データFDDと二次文書データSDDとの少なくとも一方の文書種別する種別判定処理と、文書改変部分DCPの重要度判定ルールIJRを文書種別ごとに記憶するルール記憶処理と、検出された文書改変部分DCPの改変重要度合CIRを判定された文書種別に対応した重要度判定ルールIJRで個々に判定する重要度判定処理と、検出された文書改変部分DCPを判定された改変重要度合CIRとともに出力する改変出力処理と、をデータ処理装置100に実行させるように記述されている。   Such a computer program includes, for example, document acquisition processing for acquiring primary document data FDD that is an original and secondary document data SDD that may have been altered, acquired primary document data FDD, and secondary document data A description recognition process for recognizing the document description content with the SDD, and a modification detection process for detecting the document modification portion DCP by comparing the primary document data FDD and the secondary document data SDD according to the recognized document description content. A type determination process for classifying at least one of the primary document data FDD and the secondary document data SDD according to the document description, a rule storage process for storing the importance determination rule IJR of the document modification part DCP for each document type, Importance determination rule IJ corresponding to the document type for which the modification importance degree CIR of the detected document modification portion DCP is determined And severity determination process of determining an individual in, is described so as to perform a modified output process of outputting with the determined modified importance degree CIR detected document modifying moiety DCP, to the data processing apparatus 100.

上述のような構成において、本実施の形態のデータ処理装置100は、前述のように文書改変を検出して重要度を判定するウェブサイトを有償や無償で通信ネットワークINに開設する。   In the configuration as described above, the data processing apparatus 100 according to the present embodiment opens a website on the communication network IN for a fee or free of charge, as described above, for detecting document modification and determining the importance.

このウェブサイトには、例えば、「契約書などの一次文書と二次文書との改変部分を、その重要度とともに判定して御教示します。以下の第一の入力スペースに一次文書のテキストデータを、第二の入力スペースに二次文書のテキストデータを、それぞれ入力してください。」などのガイダンスデータが二つの入力スペースとともに提示される(図示せず)。   In this website, for example, “The modified part of the primary document and the secondary document such as a contract document will be judged and taught along with its importance. The text data of the primary document will be in the first input space below. , Enter the text data of the secondary document in the second input space respectively ", and guidance data such as" is not shown ".

そこで、原本である一次文書データFDDと改変された可能性がある二次文書データSDDとを有する利用者は、所望により上述のウェブサイトをユーザ操作端末200で利用する。   Therefore, a user who has primary document data FDD that is the original and secondary document data SDD that may have been altered uses the above-described website on the user operation terminal 200 as desired.

その場合、例えば、図3に示すように、一次文書データFDDと二次文書データSDDとがパーソナルコンピュータからなるユーザ操作端末200に電子データとして保持されているならば、そのユーザ操作端末200からデータ処理装置100のウェブサイトの入力スペース(図示せず)に一次文書データFDDと二次文書データSDDとを入力する。   In this case, for example, as shown in FIG. 3, if the primary document data FDD and the secondary document data SDD are held as electronic data in the user operation terminal 200 composed of a personal computer, the data from the user operation terminal 200 is stored. Primary document data FDD and secondary document data SDD are input to an input space (not shown) of the website of the processing apparatus 100.

すると、図6に示すように、これで一次文書データFDDと二次文書データSDDとを取得したデータ処理装置100は(ステップS1−Y)、既存の文章解析アルゴリズムなどにより、取得された一次文書データFDDと二次文書データSDDとの文書記載内容を認識する(ステップS2)。   Then, as shown in FIG. 6, the data processing apparatus 100 that has acquired the primary document data FDD and the secondary document data SDD (step S1-Y), the primary document acquired by the existing sentence analysis algorithm or the like. The document description contents of the data FDD and the secondary document data SDD are recognized (step S2).

つぎに、データ処理装置100は、認識された文書記載内容により一次文書データFDDと二次文書データSDDとを比較して文書改変部分DCPを検出する(ステップS3)。   Next, the data processing apparatus 100 compares the primary document data FDD and the secondary document data SDD according to the recognized document description, and detects the document modification portion DCP (step S3).

これで文書改変部分DCPが検出されない場合(ステップS4−N)、前述のウェブサイトに「これら二つの文書は同一内容です。改変は検出されませんでした。なお、この解析結果は法的責任を負うものではありません。」等のガイダンスメッセージが解析結果として表示出力される(ステップS8)。   If the document modification part DCP is not detected (step S4-N), the above-mentioned website says "These two documents have the same contents. Modifications were not detected. A guidance message such as “It is not assumed” is displayed and output as an analysis result (step S8).

一方、図4に示すように、文書改変部分DCPが検出された場合(ステップS4−Y)、文頭の文字列の認識結果などから一次文書データFDDの文書種別が判定される(ステップS5)。すると、この文書種別に対応した重要度判定ルールIJRが読み出される(ステップS6)。   On the other hand, as shown in FIG. 4, when the document modification portion DCP is detected (step S4-Y), the document type of the primary document data FDD is determined from the recognition result of the character string at the beginning of the sentence (step S5). Then, the importance determination rule IJR corresponding to this document type is read (step S6).

そこで、検出された文書改変部分DCPの改変重要度合CIRが読み出された重要度判定ルールIJRで個々に判定される(ステップS7)。この重要度判定ルールIJRは、例えば、特定重要表記IIMごとに改変重要度合CIRが設定されている。   Therefore, the modification importance degree CIR of the detected document modification part DCP is individually determined by the importance degree determination rule IJR (step S7). In the importance determination rule IJR, for example, a modified importance degree CIR is set for each specific importance notation IIM.

そこで、文書改変部分DCPが重要度判定ルールIJRに特定重要表記IIMとして登録されているかが検索される。これで検索された場合には、文書改変部分DCPを内包する一文を構成する全部の単語が抽出され、その単語が重要度判定ルールIJRに特定重要表記IIMとして登録されているかが検索される。   Therefore, it is searched whether the document modification part DCP is registered as the specific important notation IIM in the importance determination rule IJR. In this case, all the words constituting one sentence including the document modification part DCP are extracted, and it is searched whether or not the words are registered as the specific important notation IIM in the importance determination rule IJR.

つぎに、上述のように文書改変部分DCPを内包する一文から検索された特定重要表記IIMの組み合わせが重要度判定ルールIJRに登録されているかが判定される。この重要度判定ルールIJRには、複数の特定重要表記IIMの組み合わせにも改変重要度合CIRが設定されている。   Next, as described above, it is determined whether the combination of the specific important notation IIM retrieved from one sentence including the document modification part DCP is registered in the importance determination rule IJR. In this importance determination rule IJR, a modified importance degree CIR is also set for a combination of a plurality of specific important notations IIM.

そこで、文書改変部分DCPを内包する一文から検索された特定重要表記IIMの組み合わせが重要度判定ルールIJRに登録されていた場合には、例えば、
(文書改変部分DCPの改変重要度合CIR×A(Aは1以上の定数)+特定重要表記IIMの改変重要度合CIR×B(Bは1以下の定数)+…+文書改変部分DCPの改変重要度合CIR×A+特定重要表記IIMの改変重要度合CIR×B)×組み合わせの改変重要度合CIR=
などとして該当文章の改変重要度合CIRが算出される。
Therefore, when the combination of the specific important notation IIM retrieved from one sentence including the document modification part DCP is registered in the importance determination rule IJR, for example,
(Document modification part DCP modification importance degree CIR × A (A is a constant of 1 or more) + Specific importance notation IIM modification importance degree CIR × B (B is a constant of 1 or less) + ... + Document modification part DCP modification importance Degree CIR × A + modified importance degree CIR × B) of specific importance notation IIM × modified importance degree CIR of combination =
For example, the modification importance degree CIR of the corresponding sentence is calculated.

このように文書改変部分DCPを内包する一文ごとに改変重要度合CIRが算出されると、例えば、図5に示すように、その改変重要度合CIRで各文がソートされて「文書データを××(文書種別)と判定しました。一次文書データFDDと二次文書データSDDに相違部分がありました。…」などのガイダンスメッセージとともに、文書改変部分DCPが検出された文章が算出された改変重要度合CIRでソートされて一覧表示される。このとき、例示される各文の文書改変部分DCPは下線の付与などで強調表現される。   When the modification importance degree CIR is calculated for each sentence including the document modification part DCP in this way, for example, as shown in FIG. 5, the sentences are sorted by the modification importance degree CIR, and “document data XX (The document type was determined. There was a difference between the primary document data FDD and the secondary document data SDD ....) and the modification importance level calculated for the sentence where the document modification part DCP was detected. Sorted by CIR and displayed as a list. At this time, the document modification portion DCP of each sentence exemplified is emphasized by underlining.

本実施の形態のデータ処理装置100では、上述のように原本である一次文書データFDDと改変された可能性がある二次文書データSDDとを取得すると、取得された一次文書データFDDと二次文書データSDDとの文書記載内容を認識する。   In the data processing apparatus 100 according to the present embodiment, when the primary document data FDD that is the original and the secondary document data SDD that may be altered are acquired as described above, the acquired primary document data FDD and the secondary document data FDD are acquired. Recognizes document description content with document data SDD.

つぎに、この認識された文書記載内容により一次文書データFDDと二次文書データSDDとを比較して文書改変部分DCPを検出するとともに、認識された文書記載内容により一次文書データFDDと二次文書データSDDとの少なくとも一方の文書種別する。   Next, the primary document data FDD and the secondary document data SDD are compared with the recognized document description to detect the document modification portion DCP, and the primary document data FDD and the secondary document are detected based on the recognized document description. The document type is at least one of data SDD.

そして、検出された文書改変部分DCPの改変重要度合CIRを判定された文書種別に対応した重要度判定ルールIJRで個々に判定し、検出された文書改変部分DCPを判定された改変重要度合CIRとともに改変出力部170が出力する。このため、利用者は一次文書データFDDに対する二次文書データSDDの改変部分を重要度とともに一目で確認することができる。   Then, the modification importance degree CIR of the detected document modification part DCP is individually determined by the importance determination rule IJR corresponding to the determined document type, and the detected document modification part DCP is determined together with the determined modification importance degree CIR. The modified output unit 170 outputs. For this reason, the user can confirm at a glance the modification part of the secondary document data SDD with respect to the primary document data FDD together with the importance.

特に、本実施の形態のデータ処理装置100では、少なくとも一つが文書改変部分DCPである複数の特定重要表記IIMを関連させた重要度判定ルールIJRにより、検出された複数の文書改変部分DCPを重要度判定ルールIJRで関連させて改変重要度合CIRを判定する。   In particular, in the data processing apparatus 100 according to the present embodiment, a plurality of detected document modification portions DCP are important by the importance determination rule IJR that associates a plurality of specific important notations IIM, at least one of which is a document modification portion DCP. The modification importance degree CIR is determined in association with the degree determination rule IJR.

このため、文書改変部分DCPが検出された文章に存在する複数の特定重要表記IIMの組み合わせに対応した改変重要度合CIRが算出されるので、より的確な改変重要度合CIRを簡単に判定して利用者に提供することができる。   For this reason, since the modification importance degree CIR corresponding to the combination of a plurality of specific important notations IIM existing in the sentence in which the document modification part DCP is detected is calculated, the more appropriate modification importance degree CIR can be easily determined and used. Can be provided.

しかも、本実施の形態のデータ処理装置100は、一次文書データFDDと二次文書データSDDとの少なくとも一方の文書種別し、その文書種別に対応した重要度判定ルールIJRにより改変重要度合CIRを判定する。このため、文書種別により相違する文書改変部分DCPの改変重要度合CIRを的確に判定することができる。   Moreover, the data processing apparatus 100 according to the present embodiment determines at least one document type of the primary document data FDD and the secondary document data SDD, and determines the modified importance degree CIR by the importance degree determination rule IJR corresponding to the document type. To do. For this reason, it is possible to accurately determine the modification importance degree CIR of the document modification portion DCP that differs depending on the document type.

それでいて、本実施の形態のデータ処理装置100は、文書改変部分DCPが検出されないと文書種別を判定しない。このため、無駄なデータ処理を実行することがなく、その処理負担を軽減することができる。   Nevertheless, the data processing apparatus 100 according to the present embodiment does not determine the document type unless the document modification portion DCP is detected. For this reason, useless data processing is not executed, and the processing load can be reduced.

さらに、本実施の形態のデータ処理装置100は、文書改変部分DCPを下線で強調表現して出力する。このため、利用者は長大な文章に内包される文書改変部分DCPを一目で確認することができる。   Furthermore, the data processing apparatus 100 according to the present embodiment emphasizes and outputs the document modification portion DCP with an underline. For this reason, the user can confirm at a glance the document modification portion DCP included in the long sentence.

しかも、本実施の形態のデータ処理装置100は、文書改変部分DCPが検出された文章が複数の場合、その複数の文章を改変重要度合CIRでソートして出力する。このため、利用者は改変された文章を重要な順番で確認することができる。   In addition, when there are a plurality of sentences in which the document modification portion DCP is detected, the data processing apparatus 100 according to the present embodiment sorts the plurality of sentences by the modification importance degree CIR and outputs them. For this reason, the user can check the modified sentences in an important order.

さらに、本実施の形態のデータ処理装置100は、通信ネットワークINに開設しているウェブサイトへの入力操作により、利用者のユーザ操作端末200から通信ネットワークINを経由して一次文書データFDDと二次文書データSDDとを受信する。   Further, the data processing apparatus 100 according to the present embodiment is configured to input primary document data FDD and second text data from the user operation terminal 200 of the user via the communication network IN by an input operation to a website established in the communication network IN. Next document data SDD is received.

そして、文書改変部分DCPを判定された改変重要度合CIRとともに通信ネットワークINを経由してユーザ操作端末200にウェブサイトの表示出力で返信する。このため、利用者は特別なアプリケーションプログラムなどをユーザ操作端末200にインストールせずとも、一次文書データFDDと二次文書データSDDとの相違の有無を簡単に確認することができる。   Then, the document modification portion DCP is returned to the user operation terminal 200 via the communication network IN together with the determined modification importance degree CIR as a display output of the website. Therefore, the user can easily confirm whether there is a difference between the primary document data FDD and the secondary document data SDD without installing a special application program or the like in the user operation terminal 200.

なお、本発明は本実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で各種の変形を許容する。例えば、上記形態ではデータ処理装置100がユーザ操作端末200から一次文書データFDDと二次文書データSDDとをリアルタイムに取得することを例示した。   The present invention is not limited to the present embodiment, and various modifications are allowed without departing from the scope of the present invention. For example, in the above embodiment, the data processing apparatus 100 has exemplified the primary document data FDD and the secondary document data SDD acquired from the user operation terminal 200 in real time.

しかし、データ処理装置100が、外部から一次文書データFDDや二次文書データSDDを受信して文書保持部に格納する文書受信部と、一次文書データFDDや二次文書データSDDを保持する文書保持手段とを、さらに有し、文書取得部110は、文書保持部から一次文書データFDDや二次文書データSDDを読み出してもよい(図示せず)。   However, the data processing apparatus 100 receives a primary document data FDD and secondary document data SDD from the outside and stores them in a document holding unit, and a document holding unit that holds primary document data FDD and secondary document data SDD. The document acquisition unit 110 may read the primary document data FDD and the secondary document data SDD from the document holding unit (not shown).

また、上記形態ではサービス業者のデータ処理装置100が通信ネットワークINに開設しているウェブサイトにより、利用者のユーザ操作端末200から一次文書データFDDと二次文書データSDDとを取得して解析結果を返信することを例示した。   In the above embodiment, the primary document data FDD and the secondary document data SDD are acquired from the user operation terminal 200 of the user by the website established by the data processing apparatus 100 of the service provider in the communication network IN, and the analysis result is obtained. An example of replying.

しかし、利用者が所有するパーソナルコンピュータに専用のアプリケーションプログラムをインストールすることなどにより、原本である一次文書データFDDと改変された可能性がある二次文書データSDDとを取得する文書取得部110と、取得された一次文書データFDDと二次文書データSDDとの文書記載内容を認識する記載認識部120と、認識された文書記載内容により一次文書データFDDと二次文書データSDDとを比較して文書改変部分DCPを検出する改変検出部130と、認識された文書記載内容により一次文書データFDDと二次文書データSDDとの少なくとも一方の文書種別する種別判定部140と、文書改変部分DCPの重要度判定ルールIJRを文書種別ごとに記憶するルール記憶部150と、検出された文書改変部分DCPの改変重要度合CIRを判定された文書種別に対応した重要度判定ルールIJRで個々に判定する重要度判定部160と、検出された文書改変部分DCPを判定された改変重要度合CIRとともに出力する改変出力部170と、を有するデータ処理装置(図示せず)を実現してもよい。   However, a document acquisition unit 110 that acquires primary document data FDD that is the original and secondary document data SDD that may have been altered by installing a dedicated application program on a personal computer owned by the user, etc. The description recognition unit 120 for recognizing document description contents of the acquired primary document data FDD and secondary document data SDD, and comparing the primary document data FDD and the secondary document data SDD according to the recognized document description contents The modification detection unit 130 that detects the document modification part DCP, the type determination unit 140 that classifies at least one of the primary document data FDD and the secondary document data SDD according to the recognized document description, and the importance of the document modification part DCP A rule storage unit 150 for storing the degree determination rule IJR for each document type, and An importance determination unit 160 that individually determines the modification importance degree CIR of the document modification part DCP by the importance determination rule IJR corresponding to the document type determined, and the modification importance degree CIR that is determined for the detected document modification part DCP A data processing device (not shown) having a modified output unit 170 that outputs the data may be realized.

このようなデータ処理装置が、一次文書原稿と二次文書原稿とを光学読取して一次画像データと二次画像データとを生成する光学読取手段と、一次画像データと二次画像データとの表記文字認識により一次文書データFDDと二次文書データSDDとを生成する文字認識手段とを、さらに有してもよい(図示せず)。   Such a data processing apparatus optically reads a primary document original and a secondary document original to generate primary image data and secondary image data, and description of primary image data and secondary image data You may further have the character recognition means (not shown) which produces | generates the primary document data FDD and the secondary document data SDD by character recognition.

この場合、データ処理装置は、いわゆる紙媒体からなる一次文書原稿と二次文書原稿との改変部分を簡単に検出して利用者に教示することができる。なお、このようなデータ処理装置が携帯電話端末からなる場合、上述の光学読取手段として現在の携帯電話端末では一般的なCCD(Charge Coupled Device)カメラを利用することができる。   In this case, the data processing apparatus can easily detect a modified portion between the primary document original and the secondary document original made of a so-called paper medium and can teach the user. In the case where such a data processing device is composed of a mobile phone terminal, a current CCD (Charge Coupled Device) camera can be used as the above-mentioned optical reading means in the current mobile phone terminal.

さらに、このようなデータ処理装置100が、光学読取された一次画像データと二次画像データとを比較して画像改変部分を検出する画像比較手段も有し、検出された画像改変部分も参照して文書改変部分DCPを検出してもよい(図示せず)。   Further, such a data processing apparatus 100 also has image comparison means for comparing the primary image data and the secondary image data that have been optically read to detect an image modification portion, and also refers to the detected image modification portion. Then, the document modification part DCP may be detected (not shown).

この場合、テキストデータとしては同一に認識されても画像として改変されている部分を検出して文書改変部分DCPを判定することができる。このため、例えば、手書きなどによる改変を良好な精度で検出するようなことができる。   In this case, it is possible to determine the document modification portion DCP by detecting a portion that is recognized as the same text data but is modified as an image. For this reason, for example, it is possible to detect alteration by handwriting or the like with good accuracy.

また、データ処理装置100が、一次文書原稿や二次文書原稿を光学読取して各々生成された一次画像データや二次画像データを外部のユーザ操作端末200などから受信する文書受信部と、受信された一次画像データや二次画像データの表記文字認識により一次文書データFDDや二次文書データSDDを生成して前述の文書保持部に格納する文字認識部とを、さらに有し、文書取得部110は、文書保持部から一次文書データFDDや二次文書データSDDを読み出してもよい。   In addition, the data processing apparatus 100 receives a primary image data and secondary image data generated by optically reading a primary document original and a secondary document original, respectively, and receives the primary image data and secondary image data from an external user operation terminal 200 and the like. A character recognition unit that generates primary document data FDD and secondary document data SDD by recognizing the written characters of the primary image data and secondary image data, and stores them in the document holding unit. 110 may read primary document data FDD and secondary document data SDD from the document holding unit.

この場合、例えば、一般ユーザはCCDカメラが搭載されている携帯電話端末、ウェブカメラやフラットベッドスキャナが接続されているパーソナルコンピュータ、等をユーザ操作端末200として利用することができる。   In this case, for example, a general user can use as the user operation terminal 200 a mobile phone terminal on which a CCD camera is mounted, a personal computer to which a web camera or a flatbed scanner is connected, and the like.

このようなユーザ操作端末200で一般ユーザが一次文書原稿や二次文書原稿を光学読取してデータ処理装置100に送信すると、その改変有無の解析結果を一般ユーザはユーザ操作端末200で受信することができる。   When a general user optically reads a primary document manuscript or a secondary document manuscript at such a user operation terminal 200 and transmits it to the data processing apparatus 100, the general user receives the analysis result of the presence / absence of modification at the user operation terminal 200. Can do.

また、上記形態では検出された文書改変部分DCPを下線付与により単純に強調表現することを例示した。しかし、文書改変部分DCPを判定された改変重要度合CIRに対応して二次文書データSDDで強調表現した改変強調データを生成して出力してもよい。   In the above embodiment, the detected document modification portion DCP is simply emphasized by underlining. However, the modification emphasis data in which the document modification portion DCP is emphasized by the secondary document data SDD corresponding to the determined modification importance degree CIR may be generated and output.

例えば、改変重要度合CIRが"3"の場合は文書改変部分DCPを赤色、"2"の場合は黄色、"1"の場合は青色、でハイライト表示するようなことが可能である(図示せず)。この場合、利用者は文書改変部分DCPを改変重要度合CIRとともに一目で確認することができる。   For example, when the modification importance degree CIR is “3”, the document modification portion DCP can be highlighted in red, “2” in yellow, and “1” in blue. Not shown). In this case, the user can confirm the document modification portion DCP together with the modification importance degree CIR at a glance.

さらに、上記形態では検出された文書改変部分DCPを内包する文章を単純に列記することを例示した。しかし、検出された文書改変部分DCPを内包する少なくとも一文部分文章を一次文書データFDDと二次文書データSDDから抽出し、改変出力部170は、抽出された一次文書データFDDと二次文書データSDDとの一文部分文章を要約した改変要約文章を生成して文書改変部分DCPとともに出力してもよい。この場合、一般的な利用者には難解な契約書などの文章を、より簡単に理解させることができる。   Furthermore, in the said form, it illustrated illustrating simply enumerating the sentence which contains the document modification part DCP detected. However, at least one sentence part sentence including the detected document modification part DCP is extracted from the primary document data FDD and the secondary document data SDD, and the modification output unit 170 extracts the extracted primary document data FDD and secondary document data SDD. A modified summary sentence that summarizes the one sentence part sentence may be generated and output together with the document modification part DCP. In this case, general users can more easily understand sentences such as difficult contracts.

また、文書改変部分DCPごとに注釈文章データを重要度判定ルールIJRに設定しておき、検出された文書改変部分DCPを改変重要度合CIRおよび注釈文章データとともに出力してもよい。この場合、一般的な利用者には難解な専門用語などを、より簡単に理解させることができる。   Alternatively, the annotation text data may be set in the importance determination rule IJR for each document modification portion DCP, and the detected document modification portion DCP may be output together with the modification importance level CIR and the annotation text data. In this case, technical terms that are difficult for general users to understand can be understood more easily.

さらに、本実施の形態ではデータ処理装置の各部がコンピュータプログラムにより各種機能として論理的に実現されることを例示した。しかし、このような各部の各々を固有のハードウェアとして形成することもでき、ソフトウェアとハードウェアとの組み合わせとして実現することもできる。   Furthermore, in the present embodiment, it has been exemplified that each unit of the data processing apparatus is logically realized as various functions by a computer program. However, each of these units can be formed as unique hardware, or can be realized as a combination of software and hardware.

なお、当然ながら、上述した実施の形態および複数の変形例は、その内容が相反しない範囲で組み合わせることができる。また、上述した実施の形態および変形例では、各部の構造などを具体的に説明したが、その構造などは本願発明を満足する範囲で各種に変更することができる。   Needless to say, the above-described embodiment and a plurality of modifications can be combined within a range in which the contents do not conflict with each other. Further, in the above-described embodiments and modifications, the structure of each part has been specifically described, but the structure and the like can be changed in various ways within a range that satisfies the present invention.

本発明の実施の形態のデータ通信システムの論理構造を示す模式図である。It is a schematic diagram which shows the logical structure of the data communication system of embodiment of this invention. データ通信システムの物理構造を示すブロック図である。It is a block diagram which shows the physical structure of a data communication system. 一次文書データと二次文書データとの表記内容を示す模式的な正面図である。It is a typical front view which shows the description content of primary document data and secondary document data. 二次文書データから文書改変部分が検出された状態を示す模式的な正面図である。It is a typical front view which shows the state in which the document modification part was detected from secondary document data. 文書改変部分や改変重要度合の出力結果を示す模式的な正面図である。It is a typical front view which shows the output result of a document modification part and modification importance. データ処理装置によるデータ処理方法を示すフローチャートである。It is a flowchart which shows the data processing method by a data processor.

符号の説明Explanation of symbols

100 データ処理装置
110 文書取得部
120 記載認識部
130 改変検出部
140 種別判定部
150 ルール記憶部
160 重要度判定部
170 改変出力部
200 ユーザ操作端末
1000 データ処理システム
CIR 改変重要度合
DCP 文書改変部分
FDD 一次文書データ
IIM 特定重要表記
IJR 重要度判定ルール
IN 通信ネットワーク
SDD 二次文書データ
DESCRIPTION OF SYMBOLS 100 Data processor 110 Document acquisition part 120 Description recognition part 130 Modification detection part 140 Type determination part 150 Rule storage part 160 Importance determination part 170 Modification output part 200 User operation terminal 1000 Data processing system CIR Modification importance degree DCP Document modification part FDD Primary document data IIM Specific important notation IJR Importance determination rule IN Communication network SDD Secondary document data

Claims (18)

原本である一次文書データと改変された可能性がある二次文書データとを取得する文書取得手段と、
取得された前記一次文書データと前記二次文書データとの文書記載内容を認識する記載認識手段と、
認識された前記文書記載内容により前記一次文書データと前記二次文書データとを比較して文書改変部分を検出する改変検出手段と、
認識された前記文書記載内容により前記一次文書データと前記二次文書データとの少なくとも一方の文書種別を判定する種別判定手段と、
前記文書改変部分の重要度判定ルールを前記文書種別ごとに記憶するルール記憶手段と、
検出された前記文書改変部分の改変重要度合を判定された前記文書種別に対応した前記重要度判定ルールで個々に判定する重要度判定手段と、
検出された前記文書改変部分を判定された前記改変重要度合とともに出力する改変出力手段と、
を有し、
複数の特定重要標記が予め定められており、
前記ルール記憶手段は、前記特定重要表記の組み合わせである前記重要度判定ルールを記憶し、
前記重要度判定手段は、検出された前記文書改変部分を含む一文から、前記特定重要標記を抽出し、抽出した前記特定重要標記の組み合わせと前記重要度判定ルールとを比較した結果を用いて、前記改変重要度合を判定するデータ処理装置。
Document acquisition means for acquiring the original primary document data and possibly modified secondary document data;
Description recognizing means for recognizing document description contents of the acquired primary document data and the secondary document data;
Modification detection means for detecting a document modification portion by comparing the primary document data and the secondary document data according to the document description content recognized;
Type determination means for determining at least one document type of the primary document data and the secondary document data according to the recognized document description;
Rule storage means for storing the importance determination rule of the document modification part for each document type;
Importance determination means for individually determining with the importance determination rule corresponding to the document type for which the modification importance of the detected document modification portion is determined;
Modification output means for outputting the detected document modification part together with the determined modification importance degree;
I have a,
A number of specific important titles are predefined,
The rule storage means stores the importance determination rule that is a combination of the specific important notations,
The importance determination means extracts the specific important mark from one sentence including the detected document modification part, and uses a result of comparing the extracted combination of the specific important mark and the importance determination rule, A data processing apparatus for determining the modification importance level .
少なくとも前記一次文書データを保持する文書保持手段を、さらに有し、
前記文書取得手段は、前記文書保持手段から前記一次文書データを読み出す請求項1に記載のデータ処理装置。
Document holding means for holding at least the primary document data;
The data processing apparatus according to claim 1, wherein the document acquisition unit reads the primary document data from the document holding unit.
外部から少なくとも前記一次文書データを受信して前記文書保持手段に格納する文書受信手段を、さらに有する請求項2に記載のデータ処理装置。   The data processing apparatus according to claim 2, further comprising a document receiving unit that receives at least the primary document data from the outside and stores it in the document holding unit. 少なくとも一次文書原稿を光学読取して次画像データを生成する光学読取手段と、
生成された前記一次画像データの表記文字認識により前記一次文書データを生成して前記文書保持手段に格納する文字認識手段とを、
さらに有する請求項2に記載のデータ処理装置。
Optical reading means for generating a primary image data by reading optical at least primary original document,
Character recognition means for generating the primary document data by recognizing written characters of the generated primary image data and storing it in the document holding means;
The data processing apparatus according to claim 2, further comprising:
少なくとも一次文書原稿を光学読取して生成された次画像データを外部から受信する文書受信手段と、
受信された前記一次画像データの表記文字認識により前記一次文書データを生成して前記文書保持手段に格納する文字認識手段とを、
さらに有する請求項2に記載のデータ処理装置。
A document receiving means for receiving from the outside the primary image data generated by reading optical at least primary original document,
Character recognition means for generating the primary document data by notation character recognition of the received primary image data and storing it in the document holding means;
The data processing apparatus according to claim 2, further comprising:
少なくとも前記二次文書データを保持する文書保持手段を、さらに有し、
前記文書取得手段は、前記文書保持手段から前記二次文書データを読み出す請求項1ないし5の何れか一項に記載のデータ処理装置。
A document holding means for holding at least the secondary document data;
The data processing apparatus according to claim 1, wherein the document acquisition unit reads the secondary document data from the document holding unit.
外部から少なくとも前記二次文書データを受信して前記文書保持手段に格納する文書受信手段を、さらに有する請求項6に記載のデータ処理装置。   The data processing apparatus according to claim 6, further comprising a document receiving unit that receives at least the secondary document data from outside and stores the data in the document holding unit. 少なくとも二次文書原稿を光学読取して次画像データを生成する光学読取手段と、
生成された前記二次画像データの表記文字認識により前記二次文書データを生成して前記文書保持手段に格納する文字認識手段とを、
さらに有する請求項6に記載のデータ処理装置。
Optical reading means for generating a secondary image data by reading optical at least secondary original document,
Character recognition means for generating the secondary document data by recognizing written characters of the generated secondary image data and storing it in the document holding means;
The data processing apparatus according to claim 6, further comprising:
少なくとも二次文書原稿を光学読取して生成された次画像データを外部から受信する文書受信手段と、
受信された前記二次画像データの表記文字認識により前記二次文書データを生成して前記文書保持手段に格納する文字認識手段とを、
さらに有する請求項6に記載のデータ処理装置。
A document receiving means for receiving from the outside at least the secondary document original secondary image data generated by reading optical and
Character recognition means for generating the secondary document data by recognizing the written character of the received secondary image data and storing it in the document holding means;
The data processing apparatus according to claim 6, further comprising:
前記文書受信手段は、利用者のユーザ操作端末から通信ネットワークを経由して前記一次文書データと前記二次文書データとを受信し、
前記改変出力手段は、前記文書改変部分を判定された前記改変重要度合とともに前記通信ネットワークを経由して前記ユーザ操作端末に返信する請求項3または7に記載のデータ処理装置。
The document receiving means receives the primary document data and the secondary document data from a user operation terminal of a user via a communication network,
The data processing device according to claim 3 or 7, wherein the modification output unit returns the document modification part to the user operation terminal via the communication network together with the determined modification importance level.
前記光学読取手段は、前記一次文書原稿と前記二次文書原稿とを光学読取して前記一次画像データと前記二次画像データとを生成し、
前記文字認識手段は、生成された前記一次画像データと前記二次画像データとの表記文字認識により前記一次文書データと前記二次文書データとを生成し、
光学読取された前記一次画像データと前記二次画像データとを比較して画像改変部分を検出する画像比較手段とを、さらに有し、
前記改変検出手段は、検出された前記画像改変部分も参照して前記文書改変部分を検出する請求項4または8に記載のデータ処理装置。
The optical reading unit optically reads the primary document original and the secondary document original to generate the primary image data and the secondary image data;
The character recognizing means generates the primary document data and the secondary document data by recognizing written characters of the generated primary image data and the secondary image data;
Image comparison means for detecting an image modification portion by comparing the optically read primary image data and the secondary image data, and
9. The data processing apparatus according to claim 4, wherein the alteration detection unit detects the document alteration portion with reference to the detected image alteration portion.
前記文書受信手段は、前記一次文書原稿と前記二次文書原稿とを光学読取して生成された前記一次画像データと前記二次画像データとを受信し、
前記文字認識手段は、受信された前記一次画像データと前記二次画像データとの表記文字認識により前記一次文書データと前記二次文書データとを生成し、
光学読取された前記一次画像データと前記二次画像データとを比較して画像改変部分を検出する画像比較手段とを、さらに有し、
前記改変検出手段は、検出された前記画像改変部分も参照して前記文書改変部分を検出する請求項5または9に記載のデータ処理装置。
The document receiving means receives the primary image data and the secondary image data generated by optically reading the primary document original and the secondary document original;
The character recognition means generates the primary document data and the secondary document data by recognizing the written characters of the received primary image data and the secondary image data,
Image comparison means for detecting an image modification portion by comparing the optically read primary image data and the secondary image data, and
The data processing apparatus according to claim 5 or 9, wherein the alteration detection unit detects the document alteration portion with reference to the detected image alteration portion.
前記改変検出手段は、検出された前記文書改変部分を内包する少なくとも一文部分文章を前記一次文書データと前記二次文書データから抽出し、
前記改変出力手段は、抽出された前記一次文書データと前記二次文書データとの前記一文部分文章を要約した改変要約文章を生成して前記文書改変部分とともに出力する請求項1ないし12の何れか一項に記載のデータ処理装置。
The modification detection means extracts at least one sentence part sentence including the detected document modification part from the primary document data and the secondary document data,
Said modified output means, any one of claims 1 to 12 for output together with the document-modifying moiety to the sentence portion sentences and extracted the primary document data the secondary document data to generate the modified summary sentence summarizing The data processing device according to one item.
前記ルール記憶手段は、前記文書改変部分ごとに注釈文章データが設定された前記重要度判定ルールを記憶し、
前記改変出力手段は、検出された前記文書改変部分を前記改変重要度合および前記注釈文章データとともに出力する請求項1ないし13の何れか一項に記載のデータ処理装置。
The rule storage means stores the importance determination rule in which annotation text data is set for each document modification part,
The data processing apparatus according to any one of claims 1 to 13 , wherein the modification output unit outputs the detected document modification part together with the modification importance level and the annotation text data.
前記改変出力手段は、前記文書改変部分を判定された前記改変重要度合に対応して前記二次文書データで強調表現した改変強調データを生成して出力する請求項1ないし14の何れか一項に記載のデータ処理装置。 Said modified output means, any one of claims 1 to 14 for generating and outputting a modified enhancement data highlighted expressed in the secondary document data in response to said modified important degree it is determined the document modifying moiety The data processing apparatus described in 1. 前記改変出力手段は、前記文書改変部分が各々検出された複数の一文部分文章を判定された前記改変重要度合でソートして出力する請求項1ないし15の何れか一項に記載のデータ処理装置。 The data processing apparatus according to any one of claims 1 to 15 , wherein the modification output unit sorts and outputs a plurality of one-sentence partial sentences in which the document modification parts are respectively detected according to the determined importance of modification. . 原本である一次文書データと改変された可能性がある二次文書データとを取得する文書取得処理と、
取得された前記一次文書データと前記二次文書データとの文書記載内容を認識する記載認識処理と、
認識された前記文書記載内容により前記一次文書データと前記二次文書データとを比較して文書改変部分を検出する改変検出処理と、
認識された前記文書記載内容により前記一次文書データと前記二次文書データとの少なくとも一方の文書種別を判定する種別判定処理と、
前記文書改変部分の重要度判定ルールを前記文書種別ごとに記憶するルール記憶処理と、
検出された前記文書改変部分の改変重要度合を判定された前記文書種別に対応した前記重要度判定ルールで個々に判定する重要度判定処理と、
検出された前記文書改変部分を判定された前記改変重要度合とともに出力する改変出力処理と、
をデータ処理装置に実行させ
複数の特定重要標記が予め定められており、
前記ルール記憶処理において、前記特定重要表記の組み合わせである前記重要度判定ルールを記憶させ、
前記重要度判定処理において、検出された前記文書改変部分を含む一文から、前記特定重要標記を抽出し、抽出した前記特定重要標記の組み合わせと前記重要度判定ルールとを比較した結果を用いて、前記改変重要度合を判定させるコンピュータプログラム。
A document acquisition process for acquiring the original primary document data and possibly modified secondary document data;
A description recognition process for recognizing document descriptions of the acquired primary document data and the secondary document data;
A modification detection process for detecting a document modification portion by comparing the primary document data and the secondary document data according to the document description content recognized;
A type determination process for determining at least one document type of the primary document data and the secondary document data according to the recognized document description content;
A rule storage process for storing the importance determination rule of the document modification part for each document type;
Importance determination processing for individually determining with the importance determination rule corresponding to the document type for which the modification importance of the detected document modification portion is determined;
A modification output process for outputting the detected document modification part together with the determined modification importance degree;
To the data processing device ,
A number of specific important titles are predefined,
In the rule storage process, the importance determination rule that is a combination of the specific important notations is stored,
In the importance determination process, the specific important mark is extracted from one sentence including the detected document modification part, and the result of comparing the extracted combination of the specific important mark and the importance determination rule is used. It said modified important degree the computer program Ru is determined.
原本である一次文書データと改変された可能性がある二次文書データとを取得する文書取得動作と、
取得された前記一次文書データと前記二次文書データとの文書記載内容を認識する記載認識動作と、
認識された前記文書記載内容により前記一次文書データと前記二次文書データとを比較して文書改変部分を検出する改変検出動作と、
認識された前記文書記載内容により前記一次文書データと前記二次文書データとの少なくとも一方の文書種別を判定する種別判定動作と、
前記文書改変部分の重要度判定ルールを前記文書種別ごとに記憶するルール記憶動作と、
検出された前記文書改変部分の改変重要度合を判定された前記文書種別に対応した前記重要度判定ルールで個々に判定する重要度判定動作と、
検出された前記文書改変部分を判定された前記改変重要度合とともに出力する改変出力動作と、
を有し、
複数の特定重要標記が予め定められており、
前記ルール記憶動作において、前記特定重要表記の組み合わせである前記重要度判定ルールを記憶し、
前記重要度判定動作において、検出された前記文書改変部分を含む一文から、前記特定重要標記を抽出し、抽出した前記特定重要標記の組み合わせと前記重要度判定ルールとを比較した結果を用いて、前記改変重要度合を判定するデータ処理装置のデータ処理方法。
A document acquisition operation for acquiring the original primary document data and possibly modified secondary document data;
A description recognition operation for recognizing document description contents of the acquired primary document data and the secondary document data;
A modification detecting operation for detecting a document modification portion by comparing the primary document data and the secondary document data according to the recognized document description content;
A type determination operation for determining at least one document type of the primary document data and the secondary document data according to the recognized document description;
A rule storage operation for storing the importance determination rule of the document modification part for each document type;
An importance determination operation for individually determining with the importance determination rule corresponding to the document type for which the modification importance level of the detected document modification portion is determined;
A modification output operation for outputting the detected document modification portion together with the determined modification importance degree;
I have a,
A number of specific important titles are predefined,
In the rule storage operation, the importance determination rule that is a combination of the specific important notations is stored,
In the importance level judgment operation, the specific important title is extracted from one sentence including the detected document modification part, and the result of comparing the extracted combination of the specific important title and the importance level judgment rule is used. data processing method for data processing apparatus for determining the modified importance degree.
JP2008125499A 2008-05-13 2008-05-13 Data processing apparatus, computer program thereof, and data processing method Expired - Fee Related JP4992820B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008125499A JP4992820B2 (en) 2008-05-13 2008-05-13 Data processing apparatus, computer program thereof, and data processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008125499A JP4992820B2 (en) 2008-05-13 2008-05-13 Data processing apparatus, computer program thereof, and data processing method

Publications (2)

Publication Number Publication Date
JP2009276873A JP2009276873A (en) 2009-11-26
JP4992820B2 true JP4992820B2 (en) 2012-08-08

Family

ID=41442277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008125499A Expired - Fee Related JP4992820B2 (en) 2008-05-13 2008-05-13 Data processing apparatus, computer program thereof, and data processing method

Country Status (1)

Country Link
JP (1) JP4992820B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7164888B2 (en) * 2019-03-29 2022-11-02 智博 小野 Contract checking device and its program

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3020803B2 (en) * 1994-06-08 2000-03-15 株式会社日立製作所 Legal document search and revision system
JPH10254900A (en) * 1997-03-14 1998-09-25 Omron Corp Automatic document summarizing device and its method
JP2004086851A (en) * 2002-06-27 2004-03-18 Oki Electric Ind Co Ltd Apparatus, method, and program for detecting significant updating of electronic document, and record medium storing the program
JP2006163902A (en) * 2004-12-08 2006-06-22 Canon Inc Update notification device and update notification method

Also Published As

Publication number Publication date
JP2009276873A (en) 2009-11-26

Similar Documents

Publication Publication Date Title
US10812427B2 (en) Forgotten attachment detection
JP5480462B2 (en) Document processing program, document processing apparatus, and document processing system
JP2018512666A (en) Method and apparatus for verifying an image based on an image verification code
US10769360B1 (en) Apparatus and method for processing an electronic document to derive a first electronic document with electronic-sign items and a second electronic document with wet-sign items
KR20080100179A (en) Detection of lists in vector graphics documents
US11195004B2 (en) Method and system for extracting information from document images
JP2006189924A (en) Image display program and image display apparatus
US20210295033A1 (en) Information processing apparatus and non-transitory computer readable medium
US10638001B2 (en) Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data
JP4992820B2 (en) Data processing apparatus, computer program thereof, and data processing method
US20180307669A1 (en) Information processing apparatus
US11363162B2 (en) System and method for automated organization of scanned text documents
JP5510221B2 (en) Information processing apparatus and information processing program
JP6303742B2 (en) Image processing apparatus, image processing method, and image processing program
TWI726356B (en) Electronic device and file content management method
JP2014044555A (en) Image processing apparatus, image processing system, and program
US11574490B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
US11206336B2 (en) Information processing apparatus, method, and non-transitory computer readable medium
US20210191991A1 (en) Information processing apparatus and non-transitory computer readable medium
US20240244149A1 (en) Generating file of distinct writer based on handwriting text
US10896220B2 (en) Method of searching an image file in a computer system, related image file searching device, and related computer system
JP4960401B2 (en) Image display program and image display apparatus
US20240233426A9 (en) Method of classifying a document for a straight-through processing
US20230334885A1 (en) Neural Network Architecture for Classifying Documents
CN114564941A (en) Method, device and equipment for judging option selection state and readable storage medium

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111114

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120104

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120410

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120423

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150518

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees