JP5542414B2 - Information processing apparatus, document management method, and document management program - Google Patents
Information processing apparatus, document management method, and document management program Download PDFInfo
- Publication number
- JP5542414B2 JP5542414B2 JP2009250543A JP2009250543A JP5542414B2 JP 5542414 B2 JP5542414 B2 JP 5542414B2 JP 2009250543 A JP2009250543 A JP 2009250543A JP 2009250543 A JP2009250543 A JP 2009250543A JP 5542414 B2 JP5542414 B2 JP 5542414B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- information
- image data
- character
- text data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Character Discrimination (AREA)
Description
本発明は、文書が記された画像データからテキストデータを生成し、また作成されたテキストデータの編集作業および確認作業を支援する技術に関する。 The present invention relates to a technique for generating text data from image data in which a document is written, and for supporting editing and confirmation work of the created text data.
紙媒体で管理された文書を修正する場合、スキャナで紙媒体を読み取り画像データを作成した後、OCR(Optical Character Reader)を使用してテキストデータ化したものを修正することになる。修正内容の確認作業は、図15に示すように、修正前原本と修正後の出力物(プリントアウトされた紙媒体やコンピュータの画面上に表示されたデータ)とを確認者が交互に目視し、対比することで行われる。 When correcting a document managed by a paper medium, the paper medium is read by a scanner to create image data, and then the text data is converted using an OCR (Optical Character Reader). As shown in FIG. 15, the checker confirms the original contents before correction and the output data after correction (printed paper media or data displayed on the computer screen) alternately as shown in FIG. , By contrast.
関連する技術として、以下の技術が開示されている。 The following technologies are disclosed as related technologies.
原本が紙媒体の場合、修正後との比較確認は目視確認にならざるを得ない。また、修正前原本と修正後の出力物を目視確認する場合、修正箇所が明確に判別できる訳ではないため確認漏れが発生する可能性がある。また、確認作業は修正前原本と修正後の出力物を見比べるという作業となり、作業の手間も大きい。 In the case where the original is a paper medium, the comparison confirmation after the correction must be a visual confirmation. In addition, when the original before correction and the output after correction are visually checked, there is a possibility that a check omission may occur because the correction portion cannot be clearly identified. Also, the confirmation work is a work of comparing the original document before correction with the output product after correction, which requires a lot of work.
さらに、修正前原本と修正後の出力物との対比は、新旧対比表を作成しこの表を用いて確認することが有効であるが、従来技術においては、新旧対比表を別途生成する必要がある。 In addition, it is effective to create a new / old comparison table and check the comparison between the original data before correction and the output after correction, but in the conventional technology, it is necessary to generate a new / old comparison table separately. is there.
本発明は、上述した問題点を解決するためになされたものであり、修正前原本と修正後の出力物との確認作業を一つのイメージにマージすることで、修正前のデータに対して修正箇所を明示することが可能になり、確認漏れを低減させるとともに修正前のデータと修正後のデータとの比較確認も容易となる技術を提供することを目的とする。 The present invention has been made in order to solve the above-described problems, and the data before correction is corrected by merging the confirmation work between the original data before correction and the output data after correction into one image. It is an object of the present invention to provide a technique that makes it possible to clearly indicate a location, reduce confirmation omissions, and facilitate comparison and confirmation of data before correction and data after correction.
上述した課題を解決するため、本発明の一態様に係る情報処理装置は、一つの文字または複数の文字で構成された文字列が記された画像データから、前記文字列を読み取りテキストデータを生成する認識部と、前記認識部によって生成されたテキストデータを取得し、該テキストデータに対しての編集作業によって削除された文字列には削除情報を付与し、挿入された文字列には挿入情報を付与し、これら削除情報、挿入情報が付与されたテキストデータを生成する編集支援部と、前記画像データと前記編集支援部によって生成されたテキストデータとを取得し、前記画像データと挿入情報が付与された文字列とを表示するとともに、削除情報が付与された文字列に対応する前記画像データの文字列を、他の文字列とは異なる形式で表示し、且つ前記挿入情報が付与された文字列が前記画像データのいずれに挿入されるかを、視認可能な形式で表示する表示部とを有する。 In order to solve the above-described problem, an information processing apparatus according to an aspect of the present invention generates text data by reading the character string from image data in which a character string including one character or a plurality of characters is written. A recognition unit that acquires the text data generated by the recognition unit, adds deletion information to the character string deleted by editing the text data, and inserts information into the inserted character string. An edit support unit that generates text data to which the deletion information and the insert information are added, the image data and the text data generated by the edit support unit, and the image data and the insert information are Displaying the assigned character string and displaying the character string of the image data corresponding to the character string to which the deletion information is given in a format different from other character strings, One or the insertion information string is granted is inserted into any of the image data, and a display unit for displaying in a visible form.
また、上述した課題を解決するため、本発明の一態様に係る文書管理方法は、コンピュータが、一つの文字または複数の文字で構成された文字列が記された画像データから、前記文字列を読み取りテキストデータを生成し、生成されたテキストデータを取得し、該テキストデータに対しての編集作業によって削除された文字列には削除情報を付与し、挿入された文字列には挿入情報を付与し、これら削除情報、挿入情報が付与されたテキストデータを生成し、前記画像データと、削除情報、挿入情報が付与されることで生成されたテキストデータとを取得し、前記画像データと挿入情報が付与された文字列とを表示するとともに、削除情報が付与された文字列に対応する前記画像データの文字列を、他の文字列とは異なる形式で表示し、且つ前記挿入情報が付与された文字列が前記画像データのいずれに挿入されるかを、視認可能な形式で表示する。 In order to solve the above-described problem, in a document management method according to one aspect of the present invention, a computer uses the character string from image data in which a character string including one character or a plurality of characters is written. Generates read text data, acquires the generated text data, gives deletion information to the character string deleted by editing the text data, and gives insertion information to the inserted character string And generating the text data to which the deletion information and the insertion information are added, obtaining the image data and the text data generated by adding the deletion information and the insertion information, and acquiring the image data and the insertion information. And a character string of the image data corresponding to the character string to which the deletion information is added, in a format different from other character strings, and Or serial insertion information string granted is inserted into any of the image data is displayed in a visible form.
上述した課題を解決するため、本発明の一態様に係る文書管理プログラムは、一つの文字または複数の文字で構成された文字列が記された画像データから、前記文字列を読み取りテキストデータを生成し、生成されたテキストデータを取得し、該テキストデータに対しての編集作業によって削除された文字列には削除情報を付与し、挿入された文字列には挿入情報を付与し、これら削除情報、挿入情報が付与されたテキストデータを生成し、前記画像データと、削除情報、挿入情報が付与されることで生成されたテキストデータとを取得し、前記画像データと挿入情報が付与された文字列とを表示するとともに、削除情報が付与された文字列に対応する前記画像データの文字列を、他の文字列とは異なる形式で表示し、且つ前記挿入情報が付与された文字列が前記画像データのいずれに挿入されるかを、視認可能な形式で表示する処理をコンピュータに実行させる。 In order to solve the above-described problem, a document management program according to an aspect of the present invention generates text data by reading the character string from image data in which a character string composed of one character or a plurality of characters is written. The generated text data is acquired, deletion information is given to the character string deleted by editing the text data, insertion information is given to the inserted character string, and the deletion information The text data to which the insertion information is added is generated, the image data and the text data generated by the deletion information and the insertion information are acquired, and the character to which the image data and the insertion information are assigned are obtained. A character string of the image data corresponding to the character string to which the deletion information is given, in a format different from other character strings, and the insertion information is attached. Or string is inserted into any of the image data, to execute the processing for displaying in a visible form to the computer.
編集前原本の画像データと修正後のデータとの比較確認作業を一つの修正確認用イメージ上で表示することができ、確認漏れが低減するとともに、目視比較作業の手間を大幅に削減することができる。 Comparing and confirming the original image data before editing and the corrected data can be displayed on a single image for confirmation of confirmation, reducing check errors and greatly reducing the labor of visual comparison. it can.
以下、本発明の実施の形態について図面を参照しつつ説明する。 Embodiments of the present invention will be described below with reference to the drawings.
図1に、本実施の形態に係る文書管理システムの構成を示す。文書管理システム300は、スキャナ200、文書管理端末100(情報処理装置)を有する。
FIG. 1 shows a configuration of a document management system according to the present embodiment. The
スキャナ200は、イメージスキャニング部20を有する。文書管理端末100は、文字認識部1(認識部)、文字編集部2(編集支援部)、出力部3(表示部)、新旧対比表生成部4(対比表生成部)を有する。
The
文書管理端末100は、演算処理装置であるCPU(Central Processing Unit)、主記憶装置であるメモリ、不揮発性記憶装置(フラッシュメモリ、ハードディスクドライブ等)を有し、またキーボード、マウス、ディスプレイ、プリンタ等の入出力装置を有するコンピュータである。文書管理端末100内の各機能ブロックは、不揮発性記憶装置に予め記憶されている文書管理プログラムが、メモリ上にロードされ、CPUによって文書管理プログラムが演算実行されることで実現される。
The
次に、これら各機能ブロックの詳細説明をする。
イメージスキャニング部20の詳細を図2を参照しつつ説明する。イメージスキャニング部20は、紙媒体で管理された修正前原本51(修正前原本51には少なくとも一つの文字または複数の文字が記載されている)に光を照射し、その反射光を用いてデジタルデータに変換することで、イメージデータ52を生成する。生成されたイメージデータ52は、文書管理端末100の文字認識部1に送信される。
Next, a detailed description of each of these functional blocks will be given.
Details of the
文字認識部1の詳細を、図3を参照しつつ説明する。文字認識部1は、イメージスキャニング部20から送信されたイメージデータ52を解析し、文字列と思われる箇所をテキストデータ(所定の文字コードによって構成されるデータ)に変換するとともに、その文字列がイメージデータ52のどの場所に存在するかの座標情報を行単位で変換後のテキストデータに付与する。
Details of the
また文字認識部1は、変換後のテキストデータにイメージデータ52のファイル名およびイメージデータ52の存在場所(いずれのフォルダに格納されるか)を付与することで、テキストデータとイメージデータ52の関連付けを行う。このテキストデータは、XML形式でテキストデータ53として生成される。文字認識部1は、処理が完了した際に、生成したテキストデータ53と認識に使用されたイメージデータ52を所定の格納場所にファイルとして格納する。
Further, the
ここで、文字認識部1が生成するテキストデータ53の例を図4に示す。図4のように、テキストデータ53上にイメージデータ52の情報(イメージデータ情報)を設定することで、イメージデータ52とテキストデータ53とが出力部3によるマージ処理の際にマッチングされる。尚、図4で示したテキストデータ53で、「<image path>/usr/DAT/A00001/genpon.jpg</>」から「<image height>296.7</>」までがイメージデータ情報であり、「xs」、「ys」、「xe」、「ye」のそれぞれの値がイメージデータ52の左上端を基準とした行ごとの座標情報である。
Here, an example of the
文字編集部2の詳細を図5を参照しつつ説明する。文字編集部2は、文字認識部1が生成したテキストデータ53を呼び出し、自己のエディタ上に文字列を表示することで編集者による編集作業を支援する。編集結果は再度テキストデータ53に書き込まれる。尚、文字編集部2のエディタによって表示されるデータは、XML形式のタグやイメージデータ情報、座標情報が付与されていない状態(すなわち、文字認識部1によって認識された直後のテキストデータ)であるものとする。
Details of the
文字編集部2は、格納されたテキストデータ53を呼び出し、エディタに渡す(ステップS1)。エディタは、渡されたテキストデータ53を入出力装置(例えばディスプレイ)の画面上に表示し、編集者はその画面上でキーボード、マウスを使用しながら編集作業を行う(S2)。エディタでの編集作業中では、メモリ内にロードされているテキストデータに対して修正が行われている。
The
編集者が編集結果を保存指示したタイミングで、エディタはメモリ内にロードされている編集後のテキストデータと編集前のテキストデータ53とを比較し、編集前後のテキスト情報とともに、修正情報タグ(後述)を付与したデータをテキストデータ53として新たに作成する(S3)。作成されたテキストデータ53は不揮発性記憶装置に書き込まれる。本実施の形態では、編集前のテキストデータを編集後のテキストデータで上書き保存するものとするが、それぞれ別ファイルとなるように保存してもよい。
At the timing when the editor instructs to save the editing result, the editor compares the text data after editing loaded in the memory with the
文字編集部2による修正情報タグの設定方法例を図6に示す。本実施の形態では、修正情報タグとは、挿入された文字列であることを示す<ins/>タグ(以下、挿入タグ(挿入情報)と称す)、および削除された文字列であることを示す<del/>タグ(以下、削除タグ(削除情報)と称す)の総称である。テキストデータの編集結果は全て「挿入」と「削除」で表現することができる。文字列の置き換えは「削除」と「挿入」の組み合わせで表現可能である。文字編集部2は、エディタ上で編集された結果をファイルに書き込む際、修正情報タグをテキストデータ53内にXML形式で設定する。
An example of a method for setting the correction information tag by the
図6の例のように、ユーザが「今日の天気は雨でしたが午後から晴れました。」の文字列を、「今日の天気は晴れでした。」と修正した場合(図6(A)参照)、文字編集部2は、挿入された文字列には挿入タグを付与し、削除された文字列には、実際にデータを削除するのではなく削除タグを付与したテキストデータ53を作成する(図6(B)参照)。
As in the example of FIG. 6, when the user modifies the character string “Today's weather was rainy but sunny from the afternoon” to “Today's weather was sunny” (FIG. 6 (A )), The
次に、出力部3の詳細を、図7に基づき説明する。出力部3は、文字編集部2からの修正確認用データの出力指示を受けて(ステップS10)、不揮発性記憶装置にファイルとして記憶されている編集後のテキストデータ53、およびイメージデータ52を取り込み(S11、S12)、これらをマージした修正確認用データ54を生成し(S13)、不揮発性記憶装置にファイルとして出力または入出力装置(例えばディスプレイ)に表示する(S14)。
Next, the detail of the
修正確認用データ54のレイアウトの一例を図8に示す。修正確認用データ54は、いずれの位置にイメージデータ、文字列を配置するかを定義したレイアウト情報を少なくとも有するデータ構造である。本実施の形態において、修正確認用データ54は、イメージデータ52を配置する領域(イメージデータ配置領域)、および挿入された文字列を配置する領域(修正情報配置領域)とで領域が分けられて入出力装置(例えばディスプレイ)に表示される形式のデータである。イメージデータ52は、必要に応じてファイルに格納されているデータが縮小されて配置される。
An example of the layout of the
図9を参照しつつ、出力部3によるマージ処理(修正確認用データ54の作成方法)について説明する。出力部3は、イメージデータ52を修正確認用データ54のイメージデータ配置領域に配置し、テキストデータ53内の修正情報タグと座標情報から、イメージデータ52のいずれの文字列が削除されたかを算出し、確認者が修正内容を視認することができる注意情報(削除箇所の網掛け)を該当文字列上に乗せる。また、出力部3は、イメージデータ52内の挿入箇所をポイントした吹き出しを修正情報配置領域に配置し、その吹き出しの中に挿入文字列を設定する。図9の例では、出力部3は、イメージデータ52に削除タグが付与されている文字列に網掛けの注意情報を乗せ、イメージデータ52の挿入箇所をポイントする吹き出しを修正情報配置領域に配置し、吹き出しの中に挿入タグが付与されている文字列を配置する。修正確認用データ54の、より具体的な例を図10に示す。
With reference to FIG. 9, a merge process (a method for creating the correction confirmation data 54) by the
図11のフローチャートを参照しつつ、出力部3によるマージ処理の動作を説明する。
The operation of the merge process by the
出力部3は、テキストデータ53を不揮発性記憶装置から受け取り(S20)、イメージデータ52を不揮発性記憶装置から受け取る(S21)。出力部3は、イメージデータ52を図8で示したイメージデータ配置領域に配置し(S22)、テキストデータ53を読み込む(S23)。
The
出力部3は、ここで、最後までテキストデータ53を読み込んだかを判定し(S24)、最後まで読み込んでいない場合(S24、NO)、次に現在の読み込み箇所が修正情報タグであるかを判定する(S25)。ここで、修正情報タグでない場合(S25、NO)、処理はステップS23に戻りテキストデータ53内の次の文字を読み込む。一方、修正情報タグである場合(S25、YES)、出力部3は、修正情報タグの種別を判定する(S26)。
Here, the
修正情報タグが削除タグである場合(S26、削除タグ)、出力部3は削除範囲を算出する(S27)。本実施の形態では、出力部3は、テキストデータ53の削除タグが付与されている文字列の最初の文字が、行の端から何文字目(値Aとする)にあるのか、および削除タグが付与されている文字列の文字数(値Bとする)をカウントし、削除範囲を決定する。
When the correction information tag is a deletion tag (S26, deletion tag), the
出力部3は、イメージデータ52上での削除箇所を設定し、該当箇所に注意情報を乗せる(S28)。出力部3は、ステップS28で以下の処理を実行する。
(S28−1)削除タグが付与されている文字列が存在する行の座標情報(行の起点(xs, ys)、終点(xe, ye)の座標)をテキストデータ53から取得する。
(S28−2)取得した座標情報を用いて、イメージデータ52の該当行を特定する。
(S28−3)イメージデータ52上で、特定された該当行の修正前総文字数(値Cとする)で座標情報の文字方向のサイズを割り(横書きの場合:(xe − xs)/C、縦書きの場合:(ye − ys)/C)、1文字ごとの座標位置を算出し、値Aが該当する座標位置から値Bが該当する座標位置の範囲に網掛けを乗せる。
尚、S27では、テキストデータ53のカウント値とS28−3の網掛けをする座標位置とにずれが生じないようにするため、XML形式のタグ文字および挿入タグが付与されている文字列はカウントしないものとする。
The
(S28-1) The coordinate information (coordinates of the starting point (xs, ys) and ending point (xe, ye) of the line) of the line in which the character string to which the deletion tag is assigned is acquired from the
(S28-2) The corresponding line of the
(S28-3) On the
In S27, in order to prevent a shift between the count value of the
ステップS28では、上記方法以外にも、イメージデータ52で行が特定された後に、削除タグが付与されている文字列を取得し、OCR機能を用いてイメージデータ52の該当行に対して、削除タグが付与されている文字列であるか否かサーチする方法も考えられる。しかし、イメージデータ52の同一行の中に同じ文字列が複数あり、一方は削除タグが付与されており、他方は付与されてない場合、イメージデータ52内をサーチし検索対象文字列が見つかったときに、削除対象の文字列なのか否かの判断が困難となる。本実施の形態では、かかる点を考慮して上述のような実装としている。
In step S28, in addition to the above method, after a line is specified in the
ステップS26の処理に説明を戻す。修正情報タグが挿入タグである場合(S26、挿入タグ)、出力部3は挿入箇所を算出する(S29)。出力部3は、ここでテキストデータ53の挿入タグが付与されている文字列の一つ前の文字が、行の端から何文字目にあるのかをカウントする。
The description returns to the process of step S26. When the correction information tag is an insertion tag (S26, insertion tag), the
次に出力部3は、挿入タグが付与されている文字列をテキストデータ53から抽出し(S30)、イメージデータ52への挿入箇所を設定する(S31)。
Next, the
出力部3は、S31で以下の処理を実行する。
(S31−1)挿入タグが付与されている文字列が存在する行の座標情報(行の起点、終点の座標)をテキストデータ53から取得する。
(S31−2)取得した座標情報を用いて、イメージデータ52の該当行を特定する。
(S31−3)イメージデータ52上で、特定された該当行の修正前総文字数(値Dとする)で座標情報の文字方向のサイズを割り(横書きの場合:(xe − xs)/D、縦書きの場合:(ye − ys)/D)、1文字ごとの座標位置を行の基点から順に算出し、算出した座標位置の数がステップS29で得られたカウント値になった場合、その座標位置をイメージデータ52上の挿入箇所として特定する。
尚、S29では、テキストデータ53のカウント値とS31−3の座標位置とにずれが生じないようにするため、XML形式のタグ文字および挿入タグが付与されている文字列はカウントしないものとする。
The
(S31-1) The coordinate information (coordinates of the start point and end point of the line) of the line in which the character string to which the insertion tag is attached is obtained from the
(S31-2) The corresponding line of the
(S31-3) On the
In S29, in order to prevent a shift between the count value of the
次に出力部3は、修正情報配置領域(図8参照)に、ステップS31で得られたイメージデータ52上の挿入箇所をポイントする吹き出しを配置し、この吹き出し内の領域に挿入タグが付与されている文字列を配置する。(S32)。
Next, the
ステップS28、ステップS32の後に、処理はS23へ戻り、次の文字に対しての処理が実行される。また、出力部3は、ステップS24で最後までテキストデータ53を読み込んだと判定した場合(S24、YES)、終了処理(修正確認データ54のファイル作成やディスプレイ上への表示、使用したメモリの開放等)を実行し(S33)、処理は終了する。
After step S28 and step S32, the process returns to S23, and the process for the next character is executed. If the
次に、新旧対比表生成部4の詳細を図12を参照しつつ説明する。新旧対比表生成部4は、文字編集部2からの新旧対比表の出力指示を受けて(S40)、文字編集部2が生成したテキストデータ53を取り込み(S41)、テキストデータ53内の修正情報タグを元に新旧対比表55を生成しファイル出力する(S42、S43)。新旧対比表55として出力されるデータはCSV(Comma Separated Values)形式であるものとする。
Next, details of the new and old comparison table generator 4 will be described with reference to FIG. The old and new comparison table generation unit 4 receives an instruction to output the old and new comparison table from the character editing unit 2 (S40), takes in the
新旧対比表55の生成例を図13に示す。新旧対比表生成部4は、テキストデータ53から行単位で文字列情報を抽出し、「挿入」、「削除」に応じて修正前と修正後の新旧対比表55を生成する。本実施の形態では、図13の例のように、ページ番号を示す「頁」、修正前の行数を示す「行数」、(挿入/削除)または削除の別を示す「修正タイプ」、修正前の文字列を示す「修正前原本」、修正後の文字列を示す「修正後」を1つのレコードとしたCSVデータが生成される。「修正前原本」には、挿入タグが付与されている文字列が取り除かれたテキストデータが抽出され、「修正後」には、削除タグが付与されている文字列が取り除かれたテキストデータが抽出される。
A generation example of the old and new comparison table 55 is shown in FIG. The old and new comparison table generation unit 4 extracts character string information in line units from the
ここで、新旧対比表を作成する理由について説明する。例えば、文書を修正した後に、その修正内容を通知するための通達文書を作成することがある。この通達文書には、文書のどの箇所がどのように修正したかを記載する必要がある。従来、修正箇所を目視確認し通達文書を新規で作成していたが、本実施の形態のように新旧対比表を装置が自動で作成すれば、作成された表をそのまま貼り付けることで通達文書を作成することができる。よって、本実施の形態によって作業効率を向上させることができる。 Here, the reason for creating the old and new comparison table will be described. For example, after a document is corrected, a notification document for notifying the correction content may be created. This notification document must describe which part of the document has been modified and how. Conventionally, a notification document has been created by visually checking the correction location, but if the device automatically creates a new and old comparison table as in this embodiment, the notification document can be created by pasting the created table as it is. Can be created. Therefore, working efficiency can be improved by this embodiment.
また、例えば監督官庁等の機関からの行政指導により、文書修正が指示された場合、修正結果を当該機関に報告する必要がある。この報告文書に記載する修正内容に新旧対比表を使用することが可能となる。 For example, when a document correction is instructed by administrative guidance from an organization such as a supervisory government office, it is necessary to report the correction result to the organization. It is possible to use the old and new comparison tables for the correction contents described in this report document.
最後に、文書管理システム300の全体動作を図14のフローチャートを参照しつつ説明する。
Finally, the overall operation of the
イメージスキャニング部20は、修正前原本51を読み取り、イメージデータ52(例えばJPEG形式の画像データ)を生成する(S51)。このイメージデータ52には、少なくとも一つの文字または複数の文字で構成された文字列が記されているものとする。
The
文字認識部1は、イメージデータ52から、文字列を読み取りテキストデータ53を生成する(S52)。このテキストデータ53には、イメージデータ52に記された文字列の行ごとに、その行がイメージデータ52のいずれの位置にあるかを示す座標情報が付与される。
The
文字編集部2は、文字認識部1によって生成されたテキストデータ53を取得し、テキストデータ53に対してのユーザによる編集作業に応じて、削除された文字列には削除タグを付与し、挿入された文字列には挿入タグを付与する。文字編集部2は、これら削除タグ、挿入タグが付与されたテキストデータ53を生成する(S53)。
The
次に、文字編集部2から修正確認用データの出力指示があった場合(S54、修正確認用データ)の処理について説明する。 Next, a description will be given of processing when there is an instruction to output correction confirmation data from the character editing unit 2 (S54, correction confirmation data).
出力部3は、修正確認用データを作成し、ファイル出力やディスプレイに表示する(S55)。S55について説明する。出力部3は、イメージデータ52と文字編集部2によって生成されたテキストデータ53とを取得する。出力部3は、イメージデータ52と挿入タグが付与された文字列とを表示する。さらに、出力部3は、削除タグが付与された文字列に対応するイメージデータ52の文字列を、他の文字列とは異なる形式(例えば網掛け形式)で表示する。加えて出力部3は、挿入タグが付与された文字列がイメージデータ52のいずれに挿入されるかをユーザが視認可能な形式(例えば挿入箇所をポイントしている吹き出し)で表示する。
The
イメージデータ52上での削除箇所、挿入箇所の特定について説明する。出力部3は、削除タグが付与されている文字列の最初の文字が、行の端から何文字目にあるのか、および前記文字列の文字数を、文字編集部2によって生成されたテキストデータ53を用いてカウントし、これらカウント値と座標情報とに基づき、削除タグが付与された文字列に対応するイメージデータ52の文字列を特定する。また、挿入タグが付与されている文字列の最初の文字が、行の端から何文字目にあるのかを、文字編集部2によって生成されたテキストデータ53を用いてカウントし、このカウント値と座標情報とに基づき、挿入タグが付与された文字列がイメージデータ52のいずれに挿入されるかを特定する。
A description will be given of how to specify a deletion location and an insertion location on the
S54の判定処理に説明を戻す。文字編集部2から新旧対応表の出力指示があった場合(S54、新旧対応表)の処理について説明する。
The description returns to the determination process of S54. The processing when the
新旧対比表生成部4は、文字編集部2によって生成されたテキストデータ53の削除タグ、挿入タグに基づき、ユーザの編集作業によって削除された文字列または挿入された文字列を特定し、編集作業の前と後との新旧対比表55を生成する(S56)。
The old and new comparison table generation unit 4 identifies a character string deleted or inserted by a user editing operation based on the deletion tag and insertion tag of the
本実施の形態では、文書管理端末100は画像データを取得し、画像データに対して処理するものとしたが、画像データに限らず文字列を有するデータであれば本実施の形態の態様を適用することができる。
In the present embodiment, the
また、本実施の形態では、スキャナ200、文書管理端末100の2つのユニットに分かれた文書管理システム300について説明したが、これら2つのユニットを1つのOCR装置(光学式文字読取装置)とすることも可能である。
In the present embodiment, the
本実施の形態のように、修正前原本と修正後の出力物との確認作業を一つのイメージにマージすることで、修正前原本に対して修正箇所を明示することが可能になり、確認漏れを無くすとともに比較確認も容易となる。また、修正前原本のテキスト情報と修正後のテキスト情報とが対比された表を作成することで、新旧対比を容易に作成可能となる。 As in this embodiment, by merging the confirmation work of the uncorrected original and the corrected output into a single image, it becomes possible to clearly indicate the correction location for the uncorrected original, and omission of confirmation This makes it easier to confirm the comparison. In addition, by creating a table in which the text information of the original before correction and the text information after correction are compared, it is possible to easily create a comparison between old and new.
本実施の形態において、文書管理プログラムは上述した文書管理端末の内部に予めインストールされているものとして記載したが、本発明における文書管理プログラムは記憶媒体に記憶されたものも含まれる。ここで記憶媒体とは、磁気テープ、磁気ディスク(ハードディスクドライブ等)、光ディスク(CD−ROM、DVDディスク等)、光磁気ディスク(MO等)、フラッシュメモリ等、文書管理端末に対し脱着可能な媒体や、さらにネットワークを介することで伝送可能な媒体等、上述した文書管理端末におけるコンピュータで読み取りや実行が可能な全ての媒体をいう。 In the present embodiment, the document management program is described as being installed in advance in the above-described document management terminal. However, the document management program in the present invention includes one stored in a storage medium. Here, the storage medium is a medium that is detachable from the document management terminal, such as a magnetic tape, a magnetic disk (hard disk drive, etc.), an optical disk (CD-ROM, DVD disk, etc.), a magneto-optical disk (MO, etc.), and a flash memory. Further, it refers to all media that can be read and executed by a computer in the document management terminal described above, such as media that can be transmitted via a network.
本発明は、その精神または主要な特徴から逸脱することなく、他の様々な形で実施することができる。そのため、前述の実施の形態は、あらゆる点で単なる例示に過ぎず、限定的に解釈してはならない。本発明の範囲は、特許請求の範囲によって示すものであって、明細書本文には、何ら拘束されない。更に、特許請求の範囲の均等範囲に属する全ての変形、様々な改良、代替および改質は、全て本発明の範囲内のものである。 The present invention can be implemented in various other forms without departing from the spirit or main features thereof. Therefore, the above-described embodiment is merely an example in all respects and should not be interpreted in a limited manner. The scope of the present invention is shown by the scope of claims, and is not restricted by the text of the specification. Moreover, all modifications, various improvements, substitutions and modifications belonging to the equivalent scope of the claims are all within the scope of the present invention.
1 文字認識部、2 文字編集部、3 出力部、4、新旧対比表生成部、20 イメージスキャニング部、51 修正前原本、52 イメージデータ、53 テキストデータ、54 修正確認用データ、55 新旧対比表、100 文書管理端末、200 スキャナ、300 文書管理システム。 1 character recognition unit, 2 character editing unit, 3 output unit, 4 old and new comparison table generation unit, 20 image scanning unit, 51 original document before correction, 52 image data, 53 text data, 54 correction confirmation data, 55 old and new comparison table , 100 document management terminal, 200 scanner, 300 document management system.
Claims (4)
該テキストデータを取得し、該テキストデータに対しての編集作業によって削除された文字列には削除情報を付与し、挿入された文字列には挿入情報を付与し、これら削除情報、挿入情報が付与されたテキストデータを生成する編集支援部と、
前記画像データと前記編集支援部によって生成されたテキストデータとを取得し、前記画像データと挿入情報が付与された文字列とを表示するとともに、削除情報が付与された文字列に対応する前記画像データの文字列を、他の文字列とは異なる形式で表示し、且つ前記挿入情報が付与された文字列が前記画像データのいずれに挿入されるかを、視認可能な形式で表示する表示部と、
を有し、
前記認識部は、前記画像データに記された文字列の行ごとに、該行が前記画像データのいずれの位置にあるかを示す座標情報を前記テキストデータに付与し、
前記表示部は、削除情報が付与された文字列の最初の文字が、行の端から何文字目にあるか、および前記削除情報が付与された文字列の列文字数を、前記編集支援部によって生成されたテキストデータを用いてカウントし、これらカウント値と前記座標情報とに基づき、前記削除情報が付与された文字列に対応する前記画像データの文字列を特定し、且つ挿入情報が付与された文字列の1つ前の文字が、行の端から何文字目にあるかを、前記編集支援部によって生成されたテキストデータを用いてカウントし、このカウント値と前記座標情報とに基づき、前記挿入情報が付与された文字列が前記画像データのいずれに挿入されるかを特定することを特徴とする情報処理装置。 From the image data in which a character string composed of one character or a plurality of characters is written, the character string is read to generate text data, and the information about the storage location and size of the image data is used as image data information. A recognition unit to be assigned to
The text data is acquired, deletion information is given to the character string deleted by the editing operation on the text data, insertion information is given to the inserted character string, and the deletion information and insertion information are An editing support unit for generating the given text data;
The image data and the text data generated by the editing support unit are acquired, the image data and the character string to which insertion information is added are displayed, and the image corresponding to the character string to which deletion information is assigned A display unit that displays a character string of data in a format different from other character strings, and displays in which form the character string to which the insertion information is added is inserted into the image data in a visually recognizable format When,
I have a,
For each line of the character string written in the image data, the recognition unit gives coordinate information indicating the position of the line in the image data to the text data,
The display unit displays the number of characters from the end of the line where the first character of the character string to which deletion information is assigned, and the number of column characters of the character string to which the deletion information is assigned by the editing support unit. Count using the generated text data, and based on these count values and the coordinate information, specify the character string of the image data corresponding to the character string to which the deletion information is assigned, and is provided with insertion information The character immediately before the character string is counted from the end of the line using the text data generated by the editing support unit, and based on the count value and the coordinate information, An information processing apparatus that identifies in which of the image data the character string to which the insertion information is added is inserted .
前記表示部は、
前記削除情報が付与された文字列または前記挿入情報が付与された文字列が存在する行の起点及び終点の座標情報を前記テキストデータから取得し、該起点及び終点の座標情報を用いて前記画像データにおける該行を特定し、該終点の座標情報から該起点の座標情報の差を該行の修正前の総文字数で除して、前記画像データ上での1文字毎の座標位置を算出し、
前記削除情報が付与された文字列に対応する前記画像データの文字列を特定する場合、前記算出した1文字毎の座標位置における、前記削除情報が付与された文字列の最初の文字が行端から何文字目にあるかを示す前記カウント値に該当する座標位置から、前記列文字数に該当する座標位置までの前記画像データ上の範囲に網掛けを乗せ、
前記挿入情報が付与された文字列に対応する前記画像データの文字列を特定する場合、前記算出した1文字毎の座標位置のうち、前記挿入情報が付与された文字列の1つ前の文字が行端から何文字目にあるかを示す前記カウント値に該当する座標位置に、前記挿入情報が付与された文字列に関する情報を配置することを特徴とする情報処理装置。 The information processing apparatus according to claim 1 ,
The display unit
The coordinate information of the starting point and the ending point of the line in which the character string to which the deletion information is attached or the character string to which the insertion information is attached is obtained from the text data, and the image is obtained using the starting point and ending point coordinate information. The line in the data is specified, and the coordinate position of each character on the image data is calculated by dividing the difference of the coordinate information of the starting point from the coordinate information of the end point by the total number of characters before correction of the line. ,
When the character string of the image data corresponding to the character string to which the deletion information is added is specified, the first character of the character string to which the deletion information is added at the calculated coordinate position of each character is a line end. From the coordinate position corresponding to the count value indicating the number of characters from, to the range on the image data from the coordinate position corresponding to the number of column characters,
When the character string of the image data corresponding to the character string to which the insertion information is assigned is specified, the character immediately before the character string to which the insertion information is assigned out of the calculated coordinate position of each character An information processing apparatus, wherein information relating to the character string to which the insertion information is added is arranged at a coordinate position corresponding to the count value indicating the character number from the line end.
前記コンピュータが有する編集支援部が、該テキストデータを取得し、該テキストデータに対しての編集作業によって削除された文字列には削除情報を付与し、挿入された文字列には挿入情報を付与し、これら削除情報、挿入情報が付与されたテキストデータを生成し、
前記コンピュータが有する表示部が、前記画像データと前記編集支援部によって生成されたテキストデータとを取得し、前記画像データと挿入情報が付与された文字列とを表示するとともに、削除情報が付与された文字列に対応する前記画像データの文字列を、他の文字列とは異なる形式で表示し、且つ前記挿入情報が付与された文字列が前記画像データのいずれに挿入されるかを、視認可能な形式で表示し、
前記認識部が、前記画像データに記された文字列の行ごとに、該行が前記画像データのいずれの位置にあるかを示す座標情報を前記テキストデータに付与し、
前記表示部が、削除情報が付与された文字列の最初の文字が、行の端から何文字目にあるか、および前記削除情報が付与された文字列の列文字数を、前記編集支援部によって生成されたテキストデータを用いてカウントし、これらカウント値と前記座標情報とに基づき、前記削除情報が付与された文字列に対応する前記画像データの文字列を特定し、且つ挿入情報が付与された文字列の1つ前の文字が、行の端から何文字目にあるかを、前記編集支援部によって生成されたテキストデータを用いてカウントし、このカウント値と前記座標情報とに基づき、前記挿入情報が付与された文字列が前記画像データのいずれに挿入されるかを特定することを特徴とする文書管理方法。 A recognition unit of the computer reads the character string from image data in which a character string composed of one character or a plurality of characters is written, generates text data, and stores information on the storage location and size of the image data. Attached to the text data as image data information,
The editing support unit of the computer obtains the text data, gives deletion information to a character string deleted by editing the text data, and gives insertion information to the inserted character string Then, generate the text data with the deletion information and insertion information.
The display unit of the computer acquires the image data and text data generated by the editing support unit , displays the image data and a character string to which insertion information is added, and is given deletion information. The character string of the image data corresponding to the character string displayed is displayed in a format different from that of the other character strings, and it is visually recognized in which of the image data the character string provided with the insertion information is inserted. Display in a possible format ,
For each line of the character string written in the image data, the recognition unit gives coordinate information indicating the position of the line in the image data to the text data,
The display unit determines the number of characters from the end of the line where the first character of the character string to which deletion information has been assigned, and the number of column characters of the character string to which the deletion information has been assigned, by the editing support unit. Count using the generated text data, and based on these count values and the coordinate information, specify the character string of the image data corresponding to the character string to which the deletion information is assigned, and is provided with insertion information The character immediately before the character string is counted from the end of the line using the text data generated by the editing support unit, and based on the count value and the coordinate information, A document management method for specifying in which of the image data the character string to which the insertion information is added is inserted .
該テキストデータを取得し、該テキストデータに対しての編集作業によって削除された文字列には削除情報を付与し、挿入された文字列には挿入情報を付与し、これら削除情報、挿入情報が付与されたテキストデータを生成する編集支援部と、
前記画像データと前記編集支援部によって生成されたテキストデータとを取得し、前記画像データと挿入情報が付与された文字列とを表示するとともに、削除情報が付与された文字列に対応する前記画像データの文字列を、他の文字列とは異なる形式で表示し、且つ前記挿入情報が付与された文字列が前記画像データのいずれに挿入されるかを、視認可能な形式で表示する表示部
としてコンピュータを機能させ、
前記認識部は、前記画像データに記された文字列の行ごとに、該行が前記画像データのいずれの位置にあるかを示す座標情報を前記テキストデータに付与し、
前記表示部は、削除情報が付与された文字列の最初の文字が、行の端から何文字目にあるか、および前記削除情報が付与された文字列の列文字数を、前記編集支援部によって生成されたテキストデータを用いてカウントし、これらカウント値と前記座標情報とに基づき、前記削除情報が付与された文字列に対応する前記画像データの文字列を特定し、且つ挿入情報が付与された文字列の1つ前の文字が、行の端から何文字目にあるかを、前記編集支援部によって生成されたテキストデータを用いてカウントし、このカウント値と前記座標情報とに基づき、前記挿入情報が付与された文字列が前記画像データのいずれに挿入されるかを特定することを特徴とする文書管理プログラム。 From the image data in which a character string composed of one character or a plurality of characters is written, the character string is read to generate text data, and the information about the storage location and size of the image data is used as image data information. A recognition unit to be assigned to
The text data is acquired, deletion information is given to the character string deleted by the editing operation on the text data, insertion information is given to the inserted character string, and the deletion information and insertion information are An editing support unit for generating the given text data;
The image data and the text data generated by the editing support unit are acquired, the image data and the character string to which insertion information is added are displayed, and the image corresponding to the character string to which deletion information is assigned display the character string data, it is displayed in a different format from the other strings, and whether the insertion information is imparted string is inserted into any of the image data is displayed in a visible form
Function as a computer
For each line of the character string written in the image data, the recognition unit gives coordinate information indicating the position of the line in the image data to the text data,
The display unit displays the number of characters from the end of the line where the first character of the character string to which deletion information is assigned, and the number of column characters of the character string to which the deletion information is assigned by the editing support unit. Count using the generated text data, and based on these count values and the coordinate information, specify the character string of the image data corresponding to the character string to which the deletion information is assigned, and is provided with insertion information The character immediately before the character string is counted from the end of the line using the text data generated by the editing support unit, and based on the count value and the coordinate information, A document management program for specifying in which of the image data the character string to which the insertion information is added is inserted .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009250543A JP5542414B2 (en) | 2009-10-30 | 2009-10-30 | Information processing apparatus, document management method, and document management program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009250543A JP5542414B2 (en) | 2009-10-30 | 2009-10-30 | Information processing apparatus, document management method, and document management program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011096070A JP2011096070A (en) | 2011-05-12 |
JP5542414B2 true JP5542414B2 (en) | 2014-07-09 |
Family
ID=44112894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009250543A Active JP5542414B2 (en) | 2009-10-30 | 2009-10-30 | Information processing apparatus, document management method, and document management program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5542414B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5777994B2 (en) * | 2011-09-27 | 2015-09-16 | 富士フイルム株式会社 | Editing system |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6254346A (en) * | 1985-09-03 | 1987-03-10 | Casio Comput Co Ltd | Automatic formation system for list of document file correcting points |
JP2920312B2 (en) * | 1990-05-14 | 1999-07-19 | 三菱レイヨン株式会社 | Manufacturing method of ultra-fine fiber |
JPH06131346A (en) * | 1992-10-19 | 1994-05-13 | Fujitsu Ltd | Document processor |
JP2001067344A (en) * | 1999-08-30 | 2001-03-16 | Hitachi Ltd | Information processor |
JP2002024211A (en) * | 2000-06-30 | 2002-01-25 | Hitachi Ltd | Method and system for document management and storage medium having processing program stored thereon |
JP2003271589A (en) * | 2002-03-18 | 2003-09-26 | Mitsubishi Electric Information Systems Corp | Annotation system, annotation method, computer- readable storage medium with program stored therein, and program |
-
2009
- 2009-10-30 JP JP2009250543A patent/JP5542414B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011096070A (en) | 2011-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005173730A (en) | Business form ocr program, method, and device | |
JP5321109B2 (en) | Information processing apparatus and information processing program | |
CN102708580A (en) | Image processing apparatus and image processing method | |
TW201714124A (en) | Document management system and method thereof | |
JP5542414B2 (en) | Information processing apparatus, document management method, and document management program | |
JP5732861B2 (en) | Image processing apparatus and image processing program | |
JP6221220B2 (en) | Image processing apparatus and image processing program | |
JP2009251872A (en) | Information processing device and information processing program | |
JP6931168B2 (en) | Information processing device, control method, program | |
JP4756650B2 (en) | Image processing apparatus, reading order setting method, and program | |
JP5720182B2 (en) | Image processing apparatus and image processing program | |
JP5923981B2 (en) | Image processing apparatus and image processing program | |
JP2013152580A (en) | Code generation device, code generation method, and program | |
JP6244743B2 (en) | Layout editing processing method, apparatus and program | |
JP4712629B2 (en) | Equipment specification input device | |
KR20210060808A (en) | Document editing device to check whether the font applied to the document is a supported font and operating method thereof | |
GB2567407A (en) | Method and apparatus for determining layout | |
JP2005050094A (en) | Optical character reader | |
JP2007011472A (en) | Information processing method and device, program and computer-readable memory | |
JP5303967B2 (en) | Typesetting device, typesetting method, and typesetting processing program | |
JP2005056010A (en) | Device, method and program for defining business form | |
TWM517377U (en) | Document management system | |
JP2006085583A (en) | Document processing apparatus and program | |
JP2010026667A (en) | Information processing apparatus and information processing program | |
JP3307358B2 (en) | Partial correction command method and information processing apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120321 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130412 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130423 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130621 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140310 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140408 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140507 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5542414 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |