JP5542414B2 - Information processing apparatus, document management method, and document management program - Google Patents

Information processing apparatus, document management method, and document management program Download PDF

Info

Publication number
JP5542414B2
JP5542414B2 JP2009250543A JP2009250543A JP5542414B2 JP 5542414 B2 JP5542414 B2 JP 5542414B2 JP 2009250543 A JP2009250543 A JP 2009250543A JP 2009250543 A JP2009250543 A JP 2009250543A JP 5542414 B2 JP5542414 B2 JP 5542414B2
Authority
JP
Japan
Prior art keywords
character string
information
image data
character
text data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009250543A
Other languages
Japanese (ja)
Other versions
JP2011096070A (en
Inventor
正仁 西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2009250543A priority Critical patent/JP5542414B2/en
Publication of JP2011096070A publication Critical patent/JP2011096070A/en
Application granted granted Critical
Publication of JP5542414B2 publication Critical patent/JP5542414B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Character Discrimination (AREA)

Description

本発明は、文書が記された画像データからテキストデータを生成し、また作成されたテキストデータの編集作業および確認作業を支援する技術に関する。   The present invention relates to a technique for generating text data from image data in which a document is written, and for supporting editing and confirmation work of the created text data.

紙媒体で管理された文書を修正する場合、スキャナで紙媒体を読み取り画像データを作成した後、OCR(Optical Character Reader)を使用してテキストデータ化したものを修正することになる。修正内容の確認作業は、図15に示すように、修正前原本と修正後の出力物(プリントアウトされた紙媒体やコンピュータの画面上に表示されたデータ)とを確認者が交互に目視し、対比することで行われる。   When correcting a document managed by a paper medium, the paper medium is read by a scanner to create image data, and then the text data is converted using an OCR (Optical Character Reader). As shown in FIG. 15, the checker confirms the original contents before correction and the output data after correction (printed paper media or data displayed on the computer screen) alternately as shown in FIG. , By contrast.

関連する技術として、以下の技術が開示されている。   The following technologies are disclosed as related technologies.

特開2005−50094号公報Japanese Patent Laid-Open No. 2005-50094

原本が紙媒体の場合、修正後との比較確認は目視確認にならざるを得ない。また、修正前原本と修正後の出力物を目視確認する場合、修正箇所が明確に判別できる訳ではないため確認漏れが発生する可能性がある。また、確認作業は修正前原本と修正後の出力物を見比べるという作業となり、作業の手間も大きい。   In the case where the original is a paper medium, the comparison confirmation after the correction must be a visual confirmation. In addition, when the original before correction and the output after correction are visually checked, there is a possibility that a check omission may occur because the correction portion cannot be clearly identified. Also, the confirmation work is a work of comparing the original document before correction with the output product after correction, which requires a lot of work.

さらに、修正前原本と修正後の出力物との対比は、新旧対比表を作成しこの表を用いて確認することが有効であるが、従来技術においては、新旧対比表を別途生成する必要がある。   In addition, it is effective to create a new / old comparison table and check the comparison between the original data before correction and the output after correction, but in the conventional technology, it is necessary to generate a new / old comparison table separately. is there.

本発明は、上述した問題点を解決するためになされたものであり、修正前原本と修正後の出力物との確認作業を一つのイメージにマージすることで、修正前のデータに対して修正箇所を明示することが可能になり、確認漏れを低減させるとともに修正前のデータと修正後のデータとの比較確認も容易となる技術を提供することを目的とする。   The present invention has been made in order to solve the above-described problems, and the data before correction is corrected by merging the confirmation work between the original data before correction and the output data after correction into one image. It is an object of the present invention to provide a technique that makes it possible to clearly indicate a location, reduce confirmation omissions, and facilitate comparison and confirmation of data before correction and data after correction.

上述した課題を解決するため、本発明の一態様に係る情報処理装置は、一つの文字または複数の文字で構成された文字列が記された画像データから、前記文字列を読み取りテキストデータを生成する認識部と、前記認識部によって生成されたテキストデータを取得し、該テキストデータに対しての編集作業によって削除された文字列には削除情報を付与し、挿入された文字列には挿入情報を付与し、これら削除情報、挿入情報が付与されたテキストデータを生成する編集支援部と、前記画像データと前記編集支援部によって生成されたテキストデータとを取得し、前記画像データと挿入情報が付与された文字列とを表示するとともに、削除情報が付与された文字列に対応する前記画像データの文字列を、他の文字列とは異なる形式で表示し、且つ前記挿入情報が付与された文字列が前記画像データのいずれに挿入されるかを、視認可能な形式で表示する表示部とを有する。   In order to solve the above-described problem, an information processing apparatus according to an aspect of the present invention generates text data by reading the character string from image data in which a character string including one character or a plurality of characters is written. A recognition unit that acquires the text data generated by the recognition unit, adds deletion information to the character string deleted by editing the text data, and inserts information into the inserted character string. An edit support unit that generates text data to which the deletion information and the insert information are added, the image data and the text data generated by the edit support unit, and the image data and the insert information are Displaying the assigned character string and displaying the character string of the image data corresponding to the character string to which the deletion information is given in a format different from other character strings, One or the insertion information string is granted is inserted into any of the image data, and a display unit for displaying in a visible form.

また、上述した課題を解決するため、本発明の一態様に係る文書管理方法は、コンピュータが、一つの文字または複数の文字で構成された文字列が記された画像データから、前記文字列を読み取りテキストデータを生成し、生成されたテキストデータを取得し、該テキストデータに対しての編集作業によって削除された文字列には削除情報を付与し、挿入された文字列には挿入情報を付与し、これら削除情報、挿入情報が付与されたテキストデータを生成し、前記画像データと、削除情報、挿入情報が付与されることで生成されたテキストデータとを取得し、前記画像データと挿入情報が付与された文字列とを表示するとともに、削除情報が付与された文字列に対応する前記画像データの文字列を、他の文字列とは異なる形式で表示し、且つ前記挿入情報が付与された文字列が前記画像データのいずれに挿入されるかを、視認可能な形式で表示する。   In order to solve the above-described problem, in a document management method according to one aspect of the present invention, a computer uses the character string from image data in which a character string including one character or a plurality of characters is written. Generates read text data, acquires the generated text data, gives deletion information to the character string deleted by editing the text data, and gives insertion information to the inserted character string And generating the text data to which the deletion information and the insertion information are added, obtaining the image data and the text data generated by adding the deletion information and the insertion information, and acquiring the image data and the insertion information. And a character string of the image data corresponding to the character string to which the deletion information is added, in a format different from other character strings, and Or serial insertion information string granted is inserted into any of the image data is displayed in a visible form.

上述した課題を解決するため、本発明の一態様に係る文書管理プログラムは、一つの文字または複数の文字で構成された文字列が記された画像データから、前記文字列を読み取りテキストデータを生成し、生成されたテキストデータを取得し、該テキストデータに対しての編集作業によって削除された文字列には削除情報を付与し、挿入された文字列には挿入情報を付与し、これら削除情報、挿入情報が付与されたテキストデータを生成し、前記画像データと、削除情報、挿入情報が付与されることで生成されたテキストデータとを取得し、前記画像データと挿入情報が付与された文字列とを表示するとともに、削除情報が付与された文字列に対応する前記画像データの文字列を、他の文字列とは異なる形式で表示し、且つ前記挿入情報が付与された文字列が前記画像データのいずれに挿入されるかを、視認可能な形式で表示する処理をコンピュータに実行させる。   In order to solve the above-described problem, a document management program according to an aspect of the present invention generates text data by reading the character string from image data in which a character string composed of one character or a plurality of characters is written. The generated text data is acquired, deletion information is given to the character string deleted by editing the text data, insertion information is given to the inserted character string, and the deletion information The text data to which the insertion information is added is generated, the image data and the text data generated by the deletion information and the insertion information are acquired, and the character to which the image data and the insertion information are assigned are obtained. A character string of the image data corresponding to the character string to which the deletion information is given, in a format different from other character strings, and the insertion information is attached. Or string is inserted into any of the image data, to execute the processing for displaying in a visible form to the computer.

編集前原本の画像データと修正後のデータとの比較確認作業を一つの修正確認用イメージ上で表示することができ、確認漏れが低減するとともに、目視比較作業の手間を大幅に削減することができる。   Comparing and confirming the original image data before editing and the corrected data can be displayed on a single image for confirmation of confirmation, reducing check errors and greatly reducing the labor of visual comparison. it can.

本実施の形態に係る文書管理システムの構成の一例を示す図である。It is a figure which shows an example of a structure of the document management system which concerns on this Embodiment. 本実施の形態に係るイメージスキャニング部の一例を説明する図である。It is a figure explaining an example of the image scanning part which concerns on this Embodiment. 本実施の形態に係る文字認識部の一例を説明する図である。It is a figure explaining an example of the character recognition part which concerns on this Embodiment. 本実施の形態に係る文字認識部が出力するテキストデータの一例を説明する図である。It is a figure explaining an example of the text data which the character recognition part which concerns on this Embodiment outputs. 本実施の形態に係る文字編集部の一例を説明する図である。It is a figure explaining an example of the character edit part which concerns on this Embodiment. 本実施の形態に係る文字編集部による編集前後のデータ例を説明する図である。It is a figure explaining the example of data before and behind the edit by the character edit part which concerns on this Embodiment. 本実施の形態に係る出力部の一例を説明する図である。It is a figure explaining an example of the output part which concerns on this Embodiment. 本実施の形態に係る修正確認用データのレイアウトの一例を示す図である。It is a figure which shows an example of the layout of the data for a correction confirmation which concerns on this Embodiment. 本実施の形態に係る出力部のマージ処理の一例を説明する図である。It is a figure explaining an example of the merge process of the output part which concerns on this Embodiment. 本実施の形態に係る修正確認用データの具体例を示す図である。It is a figure which shows the specific example of the data for correction confirmation which concerns on this Embodiment. 本実施の形態に係る出力部の動作の一例を示すフローチャートである。It is a flowchart which shows an example of operation | movement of the output part which concerns on this Embodiment. 本実施の形態に係る新旧対比表生成部の一例を説明する図である。It is a figure explaining an example of the old and new comparison table production | generation part which concerns on this Embodiment. 本実施の形態に係る新旧対比表生成部によるテキストデータから新旧対比表を作成する処理の一例を説明する図である。It is a figure explaining an example of the process which creates an old and new comparison table from the text data by the old and new comparison table production | generation part which concerns on this Embodiment. 本実施の形態に係る文書管理システムの動作の一例を示すフローチャートである。It is a flowchart which shows an example of operation | movement of the document management system which concerns on this Embodiment. 従来の修正前原本と修正後の出力物との比較確認を説明する模式図である。It is a schematic diagram explaining the comparison confirmation of the conventional uncorrected original and the corrected output.

以下、本発明の実施の形態について図面を参照しつつ説明する。   Embodiments of the present invention will be described below with reference to the drawings.

図1に、本実施の形態に係る文書管理システムの構成を示す。文書管理システム300は、スキャナ200、文書管理端末100(情報処理装置)を有する。   FIG. 1 shows a configuration of a document management system according to the present embodiment. The document management system 300 includes a scanner 200 and a document management terminal 100 (information processing apparatus).

スキャナ200は、イメージスキャニング部20を有する。文書管理端末100は、文字認識部1(認識部)、文字編集部2(編集支援部)、出力部3(表示部)、新旧対比表生成部4(対比表生成部)を有する。   The scanner 200 has an image scanning unit 20. The document management terminal 100 includes a character recognition unit 1 (recognition unit), a character editing unit 2 (editing support unit), an output unit 3 (display unit), and an old and new comparison table generation unit 4 (contrast table generation unit).

文書管理端末100は、演算処理装置であるCPU(Central Processing Unit)、主記憶装置であるメモリ、不揮発性記憶装置(フラッシュメモリ、ハードディスクドライブ等)を有し、またキーボード、マウス、ディスプレイ、プリンタ等の入出力装置を有するコンピュータである。文書管理端末100内の各機能ブロックは、不揮発性記憶装置に予め記憶されている文書管理プログラムが、メモリ上にロードされ、CPUによって文書管理プログラムが演算実行されることで実現される。   The document management terminal 100 includes a CPU (Central Processing Unit) that is an arithmetic processing device, a memory that is a main storage device, a nonvolatile storage device (flash memory, a hard disk drive, etc.), a keyboard, a mouse, a display, a printer, and the like. The computer having the input / output device. Each functional block in the document management terminal 100 is realized by loading a document management program stored in advance in a non-volatile storage device onto the memory and calculating and executing the document management program by the CPU.

次に、これら各機能ブロックの詳細説明をする。
イメージスキャニング部20の詳細を図2を参照しつつ説明する。イメージスキャニング部20は、紙媒体で管理された修正前原本51(修正前原本51には少なくとも一つの文字または複数の文字が記載されている)に光を照射し、その反射光を用いてデジタルデータに変換することで、イメージデータ52を生成する。生成されたイメージデータ52は、文書管理端末100の文字認識部1に送信される。
Next, a detailed description of each of these functional blocks will be given.
Details of the image scanning unit 20 will be described with reference to FIG. The image scanning unit 20 irradiates light to an uncorrected original 51 (at least one character or a plurality of characters written on the uncorrected original 51) managed by a paper medium, and digitally uses the reflected light. Image data 52 is generated by converting the data. The generated image data 52 is transmitted to the character recognition unit 1 of the document management terminal 100.

文字認識部1の詳細を、図3を参照しつつ説明する。文字認識部1は、イメージスキャニング部20から送信されたイメージデータ52を解析し、文字列と思われる箇所をテキストデータ(所定の文字コードによって構成されるデータ)に変換するとともに、その文字列がイメージデータ52のどの場所に存在するかの座標情報を行単位で変換後のテキストデータに付与する。   Details of the character recognition unit 1 will be described with reference to FIG. The character recognizing unit 1 analyzes the image data 52 transmitted from the image scanning unit 20 and converts a portion that seems to be a character string into text data (data constituted by a predetermined character code). Coordinate information indicating where the image data 52 exists is added to the converted text data in units of lines.

また文字認識部1は、変換後のテキストデータにイメージデータ52のファイル名およびイメージデータ52の存在場所(いずれのフォルダに格納されるか)を付与することで、テキストデータとイメージデータ52の関連付けを行う。このテキストデータは、XML形式でテキストデータ53として生成される。文字認識部1は、処理が完了した際に、生成したテキストデータ53と認識に使用されたイメージデータ52を所定の格納場所にファイルとして格納する。   Further, the character recognition unit 1 associates the text data with the image data 52 by assigning the file name of the image data 52 and the location where the image data 52 exists (in which folder) to the converted text data. I do. This text data is generated as text data 53 in the XML format. When the process is completed, the character recognition unit 1 stores the generated text data 53 and the image data 52 used for recognition as a file in a predetermined storage location.

ここで、文字認識部1が生成するテキストデータ53の例を図4に示す。図4のように、テキストデータ53上にイメージデータ52の情報(イメージデータ情報)を設定することで、イメージデータ52とテキストデータ53とが出力部3によるマージ処理の際にマッチングされる。尚、図4で示したテキストデータ53で、「<image path>/usr/DAT/A00001/genpon.jpg</>」から「<image height>296.7</>」までがイメージデータ情報であり、「xs」、「ys」、「xe」、「ye」のそれぞれの値がイメージデータ52の左上端を基準とした行ごとの座標情報である。   Here, an example of the text data 53 generated by the character recognition unit 1 is shown in FIG. As shown in FIG. 4, by setting the information (image data information) of the image data 52 on the text data 53, the image data 52 and the text data 53 are matched during the merge process by the output unit 3. In the text data 53 shown in FIG. 4, the image data information from “<image path> /usr/DAT/A00001/genpon.jpg </>” to “<image height> 296.7 </>” Each value of “xs”, “ys”, “xe”, and “ye” is coordinate information for each row with the upper left corner of the image data 52 as a reference.

文字編集部2の詳細を図5を参照しつつ説明する。文字編集部2は、文字認識部1が生成したテキストデータ53を呼び出し、自己のエディタ上に文字列を表示することで編集者による編集作業を支援する。編集結果は再度テキストデータ53に書き込まれる。尚、文字編集部2のエディタによって表示されるデータは、XML形式のタグやイメージデータ情報、座標情報が付与されていない状態(すなわち、文字認識部1によって認識された直後のテキストデータ)であるものとする。   Details of the character editing unit 2 will be described with reference to FIG. The character editing unit 2 supports the editing work by the editor by calling the text data 53 generated by the character recognition unit 1 and displaying the character string on its own editor. The editing result is written to the text data 53 again. The data displayed by the editor of the character editing unit 2 is in a state in which no XML tag, image data information, or coordinate information is attached (that is, text data immediately after being recognized by the character recognition unit 1). Shall.

文字編集部2は、格納されたテキストデータ53を呼び出し、エディタに渡す(ステップS1)。エディタは、渡されたテキストデータ53を入出力装置(例えばディスプレイ)の画面上に表示し、編集者はその画面上でキーボード、マウスを使用しながら編集作業を行う(S2)。エディタでの編集作業中では、メモリ内にロードされているテキストデータに対して修正が行われている。   The character editing unit 2 calls the stored text data 53 and passes it to the editor (step S1). The editor displays the passed text data 53 on the screen of the input / output device (for example, display), and the editor performs editing work using the keyboard and mouse on the screen (S2). During the editing work in the editor, the text data loaded in the memory is corrected.

編集者が編集結果を保存指示したタイミングで、エディタはメモリ内にロードされている編集後のテキストデータと編集前のテキストデータ53とを比較し、編集前後のテキスト情報とともに、修正情報タグ(後述)を付与したデータをテキストデータ53として新たに作成する(S3)。作成されたテキストデータ53は不揮発性記憶装置に書き込まれる。本実施の形態では、編集前のテキストデータを編集後のテキストデータで上書き保存するものとするが、それぞれ別ファイルとなるように保存してもよい。   At the timing when the editor instructs to save the editing result, the editor compares the text data after editing loaded in the memory with the text data 53 before editing, and the correction information tag (described later) together with the text information before and after editing. ) Is newly created as text data 53 (S3). The created text data 53 is written into the nonvolatile storage device. In this embodiment, the text data before editing is overwritten and saved with the text data after editing. However, the text data may be saved in separate files.

文字編集部2による修正情報タグの設定方法例を図6に示す。本実施の形態では、修正情報タグとは、挿入された文字列であることを示す<ins/>タグ(以下、挿入タグ(挿入情報)と称す)、および削除された文字列であることを示す<del/>タグ(以下、削除タグ(削除情報)と称す)の総称である。テキストデータの編集結果は全て「挿入」と「削除」で表現することができる。文字列の置き換えは「削除」と「挿入」の組み合わせで表現可能である。文字編集部2は、エディタ上で編集された結果をファイルに書き込む際、修正情報タグをテキストデータ53内にXML形式で設定する。   An example of a method for setting the correction information tag by the character editing unit 2 is shown in FIG. In the present embodiment, the correction information tag is an <ins /> tag (hereinafter referred to as an insertion tag (insertion information)) indicating an inserted character string, and a deleted character string. <Del /> tag (hereinafter referred to as deletion tag (deletion information)). All edit results of text data can be expressed by “insertion” and “deletion”. The replacement of a character string can be expressed by a combination of “delete” and “insert”. The character editing unit 2 sets a correction information tag in the text data 53 in the XML format when writing the result edited on the editor to a file.

図6の例のように、ユーザが「今日の天気は雨でしたが午後から晴れました。」の文字列を、「今日の天気は晴れでした。」と修正した場合(図6(A)参照)、文字編集部2は、挿入された文字列には挿入タグを付与し、削除された文字列には、実際にデータを削除するのではなく削除タグを付与したテキストデータ53を作成する(図6(B)参照)。   As in the example of FIG. 6, when the user modifies the character string “Today's weather was rainy but sunny from the afternoon” to “Today's weather was sunny” (FIG. 6 (A )), The character editing unit 2 assigns an insertion tag to the inserted character string, and creates text data 53 to which the deleted character string is assigned a deletion tag instead of actually deleting data. (See FIG. 6B).

次に、出力部3の詳細を、図7に基づき説明する。出力部3は、文字編集部2からの修正確認用データの出力指示を受けて(ステップS10)、不揮発性記憶装置にファイルとして記憶されている編集後のテキストデータ53、およびイメージデータ52を取り込み(S11、S12)、これらをマージした修正確認用データ54を生成し(S13)、不揮発性記憶装置にファイルとして出力または入出力装置(例えばディスプレイ)に表示する(S14)。   Next, the detail of the output part 3 is demonstrated based on FIG. Upon receiving an instruction to output correction confirmation data from the character editing unit 2 (step S10), the output unit 3 captures the edited text data 53 and image data 52 stored as files in the nonvolatile storage device. (S11, S12), the correction confirmation data 54 obtained by merging them is generated (S13), and output as a file to the nonvolatile storage device or displayed on the input / output device (for example, display) (S14).

修正確認用データ54のレイアウトの一例を図8に示す。修正確認用データ54は、いずれの位置にイメージデータ、文字列を配置するかを定義したレイアウト情報を少なくとも有するデータ構造である。本実施の形態において、修正確認用データ54は、イメージデータ52を配置する領域(イメージデータ配置領域)、および挿入された文字列を配置する領域(修正情報配置領域)とで領域が分けられて入出力装置(例えばディスプレイ)に表示される形式のデータである。イメージデータ52は、必要に応じてファイルに格納されているデータが縮小されて配置される。   An example of the layout of the correction confirmation data 54 is shown in FIG. The correction confirmation data 54 has a data structure having at least layout information that defines where image data and character strings are to be arranged. In the present embodiment, the correction confirmation data 54 is divided into an area where the image data 52 is arranged (image data arrangement area) and an area where the inserted character string is arranged (correction information arrangement area). Data in a format displayed on an input / output device (for example, a display). The image data 52 is arranged by reducing the data stored in the file as necessary.

図9を参照しつつ、出力部3によるマージ処理(修正確認用データ54の作成方法)について説明する。出力部3は、イメージデータ52を修正確認用データ54のイメージデータ配置領域に配置し、テキストデータ53内の修正情報タグと座標情報から、イメージデータ52のいずれの文字列が削除されたかを算出し、確認者が修正内容を視認することができる注意情報(削除箇所の網掛け)を該当文字列上に乗せる。また、出力部3は、イメージデータ52内の挿入箇所をポイントした吹き出しを修正情報配置領域に配置し、その吹き出しの中に挿入文字列を設定する。図9の例では、出力部3は、イメージデータ52に削除タグが付与されている文字列に網掛けの注意情報を乗せ、イメージデータ52の挿入箇所をポイントする吹き出しを修正情報配置領域に配置し、吹き出しの中に挿入タグが付与されている文字列を配置する。修正確認用データ54の、より具体的な例を図10に示す。   With reference to FIG. 9, a merge process (a method for creating the correction confirmation data 54) by the output unit 3 will be described. The output unit 3 arranges the image data 52 in the image data arrangement area of the correction confirmation data 54, and calculates which character string of the image data 52 has been deleted from the correction information tag and the coordinate information in the text data 53. Then, attention information (shading of the deleted part) that allows the confirmer to visually recognize the correction contents is put on the corresponding character string. Further, the output unit 3 arranges a balloon pointing to the insertion position in the image data 52 in the correction information arrangement area, and sets an insertion character string in the balloon. In the example of FIG. 9, the output unit 3 places shaded attention information on a character string with a deletion tag attached to the image data 52, and places a balloon that points to the insertion position of the image data 52 in the correction information arrangement area. Then, the character string to which the insertion tag is attached is placed in the balloon. A more specific example of the correction confirmation data 54 is shown in FIG.

図11のフローチャートを参照しつつ、出力部3によるマージ処理の動作を説明する。   The operation of the merge process by the output unit 3 will be described with reference to the flowchart of FIG.

出力部3は、テキストデータ53を不揮発性記憶装置から受け取り(S20)、イメージデータ52を不揮発性記憶装置から受け取る(S21)。出力部3は、イメージデータ52を図8で示したイメージデータ配置領域に配置し(S22)、テキストデータ53を読み込む(S23)。   The output unit 3 receives the text data 53 from the nonvolatile storage device (S20), and receives the image data 52 from the nonvolatile storage device (S21). The output unit 3 arranges the image data 52 in the image data arrangement area shown in FIG. 8 (S22), and reads the text data 53 (S23).

出力部3は、ここで、最後までテキストデータ53を読み込んだかを判定し(S24)、最後まで読み込んでいない場合(S24、NO)、次に現在の読み込み箇所が修正情報タグであるかを判定する(S25)。ここで、修正情報タグでない場合(S25、NO)、処理はステップS23に戻りテキストデータ53内の次の文字を読み込む。一方、修正情報タグである場合(S25、YES)、出力部3は、修正情報タグの種別を判定する(S26)。   Here, the output unit 3 determines whether or not the text data 53 has been read to the end (S24), and if it has not been read to the end (S24, NO), determines whether or not the current read location is a correction information tag. (S25). If it is not a correction information tag (S25, NO), the process returns to step S23 to read the next character in the text data 53. On the other hand, when it is a correction information tag (S25, YES), the output unit 3 determines the type of the correction information tag (S26).

修正情報タグが削除タグである場合(S26、削除タグ)、出力部3は削除範囲を算出する(S27)。本実施の形態では、出力部3は、テキストデータ53の削除タグが付与されている文字列の最初の文字が、行の端から何文字目(値Aとする)にあるのか、および削除タグが付与されている文字列の文字数(値Bとする)をカウントし、削除範囲を決定する。   When the correction information tag is a deletion tag (S26, deletion tag), the output unit 3 calculates a deletion range (S27). In the present embodiment, the output unit 3 determines the number of characters (value A) from the end of the line where the first character of the character string to which the deletion tag of the text data 53 is assigned, and the deletion tag. Is counted to determine the deletion range.

出力部3は、イメージデータ52上での削除箇所を設定し、該当箇所に注意情報を乗せる(S28)。出力部3は、ステップS28で以下の処理を実行する。
(S28−1)削除タグが付与されている文字列が存在する行の座標情報(行の起点(xs, ys)、終点(xe, ye)の座標)をテキストデータ53から取得する。
(S28−2)取得した座標情報を用いて、イメージデータ52の該当行を特定する。
(S28−3)イメージデータ52上で、特定された該当行の修正前総文字数(値Cとする)で座標情報の文字方向のサイズを割り(横書きの場合:(xe − xs)/C、縦書きの場合:(ye − ys)/C)、1文字ごとの座標位置を算出し、値Aが該当する座標位置から値Bが該当する座標位置の範囲に網掛けを乗せる。
尚、S27では、テキストデータ53のカウント値とS28−3の網掛けをする座標位置とにずれが生じないようにするため、XML形式のタグ文字および挿入タグが付与されている文字列はカウントしないものとする。
The output unit 3 sets a deletion location on the image data 52 and puts attention information on the corresponding location (S28). The output unit 3 executes the following process in step S28.
(S28-1) The coordinate information (coordinates of the starting point (xs, ys) and ending point (xe, ye) of the line) of the line in which the character string to which the deletion tag is assigned is acquired from the text data 53.
(S28-2) The corresponding line of the image data 52 is specified using the acquired coordinate information.
(S28-3) On the image data 52, the size in the character direction of the coordinate information is divided by the total number of characters before correction (value C) of the identified line (in the case of horizontal writing: (xe−xs) / C, In the case of vertical writing: (ye−ys) / C) The coordinate position for each character is calculated, and the range of the coordinate position corresponding to the value B is shaded from the coordinate position corresponding to the value A.
In S27, in order to prevent a shift between the count value of the text data 53 and the coordinate position to be shaded in S28-3, the character string to which the XML format tag character and the insertion tag are attached is counted. Shall not.

ステップS28では、上記方法以外にも、イメージデータ52で行が特定された後に、削除タグが付与されている文字列を取得し、OCR機能を用いてイメージデータ52の該当行に対して、削除タグが付与されている文字列であるか否かサーチする方法も考えられる。しかし、イメージデータ52の同一行の中に同じ文字列が複数あり、一方は削除タグが付与されており、他方は付与されてない場合、イメージデータ52内をサーチし検索対象文字列が見つかったときに、削除対象の文字列なのか否かの判断が困難となる。本実施の形態では、かかる点を考慮して上述のような実装としている。   In step S28, in addition to the above method, after a line is specified in the image data 52, a character string to which a deletion tag is attached is acquired, and the corresponding line in the image data 52 is deleted using the OCR function. A method of searching for whether or not a character string has a tag is also conceivable. However, when there are a plurality of the same character strings in the same line of the image data 52, one of them is assigned a deletion tag, and the other is not attached, a search target character string is found by searching the image data 52. Sometimes, it is difficult to determine whether the character string is to be deleted. In the present embodiment, the above-described mounting is performed in consideration of such points.

ステップS26の処理に説明を戻す。修正情報タグが挿入タグである場合(S26、挿入タグ)、出力部3は挿入箇所を算出する(S29)。出力部3は、ここでテキストデータ53の挿入タグが付与されている文字列の一つ前の文字が、行の端から何文字目にあるのかをカウントする。   The description returns to the process of step S26. When the correction information tag is an insertion tag (S26, insertion tag), the output unit 3 calculates the insertion location (S29). The output unit 3 counts the number of characters from the end of the line where the character immediately before the character string to which the insertion tag of the text data 53 is assigned.

次に出力部3は、挿入タグが付与されている文字列をテキストデータ53から抽出し(S30)、イメージデータ52への挿入箇所を設定する(S31)。   Next, the output unit 3 extracts the character string to which the insertion tag is assigned from the text data 53 (S30), and sets the insertion location in the image data 52 (S31).

出力部3は、S31で以下の処理を実行する。
(S31−1)挿入タグが付与されている文字列が存在する行の座標情報(行の起点、終点の座標)をテキストデータ53から取得する。
(S31−2)取得した座標情報を用いて、イメージデータ52の該当行を特定する。
(S31−3)イメージデータ52上で、特定された該当行の修正前総文字数(値Dとする)で座標情報の文字方向のサイズを割り(横書きの場合:(xe − xs)/D、縦書きの場合:(ye − ys)/D)、1文字ごとの座標位置を行の基点から順に算出し、算出した座標位置の数がステップS29で得られたカウント値になった場合、その座標位置をイメージデータ52上の挿入箇所として特定する。
尚、S29では、テキストデータ53のカウント値とS31−3の座標位置とにずれが生じないようにするため、XML形式のタグ文字および挿入タグが付与されている文字列はカウントしないものとする。
The output unit 3 executes the following process in S31.
(S31-1) The coordinate information (coordinates of the start point and end point of the line) of the line in which the character string to which the insertion tag is attached is obtained from the text data 53.
(S31-2) The corresponding line of the image data 52 is specified using the acquired coordinate information.
(S31-3) On the image data 52, the size in the character direction of the coordinate information is divided by the total number of characters before correction (value D) in the specified line (in the case of horizontal writing: (xe−xs) / D, For vertical writing: (ye−ys) / D) When the coordinate position for each character is calculated in order from the base point of the line, and the number of calculated coordinate positions becomes the count value obtained in step S29, A coordinate position is specified as an insertion location on the image data 52.
In S29, in order to prevent a shift between the count value of the text data 53 and the coordinate position of S31-3, the character string to which the XML format tag character and the insertion tag are attached is not counted. .

次に出力部3は、修正情報配置領域(図8参照)に、ステップS31で得られたイメージデータ52上の挿入箇所をポイントする吹き出しを配置し、この吹き出し内の領域に挿入タグが付与されている文字列を配置する。(S32)。   Next, the output unit 3 arranges a balloon that points to the insertion location on the image data 52 obtained in step S31 in the correction information arrangement area (see FIG. 8), and an insertion tag is assigned to the area in the balloon. Place the character string. (S32).

ステップS28、ステップS32の後に、処理はS23へ戻り、次の文字に対しての処理が実行される。また、出力部3は、ステップS24で最後までテキストデータ53を読み込んだと判定した場合(S24、YES)、終了処理(修正確認データ54のファイル作成やディスプレイ上への表示、使用したメモリの開放等)を実行し(S33)、処理は終了する。   After step S28 and step S32, the process returns to S23, and the process for the next character is executed. If the output unit 3 determines in step S24 that the text data 53 has been read to the end (YES in S24), the output unit 3 creates a file of the correction confirmation data 54, displays it on the display, and releases the used memory. Etc.) is executed (S33), and the process ends.

次に、新旧対比表生成部4の詳細を図12を参照しつつ説明する。新旧対比表生成部4は、文字編集部2からの新旧対比表の出力指示を受けて(S40)、文字編集部2が生成したテキストデータ53を取り込み(S41)、テキストデータ53内の修正情報タグを元に新旧対比表55を生成しファイル出力する(S42、S43)。新旧対比表55として出力されるデータはCSV(Comma Separated Values)形式であるものとする。   Next, details of the new and old comparison table generator 4 will be described with reference to FIG. The old and new comparison table generation unit 4 receives an instruction to output the old and new comparison table from the character editing unit 2 (S40), takes in the text data 53 generated by the character editing unit 2 (S41), and corrects information in the text data 53 The new and old comparison table 55 is generated based on the tag and output as a file (S42, S43). The data output as the old and new comparison table 55 is assumed to be in CSV (Comma Separated Values) format.

新旧対比表55の生成例を図13に示す。新旧対比表生成部4は、テキストデータ53から行単位で文字列情報を抽出し、「挿入」、「削除」に応じて修正前と修正後の新旧対比表55を生成する。本実施の形態では、図13の例のように、ページ番号を示す「頁」、修正前の行数を示す「行数」、(挿入/削除)または削除の別を示す「修正タイプ」、修正前の文字列を示す「修正前原本」、修正後の文字列を示す「修正後」を1つのレコードとしたCSVデータが生成される。「修正前原本」には、挿入タグが付与されている文字列が取り除かれたテキストデータが抽出され、「修正後」には、削除タグが付与されている文字列が取り除かれたテキストデータが抽出される。   A generation example of the old and new comparison table 55 is shown in FIG. The old and new comparison table generation unit 4 extracts character string information in line units from the text data 53, and generates the old and new comparison table 55 before and after correction according to “insertion” and “deletion”. In the present embodiment, as in the example of FIG. 13, “page” indicating the page number, “number of lines” indicating the number of lines before correction, “modification type” indicating (insertion / deletion) or deletion, CSV data is generated with “record before modification” indicating a character string before correction and “after correction” indicating a character string after correction as one record. The text data from which the character string with the insertion tag is removed is extracted in the “original document”, and the text data from which the character string to which the deletion tag is added is removed in “After modification”. Extracted.

ここで、新旧対比表を作成する理由について説明する。例えば、文書を修正した後に、その修正内容を通知するための通達文書を作成することがある。この通達文書には、文書のどの箇所がどのように修正したかを記載する必要がある。従来、修正箇所を目視確認し通達文書を新規で作成していたが、本実施の形態のように新旧対比表を装置が自動で作成すれば、作成された表をそのまま貼り付けることで通達文書を作成することができる。よって、本実施の形態によって作業効率を向上させることができる。   Here, the reason for creating the old and new comparison table will be described. For example, after a document is corrected, a notification document for notifying the correction content may be created. This notification document must describe which part of the document has been modified and how. Conventionally, a notification document has been created by visually checking the correction location, but if the device automatically creates a new and old comparison table as in this embodiment, the notification document can be created by pasting the created table as it is. Can be created. Therefore, working efficiency can be improved by this embodiment.

また、例えば監督官庁等の機関からの行政指導により、文書修正が指示された場合、修正結果を当該機関に報告する必要がある。この報告文書に記載する修正内容に新旧対比表を使用することが可能となる。   For example, when a document correction is instructed by administrative guidance from an organization such as a supervisory government office, it is necessary to report the correction result to the organization. It is possible to use the old and new comparison tables for the correction contents described in this report document.

最後に、文書管理システム300の全体動作を図14のフローチャートを参照しつつ説明する。   Finally, the overall operation of the document management system 300 will be described with reference to the flowchart of FIG.

イメージスキャニング部20は、修正前原本51を読み取り、イメージデータ52(例えばJPEG形式の画像データ)を生成する(S51)。このイメージデータ52には、少なくとも一つの文字または複数の文字で構成された文字列が記されているものとする。   The image scanning unit 20 reads the uncorrected original 51 and generates image data 52 (for example, image data in JPEG format) (S51). It is assumed that the image data 52 includes a character string composed of at least one character or a plurality of characters.

文字認識部1は、イメージデータ52から、文字列を読み取りテキストデータ53を生成する(S52)。このテキストデータ53には、イメージデータ52に記された文字列の行ごとに、その行がイメージデータ52のいずれの位置にあるかを示す座標情報が付与される。   The character recognition unit 1 reads a character string from the image data 52 and generates text data 53 (S52). The text data 53 is given coordinate information indicating the position of the line in the image data 52 for each line of the character string written in the image data 52.

文字編集部2は、文字認識部1によって生成されたテキストデータ53を取得し、テキストデータ53に対してのユーザによる編集作業に応じて、削除された文字列には削除タグを付与し、挿入された文字列には挿入タグを付与する。文字編集部2は、これら削除タグ、挿入タグが付与されたテキストデータ53を生成する(S53)。   The character editing unit 2 acquires the text data 53 generated by the character recognition unit 1, adds a deletion tag to the deleted character string, and inserts it according to the editing operation by the user on the text data 53. An insertion tag is assigned to the character string that has been set. The character editing unit 2 generates text data 53 to which these deletion tags and insertion tags are assigned (S53).

次に、文字編集部2から修正確認用データの出力指示があった場合(S54、修正確認用データ)の処理について説明する。   Next, a description will be given of processing when there is an instruction to output correction confirmation data from the character editing unit 2 (S54, correction confirmation data).

出力部3は、修正確認用データを作成し、ファイル出力やディスプレイに表示する(S55)。S55について説明する。出力部3は、イメージデータ52と文字編集部2によって生成されたテキストデータ53とを取得する。出力部3は、イメージデータ52と挿入タグが付与された文字列とを表示する。さらに、出力部3は、削除タグが付与された文字列に対応するイメージデータ52の文字列を、他の文字列とは異なる形式(例えば網掛け形式)で表示する。加えて出力部3は、挿入タグが付与された文字列がイメージデータ52のいずれに挿入されるかをユーザが視認可能な形式(例えば挿入箇所をポイントしている吹き出し)で表示する。   The output unit 3 creates correction confirmation data and displays it on a file output or display (S55). S55 will be described. The output unit 3 acquires the image data 52 and the text data 53 generated by the character editing unit 2. The output unit 3 displays the image data 52 and the character string to which the insertion tag is attached. Further, the output unit 3 displays the character string of the image data 52 corresponding to the character string to which the deletion tag is assigned in a format different from other character strings (for example, a shaded format). In addition, the output unit 3 displays in which format the character string to which the insertion tag is added is inserted into the image data 52 in a format that the user can visually recognize (for example, a balloon pointing to the insertion location).

イメージデータ52上での削除箇所、挿入箇所の特定について説明する。出力部3は、削除タグが付与されている文字列の最初の文字が、行の端から何文字目にあるのか、および前記文字列の文字数を、文字編集部2によって生成されたテキストデータ53を用いてカウントし、これらカウント値と座標情報とに基づき、削除タグが付与された文字列に対応するイメージデータ52の文字列を特定する。また、挿入タグが付与されている文字列の最初の文字が、行の端から何文字目にあるのかを、文字編集部2によって生成されたテキストデータ53を用いてカウントし、このカウント値と座標情報とに基づき、挿入タグが付与された文字列がイメージデータ52のいずれに挿入されるかを特定する。   A description will be given of how to specify a deletion location and an insertion location on the image data 52. The output unit 3 uses the text data 53 generated by the character editing unit 2 to determine the number of characters from the end of the line, and the number of characters in the character string, to which the first character of the character string to which the deletion tag is assigned. The character string of the image data 52 corresponding to the character string to which the deletion tag is assigned is specified based on the count value and the coordinate information. In addition, the number of characters from the end of the line at which the first character of the character string to which the insertion tag is attached is counted using the text data 53 generated by the character editing unit 2, and this count value and Based on the coordinate information, it is specified in which of the image data 52 the character string to which the insertion tag is attached is inserted.

S54の判定処理に説明を戻す。文字編集部2から新旧対応表の出力指示があった場合(S54、新旧対応表)の処理について説明する。   The description returns to the determination process of S54. The processing when the character editing unit 2 instructs to output the old and new correspondence table (S54, old and new correspondence table) will be described.

新旧対比表生成部4は、文字編集部2によって生成されたテキストデータ53の削除タグ、挿入タグに基づき、ユーザの編集作業によって削除された文字列または挿入された文字列を特定し、編集作業の前と後との新旧対比表55を生成する(S56)。   The old and new comparison table generation unit 4 identifies a character string deleted or inserted by a user editing operation based on the deletion tag and insertion tag of the text data 53 generated by the character editing unit 2, and the editing operation The old and new comparison table 55 before and after is generated (S56).

本実施の形態では、文書管理端末100は画像データを取得し、画像データに対して処理するものとしたが、画像データに限らず文字列を有するデータであれば本実施の形態の態様を適用することができる。   In the present embodiment, the document management terminal 100 acquires image data and processes the image data. However, the present embodiment is not limited to image data, and any data having a character string can be applied. can do.

また、本実施の形態では、スキャナ200、文書管理端末100の2つのユニットに分かれた文書管理システム300について説明したが、これら2つのユニットを1つのOCR装置(光学式文字読取装置)とすることも可能である。   In the present embodiment, the document management system 300 divided into two units of the scanner 200 and the document management terminal 100 has been described. However, these two units are assumed to be one OCR device (optical character reader). Is also possible.

本実施の形態のように、修正前原本と修正後の出力物との確認作業を一つのイメージにマージすることで、修正前原本に対して修正箇所を明示することが可能になり、確認漏れを無くすとともに比較確認も容易となる。また、修正前原本のテキスト情報と修正後のテキスト情報とが対比された表を作成することで、新旧対比を容易に作成可能となる。   As in this embodiment, by merging the confirmation work of the uncorrected original and the corrected output into a single image, it becomes possible to clearly indicate the correction location for the uncorrected original, and omission of confirmation This makes it easier to confirm the comparison. In addition, by creating a table in which the text information of the original before correction and the text information after correction are compared, it is possible to easily create a comparison between old and new.

本実施の形態において、文書管理プログラムは上述した文書管理端末の内部に予めインストールされているものとして記載したが、本発明における文書管理プログラムは記憶媒体に記憶されたものも含まれる。ここで記憶媒体とは、磁気テープ、磁気ディスク(ハードディスクドライブ等)、光ディスク(CD−ROM、DVDディスク等)、光磁気ディスク(MO等)、フラッシュメモリ等、文書管理端末に対し脱着可能な媒体や、さらにネットワークを介することで伝送可能な媒体等、上述した文書管理端末におけるコンピュータで読み取りや実行が可能な全ての媒体をいう。   In the present embodiment, the document management program is described as being installed in advance in the above-described document management terminal. However, the document management program in the present invention includes one stored in a storage medium. Here, the storage medium is a medium that is detachable from the document management terminal, such as a magnetic tape, a magnetic disk (hard disk drive, etc.), an optical disk (CD-ROM, DVD disk, etc.), a magneto-optical disk (MO, etc.), and a flash memory. Further, it refers to all media that can be read and executed by a computer in the document management terminal described above, such as media that can be transmitted via a network.

本発明は、その精神または主要な特徴から逸脱することなく、他の様々な形で実施することができる。そのため、前述の実施の形態は、あらゆる点で単なる例示に過ぎず、限定的に解釈してはならない。本発明の範囲は、特許請求の範囲によって示すものであって、明細書本文には、何ら拘束されない。更に、特許請求の範囲の均等範囲に属する全ての変形、様々な改良、代替および改質は、全て本発明の範囲内のものである。   The present invention can be implemented in various other forms without departing from the spirit or main features thereof. Therefore, the above-described embodiment is merely an example in all respects and should not be interpreted in a limited manner. The scope of the present invention is shown by the scope of claims, and is not restricted by the text of the specification. Moreover, all modifications, various improvements, substitutions and modifications belonging to the equivalent scope of the claims are all within the scope of the present invention.

1 文字認識部、2 文字編集部、3 出力部、4、新旧対比表生成部、20 イメージスキャニング部、51 修正前原本、52 イメージデータ、53 テキストデータ、54 修正確認用データ、55 新旧対比表、100 文書管理端末、200 スキャナ、300 文書管理システム。   1 character recognition unit, 2 character editing unit, 3 output unit, 4 old and new comparison table generation unit, 20 image scanning unit, 51 original document before correction, 52 image data, 53 text data, 54 correction confirmation data, 55 old and new comparison table , 100 document management terminal, 200 scanner, 300 document management system.

Claims (4)

一つの文字または複数の文字で構成された文字列が記された画像データから、前記文字列を読み取りテキストデータを生成し、前記画像データの格納場所及びサイズに関する情報をイメージデータ情報として該テキストデータに付与する認識部と、
該テキストデータを取得し、該テキストデータに対しての編集作業によって削除された文字列には削除情報を付与し、挿入された文字列には挿入情報を付与し、これら削除情報、挿入情報が付与されたテキストデータを生成する編集支援部と、
前記画像データと前記編集支援部によって生成されたテキストデータとを取得し、前記画像データと挿入情報が付与された文字列とを表示するとともに、削除情報が付与された文字列に対応する前記画像データの文字列を、他の文字列とは異なる形式で表示し、且つ前記挿入情報が付与された文字列が前記画像データのいずれに挿入されるかを、視認可能な形式で表示する表示部と、
を有し、
前記認識部は、前記画像データに記された文字列の行ごとに、該行が前記画像データのいずれの位置にあるかを示す座標情報を前記テキストデータに付与し、
前記表示部は、削除情報が付与された文字列の最初の文字が、行の端から何文字目にあるか、および前記削除情報が付与された文字列の列文字数を、前記編集支援部によって生成されたテキストデータを用いてカウントし、これらカウント値と前記座標情報とに基づき、前記削除情報が付与された文字列に対応する前記画像データの文字列を特定し、且つ挿入情報が付与された文字列の1つ前の文字が、行の端から何文字目にあるかを、前記編集支援部によって生成されたテキストデータを用いてカウントし、このカウント値と前記座標情報とに基づき、前記挿入情報が付与された文字列が前記画像データのいずれに挿入されるかを特定することを特徴とする情報処理装置。
From the image data in which a character string composed of one character or a plurality of characters is written, the character string is read to generate text data, and the information about the storage location and size of the image data is used as image data information. A recognition unit to be assigned to
The text data is acquired, deletion information is given to the character string deleted by the editing operation on the text data, insertion information is given to the inserted character string, and the deletion information and insertion information are An editing support unit for generating the given text data;
The image data and the text data generated by the editing support unit are acquired, the image data and the character string to which insertion information is added are displayed, and the image corresponding to the character string to which deletion information is assigned A display unit that displays a character string of data in a format different from other character strings, and displays in which form the character string to which the insertion information is added is inserted into the image data in a visually recognizable format When,
I have a,
For each line of the character string written in the image data, the recognition unit gives coordinate information indicating the position of the line in the image data to the text data,
The display unit displays the number of characters from the end of the line where the first character of the character string to which deletion information is assigned, and the number of column characters of the character string to which the deletion information is assigned by the editing support unit. Count using the generated text data, and based on these count values and the coordinate information, specify the character string of the image data corresponding to the character string to which the deletion information is assigned, and is provided with insertion information The character immediately before the character string is counted from the end of the line using the text data generated by the editing support unit, and based on the count value and the coordinate information, An information processing apparatus that identifies in which of the image data the character string to which the insertion information is added is inserted .
請求項に記載の情報処理装置において、
前記表示部は、
前記削除情報が付与された文字列または前記挿入情報が付与された文字列が存在する行の起点及び終点の座標情報を前記テキストデータから取得し、該起点及び終点の座標情報を用いて前記画像データにおける該行を特定し、該終点の座標情報から該起点の座標情報の差を該行の修正前の総文字数で除して、前記画像データ上での1文字毎の座標位置を算出し、
前記削除情報が付与された文字列に対応する前記画像データの文字列を特定する場合、前記算出した1文字毎の座標位置における、前記削除情報が付与された文字列の最初の文字が行端から何文字目にあるかを示す前記カウント値に該当する座標位置から、前記列文字数に該当する座標位置までの前記画像データ上の範囲に網掛けを乗せ、
前記挿入情報が付与された文字列に対応する前記画像データの文字列を特定する場合、前記算出した1文字毎の座標位置のうち、前記挿入情報が付与された文字列の1つ前の文字が行端から何文字目にあるかを示す前記カウント値に該当する座標位置に、前記挿入情報が付与された文字列に関する情報を配置することを特徴とする情報処理装置。
The information processing apparatus according to claim 1 ,
The display unit
The coordinate information of the starting point and the ending point of the line in which the character string to which the deletion information is attached or the character string to which the insertion information is attached is obtained from the text data, and the image is obtained using the starting point and ending point coordinate information. The line in the data is specified, and the coordinate position of each character on the image data is calculated by dividing the difference of the coordinate information of the starting point from the coordinate information of the end point by the total number of characters before correction of the line. ,
When the character string of the image data corresponding to the character string to which the deletion information is added is specified, the first character of the character string to which the deletion information is added at the calculated coordinate position of each character is a line end. From the coordinate position corresponding to the count value indicating the number of characters from, to the range on the image data from the coordinate position corresponding to the number of column characters,
When the character string of the image data corresponding to the character string to which the insertion information is assigned is specified, the character immediately before the character string to which the insertion information is assigned out of the calculated coordinate position of each character An information processing apparatus, wherein information relating to the character string to which the insertion information is added is arranged at a coordinate position corresponding to the count value indicating the character number from the line end.
コンピュータが有する認識部が、一つの文字または複数の文字で構成された文字列が記された画像データから、前記文字列を読み取りテキストデータを生成し、前記画像データの格納場所及びサイズに関する情報をイメージデータ情報として該テキストデータに付与し、
前記コンピュータが有する編集支援部が、該テキストデータを取得し、該テキストデータに対しての編集作業によって削除された文字列には削除情報を付与し、挿入された文字列には挿入情報を付与し、これら削除情報、挿入情報が付与されたテキストデータを生成し、
前記コンピュータが有する表示部が、前記画像データと前記編集支援部によって生成されたテキストデータとを取得し、前記画像データと挿入情報が付与された文字列とを表示するとともに、削除情報が付与された文字列に対応する前記画像データの文字列を、他の文字列とは異なる形式で表示し、且つ前記挿入情報が付与された文字列が前記画像データのいずれに挿入されるかを、視認可能な形式で表示し
前記認識部が、前記画像データに記された文字列の行ごとに、該行が前記画像データのいずれの位置にあるかを示す座標情報を前記テキストデータに付与し、
前記表示部が、削除情報が付与された文字列の最初の文字が、行の端から何文字目にあるか、および前記削除情報が付与された文字列の列文字数を、前記編集支援部によって生成されたテキストデータを用いてカウントし、これらカウント値と前記座標情報とに基づき、前記削除情報が付与された文字列に対応する前記画像データの文字列を特定し、且つ挿入情報が付与された文字列の1つ前の文字が、行の端から何文字目にあるかを、前記編集支援部によって生成されたテキストデータを用いてカウントし、このカウント値と前記座標情報とに基づき、前記挿入情報が付与された文字列が前記画像データのいずれに挿入されるかを特定することを特徴とする文書管理方法。
A recognition unit of the computer reads the character string from image data in which a character string composed of one character or a plurality of characters is written, generates text data, and stores information on the storage location and size of the image data. Attached to the text data as image data information,
The editing support unit of the computer obtains the text data, gives deletion information to a character string deleted by editing the text data, and gives insertion information to the inserted character string Then, generate the text data with the deletion information and insertion information.
The display unit of the computer acquires the image data and text data generated by the editing support unit , displays the image data and a character string to which insertion information is added, and is given deletion information. The character string of the image data corresponding to the character string displayed is displayed in a format different from that of the other character strings, and it is visually recognized in which of the image data the character string provided with the insertion information is inserted. Display in a possible format ,
For each line of the character string written in the image data, the recognition unit gives coordinate information indicating the position of the line in the image data to the text data,
The display unit determines the number of characters from the end of the line where the first character of the character string to which deletion information has been assigned, and the number of column characters of the character string to which the deletion information has been assigned, by the editing support unit. Count using the generated text data, and based on these count values and the coordinate information, specify the character string of the image data corresponding to the character string to which the deletion information is assigned, and is provided with insertion information The character immediately before the character string is counted from the end of the line using the text data generated by the editing support unit, and based on the count value and the coordinate information, A document management method for specifying in which of the image data the character string to which the insertion information is added is inserted .
一つの文字または複数の文字で構成された文字列が記された画像データから、前記文字列を読み取りテキストデータを生成し、前記画像データの格納場所及びサイズに関する情報をイメージデータ情報として該テキストデータに付与する認識部と
該テキストデータを取得し、該テキストデータに対しての編集作業によって削除された文字列には削除情報を付与し、挿入された文字列には挿入情報を付与し、これら削除情報、挿入情報が付与されたテキストデータを生成する編集支援部と
前記画像データと前記編集支援部によって生成されたテキストデータとを取得し、前記画像データと挿入情報が付与された文字列とを表示するとともに、削除情報が付与された文字列に対応する前記画像データの文字列を、他の文字列とは異なる形式で表示し、且つ前記挿入情報が付与された文字列が前記画像データのいずれに挿入されるかを、視認可能な形式で表示する表示部
としてコンピュータを機能させ、
前記認識部は、前記画像データに記された文字列の行ごとに、該行が前記画像データのいずれの位置にあるかを示す座標情報を前記テキストデータに付与し、
前記表示部は、削除情報が付与された文字列の最初の文字が、行の端から何文字目にあるか、および前記削除情報が付与された文字列の列文字数を、前記編集支援部によって生成されたテキストデータを用いてカウントし、これらカウント値と前記座標情報とに基づき、前記削除情報が付与された文字列に対応する前記画像データの文字列を特定し、且つ挿入情報が付与された文字列の1つ前の文字が、行の端から何文字目にあるかを、前記編集支援部によって生成されたテキストデータを用いてカウントし、このカウント値と前記座標情報とに基づき、前記挿入情報が付与された文字列が前記画像データのいずれに挿入されるかを特定することを特徴とする文書管理プログラム。
From the image data in which a character string composed of one character or a plurality of characters is written, the character string is read to generate text data, and the information about the storage location and size of the image data is used as image data information. A recognition unit to be assigned to
The text data is acquired, deletion information is given to the character string deleted by the editing operation on the text data, insertion information is given to the inserted character string, and the deletion information and insertion information are An editing support unit for generating the given text data;
The image data and the text data generated by the editing support unit are acquired, the image data and the character string to which insertion information is added are displayed, and the image corresponding to the character string to which deletion information is assigned display the character string data, it is displayed in a different format from the other strings, and whether the insertion information is imparted string is inserted into any of the image data is displayed in a visible form
Function as a computer
For each line of the character string written in the image data, the recognition unit gives coordinate information indicating the position of the line in the image data to the text data,
The display unit displays the number of characters from the end of the line where the first character of the character string to which deletion information is assigned, and the number of column characters of the character string to which the deletion information is assigned by the editing support unit. Count using the generated text data, and based on these count values and the coordinate information, specify the character string of the image data corresponding to the character string to which the deletion information is assigned, and is provided with insertion information The character immediately before the character string is counted from the end of the line using the text data generated by the editing support unit, and based on the count value and the coordinate information, A document management program for specifying in which of the image data the character string to which the insertion information is added is inserted .
JP2009250543A 2009-10-30 2009-10-30 Information processing apparatus, document management method, and document management program Active JP5542414B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009250543A JP5542414B2 (en) 2009-10-30 2009-10-30 Information processing apparatus, document management method, and document management program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009250543A JP5542414B2 (en) 2009-10-30 2009-10-30 Information processing apparatus, document management method, and document management program

Publications (2)

Publication Number Publication Date
JP2011096070A JP2011096070A (en) 2011-05-12
JP5542414B2 true JP5542414B2 (en) 2014-07-09

Family

ID=44112894

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009250543A Active JP5542414B2 (en) 2009-10-30 2009-10-30 Information processing apparatus, document management method, and document management program

Country Status (1)

Country Link
JP (1) JP5542414B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5777994B2 (en) * 2011-09-27 2015-09-16 富士フイルム株式会社 Editing system

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6254346A (en) * 1985-09-03 1987-03-10 Casio Comput Co Ltd Automatic formation system for list of document file correcting points
JP2920312B2 (en) * 1990-05-14 1999-07-19 三菱レイヨン株式会社 Manufacturing method of ultra-fine fiber
JPH06131346A (en) * 1992-10-19 1994-05-13 Fujitsu Ltd Document processor
JP2001067344A (en) * 1999-08-30 2001-03-16 Hitachi Ltd Information processor
JP2002024211A (en) * 2000-06-30 2002-01-25 Hitachi Ltd Method and system for document management and storage medium having processing program stored thereon
JP2003271589A (en) * 2002-03-18 2003-09-26 Mitsubishi Electric Information Systems Corp Annotation system, annotation method, computer- readable storage medium with program stored therein, and program

Also Published As

Publication number Publication date
JP2011096070A (en) 2011-05-12

Similar Documents

Publication Publication Date Title
JP2005173730A (en) Business form ocr program, method, and device
JP5321109B2 (en) Information processing apparatus and information processing program
CN102708580A (en) Image processing apparatus and image processing method
TW201714124A (en) Document management system and method thereof
JP5542414B2 (en) Information processing apparatus, document management method, and document management program
JP5732861B2 (en) Image processing apparatus and image processing program
JP6221220B2 (en) Image processing apparatus and image processing program
JP2009251872A (en) Information processing device and information processing program
JP6931168B2 (en) Information processing device, control method, program
JP4756650B2 (en) Image processing apparatus, reading order setting method, and program
JP5720182B2 (en) Image processing apparatus and image processing program
JP5923981B2 (en) Image processing apparatus and image processing program
JP2013152580A (en) Code generation device, code generation method, and program
JP6244743B2 (en) Layout editing processing method, apparatus and program
JP4712629B2 (en) Equipment specification input device
KR20210060808A (en) Document editing device to check whether the font applied to the document is a supported font and operating method thereof
GB2567407A (en) Method and apparatus for determining layout
JP2005050094A (en) Optical character reader
JP2007011472A (en) Information processing method and device, program and computer-readable memory
JP5303967B2 (en) Typesetting device, typesetting method, and typesetting processing program
JP2005056010A (en) Device, method and program for defining business form
TWM517377U (en) Document management system
JP2006085583A (en) Document processing apparatus and program
JP2010026667A (en) Information processing apparatus and information processing program
JP3307358B2 (en) Partial correction command method and information processing apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120321

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130423

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140408

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140507

R150 Certificate of patent or registration of utility model

Ref document number: 5542414

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350