JP2006301695A - Document processing device and program - Google Patents
Document processing device and program Download PDFInfo
- Publication number
- JP2006301695A JP2006301695A JP2005118135A JP2005118135A JP2006301695A JP 2006301695 A JP2006301695 A JP 2006301695A JP 2005118135 A JP2005118135 A JP 2005118135A JP 2005118135 A JP2005118135 A JP 2005118135A JP 2006301695 A JP2006301695 A JP 2006301695A
- Authority
- JP
- Japan
- Prior art keywords
- document
- additional
- image data
- mark
- marks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
本発明は、文書に対して手書きで追記された文字や記号、図形などの追記マークに基づいて、その追記マークが付されている領域の記載内容を抽出する技術に関する。 The present invention relates to a technique for extracting description contents of a region to which an additional mark is attached based on additional marks such as characters, symbols, and figures added by hand to a document.
紙文書には、読み手によって各種のコメントが追記される場合がある。係るコメントのように紙文書に追記された事項のなかには、その読み手にとって重要な情報が含まれている場合があるので、このような追記事項のみを紙文書から抽出したいといったニーズがあった。そこで、このようなことを可能にする技術が従来より種々提案されており、その一例としては特許文献1に開示された技術が挙げられる。特許文献1には、追記事項の属性を各追記事項が付されている文脈などに基づいて分類し、各属性毎に追記事項をリスト化して出力する技術が開示されている。
ところで、紙文書の読み手は、上記のようなコメントの他に、その読み手にとって重要な情報が記載されていると判断した章や段落にその旨を表す特定の文字や記号、図形など追記する場合がある。以下では、このような目的で紙文書に手書きで追記された文字や記号、図形などを「追記マーク」と呼ぶ。このような追記マークが付された章や段落には、読み手にとって重要な情報が記載されているのであるから、追記マークが付された領域の記載内容のみを抽出して提供することができると便利である。また、読み手が追記マークを紙文書へ書き込む際には、互いに関連性を有する記載が為されている箇所には同一の追記マークを付与することが一般的であるから、同一の追記マークが付与された領域など互いに関連性を有すると推測される領域の記載内容を集めてユーザに提示することができたならば便利である。しかしながら、特許文献1に開示された技術では、追記事項をその属性に応じてリスト化して出力するだけであるから、このようなことを実現することはできない。 By the way, when a reader of a paper document adds a specific character, symbol, figure, or the like indicating that to a chapter or paragraph that is judged to contain important information for the reader in addition to the comments as described above There is. Hereinafter, characters, symbols, figures, and the like added by hand to a paper document for such a purpose are referred to as “additional marks”. Since chapters and paragraphs marked with such additional marks contain important information for the reader, it is possible to extract and provide only the contents of the areas marked with additional marks. Convenient. In addition, when a reader writes a write-once mark on a paper document, it is common to give the same write-once mark to places where there is a description related to each other. It would be convenient if the description contents of the regions estimated to be related to each other such as the selected regions could be collected and presented to the user. However, since the technique disclosed in Patent Document 1 only lists and outputs additional items according to their attributes, this cannot be realized.
本発明は、文書に対して手書きで追記された文字や記号、図形などの追記マークに基づいて、互いに関連性を有すると推測される領域の記載内容を集めてユーザに判りやすく提示することを可能にする技術を提供することを目的としている。 The present invention collects description contents of regions that are presumed to be related to each other based on additional marks such as characters, symbols, and figures that are added by hand to a document and presents them to the user in an easily understandable manner. It aims to provide the technology that makes it possible.
上記課題を解決するために、本発明は、紙文書を電子化して得られる文書画像データが入力される入力手段と、前記入力手段へ入力された文書画像データを解析し、その文書画像データの表す文書の原本に対して手書きで追記された追記マークを特定する第1の特定手段と、前記第1の特定手段により特定された追記マークの各々について、その追記マークが対応付けられている前記文書画像データの画像領域を特定する第2の特定手段と、前記第1の特定手段により複数の追記マークが特定された場合に、各追記マークの形状を解析して、同一又は類似する形状を有する追記マーク毎に分類する分類手段と、前記分類手段により同一又は類似する形状を有すると分類された追記マークの各々について、その追記マークに対応付けられていると前記第2の特定手段により特定された画像領域に配置されている画像を所定のレイアウトにしたがって配置して出力する出力手段とを有する文書処理装置を提供する。 In order to solve the above problems, the present invention analyzes an input unit for inputting document image data obtained by digitizing a paper document, and analyzes the document image data input to the input unit. The first specifying means for specifying the additional mark added by hand writing to the original document to be represented, and the additional mark specified by the first specifying means are associated with the additional mark. When a plurality of additional marks are specified by the second specifying means for specifying the image area of the document image data and the first specifying means, the shape of each additional mark is analyzed, and the same or similar shape is analyzed. Classifying means for classifying each additional writing mark and each additional writing mark classified as having the same or similar shape by the classification means are associated with the additional writing mark. To provide a document processing apparatus and an output means for outputting the image disposed in the image area specified by the second specifying means arranged according to a predetermined layout.
このような文書処理装置によれば、同一又は類似する形状を有する追記マークが対応付けられた画像領域に配置される画像が所定のレイアウトに配置されて出力される。このため、上記所定のレイアウトとして、例えば、複数の画像をリスト形式に並べて配置するレイアウトを採用すれば、上記文書画像データの表す画像において、同一又は類似する追記マークが対応付けられた画像領域に配置される画像がリスト形式に並べられて出力されることになる。同一又は類似する追記マークが対応付けられた画像領域に配置される画像は、互いに関連性を有する事項の画像を表していると推測されることは前述した通りであるから、本発明にかかる文書処理装置によれば、上記紙文書に記載されている事項のうち、互いに関連性を有すると推測される事項を集めて、例えばリスト形式で出力するなど、それら互いに関連性を有する事項のみをユーザに判りやすく提示することが可能になる。 According to such a document processing apparatus, an image arranged in an image region associated with an additional mark having the same or similar shape is arranged and output in a predetermined layout. For this reason, for example, if a layout in which a plurality of images are arranged and arranged in a list format is adopted as the predetermined layout, in the image represented by the document image data, an image region associated with the same or similar additional mark is associated. The arranged images are output in a list format. As described above, it is presumed that the images arranged in the image region associated with the same or similar additional mark are assumed to represent images of matters having relevance to each other. According to the processing apparatus, among the items described in the paper document, the items that are estimated to be related to each other are collected, and for example, the items that are related to each other are output in a list format. Can be presented in an easy-to-understand manner.
より好ましい態様においては、前記第1の特定手段は、前記入力手段へ入力された文書画像データとその文書画像データの表す紙文書の原本を表す原本画像データとを比較して、前記追記マークを特定することを特徴としている。このような態様においては、上記原本に対して付された追記マークが確実に特定される。 In a more preferred aspect, the first specifying unit compares the document image data input to the input unit with original image data representing an original of a paper document represented by the document image data, and adds the additional mark. It is characterized by identification. In such an aspect, the postscript mark attached to the original is surely specified.
また、別の好ましい態様においては、前記第1の特定手段は、前記入力手段へ入力された文書画像データの表す画像の色とその文書画像データの表す紙文書の原本の色との差に基づいて、前記追記マークを特定することを特徴としている。このような態様においては、上記原本に付された追記マークの色がその原本の記載に用いられている色とは異なっている場合に、その追記マークが確実に特定される。 In another preferred embodiment, the first specifying means is based on a difference between an image color represented by the document image data input to the input means and an original color of the paper document represented by the document image data. The additional mark is specified. In such an aspect, when the color of the additional mark attached to the original is different from the color used in the description of the original, the additional mark is reliably specified.
また、別の好ましい態様においては、前記分類手段は、追記マークの形状を解析してその特徴量を算出し、算出された特徴量が同一である追記マーク同士を同一の形状を有する追記マークとして分類する一方、算出された特徴量の乖離が所定の範囲内である追記マーク同士を互いに類似する追記マークとして分類することを特徴としている。このような態様においては、各追記マークの色や回転の有無などの配置態様によらずに、同一又は類似する形状を有する追記マークが確実に分類される。 In another preferred embodiment, the classifying unit analyzes the shape of the write-once mark and calculates a feature amount thereof, and the write-once marks having the same calculated feature amount are used as write-once marks having the same shape. On the other hand, it is characterized in that the recordable marks whose deviation of the calculated feature amount is within a predetermined range are classified as similar recordable marks. In such an aspect, the additional recording marks having the same or similar shapes are surely classified regardless of the arrangement mode such as the color of each additional recording mark and the presence / absence of rotation.
また、上記課題を解決するために、本発明は、コンピュータ装置に、紙文書を電子化して得られる文書画像データを解析し、その文書画像データの表す文書の原本に対して手書きで追記された追記マークを特定する第1のステップと、前記第1のステップにて特定された追記マークの各々について、その追記マークが対応付けられている前記文書画像データの画像領域を特定する第2のステップと、前記第1のステップにて複数の追記マークが特定された場合に、各追記マークの形状を解析して、同一又は類似する形状を有する追記マーク毎に分類する第3のステップと、前記第3のステップにて同一又は類似する形状を有する追記マークを表すと分類された追記マークの各々について、その追記マークに対応付けられていると前記第2のステップにて特定された画像領域に配置されている画像を所定のレイアウトにしたがって配置して出力する第4のステップとを実行させるプログラムプログラムを提供する。 Further, in order to solve the above-mentioned problems, the present invention analyzes document image data obtained by digitizing a paper document in a computer device, and is added by handwriting to the original document represented by the document image data. A first step of specifying a write-once mark and a second step of specifying an image area of the document image data associated with the write-once mark for each of the write-once marks specified in the first step And when a plurality of additional marks are identified in the first step, a third step of analyzing the shape of each additional mark and classifying each additional mark having the same or similar shape, If each additional recording mark classified as representing an additional recording mark having the same or similar shape in the third step is associated with the additional recording mark, the second scan is performed. Providing a program program for executing a fourth step of outputting the image disposed in the image region specified by arranging in accordance with a predetermined layout in-up.
このようなプログラムによれば、このプログラムを一般的なコンピュータ装置へインストールしそのコンピュータ装置を該プログラムにしたがって作動させることによって、そのコンピュータ装置に本発明にかかる文書処理装置と同一の機能が付与される。なお、本発明の別の態様においては、コンピュータ装置読取り可能な記録媒体に上記プログラムを書き込んで提供するとしても勿論良い。 According to such a program, by installing this program in a general computer device and operating the computer device according to the program, the same function as that of the document processing device according to the present invention is given to the computer device. The In another aspect of the present invention, it is of course possible to provide the program by writing it in a computer-readable recording medium.
本発明によれば、文書に対して手書きで追記された追記マークに基づいて、互いに関連性を有すると推測される領域の記載内容を集めてユーザに判りやすく提示することが可能になる、といった効果を奏する。 According to the present invention, it is possible to collect the description contents of regions that are presumed to be related to each other and present them to the user in an easy-to-understand manner based on the postscript marks that are handwritten on the document. There is an effect.
以下、本発明を実施する際の最良の形態について図面を参照しつつ説明する。
(A:構成)
図1は、本発明の1実施形態に係る文書処理装置110を含んでいる文書処理システム10の構成例を示すブロック図である。図1の画像読取装置120は、例えばADF(Auto Document Feeder)などの自動給紙機構を備えたスキャナ装置であり、ADFにセットされた紙文書を1ページずつ光学的に読み取り、読み取った画像を表す画像データ(以下、文書画像データ)をLAN(Local Area Network)などの通信線130を介して文書処理装置110へ引渡すものである。なお、本実施形態では、通信線130がLANである場合について説明するが、WAN(Wide Area Network)やインターネットなどであっても良いことは勿論である。また、本実施形態では、文書処理装置110と画像読取装置120とを夫々個別のハードウェアとして構成する場合について説明するが、両者を一体のハードウェアで構成するとしても良いことは勿論である。このような態様にあっては、通信線130は、係るハードウェア内で文書処理装置110と画像読取装置120とを接続する内部バスである。
The best mode for carrying out the present invention will be described below with reference to the drawings.
(A: Configuration)
FIG. 1 is a block diagram illustrating a configuration example of a
さて、図1に示す文書処理システム10においては、読み手によって追記マークが手書きされた紙文書が画像読取装置120の自動給紙機構にセットされ、その紙文書の画像を表す文書画像データが文書処理装置110へ送られる。一方、文書処理装置110には、上記紙文書の原本(すなわち、手書きによる追記が為されていない紙文書)の画像を表す画像データ(以下、「原本画像データ」)が予め格納されている。そして、文書処理装置110は、画像読取装置120から受取った文書画像データと自装置に予め格納されている原本画像データとを比較して、上記読み手により付された追記マークを特定し、同一又は類似する追記マークが付されている章や段落の記載内容を集めて所定のレイアウトにしたがって出力する機能を備えている。以下、文書処理装置110の構成および動作を中心に説明する。
In the
図2は、文書処理装置110のハードウェア構成の一例を示す図である。
図2に示されているように、文書処理装置110は、制御部200と、通信インターフェイス(以下、IF)部210と、表示部220と、操作部230と、記憶部240と、これら各構成要素間のデータ授受を仲介するバス250と、を備えている。
FIG. 2 is a diagram illustrating an example of a hardware configuration of the
As shown in FIG. 2, the
制御部200は、例えばCPU(Central Processing Unit)であり、後述する記憶部240に格納されている各種ソフトウェアを実行することによって、文書処理装置110の各部を中枢的に制御するものである。通信IF部210は、通信線130を介して画像読取装置120に接続されており、この通信線130を介して画像読取装置120から送られてくる文書画像データを受取り、制御部200へ引渡すものである。つまり、この通信IF部210は、画像読取装置120から送られてくる文書画像データが入力される入力手段として機能する。
The
表示部220は、例えば液晶ディスプレイとその駆動回路であり、制御部200から引渡されたデータに応じた画像を表示するものである。操作部230は、例えば、複数の操作子(図示省略)を備えたキーボードであり、それら操作子の操作内容に応じたデータ(以下、操作内容データ)を制御部200へ引渡すことによって、ユーザによる上記各操作子の操作内容を制御部200へ伝達するためのものである。
The
記憶部240は、図2に示されているように、揮発性記憶部240aと不揮発性記憶部240bとを含んでいる。揮発性記憶部240aは、例えばRAM(Random Access Memory)であり、後述する各種ソフトウェアにしたがって作動している制御部200によってワークエリアとして利用される。一方、不揮発性記憶部240bは、例えば、ハードディスクである。この不揮発性記憶部240bには、本実施形態に係る文書処理装置110に特有な機能を制御部200に実現させるためのデータやソフトウェアが格納されている。
As shown in FIG. 2, the
不揮発性記憶部240bに格納されているデータの一例としては、前述した原本画像データが挙げられる。一方、不揮発性記憶部240bに格納されているソフトウェアの一例としては、オペレーティングシステム(Operating System 以下、「OS」)を制御部200に実現させるためのOSソフトウェアと編集ソフトウェアとが挙げられる。ここで、編集ソフトウェアとは、画像読取装置120から入力された文書画像データにより表される文書にて同一又は類似する追記マークを付与されている記載箇所を章や段落などの領域毎に抽出し、それらを所定のレイアウトにしたがって表示部220に表示する処理を制御部200に実行させるためのソフトウェアである。以下、これらソフトウェアを実行することによって制御部200に付与される機能について説明する。
As an example of the data stored in the nonvolatile storage unit 240b, the above-described original image data can be cited. On the other hand, examples of software stored in the nonvolatile storage unit 240b include OS software and editing software for causing the
文書処理装置110の電源(図示省略)が投入されると、制御部200は、まず、OSソフトウェアを不揮発性記憶部240bから読み出し実行する。OSソフトウェアにしたがって作動しOSを実現している状態の制御部200には、文書処理装置110の各部を制御する機能や、ユーザの指示に応じて他のソフトウェアを不揮発性記憶部240bから読み出し実行する機能が付与される。例えば、上記編集ソフトウェアの実行を指示されると、制御部200は、上記編集ソフトウェアを不揮発性記憶部240bから読み出し、これを実行する。この編集ソフトウェアにしたがって作動している制御部200には、以下に述べる4個の機能が付与される。
When the power (not shown) of the
第1に、画像読取装置120から通信IF部210を介して受取った文書画像データを解析し、その文書画像データの表す文書の原本に対して手書きで追記された追記マークを特定する第1の特定機能である。具体的には、制御部200は、上記文書画像データと上記原本画像データとを比較し、両者の差分を表す画像を上記原本に対する追記事項を表す追記画像として特定し、その追記画像の各々を表す画像データ(以下、追記画像データ)を生成する。このようにして生成された追記画像データの表す追記画像には、上述した追記マークの画像が含まれているのであるから、上記追記画像データを生成することによって追記マークが特定されることになる。
First, the document image data received from the
第2に、上記第1の特定機能により特定された追記マークの各々について、その追記マークが対応付けられている上記文書画像データの画像領域を特定する第2の特定機能である。より詳細に説明すると、制御部200は、上記第1の特定機能により生成された各追記画像データの表す追記画像について、文書画像データの表す画像内での位置を特定するとともに、上記原本画像データの表す画像についてレイアウト解析を施し、各画像領域の配置位置を特定する。そして、上記追記画像と所定の位置関係にある画像領域(例えば、その追記画像からの距離が所定の閾値以下である画像領域)をその追記画像の表す追記マークに対応付けられている画像領域として特定する。
Secondly, for each additional mark specified by the first specifying function, a second specifying function for specifying an image area of the document image data associated with the additional mark. More specifically, the
第3に、上記第1の特定機能により複数の追記マークが特定された場合に、各追記マークの形状を解析し、同一又は類似する形状を有する追記マーク毎に分類する分類機能である。より詳細に説明すると、制御部200は、各追記画像データの表す追記画像を解析してその追記画像の表す追記マークの形状についての特徴量を算出し、その特徴量が同一である追記マーク同士を同一の追記マークとして分類し、特徴量が互いに異なっているもののその乖離が所定の範囲内である追記マークを互いに類似する追記マークとして分類する。
Third, when a plurality of additional marks are specified by the first specifying function, the shape of each additional mark is analyzed and classified for each additional mark having the same or similar shape. More specifically, the
そして、第4に、上記分類機能により同一又は類似する形状を有する追記マークと分類された追記マークの各々について、その追記マークに対応付けられていると上記第2の特定機能により特定された画像領域に配置されている画像を所定のレイアウトにしたがって配置して形成される画像を表す画像データ(以下、編集済み画像データ)を生成し、その画像データを表示部220へ出力する出力機能である。なお、本実施形態では、上記のようにして生成された編集済み画像データを表示部220へ出力してその編集済み画像データに応じた画像を表示させる場合について説明するが、上記編集済み画像データを、例えばプリンタ装置などの画像形成装置へ転送し、その編集済み画像データの表す画像を印刷用紙やOHPシートなどの記録材上に形成させるようにしても勿論良い。
And fourth, the image specified by the second specifying function when each of the additional marks classified as the additional mark having the same or similar shape by the classification function is associated with the additional mark. This is an output function for generating image data representing an image formed by arranging images arranged in a region according to a predetermined layout (hereinafter referred to as edited image data) and outputting the image data to the
以上に説明したように、本実施形態に係る文書処理装置110のハードウェア構成は一般的なコンピュータ装置のハードウェア構成と同一であり、不揮発性記憶部240bに格納されている各種ソフトウェアを制御部200に実行させることによって、本発明に係る文書処理装置に特有な機能が実現される。このように、本実施形態では、本発明に係る文書処理装置に特有な機能をソフトウェアモジュールで実現する場合について説明したが、これらの機能を各々担っているハードウェアモジュールを組み合わせて本発明に係る文書処理装置を構成するとしても良いことは勿論である。
As described above, the hardware configuration of the
(B:動作)
次いで、文書処理装置110が行う動作のうち、その特徴を顕著に示す動作について図面を参照しつつ説明する。なお、以下に説明する動作例では、文書処理装置110の制御部200は上記編集ソフトウェアにしたがって作動しており、画像読取り装置120から文書画像データが送られてくることを待ち受けているものとする。
(B: Operation)
Next, of the operations performed by the
ユーザが画像読取装置120のADFに紙文書をセットし、所定の操作(例えば、画像読取装置120の操作部に設けられている起動ボタンの押下など)を行うと、その紙文書に対応する画像が画像読取装置120によって読み取られ、その画像に対応する文書画像データが通信線130を介して画像読取装置120から文書処理装置110へ送られる。本動作例では、図3(a)に示す紙文書が画像読取装置120のADFにセットされ、その紙文書に対応する画像を表す文書画像データが画像読取装置120から文書処理装置110へ送られるものとする。また、文書処理装置110の不揮発性記憶部240bには、図3(a)に示す紙文書の原本(図3(b)参照)を表す原本画像データが予め1つだけ格納されているものとする。図3(a)と図3(b)との比較から明らかなように、図3(a)に示す紙文書においては、その第1段落(図3(a):“B01”)には追記マークM01が付与されており、その第3段落(図3(a):“B02”)には、追記マークM02が付与されており、その第4段落(図3(a):“B04”)には、追記マークM03が付与されている。図3(a)から明らかなように、追記マークM01と追記マークM03とは同一の形状を有する追記マークである。
When a user sets a paper document in the ADF of the
図4は、上記編集ソフトウェアにしたがって制御部200が行う編集処理の流れを示すフローチャートである。図4に示すように、制御部200は、通信線130を介して画像読取装置120から送られてくる文書画像データを通信IF部210によって受取ると(ステップSA100)、その文書画像データと不揮発性記憶部240bに格納されている原本画像データとを比較し、その原本画像データの表す原本に対して付された追記マークを特定する(ステップSA110)。図3(a)および図3(b)の比較から明らかなように、本動作例では、追記マークM01、M02およびM03の各々を表す3つの追記画像データが上記第1の特定機能によって生成され、これら追記画像データによって各追記マークが特定されることになる。なお、本実施形態では、上記文書画像データの表す紙文書の原本を表す原本画像データが予め1つだけ文書処理装置110の不揮発性記憶部240bに格納されている場合について説明したが、複数種類の紙文書の各々の原本を表す原本画像データ(すなわち、複数の原本画像データ)が文書処理装置110の不揮発性記憶部240bに格納されているとしても良いことは勿論である。このような場合には、上記ステップSA110の実行に先立って、上記文書画像データの表す紙文書の原本を表す原本画像データをユーザに指定させるようにすれば良い。
FIG. 4 is a flowchart showing the flow of editing processing performed by the
次いで、制御部200は、上記ステップSA110にて特定した追記マークの各々について、上記文書画像データの表す画像における配置位置を特定(ステップSA120)するとともに、上記原本画像データの表す画像についてレイアウト解析を施し、その原本画像データの表す原本における章や段落などのブロック毎にそのブロックを表す画像領域の配置位置を特定する(ステップSA130)。そして、制御部200は、上記追記画像との距離が所定の閾値以下である画像領域をその追記画像の表す追記マークに対応付けられている画像領域として特定する(ステップSA140)。図3(a)に示すように、追記マークM01は、処理対象の文書の第1段落を表す画像領域B01の近傍に位置しているのであるから、上記ステップSA130の処理によって追記マークM01と画像領域B01とが対応付けられていると特定される。同様に、上記ステップSA130の処理によって、追記マークM02と画像領域B02とが対応付けられていると特定され、追記マークM03と画像領域B04とが対応付けられていると特定される。なお、本実施形態では、原本画像データの表す画像にレイアウト解析を施して、その原本における章や段落などのブロック毎にそのブロックを表す画像領域の配置位置を特定する場合について説明したが、画像読取装置120から引渡された文書画像データに対して、上記追記画像を表すデータを取り除く処理を施して得られる画像データにレイアウト解析を施して、上記原本における章や段落などのブロック毎にそのブロックを表す画像領域の配置位置を特定するとしても良いことは勿論である。
Next, the
次いで、制御部200は、上記ステップSA110において複数の追記マークが特定されたか否かを判定し(ステップSA150)、その判定結果が“Yes”である場合には、以下に述べるステップSA160〜SA170の処理を実行する。前述したように、本動作例では、上記ステップSA110において3つの追記マークが特定されているのであるか、上記ステップSA150の判定結果は“Yes”になり、ステップSA160〜ステップSA170の処理が実行されることになる。
Next, the
ステップSA150の判定結果が“Yes”である場合に後続して実行されるステップSA160においては、制御部200は、各追記マークについてその形状を表す特徴量を算出し、その特徴量が同一である追記マーク同士を同一の追記マークとして分類し、特徴量が互いに異なっていてもその乖離が所定の範囲内である追記マークを互いに類似する追記マークとして分類する。このステップSA160の処理が実行されることによって、本動作例においては、上記ステップSA110にて特定された3つの追記マークが、追記マークM01と追記マークM03のグループと、追記マークM02との2組に分類されることになる(図3(a)参照)。
In step SA160, which is subsequently executed when the determination result in step SA150 is “Yes”, the
上記ステップSA160に後続して実行されるステップSA170においては、制御部200は、上記ステップSA160にて同一又は類似する形状を有すると分類された追記マークの各々について、その追記マークに対応付けられていると上記ステップSA130にて特定された画像領域に配置されている画像を図5(a)に示すリスト形式のレイアウトにしたがって配置して得られる画像を表す画像データを生成し表示部220へ出力する。
以上が本実施形態に係る文書処理装置110が実行する編集処理である。
In step SA170 executed subsequent to step SA160,
The above is the editing process executed by the
以上に説明したように、本実施形態に係る文書処理装置110によれば、文書処理装置110の表示部220には、図5(b)に示す画像が表示されることになる。図5(b)に示す表示例では、処理対象の紙文書において、同一又は類似する形状を有する追記マーク毎に、その追記マークが対応付けられている領域の記載内容が並べて表示されている。前述したように、同一又は類似する形状を有する追記マークが付与されている領域の記載内容が関連性を有している可能性が高いことは前述した通りであるから、本実施形態に係る文書処理装置110によれば、紙文書に対して手書きで追記された文字や記号、図形などの追記マークに基づいて、互いに関連性を有すると推測される領域の記載内容を集めてユーザに判りやすく提示することをが可能になるといった効果を奏する。
As described above, according to the
(C:変形)
以上、本発明の1実施形態について説明したが、上述した実施形態を以下に述べるように変形しても良いことは勿論である。
(C−1:変形例1)
上述した実施形態では、画像読取装置120から引渡された文書画像データと原本画像データとを比較することによって、その原本画像データの表す原本に対して追記された事項を表す追記画像を文書処理装置110に抽出させる場合について説明した。しかしながら、画像読取装置から引渡された文書画像データを文書処理装置に解析させ、その文書画像データの表す画像のうち、原本を紙文書に印刷する際に利用される色として予め定められた色を表す画像以外の部分を追記画像として文書処理装置に抽出させるようにしても良い。このような態様によれば、例えば、原本がモノクロ印刷された紙文書に対して朱書きされた追記事項を、その原本を表す原本データとの比較を行うことなく、文書処理装置に抽出させることが可能になる。
(C: deformation)
Although one embodiment of the present invention has been described above, it is needless to say that the above-described embodiment may be modified as described below.
(C-1: Modification 1)
In the above-described embodiment, the document image data transferred from the
また、画像読取装置から引渡された文書画像データを文書処理装置に解析させ、その文書画像データの表す画像のうち、手書き文字や手書き図形を表す画像を追記画像として文書処理装置に抽出させるようにしても良い。このような態様によれば、例えば、活字などで印刷された紙文書に対して手書きで追記された事項を、その原本を表す原本データとの比較を行うことなく、文書処理装置に抽出させることが可能になる。また、原本の印刷に用いられている紙がアノトペーパであり、アノトペンにより追記がなされた場合には、そのアノトペンから出力されたデータに基づいてその追記事項およに追記位置を特定することも可能である。 Further, the document image data delivered from the image reading device is analyzed by the document processing device, and among the images represented by the document image data, an image representing a handwritten character or a handwritten figure is extracted as an additional image by the document processing device. May be. According to such an aspect, for example, the document processing apparatus can extract the items added by hand to a paper document printed in type without comparing with the original data representing the original. Is possible. In addition, if the paper used to print the original is Anoto Paper, and additional writing is performed with Anoto Pen, it is also possible to specify the additional writing position and the additional writing position based on the data output from the Anoto Pen. It is.
(C−2:変形例2)
上述した実施形態では、処理対象の紙文書が1頁で構成されている場合について説明した。しかしながら複数の頁から構成されている紙文書を本発明に係る文書処理装置の処理対象としても良いことは勿論である。このように処理対象の紙文書が複数の頁で構成されている場合には、その各頁の画像を表す画像データの各々について前述したステップSA110〜SA140の処理を実行するようにすれば良い。また、上述した実施形態では、各追記マークに対応付けられている領域が紙文書の原本に記載されていた事項を表す領域である場合について説明したが、追記マークとともに手書きされた記載内容を表す画像が配置される画像領域(以下、手書き領域)がその追記マークの近傍に位置しているなどその追記マークと所定の位置関係を有している場合には、その手書き領域がその追記マークに対応付けられていると特定しても良いことは勿論である。例えば、図6(a)に示すような3頁で構成されている紙文書について本発明に係る文書処理装置により追記事項の抽出を行い、その抽出結果をその文書処理装置に出力(例えば、その抽出結果の表示など)させると、図6(b)に示す画像が出力されることになる。
(C-2: Modification 2)
In the embodiment described above, the case where the paper document to be processed is composed of one page has been described. However, it is needless to say that a paper document composed of a plurality of pages may be processed by the document processing apparatus according to the present invention. In this way, when the paper document to be processed is composed of a plurality of pages, the processing in steps SA110 to SA140 described above may be executed for each piece of image data representing the image of each page. Further, in the above-described embodiment, the case where the area associated with each additional mark is an area representing an item described in the original of the paper document is described. If the image area where the image is placed (hereinafter referred to as the handwriting area) has a predetermined positional relationship with the additional mark, such as being located near the additional mark, the handwritten area becomes the additional mark. Of course, it may be specified that it is associated. For example, for a paper document composed of three pages as shown in FIG. 6 (a), an additional article is extracted by the document processing apparatus according to the present invention, and the extraction result is output to the document processing apparatus (for example, When the extraction result is displayed, the image shown in FIG. 6B is output.
より詳細に説明すると、図6(a)に示す紙文書においては、第1頁の第1段落B11には追記マークM11が手書きで付されており、余白の手書き領域C11には追記マークM12が手書きで付されている。また、第2頁の余白の手書き領域C21には追記マークM21が手書きで付されており、第3頁の余白の手書き領域C31には追記マークM31が手書きで付されている。なお、図6(a)を参照すれば明らかなように、追記マークM11と追記マークM31とは何れも英大文字“A”を表す追記マークであり、追記マークM12と追記マークM21とは英大文字“B”を表す追記マークである。 More specifically, in the paper document shown in FIG. 6A, the additional writing mark M11 is handwritten in the first paragraph B11 of the first page, and the additional writing mark M12 is added in the blank handwritten area C11. It is attached by hand. Further, a write-once mark M21 is handwritten in the margin handwritten region C21 on the second page, and a write-once mark M31 is handwritten in the marginal handwritten region C31 on the third page. As is clear from FIG. 6A, the additional recording mark M11 and the additional recording mark M31 are both additional recording marks representing the capital letter “A”, and the additional recording mark M12 and the additional recording mark M21 are uppercase letters. This is a postscript mark indicating “B”.
このような紙文書の各頁に対応する画像データについて前述したステップSA110〜SA140の処理が施される結果、図6(a)に示す紙文書については、追記マークM11と追記マークM31とは同一又は類似の形状を有する追記マークであると分類され、この追記マークM11に対応付けられている領域(すなわち、第1頁第1段落B11)と追記マークM31に対応付けられている領域(すなわち、第3頁余白の手書き領域C31)の記載内容を表す画像がその追記マークの画像と対応付けて並べて表示されることになる。一方、追記マークM12と追記マークM21とについても同一又は類似の形状を有する追記マークであると分類され、この追記マークM12に対応付けられている領域(すなわち、第1頁余白の手書き領域C11)と追記マークM21に対応付けられている領域(すなわち、第2頁余白の手書き領域C21)の記載内容を表す画像がその追記マークを表す画像と対応付けて並べて表示されることになる。その結果、図6(b)に示す画像が表示されることになる。 As a result of performing the above-described steps SA110 to SA140 on the image data corresponding to each page of the paper document, the additional mark M11 and the additional mark M31 are the same for the paper document shown in FIG. Alternatively, the region is classified as a postscript mark having a similar shape and is associated with the postscript mark M11 (ie, the first page, first paragraph B11) and the region associated with the postscript mark M31 (ie, An image representing the description content of the third page margin handwritten area C31) is displayed side by side in association with the image of the additional mark. On the other hand, the additional recording mark M12 and the additional recording mark M21 are also classified as additional recording marks having the same or similar shape, and are associated with the additional recording mark M12 (ie, the handwritten region C11 in the first page margin). And an image representing the description content of the area associated with the additional mark M21 (that is, the handwritten area C21 in the second page margin) are displayed in association with the image representing the additional mark. As a result, the image shown in FIG. 6B is displayed.
(C−3:変形例3)
上述した実施形態では、追記マークの近傍に位置する画像領域に配置される画像を被追記画像として特定する場合について説明した。しかしながら、第1の追記マークの近傍に位置する画像領域に配置される画像を、その第1の追記マークの近傍に位置する第2の追記マークに対する被追記画像として特定するようにしても良い。このようにすると、例えば、図7に示すように、引き出し線などの第1の追記マークM41の近傍に位置する第2の追記マークM42と、その第1の追記マークM41の近傍に位置する画像領域B41に配置される画像とを対応付けることが可能になる。
(C-3: Modification 3)
In the embodiment described above, a case has been described in which an image arranged in an image region located in the vicinity of the additional recording mark is specified as the additional recording image. However, an image arranged in an image region located in the vicinity of the first additional recording mark may be specified as an image to be recorded with respect to the second additional recording mark positioned in the vicinity of the first additional recording mark. In this case, for example, as shown in FIG. 7, the second additional recording mark M42 located near the first additional recording mark M41 such as a lead line and the image positioned near the first additional recording mark M41. It is possible to associate the image arranged in the region B41.
(C−4:変形例4)
上述した実施形態では、本発明に係る文書処理装置に特有な機能を制御部200に実現させるためのソフトウェアを不揮発性記憶部240bに予め格納しておく場合について説明した。しかしながら、例えばCD−ROM(Compact Disk- Read Only Memory)やDVD(Digital Versatile Disk)などのコンピュータ装置読み取り可能な記録媒体に、上記ソフトウェアを記録しておき、このような記録媒体を用いて一般的なコンピュータ装置に上記ソフトウェアをインストールするとしても良いことは勿論である。このようにすると、一般的なコンピュータ装置に、本発明に係る文書処理装置と同一の機能を付与することが可能になる、といった効果を奏する。
(C-4: Modification 4)
In the above-described embodiment, the case has been described in which the software for causing the
10…文書処理システム、110…文書処理装置、120…画像読取装置、130…通信線、200…制御部、210…通信IF部、220…表示部、230…操作部、240…記憶部、240a…揮発性記憶部、240b…不揮発性記憶部、250…バス。
DESCRIPTION OF
Claims (5)
前記入力手段へ入力された文書画像データを解析し、その文書画像データの表す文書の原本に対して手書きで追記された追記マークを特定する第1の特定手段と、
前記第1の特定手段により特定された追記マークの各々について、その追記マークが対応付けられている前記文書画像データの画像領域を特定する第2の特定手段と、
前記第1の特定手段により複数の追記マークが特定された場合に、各追記マークの形状を解析して、同一又は類似する形状を有する追記マーク毎に分類する分類手段と、
前記分類手段により同一又は類似する形状を有すると分類された追記マークの各々について、その追記マークに対応付けられていると前記第2の特定手段により特定された画像領域に配置されている画像を所定のレイアウトにしたがって配置して出力する出力手段と
を有する文書処理装置。 Input means for inputting document image data obtained by digitizing a paper document;
Analyzing the document image data input to the input means, and a first specifying means for specifying an additional mark added by hand writing on the original document represented by the document image data;
Second specifying means for specifying an image area of the document image data associated with the additional mark for each additional mark specified by the first specifying means;
When a plurality of additional marks are specified by the first specifying means, the shape of each additional mark is analyzed, and classification means for classifying each additional mark having the same or similar shape;
For each additional mark classified as having the same or similar shape by the classifying means, an image arranged in the image area specified by the second specifying means is associated with the additional mark. A document processing apparatus comprising: output means arranged and output according to a predetermined layout.
前記入力手段へ入力された文書画像データとその文書画像データの表す紙文書の原本を表す原本画像データとを比較して、前記追記マークを特定する
ことを特徴とする請求項1に記載の文書処理装置。 The first specifying means includes:
2. The document according to claim 1, wherein the additional mark is specified by comparing the document image data input to the input means with original image data representing an original of a paper document represented by the document image data. Processing equipment.
前記入力手段へ入力された文書画像データの表す画像の色とその文書画像データの表す紙文書の原本の色との差に基づいて、前記追記マークを特定する
ことを特徴とする請求項1に記載の文書処理装置。 The first specifying means includes:
The additional mark is specified based on a difference between an image color represented by the document image data input to the input unit and an original color of the paper document represented by the document image data. The document processing apparatus described.
追記マークの形状を解析してその特徴量を算出し、算出された特徴量が同一である追記マーク同士を同一の形状を有する追記マークとして分類する一方、算出された特徴量の乖離が所定の範囲内である追記マーク同士を互いに類似する追記マークとして分類する
ことを特徴とする請求項1に記載の文書処理装置。 The classification means includes
Analyzing the shape of the write-once mark and calculating its feature value, classifying the write-once marks that have the same calculated feature amount as write-once marks having the same shape, while the calculated feature amount has a predetermined divergence The document processing apparatus according to claim 1, wherein the recordable marks within the range are classified as similar recordable marks.
紙文書を電子化して得られる文書画像データを解析し、その文書画像データの表す文書の原本に対して手書きで追記された追記マークを特定する第1のステップと、
前記第1のステップにて特定された追記マークの各々について、その追記マークが対応付けられている前記文書画像データの画像領域を特定する第2のステップと、
前記第1のステップにて複数の追記マークが特定された場合に、各追記マークの形状を解析して、同一又は類似する形状を有する追記マーク毎に分類する第3のステップと、
前記第3のステップにて同一又は類似する形状を有する追記マークを表すと分類された追記マークの各々について、その追記マークに対応付けられていると前記第2のステップにて特定された画像領域に配置されている画像を所定のレイアウトにしたがって配置して出力する第4のステップと
を実行させるプログラム。 Computer equipment,
A first step of analyzing document image data obtained by digitizing a paper document and identifying an additional mark added by hand to the original document represented by the document image data;
A second step of specifying an image area of the document image data associated with the additional mark for each additional mark specified in the first step;
When a plurality of additional marks are specified in the first step, a third step of analyzing the shape of each additional mark and classifying each additional mark having the same or similar shape;
The image area specified in the second step when each of the additional marks classified as representing the additional mark having the same or similar shape in the third step is associated with the additional mark. A program that executes a fourth step of arranging and outputting the image arranged in accordance with a predetermined layout.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005118135A JP2006301695A (en) | 2005-04-15 | 2005-04-15 | Document processing device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005118135A JP2006301695A (en) | 2005-04-15 | 2005-04-15 | Document processing device and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006301695A true JP2006301695A (en) | 2006-11-02 |
Family
ID=37469952
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005118135A Pending JP2006301695A (en) | 2005-04-15 | 2005-04-15 | Document processing device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006301695A (en) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009098763A (en) * | 2007-10-15 | 2009-05-07 | Hitachi Ltd | Handwritten annotation management apparatus and interface |
JP2009157754A (en) * | 2007-12-27 | 2009-07-16 | Pfu Ltd | Drawing information management device, drawing information management method, and program |
JP2012512444A (en) * | 2008-12-17 | 2012-05-31 | トムソン ライセンシング | Data management apparatus, data management method, and data management program |
JP2012151722A (en) * | 2011-01-20 | 2012-08-09 | Murata Mach Ltd | Image processor, image processing system, image processing method and program |
JP2012208898A (en) * | 2011-03-30 | 2012-10-25 | Sony Corp | Information processor, play list generating method and play list generating program |
JP2014026302A (en) * | 2012-07-24 | 2014-02-06 | Casio Comput Co Ltd | Information processing device and program |
JP2015026927A (en) * | 2013-07-25 | 2015-02-05 | ブラザー工業株式会社 | Image processing device and image processing program |
US9285984B2 (en) | 2012-07-24 | 2016-03-15 | Casio Computer Co., Ltd | Information processing apparatus and computer readable medium |
JP2016164797A (en) * | 2016-04-18 | 2016-09-08 | カシオ計算機株式会社 | Information processing device and program |
-
2005
- 2005-04-15 JP JP2005118135A patent/JP2006301695A/en active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009098763A (en) * | 2007-10-15 | 2009-05-07 | Hitachi Ltd | Handwritten annotation management apparatus and interface |
JP2009157754A (en) * | 2007-12-27 | 2009-07-16 | Pfu Ltd | Drawing information management device, drawing information management method, and program |
JP2012512444A (en) * | 2008-12-17 | 2012-05-31 | トムソン ライセンシング | Data management apparatus, data management method, and data management program |
JP2012151722A (en) * | 2011-01-20 | 2012-08-09 | Murata Mach Ltd | Image processor, image processing system, image processing method and program |
US9081759B2 (en) | 2011-01-20 | 2015-07-14 | Murata Machinery Ltd. | Image processing apparatus, image processing system and image processing method |
JP2012208898A (en) * | 2011-03-30 | 2012-10-25 | Sony Corp | Information processor, play list generating method and play list generating program |
JP2014026302A (en) * | 2012-07-24 | 2014-02-06 | Casio Comput Co Ltd | Information processing device and program |
US9285984B2 (en) | 2012-07-24 | 2016-03-15 | Casio Computer Co., Ltd | Information processing apparatus and computer readable medium |
US9536140B2 (en) | 2012-07-24 | 2017-01-03 | Casio Computer Co., Ltd | Information processing apparatus and computer readable medium |
JP2015026927A (en) * | 2013-07-25 | 2015-02-05 | ブラザー工業株式会社 | Image processing device and image processing program |
JP2016164797A (en) * | 2016-04-18 | 2016-09-08 | カシオ計算機株式会社 | Information processing device and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2006301695A (en) | Document processing device and program | |
US7703001B2 (en) | Media storing a program to extract and classify annotation data, and apparatus and method for processing annotation data | |
US8213717B2 (en) | Document processing apparatus, document processing method, recording medium and data signal | |
US8508756B2 (en) | Image forming apparatus having capability for recognition and extraction of annotations and additionally written portions | |
US20070070473A1 (en) | Image display device, image display method, computer program product, and image display system | |
JP4311365B2 (en) | Document processing apparatus and program | |
JP2010157107A (en) | Business document processor | |
JP2008145611A (en) | Information processor and program | |
JP2007004621A (en) | Document management supporting device, and document management supporting method and program | |
US9277094B2 (en) | Image processing apparatus and recording medium | |
JP2020037228A (en) | Information processing apparatus and information processing program | |
JP2006221569A (en) | Document processing system, document processing method, program, and storage medium | |
JP4682747B2 (en) | Document processing apparatus, rule data generation method and program | |
US7844138B2 (en) | History control apparatus | |
JP4807618B2 (en) | Image processing apparatus and image processing program | |
US20070229856A1 (en) | Printer apparatus, printing method, and printer system | |
JP4518212B2 (en) | Image processing apparatus and program | |
JP2006270589A (en) | Information processing device, information processing method, program, and recording medium | |
JP4517822B2 (en) | Image processing apparatus and program | |
JP4501731B2 (en) | Image processing device | |
JP4682663B2 (en) | Document processing device | |
US20100134849A1 (en) | Image processing apparatus, image processing method and computer readable medium | |
JP7404943B2 (en) | Information processing device and information processing program | |
JP2001005831A (en) | Filing method and recording medium storing the method | |
JP2006268792A (en) | Apparatus and method for image processing |