JP2007004621A - Document management supporting device, and document management supporting method and program - Google Patents
Document management supporting device, and document management supporting method and program Download PDFInfo
- Publication number
- JP2007004621A JP2007004621A JP2005185575A JP2005185575A JP2007004621A JP 2007004621 A JP2007004621 A JP 2007004621A JP 2005185575 A JP2005185575 A JP 2005185575A JP 2005185575 A JP2005185575 A JP 2005185575A JP 2007004621 A JP2007004621 A JP 2007004621A
- Authority
- JP
- Japan
- Prior art keywords
- sticky note
- area
- sticky
- image data
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
- Processing Or Creating Images (AREA)
- Image Processing (AREA)
Abstract
Description
本発明は、文書を電子化および加工する技術に関し、特に紙付箋が貼り付けられた文書を電子化および加工する技術に関する。 The present invention relates to a technique for digitizing and processing a document, and more particularly to a technique for digitizing and processing a document on which a paper sticky note is attached.
文書内の注釈や、注意を促すための文章などを電子的に読み取って、処理や加工ができるとデータの再利用時、例えばファイリングや文書の検索に便利である。
特許文献1には、読み取った原稿からタイトルを抽出して、抽出したタイトルを付箋として印刷する技術が開示されている。
一方、注釈や、注意を促すために紙付箋を貼り付けた原稿が多くある。このような原稿は、一旦電子的に読み込みを行うと、紙付箋が貼られた状態の一枚の画像として読み込まれてしまうため、後から紙付箋を移動させたり、色を変えたりするような処理を行うことができなくなってしまう。上述の特許文献1の技術においては、タイトルを元に付箋として印刷することはできるが、付箋の処理や加工はできなかった。そこで、紙付箋が貼られている原稿を読み取った跡に、付箋部分に対して単独に且つ簡単に加工処理ができる装置の開発が望まれていた。
On the other hand, there are many manuscripts with paper sticky notes attached for annotation and attention. Once such a document has been electronically read, it will be read as a single image with a paper sticky note attached, so that the paper sticky note may be moved or changed in color later. Processing cannot be performed. In the technique of the above-mentioned
本発明はこのような事情に鑑みてなされたものであり、その目的は、付箋が添付された電子文書から付箋の外形を識別し、オリジナル原稿の画像を維持しつつ、付箋を加工することができる文書管理支援装置を提供することにある。 The present invention has been made in view of such circumstances, and its purpose is to identify the outline of a sticky note from an electronic document attached with a sticky note and process the sticky note while maintaining the image of the original document. An object of the present invention is to provide a document management support device that can be used.
上記課題を解決するために、本発明は、用紙の画像を読み取って、画像データを生成する入力手段と、紙付箋の画像の特徴を記憶する特徴記憶手段と、前記入力手段により生成されたされた画像データから、前記特徴記憶手段に記憶されている紙付箋の特徴を元に、前記用紙に添付された紙付箋の輪郭を示す付箋領域を抽出する付箋領域抽出手段と、前記付箋領域抽出手段により抽出された付箋領域の画像データから該付箋領域の属性を表す第1付箋情報を取得する第1付箋情報取得手段と、前記付箋領域抽出手段により抽出された付箋領域内の画像データに文字認識処理を施し、付箋領域内の文字列を第2付箋情報として取得する第2付箋情報取得手段と、前記第1付箋情報取得手段が取得した第1付箋情報と、前記第2付箋情報が取得した第2付箋情報とを関連づけて記憶する付箋情報記憶手段とを具備する文書管理支援装置を提供する。 In order to solve the above problems, the present invention provides an input unit that reads an image of a sheet and generates image data, a feature storage unit that stores a feature of an image of a paper sticky note, and an input unit that is generated by the input unit. A sticky note area extracting unit for extracting a sticky note region indicating an outline of a paper sticky note attached to the paper based on the feature of the paper sticky note stored in the feature storing unit, and the sticky note region extracting unit. First sticky information acquisition means for acquiring first sticky note information representing the attribute of the sticky note area from the image data of the sticky note area extracted by the above, and character recognition for the image data in the sticky note area extracted by the sticky note area extracting means. The second sticky information acquisition means for performing processing and acquiring the character string in the sticky note area as the second sticky information, the first sticky information acquired by the first sticky information acquisition means, and the second sticky information are acquired. Providing document management support apparatus comprising a tag information storing means for storing in association with the second tag information.
この文書管理支援装置によれば、予め紙付箋の特徴が記憶されているので、その記憶されている特徴を元に、文字や絵などが記載された文書を表す画像データから、紙付箋の領域(付箋領域)を抽出することができる。さらに、抽出した付箋領域の属性が記憶されると共に、抽出した付箋領域に文字認識処理を施すことによって生成したテキストデータも記憶される。これらの情報、つまり、付箋領域の属性及びテキストデータは関連づけて記憶されるため、文書に添付された付箋が複数であっても、それぞれの付箋領域における付箋情報の関連性を維持できる。 According to this document management support apparatus, since the features of paper sticky notes are stored in advance, an area of a paper sticky note is obtained from image data representing a document on which characters, pictures, etc. are written based on the stored features. (Sticky note area) can be extracted. Further, attributes of the extracted sticky note area are stored, and text data generated by performing character recognition processing on the extracted sticky note area is also stored. Since these pieces of information, that is, the attribute of the sticky note area and the text data are stored in association with each other, even if there are a plurality of sticky notes attached to the document, the relevance of the sticky note information in each sticky note area can be maintained.
本発明の好ましい態様においては、前記付箋領域抽出手段は、エッジ検出処理により矩形領域を特定する矩形領域特定手段と、前記矩形領域特定手段により特定された前記矩形領域において、前記特徴記憶手段に記憶されている紙付箋の特徴と一致する矩形領域を付箋領域と特定する矩形付箋領域特定手段とを含むようにしてもよい。 In a preferred aspect of the present invention, the sticky note area extracting means stores the rectangular area specifying means for specifying a rectangular area by edge detection processing and the feature storage means in the rectangular area specified by the rectangular area specifying means. A rectangular sticky note area specifying unit that specifies a rectangular area that matches the feature of the paper sticky note as the sticky note area may be included.
また、別の好ましい態様においては、前記付箋領域抽出手段は、前記画像データから、注目領域を順次特定する注目領域特定手段と、前記注目領域特定手段により特定された各注目領域内において、隣り合う2つの文字の間の距離を当該2つの文字列の組毎に求め、求めた各距離のばらつきの程度が所定の範囲を超えるか否かを判断する判断手段と、前記判断手段による判断結果が、所定の範囲を超えると判断された前記各注目領域において、前記特徴記憶手段に記憶されている紙付箋の特徴と一致する注目領域を付箋領域と特定する注目付箋領域特定手段とを含むようにしてもよい。 In another preferred embodiment, the sticky note area extracting means is adjacent to the attention area specifying means for sequentially specifying the attention area from the image data, and within each attention area specified by the attention area specifying means. A distance between two characters is determined for each set of the two character strings, and a determination unit that determines whether or not the degree of variation in the calculated distances exceeds a predetermined range; The attention area determined to exceed a predetermined range includes attention sticky area specifying means for specifying the attention area that matches the feature of the paper sticky note stored in the feature storage means as the sticky area. Good.
また、前記特徴記憶手段に記憶されている紙付箋の画像の特徴は、予め規定された色又は大きさであるとしてもよい。紙付箋の特徴は、色又は大きさによって表すことができるため、これらの情報を元にすることで、画像データから紙付箋の領域を抽出することができる。また、前記付箋領域の属性は前記付箋領域の色、位置及び大きさのうち少なくともいずれか1つであるとしてもよい。付箋領域の画像データは、色、位置及び大きさによって特定することができるため、これらを第1付箋情報とすることにより、この第1付箋情報を元に画像データから付箋領域を特定することができる。 The feature of the image of the paper sticky note stored in the feature storage means may be a color or size defined in advance. Since the feature of the paper sticky note can be expressed by color or size, the area of the paper sticky note can be extracted from the image data based on such information. The attribute of the sticky note area may be at least one of the color, position, and size of the sticky note area. Since the image data of the sticky note area can be specified by color, position and size, the sticky note area can be specified from the image data based on the first sticky note information by using these as the first sticky note information. it can.
また、前記付箋領域の属性は、少なくとも位置および大きさを含み、前記付箋情報記憶手段に記憶されている第1付箋情報のうちの少なくとも位置及び大きさから付箋画像データを生成し、前記入力手段が生成した画像データと共に付箋画像データを表示する表示手段を具備するようにしてもよい。 The attribute of the sticky note area includes at least a position and a size, and generates sticky image data from at least a position and a size of the first sticky note information stored in the sticky note information storage unit, and the input unit Display means for displaying the sticky note image data together with the image data generated by may be provided.
さらに、操作者によって操作される操作手段と、前記操作手段の操作内容に基づいて前記付箋画像データの表示態様を指定する指定手段と、前記指定手段によって指定された制御内容が前記付箋画像データの移動である場合、前記指定手段によって選択された前記付箋画像データを移動して前記表示手段に表示することを制御する付箋描画制御手段とを具備するようにしてもよい。 Furthermore, an operation means operated by an operator, a designation means for designating a display mode of the sticky image data based on the operation content of the operation means, and a control content designated by the designation means includes the tag image data In the case of movement, a sticky note drawing control means for controlling the sticky note image data selected by the specifying means to be moved and displayed on the display means may be provided.
また、本発明は、用紙の画像を読み取って画像データを生成する第1のステップと、前記第1のステップにより生成された画像データから、予め記憶された紙付箋の画像の特徴を元に、前記用紙に添付された紙付箋の輪郭を示す付箋領域を抽出する第2のステップと、前記第2のステップにより抽出された付箋領域の画像データから該付箋領域の属性を表す第1付箋情報を取得する第3のステップと、第3のステップにより抽出された付箋領域内の画像データに文字認識処理を施し、付箋領域内の文字列を第2付箋情報として取得する第4のステップと、第3のステップにより取得した第1付箋情報と、第4のステップにより取得した第2付箋情報とを関連づけて記憶する第5のステップとを具備する文書管理支援方法を提供する。
According to the present invention, a first step of reading an image of a sheet to generate image data, and an image data generated by the first step, based on the characteristics of an image of a paper sticky note stored in advance, A second step of extracting a sticky note region indicating the outline of the paper sticky note attached to the paper, and first sticky note information representing the attribute of the sticky note region from the image data of the sticky note region extracted in the second step. A third step of acquiring, a fourth step of performing character recognition processing on the image data in the sticky note area extracted in the third step, and acquiring a character string in the sticky note region as second sticky note information; There is provided a document management support method comprising a fifth step of storing the first sticky note information obtained in
また、本発明は、コンピュータを、用紙の画像を読み取って画像データを生成する入力手段と、紙付箋の画像の特徴を記憶する特徴記憶手段と、前記入力手段により生成された画像データから、前記特徴記憶手段に記憶されている紙付箋の特徴を元に、前記用紙に添付された紙付箋の輪郭を示す付箋領域を抽出する付箋領域抽出手段と、前記付箋領域抽出手段により抽出された付箋領域の画像データから該付箋領域の属性を表す第1付箋情報を取得する第1付箋情報取得手段と、前記付箋領域抽出手段により抽出された付箋領域内の画像データに文字認識処理を施し、付箋領域内の文字列を第2付箋情報として取得する第2付箋情報取得手段と、前記第1付箋情報取得手段が取得した第1付箋情報と、前記第2付箋情報が取得した第2付箋情報とを関連づけて記憶する付箋情報記憶手段として機能させるプログラムを提供する。 Further, according to the present invention, an input unit that reads a paper image to generate image data, a feature storage unit that stores a feature of a paper sticky note image, and an image data generated by the input unit are used as the computer. Based on the features of the paper sticky notes stored in the feature storage means, a sticky note area extracting means for extracting a sticky note area indicating the outline of the paper sticky notes attached to the paper, and a sticky note area extracted by the sticky note area extracting means First sticky information obtaining means for obtaining first sticky note information representing the attribute of the sticky note area from the image data, and performing character recognition processing on the image data in the sticky note area extracted by the sticky note area extracting means, Second sticky information acquisition means for acquiring the character string in the first sticky information, first sticky information acquired by the first sticky information acquisition means, and second sticky information acquired by the second sticky information. Providing a program to function as a tag information storing means for storing in association with and.
以下、本発明の実施形態について図面を用いて詳細に説明する。なお、以下の説明においては、矩形の付箋が原稿の上下の辺に対してほぼ平行に添付されている原稿を処理の対象とする。
図1は、本発明に係る文書管理支援装置の1実施形態である文書管理支援システム1の構成例を示すブロック図である。図1の画像読取装置10は、自動給紙機能であるADF(Auto Document Feeder)を備えており、ユーザはADFを利用することにより複数枚の原稿を一枚ずつ自動的に、原稿読み取り位置まで搬送させてスキャンを行うことができる。このとき、画像読取装置10は、原稿に対応した大きさでスキャンを行う。
また、画像読取装置10はフラッドベッドスキャナ(FBS)と呼ばれる機能を備えており、このFBS機能により、ユーザは原稿読み取り位置にセットした原稿をどの大きさでスキャンするかの指定を行うことができる。そして、画像読取装置10は指定された大きさで、セットされた原稿をスキャンする。すなわち、ユーザは、紙付箋が原稿からはみ出して貼付された原稿を読み取る場合であっても、紙付箋を含めた大きさで原稿を読み取る指示を行うことができる。
画像読取装置10は、ADF、又はFBSによって光学的に読み取った紙文書の画像に対応する画像データを通信線12を介して文書管理支援装置20に転送する。通信線12はLAN(Local Area Network)、WAN(Wide Area Network)、インターネットなどを用いることができるが、本実施形態においては、通信線12としてLANを用いている。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In the following description, a document in which a rectangular tag is attached substantially parallel to the upper and lower sides of the document is assumed to be processed.
FIG. 1 is a block diagram showing a configuration example of a document
The
The
図2は、文書管理支援装置20のハードウェア構成を示すブロック図である。
制御部21は、例えばCPU(Central Processing Unit)であり、記憶部25に格納されている各種ソフトウェアを実行することによって、文書管理支援装置20の各部を制御する。通信IF(Inter Face)部22は通信線12を介して画像読取装置10に接続されており、この通信線12を介して画像読取装置10から送信される画像データを受け取り、制御部21に転送する。
FIG. 2 is a block diagram illustrating a hardware configuration of the document
The
表示部23は、例えば液晶ディスプレイとその駆動回路であり、制御部21から転送されたデータに応じた画像を表示する。操作部24は、例えば、複数の操作子(図示省略)を備えたキーボードおよびマウス等であり、それら操作子の操作内容に応じたデータ(以下、操作内容データ)を制御部21へ供給する。
The
記憶部25は、揮発性記憶部25a、不揮発性記憶部25bを含んでいる。揮発性記憶部25aは、例えばRAM(Random Access Memory)であり、制御部21のワークエリアとして利用される。不揮発性記憶部25bは、例えばハードディスクである。不揮発性記憶部25bには図3に示したRGB値テーブルT1が格納されている。RGB値テーブルT1は紙付箋の色値をR(レッド)G(グリーン)B(ブルー)各色3バイト(24ビット)で表したテーブルである。また、不揮発性記憶部25bには、制御部21にOS(Operating System)を実行させるためのOSソフトウェア、画像読取装置10から送信される画像データを解析して紙付箋の輪郭で囲まれた部分(以下、付箋領域という)の抽出等を実行させるための解析処理プログラムが格納されている。加えて、不揮発性記憶部25bには、付箋領域の色や位置を表す情報(以下、付箋情報という)を記憶した付箋情報テーブルT2が格納される。
以上説明した要素はバス26によって接続されている。
The
The elements described above are connected by a
以下、制御部21が図4に示した紙付箋31、32(ここでは黄色の紙付箋を想定する)および紙付箋33(ここではライム色の紙付箋を想定する)が添付された原稿30に対して、画像データの解析処理を行う場合を図4乃至図7を用いて説明する。
文書管理支援装置20の電源(図示略)が投入されると、制御部21は、まず、OSソフトウェアを不揮発性記憶部25bから読み出す。そしてユーザの指示により上記解析処理プログラムの実行が指示されると、制御部21は上記解析処理プログラムを不揮発性記憶部25bから読み出す。
次に、制御部21は、画像読取装置10からの解析処理対象となる画像データの転送を待ち受ける。
Hereinafter, the
When the power (not shown) of the document
Next, the
一方、ユーザが画像読取装置10に原稿30をセットし、所定の操作を行うと、原稿30が画像読取装置10によって読み取られ、その原稿30に対応する画像データが通信線12を介して画像読取装置10から文書管理支援装置20へ送られる。
On the other hand, when the user sets the original 30 on the
制御部21は、画像読取装置10から送られた画像データを通信IF部22を介して受け取る(ステップSA10)。このとき受け取った画像データには各画素におけるRGB値が含まれる。制御部21は、この画像データの各画素におけるRGB値と不揮発性記憶部25bに格納されているRGB値テーブルT1の値とを比較し、付箋領域を抽出する(ステップSA12)。つまり、各画素を横方向、縦方向の各々に走査し、RGB値テーブルT1のRGB値が所定数連続して検出された範囲を付箋領域として抽出する。図4に示す例では、紙付箋31〜33に対応して付箋領域31a〜33aが抽出される。
The
そして抽出したそれぞれの付箋領域の色、位置及び大きさを検出し、これらを付箋情報として図6に示した付箋情報テーブルT2に記憶する(ステップSA14)。ここで付箋情報テーブルT2の「番号」は1つ1つの付箋領域を識別する識別番号であり、「RGB値」は各付箋領域の色を示すRGB値である。「位置」は原稿画像の左上端を原点としたときの基準点(付箋領域の左上頂点)のx,y座標であり、「大きさ」は基準点から延びる2つの辺の長さ(短辺、長辺)である。 Then, the color, position and size of each extracted sticky note area are detected and stored as sticky note information in the sticky note information table T2 shown in FIG. 6 (step SA14). Here, “number” in the tag information table T2 is an identification number for identifying each tag region, and “RGB value” is an RGB value indicating the color of each tag region. “Position” is the x and y coordinates of the reference point (upper left vertex of the sticky note area) when the upper left corner of the document image is the origin, and “Size” is the length (short side) of two sides extending from the reference point , Long side).
続いて、制御部21は画像データにレイアウト解析、OCR処理を施し、原稿30を表す画像データ内の文字列をテキストデータにする(ステップSA16)。次に、制御部21は付箋情報テーブルT2内の各付箋情報からそれぞれの付箋領域の位置及び大きさを読み出し、読み出した位置及び大きさが示す範囲と、ステップSA16において生成したテキストデータの範囲とを比較し、各付箋領域内にあるテキストデータを抽出して、対応する付箋情報テーブルT2の「テキストデータ」フィールドに格納する(ステップSA18)。図6に示す例においては、「番号」フィールドの「1」、「3」に対応する付箋領域から文字(手書き文字)が抽出され、それらの付箋領域に対応する「テキストデータ」のフィールドには、それぞれ抽出された文字である「特になし」、「復元について調査必要」のテキストデータがそれぞれ格納されている。また、「番号」フィールドの「2」に対応する付箋領域からは文字が抽出されないため、この付箋領域に対応する「テキストデータ」のフィールドにテキストデータは何も格納されていない。
Subsequently, the
以上のような動作を行った後、制御部21は原稿30を表す画像を表示部23に表示する(ステップSA20)。このとき、制御部21は、付箋情報テーブルT2に格納してある付箋情報を読み出し、読み出した付箋情報を元に付箋画像31b乃至33bを生成して表示する。図7は制御部21が表示部23に表示する画像を示した図である。図に示したように制御部21は、文書30の原稿の画像と同一の画像を表示部23に表示する。
After performing the operation as described above, the
次に、ユーザによる操作に応じて、表示部23に表示している付箋画像31b乃至33b(図7参照)を編集する場合について図8および図9を用いて説明する。
まず、例えば操作部24のマウス等によって、付箋画像31b乃至33bのいずれかが選択されると(ステップSB10)、制御部21は選択された付箋画像の輪郭を点線で表示する(ステップSB12)。以下の説明においては、付箋画像31bがユーザによって選択された場合について説明する。すなわち、制御部21は、マウス等によって操作されるポインタが、付箋画像31bの領域に位置し、この状態でマウスボタンがクリックされたことを検出すると、付箋画像31bの輪郭を点線表示する。そして、ポインタが移動され、移動後の位置で再びマウスボタンがクリックされると、制御部21は、付箋情報テーブルT2の付箋画像31bに対応する付箋情報のRGB値、大きさ及びテキストデータを参照して付箋描画画像31cを生成し(ステップSB14)、このときのポインタの位置を基準位置として、生成した付箋描画画像31cを描画する(ステップSB16)。
Next, a case where the
First, for example, when any one of the
次に、制御部21は、移動元となった付箋画像31bの内部に、例えば灰色などの薄い色で「ふせん」のテキストデータの文字列を表示する(ステップSB18)。具体的には、制御部21は予め記憶されている「ふせん」のテキストデータ及び図3に示したRGB値テーブルから灰色のRGB値を読み出し、読み出したこれらの情報を元に生成した文字列を表示する。これにより、ステップSB12において点線で表示した付箋画像の輪郭内に「ふせん」の文字列が表示される。
Next, the
以上説明したように、本実施形態においては、予め記憶された紙付箋の特徴を元に画像から付箋領域を抽出し、抽出した付箋領域の色、位置、大きさおよび付箋領域内のテキストデータを関連づけて記憶し、それらの付箋情報を元に生成した付箋画像を表示する。そのため、付箋を含んだ元の原稿と同じ画像を表示することができる。また、記憶した付箋情報を元に、付箋画像の表示態様を変更することができるため、原稿の画像を視認したユーザは画像上において付箋画像の位置の変更などを行うことができる。さらに、付箋画像の位置変更を示す制御が指示された場合、元の付箋画像を矩形表示等によって表示するため、ユーザは付箋画像を移動した後であっても、移動した付箋画像の元の位置を把握することができる。すなわち、原稿のオリジナリティを保ち、且つユーザの指示に応じた画像データの編集を行うことができる。 As described above, in the present embodiment, a sticky note area is extracted from an image based on characteristics of a paper sticky note stored in advance, and the color, position, size, and text data in the sticky note area of the extracted sticky note area are determined. A tag image generated based on the tag information is displayed in association with each other. Therefore, the same image as the original document including the sticky note can be displayed. Further, since the display mode of the sticky note image can be changed based on the stored sticky note information, the user who visually recognizes the image of the original can change the position of the sticky note image on the image. Further, when control indicating the position change of the sticky note image is instructed, the original sticky note image is displayed in a rectangular display or the like, so that even after the user moves the sticky note image, the original position of the moved sticky note image is displayed. Can be grasped. That is, the originality of the original can be maintained and the image data can be edited according to the user's instruction.
[変形例]
(1)なお、本実施形態においては、付箋情報テーブルT2に格納された付箋情報に基づいて、原稿30を表示部23に再現表示する場合を示したが、特定の付箋については、所定の変換を行って表示するようにしてもよい。例えば、付箋領域内にテキストデータがある付箋画像はダークグレイに変換して表示する等である。具体的には、制御部21は図5に示したフローチャートのステップSA20において画像を表示する際、付箋情報テーブルT2(図6参照)の「テキストデータ」にテキストデータが格納されている付箋画像データについては、該付箋領域に該当する付箋情報から位置及び大きさ、そして図3に示したRGB値テーブルT1からRGB値(ダークグレイ)を読み出し、これらの付箋情報を元に灰色付箋画像を生成する。そして生成した灰色付箋画像を表示する。このようにすることで、複数の色の紙付箋が添付された原稿であっても、テキストデータがある付箋画像を同一の色で表示するため、紙付箋の表示に一貫性を与えることができる。すなわち、付箋の重要度等、ユーザの情報把握を援助することができる。
[Modification]
(1) In the present embodiment, the case where the
(2)また、各付箋画像のRGB値を所定のRGB値に変換して生成した付箋画像を表示するようにしても良い。このとき、図10に示した色変換テーブルT3を不揮発性記憶部25bに格納しておく。色変換テーブルT3は「元の色」フィールドと「変換後」フィールドによって構成される。制御部21は付箋画像データのRGB値に一致する「元の色」フィールドのRGB値を検索し、そのRGB値に関連して格納されている「変換後」フィールドのRGB値を読み出す。そして、読み出したRGB値を元に生成した付箋画像を表示するようにする。このようにすることで、例えば、紙付箋によってはそのままの色で画像として表示すると薄い(例えば黄色)、濃い(例えば赤)等で見づらい紙付箋が添付されている場合においても、ユーザにとって視認しやすい色で表示することができる。
(2) Alternatively, a tag image generated by converting the RGB value of each tag image into a predetermined RGB value may be displayed. At this time, the color conversion table T3 shown in FIG. 10 is stored in the nonvolatile storage unit 25b. The color conversion table T3 includes an “original color” field and an “after conversion” field. The
(3)また、本実施形態においては、制御部21が、付箋領域の抽出は画像データの各画素におけるRGB値とRGB値テーブルT1の値とを比較することにより行う場合を示したが、エッジ検出処理(例えばsobel処理)によって矩形領域を特定し、特定した矩形領域の大きさとRGB値とから付箋領域を特定するようにしてもよい。具体的には、不揮発性記憶部25bに紙付箋の大きさを示すサイズテーブルを格納しておく。そして、制御部21は画像データの各画素の画素値において2次微分を行い、画素内における濃度変化を算出する。続いて、算出した濃度変化が同一である一連の画素において、その一連の画素が矩形を呈している画素群を特定領域とする。そして、特定領域において、その大きさがサイズテーブルに格納されている値と同一であり、特定領域内の画素のRGB値がRGB値テーブルT1と同一である特定領域を付箋領域として抽出する。
(3) In the present embodiment, the
(4)また、黒画素の並びの幅から手書領域を特定し、特定した領域内のRGB値とRGB値テーブルT1の値とを比較することによって付箋領域を特定するようにしてもよい。具体的には、図11(a)に示した紙付箋41が添付された原稿40に対して画像データの解析処理を行う場合、制御部21は、角画素を横方向に操作する。そして、隣り合う2つの文字の間の距離、即ち、連続する黒画素以外の画素の並びの幅が、所定値Xよりも小さかったとき、それらの画素を黒画素に置き換える。この所定値Xは、隣りにある文字との距離として想定される値と概ね一致させる。同様に、制御部21は、各画素を縦方向にも走査し、連続する黒画素以外の画素の並びの幅が所定値Yよりも小さかったとき、それらの連続する画素のRGB値を揮発性記憶部25aに記憶すると共に、それらの画素を黒画素に置き換える。このとき、所定値Yは、文字行の間隔として想定される値と概ね一致させる。この結果、黒画素で塗り潰された領域が形成される。図11(b)は、文書40の画像に上述の置き換え処理を施した状態を示すものである。この図では、黒画素で塗り潰された領域L1乃至L3が形成されている。
(4) Alternatively, the handwritten area may be specified from the width of the arrangement of black pixels, and the tag area may be specified by comparing the RGB value in the specified area with the value of the RGB value table T1. Specifically, when image data analysis processing is performed on the
そして、制御部21は、処理対象となる注目領域を特定し、特定した領域内において黒画素に置き換えられていた画素を、元の描画内容に復元する。続いて、その領域内の画素を横方向に走査し、連続する黒画素以外の画素において、その画素のピッチのばらつきの程度が所定値よりも小さいか否か判定する。一般に、活字文字が記された領域であれば隣り合う2つの文字の間隔は概ね一定となるため、連続する黒画素以外のピッチのばらつきの程度は所定値よりも小さくなる。一方で、手書文字が記された領域であれば隣り合う文字2つの間隔は一定とならないため、連続する黒画素以外のピッチのばらつきの程度は所定値よりも大きくなる。図11(b)に示したL1乃至L3の領域についての判定の例では、L1及びL3の領域は活字領域であるとの判定結果が下され、L2の領域は手書領域であるとの判定結果が下されている。
以上の操作により、抽出した手書領域について、領域内のRGB値に該当する値がRGB値テーブルT1にあれば、その手書領域を付箋領域とする。
Then, the
With the above operation, if the extracted handwriting area has a value corresponding to the RGB value in the area in the RGB value table T1, the handwriting area is set as a tag area.
(5)また、本実施形態においては、付箋情報テーブルT2からテキストデータも読み出し、付箋画像内に文字列として表示する場合を示した。しかし、最初に画像を表示する際(図5:ステップSA20)は文字列の表示は行わず、付箋の位置、大きさ及び色のみから生成した付箋画像を表示し、マウス等によって付箋画像がクリックされた場合に該当するテキストデータの文字列を表示するようにしてもよい。具体的には、制御部21は付箋情報テーブルT2から付箋領域の位置、大きさ及びRGB値を読み出し、読み出した情報を元に付箋画像を生成し、表示部23に表示する。そして、クリックされた付箋画像に該当する付箋画像データに関連して格納されているテキストデータを付箋情報テーブルT2から読み出し、読み出したテキストデータの文字列を付箋画像内に表示する。
(5) In the present embodiment, the text data is also read from the tag information table T2 and displayed as a character string in the tag image. However, when the image is displayed for the first time (FIG. 5: Step SA20), the character string is not displayed, the sticky note image generated only from the position, size and color of the sticky note is displayed, and the sticky note image is clicked with a mouse or the like. In such a case, the character string of the corresponding text data may be displayed. Specifically, the
(6)なお、本実施形態においては、原稿30に記載されているのは文(文字)である場合を示したが、記載されているものは文字に限らず、絵、グラフ等であってもよい。
(6) In the present embodiment, the case where a document (character) is described in the
(7)また、本実施形態においては、画像読取装置10と文書管理支援装置20とをそれぞれ個別のハードウェアとして構成する場合を示したが、両者を一体のハードウェアで構成するようにしてもよい。このとき、通信線12は、係るハードウェア内で画像読取装置10と文書管理支援装置20とを接続する内部バスとなる。
(7) In the present embodiment, the case where the
(8)また、本実施形態においては、不揮発性記憶部25bに予め記憶されたプログラムに基づいて実施する場合を示したが、例えばCD−ROM(Compact Disk-Read Only Memory)やDVD(Digital Versatile Disk)などのコンピュータ装置読取可能な記録媒体に、上記ソフトウェアをインストールするようにしてもよい。 (8) Further, in the present embodiment, the case of performing based on a program stored in advance in the nonvolatile storage unit 25b has been shown, but for example, a CD-ROM (Compact Disk-Read Only Memory) or a DVD (Digital Versatile) The software may be installed in a computer-readable recording medium such as a disk.
1・・・文書管理支援システム、10・・・画像読取装置、12・・・通信線、20・・・文書管理支援装置、21・・・制御部、22・・・通信IF部、23・・・表示部、24・・・操作部、25・・・記憶部、25a・・・揮発性記憶部、25b・・・不揮発性記憶部、26・・・バス、T1・・・RGB値テーブル、T2・・・付箋情報テーブル、T3・・・色変換テーブル
DESCRIPTION OF
Claims (9)
紙付箋の画像の特徴を記憶する特徴記憶手段と、
前記入力手段により生成された画像データから、前記特徴記憶手段に記憶されている紙付箋の特徴を元に、前記用紙に添付された紙付箋の輪郭を示す付箋領域を抽出する付箋領域抽出手段と、
前記付箋領域抽出手段により抽出された付箋領域の画像データから該付箋領域の属性を表す第1付箋情報を取得する第1付箋情報取得手段と、
前記付箋領域抽出手段により抽出された付箋領域内の画像データに文字認識処理を施し、付箋領域内の文字列を第2付箋情報として取得する第2付箋情報取得手段と、
前記第1付箋情報取得手段が取得した第1付箋情報と、前記第2付箋情報が取得した第2付箋情報とを関連づけて記憶する付箋情報記憶手段と
を具備することを特徴とする文書管理支援装置。 An input unit that reads an image of a sheet and generates image data;
Feature storage means for storing the characteristics of the image of the paper sticky note;
A sticky note area extracting unit that extracts a sticky note region indicating an outline of a paper sticky note attached to the paper based on the feature of the paper sticky note stored in the feature storing unit from the image data generated by the input unit; ,
First sticky information acquiring means for acquiring first sticky information representing the attribute of the sticky note area from image data of the sticky note area extracted by the sticky note area extracting means;
Second sticky information acquisition means for performing character recognition processing on the image data in the sticky note area extracted by the sticky note area extracting means, and acquiring a character string in the sticky note area as second sticky note information;
Document management support, comprising: tag information storage means for storing the first tag information acquired by the first tag information acquisition means and the second tag information acquired by the second tag information in association with each other apparatus.
エッジ検出処理により矩形領域を特定する矩形領域特定手段と、
前記矩形領域特定手段により特定された前記矩形領域において、前記特徴記憶手段に記憶されている紙付箋の特徴と一致する矩形領域を付箋領域と特定する矩形付箋領域特定手段と
を含むことを特徴とする請求項1記載の文書管理支援装置。 The sticky note area extracting means includes:
Rectangular area specifying means for specifying a rectangular area by edge detection processing;
The rectangular area specified by the rectangular area specifying means includes: a rectangular sticky note area specifying means for specifying, as a sticky note area, a rectangular area that matches the feature of the paper sticky note stored in the feature storage means; The document management support apparatus according to claim 1.
前記画像データから、注目領域を順次特定する注目領域特定手段と、
前記注目領域特定手段により特定された各注目領域内において、隣り合う2つの文字の間の距離を当該2つの文字列の組毎に求め、求めた各距離のばらつきの程度が所定の範囲を超えるか否かを判断する判断手段と、
前記判断手段による判断結果が、所定の範囲を超えると判断された前記各注目領域において、前記特徴記憶手段に記憶されている紙付箋の特徴と一致する注目領域を付箋領域と特定する注目付箋領域特定手段と
を含むことを特徴とする請求項1記載の文書管理支援装置。 The sticky note area extracting means includes:
Attention area specifying means for sequentially specifying the attention area from the image data;
Within each attention area specified by the attention area specifying means, the distance between two adjacent characters is obtained for each set of the two character strings, and the degree of variation of the obtained distances exceeds a predetermined range. A judging means for judging whether or not,
Attention sticky note area that identifies the attention area that matches the feature of the paper sticky note stored in the feature storage means as the sticky note area in each attention area at which the judgment result by the judging means is determined to exceed a predetermined range. The document management support apparatus according to claim 1, further comprising: a specifying unit.
前記付箋情報記憶手段に記憶されている第1付箋情報のうちの少なくとも位置及び大きさから付箋画像データを生成し、前記入力手段が生成した画像データと共に付箋画像データを表示する表示手段
を具備することを特徴とする請求項1乃至3いずれかに記載の文書管理支援装置。 The attributes of the sticky note area include at least a position and a size,
Display means for generating sticky note image data from at least the position and size of the first sticky note information stored in the sticky note information storage means, and displaying the sticky note image data together with the image data generated by the input means; The document management support apparatus according to any one of claims 1 to 3.
前記操作手段の操作内容に基づいて前記付箋画像データの表示態様を指定する指定手段と、
前記指定手段によって指定された制御内容が前記付箋画像データの移動である場合、前記指定手段によって選択された前記付箋画像データを移動して前記表示手段に表示することを制御する付箋描画制御手段と
を具備することを特徴とする請求項1乃至6いずれかに記載の文書管理支援装置。 An operation means operated by an operator;
Designation means for designating a display mode of the tag image data based on the operation content of the operation means;
A sticky note drawing control means for controlling that the sticky image data selected by the designation means is moved and displayed on the display means when the control content designated by the designation means is movement of the sticky image data; The document management support apparatus according to claim 1, further comprising:
前記第1のステップにより生成された画像データから、予め記憶された紙付箋の画像の特徴を元に、前記用紙に添付された紙付箋の輪郭を示す付箋領域を抽出する第2のステップと、
前記第2のステップにより抽出された付箋領域の画像データから該付箋領域の属性を表す第1付箋情報を取得する第3のステップと、
第3のステップにより抽出された付箋領域内の画像データに文字認識処理を施し、付箋領域内の文字列を第2付箋情報として取得する第4のステップと、
第3のステップにより取得した第1付箋情報と、第4のステップにより取得した第2付箋情報とを関連づけて記憶する第5のステップと
を具備することを特徴とする文書管理支援方法。 A first step of reading the image of the paper and generating image data;
A second step of extracting, from the image data generated in the first step, a sticky note region indicating the outline of the paper sticky note attached to the paper based on the characteristics of the paper sticky note image stored in advance;
A third step of acquiring first sticky note information representing the attribute of the sticky note region from the image data of the sticky note region extracted in the second step;
A fourth step of performing character recognition processing on the image data in the sticky note area extracted in the third step, and acquiring a character string in the sticky note region as second sticky note information;
A document management support method, comprising: a fifth step of storing the first sticky note information acquired in the third step and the second sticky note information acquired in the fourth step in association with each other.
用紙の画像を読み取って画像データを生成する入力手段と、
紙付箋の画像の特徴を記憶する特徴記憶手段と、
前記入力手段により生成された画像データから、前記特徴記憶手段に記憶されている紙付箋の特徴を元に、前記用紙に添付された紙付箋の輪郭を示す付箋領域を抽出する付箋領域抽出手段と、
前記付箋領域抽出手段により抽出された付箋領域の画像データから該付箋領域の属性を表す第1付箋情報を取得する第1付箋情報取得手段と、
前記付箋領域抽出手段により抽出された付箋領域内の画像データに文字認識処理を施し、付箋領域内の文字列を第2付箋情報として取得する第2付箋情報取得手段と、
前記第1付箋情報取得手段が取得した第1付箋情報と、前記第2付箋情報が取得した第2付箋情報とを関連づけて記憶する付箋情報記憶手段と
して機能させることを特徴とするプログラム。 Computer
An input unit that reads an image of a sheet and generates image data;
Feature storage means for storing the characteristics of the image of the paper sticky note;
A sticky note area extracting unit that extracts a sticky note region indicating an outline of a paper sticky note attached to the paper based on the feature of the paper sticky note stored in the feature storing unit from the image data generated by the input unit; ,
First sticky information acquiring means for acquiring first sticky information representing the attribute of the sticky note area from image data of the sticky note area extracted by the sticky note area extracting means;
Second sticky information acquisition means for performing character recognition processing on the image data in the sticky note area extracted by the sticky note area extracting means, and acquiring a character string in the sticky note area as second sticky note information;
A program which functions as sticky information storage means for storing the first sticky information acquired by the first sticky information acquisition means and the second sticky information acquired by the second sticky information in association with each other.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005185575A JP2007004621A (en) | 2005-06-24 | 2005-06-24 | Document management supporting device, and document management supporting method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005185575A JP2007004621A (en) | 2005-06-24 | 2005-06-24 | Document management supporting device, and document management supporting method and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007004621A true JP2007004621A (en) | 2007-01-11 |
Family
ID=37690164
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005185575A Pending JP2007004621A (en) | 2005-06-24 | 2005-06-24 | Document management supporting device, and document management supporting method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007004621A (en) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007079976A (en) * | 2005-09-14 | 2007-03-29 | Fuji Xerox Co Ltd | Spatial arrangement reproducing method, reader, and program |
JP2009277006A (en) * | 2008-05-14 | 2009-11-26 | Fuji Xerox Co Ltd | Information processor, document management system, information processing system, and program |
CN104683643A (en) * | 2013-11-28 | 2015-06-03 | 京瓷办公信息系统株式会社 | Document reading device and image forming apparatus |
CN104796568A (en) * | 2014-01-17 | 2015-07-22 | 富士施乐株式会社 | Image processing apparatus and method |
JP2015226247A (en) * | 2014-05-29 | 2015-12-14 | 京セラドキュメントソリューションズ株式会社 | Document reading device and image forming apparatus |
US9298998B2 (en) | 2013-10-09 | 2016-03-29 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method, and computer-readable medium |
JP2016525729A (en) * | 2013-04-02 | 2016-08-25 | スリーエム イノベイティブ プロパティズ カンパニー | Memo recognition system and method |
JP2016177754A (en) * | 2015-03-23 | 2016-10-06 | 日本電気株式会社 | Character extraction device, character extraction method, and character extraction program |
JP2020177355A (en) * | 2019-04-16 | 2020-10-29 | 富士ゼロックス株式会社 | Information processing device and program |
JP2021158642A (en) * | 2020-03-30 | 2021-10-07 | シャープ株式会社 | Image processing device, image processing method, and program |
-
2005
- 2005-06-24 JP JP2005185575A patent/JP2007004621A/en active Pending
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4674513B2 (en) * | 2005-09-14 | 2011-04-20 | 富士ゼロックス株式会社 | Spatial layout reproduction method, reader, and program |
JP2007079976A (en) * | 2005-09-14 | 2007-03-29 | Fuji Xerox Co Ltd | Spatial arrangement reproducing method, reader, and program |
JP2009277006A (en) * | 2008-05-14 | 2009-11-26 | Fuji Xerox Co Ltd | Information processor, document management system, information processing system, and program |
JP2016525729A (en) * | 2013-04-02 | 2016-08-25 | スリーエム イノベイティブ プロパティズ カンパニー | Memo recognition system and method |
US9298998B2 (en) | 2013-10-09 | 2016-03-29 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method, and computer-readable medium |
JP2015106718A (en) * | 2013-11-28 | 2015-06-08 | 京セラドキュメントソリューションズ株式会社 | Document reader and image forming apparatus |
CN104683643A (en) * | 2013-11-28 | 2015-06-03 | 京瓷办公信息系统株式会社 | Document reading device and image forming apparatus |
CN104683643B (en) * | 2013-11-28 | 2018-01-02 | 京瓷办公信息系统株式会社 | Original document reading apparatus and image processing system |
US9280638B2 (en) | 2014-01-17 | 2016-03-08 | Fuji Xerox Co., Ltd. | Image processing apparatus and method, and non-transitory computer readable medium |
CN104796568A (en) * | 2014-01-17 | 2015-07-22 | 富士施乐株式会社 | Image processing apparatus and method |
CN104796568B (en) * | 2014-01-17 | 2018-06-05 | 富士施乐株式会社 | Image processing apparatus and method |
JP2015226247A (en) * | 2014-05-29 | 2015-12-14 | 京セラドキュメントソリューションズ株式会社 | Document reading device and image forming apparatus |
JP2016177754A (en) * | 2015-03-23 | 2016-10-06 | 日本電気株式会社 | Character extraction device, character extraction method, and character extraction program |
JP2020177355A (en) * | 2019-04-16 | 2020-10-29 | 富士ゼロックス株式会社 | Information processing device and program |
JP7318289B2 (en) | 2019-04-16 | 2023-08-01 | 富士フイルムビジネスイノベーション株式会社 | Information processing device and program |
JP2021158642A (en) * | 2020-03-30 | 2021-10-07 | シャープ株式会社 | Image processing device, image processing method, and program |
JP7357579B2 (en) | 2020-03-30 | 2023-10-06 | シャープ株式会社 | Image processing device, image processing method and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007004621A (en) | Document management supporting device, and document management supporting method and program | |
US9514103B2 (en) | Effective system and method for visual document comparison using localized two-dimensional visual fingerprints | |
US8508756B2 (en) | Image forming apparatus having capability for recognition and extraction of annotations and additionally written portions | |
US20070076984A1 (en) | Electronic document creating apparatus | |
US7596271B2 (en) | Image processing system and image processing method | |
US7783108B2 (en) | Document management method and apparatus | |
JP2007042106A (en) | Document processing method, document processing media, document management method, document processing system, and document management system | |
JP4785655B2 (en) | Document processing apparatus and document processing method | |
JP2006023945A (en) | Image processing system and image processing method | |
JP4502385B2 (en) | Image processing apparatus and control method thereof | |
JP5972578B2 (en) | Image processing apparatus, image forming apparatus, program, and recording medium | |
US20080218812A1 (en) | Metadata image processing | |
JP2007202132A (en) | Apparatus and method for image processing, and computer program | |
JP6540280B2 (en) | Image processing apparatus and computer program | |
JP4859054B2 (en) | Image processing apparatus, image processing method, program, and recording medium | |
US7983485B2 (en) | System and method for identifying symbols for processing images | |
JP2007005950A (en) | Image processing apparatus and network system | |
JP2006093917A (en) | Image reading apparatus and image processor, and image forming apparatus | |
JP5098614B2 (en) | Method for controlling sentence processing apparatus and sentence processing apparatus | |
JP2005303740A (en) | Image forming apparatus, image forming method, and program | |
JP2004127203A (en) | Image processor, image processing method, program for causing computer to execute the method, and computer readable recording medium with the program recorded thereon | |
JP4710672B2 (en) | Character color discrimination device, character color discrimination method, and computer program | |
JP2007011683A (en) | Document management support device | |
KR20070013157A (en) | Method for saving image data | |
US20060023236A1 (en) | Method and arrangement for copying documents |