JPH1166234A - Image-processing method, record medium recorded with the same and image processor thereof - Google Patents

Image-processing method, record medium recorded with the same and image processor thereof

Info

Publication number
JPH1166234A
JPH1166234A JP9230896A JP23089697A JPH1166234A JP H1166234 A JPH1166234 A JP H1166234A JP 9230896 A JP9230896 A JP 9230896A JP 23089697 A JP23089697 A JP 23089697A JP H1166234 A JPH1166234 A JP H1166234A
Authority
JP
Japan
Prior art keywords
partial document
document image
image
character
character code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9230896A
Other languages
Japanese (ja)
Other versions
JP3368184B2 (en
Inventor
Nobuo Miyamoto
信夫 宮本
Teruo Akiyama
照雄 秋山
Kenji Ogura
健司 小倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP23089697A priority Critical patent/JP3368184B2/en
Publication of JPH1166234A publication Critical patent/JPH1166234A/en
Application granted granted Critical
Publication of JP3368184B2 publication Critical patent/JP3368184B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a method and a processor for image processing which can accurately put document images one over the other at a high speed. SOLUTION: A character recognition part 3 recognizes characters present at an overlap part of a partial document image, and a character code matching part 4 matches them for extracting the character code string having a maximum number of matching characters. A calculation part 5 for the quantity of displacement between partial document images finds the quantity of displacement between a couple of partial document images from the difference between character circumscribed rectangle coordinates calculated by a character circumscribed rectangle calculation part 2, and a connecting image composition part 6 puts them one over the other according to the displacement quantity. A character pattern which can have its characters recognized is normally of a size tens of pixels by tens of pixels large, so that the superposition position of the images can be found very rapidly, so that speedy superposition can be actualized. Further, the same character string will hardly appears in a document and the effects of periodic patterns can be eliminated, so that the precision of the superposition can be improved.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、重畳部分を持つ複
数の部分文書画像から連結した文書画像を合成する画像
処理方法及び装置に関するものである。
[0001] 1. Field of the Invention [0002] The present invention relates to an image processing method and apparatus for synthesizing a combined document image from a plurality of partial document images having a superimposed portion.

【0002】[0002]

【従来の技術】画像を重ね合わせる方法として従来より
提案されている方法は、画像の重畳部分を少しずつずら
しながら対応する画素間の差の総和(残差)が最小とな
る位置を求める方法が一般的である。すなわち、2つの
部分文書画像をF(x,y)、G(x,y)(x=1,
…,X,y=1,…,Y)とするとき、両文書画像を上
下にi画素、左右にj画素、相対的にずらしたときの残
差Rijは次式で与えられる。
2. Description of the Related Art Conventionally, as a method of superimposing images, a method of obtaining a position where the sum of the differences (residuals) between corresponding pixels is minimized while shifting the superimposed portion of the image little by little. General. That is, two partial document images are represented by F (x, y) and G (x, y) (x = 1,
, X, y = 1,..., Y), the residual Rij when both document images are vertically shifted by i pixels and left and right by j pixels is given by the following equation.

【0003】 Rij=ΣS│F(x,y)−G(x−i,y−j)│ ここで、Sは重畳領域を表す。このRijをいろいろな
i,jの組み合わせについて計算し、最小のRijを与
えるi,jの位置で文書画像を重ね合わせる。
[0003] Rij = Σ S │F (x, y) -G (x-i, y-j) │ where, S is representative of the overlap region. This Rij is calculated for various combinations of i and j, and the document image is superimposed at the position of i and j that gives the minimum Rij.

【0004】[0004]

【発明が解決しようとする課題】しかしながら従来の方
法では、計算量が膨大となるという問題があった。例え
ば、重畳部分が100画素×100画素、探索範囲が5
0画素×50画素の場合であっても、減算、絶対値演
算、加算をそれぞれ10000回行う操作を2500回
繰り返す必要がある。そのため、大きなサイズの文書画
像を扱う場合や、高速性を要する場合には適用が困難で
あった。また、背景がi,jの探索範囲に比べて小さな
周期の模様の場合には、周期分だけずれた重ね合わせが
起こりやすいという問題もあった。
However, the conventional method has a problem that the amount of calculation is enormous. For example, the overlapping portion is 100 pixels × 100 pixels, and the search range is 5
Even in the case of 0 pixels × 50 pixels, it is necessary to repeat the operation of performing subtraction, absolute value calculation and addition 10,000 times each 2500 times. Therefore, it is difficult to apply the method when handling a large-sized document image or when high speed is required. Further, in the case where the background has a pattern with a smaller cycle than the search range of i and j, there is a problem that the superposition shifted by the cycle is likely to occur.

【0005】本発明は、上記事情に鑑みてなされたもの
で、その課題は、高速かつ正確に文書画像の重ね合わせ
を行える画像処理方法及び装置を提供することにある。
SUMMARY OF THE INVENTION The present invention has been made in view of the above circumstances, and has as its object to provide an image processing method and apparatus which can quickly and accurately superimpose document images.

【0006】[0006]

【課題を解決するための手段】本発明は、上記課題を解
決するため、以下の(1)〜(3)の発明を手段とす
る。
Means for Solving the Problems In order to solve the above-mentioned problems, the present invention uses the following inventions (1) to (3).

【0007】(1)重畳部分を持つ複数の部分文書画像
からこれらを連結した文書画像を合成する画像処理方法
であって、各部分文書画像中に存在する文字パタン毎
に、該文字パタンの外接矩形座標を算出する過程と、部
分文書画像毎に前記外接矩形で囲まれる各文字パタンの
認識を行い、部分文書画像毎の文字コード列を生成する
過程と、全ての部分文書画像間で前記文字コード列の照
合を行い、部分文書画像対毎に一致文字数が最大になる
ときの一致文字コード列を抽出する過程と、全ての部分
文書画像対について、前記一致文字コード列に属する文
字コードの部分文書画像内の外接矩形座標から部分文書
画像間の変位量を算出する過程と、全ての部分文書画像
対についての変位量を用いて連結文書画像を合成する過
程と、を具備することを特徴とする画像処理方法。
(1) An image processing method for synthesizing a document image obtained by linking a plurality of partial document images having a superimposed portion, wherein a circumscribing of the character pattern is performed for each character pattern present in each partial document image. Calculating rectangular coordinates; recognizing each character pattern surrounded by the circumscribed rectangle for each partial document image to generate a character code string for each partial document image; A process of collating the code strings and extracting a matching character code string when the number of matching characters is maximized for each partial document image pair, and for all partial document image pairs, a portion of the character code belonging to the matching character code string A step of calculating a displacement amount between partial document images from circumscribed rectangular coordinates in the document image; and a step of combining linked document images using displacement amounts of all the partial document image pairs. Image processing method according to claim.

【0008】(2)重畳部分を持つ複数の部分文書画像
からこれらを連結した文書画像を合成する画像処理方法
における、各部分文書画像中に存在する文字パタン毎
に、該文字パタンの外接矩形座標を算出する手順と、部
分文書画像毎に前記外接矩形で囲まれる各文字パタンの
認識を行い、部分文書画像毎の文字コード列を生成する
手順と、全ての部分文書画像間で前記文字コード列の照
合を行い、部分文書画像対毎に一致文字数が最大になる
ときの一致文字コード列を抽出する手順と、全ての部分
文書画像対について、前記一致文字コード列に属する文
字コードの部分文書画像内の外接矩形座標から部分文書
画像間の変位量を算出する手順と、全ての部分文書画像
対についての変位量を用いて連結文書画像を合成する手
順と、をコンピュータに実行させるプログラムを、該コ
ンピュータが読み取り可能な媒体に記録したことを特徴
とする画像処理方法を記録した記録媒体。
(2) For each character pattern present in each partial document image in an image processing method for combining a plurality of partial document images having a superimposed portion and a document image obtained by concatenating them, the circumscribed rectangular coordinates of the character pattern And a procedure for recognizing each character pattern surrounded by the circumscribed rectangle for each partial document image and generating a character code string for each partial document image. And extracting a matching character code string when the number of matching characters is maximized for each partial document image pair; and for all partial document image pairs, a partial document image of a character code belonging to the matching character code string Calculating the amount of displacement between partial document images from the circumscribed rectangular coordinates inside the document and combining the connected document images using the amounts of displacement of all the partial document image pairs. Recording medium the program was recorded an image processing method characterized by the computer is recorded on a medium readable to execute.

【0009】(3)重畳部分を持つ複数の部分文書画像
からこれらを連結した文書画像を合成する画像処理装置
であって、各部分文書画像中に存在する文字パタン毎
に、該文字パタンの外接矩形座標を算出する手段と、部
分文書画像毎に前記外接矩形で囲まれる各文字パタンの
認識を行い、部分文書画像毎の文字コード列を生成する
手段と、全ての部分文書画像間で前記文字コード列の照
合を行い、部分文書画像対毎に一致文字数が最大になる
ときの一致文字コード列を抽出する手段と、全ての部分
文書画像対について、前記一致文字コード列に属する文
字コードの部分文書画像内の外接矩形座標から部分文書
画像間の変位量を算出する手段と、全ての部分文書画像
対についての変位量を用いて連結文書画像を合成する手
段と、を具備することを特徴とする画像処理装置。
(3) An image processing apparatus for combining a plurality of partial document images having a superimposed portion into a combined document image, and for each character pattern present in each partial document image, circumscribing the character pattern Means for calculating rectangular coordinates; means for recognizing each character pattern surrounded by the circumscribed rectangle for each partial document image to generate a character code string for each partial document image; Means for collating a code string and extracting a matching character code string when the number of matching characters is maximized for each partial document image pair, and a part of a character code belonging to the matching character code string for all partial document image pairs Means for calculating the amount of displacement between partial document images from the circumscribed rectangular coordinates in the document image, and means for synthesizing a connected document image using the amounts of displacement for all pairs of partial document images. The image processing apparatus according to claim.

【0010】本発明では、文書画像中の文字情報を利用
して、部分文書画像の重畳部分に存在する文字を認識
し、文字コードレベルで位置の照合をとることにより、
高速かつ正確な重ね合わせを実現する。文字認識処理の
可能な文字パタンは通常、数十画素×数十画素程度の大
きさがある。そのため、例えば、100画素×100画
素の重畳部分の場合には、一般に数十文字しか含まれな
い。重畳部分に含まれる文字数を10個と仮定すると、
文字コード照合回数は高々10×10回に過ぎず、極め
て高速に画像の重畳位置を見い出すことができ、高速に
重ね合わせを行うことができる。また、特別な文書を除
いて、文書中に同じ文字列が周期的に出現することは少
なく、また周期的な模様等の影響を排除できることか
ら、重ね合わせの精度を向上させることができる。
According to the present invention, by utilizing character information in a document image, a character present in a superimposed portion of a partial document image is recognized, and the position is collated at a character code level.
Achieve high-speed and accurate overlay. A character pattern that can be subjected to character recognition processing usually has a size of about several tens of pixels × several tens of pixels. Therefore, for example, in the case of a superimposed portion of 100 pixels × 100 pixels, generally, only several tens of characters are included. Assuming that the number of characters included in the superimposed part is 10,
The number of times of character code collation is only 10 × 10 at most, and the superimposition position of the image can be found very quickly, and the superposition can be performed at high speed. Also, except for a special document, the same character string rarely appears periodically in the document, and the influence of a periodic pattern or the like can be eliminated, so that the overlay accuracy can be improved.

【0011】[0011]

【発明の実施の形態】以下、本発明の実施形態例を図面
を参照して詳細に説明する。
Embodiments of the present invention will be described below in detail with reference to the drawings.

【0012】図1は、本発明の一実施形態例の画像処理
装置のブロック図である。
FIG. 1 is a block diagram of an image processing apparatus according to an embodiment of the present invention.

【0013】本実施形態例の画像処理装置は、部分文書
画像格納部1と、文字外接矩形算出部2と、文字認識部
3と、文字コード列照合部4と、部分文書画像間変位量
算出部5と、連結文書画像合成部6と、連結文書画像格
納部7とで構成されている。図1において、破線で囲ん
だ部分、すなわち文字外接矩形算出部2と、文字認識部
3と、文字コード列照合部4と、部分文書画像間変位量
算出部5が、本発明で追加した部分である。
The image processing apparatus according to the present embodiment includes a partial document image storage section 1, a character circumscribed rectangle calculation section 2, a character recognition section 3, a character code string collation section 4, and a displacement calculation between partial document images. It is composed of a unit 5, a connected document image synthesizing unit 6, and a connected document image storage unit 7. In FIG. 1, a portion enclosed by a broken line, that is, a portion added by the present invention to a character circumscribed rectangle calculation unit 2, a character recognition unit 3, a character code string collation unit 4, and a partial document image displacement amount calculation unit 5 It is.

【0014】部分文書画像格納部1には、重畳部分を持
つ部分文書画像の集合が格納されている。
The partial document image storage unit 1 stores a set of partial document images having a superimposed portion.

【0015】文字外接矩形算出部2は、部分文書画像格
納部1に格納されている部分文書画像を1枚ずつ読み出
し、画像中に存在する文字パタンの各々について外接矩
形座標を算出する。
The character circumscribed rectangle calculation unit 2 reads out the partial document images stored in the partial document image storage unit 1 one by one, and calculates the circumscribed rectangle coordinates for each of the character patterns existing in the image.

【0016】文字認識部3は、文字外接矩形算出部2で
算出された外接矩形で囲まれる各文字パタンの認識を行
い、部分文書画像毎に文字コード列を生成する。
The character recognition unit 3 recognizes each character pattern surrounded by the circumscribed rectangle calculated by the character circumscribed rectangle calculation unit 2 and generates a character code string for each partial document image.

【0017】文字コード列照合部4は、全ての部分文書
画像の対について、文字認識部3で得られた文字コード
列の照合を行い、一致文字数が最大になるときの一致文
字コード列を抽出する。
The character code string collating section 4 collates the character code strings obtained by the character recognizing section 3 for all the pairs of partial document images, and extracts a matching character code string when the number of matching characters is maximized. I do.

【0018】部分文書画像間変位量算出部5は、部分文
書画像対毎に、一致文字コード列に属する文字コードの
両部分文書画像内における外接矩形座標の差分の平均値
から両部分文書画像の変位量を算出する。
The partial document image displacement amount calculating section 5 calculates, for each partial document image pair, the average value of the difference between the circumscribed rectangular coordinates in both partial document images of the character codes belonging to the matching character code string, and calculates the Calculate the amount of displacement.

【0019】連結文書画像合成部6は、部分文書画像間
変位量算出部5で算出された部分文書画像対毎の変位量
をもとに連結文書画像を合成し、連結文書画像格納部7
に格納する。
The connected document image synthesizing section 6 synthesizes a connected document image based on the displacement amount of each partial document image calculated by the partial document image displacement amount calculating section 5, and generates a connected document image storage section 7.
To be stored.

【0020】このように構成した画像処理装置の動作お
よび作用とともに、本発明の画像処理方法の一実施形態
例を説明する。図2〜図5は、図1に示した画像処理装
置の動作とともに、本発明の画像処理方法の一実施形態
例を示すフローチャートである。
An embodiment of the image processing method according to the present invention will be described together with the operation and operation of the image processing apparatus configured as described above. FIGS. 2 to 5 are flowcharts showing the operation of the image processing apparatus shown in FIG. 1 and an embodiment of the image processing method of the present invention.

【0021】まず、ステップ10において、部分文書画
像を読み込み、ステップ11で文字外接矩形座標を算出
する。
First, in step 10, the partial document image is read, and in step 11, the coordinates of the circumscribed rectangle of the character are calculated.

【0022】ステップ12で外接矩形内の文字の認識を
行い、文字パタンを文字コードに変換する。この処理は
ステップ13およびステップ14の判定処理で示される
ように、全ての部分文書画像内の全ての文字パタンの認
識が完了するまで繰り返される。
In step 12, characters in the circumscribed rectangle are recognized, and the character pattern is converted into a character code. This processing is repeated until the recognition of all the character patterns in all the partial document images is completed, as indicated by the determination processing in steps 13 and 14.

【0023】続いてステップ15からステップ51まで
の第n着目部分文書画像についての処理を行う。まずス
テップ16でnを1加算後、ステップ17で第n部分文
書画像の文字コード列A12…Apを読込む。続いて、
ステップ18で第n着目部分文書画像nに対する照合先
部分文書画像の番号mの初期値としてn+1を設定し、
ステップ19で第m部分文書画像の文字コード列B12
…Bqを読込む。
Subsequently, the processing for the n-th focused partial document image from step 15 to step 51 is performed. After first 1 adds n in step 16, it reads the character code string A 1 A 2 ... A p of the n partial document image in step 17. continue,
In step 18, n + 1 is set as the initial value of the number m of the collation destination partial document image with respect to the nth focused partial document image n,
In step 19, the character code string B 1 B 2 of the m-th partial document image
... reads the B q.

【0024】ステップ20で照合開始文字位置番号sに
0を設定後、ステップ21でA1+s2+s…ApとB12
…Bp-sの一致文字数k1(s)を計数する。ステップ2
2でsに1を加算し、ステップ23でsがp未満か否か
を判定する。sがp未満のときは、新たなsについて一
致文字数k1(s)の計数を繰り返す。
[0024] After setting the 0 to the verification start character position number s in step 20, A 1 + s A 2 + s ... A p and B 1 B 2 in step 21
... The number k 1 (s) of matching characters of B ps is counted. Step 2
In step 2, 1 is added to s, and in step 23, it is determined whether s is less than p. If s is less than p, the counting of the number of matching characters k 1 (s) is repeated for a new s.

【0025】sがp以上になったときは、図3のステッ
プ24で照合開始文字位置番号sに再び0を設定後、ス
テップ25でA12…A1+sとBq-sq-s+1…Bqの一致
文字数k2(s)を計数する。ステップ26でsに1を
加算し、ステップ27でsがq未満か否かを判定する。
sがq未満のときは、新たなsについて一致文字数k2
(s)の計数を繰り返す。
When s is equal to or greater than p, the collation start character position number s is set to 0 again in step 24 in FIG. 3, and in step 25, A 1 A 2 ... A 1 + s and B qs B q- s + 1 ... The number of matching characters k 2 (s) of B q is counted. In step 26, 1 is added to s, and in step 27, it is determined whether s is less than q.
If s is less than q, the number of matching characters k 2 for the new s
The counting of (s) is repeated.

【0026】sがq以上になったときは、ステップ28
へ進み、一致文字数k1(s)を最大にするsをS1に代
入し、ステップ29でk1(S1)をK1に代入する。同
様に、ステップ30、ステップ31で一致文字数k
2(s)を最大にするsをS2に、k2(S2)をK2に代
入する。続いて、ステップ32でK1がK2より大きいか
否かを判定する。K1がK2より大きいときは、ステップ
33、ステップ34でSにS1、KにK1を代入する。K
1がK2以下のときは、ステップ35、ステップ36でS
にS2、KにK2を代入する。
If s is greater than q, step 28
Then, s that maximizes the number of matching characters k 1 (s) is substituted for S 1 , and k 1 (S 1 ) is substituted for K 1 in step 29. Similarly, in steps 30 and 31, the number of matching characters k
Substitute s that maximizes 2 (s) into S 2 , and substitute k 2 (S 2 ) into K 2 . Then, K 1 at step 32 is equal to or greater than K 2. When K 1 is greater than K 2, the step 33 is substituted for K 1 to S 1, K to S at step 34. K
1 when the K 2 below, steps 35, S at step 36
Substituting K 2 to S 2, K to.

【0027】ステップ37でこのようにして得られたK
が0か否かを判定し、0のときは重畳部分無しと見な
し、図5のステップ48へジャンプし、次の照合先部分
文書画像の処理に進む。Kが0でないときは、図4のス
テップ38でSの値をもとに、A12…ApとB12
qの一致文字コード列C12…CKを抽出する。
The K thus obtained in step 37
Is determined to be 0, and if 0, it is considered that there is no overlapping portion, and the process jumps to step 48 in FIG. 5 to proceed to the processing of the next collation destination partial document image. If K is not 0, A 1 A 2 ... A p and B 1 B 2 .
Extracting a matching character code string C 1 C 2 ... C K of B q.

【0028】次に、ステップ39で一致文字コード番号
kに初期値として1を設定した後、ステップ40で文字
コードCkについての第n部分文書画像中における外接
矩形座標(XSn,YSn)および(XEn,YEn)を取出
す。さらに、ステップ40でCkについての第m部分文
書画像中における外接矩形座標(XSm,YSm)および
(XEm,YEm)取出し、ステップ41で両座標値の差
分: DXSnm=XSm−XSn DYSnm=YSm−YSn DXEnm=XEm−XEn DYEnm=YEm−YEn を算出する。ステップ43でkに1を加算した後、ステ
ップ44でkがK未満か否かを判定する。kがK未満の
ときは次の一致文字コードについて座標の差分を求める
処理を繰り返す。kがK以上のときは、ステップ45で
DXSnm,DXEnmの全一致文字コードについての平均値
DXを算出する。同様に、ステップ46でDYSnm,D
Enmの平均値DYを算出する。(DX,DY)は着目
部分文書画像nと照合先部分文書画像mの平均的なずれ
と考えられるので、ステップ47で第n部分文書画像と
第m部分文書画像とを(DX,DY)ずらして重ね合わ
せる。
Next, in step 39, the matching character code number k is set to 1 as an initial value, and in step 40, the circumscribed rectangular coordinates (X Sn , Y Sn ) of the character code C k in the nth partial document image. And (X En , Y En ). Further, in step 40, the circumscribed rectangular coordinates (X Sm , Y Sm ) and (X Em , Y Em ) of C k in the m-th partial document image are extracted. In step 41, the difference between the two coordinate values: DX Snm = X Sm -X Sn DY Snm = Y Sm -Y Sn DX Enm = X Em -X En DY Enm = Y Em -Y En is calculated. After adding 1 to k in step 43, it is determined in step 44 whether k is less than K. If k is smaller than K, the process of obtaining the coordinate difference for the next matching character code is repeated. If k is equal to or larger than K, an average value DX is calculated in step 45 for all matching character codes DX Snm and DX Enm . Similarly, in step 46, DY Snm , D
The average value DY of Y Enm is calculated. Since (DX, DY) is considered to be an average deviation between the focused partial document image n and the collation destination partial document image m, in step 47, the (n, n) th partial document image and the mth partial document image are shifted by (DX, DY). And overlap.

【0029】以上の処理が完了したら、図5のステップ
48でmに1を加算し、ステップ49でmが部分文書画
像数より大きいか否かの判定を行う。mが部分文書画像
数以下の時は図2のステップ19以降の処理を繰り返
す。mが部分文書画像数より大きい時は、ステップ50
でnに1を加算し、ステップ51でnが部分文書画像数
より大きいか否かの判定を行う。nが部分文書画像数以
下の時は図1のステップ16以降の処理を繰り返す。n
が部分文書画像数より大きい時は、処理を終了する。
When the above processing is completed, 1 is added to m in step 48 of FIG. 5, and it is determined in step 49 whether m is larger than the number of partial document images. If m is equal to or smaller than the number of partial document images, the processing from step 19 onward in FIG. 2 is repeated. If m is larger than the number of partial document images, step 50
In step 51, it is determined whether or not n is greater than the number of partial document images. When n is equal to or less than the number of partial document images, the processing from step 16 onward in FIG. 1 is repeated. n
Is larger than the number of partial document images, the process ends.

【0030】以上の説明では、p≦qの場合について説
明したが、p>qの場合も一致文字数計数の繰り返し回
数を切り替えることで対応可能である。また、重畳部分
に複数の文字行が存在する場合も、以上説明した処理を
行毎に行うことで容易に拡張可能である。
In the above description, the case of p ≦ q has been described. However, the case of p> q can be dealt with by changing the number of repetitions of counting the number of matching characters. Further, even when a plurality of character lines exist in the superimposed portion, the processing can be easily extended by performing the above-described processing for each line.

【0031】図3は外接矩形座標を説明する図であっ
て、文字外接矩形座標とは、文書画像中における文字の
左右端および上下端の位置を表す。言い換えると、文字
を矩形で囲んだときの左上頂点および右下頂点の座標を
表す。
FIG. 3 is a diagram for explaining the circumscribed rectangular coordinates. The character circumscribed rectangular coordinates indicate the positions of the left and right ends and the upper and lower ends of the character in the document image. In other words, it represents the coordinates of the upper left vertex and the lower right vertex when a character is enclosed by a rectangle.

【0032】図4は処理の流れを説明する図であって、
100は着目部分文書画像、101は照合先部分文書画
像、102は着目部分文書画像の認識結果文字コード
列、103は照合先部分文書画像の認識結果文字コード
列、104は一致文字数計数範囲、105は一致文字
数、106は連結文書画像である。
FIG. 4 is a diagram for explaining the flow of processing.
100 is a partial document image of interest, 101 is a partial document image of the collation target, 102 is a character code string of the recognition result of the partial document image of interest, 103 is a character code string of the recognition result of the partial document image of the collation, 104 is a matching character number counting range, 105 Is the number of matching characters, and 106 is a connected document image.

【0033】着目部分文書画像100、照合先部分文書
画像101は、文字毎の外接矩形座標を算出され、文字
認識処理により、それぞれ文字コード列102“神奈川
県川崎”、103“川県川崎市幸区”が生成される。次
に、右方向に1文字ずつずらして一致文字数105を計
数する処理を重畳部分がなくなるまで実行する。続い
て、左方向にも1文字ずつずらして一致文字数105を
計数する処理を重畳部分がなくなるまで実行する。以上
の計数処理で求めた一致文字数が最大になる位置(図4
の例では、右方向照合処理の3回目)を求め、そのとき
の一致文字“川”“県”“川”“崎”の外接矩形が一致
するように着目部分文書画像100、照合先部分文書画
像101を重ね合わせた結果が連結文書画像106であ
る。
The circumscribed rectangular coordinates of each character are calculated for the target partial document image 100 and the collation target partial document image 101, and the character code strings 102 “Kawasaki, Kanagawa” and 103 “Kawasaki, Kawasaki” are obtained by character recognition processing. Ward ”is generated. Next, a process of counting the number of matching characters 105 shifted one character at a time to the right is executed until there is no overlapped portion. Subsequently, the process of counting the number of matching characters 105 shifted one character at a time in the left direction is performed until there is no overlapped portion. The position where the number of matching characters obtained by the above counting process becomes maximum (FIG. 4)
In the example of (3), the rightward collation process is performed for the third time), and the partial document image of interest 100 and the collation target partial document such that the circumscribed rectangles of the matching characters “kawa”, “prefecture”, “kawa” and “saki” match at that time The result obtained by superimposing the images 101 is the connected document image 106.

【0034】なお、本実施形態例は文書画像の場合につ
いて説明したが、文字パタンを含む一般画像へも適用可
能である。
Although the present embodiment has been described with reference to a document image, the present embodiment is also applicable to a general image including a character pattern.

【0035】本発明は、データを保存しそれらを自由に
読み出し可能なハードディスクやそれに準ずる装置と、
データを処理する際に必要なバッファやそれに準ずる装
置と、最終的に検出されたカット点を表示、出力するデ
ィスプレイなどの装置を備え、それらハードディスク、
バッファ及びディスプレイなどをあらかじめ定められた
手順に基いて制御する中央演算装置などを備えたコンピ
ュータやそれに準ずる装置を基に、上述した実施形態例
の処理、ないしは、図2ないし図7までの一連の図に示
した方法ないしアルゴリズムを記述した処理プログラム
やそれに準ずる物を、該コンピュータに対して与え、制
御、実行させることで実現することが可能である。ここ
で、該処理プログラムやそれに準ずる物を、コンピュー
タが実行する際に読み出しを実行できるCD−ROM、
フロッピーディスク(FD)、光磁気ディスク(MO)
あるいはそれらに準ずる記憶媒体に記録して、配布する
ことが可能である。
The present invention provides a hard disk capable of storing data and freely reading them and a device similar thereto,
It is equipped with devices such as a buffer necessary for processing data and a device equivalent to it, and a display etc. that displays and outputs the finally detected cut point,
Based on a computer having a central processing unit or the like that controls a buffer, a display, and the like based on a predetermined procedure, and the like, the processing of the above-described embodiment or a series of processes shown in FIGS. The present invention can be realized by providing a computer with a processing program describing a method or an algorithm shown in the drawing or an equivalent thereof, and controlling and executing the computer. Here, a CD-ROM that can read the processing program and the equivalents when the computer executes the processing program,
Floppy disk (FD), magneto-optical disk (MO)
Alternatively, they can be recorded on a storage medium corresponding to them and distributed.

【0036】[0036]

【発明の効果】以上説明したように、本発明によれば、
画素ではなく文書画像中に存在する文字パタンを認識
し、その位置情報をもとに文書画像の重ね合わせを行う
ので、高速かつ正確な画像重ね合わせが可能となり、大
きなサイズの文書画像を対象とする場合や、高速性を要
する場合にも適用可能な画像処理方法及び装置が実現で
きる。
As described above, according to the present invention,
It recognizes character patterns that exist in the document image instead of pixels, and superimposes the document images based on the position information, so that high-speed and accurate image superposition can be performed. And an image processing method and apparatus that can be applied even when high speed is required.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態例の画像処理装置を示すブ
ロック図である。
FIG. 1 is a block diagram illustrating an image processing apparatus according to an embodiment of the present invention.

【図2】本発明の一実施形態例の画像処理装置の動作と
ともに本発明での画像処理方法の一実施形態例を示すフ
ローチャート(その1)である。
FIG. 2 is a flowchart (part 1) illustrating an operation of the image processing apparatus according to the embodiment of the present invention and an image processing method according to an embodiment of the present invention.

【図3】本発明の一実施形態例の画像処理装置の動作と
ともに本発明での画像処理方法の一実施形態例を示すフ
ローチャート(その2)である。
FIG. 3 is a flowchart (part 2) illustrating an operation of the image processing apparatus according to the embodiment of the present invention and an embodiment of the image processing method according to the present invention.

【図4】本発明の一実施形態例の画像処理装置の動作と
ともに本発明での画像処理方法の一実施形態例を示すフ
ローチャート(その3)である。
FIG. 4 is a flowchart (part 3) illustrating an operation of the image processing apparatus according to the embodiment of the present invention and an embodiment of the image processing method according to the present invention.

【図5】本発明の一実施形態例の画像処理装置の動作と
ともに本発明での画像処理方法の一実施形態例を示すフ
ローチャート(その4)である。
FIG. 5 is a flowchart (part 4) illustrating an operation of the image processing apparatus according to the embodiment of the present invention and an embodiment of the image processing method according to the present invention.

【図6】上記実施形態例での外接矩形座標を説明する図
である。
FIG. 6 is a diagram illustrating circumscribed rectangular coordinates in the embodiment.

【図7】上記実施形態例での処理の流れを説明する図で
ある。
FIG. 7 is a diagram illustrating a flow of a process in the embodiment.

【符号の説明】[Explanation of symbols]

1…部分文書画像格納部 2…文字外接矩形算出部 3…文字認識部 4…文字コード列照合部 5…部分文書画像間変位量算出部 6…連結文書画像合成部 7…連結文書画像格納部 10〜51…ステップ 100…着目部分文書画像 101…照合先部分文書画像 102…着目部分文書画像の認識結果文字コード列 103…照合先部分文書画像の認識結果文字コード列 104…一致文字数計数範囲 105…一致文字数 106…連結文書画像 DESCRIPTION OF SYMBOLS 1 ... Part document image storage part 2 ... Character circumscribed rectangle calculation part 3 ... Character recognition part 4 ... Character code string collation part 5 ... Displacement amount calculation part between partial document images 6 ... Concatenated document image synthesis part 7 ... Concatenated document image storage part 10 to 51: Step 100: Partial document image of interest 101: Partial document image of collation target 102: Recognition result character code string of partial document image of interest 103: Recognition character code string of partial document image of collation 104: Matching character number counting range 105 ... Number of matching characters 106 ... Concatenated document image

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 重畳部分を持つ複数の部分文書画像から
これらを連結した文書画像を合成する画像処理方法であ
って、 各部分文書画像中に存在する文字パタン毎に、該文字パ
タンの外接矩形座標を算出する過程と、 部分文書画像毎に前記外接矩形で囲まれる各文字パタン
の認識を行い、部分文書画像毎の文字コード列を生成す
る過程と、 全ての部分文書画像間で前記文字コード列の照合を行
い、部分文書画像対毎に一致文字数が最大になるときの
一致文字コード列を抽出する過程と、 全ての部分文書画像対について、前記一致文字コード列
に属する文字コードの部分文書画像内の外接矩形座標か
ら部分文書画像間の変位量を算出する過程と、 全ての部分文書画像対についての変位量を用いて連結文
書画像を合成する過程と、 を具備することを特徴とする画像処理方法。
1. An image processing method for combining a plurality of partial document images having a superimposed portion into a document image obtained by concatenating the plurality of partial document images, comprising: for each character pattern present in each partial document image, a circumscribed rectangle of the character pattern A step of calculating coordinates; a step of recognizing each character pattern surrounded by the circumscribed rectangle for each partial document image to generate a character code string for each partial document image; Collating the columns and extracting a matching character code string when the number of matching characters is maximized for each partial document image pair; and for all partial document image pairs, a partial document of a character code belonging to the matching character code string Calculating a displacement amount between partial document images from circumscribed rectangular coordinates in the image; and synthesizing a connected document image using displacement amounts of all the partial document image pairs. An image processing method characterized by the following.
【請求項2】 重畳部分を持つ複数の部分文書画像から
これらを連結した文書画像を合成する画像処理方法にお
ける、 各部分文書画像中に存在する文字パタン毎に、該文字パ
タンの外接矩形座標を算出する手順と、 部分文書画像毎に前記外接矩形で囲まれる各文字パタン
の認識を行い、部分文書画像毎の文字コード列を生成す
る手順と、 全ての部分文書画像間で前記文字コード列の照合を行
い、部分文書画像対毎に一致文字数が最大になるときの
一致文字コード列を抽出する手順と、 全ての部分文書画像対について、前記一致文字コード列
に属する文字コードの部分文書画像内の外接矩形座標か
ら部分文書画像間の変位量を算出する手順と、 全ての部分文書画像対についての変位量を用いて連結文
書画像を合成する手順と、 をコンピュータに実行させるプログラムを、該コンピュ
ータが読み取り可能な媒体に記録した、 ことを特徴とする画像処理方法を記録した記録媒体。
2. An image processing method for combining a plurality of partial document images having a superimposed portion and a document image obtained by linking the plurality of partial document images, wherein for each character pattern present in each partial document image, a circumscribed rectangular coordinate of the character pattern is determined. A calculating procedure, a procedure for recognizing each character pattern surrounded by the circumscribed rectangle for each partial document image, and generating a character code string for each partial document image, and a procedure for calculating the character code string between all partial document images. A step of performing matching and extracting a matching character code string when the number of matching characters is maximized for each partial document image pair; and for all partial document image pairs, a partial document image of a character code belonging to the matching character code string Calculating the displacement between the partial document images from the circumscribed rectangle coordinates of the partial document image, and combining the connected document images using the displacement amounts of all the partial document image pairs. A recording medium recording an image processing method, wherein a program to be executed by the computer is recorded on a computer-readable medium.
【請求項3】 重畳部分を持つ複数の部分文書画像から
これらを連結した文書画像を合成する画像処理装置であ
って、 各部分文書画像中に存在する文字パタン毎に、該文字パ
タンの外接矩形座標を算出する手段と、 部分文書画像毎に前記外接矩形で囲まれる各文字パタン
の認識を行い、部分文書画像毎の文字コード列を生成す
る手段と、 全ての部分文書画像間で前記文字コード列の照合を行
い、部分文書画像対毎に一致文字数が最大になるときの
一致文字コード列を抽出する手段と、 全ての部分文書画像対について、前記一致文字コード列
に属する文字コードの部分文書画像内の外接矩形座標か
ら部分文書画像間の変位量を算出する手段と、 全ての部分文書画像対についての変位量を用いて連結文
書画像を合成する手段と、 を具備することを特徴とする画像処理装置。
3. An image processing apparatus for synthesizing a plurality of partial document images having a superimposed portion and combining them into a document image, comprising: for each character pattern present in each partial document image, a circumscribed rectangle of the character pattern; Means for calculating coordinates; means for recognizing each character pattern surrounded by the circumscribed rectangle for each partial document image to generate a character code string for each partial document image; Means for collating the strings and extracting a matching character code string when the number of matching characters is maximized for each partial document image pair; and for all partial document image pairs, a partial document of a character code belonging to the matching character code string Means for calculating the amount of displacement between partial document images from the circumscribed rectangular coordinates in the image, and means for combining connected document images using the amounts of displacement for all pairs of partial document images An image processing apparatus characterized by the above-mentioned.
JP23089697A 1997-08-27 1997-08-27 Image processing method, recording medium recording the method, and image processing apparatus Expired - Fee Related JP3368184B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23089697A JP3368184B2 (en) 1997-08-27 1997-08-27 Image processing method, recording medium recording the method, and image processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23089697A JP3368184B2 (en) 1997-08-27 1997-08-27 Image processing method, recording medium recording the method, and image processing apparatus

Publications (2)

Publication Number Publication Date
JPH1166234A true JPH1166234A (en) 1999-03-09
JP3368184B2 JP3368184B2 (en) 2003-01-20

Family

ID=16915004

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23089697A Expired - Fee Related JP3368184B2 (en) 1997-08-27 1997-08-27 Image processing method, recording medium recording the method, and image processing apparatus

Country Status (1)

Country Link
JP (1) JP3368184B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003216944A (en) * 2002-01-23 2003-07-31 Fujitsu Ltd Device for combining image
US7194144B1 (en) * 1999-01-18 2007-03-20 Fujitsu Limited Document image processing device, document image merging method, and storage medium recording a document image merging program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7194144B1 (en) * 1999-01-18 2007-03-20 Fujitsu Limited Document image processing device, document image merging method, and storage medium recording a document image merging program
JP2003216944A (en) * 2002-01-23 2003-07-31 Fujitsu Ltd Device for combining image

Also Published As

Publication number Publication date
JP3368184B2 (en) 2003-01-20

Similar Documents

Publication Publication Date Title
US20130195351A1 (en) Image processor, image processing method, learning device, learning method and program
RU2621601C1 (en) Document image curvature eliminating
JP2004139484A (en) Form processing device, program for implementing it, and program for creating form format
Ronen et al. Glass: Global to local attention for scene-text spotting
KR101016544B1 (en) Word recognition method and recording medium
JP3368184B2 (en) Image processing method, recording medium recording the method, and image processing apparatus
CN110705554B (en) Image processing method and device
CN111753670A (en) Human face overdividing method based on iterative cooperation of attention restoration and key point detection
JP4793868B2 (en) Writing medium, writing information detection device, writing information detection method, program, and recording medium
JP2020030730A (en) House movement reading system, house movement reading method, house movement reading program, and house loss reading model
Ballerini et al. Craniofacial superimposition in forensic identification using genetic algorithms
JP2023064427A (en) Inference program, learning program, inference method, and learning method
JP2023064439A (en) Learning program, learning method, and information processing apparatus
CN110866939B (en) Robot motion state identification method based on camera pose estimation and deep learning
JP5712415B2 (en) Form processing system and form processing method
CN113065318B (en) Electronic point reading material manufacturing method and device, electronic equipment and storage medium
CN115937906B (en) Occlusion scene pedestrian re-identification method based on occlusion suppression and feature reconstruction
KR20220076079A (en) Map sheet image generation system and method using satellite images
JP7229692B2 (en) Information processing device, information processing method, and program
JP6545563B2 (en) Seal verification program, seal verification method, seal verification device
JP2891211B2 (en) Optical character reader and method
JP3486246B2 (en) Character recognition device
JP3099845B2 (en) Post-processing of pattern recognition
JP2984287B2 (en) Optical character reader
JPS61198385A (en) Character recognizing system

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071108

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081108

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091108

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees