JP2954218B2 - Image processing method and apparatus - Google Patents

Image processing method and apparatus

Info

Publication number
JP2954218B2
JP2954218B2 JP63094571A JP9457188A JP2954218B2 JP 2954218 B2 JP2954218 B2 JP 2954218B2 JP 63094571 A JP63094571 A JP 63094571A JP 9457188 A JP9457188 A JP 9457188A JP 2954218 B2 JP2954218 B2 JP 2954218B2
Authority
JP
Japan
Prior art keywords
contour
contour point
block
image data
character image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63094571A
Other languages
Japanese (ja)
Other versions
JPH01266691A (en
Inventor
正己 久貝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP63094571A priority Critical patent/JP2954218B2/en
Publication of JPH01266691A publication Critical patent/JPH01266691A/en
Application granted granted Critical
Publication of JP2954218B2 publication Critical patent/JP2954218B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、文字画像データの輪郭線の特徴量を抽出す
る画像処理方法及び装置に関するものである。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image processing method and apparatus for extracting a feature amount of a contour line of character image data.

[従来の技術] 従来、2値文字画像データの特徴抽出の方法として、
文字画像データの輪郭点で輪郭線の傾きを4つの方向に
コード化し、その方向コードを全ての輪郭点に対して求
める。そして、画像領域を、例えば4×4のブロツクに
分割した各ブロツク毎に、そのブロツクに含まれる輪郭
点の方向コードのヒストグラムを算出して、4×4×4
(=64個)の方向コードヒストグラムを算出し、それら
を文字画像データの特徴量とする特徴抽出法があつた。
[Prior Art] Conventionally, as a method of extracting features of binary character image data,
The inclination of the outline is coded in four directions at the outline points of the character image data, and the direction codes are obtained for all the outline points. Then, for each block obtained by dividing the image area into, for example, 4 × 4 blocks, a histogram of the direction codes of the contour points included in the block is calculated to obtain 4 × 4 × 4 blocks.
There is a feature extraction method in which (= 64) direction code histograms are calculated, and these are used as feature amounts of character image data.

[発明が解決しようとしている課題] この場合、ブロツク毎の方向コードのヒストグラムを
求めるために、画像領域をそのブロツクに対応する領域
の左上から順次ラスタ走査していき、文字画像の輪郭点
にぶつかる毎にその輪郭点の方向コードをそのブロツク
のものとして計数する方法がとられていた。また、輪郭
点の存在しない部分の無駄な走査を行わない工夫とし
て、各走査ライン毎に輪郭点の最左端と最右端とを記憶
しておき、走査をその画素のみについて行う方法も考え
られていた。しかしながら上述した従来例では、ブロツ
ク毎の方向コードヒストグラムを求めるために、輪郭点
でない画素が大部分含まれる領域を走査するので、はな
はだ非効率であつた。
[Problems to be Solved by the Invention] In this case, in order to obtain a histogram of the direction code for each block, the image area is raster-scanned sequentially from the upper left of the area corresponding to the block, and hits the contour points of the character image. Each time, the direction code of the contour point is counted as that of the block. Further, as a device for preventing unnecessary scanning of a portion having no contour point, a method of storing the leftmost edge and the rightmost edge of the contour point for each scanning line and performing scanning only on that pixel is also considered. Was. However, in the above-described conventional example, an area including most non-outline pixels is scanned in order to obtain a direction code histogram for each block, which is extremely inefficient.

本発明は上記従来例に鑑みてなされたもので、輪郭点
の座標情報とその輪郭点の特徴情報とを組合わせて輪郭
点データを作成し、その輪郭点データの座標情報と文字
画像データの各ブロックの座標値とを比較して、その輪
郭点が存在しているブロックを求めて、そのブロックの
特徴量を求めて、その文字画像全体の特徴量を抽出する
画像処理方法及び装置を提供することを目的とする。
The present invention has been made in view of the above conventional example, and creates contour point data by combining coordinate information of a contour point and characteristic information of the contour point, and generates coordinate data of the contour point data and character image data. Provided is an image processing method and apparatus for comparing a coordinate value of each block to obtain a block in which the contour point is present, obtaining a characteristic amount of the block, and extracting a characteristic amount of the entire character image. The purpose is to do.

[課題を解決するための手段] 上記目的を達成するために本発明の画像処理方法は以
下のような工程を備える。即ち、 文字画像データの輪郭線を追跡して該輪郭線を構成す
る輪郭点の特徴を抽出し、 前記輪郭点の特徴が抽出された場合に、当該抽出され
た輪郭点の座標情報と、当該輪郭点の特徴情報とを組み
合わせて輪郭点データを作成し、 前記作成した輪郭点データの各輪郭点の座標値を順次
読み出し、前記文字画像データを複数ブロックに分割し
た各ブロックの座標値と比較して前記輪郭点データに対
応する輪郭点が存在しているブロックを求め、 当該輪郭点が存在しているブロックの特徴量計数値を
積算する処理を前記文字画像データの全ての輪郭点に対
して実行し、前記ブロックの特徴量計数値を前記文字画
像データの特徴量とすることを特徴とする。
[Means for Solving the Problems] In order to achieve the above object, an image processing method of the present invention includes the following steps. That is, the contour of the character image data is tracked, and the features of the contour points that constitute the contour are extracted. When the features of the contour points are extracted, the coordinate information of the extracted contour points, The contour point data is created by combining the feature information of the contour points, the coordinate values of each contour point of the created contour point data are sequentially read, and the coordinate values of the character image data are divided into a plurality of blocks and compared with the coordinate values of each block. Then, a block in which a contour point corresponding to the contour point data exists is obtained, and a process of integrating the characteristic amount count value of the block in which the contour point exists exists is performed on all the contour points of the character image data. And the feature amount count value of the block is used as the feature amount of the character image data.

また上記目的を達成するため本発明の画像処理装置は
以下のような構成を備える。即ち、 文字画像データの輪郭線を追跡して該輪郭線を構成す
る輪郭点の特徴を抽出する輪郭点特徴抽出手段と、 前記輪郭点特徴抽出手段により輪郭点の特徴が抽出さ
れた場合に、当該抽出された輪郭点の座標情報と、当該
輪郭点の特徴情報とを組み合わせて輪郭点データを作成
する輪郭点データ作成手段と、 前記輪郭点データ作成手段により作成された輪郭点デ
ータの座標値を順次読み出す読出手段と、 前記読出手段により読出された前記座標値と前記文字
画像データを複数ブロックに分割した各ブロックの座標
値とを比較して前記輪郭点データに対応する輪郭点が存
在しているブロックを求めるブロック検出手段と、 前記ブロック検出手段により求められたブロックの特
徴量計数値を積算して前記文字画像データの特徴量とす
る文字画像データ特徴量抽出手段とを有することを特徴
とする。
In order to achieve the above object, the image processing apparatus of the present invention has the following configuration. That is, when a contour point feature extraction unit that tracks a contour line of character image data and extracts a feature of a contour point constituting the contour line, and a contour point feature is extracted by the contour point feature extraction unit, Contour point data creating means for creating contour point data by combining coordinate information of the extracted contour points and feature information of the contour points; coordinate values of the contour point data created by the contour point data creating means Reading means for sequentially reading the coordinate values, and comparing the coordinate values read by the reading means with the coordinate values of each block obtained by dividing the character image data into a plurality of blocks, wherein there is a contour point corresponding to the contour point data. Block detecting means for obtaining a block which is present, and a character image which is a feature quantity of the character image data by integrating a feature quantity count value of the block obtained by the block detecting means. And having a data feature extraction means.

[作用] 以上の構成により、文字画像データの輪郭線を追跡し
て、その輪郭線を構成する輪郭点の特徴を抽出し、それ
ら輪郭点の特徴が抽出された場合に、その抽出された輪
郭点の座標情報と当該輪郭点の特徴情報とを組み合わせ
て輪郭点データを作成し、その作成した輪郭点データの
各輪郭点の座標値を順次読み出し、文字画像データを複
数ブロックに分割した各ブロックの座標値と比較して輪
郭点データに対応する輪郭点が存在しているブロックを
求め、それら輪郭点が存在しているブロックの特徴量計
数値を積算する処理を、その文字画像データの全ての輪
郭点に対して実行し、それらブロックの特徴量計数値を
文字画像データの特徴量とするように動作する。
[Operation] With the configuration described above, the contour of the character image data is tracked, and the features of the contour points constituting the contour are extracted. When the features of the contour points are extracted, the extracted contour is extracted. Creates the contour point data by combining the coordinate information of the point and the characteristic information of the contour point, sequentially reads out the coordinate values of each contour point of the created contour point data, and divides the character image data into a plurality of blocks. The block in which the contour points corresponding to the contour point data are found by comparing the coordinate values of the contour point data, and the process of integrating the feature quantity count value of the block in which the contour points are present is performed on all of the character image data. , And operates so that the feature amount count value of those blocks is used as the feature amount of the character image data.

[実施例] 以下、添付図面を参照して本発明の好適な実施例を詳
細に説明する。
Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.

[機能構成の説明 (第1図)] 第1図は実施例の文字認識装置の機能構成を示すブロ
ツク図である。
[Explanation of Functional Configuration (FIG. 1)] FIG. 1 is a block diagram showing the functional configuration of the character recognition device of the embodiment.

図中、100は、例えば文書原稿を光電的に読取つた2
値デジタル信号の文字画像データを入力して記憶する画
像メモリである。但し、この画像メモリ100は、例えば
既に文字画像データを記憶しているデイスク等の記憶装
置であつてもよい。101は検出した文字の輪郭点を追跡
する輪郭追跡部、102は文字画像の輪郭を追跡して求め
られた各輪郭点の輪郭点コードと、その輪郭点の座標と
の組を順次並べた輪郭点コード配列を作成して記憶する
輪郭点コード配列記憶部である。
In the figure, reference numeral 100 denotes, for example, a document manuscript read photoelectrically.
This is an image memory for inputting and storing character image data of a value digital signal. However, the image memory 100 may be a storage device such as a disk that already stores character image data. 101 is a contour tracking unit that tracks the contour points of the detected character, and 102 is a contour in which a set of the contour point code of each contour point obtained by tracking the contour of the character image and the coordinates of the contour point are sequentially arranged. This is a contour point code array storage unit that creates and stores a point code array.

103は各輪郭点の座標値と次輪郭点との方向を基に、
輪郭点コードを算出する輪郭点コード算出部である。10
4は文字画像データを各ブロツクに分割するブロツク分
割部、105は輪郭点コード配列を順次読出し、各配列要
素の輪郭点が所属するブロツクを決定する所属ブロツク
決定部である。106はブロツクと輪郭点コード別に配列
要素の個数を計数していき、ブロツク別輪郭点コードヒ
ストグラムを作成するブロツク別輪郭点分類部である。
103 is based on the coordinate value of each contour point and the direction of the next contour point,
This is a contour point code calculation unit that calculates a contour point code. Ten
Reference numeral 4 denotes a block dividing unit for dividing the character image data into blocks, and reference numeral 105 denotes a belonging block determining unit for sequentially reading the contour point code array and determining the block to which the contour point of each array element belongs. Reference numeral 106 denotes a block-based contour point classification unit that counts the number of array elements for each block and contour point code, and creates a block-based contour point code histogram.

以下、これら各部の動作を詳しく説明する。 Hereinafter, the operations of these units will be described in detail.

画像メモリ100の文字画像データは1画素1バイトで
構成されており、文字部分(黒)は最下位ビツト(LS
B)が“1"、白部分は最下位ビツトが“0"で示されてい
る。また、最下位ビツト(MSB)は輪郭追跡時、追跡済
みのときに“1"がセツトされるビツトで、輪郭追跡時、
このMSBの値をチエツクすることにより同じ輪郭点が2
度追跡されるのが防止できる。
The character image data of the image memory 100 is composed of one byte per pixel, and the character part (black) is the least significant bit (LS).
B) is "1", and the least significant bit of the white part is "0". Also, the least significant bit (MSB) is a bit that is set to “1” when the contour has been tracked and has already been tracked.
By checking the value of this MSB, the same contour point
Can be prevented from being tracked.

輪郭追跡部101は、画像メモリ100の画像データは最下
位のアドレスよりラスタ走査して文字画像データをチエ
ツクし、前画素が白で現画素が黒、かつ輪郭追跡が未実
施(MSBが“0")の画素を検索していき、その画素が見
つかると、最初のその点を輪郭開始点とする。
The contour tracking unit 101 raster scans the image data in the image memory 100 from the lowest address and checks the character image data. The previous pixel is white, the current pixel is black, and the contour tracking is not performed (MSB is “0”). The pixel of ") is searched, and when the pixel is found, the first point is set as the contour start point.

第3図は輪郭追跡の原理を示す図である。 FIG. 3 is a diagram showing the principle of contour tracking.

ここでは、3×3の画素マトリクス単位で輪郭点の追
跡が行われ、“*”印は現在の輪郭点を示し、“1"〜
“7"を付したのはその周辺画素を示している。いま、前
の輪郭点が“1"で示された画素であるとすると、1つ飛
び越した次の画素を出発点として、画素“3"→“4"…の
順に画素が白か黒かを判定していき、初めて出会つた黒
の画素が次の輪郭点となる。
Here, contour points are tracked in 3 × 3 pixel matrix units, and “*” marks indicate the current contour points, and “1” to
“7” indicates peripheral pixels. Now, assuming that the previous contour point is a pixel indicated by “1”, starting from the next pixel that is one step over, as a starting point, it is determined whether the pixels are white or black in the order of pixels “3” → “4”. The determination is made, and the first black pixel encountered is the next contour point.

次に、輪郭点コード算出部103の動作を説明すると、
前述したようにして輪郭追跡部101により次の輪郭点が
求められると、現輪郭点と次輪郭点とを結ぶ方向を方向
コードとして、輪郭点コードが決定される。この方向コ
ードは第4図に示されるように、4つの方向に対応して
コード化され、“0"〜“3"の4つの値を取り得る。こう
して輪郭点コード算出部103により求められたコード
は、輪郭追跡部101を介して輪郭点コード配列記憶部102
に記憶される。
Next, the operation of the contour point code calculation unit 103 will be described.
When the next contour point is obtained by the contour tracking unit 101 as described above, a contour point code is determined using a direction connecting the current contour point and the next contour point as a direction code. This direction code is coded corresponding to four directions, as shown in FIG. 4, and can take four values "0" to "3". The code obtained by the contour point code calculation unit 103 in this way is transferred to the contour point code array storage unit 102 via the contour tracking unit 101.
Is stored.

このようにして、順次新に求められた次の輪郭点を現
輪郭点として、順次輪郭追跡を実行していき、輪郭点コ
ードと輪郭点座標の組を要素とするコード配列が、輪郭
点コード配列記憶部102に作成される。
In this way, successively following the newly determined next contour point as the current contour point, the contour tracking is sequentially performed, and a code array having a set of a contour point code and a contour point coordinate as an element is a contour point code. It is created in the array storage unit 102.

輪郭点コード配列記憶部102は、輪郭点の輪郭点コー
ドと輪郭点座標(文字画像データの主走査方向をX軸、
副走査方向をY軸としたときのX座標値とY座標値)の
組を要素とする配列R[i](以下、輪郭点コード配列
と呼ぶ。R[i].code:輪郭点コード、R[i].x:X座
標、R[i].y:Y座標)に、現輪郭点の輪郭点コードと
輪郭点座標とを記憶する。
The contour point code array storage unit 102 stores contour point codes and contour point coordinates of the contour points (the main scanning direction of the character image data is the X axis,
An array R [i] (hereinafter, referred to as a contour point code array. R [i] .code: contour point code, in which a set of an X coordinate value and a Y coordinate value when the sub-scanning direction is the Y axis is an element. R [i] .x: X coordinate, R [i] .y: Y coordinate) store the contour point code and the contour point coordinates of the current contour point.

ブロツク分割部104は、画像メモリ100内と文字画像デ
ータの文字枠内を、例えば第5図に示すように4×4の
ブロツクに分割する部分である。こうして、文字画像デ
ータがブロツクに分割されると、所属ブロツク決定部10
5は輪郭点コード配列記憶部102に記憶されている各輪郭
点の座標値を基に、各輪郭点がどのブロツクに存在する
かを判定する。これは、ブロック分割された各ブロツク
の左上点の座標値と右下点の座標値を記憶しておき、そ
れらの座標値と各輪郭点の座標値とを比較して決定す
る。
The block dividing section 104 divides the inside of the image memory 100 and the inside of the character frame of character image data into, for example, 4 × 4 blocks as shown in FIG. Thus, when the character image data is divided into blocks, the belonging block determination unit 10
5 determines which block each contour point exists in based on the coordinate values of each contour point stored in the contour point code array storage unit 102. This is done by storing the coordinate value of the upper left point and the coordinate value of the lower right point of each block divided into blocks, and comparing these coordinate values with the coordinate values of each contour point.

ブロツク別輪郭点分類部106は、輪郭点配列コード記
憶部102よりそのブロツクに含まれる輪郭点の輪郭点コ
ード配列R[i]を順次読出して、ブロツク毎に計数し
て最終的にブロツク別方向コードヒストグラムH[k]
[j](k:ブロツク番号0〜15、j:方向コード0〜3)
を求める。
The block-specific contour point classifying unit 106 sequentially reads the contour point code array R [i] of the contour points included in the block from the contour point array code storage unit 102, counts each block, and finally calculates the block-specific direction. Code histogram H [k]
[J] (k: block number 0-15, j: direction code 0-3)
Ask for.

[文字認識装置の説明 (第2図)] 第2図は上述の動作を行う実施例の文字認識装置の概
略構成を示すブロツク図である。
[Explanation of Character Recognition Apparatus (FIG. 2)] FIG. 2 is a block diagram showing a schematic configuration of the character recognition apparatus of the embodiment which performs the above-described operation.

201はROM203に格納された、第6図のフローチヤート
で示された制御プログラムや各種データに従つて、各種
制御信号を出力して装置全体の制御を行うCPUである。2
02はスキヤナ205より入力した文字画像データ(イメー
ジデータ)を格納するイメージメモリである。204はCPU
201のワークエリアとして使用されるとともに、各種デ
ータを一時保存するRAMである。このRAM204には、前述
した輪郭点コード配列R[i]を記憶するコードアレイ
メモリ204−1、各ブロツク毎のヒストグラムを作成す
るヒストグラムメモリ204−2等を備えている。
A CPU 201 outputs various control signals and controls the entire apparatus according to a control program and various data shown in the flowchart of FIG. Two
An image memory 02 stores character image data (image data) input from the scanner 205. 204 is CPU
This RAM is used as a work area 201 and temporarily stores various data. The RAM 204 includes a code array memory 204-1 for storing the contour point code array R [i] described above, a histogram memory 204-2 for creating a histogram for each block, and the like.

208はCPU201の指示に従つてスキヤナ205の制御を行う
スキヤナコントローラ(SCTR)、205はSCTR208の制御の
基に文字原稿を読取つてデジタル信号で入力するスキヤ
ナである、207は読取つた文字原稿画像や認識結果、更
にはオペレータへの各種メツセージ等を表示するCRT等
のデイスプレイ、209はデイスプレイ206の制御を行うCR
Tコントローラ(CRTC)である。207は認識結果等を出力
するプリンタ、210はプリンタ207を制御するプリンタコ
ントローラ(PRTC)である。
Reference numeral 208 denotes a scanner controller (SCTR) that controls the scanner 205 in accordance with instructions from the CPU 201. Reference numeral 205 denotes a scanner that reads a character original under the control of the SCTR 208 and inputs a digital signal. And a recognition result, and a display such as a CRT for displaying various messages to the operator. A CR 209 controls the display 206.
T controller (CRTC). Reference numeral 207 denotes a printer that outputs a recognition result and the like, and 210 denotes a printer controller (PRTC) that controls the printer 207.

[動作説明 (第1図〜第6図)] 第6図は実施例の文字認識装置における特徴抽出動作
を説明したフローチヤートで、以下このフローチヤート
を基に制御動作を説明する。なお、この動作開始前に
は、イメージメモリ202には既にスキヤナ205或いは他の
装置等より文字画像データが入力されて格納されている
ものとする。
[Explanation of Operation (FIGS. 1 to 6)] FIG. 6 is a flowchart for explaining a feature extracting operation in the character recognition device of the embodiment. Hereinafter, a control operation will be described based on this flowchart. Before the start of the operation, it is assumed that character image data is already input and stored in the image memory 202 from the scanner 205 or another device.

ステツプS1でイメージメモリ202より文字画像データ
を読出し、文字画像を含む文字枠を切出した後、そのイ
メージデータの最下位アドレスより順次ラスタ走査を行
い、前画素が白で現画素が黒でかつ輪郭追跡が未実施の
の画素を検索し、ステツプS2ではその開始点が見つかつ
たかどうかをみる。開始点が見つかるとステツプS3に進
み、その輪郭点と前の輪郭点との位置関係を基に輪郭点
コードを求める。
In step S1, the character image data is read from the image memory 202, a character frame including the character image is cut out, and raster scanning is sequentially performed from the lowest address of the image data, where the previous pixel is white, the current pixel is black and the outline is black. Pixels for which tracking has not been performed are searched, and in step S2, it is determined whether or not the starting point has been found. When the start point is found, the process proceeds to step S3, and a contour point code is obtained based on the positional relationship between the contour point and the previous contour point.

そして、ステツプS4に進み、輪郭点の座標位置に対応
してその輪郭点コードをコードアレイメモリ204−1に
記憶する。そしてステツプS5で次の輪郭点を検出し、ス
テツプS6でその輪郭点がステツプS1で求めた輪郭点(輪
郭開始点)と一致しているかを判別する。ここで開始点
と一致していなければステツプS3に戻り前述の動作を実
行する。開始点と一致するとき、即ち、閉じた輪郭線が
検出されたときはステツプS1、S2に戻り、他の輪郭開始
点が存在するかをみる。こうして切出された文字枠内の
文字画像データに対する輪郭線が全て検出されるとステ
ツプS7に進む。
Then, the process proceeds to step S4, and the contour point code is stored in the code array memory 204-1 corresponding to the coordinate position of the contour point. Then, in step S5, the next contour point is detected, and in step S6, it is determined whether the contour point matches the contour point (contour start point) obtained in step S1. If not coincident with the start point, the flow returns to step S3 to execute the above-described operation. If it coincides with the start point, that is, if a closed contour is detected, the process returns to steps S1 and S2 to check whether another contour start point exists. When all the contour lines for the character image data in the character frame thus cut out are detected, the process proceeds to step S7.

ステツプS7ではイメージメモリ202の文字画像データ
を、例えば4×4のブロツクに分割し、ステツプS8でコ
ードアレイメモリ204−1より輪郭点コード配列を読出
し、ステツプS9でそれら輪郭点がどのブロツク内に存在
しているかを判定する。これは前述したように、各ブロ
ツクの左上の座標値と右下の座標値と、各輪郭点の座標
値とを比較して、その輪郭点がそのブロツク内に存在す
るかどうかを判定する。
In step S7, the character image data in the image memory 202 is divided into, for example, 4 × 4 blocks. In step S8, the outline point code array is read out from the code array memory 204-1. In step S9, those outline points are stored in any block. Determine if it exists. As described above, the coordinate value of the upper left corner and the coordinate value of the lower right corner of each block are compared with the coordinate value of each contour point to determine whether or not the contour point exists in the block.

こうしてステツプS10で、輪郭点コードR[i].code
と所属するブロツク番号m(mは0〜15)に対応するヒ
ストグラムメモリ204−2のブロツク別方向コードヒス
トグラムH[m][R[i].code]を+1する。こう
してステツプS11でコードアレイメモリ204−1に格納さ
れた全ての輪郭点コード配列R[i]に対する処理が終
了すると、その文字画像データの特徴量としてのブロツ
ク別方向コードヒストグラムH[m][j](jは方向
コード)が完成する。
Thus, in step S10, the contour point code R [i] .code
+1 is added to the block-specific directional code histogram H [m] [R [i] .code] of the histogram memory 204-2 corresponding to the block number m (m is 0 to 15) belonging to When the processing for all the outline point code arrays R [i] stored in the code array memory 204-1 is completed in step S11, the block-specific directional code histogram H [m] [j as the characteristic amount of the character image data is obtained. ] (J is the direction code) is completed.

以上説明したようにこの実施例によれば、輪郭点の追
跡時に輪郭点コードを求めてコード配列型式で記憶して
おくことにより、文字画像データの走査は輪郭追跡を行
うための1回のラスタ走査だけでよく、ブロツク別方向
コードやヒストグラムの作成のための走査を要しないた
め、文字画像データの特徴抽出が高速に行える効果があ
る。
As described above, according to this embodiment, the contour point code is obtained at the time of contour point tracking and stored in a code array format, so that the character image data can be scanned by one raster scan for contour tracking. Since only scanning is required and scanning for creating a block-specific direction code and a histogram is not required, there is an effect that the feature extraction of character image data can be performed at high speed.

[他の実施例 (第7図)] 第7図は他の実施例を説明するためのブロツク図で、
第1図と共通な部分は同一記号で示されている。
[Other Embodiment (FIG. 7)] FIG. 7 is a block diagram for explaining another embodiment.
Parts common to FIG. 1 are indicated by the same symbols.

ここでは特徴量としてブロツク別輪郭点ヒストグラム
を求める例を説明しており、ここでは各ブロツク内に含
まれる輪郭点の個数をブロツク毎に求めれば良いので、
第1図の場合に比べて輪郭点コード算出部103が不要に
なる。また、輪郭点コード配列記憶部102′は輪郭点の
座標のみを要素とする配列のみを記憶すれば良い。従つ
て、この場合は第6図のステツプS10、即ち、ブロツク
別輪郭点分類部106′では、所属ブロツク番号mに対し
て、ブロツク別輪郭点ヒストグラムH[m]を+1する
だけで良い。
Here, an example in which a block-specific contour point histogram is obtained as a feature value is described. Here, the number of contour points included in each block may be obtained for each block.
The contour point code calculation unit 103 is not required as compared with the case of FIG. Further, the contour point code array storage unit 102 'only needs to store only the array having only the coordinates of the contour points as elements. Therefore, in this case, in step S10 in FIG. 6, that is, in the block-specific contour point classifying unit 106 ', it is only necessary to increment the block-specific contour point histogram H [m] by 1 for the block number m.

以上説明したように本実施例によれば、文字画像デー
タを再度ラスタ走査して特徴抽出する場合に比べて、処
理時間が大幅に短くなり、その処理時間の比はおよそ
(輪郭画素数)/(全画素数)となり、この値は約1/10
0〜1/10程度にもなる。
As described above, according to the present embodiment, the processing time is greatly reduced as compared with the case where the character image data is raster-scanned again to extract features, and the ratio of the processing time is approximately (number of contour pixels) / (Total number of pixels), which is about 1/10
It will be about 0 to 1/10.

[発明の効果] 以上説明したように本発明によれば、文字画像データ
の特徴量を抽出するに際して、文字画像データの輪郭点
の特徴が抽出された場合に、その輪郭点が含まれるブロ
ックの特徴量計数値のみをインクリメントすればよいの
で、文字画像データを構成する、輪郭点の存在しない座
標を含んだ全座標にわたってラスタスキャンして調べる
必要がなく、文字画像データの特徴量の抽出に要する処
理を効率的に、かつ短時間で行うことができるという効
果がある。
[Effects of the Invention] As described above, according to the present invention, when extracting a feature amount of character image data, if a feature of an outline point of the character image data is extracted, a block of the block including the outline point is extracted. Since only the feature amount count value needs to be incremented, it is not necessary to perform raster scan on all the coordinates constituting the character image data, including the coordinates where there is no contour point, to check, and it is necessary to extract the feature amount of the character image data. There is an effect that processing can be performed efficiently and in a short time.

【図面の簡単な説明】[Brief description of the drawings]

第1図は実施例の文字画像データの特徴抽出の機能構成
を示すブロツク図、 第2図は実施例の文字認識装置の概略構成を示すブロツ
ク図、 第3図は輪郭点の検出を説明した図、 第4図は輪郭点における方向コードの例を示す図、 第5図は文字画像データのブロツク分割例を示す図、 第6図は実施例の文字認識装置における特徴抽出処理を
示すフローチヤート、そして、 第7図は他の実施例の特徴抽出法を示す機能ブロツク図
である。 図中、100……画像メモリ、101……輪郭追跡部、102…
…輪郭点コード配列記憶部、103……輪郭点コード算出
部、104……ブロツク分割部、105……所属ブロツク決定
部、106……ブロツク別輪郭点分類部、201……CPU、202
……イメージメモリ、203……ROM、204……RAM、204−
1……コードアレイメモリ、204−2……ヒストグラム
メモリ、205……スキヤナ、206……デイスプレイ、207
……プリンタである。
FIG. 1 is a block diagram showing a functional configuration of the feature extraction of character image data of the embodiment, FIG. 2 is a block diagram showing a schematic configuration of a character recognition device of the embodiment, and FIG. FIG. 4, FIG. 4 is a diagram showing an example of a direction code at an outline point, FIG. 5 is a diagram showing an example of block division of character image data, and FIG. 6 is a flowchart showing a feature extraction process in the character recognition device of the embodiment. FIG. 7 is a functional block diagram showing a feature extracting method according to another embodiment. In the figure, 100: image memory, 101: contour tracking unit, 102:
... Contour point code array storage section, 103... Contour point code calculation section, 104... Block division section, 105... Belonging block determination section, 106.
…… Image memory, 203… ROM, 204… RAM, 204−
1. Code array memory, 204-2 Histogram memory, 205 Scanner, 206 Display, 207
... It is a printer.

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】文字画像データの輪郭線を追跡して該輪郭
線を構成する輪郭点の特徴を抽出し、 前記輪郭点の特徴が抽出された場合に、当該抽出された
輪郭点の座標情報と、当該輪郭点の特徴情報とを組み合
わせて輪郭点データを作成し、 前記作成した輪郭点データの各輪郭点の座標値を順次読
み出し、前記文字画像データを複数ブロックに分割した
各ブロックの座標値と比較して前記輪郭点データに対応
する輪郭点が存在しているブロックを求め、 当該輪郭点が存在しているブロックの特徴量計数値を積
算する処理を前記文字画像データの全ての輪郭点に対し
て実行し、前記ブロックの特徴量計数値を前記文字画像
データの特徴量とすることを特徴とする画像処理方法。
1. A contour line of character image data is traced to extract features of contour points constituting the contour line. When the features of the contour point are extracted, coordinate information of the extracted contour point is extracted. And the feature information of the contour points are combined to create contour point data, the coordinate values of each contour point of the created contour point data are sequentially read, and the coordinates of each block obtained by dividing the character image data into a plurality of blocks The block in which the contour point corresponding to the contour point data is present is determined by comparing the value of the block with the contour point data, and the process of integrating the feature count of the block in which the contour point is present is performed on all the contours of the character image data An image processing method executed for a point, wherein a feature amount count value of the block is used as a feature amount of the character image data.
【請求項2】文字画像データの輪郭線を追跡して該輪郭
線を構成する輪郭点の特徴を抽出する輪郭点特徴抽出手
段と、 前記輪郭点特徴抽出手段により輪郭点の特徴が抽出され
た場合に、当該抽出された輪郭点の座標情報と、当該輪
郭点の特徴情報とを組み合わせて輪郭点データを作成す
る輪郭点データ作成手段と、 前記輪郭点データ作成手段により作成された輪郭点デー
タの座標値を順次読み出す読出手段と、 前記読出手段により読出された前記座標値と前記文字画
像データを複数ブロックに分割した各ブロックの座標値
とを比較して前記輪郭点データに対応する輪郭点が存在
しているブロックを求めるブロック検出手段と、 前記ブロック検出手段により求められたブロックの特徴
量計数値を積算して前記文字画像データの特徴量とする
文字画像データ特徴量抽出手段と、 を有することを特徴とする画像処理装置。
2. A contour point feature extracting means for tracing a contour line of character image data and extracting features of contour points constituting the contour line, wherein the contour point feature is extracted by the contour point feature extracting means. In this case, contour point data creating means for creating contour point data by combining coordinate information of the extracted contour points and feature information of the contour points, and contour point data created by the contour point data creating means Reading means for sequentially reading the coordinate values of the above, and comparing the coordinate values read by the reading means with the coordinate values of each of the blocks obtained by dividing the character image data into a plurality of blocks, the contour points corresponding to the contour point data. A block detecting means for obtaining a block in which a character exists, and a sentence as a feature quantity of the character image data by integrating a feature quantity count value of the block obtained by the block detecting means. An image processing apparatus comprising: character image data feature amount extraction means;
JP63094571A 1988-04-19 1988-04-19 Image processing method and apparatus Expired - Fee Related JP2954218B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63094571A JP2954218B2 (en) 1988-04-19 1988-04-19 Image processing method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63094571A JP2954218B2 (en) 1988-04-19 1988-04-19 Image processing method and apparatus

Publications (2)

Publication Number Publication Date
JPH01266691A JPH01266691A (en) 1989-10-24
JP2954218B2 true JP2954218B2 (en) 1999-09-27

Family

ID=14113990

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63094571A Expired - Fee Related JP2954218B2 (en) 1988-04-19 1988-04-19 Image processing method and apparatus

Country Status (1)

Country Link
JP (1) JP2954218B2 (en)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59135579A (en) * 1983-01-21 1984-08-03 Fuji Electric Co Ltd Pattern contour tracing method
JPS62192886A (en) * 1986-02-20 1987-08-24 Ricoh Co Ltd Feature quantity generating method in character recognizing device
JPH0766417B2 (en) * 1986-07-29 1995-07-19 松下電器産業株式会社 Character recognition device
JPS63108480A (en) * 1986-10-25 1988-05-13 Fuji Electric Co Ltd System for reading two-dimensional image
JPH061504B2 (en) * 1987-05-27 1994-01-05 富士電機株式会社 Feature extraction circuit

Also Published As

Publication number Publication date
JPH01266691A (en) 1989-10-24

Similar Documents

Publication Publication Date Title
US5048107A (en) Table region identification method
EP0843275B1 (en) Pattern extraction apparatus and method for extracting patterns
JPS6159568A (en) Document understanding system
US4891750A (en) Optical character recognition by forming and detecting matrices of geo features
US5164996A (en) Optical character recognition by detecting geo features
EP0513678A2 (en) Fast character segmentation of skewed text lines for optical character recognition
JPH08287184A (en) Picture cutting-out device and character recognition device
CN111126266A (en) Text processing method, text processing system, device, and medium
JP2000331156A (en) Method for automatically deciding tracker set along outline and storage medium storing program for execution of the method
JP2954218B2 (en) Image processing method and apparatus
JP3149221B2 (en) Image processing device
JP3172498B2 (en) Image recognition feature value extraction method and apparatus, storage medium for storing image analysis program
JPS62121589A (en) Character segmenting system
JP2803736B2 (en) Character recognition method
JP2902097B2 (en) Information processing device and character recognition device
JP2755299B2 (en) Image processing method
JP2800205B2 (en) Image processing device
JP2933947B2 (en) Image processing method and apparatus
JP2931041B2 (en) Character recognition method in table
JP2926842B2 (en) Character extraction circuit
JPS6343788B2 (en)
JPS63131287A (en) Character recognition system
JPS6214263A (en) Document picture processing system
JPH05242297A (en) Character segmenting method
JPH0652156A (en) Method and device for processing document

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees