JP2740506B2 - Image recognition method - Google Patents

Image recognition method

Info

Publication number
JP2740506B2
JP2740506B2 JP62039198A JP3919887A JP2740506B2 JP 2740506 B2 JP2740506 B2 JP 2740506B2 JP 62039198 A JP62039198 A JP 62039198A JP 3919887 A JP3919887 A JP 3919887A JP 2740506 B2 JP2740506 B2 JP 2740506B2
Authority
JP
Japan
Prior art keywords
character
graph
recognition
image data
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62039198A
Other languages
Japanese (ja)
Other versions
JPS63206882A (en
Inventor
新子 石谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP62039198A priority Critical patent/JP2740506B2/en
Publication of JPS63206882A publication Critical patent/JPS63206882A/en
Application granted granted Critical
Publication of JP2740506B2 publication Critical patent/JP2740506B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は画像認識方法、詳しくはイメージデータ中の
文字記号パターンから、そのパターンに該当する文字記
号を認識する画像認識方法に関するものである。 [従来の技術] 従来から、原稿読み取り装置でもって入力したイメー
ジデータ中にある文字記号パターンから正規の文字を認
識する文字認識装置がある。この種の装置では、イメー
ジデータ中に文字記号パターンのみが存在していること
を前提としているものであつて、例えば文字記号パター
ンと円グラフパターンとが混在している場合には認識で
きなかつた。更に、この種の文字認識装置では、入力し
た文字パターンそのものから認識処理していた。すなわ
ち認識しようとする文字パターンの置かれている状態或
いは環境から認識処理を補助するということをしていな
かつたため、認識効率という点ではまだ十分とはいえな
かつた。 [発明が解決しようとする問題点] 本発明は、上記従来技術に鑑みなされたものであり、
グラフ内の各項目の数値文字については文字認識処理の
みではなく、グラフの各項目の面積比をも参照すること
で、文字の認識率を向上させる画像認識方法を提供しよ
うとするものである。 [課題を解決するための手段] この課題を解決する本発明の画像認識方法は以下の工
程を行う。すなわち、 グラフ中の比率を示す数値文字に対して文字認識して
得た候補群の中から候補を絞り込む画像認識方法であっ
て、 認識対象の引率を示す文字を含むグラフの画像データ
を格納し、 格納された画像データを細線化し、 細線化後の画像データから前記グラフを構成している
線分を構成している連続する点列を抽出し、 該連続する点列に基づいてベクトル情報を生成し、 生成されたベクトル情報に従ってグラフの各項目の面
積比率を求め、 求められた面積比率を用いて、前記グラフ中の各項目
の数値文字を認識して得られた候補群の中から候補を絞
り込む。 [実施例] 以下添付図面に従つて本発明に係る実施例を詳細に説
明する。 第1図は本実施例の情報認識装置のブロツク構成図で
ある。 図中、1は原稿であり、本実施例におけるこの原稿1
には第2図(a)に示す様に文章情報(“×”は文字を
意味する)と円グラフが既に書かれているものとする。
2は原稿1を光学的に読取る画像読み取り装置である。
3は読み取つたイメージデータを格納するバツフアメモ
リである。4はバツフアメモリ3内に展開されたイメー
ジデータ中の円グラフを認識する円グラフ認識部であ
り、その詳細は後述する。5は文字フオントROM6内の情
報、及び円グラフ認識部4で得られた情報を基に、バツ
フアメモリ3内に展開されたイメージデータ中の文字記
号パターンを認識する文字認識部である。この文字認識
部5で認識された文字パターンは文字フオントROM6から
正規の文字パターンを読出し、表示様のRAMであるVRAM7
に書込む処理をする。このVRAM7に格納された各種パタ
ーンはグラフイツクコントローラGC8でもつてCRT9に表
示する。 更に、10は本装置全体を制御するCPUであり、装置全
体を制御するための制御プログラム(第4図、第6図の
フローチヤート)を格納するROM10aと、CPU10のワーク
エリアとして使用するRAM10bとを備えている。 [円グラフ認識部の説明(第2図(a)〜(c),第3
図)] 上述した構成において、原稿1上の画像が第2図
(a)に示すものとした場合、結局、画像読取り装置2
を介してバツフアメモリ3に格納される画像データも第
2図(a)に示すものとなる。 そして、バツフアメモリ3に画像データが格納される
と、円グラフ認識部4はバツフアメモリ3から画像を読
込んで、イメージデータを細線化し(第2図(b))、
まとまつた点列のみをベクトル化することで第2図
(c)に示す直線と円のパターンのみが抽出される。
尚、この抽出された画像はVRAM7に展開しても良いが、
本実施例では円グラフ認識部4内に設けられた不図示の
RAMに展開されるものとする。 さて、この様にして得られた円グラフを認識すると
き、本実施例では第3図に示す様に、エリアAにおける
角度θ、エリアBの角度θ及びエリアCの角度θ
とから、各エリアにおける円全体に対する角度比(面積
比と等価である)を算出する。 尚、θ+θ+θ=360゜となるから、各エリア
毎の円全体に対する角度比(仮にσABという)
は次式によつて算出される。 すなわち、 さて、上記の式でもつて、算出されたσAB
一例を第4図に示す。また、これらσABは換言
すれば各エリアのパーセンテージ、即ち、原稿1内の円
グラフ中の各エリア内の度数比率を表わす数値文字その
ものを意味することになる。 従つて、文字認識部5でもつて円グラフ中の度数比率
を表わした数値文字を認識するとき(それら文字は他の
文字と比較して小さいこともあり、認識候補が多数発生
することが考えられる)の、複数の候補数値文字の中か
ら1つを選択する要素として用いることができるわけで
ある。 [認識処理の説明(第5図〜第7図)] 以上の円グラフ認識処理を踏まえて、本実施例の処理
の流れを第5図に示すフローチヤートに従つて説明す
る。 先ずステツプS1では原稿画像1を読み込み、バツフア
メモリ3内に格納する。次にステツプS2の円グラフ認識
処理とステツプS4の文字切り出し処置の2つに分かれる
が、先ずステツプS2から説明する。 ステツプS2ではバツフアメモリ3内に格納されたイメ
ージデータを細線化し、ベクトル化して文字パターンを
除く円グラフの認識処理する。次にステツプS3で円グラ
フ内の各エリア毎の度数比率を算出する。 また、ステツプS2,3と並行してステツプS4ではバツフ
アメモリ3内に格納された画像中の文字パターンのみを
切り出し(ステツプS4)て、通常の文字認識処理を実行
する(ステツプS5)。このとき、円グラフ中の文字及び
比率文字も認識対象となる。尚、このステツプS4,S5の
処理はステツプS2,S3と必ずしも並行して処理する必要
はなく、ステツプS2,S3の後でも構わない。また、文字
切り出しであるが、例えばステツプS2でもつて円グラフ
認識されたとき、その円グラフ以外のイメージデータ
(結局、文字パターンとなる)を文字認識すればよい。 さて、ステツプS6では文字認識処理(ステツプS5)の
結果を受けて、円グラフ中の各エリア毎の度数比率の認
識候補群から1つを選択するために、ステツプS3でもつ
て得られた各エリア毎の度数比率値(σAB)を
参照し、最善の認識候補を選択する。 次に、ステツプS7で認識された文字パターンに対応す
る正規の文字パターンを文字フオントROM6から読出し
て、VRAM7に展開し、表示する。尚、このとき、円グラ
フパターンのそのものもVRAM7に転送(必要なら縮小し
て転送)するものとする。 例えばステツプS5で文字認識部5をもつて認識され
た、円グラフ内のエリアA,B,Cの度数比率値の認識候補
文字が第6図に示す様になり、円グラフ認識部4から送
られてきた各エリア毎の度数比率値が第4図(b)に示
す毎くなつた場合のステツプS6での処理は第7図に示す
フローチヤートの様になる。 ステツプS70ではエリアAのσ(=54.5)との差が
最も小さい候補値“55"を認識結果とすることになる。
以下、ステツプS71では“3"を、ステツプS72では“42"
を認識結果とすることになる。 以上説明した毎く、円グラフと文章情報とが混在した
原稿においても、文字パターンのみを切り出して認識す
ることが可能となる。 また、円グラフ中の度数比率値は円グラフそのものか
らある程度予測できるのであるから、この予測の基で、
度数比率値の文字認識の効率は著しく向上することにな
る。 [発明の効果] 以上説明したように本発明によれば、グラフ内の各項
目の数値文字については文字認識処理のみではなく、グ
ラフの各項目の面積比をも参照することで、文字の認識
率を向上させることが可能になる。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image recognition method, and more particularly to an image recognition method for recognizing a character symbol corresponding to a pattern from a character symbol pattern in image data. 2. Description of the Related Art Conventionally, there is a character recognition device that recognizes a regular character from a character symbol pattern in image data input by a document reading device. This type of device is based on the premise that only a character symbol pattern exists in image data, and cannot be recognized when, for example, a character symbol pattern and a pie chart pattern are mixed. . Furthermore, in this type of character recognition device, recognition processing is performed from the input character pattern itself. That is, since the recognition process is not assisted based on the state or environment in which the character pattern to be recognized is placed, the recognition efficiency is still not sufficient. [Problems to be Solved by the Invention] The present invention has been made in view of the above conventional technology,
An object of the present invention is to provide an image recognition method that improves the character recognition rate by referring to not only the character recognition processing but also the area ratio of each item in the graph for the numerical characters of each item in the graph. [Means for Solving the Problems] The image recognition method of the present invention for solving the problems includes the following steps. That is, an image recognition method for narrowing down candidates from a group of candidates obtained by character recognition of numerical characters indicating a ratio in a graph, and storing image data of a graph including a character indicating a trigger to be recognized. Thinning the stored image data, extracting a continuous point sequence forming a line segment forming the graph from the thinned image data, and extracting vector information based on the continuous point sequence. Generating, calculating the area ratio of each item of the graph according to the generated vector information, and using the obtained area ratio, a candidate is selected from a candidate group obtained by recognizing numerical characters of each item in the graph. To narrow down. Embodiment An embodiment according to the present invention will be described below in detail with reference to the accompanying drawings. FIG. 1 is a block diagram of the information recognition apparatus of the present embodiment. In the figure, reference numeral 1 denotes an original, which is the original 1 in this embodiment.
It is assumed that text information ("x" means a character) and a pie graph have already been written as shown in FIG. 2 (a).
Reference numeral 2 denotes an image reading device that optically reads the document 1.
Reference numeral 3 denotes a buffer memory for storing read image data. Reference numeral 4 denotes a pie chart recognizing unit for recognizing a pie chart in the image data developed in the buffer memory 3, the details of which will be described later. Reference numeral 5 denotes a character recognition unit for recognizing a character / symbol pattern in the image data developed in the buffer memory 3 based on the information in the character font ROM 6 and the information obtained by the pie graph recognition unit 4. For the character pattern recognized by the character recognition unit 5, a regular character pattern is read from the character font ROM 6, and a VRAM7 which is a RAM for display is read.
Process to write to. The various patterns stored in the VRAM 7 are also displayed on the CRT 9 by the graphic controller GC8. Further, reference numeral 10 denotes a CPU for controlling the entire apparatus, a ROM 10a for storing a control program (flow charts in FIGS. 4 and 6) for controlling the entire apparatus, and a RAM 10b used as a work area of the CPU 10. It has. [Explanation of Pie Graph Recognition Unit (FIGS. 2A to 2C, 3rd
FIG.)] In the configuration described above, if the image on the document 1 is as shown in FIG.
FIG. 2A also shows the image data stored in the buffer memory 3 via. When the image data is stored in the buffer memory 3, the pie chart recognition unit 4 reads the image from the buffer memory 3 and thins the image data (FIG. 2 (b)).
By vectorizing only the point sequence, only the straight and circular patterns shown in FIG. 2 (c) are extracted.
This extracted image may be expanded in VRAM7,
In the present embodiment, an unillustrated
Assume that it is expanded to RAM. Now, when recognizing the pie chart thus obtained, in the present embodiment, as shown in FIG. 3, the angle θ A in the area A , the angle θ B in the area B, and the angle θ C in the area C.
From this, the angle ratio (equivalent to the area ratio) to the entire circle in each area is calculated. Since θ A + θ B + θ C = 360 °, the angle ratio of each area to the entire circle (tentatively referred to as σ A , σ B , σ C )
Is calculated by the following equation. That is, FIG. 4 shows an example of σ A , σ B , and σ C calculated using the above formula. In addition, these σ A , σ B , and σ C mean the numerical characters themselves representing the percentage of each area, that is, the frequency ratio in each area in the pie chart in the document 1. Therefore, when the character recognizing unit 5 recognizes numerical characters representing the frequency ratio in the pie chart (these characters may be smaller than other characters, and a large number of recognition candidates may be generated). ) Can be used as an element for selecting one from a plurality of candidate numeric characters. [Explanation of Recognition Processing (FIGS. 5 to 7)] Based on the above pie graph recognition processing, the flow of the processing of this embodiment will be described with reference to the flowchart shown in FIG. First, in step S1, the original image 1 is read and stored in the buffer memory 3. Next, the process is divided into a pie graph recognition process in step S2 and a character segmentation process in step S4. First, step S2 will be described. In step S2, the image data stored in the buffer memory 3 is thinned, vectorized, and a pie chart excluding a character pattern is recognized. Next, in step S3, the frequency ratio for each area in the pie graph is calculated. At step S4, only character patterns in the image stored in the buffer memory 3 are cut out (step S4) in parallel with steps S2 and S3, and normal character recognition processing is executed (step S5). At this time, characters in the pie chart and ratio characters are also recognized. Note that the processing in steps S4 and S5 does not necessarily need to be performed in parallel with steps S2 and S3, and may be performed after steps S2 and S3. In the case of character segmentation, for example, when a pie chart is recognized in step S2, image data other than the pie graph (which eventually becomes a character pattern) may be character-recognized. Now, in step S6, based on the result of the character recognition process (step S5), each area obtained in step S3 is selected in order to select one from the recognition candidate group of the frequency ratio for each area in the pie chart. The best recognition candidate is selected with reference to the frequency ratio value (σ A , σ B , σ C ) for each. Next, a regular character pattern corresponding to the character pattern recognized in step S7 is read from the character font ROM 6, expanded in the VRAM 7, and displayed. At this time, the pie chart pattern itself is also transferred to the VRAM 7 (reduced and transferred if necessary). For example, the recognition candidate characters of the frequency ratio values of the areas A, B, and C in the pie graph recognized by the character recognition unit 5 in step S5 are as shown in FIG. The processing in step S6 when the frequency ratio values obtained for each area are as shown in FIG. 4 (b) is as shown in the flowchart of FIG. In step S70, the candidate value “55” having the smallest difference from σ A (= 54.5) of area A is determined as the recognition result.
Hereinafter, “3” is set in step S71, and “42” is set in step S72.
Is the recognition result. As described above, even in a document in which a pie chart and text information are mixed, only a character pattern can be cut out and recognized. In addition, since the frequency ratio value in the pie chart can be predicted to some extent from the pie chart itself, based on this prediction,
The efficiency of character recognition of the frequency ratio value will be significantly improved. [Effects of the Invention] As described above, according to the present invention, character recognition is performed by referring not only to the character recognition processing but also to the area ratio of each item in the graph for numerical characters of each item in the graph. The rate can be improved.

【図面の簡単な説明】 第1図は本実施例のおける文字認識装置のブロツク構成
図、 第2図(a)は原稿画像を示す図、 第2図(b)は細線化したイメージデータを示す図、 第2図(c)は第2図(b)の画像から円グラフを抽出
した画像を示す図、 第3図は円グラフでもつて度数比率値を算出することを
説明するための図、 第4図は円グラフ中の各度数値の算出例を示す図、 第5図は本実施例における文字認識処理の動作フローチ
ヤート、 第6図は本実施例における文字認識部でもつて認識され
た各エリア毎の度数比率値の候補を示す図、 第7図は認識結果となる度数比率値を選択する手順を示
したフローチヤートである。 図中、1……原稿、2……画像読取り装置、3……バツ
フアメモリ、4……円グラフ認識部、5……文字認識
部、6……文字フオントROM、7……VRAM、8……GC、
9……CRT、10……CPU、10a……ROM、10b……RAMであ
る。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram of a character recognition device according to the present embodiment, FIG. 2 (a) is a diagram showing an original image, and FIG. 2 (b) is a diagram showing thinned image data. FIG. 2 (c) is a diagram showing an image obtained by extracting a pie graph from the image of FIG. 2 (b). FIG. 3 is a diagram for explaining calculation of a frequency ratio value by using a pie graph. FIG. 4 is a diagram showing an example of calculation of each frequency value in a pie chart. FIG. 5 is an operation flowchart of a character recognition process in this embodiment. FIG. FIG. 7 is a flowchart showing a procedure for selecting a frequency ratio value to be a recognition result. In the figure, 1 ... original, 2 ... image reading device, 3 ... buffer memory, 4 ... pie graph recognition unit, 5 ... character recognition unit, 6 ... character font ROM, 7 ... VRAM, 8 ... GC,
9 ... CRT, 10 ... CPU, 10a ... ROM, 10b ... RAM.

Claims (1)

(57)【特許請求の範囲】 1.グラフ中の比率を示す数値文字に対して文字認識し
て得た候補群の中から候補を絞り込む画像認識方法であ
って、 認識対象の比率を示す文字を含むグラフの画像データを
格納し、 格納された画像データを細線化し、 細線化後の画像データから前記グラフを構成している線
分を構成している連続する点列を抽出し、 該連続する点列に基づいてベクトル情報を生成し、 生成されたベクトル情報に従ってグラフの各項目の面積
比率を求め、 求められた面積比率を用いて、前記グラフ中の各項目の
数値文字を認識して得られた候補群の中から候補を絞り
込む ことを特徴とする画像認識方法。
(57) [Claims] An image recognition method for narrowing down candidates from a group of candidates obtained by character recognition of numerical characters indicating a ratio in a graph. The obtained image data is thinned, a continuous point sequence forming a line segment forming the graph is extracted from the thinned image data, and vector information is generated based on the continuous point sequence. Calculating the area ratio of each item of the graph according to the generated vector information, and narrowing down candidates from a group of candidates obtained by recognizing numerical characters of each item in the graph using the obtained area ratio. An image recognition method characterized in that:
JP62039198A 1987-02-24 1987-02-24 Image recognition method Expired - Fee Related JP2740506B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62039198A JP2740506B2 (en) 1987-02-24 1987-02-24 Image recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62039198A JP2740506B2 (en) 1987-02-24 1987-02-24 Image recognition method

Publications (2)

Publication Number Publication Date
JPS63206882A JPS63206882A (en) 1988-08-26
JP2740506B2 true JP2740506B2 (en) 1998-04-15

Family

ID=12546424

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62039198A Expired - Fee Related JP2740506B2 (en) 1987-02-24 1987-02-24 Image recognition method

Country Status (1)

Country Link
JP (1) JP2740506B2 (en)

Also Published As

Publication number Publication date
JPS63206882A (en) 1988-08-26

Similar Documents

Publication Publication Date Title
US6185341B1 (en) Image processing using vector data to reduce noise
JP2003308480A (en) On-line handwritten character pattern recognizing editing device and method, and computer-aided program to realize method
JP5231159B2 (en) Person detecting device and method, learning model creating device and method, and program
JPH0981682A (en) Character recognition device, method therefor and computer controller
JP2740506B2 (en) Image recognition method
JPS60136890A (en) Real-time recognition device of hand-written locus
JPH0247788B2 (en)
JPH1049624A (en) Method and device for handwritten character recognition
JPH0830725A (en) Device and method for processing image
JP3320083B2 (en) Character recognition apparatus and method
JPH08202856A (en) Picture processing method
JPH05303644A (en) Grahic recognition method for picture processor
JP2812391B2 (en) Pattern processing method
JPH0589190A (en) Drawing information checking system
JP2000285237A (en) Method and device for picture processing and recording medium with picture processing program recorded
JPS60217483A (en) Recognizer of character
KR20230141582A (en) Method of extracting drawing information from 2-dimensional drawing image in graph structure and method of comparing one drawing image with another drawing image
JPH07141468A (en) Handwritten character recognition processing method in handwriting input character device
JP2019109559A (en) Machine learning apparatus and machine learning program
JPH103518A (en) Method for recognizing character and recording medium and device for recognizing character
JPS62107378A (en) Drawing data managing system
JP2578965B2 (en) Graphic processing unit
JPS63136292A (en) Information recognizing system
JPH07334611A (en) Display method for non-recognized character
JPH07182455A (en) Character recognition device/method

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees