JPH01266689A - Image recognition device - Google Patents

Image recognition device

Info

Publication number
JPH01266689A
JPH01266689A JP63094568A JP9456888A JPH01266689A JP H01266689 A JPH01266689 A JP H01266689A JP 63094568 A JP63094568 A JP 63094568A JP 9456888 A JP9456888 A JP 9456888A JP H01266689 A JPH01266689 A JP H01266689A
Authority
JP
Japan
Prior art keywords
character
recognition
characters
extracting
circle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63094568A
Other languages
Japanese (ja)
Inventor
Shinko Ishitani
石谷 新子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP63094568A priority Critical patent/JPH01266689A/en
Publication of JPH01266689A publication Critical patent/JPH01266689A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To obtain a device to recognize a document and a graphic on an original precisely by extracting the graphic from image information by a graphic recognizing means, and extracting and recognizing a character and a mark related to the graphic by a character string recognizing means. CONSTITUTION:The original 1 is read by an image reader 2, and the image information of the original is stored in a buffer memory 3. A circular graph recognition part 4 recognizes a circular graph in the image information developed on the memory 3. A character recognition part 5 recognizes a character pattern in the image information developed in the memory 3 based on information in a character font ROM 6 and the information obtained at the recognition part 4. The character pattern recognized at the recognition part 5 reads out a corresponding character pattern from the ROM 6, and performs a processing to write it on a VRAM 7 that is a RAM for display. Also, a various kinds of patterns stored in the VRAM 7 are displayed on a CRT 9 by a graphic control GC 8. A CPU 10 controls the whole of the device.

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は画像認識装置、特に原稿から入力された画像情
報から文字を認識する能力をもつ画像認識装置に関する
ものである。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to an image recognition device, and particularly to an image recognition device capable of recognizing characters from image information input from a document.

[従来の技術] 従来から、原稿読み取り装置から入力した画像情報中に
あるパターンから文字を認識する文字認識装置がある。
[Prior Art] Conventionally, there have been character recognition devices that recognize characters from patterns in image information input from a document reading device.

この文字認識装置により、手書きした原稿等を活字等の
清書体にするばかりでなく、認識したパターンをコード
化(多くの場合にはJISコード化)することにより、
例えば外部記憶装置に記憶するときに少量のデータに圧
縮することもできる。
This character recognition device not only converts handwritten manuscripts into typeface, but also converts recognized patterns into codes (JIS codes in most cases).
For example, the data can be compressed into a small amount of data when stored in an external storage device.

[発明が解決しようとする課題] しかし、この種の装置で認識対象となる原稿あるいは画
像情報は、文字記号パターンのみの存在を前提としてい
るものである。従って、図形パターンのみの原稿、ある
いは文字記号パターンと図・形パターンとが混在してい
る原稿の場合には、図形パターンを認識できないといっ
た欠点がある。
[Problems to be Solved by the Invention] However, the document or image information to be recognized by this type of device is premised on the existence of only character symbol patterns. Therefore, in the case of a document containing only graphic patterns or a document containing a mixture of character/symbol patterns and figure/shape patterns, there is a drawback that the graphic pattern cannot be recognized.

更に、図形パターンを認識できるものでも、図形の付近
に存在する文字列が図形の一部であるか文章の一部であ
るかを区別できないため、文章の認識及び図形の認識が
正確にできないという欠点がある。
Furthermore, even if a device can recognize graphic patterns, it cannot distinguish whether a character string near a graphic is part of the graphic or a text, making it unable to accurately recognize text and shapes. There are drawbacks.

本発明は、前記従来例の欠点を除去し、原稿上の文書と
図形とを正確に認識する画像認識装置を提供する。
The present invention eliminates the drawbacks of the conventional example and provides an image recognition device that accurately recognizes documents and figures on a manuscript.

また、図形が円グラフの場合に、引き出し線を抽出して
認識することにより、円グラフの付近にある文字列を認
識する画像認識装置を提供する。
Furthermore, when the figure is a pie chart, an image recognition device is provided that recognizes character strings near the pie chart by extracting and recognizing leader lines.

更に、図形が円グラフの場合に、仕切り線と円弧で囲ま
れた扇形領域を抽出し、その延長領域に文字領域全体又
は1部が含まれることを調べることにより、円グラフの
外側付近にある文字列を認識する画像認識装置を提供す
る。
Furthermore, when the figure is a pie chart, by extracting the fan-shaped area surrounded by the partition line and arc and checking whether the entire character area or a part of the character area is included in the extended area, An image recognition device that recognizes character strings is provided.

[課題を解決するための手段] この課題を解決するために、本発明の画像認識装置は、
文章と図形とが混在する画像情報を入力する入力手段と
、該入力手段より入力された前記画像情報から図形を抽
出して、該図形の特徴を認識する図形認識手段と、該図
形認識手段の認識結果に基づいて、前記図形と関連する
文字及び記号を抽出することにより、前記文字及び記号
を認識する文字列認識手段とを備える。
[Means for Solving the Problem] In order to solve this problem, the image recognition device of the present invention has the following features:
an input means for inputting image information in which text and figures are mixed; a figure recognition means for extracting a figure from the image information inputted from the input means and recognizing characteristics of the figure; The apparatus further includes character string recognition means for recognizing the characters and symbols by extracting the characters and symbols associated with the graphics based on the recognition results.

前記図形認識手段は、円を抽出する円抽出手段と、該円
の中心と円周とを結ぶ直線を抽出して仕切り線とする仕
切り線認識手段とを備える。
The figure recognition means includes a circle extraction means for extracting a circle, and a partition line recognition means for extracting a straight line connecting the center and circumference of the circle and using it as a partition line.

前記文字列認識手段は、前記仕切り線以外の直線のうち
、少なくとも一端が前記円の外にある直線を抽出して引
き出し線とする切り出し線認識手段を備える。
The character string recognition means includes a cut-out line recognition means that extracts a straight line having at least one end outside the circle from among the straight lines other than the partition line and uses it as a lead line.

又、前記文字列認識手段は、前記仕切り線と円弧で囲ま
れた扇形の延長領域の文字及び記号を抽出する文字列抽
出手段を備える。
Further, the character string recognition means includes a character string extraction means for extracting characters and symbols in a fan-shaped extension area surrounded by the partition line and the arc.

[作用] かかる構成において、図形認識手段により、入力手段よ
り入力された画像情報から図形を抽出し、文字列認識手
段は、該図形認識手段の認識結果に基づいて、前記図形
と関連する文字及び記号を抽出することにより、前記文
字及び記号を認識する。
[Operation] In this configuration, the figure recognition means extracts a figure from the image information input from the input means, and the character string recognition means extracts the characters and characters associated with the figure based on the recognition result of the figure recognition means. The characters and symbols are recognized by extracting the symbols.

前記図形認識手段は、円抽出手段により円を抽出し、仕
切り線認識手段により仕切り線を認識し、入力された前
記画像情報から円グラフを抽出して認識する。
The figure recognition means extracts a circle using a circle extraction means, recognizes a partition line using a partition line recognition means, and extracts and recognizes a pie chart from the inputted image information.

前記文字列認識手段は、切り出し線認識手段により、前
記仕切り線以外の直線のうち、少なくとも一端が前記内
の外にある直線を抽出して引き出し線とし、該引き出し
線と所定の関係にある文字及び記号を前記円グラフの比
率を示す文字列とする。
The character string recognition means uses the extraction line recognition means to extract a straight line having at least one end outside the inside from among the straight lines other than the partition line as a leader line, and extracts a character having a predetermined relationship with the leader line. and symbols are character strings indicating the ratio of the pie chart.

又、前記文字列認識手段は、文字列抽出手段により、前
記仕切り線と円弧で囲まれた扇形の延長領域の文字及び
記号を抽出し、該文字及び記号を前記円グラフの比率を
示す文字列とする。
Further, the character string recognition means extracts characters and symbols in a sector-shaped extension area surrounded by the partition line and the arc, and converts the characters and symbols into a character string indicating the ratio of the pie chart. shall be.

[実施例] 以下、添付図面に従って、本発明の画像認識装置の実施
例を詳細に説明する。
[Embodiments] Hereinafter, embodiments of the image recognition apparatus of the present invention will be described in detail with reference to the accompanying drawings.

第1図は、本実施例の画像認識装置のブロック構成図で
ある1図中、1は原稿であり、2は原稿を光学的に読み
取る画像読み取り装置である。
FIG. 1 is a block diagram of the image recognition apparatus according to the present embodiment. In FIG. 1, 1 is a document, and 2 is an image reading device that optically reads the document.

3は読み取った画像情報を格納するバッファメモリ、4
はバッファメモリ3内に展開された画像情報中の円グラ
フを認識する円グラフ認識部、5は文字フォントROM
e内の情報及び円グラフ認識部4で、得られた情報を基
に、バッファメモリ3内に展開された画像情報中の文字
記号パターンを認識する文字認識部である。
3 is a buffer memory for storing read image information; 4
5 is a pie chart recognition unit that recognizes a pie chart in the image information developed in the buffer memory 3, and 5 is a character font ROM.
This is a character recognition unit that recognizes the character symbol pattern in the image information developed in the buffer memory 3 based on the information in e and the information obtained by the pie chart recognition unit 4.

この文字認識部5で認識された文字パターンは、文字フ
ォントROM6から対応する文字パターンを読出し、表
示用のRAMであるVRAM7に書込む処理をする。ま
た、このVRAM7に格納された各種パターンは、グラ
フィックコントローラGC8によりCRT9に表示され
る。
The character pattern recognized by the character recognition unit 5 is processed by reading the corresponding character pattern from the character font ROM 6 and writing it into the VRAM 7 which is a display RAM. Further, the various patterns stored in this VRAM 7 are displayed on the CRT 9 by the graphic controller GC8.

更に、10は本装置全体を制御するCPtJであり、装
置全体を制御するための制御プログラムを格納するRO
M10aと、CPUl0のワークエリアとして使用する
RAM10bとを備えている。
Furthermore, 10 is a CPtJ that controls the entire device, and an RO that stores a control program for controlling the entire device.
The RAM 10b is used as a work area for the CPU 10.

以上の構成における本装置の基本的な処理手順を、第2
図に示すフローチャートに従って説明する。先ずステッ
プS1では、イメージスキャナ等の画像読み取り装置2
より原稿1を読み込み、バッファメモリ2に格納する0
次にステップS2では、細線化処理を行う。ステップS
3で文字パターンと図形パターンとを判別する。この判
別の基準は、例えば線分の長さが短いものは文字パター
ンの一部、長いものは図形パターンの一部と判断する。
The basic processing procedure of this device with the above configuration is explained in the second section.
The explanation will be given according to the flowchart shown in the figure. First, in step S1, an image reading device 2 such as an image scanner is used.
Read original 1 from 0 and store it in buffer memory 2.
Next, in step S2, thinning processing is performed. Step S
In step 3, character patterns and graphic patterns are discriminated. The criteria for this determination is, for example, if a line segment is short, it is determined to be part of a character pattern, and if it is long, it is determined to be part of a graphic pattern.

文字パターンの場合は、ステップS9に進んで、文字切
り出しステップSIOで文字を認識してステップSll
で表示する。
If it is a character pattern, proceed to step S9, recognize the character in character extraction step SIO, and proceed to step Sll.
Display in .

一方、図形パターンの一部と判断された場合はステtツ
ブS4に進んで、ステップS4では点列に分けて該点列
毎に直線近似を行って直線化した結果のベクトルを得る
。第3図は画像情報をベクトル情報にする過程を示した
ものである。次に、ステップS5では、ステップS4で
得られたベクトルをもとに円の中心点を算出し、この中
心点を基に半径を求める。
On the other hand, if it is determined that it is part of a graphic pattern, the process proceeds to step S4, where the point sequence is divided into point sequences, linear approximation is performed for each point sequence, and a linearized vector is obtained. FIG. 3 shows the process of converting image information into vector information. Next, in step S5, the center point of the circle is calculated based on the vector obtained in step S4, and the radius is determined based on this center point.

円の中心点を算出するアルゴリズムについて第4図で詳
しく説明する。今、ベクトルがVO。
The algorithm for calculating the center point of the circle will be explained in detail with reference to FIG. Vector is now VO.

■、・・・vn個存在する場合には、ベクトルの垂直二
等分線は、氾3.λ2.氾、・・・β、本できる。
■,... If there are vn pieces, the perpendicular bisector of the vector is 3. λ2. Flood...β, I can write a book.

℃1とβ、の交点、β、とβ3の交点・・・、ρ、と4
1の交点、β2とβ8、β、とβ4・・・、β2とβn
、f13と124、Asとf2s・・・、ρ、と12.
 *a*11n−1と47の交点を算出していくと、全
部で(n−1)1個の交点が算出される0次に、該交点
の座標値(x、y)の分布のヒストグラムを作成すると
、第5図に示すように一部(傾斜部分)に交点が集中す
る。従って、この領域の中間値(Xwamx * Vw
a□)を円グラフの円の中心座標と決定する。
Intersection of ℃1 and β, intersection of β and β3..., ρ, and 4
1 intersection, β2 and β8, β and β4..., β2 and βn
, f13 and 124, As and f2s..., ρ, and 12.
When the intersections of *a*11n-1 and 47 are calculated, a total of (n-1) 1 intersections are calculated. Next, the histogram of the distribution of the coordinate values (x, y) of the intersections. When , the intersection points are concentrated in a part (slanted part) as shown in FIG. Therefore, the intermediate value (Xwamx * Vw
Determine a□) as the center coordinates of the circle of the pie chart.

次に、このようにして求められた中心座標(xs□+ 
ym□)から、さらにベクトル■l。
Next, the center coordinates (xs□+
From ym□), further vector ■l.

Vs、Vs・・・vnにそれぞれ中線を引くと、全部で
n本の中線が出来る。この中線とベクトル間の角度をα
1.α2・・・α。とすると、・an>07(θ7はス
レッショルド)ならばVnは円の一部を形成する円ベク
トル、又α7≦θ丁ならばv7は直線を形成する直線ベ
クトルと認識する。
If we draw a median line on each of Vs, Vs...vn, a total of n median lines will be created. The angle between this median line and the vector is α
1. α2...α. Then, if an>07 (θ7 is a threshold), Vn is recognized as a circular vector forming a part of a circle, and if α7≦θd, v7 is recognized as a straight line vector forming a straight line.

第6図では、α。〉θアなのでvIは円ベクトル、そし
てα7〉0丁なのでV、は直線エレメントとなる。この
ようにして、すべてのベクトルを円工・レメントと直線
エレメントに分類し、円エレメントと中心点を結ぶ直線
の長さをヒストグラムにとりピーク値を半径と定める。
In Figure 6, α. Since 〉θa, vI is a circular vector, and since α7〉0, V is a straight line element. In this way, all vectors are classified into circular elements, element elements, and straight line elements, and the length of the straight line connecting the circular element and the center point is made into a histogram, and the peak value is determined as the radius.

第7図(a)は、この半径の抽出アルゴリズムを図化し
たもので、中心点(Xmax 、V□8)と円エレメン
トγ1とすると、γ1.γ2.γ3・・・γ。とデータ
ができる。このデータをヒストグラムにとると第7図(
b)に示すようなヒストグラムが得られ、このピーク値
が円の半径の値となる。
FIG. 7(a) is a diagram of this radius extraction algorithm, where the center point (Xmax, V□8) and the circular element γ1 are γ1. γ2. γ3...γ. and data can be created. When this data is plotted as a histogram, Figure 7 (
A histogram as shown in b) is obtained, and this peak value becomes the value of the radius of the circle.

このようにして中心座標と半径が求められ、円を認識す
ることができる。
In this way, the center coordinates and radius are determined, and a circle can be recognized.

また、円の半径が求まると、円エレメントの中でも中心
点(xl、8.y、、、)からの距離が半径の長さと異
なるエレメントは、新たに直線エレメントとみなされる
。このようにして、抽出した直線エレメントの中から、
次に仕切り線と引き出し線とを抽出していく。
Furthermore, when the radius of the circle is determined, among the circular elements, elements whose distance from the center point (xl, 8.y, . . . ) is different from the length of the radius are newly regarded as linear elements. In this way, from the extracted straight line elements,
Next, partition lines and leader lines are extracted.

ステップS6では、まず仕切り線の抽出を行う。両端の
点座標が、円の内側にある直線エレメントを仕切り線と
認識した後、ステップS7では、のこりの直線エレメン
トの中から、少なくとも1端が円の外側にある直線エレ
メントを、引き出し線と認識している。第8図は、すべ
てのエレメントを、円エレメント、仕切り線、引き出し
線に分類した図である。このように円エレメント。
In step S6, partition lines are first extracted. After recognizing a straight line element whose point coordinates at both ends are inside the circle as a partition line, in step S7, from among the remaining straight line elements, a straight line element whose at least one end is outside the circle is recognized as a leader line. are doing. FIG. 8 is a diagram in which all elements are classified into circle elements, partition lines, and leader lines. A circle element like this.

仕切り線、引き出し線を抽出した後は、ステップS8で
、引き出し線の円の外側の端の位置をもとに、比率を表
す文字等の文字領域を抽出する。
After extracting the partition line and leader line, in step S8, a character area such as a character representing a ratio is extracted based on the position of the outer end of the circle of the leader line.

第9図で示すように、引き出し線の先端P1にもっと近
い文字ベクトルU+を抽出する0次に、このUlの先端
から半径70以内に端がある文字ベクトルU2を捜し、
同様の処理を行っていくと、=Ut 、Us 、Us・
・・U、が求まり、引き出し線で導かれる文字等を抽出
し、これを比率(パーセント)を表す文字列であると認
識することができる。その後、ステップS9では文字の
切り出しを行い、ステップSIOで文字の認識を行う、
ステップSllで認識結果を表示する。
As shown in FIG. 9, a character vector U+ that is closer to the tip P1 of the leader line is extracted. Next, a character vector U2 whose end is within a radius of 70 from the tip of this Ul is searched,
When similar processing is performed, =Ut, Us, Us・
. . U is determined, characters etc. guided by the lead line are extracted, and this can be recognized as a character string representing a ratio (percentage). After that, in step S9, the characters are cut out, and in step SIO, the characters are recognized.
The recognition result is displayed in step Sll.

[第2実施例] 本実施例では、第10図に示すように引出し線の無い円
グラフの場合の認識手順を示す。この場合、前述した実
施例では比率を表す文字等を抽出できない。そこでステ
ップS8で更に次のような処理を行う。
[Second Example] In this example, a recognition procedure for a pie chart without a leader line as shown in FIG. 10 will be described. In this case, in the above-described embodiments, it is not possible to extract characters representing ratios. Therefore, the following processing is further performed in step S8.

ステップ31〜S6の処理で中心座標と半径、さらに仕
切り線が認識されると、仕切り線と円弧とで囲まれた扇
形の領域が抽出されるので、ステップS8では、まずこ
の扇形領域を抽出する。第11図(a)に示すように、
直線、gl+122、ρ、のX軸との角度θ3.θ2.
θ3の大きさを調べると、β、〈βg < 12 sと
なる。
When the center coordinates, radius, and partition line are recognized in the processing of steps 31 to S6, a fan-shaped area surrounded by the partition line and the circular arc is extracted, so in step S8, this fan-shaped area is first extracted. . As shown in FIG. 11(a),
The angle θ3 of the straight line, gl+122, ρ, with the X axis. θ2.
Examining the magnitude of θ3, we find that β, <βg < 12 s.

また、円グラフの半径をγとすると、円の方程式はx”
 +y” =γ2となる。全黒画素について、第11図
(b)の領域A、B、Cのどの領域に含まれるかを調べ
ていくと、座標(x、y)がx2+y2<γ2をみたし
、且つ(0,O)と(x、y)を結ぶ直線の角度θ□ 
がθ1くθ8yくθ3をみたしている場合には領域Aに
含まれるとし、またθ2くθつ、くθ3の場合には領域
B、0くθ、ly<θ8、又θ3くθ8yの場合には領
域Cに含まれるとする。
Also, if the radius of the pie chart is γ, then the equation of the circle is x”
+y" = γ2. When examining which area of the area A, B, or C in FIG. 11(b) the all-black pixel is included, we find that the coordinates (x, y) satisfy x2+y2<γ2. And the angle θ□ of the straight line connecting (0, O) and (x, y)
If it satisfies θ1 * θ8y * θ3, it is considered to be included in region A, and if θ2 * θ * θ3, it is included in region B, and if 0 * θ, ly < θ8, and θ3 * θ8y. is included in area C.

次に、A、B、Cの各領域に含まれる黒画素の座標値の
X座標、X座標の最大値、最小値を求めると、第11図
(C)のように文字領域が抽出される・。このように、
円グラフ内の文字領域が抽出されると、文字列がない扇
形領域では文字領域が存在しないことから第12図で示
すように、文字列が存在する扇形の領域と空白の扇形領
域を得る。
Next, by finding the X coordinate, the maximum value, and the minimum value of the X coordinate of the black pixel coordinate values included in each area of A, B, and C, the character area is extracted as shown in Figure 11 (C).・. in this way,
When the character area in the pie chart is extracted, since there is no character area in the fan-shaped area where there is no character string, a fan-shaped area where the character string exists and a blank fan-shaped area are obtained as shown in FIG.

次に、この空白領域の延長領域内に文字が存在するか否
かを調べ、円の外側にある文字等の抽出を行う、第13
図は、該文字等の抽出方法を示した図である。斜線部分
は、円グラフの空白の扇形領域Aを、半径局の長さだけ
円の外側へ拡張した領域である。この斜線領域中に文字
ベクトルが少なくとも1個以上存在する場合にのみ、近
傍の文字ベクトルの集合(文字領域)を抽出していく、
抽出された文字列は比率を示す文字列と認識される。
Next, it is checked whether or not characters exist within the extension area of this blank area, and characters, etc. located outside the circle are extracted.
The figure shows a method for extracting the characters, etc. The shaded area is an area obtained by extending the blank fan-shaped area A of the pie chart to the outside of the circle by the length of the radius station. Only when at least one character vector exists in this diagonal area, a set of nearby character vectors (character area) is extracted.
The extracted character string is recognized as a character string indicating a ratio.

以下、前述実施例と同様にステップS9で文字を切り出
し、ステップS10で文字の認識を行い、ステップSl
lで認識結果を表示する。
Thereafter, as in the above embodiment, characters are cut out in step S9, characters are recognized in step S10, and characters are recognized in step S1.
Display the recognition result with l.

以上説明したように、円グラフ等の図形を認識すること
によって、文章と図形とからなる原稿をスキャナから入
力し、編集することが可能になり、原稿からの入力情報
量が増大した。
As explained above, by recognizing figures such as pie charts, it has become possible to input and edit manuscripts consisting of text and figures using a scanner, increasing the amount of information input from manuscripts.

しかも、円グラフの円の外にある比率(パーセント)を
表す文字等の図形中の文字や記号の認識が可能になった
ため、複雑なパターンも認識することができるようにな
った。
Moreover, it has become possible to recognize characters and symbols inside figures, such as characters representing percentages outside the circle of a pie chart, making it possible to recognize complex patterns.

また、認識速度から見ても、円グラフ及び比率と表す文
字等を簡単な処理方法で認識表示することができ、この
ため、処理時間が短く済み、よって高速の文字図形認識
が可能となった。
In addition, in terms of recognition speed, it is possible to recognize and display pie charts, characters representing ratios, etc. using a simple processing method, which reduces processing time and enables high-speed character/figure recognition. .

又、円グラフの引き出し線及び円の外にある比率を表す
文字等の認識が可能になったため、複雑なパターンの円
グラフも認識することができるようになった。
Additionally, it has become possible to recognize leader lines of pie charts and characters representing ratios outside the circle, making it possible to recognize pie charts with complex patterns.

更に、円グラフの一部である比率を表す文字等の認識が
可能になったため、複雑なパターンが円グラフも認識す
ることがで・きるようになった。
Furthermore, it has become possible to recognize characters that represent ratios that are part of a pie chart, making it possible to recognize complex patterns in pie charts.

尚、本実施例では、円グラフと比率を示す文字列の関連
に限定したが、認識した図形の特徴に応じて文字列を抽
出することにより、一般に図形と該図面に関連する文字
及び記号を認識できる0本発明の画像の認識により、文
字と図形に関連する文字列とは明確に区別されて認識さ
れるため、画像の記憶時の圧縮あるいは編集等が可能と
なる。
In this example, the relationship is limited to the relationship between a pie chart and a character string indicating a ratio, but by extracting a character string according to the characteristics of the recognized shape, it is generally possible to associate a shape with characters and symbols related to the drawing. By the image recognition of the present invention, characters and character strings related to graphics can be clearly distinguished and recognized, so that it becomes possible to compress or edit images when they are stored.

[発明の効果] 本発明により、原稿上の文書と図形とを正確に認識する
画像認識装置を提供できる。また、文書の文字と図形中
の文字とを識別することにより、文字と図形とからなる
原稿の編集も可能になった。
[Effects of the Invention] According to the present invention, it is possible to provide an image recognition device that accurately recognizes documents and figures on a manuscript. Furthermore, by distinguishing between characters in a document and characters in graphics, it has become possible to edit manuscripts consisting of characters and graphics.

また、図形が円グラフの場合に、引き出し線を抽出して
認識することにより、円グラフの付近にある文字列を認
識する画像認識装置を提供できる。
Furthermore, when the figure is a pie chart, by extracting and recognizing leader lines, it is possible to provide an image recognition device that recognizes character strings near the pie chart.

更に、図形が円グラフの場合に、仕切り線と円弧で囲ま
れた扇形領域を抽出し、その延長領域に文字領域全体又
は1部が含まれることを調べることにより、円グラフの
外側付近にある文字列を認識する画像認識装置を提供で
きる。
Furthermore, when the figure is a pie chart, by extracting the fan-shaped area surrounded by the partition line and arc and checking whether the entire character area or a part of the character area is included in the extended area, An image recognition device that recognizes character strings can be provided.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本実施例の画像認識装置のブロック図、 第2図は本実施例の画像認識装置の処理手順のフロ、−
チャート、 第3図、第10図は画像情報の変換を示す図、第4図は
円の中心の求め方を示す図、 第5図は中心点の分布図を示す図、 第6図は円エレメントと直線エレメントの求め方を示す
図、 第7図(a)は円の半径を示す図、 第7図(b)は円の半径のヒストグラムを示す図、 第8図はエレメントの分類図を示す図、第9図は比率を
表す文字等の抽出を示す図、第11図(a)〜(c)は
扇形領域の抽出方法を示す図、 第12図は扇形空白領域を示す図、 第13図は円外の文字列の抽出法を示す図である。 図中、1・・・原稿、2・・・画像読み取り装置、3・
・・バッファメモリ、4・・・円グラフ認識部、5・・
・文字認識部、6・・・文字フォントROM、7・・・
VRAM、8−G −C,9−CRT、10−・・CP
U、10a・・・ROM、10b・・・RAMである。
FIG. 1 is a block diagram of the image recognition device of this embodiment, and FIG. 2 is a flowchart of the processing procedure of the image recognition device of this embodiment.
Charts, Figures 3 and 10 are diagrams showing the conversion of image information, Figure 4 is a diagram showing how to find the center of a circle, Figure 5 is a diagram showing the distribution of center points, Figure 6 is a diagram showing a circle Figure 7(a) is a diagram showing the radius of a circle. Figure 7(b) is a diagram showing a histogram of the radius of a circle. Figure 8 is a diagram showing the classification of elements. Figure 9 is a diagram showing the extraction of characters representing ratios, Figures 11 (a) to (c) are diagrams showing the method for extracting a fan-shaped area, Figure 12 is a diagram showing a fan-shaped blank area, FIG. 13 is a diagram showing a method for extracting character strings outside the circle. In the figure, 1... original, 2... image reading device, 3...
... Buffer memory, 4... Pie chart recognition unit, 5...
・Character recognition unit, 6...Character font ROM, 7...
VRAM, 8-G-C, 9-CRT, 10-...CP
U, 10a...ROM, 10b...RAM.

Claims (1)

【特許請求の範囲】 (1)文章と図形とが混在する画像情報を入力する入力
手段と、 該入力手段より入力された前記画像情報から図形を抽出
して、該図形の特徴を認識する図形認識手段と、 該図形認識手段の認識結果に基づいて、前記図形と関連
する文字及び記号を抽出することにより、前記文字及び
記号を認識する文字列認識手段とを備えることを特徴と
する画像認識装置。(2)前記図形認識手段は、円を抽
出する円抽出手段と、該円の中心と円周とを結ぶ直線を
抽出して仕切り線とする仕切り線認識手段とを備え、入
力された前記画像情報から円グラフを抽出して認識する
ことを特徴とする請求項第1項記載の画像認識装置。 (3)前記文字列認識手段は、前記仕切り線以外の直線
のうち、少なくとも一端が前記円の外にある直線を抽出
して引き出し線とする引き出し線認識手段を備え、 該引き出し線と所定の関係にある文字及び記号を前記円
グラフの比率を示す文字列とすることを特徴とする請求
項第2項記載の画像認識装置。(4)前記文字列認識手
段は、前記仕切り線と円弧で囲まれた扇形の延長領域内
の文字及び記号を抽出する文字列抽出手段を備え、 抽出した該文字及び記号を前記円グラフの比率を示す文
字列とすることを特徴とする請求項第2項記載の画像認
識装置。
[Claims] (1) An input means for inputting image information containing a mixture of text and figures, and a figure that extracts a figure from the image information inputted from the input means and recognizes the characteristics of the figure. Image recognition comprising: a recognition means; and a character string recognition means for recognizing the characters and symbols by extracting characters and symbols associated with the figure based on the recognition results of the figure recognition means. Device. (2) The figure recognition means includes a circle extraction means for extracting a circle, and a partition line recognition means for extracting a straight line connecting the center and the circumference of the circle and using it as a partition line, and the figure recognition means is provided with the input image. 2. The image recognition apparatus according to claim 1, wherein the image recognition apparatus extracts and recognizes a pie chart from the information. (3) The character string recognition means includes a leader line recognition means for extracting a straight line having at least one end outside the circle from among straight lines other than the partition line and using the extracted line as a leader line; 3. The image recognition apparatus according to claim 2, wherein the related characters and symbols are character strings indicating the ratio of the pie chart. (4) The character string recognition means includes a character string extraction means for extracting characters and symbols within a fan-shaped extension area surrounded by the partition line and the circular arc, and converts the extracted characters and symbols into the ratio of the pie chart. 3. The image recognition device according to claim 2, wherein the image recognition device is a character string indicating .
JP63094568A 1988-04-19 1988-04-19 Image recognition device Pending JPH01266689A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63094568A JPH01266689A (en) 1988-04-19 1988-04-19 Image recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63094568A JPH01266689A (en) 1988-04-19 1988-04-19 Image recognition device

Publications (1)

Publication Number Publication Date
JPH01266689A true JPH01266689A (en) 1989-10-24

Family

ID=14113914

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63094568A Pending JPH01266689A (en) 1988-04-19 1988-04-19 Image recognition device

Country Status (1)

Country Link
JP (1) JPH01266689A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7660014B2 (en) 2006-01-17 2010-02-09 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of extracting rule from document image with high precision
US7715625B2 (en) 2004-04-01 2010-05-11 Fuji Xerox Co., Ltd. Image processing device, image processing method, and storage medium storing program therefor
US8208744B2 (en) 2006-01-23 2012-06-26 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of accurately and quickly determining character part included in image

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7715625B2 (en) 2004-04-01 2010-05-11 Fuji Xerox Co., Ltd. Image processing device, image processing method, and storage medium storing program therefor
US7660014B2 (en) 2006-01-17 2010-02-09 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of extracting rule from document image with high precision
US8208744B2 (en) 2006-01-23 2012-06-26 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of accurately and quickly determining character part included in image

Similar Documents

Publication Publication Date Title
US7437001B2 (en) Method and device for recognition of a handwritten pattern
JP4580554B2 (en) Character recognition
US5517578A (en) Method and apparatus for grouping and manipulating electronic representations of handwriting, printing and drawings
CA1309180C (en) Method for detecting character strings
US5515455A (en) System for recognizing handwritten words of cursive script
JPS63155386A (en) Document data reader
JPH1011531A (en) Slip reader
US6947596B2 (en) Character recognition method, program and recording medium
US6810147B2 (en) Document image processing apparatus for processing line portions manually input to document image, method therefor, and computer readable recording medium recorded with document image processing program therefor
US5625710A (en) Character recognition apparatus using modification of a characteristic quantity
US5526440A (en) Hand-written character recognition apparatus
JPH01266689A (en) Image recognition device
JP4810853B2 (en) Character image cutting device, character image cutting method and program
Bai et al. Object Boundary Encoding—a new vectorisation algorithm for engineering drawings
JPH0247788B2 (en)
JP3015137B2 (en) Handwritten character recognition device
Nagabhushan et al. Recognition of Pitman shorthand text using tangent feature values at word level
JP3304512B2 (en) Table recognition device
JP2755299B2 (en) Image processing method
JPH1049624A (en) Method and device for handwritten character recognition
JP2762476B2 (en) Copy-writing device
JP2972443B2 (en) Character recognition device
CN113902704A (en) Chinese character framework inflection point detection method and system based on eight-neighborhood direction coding
JP3069771B2 (en) Pattern recognition method and apparatus
JPH09114925A (en) Optical character reader