JPS63223890A - Drawing reader - Google Patents

Drawing reader

Info

Publication number
JPS63223890A
JPS63223890A JP62055211A JP5521187A JPS63223890A JP S63223890 A JPS63223890 A JP S63223890A JP 62055211 A JP62055211 A JP 62055211A JP 5521187 A JP5521187 A JP 5521187A JP S63223890 A JPS63223890 A JP S63223890A
Authority
JP
Japan
Prior art keywords
character
kanji
kana
recognition
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62055211A
Other languages
Japanese (ja)
Inventor
Naruyoshi Shimotsuji
下辻 成佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP62055211A priority Critical patent/JPS63223890A/en
Publication of JPS63223890A publication Critical patent/JPS63223890A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To recognize alphanumeric characters, KANA (Japanese syllabary) and KANJI (Japanese character) entered into a drawing by providing a means which decides whether character patterns are recognized as alphanumeric characters, or KANA or KANJI individually. CONSTITUTION:Drawing information is inputted through a drawing input part 1 and stored in a frame memory 2 and then a diagram processing process 4 is started to perform a series of linked graphic form processes. Then it is decided whether or not linked areas are character information by checking the sizes of the respective linked areas. When it is decided the linked areas are character information, the processor 4 decides English characters when the shape of a circumscribed frame is rectangular or KANA or KANJI when the shape is square. A character recognizing processor 5 recognizes character patterns cut as a square shape as KANA or KANJI or character patterns cut as a rectangular shape as alphanumeric characters.

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は図面中に記載された文字情報を効果的に読取る
ことのできる図面読取装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Object of the Invention] (Industrial Application Field) The present invention relates to a drawing reading device that can effectively read character information written in drawings.

(従来の技術) 図面読取装置では図面中に記載された、例えば論理回路
図や電子回路図の情報を読取認識することは勿論のこと
、それに阻隔して記載されている文字情報をも読取認識
することが必要である。
(Prior Art) Drawing reading devices can not only read and recognize information written in drawings, such as logic circuit diagrams and electronic circuit diagrams, but also read and recognize character information written in a space between them. It is necessary to.

従来、この種の一般的な図面における記載文字情報は、
通常、英数字だけであることが多い。そしてこれらの英
数字は一連結文字パターンで表現されることから、従来
では図形等として判別される図面情報以外の線情報から
一連結パターンを個々に切出し、これを文字パターンで
あると想定して文字認識を行っている。これ故、比較的
簡単な処理にて図面中に記載された文字情報の読取認識
を実現している。
Conventionally, the written character information in this type of general drawing is
It is usually alphanumeric only. Since these alphanumeric characters are expressed as a series of character patterns, conventionally the series of patterns are individually cut out from line information other than drawing information that is identified as figures, etc., and these are assumed to be character patterns. Performs character recognition. Therefore, the reading and recognition of character information written in drawings can be achieved through relatively simple processing.

ところが図面情報の多様化に伴い、例えば化学プラント
図面のように仮名・漢字が数多く記載された図面情報の
読取認識の必要性が高まっている。
However, with the diversification of drawing information, there is an increasing need to read and recognize drawing information that includes many kana and kanji characters, such as chemical plant drawings.

更には、仮名漢字と英数字とが混在して記載された図面
情報を読取認識する必要性も高まっている。
Furthermore, there is an increasing need to read and recognize drawing information written in a mixture of kana, kanji, and alphanumeric characters.

このような要求に応えるべく、近時種々研究開発されて
いる仮名・漢字の認識技術を導入することが考えられて
いる。ところがこの種の従来の仮名・漢字を認識対象す
る文字認識装置は、予め定められた升目に記載された文
字をその升目毎に認識することを前提としている。この
為、図面中のどこに記載されるか不明な、つまり図面内
容に応じて任意の位置に記載される文字を検出し、これ
を認識することが甚だ困難であった。
In order to meet these demands, it is being considered to introduce kana and kanji recognition technology, which has been recently researched and developed. However, this type of conventional character recognition device that recognizes kana and kanji characters is based on the premise that characters written in predetermined squares are recognized for each square. For this reason, it is extremely difficult to detect and recognize characters whose location in a drawing is unknown, that is, characters written at arbitrary positions depending on the content of the drawing.

特に仮名・漢字は、上述した英数字と異なって、複数の
連結パターンの組合せとして表現されることが多いので
、図面中の任意の場所から仮名・漢字を個々に切出すこ
と自体が非常に困難であると云う問題があった。
In particular, unlike the alphanumeric characters mentioned above, kana and kanji are often expressed as a combination of multiple connected patterns, so it is extremely difficult to cut out individual kana and kanji from arbitrary locations in a drawing. There was a problem that.

(発明が解決しようとする問題点) このように従来の図面読取装置にあっては、図面中に任
意に記載された英数字や仮名・漢字をそれぞれ読取認識
することが困難であると云う問題があった。
(Problems to be Solved by the Invention) As described above, the problem with conventional drawing reading devices is that it is difficult to read and recognize alphanumeric characters, kana, and kanji characters arbitrarily written in drawings. was there.

本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、図面中に混在する英数字や仮名
・漢字をそれぞれ高精度に読取認識することのできる簡
易な構成で実用性の高い図面読取装置を提供することに
ある。
The present invention was made in consideration of these circumstances, and its purpose is to provide a practical and simple structure that can read and recognize alphanumeric characters, kana, and kanji characters mixed in drawings with high precision. An object of the present invention is to provide a drawing reading device with high performance.

[発明の構成] (問題点を解決するための手段) 本発明は、画像入力された図面画像中から文字記載領域
を検出し、この文字記載領域から、例えば一連結文字パ
ターンを英数字をなす1文字として個々に切出して認識
処理する第1の文字!識手段と、上記文字記載領域から
、例えばほぼ正方形状をなす連結パターンの組を仮名・
漢字をなす1文字の文字パターンとして切出して個々に
認識処理する第2の文字認識手段とを設け、これらの第
1および第2の文字認識手段でそれぞれ求められた認識
結果を総合判定して、例えば同一の文字パターンについ
て上記第1および第2の文字認識手段でそれぞれ求めら
れた認識結果の認識成績の高いものを採用する等して、
文字パターンとして矛盾のない認識結果を選択するよう
にしたことを特徴とするものである。
[Structure of the Invention] (Means for Solving the Problems) The present invention detects a character writing area from an inputted drawing image, and from this character writing area, for example, forms a series of connected character patterns to form an alphanumeric character. The first character to be cut out and recognized individually as a single character! For example, a set of almost square connected patterns can be written in kana and from the character writing area.
A second character recognition means is provided for cutting out a character pattern of one character forming a kanji and performing recognition processing on each character, and comprehensively judging the recognition results obtained by each of the first and second character recognition means, For example, by employing the recognition results obtained by the first and second character recognition means for the same character pattern, and which have the highest recognition results,
This method is characterized in that recognition results that are consistent with each other are selected as character patterns.

(作用) 本発明によれば、図面中に記載された文字が英数字を認
識対象として認識処理されると共に、仮名・漢字を認識
対象として認識処理される。そしてこれらの各認識結果
が総合判定されて、例えば文字パターンとして矛盾のな
いものとしてその最終的な認識結果が求められる。つま
り複数の連結文字パターンが存在する場合、それらの各
連結文字パターンが個々に英数字として認識されるか、
またそれらの文字パターンの組が仮名・漢字として認識
し得るかが調べられ、これらの連結パターンに対して矛
盾のない認識結果が選択採用される。
(Operation) According to the present invention, characters written in drawings are recognized by alphanumeric characters and kana and kanji characters. Then, these recognition results are comprehensively judged, and the final recognition result is determined as, for example, a consistent character pattern. That is, if multiple concatenated character patterns exist, each concatenated character pattern is individually recognized as an alphanumeric character, or
It is also checked whether these character pattern sets can be recognized as kana/kanji, and recognition results that are consistent with these connected patterns are selected and adopted.

これ故、図面中に英数字と仮名・漢字とが混在して記載
されている場合であっても、これらの文字情報を個々に
精度良く認識することが可能となる。
Therefore, even if alphanumeric characters and kana/kanji characters are mixedly written in the drawing, it is possible to individually recognize these character information with high accuracy.

(実施例) 以下、図面を参照して本発明の一実施例につき説明する
(Example) Hereinafter, an example of the present invention will be described with reference to the drawings.

第1図は実施例装置の概略構成図であり、1はファクシ
ミリやドラム・スキャナ、ハンド・スキャナ、TVカメ
ラ等からなる図面入力部であり、この図面入力部1を介
して処理対象する図面の情報が読取入力される。そして
この図面入力部1を介して読取入力された図面情報はフ
レーム・メモリ2に格納されて図面処理に供される。
FIG. 1 is a schematic configuration diagram of an embodiment of the apparatus. Reference numeral 1 denotes a drawing input unit consisting of a facsimile, drum scanner, hand scanner, TV camera, etc. Through this drawing input unit 1, drawings to be processed are Information is read and input. The drawing information read and input through the drawing input section 1 is stored in the frame memory 2 and used for drawing processing.

アドレス・コントローラ3は、上記フレーム・メモリ2
に格納された図面情報の2次元アドレスを管理するもの
であり、このアドレス管理を受けて上記フレーム・メモ
リ2に格納された図面情報が線図形処理プロセッサ4に
読出される。この線図形処理プロセッサ4は、基本的に
は入力画像(図面情報)中の、例えば黒画素の連結性を
調べ、各連結領域の大きさや長さ等からその連結領域が
図形や記号等の情報であるか、或いは文字情報を示すも
のであるかを判定処理するものである。そして連結領域
が文字情報である場合には、それに対する処理を後述す
る文字認識プロセッサ5に委ね、また図形や記号等の情
報である場合には、所定の図形処理を実行するものであ
る。
The address controller 3 is the frame memory 2
Under this address management, the drawing information stored in the frame memory 2 is read out to the line graphic processing processor 4. This line figure processing processor 4 basically examines the connectivity of, for example, black pixels in the input image (drawing information), and uses the size and length of each connected area to determine if the connected area is a figure, symbol, etc. , or indicates character information. If the connected region is character information, the processing thereof is entrusted to a character recognition processor 5, which will be described later.If the connected region is information such as graphics or symbols, predetermined graphic processing is executed.

ここで文字プロセッサ5は、バス6を介して上記線図形
処理プロセッサ4に接続されており、同時に上記バス6
を介してテーブル処理・制御プロセッサ7に接続されて
いる。テーブル処理制御プロセッサ7は、バス6を介し
て上記線図形処理プロセッサ4による図形処理と、文字
認識プロセッサ5による文字認識処理をそれぞれ制御す
ると共に、線図形に対するベクトル化等の図形処理を実
行するものである。
Here, the character processor 5 is connected to the line graphics processor 4 via a bus 6, and is also connected to the bus 6.
It is connected to the table processing/control processor 7 via. The table processing control processor 7 controls the graphic processing by the line graphic processor 4 and the character recognition process by the character recognition processor 5 via the bus 6, and also executes graphic processing such as vectorization for line graphics. It is.

第2図はこのように構成された本装置における処理手続
の基本的な流れを示すものであり、この処理手続に従っ
て本装置の処理機能につき説明する。
FIG. 2 shows the basic flow of processing procedures in this apparatus configured as described above, and the processing functions of this apparatus will be explained according to this processing procedure.

図面入力部1を介して図面情報が読取入力され、フレー
ム・メモリ2に格納されると (ステップa)、線図形
処理プロセッサ4が起動される。すると線図形処理プロ
セッサ4では、入力画像中の黒画素の連結性を調べ、そ
の連結領域を抽出する等の一連の連結図形検出処理を実
行する(ステップb)。そして各連結領域の大きさを調
べる等して、その連結領域が文字情報であるか否かを判
定している(ステップC)。この際、連結領域が文字情
報であると判定された場合には、線図形処理プロセッサ
4はその文字列に対する外接枠を検出し、その外接枠内
を文字記載領域として認定する等の処理を実行している
When drawing information is read and input through the drawing input section 1 and stored in the frame memory 2 (step a), the line graphics processing processor 4 is activated. Then, the line figure processing processor 4 executes a series of connected figure detection processes such as checking the connectivity of black pixels in the input image and extracting the connected areas (step b). Then, by checking the size of each connected area, it is determined whether the connected area is character information (step C). At this time, if it is determined that the connected area is character information, the line graphics processing processor 4 detects a circumscribing frame for the character string, and performs processing such as recognizing the inside of the circumscribing frame as a text writing area. are doing.

しかしてデープル処理・制御プロセッサ7は上記判定結
果に従って、図形・記号情報であると判定された連結領
域の情報を入力し、例えば各連結図形の線分をそれぞれ
ベクトル化する等の所定の図形処理を施している〈ステ
ップd)。そしてベクトル化された線情報からその図形
を認識し、図形コード化する等の処理を実行している。
Then, the data processing/control processor 7 inputs the information of the connected regions determined to be graphic/symbolic information according to the above determination result, and performs predetermined graphic processing such as vectorizing each line segment of each connected figure. (Step d). Then, the figure is recognized from the vectorized line information, and processing such as converting it into a figure code is executed.

またこのテーブル処理・制御プロセッサ7では、上記線
図形処理プロセッサ4にて求められた文字記載領域の情
報を入力し、そこに記載された文字列を検出している(
ステップe)。
In addition, this table processing/control processor 7 inputs the information of the character writing area obtained by the line figure processing processor 4, and detects the character string written therein (
Step e).

この文字列の検出処理は、図面中に記載される英数字の
外接枠の形状と、仮名・漢字の外接枠の形状との違いに
看目し、英数字をなす文字パターンとして縦長の長方形
をなす外接枠を持つ連結図形を個々に切出すと共に、仮
名・漢字をなす文字パターンとしてほぼ正方形状の外接
枠を持つ連結図形の組を切出している。
This character string detection process takes into consideration the difference between the shape of the circumscribing frame of alphanumeric characters written in the drawing and the shape of the circumscribing frame of kana and kanji characters, and creates a vertically long rectangle as a character pattern consisting of alphanumeric characters. Connected figures each having a circumscribing frame of the shape of a square are cut out individually, and sets of connected figures having a substantially square circumscribing frame are cut out as character patterns forming kana and kanji.

具体的には、第3図に示すような文字パターンが与えら
れた場合には、線図形プロセッサ4ではこれらの連結図
形領域をat、 a2. a3.〜alOとしてそれぞ
れラベリングして検出している。そしてこれらの各連結
図形領域a1. a2. a3.〜aloの外接枠の情
報を、例えば座標データ(Xa、Ya、Xb。
Specifically, when a character pattern as shown in FIG. 3 is given, the line graphic processor 4 divides these connected graphic areas into at, a2, . a3. They are labeled and detected as ~alO. And each of these connected figure areas a1. a2. a3. Information on the circumscribing frame of ~alo, for example, coordinate data (Xa, Ya, Xb.

Yb)として求めている。Yb).

テーブル処理・制御プロセッサ7は、このような情報を
第4図に示すようにしてテーブル化している。そしてこ
れらの各連結領域の間の距離から上記各連結領域のつな
がり関係を調べ、つながり  ゛を持つ複数の連結領域
の全体的な外接枠の形状がほぼ正方形となる場合には、
これを仮名・漢字をなす連結領域の組としてまとめてい
る。そして上述した如くラベリングされてテーブル化さ
れた連結領域の情報をポインタを用いて結合している。
The table processing/control processor 7 converts such information into a table as shown in FIG. Then, the connection relationship of each connected area is investigated from the distance between these connected areas, and if the overall shape of the circumscribed frame of the multiple connected areas with connection ゛ is approximately square,
These are grouped together as a set of connected areas that form kana and kanji. Then, as described above, the information of the connected regions that have been labeled and made into a table are connected using pointers.

これに対して第5図に示すような文字パターンが与えら
れても、線図形プロセッサ4では同様にしてこれらの連
結図形領域をbl、 b2.〜b5としてそれぞれラベ
リングして検出し、これらの各3!結図形1irl域b
1. b2.〜b5の外接枠の情報を、例えば座標デー
タ(Xa、Ya、Xb、Yb )として求めている。
On the other hand, even if a character pattern as shown in FIG. 5 is given, the line graphic processor 4 similarly divides these connected graphic areas into bl, b2, . 〜b5 and detected, each of these 3! Figure 1irl area b
1. b2. Information on the circumscribed frame of ~b5 is obtained as coordinate data (Xa, Ya, Xb, Yb), for example.

テーブル処理・制御プロセッサ7では、このような情報
を第6図に示すようにしてテーブル化している。そして
先の仮名・漢字の場合と同様にしてこれらの各連結領域
の間の距離から上記各連結領域のつながり関係を調べ、
つながりを持つ複数の連結領域の全体的な外接枠が縦長
の長方形である場合には、これを英数字をなす連結wA
域の組としてまとめている。そして上述した如くラベリ
ングされてテーブル化された連結領域の情報をポインタ
を用いて結合している。但し、英数字が与えられた場合
には、その殆んどがポインタによって複数の連結領域が
結合されることはなく、1つの連結領域だけでその文字
パターンが表現されることが多い。
The table processing/control processor 7 converts such information into a table as shown in FIG. Then, in the same way as in the case of kana and kanji, we examine the connection relationships between these connected areas from the distances between them, and
If the overall circumscribed frame of multiple connected connected areas is a vertically long rectangle, this can be connected to an alphanumeric character wA.
They are grouped into regional groups. Then, as described above, the information of the connected regions that have been labeled and made into a table are connected using pointers. However, when alphanumeric characters are given, in most cases, multiple connected areas are not connected by a pointer, and the character pattern is often expressed using only one connected area.

テーブル処理・制御プロセッサ7は、上述した如く連結
領域のテーブル化と、その連結領域のポインタによる結
合を行うものであるが、図面中に記載される英数字の中
には相互に近接して記載されるものもあり、また仮名・
漢字においてはその遍と労とが離れて記載される場合も
ある。そこでテーブル処理・制御プロセッサ7では、連
結領域、或いは連結領域の組が英数字あるいは仮名・漢
字である可能性を両方含む場合には、そのそれぞれを文
字パターンとして検出するものとなっている。
The table processing/control processor 7 converts the connected areas into a table as described above and connects the connected areas using pointers. However, some alphanumeric characters written in the drawings are written close to each other. In some cases, pseudonyms and
In kanji, hen and labor are sometimes written separately. Therefore, in the table processing/control processor 7, when a connected area or a set of connected areas includes both possibilities of alphanumeric characters or kana/kanji characters, each of them is detected as a character pattern.

しかして文字認識プロセッサ5は、外接枠がほぼ正方形
状として切出された文字パターンを仮名・漢字として認
識処理する機能と、外接枠が縦長の長方形状として切出
された文字パターンを仮名・漢字として認識処理する機
能とを備えている。
Therefore, the character recognition processor 5 has the function of recognizing character patterns cut out with a substantially square circumscribed frame as kana/kanji characters, and the function of recognizing character patterns cut out with a circumscribed frame having a vertically elongated rectangular shape as kana/kanji characters. It has the function of recognizing and processing as

そして外接枠がほぼ正方形状をなす連結領域の組を個々
に切出しくステップf)、そのパターン情報の特徴を抽
出し、仮名・漢字の標準パターンの特徴と照合する等し
てその文字パターンを仮名・漢字として認識処理してい
る(ステップg)。
Step f) of individually cutting out sets of connected regions whose circumscribed frames are approximately square, extracting the characteristics of that pattern information, and comparing it with the characteristics of standard patterns for kana and kanji to convert the character pattern into kana and kanji characters. - It is recognized and processed as a kanji (step g).

また外接枠が縦長の長方形状をなす連結領域をの情報を
個々に切出しくステップh)、そのパターン情報の特徴
を抽出して英数字の標準パターンの特徴と照合する等し
てその′文字パターンを英数字としてHfJ処理してい
る(ステップi)。
In addition, in step h), the information of connected regions whose circumscribed frames are vertically elongated rectangular shapes is individually cut out, and the characteristics of the pattern information are extracted and compared with the characteristics of a standard alphanumeric pattern to obtain the character pattern. is subjected to HfJ processing as alphanumeric characters (step i).

このようにして文字パターンに対する仮名・漢字の認識
処理と英数字の認識処理を行った後、同一の文字パター
ン(連結領域)に対する上記各認識結果を相互に比較し
くステップj)、文字列としての矛盾を調べる等して矛
盾のない、しかも認識成綿の良い方の認識結果(仮名・
漢字としての認識結果、或いは英数字としての認識結果
)をその文字パターンに対する認識結果として求めてい
る(ステップj)。
After performing the kana/kanji recognition process and the alphanumeric recognition process for the character pattern in this way, the above recognition results for the same character pattern (connected area) are compared with each other in step j). Check for contradictions, etc., and find the recognition result (pseudonym/
The recognition result for the character pattern (recognition result as a kanji character or recognition result as an alphanumeric character) is obtained as a recognition result for the character pattern (step j).

具体的には、第7図にその処理概念を示すように「統合
Jなる漢字を読取認識する場合、先ずその文字パターン
を検出する。そしてこの文字パターンについて仮名・漢
字を認識対象(外接枠をほぼ正方形)とする文字の切出
しを行い、これらの各文字パターンについて仮名・漢字
認識処理する。
Specifically, as shown in Figure 7, the processing concept is ``When reading and recognizing the kanji ``integrated J,'' the character pattern is first detected.Then, for this character pattern, the kana/kanji are recognized (approximately square) characters are cut out, and each of these character patterns is processed for kana/kanji recognition.

この結果、1番目の文字については「統」なる認識結果
を得、2番目の文字については「合Jなる認識結果を得
る。
As a result, for the first character, a recognition result of "un" is obtained, and for the second character, a recognition result of "un" is obtained.

これに対して上記「統合Jなる文字パターンについて英
数字を認識対象(外接枠を縦長の長方形)とする文字の
切出しを行うと、「統」なる文字パターンがその遍と労
とに切離されて抽出され、それぞれが別個に英数字に対
する文字認識に供される。しかし英数字の標準パターン
には、このようなものが存在しないことから、英数字の
認識処理は失敗し、“?”?゛“?゛′なる認識結果が
求められる。
On the other hand, when we cut out the characters with alphanumeric characters as the recognition target (the circumscribing frame is a vertical rectangle) for the character pattern "Unified J" mentioned above, the character pattern "Unified" is separated into its parts and labor. Each character is extracted separately and subjected to alphanumeric character recognition. However, since such a standard pattern does not exist for alphanumeric characters, the alphanumeric recognition process fails and "?"? A recognition result of ゛“?゛′ is required.

従ってこのような認識結果を相互に比較した場合、英数
字に対する認識結果が?”であることから、その文字パ
ターンは仮名・漢字であり、認識結果が「統」 「合」
であると決定される。
Therefore, when comparing these recognition results with each other, what is the recognition result for alphanumeric characters? ”, the character pattern is kana/kanji, and the recognition result is “tou” or “go”.
It is determined that

これに対してro123Jなる文字パターンの場合には
、第8図に示すように処理される。そしてこの場合には
、例えば「認識」および「23」をそれぞれ1文字の仮
名・漢字であるとして仮名・漢字に対する認識処理が行
われ、また「0」NJ r2J r3Jをそれぞれ独立
な英数字であるとしての認識処理が行われる。
On the other hand, the character pattern ro123J is processed as shown in FIG. In this case, for example, recognition processing is performed on kana and kanji by assuming that "recognition" and "23" are each one character of kana and kanji, and "0" NJ r2J r3J are each an independent alphanumeric character. Recognition processing is performed as follows.

そして仮名・漢字に対する認識処理に失敗することから
、両認識結果に対する総合判定では、入力文字パターン
がrOJ NJ f2J r3Jなる英数字であるとの
0識結果を得る。
Since the recognition process for kana and kanji fails, a comprehensive determination of both recognition results yields a zero-identification result that the input character pattern is an alphanumeric character rOJ NJ f2J r3J.

尚、例えば「引」なる文字パターンについて上述した仮
名・漢字に対する認識処理と、英数字に対する認識処理
を行った場合、「引」なる認識結果とr3J MJなる
認識結果とがそれぞれ得られる場合がある。逆に、例え
ば「18jなる文字パターンについて上述した仮名・漢
字に対する認識処理と、英数字に対する認識処理を行っ
た場合、「旧」なる認識結果とrN r8Jなる認識結
果とがそれぞれ得られる場合がある。
For example, if the above-mentioned recognition process for kana/kanji characters and recognition process for alphanumeric characters are performed for the character pattern "hiki", the recognition results "hiki" and r3J MJ may be obtained respectively. . Conversely, for example, if the above-mentioned recognition processing for kana and kanji characters and recognition processing for alphanumeric characters are performed for the character pattern "18j," a recognition result of "old" and a recognition result of rN r8J may be obtained, respectively. .

このような場合には、その文字列の前後関係や他の文字
列に対する認識結果を参照する等して、その文字列にお
いて矛盾のない方を正しい認識結果であるとして選択決
定するようにすれば良い。
In such a case, by referring to the context of the character string and the recognition results for other character strings, it is possible to select and determine the one that is consistent with the character string as the correct recognition result. good.

具体的に文字列の並びの規則性等に従って認識結果を選
択するようにすれば良い。
Specifically, recognition results may be selected according to the regularity of the arrangement of character strings.

以上のように本装置では、図面中に記載された文字に対
して英数字としての認識処理と仮名漢字としての認識処
理をそれぞれ施し、それらの認識結果の矛盾のないもの
、また0識結果として成績の良いもの、更には信頼性の
高いものを最終的な認識結果として求めるものとなって
いる。従って仮名・漢字と英数字とが図面中に混在する
場合であっても、それらの文字をそれぞれ精度良く認識
することが可能となる。しかも従来の仮名・漢字に対す
る文字認識に見られるように文字記入枠を予め設定する
ことなく、図面中に任意に記載された文字を効果的に読
取認識することが可能となる。
As described above, this device performs alphanumeric recognition processing and kana-kanji recognition processing for characters written in drawings, and determines whether the recognition results are consistent, or as zero-cognitive results. The final recognition result is one that has good performance and is even more reliable. Therefore, even if kana/kanji and alphanumeric characters coexist in a drawing, each of these characters can be recognized with high accuracy. Moreover, it is possible to effectively read and recognize characters arbitrarily written in a drawing without setting a character entry frame in advance as in conventional character recognition for kana and kanji characters.

これ故、益々多様化する各種の図面情報を効果的に読取
入力することが可能となる等の実用上多大なる効果が奏
せられる。
Therefore, a great practical effect can be achieved, such as being able to effectively read and input various types of drawing information that are becoming more and more diverse.

尚、本発明は上述した実施例に限定されるものではない
。例えば連結領域のつながり関係やその外接枠の形状等
からその文字種が特定できる場合には、別の文字種に対
する認識処理の実行を省略するようにしても良い。そし
て文字種が曖昧な文字パターンについてのみ、上述した
仮名・漢字に対する認識処理と英数字に対する認識処理
とをそれぞれ行うようにしても良い。その他、本発明は
その要旨を逸脱しない範囲で種々変形して実施すること
ができる。
Note that the present invention is not limited to the embodiments described above. For example, if the character type can be identified from the connection relationship of connected regions, the shape of its circumscribing frame, etc., execution of recognition processing for another character type may be omitted. Then, the above-described recognition processing for kana/kanji and alphanumeric characters may be performed only for character patterns whose character types are ambiguous. In addition, the present invention can be implemented with various modifications without departing from the gist thereof.

[発明の効果] 以上説明したように本発明によれば、英数字の外接枠の
形状的特徴と仮名・漢字の外接枠の形状的特徴との違い
に着目して文字パターンを個々に切出し、英数字に対す
る!!!識処理と仮名・漢字に対する認識処理とをそれ
ぞれ行い、それらの認識結果を比較して矛盾のないWg
識結果を選択するので、図面中に混在して記載される英
数字および仮名・漢字をそれぞれ効果的に読取認識する
ことが可能となる。しかも非常に簡易に文字情報の読取
認識を行うことが可能であり、実用性の高い図面読取装
置として多大なる効果を奏し得る。
[Effects of the Invention] As explained above, according to the present invention, character patterns are individually cut out by focusing on the difference in the shape characteristics of the circumscribed frames of alphanumeric characters and the shape characteristics of the circumscribed frames of kana and kanji. Against alphanumeric characters! ! ! Perform cognitive processing and recognition processing for kana and kanji, and compare the recognition results to find a consistent Wg.
Since the recognition results are selected, it becomes possible to effectively read and recognize alphanumeric characters, kana, and kanji characters mixed together in the drawing. Moreover, it is possible to read and recognize character information very easily, and it can produce great effects as a highly practical drawing reading device.

【図面の簡単な説明】[Brief explanation of the drawing]

図は本発明の一実施例を示すもので、第1図は実m例装
置の坂路構成図、第2図は実施例装置における処理手続
の流れを示す図、第3図は仮名・漢字の文字パターンと
その連結領域の相互関係を示す図、第4図は第3図に示
す仮名・漢字の情報のテーブルへの格納例を示す図、第
5図は英数字の文字パターンとその連結領域の相互関係
を示す図、第6図は第5図に示す仮名・漢字の情報のテ
ーブルへの格納例を示す図、第7図および第8図はそれ
ぞれ文字パターンに対する認識処理例を模式的に示す図
である。 1・・・図面入力装置、2・・・フレーム・メモリ、3
・・・アドレス・コントローラ、4・・・線図形処理プ
ロセッサ、5・・・文字認識プロセッサ、6・・・バス
、7・・・テーブル処理・制御プロセッサ。 出願人代理人 弁理士 鈴江武彦 第1図 第3図 第5図 文字列検出処理 す
The figures show one embodiment of the present invention. Fig. 1 is a diagram showing the slope configuration of an actual example device, Fig. 2 is a diagram showing the flow of processing procedures in the embodiment device, and Fig. 3 is a diagram showing the flow of processing procedures in the embodiment device. Figure 4 shows an example of how the kana and kanji information shown in Figure 3 is stored in a table. Figure 5 shows alphanumeric character patterns and their connected areas. Figure 6 is a diagram showing an example of storing the kana/kanji information shown in Figure 5 in a table, and Figures 7 and 8 schematically illustrate examples of recognition processing for character patterns. FIG. 1... Drawing input device, 2... Frame memory, 3
. . . address controller, 4 . . . line graphic processing processor, 5 . . . character recognition processor, 6 . . . bus, 7 . Applicant's agent Patent attorney Takehiko Suzue Figure 1 Figure 3 Figure 5 Character string detection processing

Claims (3)

【特許請求の範囲】[Claims] (1)画像入力された図面画像中の文字記載領域を検出
する手段と、この文字記載領域から文字パターンを英数
字として切出して個々に認識処理する第1の文字認識手
段と、上記文字記載領域から文字パターンを仮名・漢字
として切出して個々に認識処理する第2の文字認識手段
と、これらの第1および第2の文字認識手段でそれぞれ
求められた認識結果を総合判定して矛盾のない認識結果
を選択する総合判定手段とを具備したことを特徴とする
図面読取装置。
(1) A means for detecting a character writing area in an input drawing image, a first character recognition means for cutting out character patterns as alphanumeric characters from the character writing area and individually recognizing and processing the characters, and the character writing area described above. A second character recognition means extracts character patterns as kana and kanji from the text and recognizes them individually, and the recognition results obtained by the first and second character recognition means are comprehensively evaluated to achieve consistent recognition. 1. A drawing reading device characterized by comprising comprehensive judgment means for selecting a result.
(2)第1の文字認識手段は、一連結文字パターンを1
文字として個々に切出して文字認識するものであって、
第2の文字認識手段はほぼ正方形状をなす連結パターン
の組を1文字として切出して文字認識するものである特
許請求の範囲第1項記載の図面読取装置。
(2) The first character recognition means recognizes a series of connected character patterns as one
It is a system that recognizes characters by cutting them out individually as characters.
2. The drawing reading device according to claim 1, wherein the second character recognition means cuts out a set of substantially square connected patterns as one character and recognizes the character.
(3)総合判定手段は、同一の文字パターンについて第
1および第2の文字認識手段でそれぞれ求められた認識
結果の認識成績の高いものを採用するものである特許請
求の範囲第1項記載の図面読取装置。
(3) The comprehensive determination means adopts the recognition results obtained by the first and second character recognition means, respectively, for the same character pattern, which have the highest recognition results. Drawing reading device.
JP62055211A 1987-03-12 1987-03-12 Drawing reader Pending JPS63223890A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62055211A JPS63223890A (en) 1987-03-12 1987-03-12 Drawing reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62055211A JPS63223890A (en) 1987-03-12 1987-03-12 Drawing reader

Publications (1)

Publication Number Publication Date
JPS63223890A true JPS63223890A (en) 1988-09-19

Family

ID=12992299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62055211A Pending JPS63223890A (en) 1987-03-12 1987-03-12 Drawing reader

Country Status (1)

Country Link
JP (1) JPS63223890A (en)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59112367A (en) * 1982-12-18 1984-06-28 Nippon Telegr & Teleph Corp <Ntt> Reading method of character
JPS59158482A (en) * 1983-02-28 1984-09-07 Toshiba Corp Character recognizing device
JPS60108981A (en) * 1983-11-18 1985-06-14 Hitachi Ltd Optical character reader
JPS60160481A (en) * 1984-02-01 1985-08-22 Comput Basic Mach Technol Res Assoc Reader of character
JPS6195481A (en) * 1984-10-17 1986-05-14 Hitachi Ltd Pattern segmentting and recognition system
JPS61279991A (en) * 1985-06-05 1986-12-10 Hitachi Ltd Character segmenting method for optical character reader and the like
JPS6219990A (en) * 1985-07-18 1987-01-28 Matsushita Electric Ind Co Ltd Character recognizing device

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59112367A (en) * 1982-12-18 1984-06-28 Nippon Telegr & Teleph Corp <Ntt> Reading method of character
JPS59158482A (en) * 1983-02-28 1984-09-07 Toshiba Corp Character recognizing device
JPS60108981A (en) * 1983-11-18 1985-06-14 Hitachi Ltd Optical character reader
JPS60160481A (en) * 1984-02-01 1985-08-22 Comput Basic Mach Technol Res Assoc Reader of character
JPS6195481A (en) * 1984-10-17 1986-05-14 Hitachi Ltd Pattern segmentting and recognition system
JPS61279991A (en) * 1985-06-05 1986-12-10 Hitachi Ltd Character segmenting method for optical character reader and the like
JPS6219990A (en) * 1985-07-18 1987-01-28 Matsushita Electric Ind Co Ltd Character recognizing device

Similar Documents

Publication Publication Date Title
US4907285A (en) Image understanding system
US4531231A (en) Method for distinguishing between complex character sets
JPS60217477A (en) Handwritten character recognizing device
JPS63223890A (en) Drawing reader
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
KR100295715B1 (en) Handprint Recognition Accelerator System and Method
JPH11126216A (en) Automatic drawing input device
EP0175928A2 (en) Image understanding system
JPH10302025A (en) Handwritten character recognizing device and its program recording medium
JPH03212779A (en) Device for recognizing character
JP3666909B2 (en) Character recognition apparatus and method
JPS61153787A (en) Information processing device
KR100234028B1 (en) Character area discriminating method of character recognizing system
JPS62134767A (en) Automatic extracting device for symbol name and segment name
KR930012140B1 (en) Recogntion method of on-line writing down character using stroke automata
JPH1011542A (en) Character recognition device
JPH01201789A (en) Character reader
JPS61229177A (en) Recognizing system for character with voiced sound symbol and half voiced sound symbol
JPH03296883A (en) Method for recognizing document in document recognizing device
JPH0728951A (en) On-line character/graphic recognition device
JPH03111983A (en) Similar character identifying method
JPS63188284A (en) Character reader
JP2006228106A (en) Image processing method, image processing device, computer program, and storage medium
JPH04114292A (en) Japanese character recognizing device
JPH01154298A (en) Character recognizing method