JP2006227824A - Drawing recognition method and device - Google Patents

Drawing recognition method and device Download PDF

Info

Publication number
JP2006227824A
JP2006227824A JP2005039536A JP2005039536A JP2006227824A JP 2006227824 A JP2006227824 A JP 2006227824A JP 2005039536 A JP2005039536 A JP 2005039536A JP 2005039536 A JP2005039536 A JP 2005039536A JP 2006227824 A JP2006227824 A JP 2006227824A
Authority
JP
Japan
Prior art keywords
symbol
data
raster
pattern
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005039536A
Other languages
Japanese (ja)
Inventor
Takayasu Kasahara
孝保 笠原
Masaki Kaneda
昌基 金田
Hiroaki Suzuki
洋明 鈴木
Yuichi Koizumi
祐一 小泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2005039536A priority Critical patent/JP2006227824A/en
Publication of JP2006227824A publication Critical patent/JP2006227824A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To perform recognition processing of CAD data from electronic data on a drawing wherein a character and a figure are mixed, in a short time with high accuracy. <P>SOLUTION: This drawing recognition device has: a raster symbol pattern recognition means 5 performing recognition processing of a symbol with raster drawing data as input; a diagramming symbol pattern recognition means 7 performing symbol recognition with editing enabling format drawing data as input from candidates of the symbol recognized by the raster symbol pattern recognition means 5; a symbol recognition means 9 imparting ID information as the CAD data to the symbol recognized by the diagramming symbol pattern recognition means 7; a character area estimation means 10 area-dividing the drawing in reference to a recognized symbol position, and grouping a character string reflecting the area division; a character string recognition means 11 recognizing the character string of an estimated character area as attribute information of the symbol; and an integration recognition means 12 integrating the recognized symbol position and attribute information, and the ID information, and storing it in a CAD database. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、文字、記号、線分が混在する図面情報を電子データとして表現したものから必要な情報をエンジニアリングデータとして認識する方法と装置に係り、特に図面が表現する文字列・記号および相互の関連性を自動的に認識し設計データに活用可能な電子データとして認識する方法と装置に関する。   The present invention relates to a method and apparatus for recognizing necessary information as engineering data from the representation of drawing information including mixed characters, symbols, and line segments as electronic data, and more particularly to character strings / symbols represented by drawings and mutual information. The present invention relates to a method and apparatus for automatically recognizing relationships and recognizing them as electronic data that can be used for design data.

従来、文字、記号、線分が混在する図面情報を電子データとして表現したものから設計データに活用可能な電子データとして読み取る技術としては、例えば、特許文献1に開示されている、文字、記号、線分間の相対的位置関係と登録されている描画規則とを比較し、その知識を用いて認識結果を修正して精度を向上しているものがある。   Conventionally, as a technique of reading drawing information in which characters, symbols, and line segments are mixed as electronic data that can be used as design data, the character, symbol, In some cases, the relative positional relationship between line segments and a registered drawing rule are compared, and the recognition result is corrected using the knowledge to improve the accuracy.

また、非特許文献1には、認識した文字、記号、線分と、それらの間のあらかじめ登録された相対的位置関係を用い、その部分について再度認識処理を行うことで認識精度を向上させている方法が示されている。   In Non-Patent Document 1, recognition accuracy is improved by performing recognition processing again on the recognized character, symbol, line segment, and a relative positional relationship registered in advance between them. The way it is shown.

特開2001−92967号公報 (第4−6頁、第3、6図)JP 2001-92967 A (page 4-6, FIGS. 3 and 6) 笠原他、”図面認識システムの開発”,平成15年電気学会シンポジウム,2003年.Kasahara et al., “Development of drawing recognition system”, 2003 IEEJ Symposium, 2003. Image Processing−画像処理標準テキストブック,財団法人 画像情報処理教育振興会.Image Processing-Text Processing Standard Textbook, Foundation for Image Information Education. グラフィックファイルフォーマットハンドブック, David C.Kay/John R.Levine著・MbCD訳,アスキー出版。Graphic file format handbook, by David C. Kay / John R. Levine, translated by MbCD, ASCII Publishing. “DXFハンドブック“,オーム社.“DXF Handbook”, Ohmsha. プログラミング Microsoft Windows 下,日経BPソフトプレスProgramming Microsoft Windows, Nikkei BP Soft Press 中川聖一,”パターン情報処理”,p153,丸善.Seiichi Nakagawa, “Pattern Information Processing”, p153, Maruzen. 中川聖一,”パターン情報処理”,pp239−245,丸善.Seiichi Nakagawa, “Pattern Information Processing”, pp 239-245, Maruzen. Mike Heath,et.al “Comparison of Edge Detectors”, Computer Vision and Image Understanding Vol.69, No.1, pp.38−54, January, 1998Mike Heath, et.al “Comparison of Edge Detectors”, Computer Vision and Image Understanding Vol.69, No.1, pp.38-54, January, 1998 大津ほか,”パターン認識”,pp62−64,朝倉書店Otsu et al., “Pattern Recognition”, pp62-64, Asakura Shoten J. O’Rouke “Computational Geometry”,Cambridge University Press,1988.J. O’Rouke “Computational Geometry”, Cambridge University Press, 1988.

特許文献1記載の方法のように、図面のイメージデータから文字列、記号を抽出する場合、特に、文字列の認識精度には限界があり、エンジニアリングデータなど誤りが許されないデータの場合、最終確認に多くの手間を要する。確認に要する手間は、認識誤りが少ないほど小さいと考えられ、また、最終的な品質も自動認識精度よりは、少なくとも高くなると考えられる。   When extracting character strings and symbols from the image data of drawings as in the method described in Patent Document 1, especially when there is a limit to the recognition accuracy of character strings and data that does not allow errors such as engineering data, the final confirmation It takes a lot of work. The effort required for confirmation is considered to be smaller as the recognition error is smaller, and the final quality is considered to be at least higher than the automatic recognition accuracy.

一方、近年、設計情報としての意味付けはされていないが、線と文字列だけは、区別して編集可能としたデータフォーマットが広く流布しており(非特許文献2、非特許文献3、非特許文献4)、これを用いれば、特定位置の文字列情報は、100%の精度で求まると考えられる。しかしながら、これらのデータフォーマットで記述されたものは、意味づけを考慮されていない見掛けの形だけのデータのため以下のような問題がある。
(1)文字のグループ化がされていない場合がある。(たとえば、機器のIDが“RA−124”の場合、スペースの都合で“RA”と“124”が改行されていた場合、該編集可能化フォーマット中では、別の文字列として扱われる場合がある。
(2)記号についても、一般には、線の集まりとして、ばらばらに記述されている。ばらばらの線を端点の位置関係から接続関係をたどり、記号として認識するのは、一般的には、非常に大きな計算量を要する。極端な場合、一本の線分でも、任意の箇所で区切られ、内部では、短い線分の連続のデータとして扱われている場合がありうる。
On the other hand, although it has not been given meaning as design information in recent years, only a line and a character string have been widely distributed in a data format that can be edited separately (Non-Patent Document 2, Non-Patent Document 3, Non-patent). If this is used, it is considered that character string information at a specific position can be obtained with 100% accuracy. However, the data described in these data formats have the following problems because they are only apparent data that does not consider meaning.
(1) Characters may not be grouped. (For example, when the device ID is “RA-124”, if “RA” and “124” are broken due to space limitations, they may be treated as different character strings in the editable format. is there.
(2) In general, symbols are also described separately as a collection of lines. In general, a very large amount of calculation is required for recognizing a disjoint line as a symbol by following the connection relation from the positional relation of the end points. In an extreme case, even a single line segment may be divided at an arbitrary position, and may be handled as continuous data of a short line segment inside.

本発明の課題は、文字情報と線の情報からなるベクトルフォーマットの図面データから、所望のエンジニアリングデータを精度よく、かつ高速に取得することである。   An object of the present invention is to obtain desired engineering data with high accuracy and high speed from drawing data in a vector format composed of character information and line information.

上記課題を達成するために、本発明は、文字、記号を含む図面のイメージデータ、すなわちラスター図面データと、図面を、文字と図形を個別に編集することが可能な形式で表現した編集可能化フォーマット図面データとを併用することにより、ラスター図面データでおおまかな記号の認識を行い、その候補の中で、編集可能化フォーマット図面データを利用してさらに認識対象を絞り組むことを特徴としている。   In order to achieve the above object, the present invention makes it possible to edit image data of a drawing including characters and symbols, that is, raster drawing data, and the drawing in a format in which characters and figures can be individually edited. By using together with the format drawing data, rough symbols are recognized with the raster drawing data, and among the candidates, the recognition target is further narrowed down using the editable format drawing data.

具体的には、上記課題を達成する本発明は、文字、記号を含む図面のラスター図面データを記憶する画像記憶装置と、文字と図形を個別に編集することが可能な編集可能化フォーマット図面データで表現された前記図面を記憶する編集可能化フォーマット図面データ記憶装置と、認識結果がCADデータとして格納されるCADデータベースと、記号をラスター図面データ形式で表現したラスターパターンを記憶するラスターパターン記憶装置と、前記記号を編集可能化フォーマット形式で記述した線図化パターン及び前記記号と属性文字の相対的位置関係を記憶する線図化パターン記憶装置と、CADデータベース上での記号種別のID情報と、前記ラスターパターン及び線図化パターンとを対応付ける情報を格納する記号ライブラリ記憶装置と、前記ラスターパターン記憶装置に記憶されたラスターパターンと前記画像記憶装置に格納されたラスター図面データとを照合して前記図面中の記号位置の範囲を絞り込むラスター記号パターン認識手段と、前記線図化パターン記憶装置に記憶された線図化パターンと前記編集可能化フォーマット図面データ記憶装置に格納された編集可能化フォーマット図面データとを照合し、前記絞り込まれた範囲から編集可能化フォーマット形式で記述された記号を認識する線図化記号パターン認識手段と、前記認識された線図化パターンに対して、記号ライブラリ記憶装置の情報を参照して記号の位置CADデータとしてのID情報を付与する記号認識手段と、前記画像記憶装置に記憶されたラスター図面データの文字領域を推定する文字領域推定手段と、推定された文字領域の文字列を認識する文字列認識手段と、文字列の位置情報と文字列の内容、および、線図化記号パターン認識手段で認識された記号位置を用いて、記号の位置と記号に関する属性文字列を認識しCADデータベースに格納する統合認識手段と、を含んで構成されて図面中の文字、記号及びその相互の関係を認識する図面認識装置である。   Specifically, the present invention that achieves the above-described object includes an image storage device that stores raster drawing data of drawings including characters and symbols, and editable format drawing data that can individually edit characters and graphics. Editable format drawing data storage device for storing the drawing expressed in the above, a CAD database for storing recognition results as CAD data, and a raster pattern storage device for storing a raster pattern in which symbols are expressed in a raster drawing data format A plotting pattern in which the symbol is described in an editable format format, a plotting pattern storage device that stores the relative positional relationship between the symbol and the attribute character, and ID information of the symbol type on the CAD database; A symbol library storage for storing information for associating the raster pattern and the diagrammatic pattern A raster symbol pattern recognizing means for collating a raster pattern stored in the raster pattern storage device with raster drawing data stored in the image storage device and narrowing a range of symbol positions in the drawing; The plotting pattern stored in the plotting pattern storage device is compared with the editable format drawing data stored in the editable format drawing data storage device, and the editable format format is used from the narrowed range. A diagrammatic symbol pattern recognizing unit for recognizing the described symbol, and ID information as symbol position CAD data is given to the recognized diagrammed pattern by referring to information in the symbol library storage device. Symbol recognition means and a character area for estimating a character area of raster drawing data stored in the image storage device The character string recognition means for recognizing the character string of the estimated character area, the character string position information and the content of the character string, and the symbol position recognized by the diagrammatic symbol pattern recognition means And a unified recognition means for recognizing the position of the symbol and the attribute character string related to the symbol and storing them in the CAD database, and a drawing recognition apparatus for recognizing characters and symbols in the drawing and their mutual relationship.

上記構成によれば、文字、記号を含む図面の電子データから記号を認識する際に、図面のビットマップデータ等のイメージデータ、すなわちラスター図面データから、認識しようとする記号をラスター図面データで表現したラスターパターンを参照して記号の候補(位置)を絞り込み、絞り込んだ候補(位置)に対して、記号を編集可能化フォーマットで記述した線図化パターンを用いて、図面を編集可能化フォーマットで表現した編集可能化フォーマット図面データから記号を認識する。   According to the above configuration, when a symbol is recognized from electronic data of a drawing including characters and symbols, the symbol to be recognized is represented by raster drawing data from image data such as bitmap data of the drawing, that is, raster drawing data. Narrow down the candidate (position) of the symbol with reference to the raster pattern, and use the diagram pattern that describes the symbol in the editable format for the narrowed down candidate (position). Recognize symbols from the rendered editable format drawing data.

したがって、記号を編集可能化フォーマットで記述した線図化パターンを用いて、図面を編集可能化フォーマットで表現した編集可能化フォーマット図面データ全体から記号を認識する場合よりも演算量が低減され、図面の認識に要する時間が短縮される。   Therefore, using a diagram pattern in which symbols are described in an editable format, the amount of calculation is reduced compared to the case where symbols are recognized from the entire editable format drawing data in which the drawing is expressed in an editable format. The time required for recognition is reduced.

前記文字領域推定手段は、認識された記号の位置情報を利用してラスター図面データから文字列の領域分けを行なうよう構成されていることが望ましい。このように、認識された記号の位置情報を利用してラスター図面データから文字列の領域分けを行なうことにより、文字列の認識精度が向上する。   The character area estimation means is preferably configured to divide a character string from raster drawing data using position information of recognized symbols. As described above, the character string recognition accuracy is improved by dividing the character string from the raster drawing data using the position information of the recognized symbol.

また、ラスター図面データと編集可能化フォーマット図面データ相互の位置の対応関係を設定する図面位置対応データ手段を設けることが望ましい。   Further, it is desirable to provide a drawing position correspondence data means for setting a correspondence relationship between the raster drawing data and the editable format drawing data.

また、編集可能化フォーマット図面データを入力とし、該データの文字の情報を位置情報とともに抽出するとともに、該編集可能化フォーマット図面データから消去し、文字が消去された該編集可能化フォーマット図面データをラスター図面データに変換する非文字部画像データ生成手段を含んでなる図面認識装置としてもよい。このような手段を設けることにより、編集可能化フォーマット図面データのみが入手可能であるときでも、編集可能化フォーマット図面データから文字が消去されたラスター図面データを生成し、ラスター図面データと編集可能化フォーマット図面データを用いた図面認識装置による図面認識を行なうことができる。   Further, the editable format drawing data is input, and the character information of the data is extracted together with the position information, and the editable format drawing data is deleted from the editable format drawing data, It is good also as a drawing recognition apparatus containing the non-character part image data generation means converted into raster drawing data. By providing such means, even when only editable format drawing data is available, raster drawing data in which characters are deleted from editable format drawing data is generated, and the raster drawing data and editable Drawing recognition by the drawing recognition apparatus using the format drawing data can be performed.

上記の課題は又、文字、記号を含む図面のラスター図面データ及び文字と図形を個別に編集することが可能な編集可能化フォーマット図面データで表現された前記図面を記憶する手順と、前記記憶されたラスター図面データと予め記号をラスター図面データ形式で表現したラスターパターンを参照して該記号の図面上の位置の範囲を絞り込む手順と、前記記号を編集可能化フォーマット形式で記述した線図化パターン、前記ラスターパターンと線図化パターンとを対応付ける情報及び前記文字と図形を個別に編集することが可能な編集可能化フォーマット図面データで表現された前記図面を参照し、前記絞り込まれた図面上の位置の範囲から編集可能化フォーマット形式で記述された記号を認識する手順と、前記認識された記号の線図化パターンに対して、予め設定されているCADデータベース上での記号種別のID情報を参照して記号の位置CADデータとしてのID情報を付与する手順と、前記認識された記号位置を参照して、前記記憶されたラスター図面データの文字領域を推定する手順と、推定された文字領域の文字列を認識する手順と、文字列の位置情報と文字列の内容、予め記憶されている記号と属性文字の相対的位置関係および、前記認識された記号位置を用いて、記号の位置と記号に関する属性文字列を認識しCADデータベースに格納する手順と、を含んで構成されて図面中の文字、記号及びその相互の関係を認識する図面認識方法によっても達成される。   The above-described problem is also stored in the raster drawing data of the drawing including characters and symbols, and the procedure of storing the drawing expressed in the editable format drawing data capable of editing the character and the graphic individually. The raster drawing data and the raster pattern in which the symbol is expressed in the raster drawing data format in advance are referred to, and the range of the position of the symbol on the drawing is narrowed, and the diagram is a diagram pattern in which the symbol is described in the editable format format. Referring to the drawing expressed in the editable format drawing data capable of individually editing the character pattern and the figure, and the information for associating the raster pattern with the diagrammed pattern, on the narrowed drawing A procedure for recognizing a symbol described in an editable format from a range of positions, and a diagram of the recognized symbol The ID information as symbol position CAD data by referring to the ID information of the symbol type on a preset CAD database, and the recognized symbol position, A procedure for estimating the character area of the stored raster drawing data, a procedure for recognizing the character string of the estimated character area, position information of the character string and the contents of the character string, pre-stored symbols and attribute characters And a procedure for recognizing a symbol position and an attribute character string related to the symbol and storing them in a CAD database using the recognized symbol position, and the character, symbol, and symbol in the drawing. This is also achieved by a drawing recognition method for recognizing the mutual relationship.

この方法によっても、先に述べたと同様に、図面の認識に要する時間が短縮される。   This method also reduces the time required for recognizing the drawing, as described above.

本発明によれば、文字、記号、線分が混在する図面情報を、編集可能化フォーマット図面データのみを用いて認識する場合よりも、精度よく、短時間で自動認識することができる。   According to the present invention, drawing information in which characters, symbols, and line segments are mixed can be automatically recognized with higher accuracy and in a shorter time than when using only editable format drawing data.

以下、本発明の実施の形態について図面を参照して説明する。
(第1の実施の形態)
図1は本発明の第1の実施の形態に係る図面認識装置の全体構成を示すブロック図である。図示の図面認識装置は、大きく分けて、コンピュータと、このコンピュータに接続された画像データ入力装置1、データ出力装置16、及びインターフェースからなる。
Embodiments of the present invention will be described below with reference to the drawings.
(First embodiment)
FIG. 1 is a block diagram showing the overall configuration of a drawing recognition apparatus according to the first embodiment of the present invention. The drawing recognition apparatus shown in the figure is roughly divided into a computer, an image data input device 1, a data output device 16, and an interface connected to the computer.

インターフェースは、表示画面と、キーボード、マウス及びそれらを制御する装置を含んで構成され、ソフトウエアとして、図面位置対応データ設定手段18、認識結果修正手段14、認識結果表示手段13を備える。   The interface includes a display screen, a keyboard, a mouse, and devices for controlling them, and includes drawing position correspondence data setting means 18, recognition result correction means 14, and recognition result display means 13 as software.

画像データ入力装置1は、紙図面をラスター図面データフォーマットとして読み取る機能を持ったスキャナと処理ソフト、及び、編集可能化フォーマット図面データを読み取るファイル入力装置が組み合わされた装置である。   The image data input device 1 is a device in which a scanner having a function of reading a paper drawing as a raster drawing data format, processing software, and a file input device for reading editable format drawing data are combined.

データ出力装置16は、コンピュータに保持されたデータを、CD−ROMなどの記憶媒体に出力する装置である。   The data output device 16 is a device that outputs data held in the computer to a storage medium such as a CD-ROM.

コンピュータは、RAM、CPU、記憶装置からなる。RAMは、処理結果を一時的に保持するもので、画像データ入力装置1から入力されるラスター図面データを保持する画像記憶装置2、画像データ入力装置1から入力される編集可能化フォーマット図面データを保持する編集可能化フォーマット図面データ記憶装置3、及び、図面位置対応データ設定手段18から入力されるデータを保持する図面位置対応データ記憶装置17からなる。   The computer includes a RAM, a CPU, and a storage device. The RAM temporarily holds the processing results. The image storage device 2 holds raster drawing data input from the image data input device 1, and editable format drawing data input from the image data input device 1. It comprises an editable format drawing data storage device 3 to be held and a drawing position correspondence data storage device 17 to hold data inputted from the drawing position correspondence data setting means 18.

CPUは、ラスター記号パターン認識手段5、線図化記号パターン認識手段7、記号認識手段9、文字領域推定手段10、文字列認識手段11、統合認識手段12の各ソフトウエアの処理を実行する。   The CPU executes processing of each software of the raster symbol pattern recognizing means 5, the diagrammatic symbol pattern recognizing means 7, the symbol recognizing means 9, the character area estimating means 10, the character string recognizing means 11, and the integrated recognizing means 12.

記憶装置は、データを恒久的に保持するもので、ハードディスク及びその制御装置が対応し、ラスターパターン記憶装置6と、線図化パターン記憶装置8と、記号ライブラリ記憶装置15と、前記認識結果修正手段14と前記統合認識手段12の処理結果が格納されるCADデータベース4と、からなる。ラスターパターン記憶装置6には、予め記号認識の基準となるラスターパターンが格納される。   The storage device retains data permanently, and corresponds to a hard disk and its control device, a raster pattern storage device 6, a diagrammed pattern storage device 8, a symbol library storage device 15, and the recognition result correction. Means 14 and a CAD database 4 in which the processing results of the integrated recognition means 12 are stored. The raster pattern storage device 6 stores a raster pattern as a reference for symbol recognition in advance.

画像データ入力装置1のスキャナに紙図面を入力すると、スキャナからはラスター図面データが出力され、画像記憶装置2に格納される。また、画像データ入力装置1のファイル入力装置に、編集可能化フォーマット図面データを入力すると入力されたデータは、編集可能化フォーマット図面データ記憶装置3に格納される。   When a paper drawing is input to the scanner of the image data input device 1, raster drawing data is output from the scanner and stored in the image storage device 2. When the editable format drawing data is input to the file input device of the image data input device 1, the input data is stored in the editable format drawing data storage device 3.

ラスター図面データの種類としては、BMP(ビットマップ)形式(非特許文献2)、tiff形式(非特許文献3)などがある。また、編集可能化フォーマットは、DXF(Autodesk社)形式(非特許文献4)、Windows(登録商標)(非特許文献5)メタファイル(マイクロソフト社)形式など、文字と図形とを区別してその位置座標とともに、登録できるフォーマットとする。また、ラスター図面フォーマットの特定の位置座標(X,Y)と、対応する同じ点での編集可能化フォーマットでの座標(X’,Y’)との間には、1対1の対応関係があり、相互に対応点座標を計算可能とする。   The types of raster drawing data include BMP (bitmap) format (Non-Patent Document 2), tiff format (Non-Patent Document 3), and the like. The editable format is distinguished from characters and graphics in the DXF (Autodesk) format (non-patent document 4), Windows (registered trademark) (non-patent document 5) metafile (Microsoft) format, etc. A format that can be registered together with the coordinates. Further, there is a one-to-one correspondence between the specific position coordinates (X, Y) in the raster drawing format and the coordinates (X ′, Y ′) in the corresponding editable format at the same point. Yes, the corresponding point coordinates can be calculated mutually.

この2つの対応関係の設定は、インターフェースに組み込まれた図面位置対応データ設定手段18によって実行される。図15にインターフェース上の表示例を示す。この例では、左側にラスター図面(例えばBMP形式)を、右側に編集可能化フォーマット図面を表示し、ポインティングデバイスで対応点を順次、設定していくことにより、図面中の対応点を設定する。図15の例では、対応点1として、1501の点と、1502の点が、対応点3として、1503の点と1504の点が、それぞれ対応するように、設定されている。設定点を何点対応づけすればよいかは、用いる手法によって異なるが、もっとも一般的な方法であるアフィン変換(非特許文献10)を用いた場合、最低4点の対応関係を設定すれば、2つの図面全体で、対応関係を定義できる。図15では、対応点2,4の記載が省略されている。図15のインターフェースによって設定されたデータは、図面位置対応データ記憶装置17に記憶される。   The setting of the two correspondence relationships is executed by the drawing position correspondence data setting means 18 incorporated in the interface. FIG. 15 shows a display example on the interface. In this example, a raster drawing (for example, BMP format) is displayed on the left side, an editable format drawing is displayed on the right side, and corresponding points are sequentially set with a pointing device, thereby setting corresponding points in the drawing. In the example of FIG. 15, the corresponding points 1 are set so that the points 1501 and 1502 correspond to the corresponding points 3, and the points 1503 and 1504 correspond to each other. How many set points should be associated depends on the method used, but when using the most common method, affine transformation (Non-Patent Document 10), if a correspondence relationship of at least 4 points is set, Correspondence can be defined across the two drawings. In FIG. 15, the corresponding points 2 and 4 are not shown. Data set by the interface of FIG. 15 is stored in the drawing position correspondence data storage device 17.

図16に、図面位置対応データ記憶装置17に記憶された図面位置対応データの例を示す。ラスター図面(イメージデータ図面)と、編集可能化フォーマット図面における対応点の組が表形式で記憶されている。図15のような表示を行なうインターフェースがなくても、図16に示すデータをユーザが作成して、図面位置対応データ記憶装置17に取り込むことにより、同様の機能を実現することもできる。   FIG. 16 shows an example of drawing position correspondence data stored in the drawing position correspondence data storage device 17. A set of corresponding points in the raster drawing (image data drawing) and the editable format drawing is stored in a table format. Even if there is no interface for performing the display as shown in FIG. 15, the user can create the data shown in FIG. 16 and import it into the drawing position correspondence data storage device 17 to realize the same function.

図2は、編集可能化フォーマット図面データの例のひとつとして、DXF形式によるもの(非特許文献4)を示したもので、線はPOLYLINEタグで線をつなぐ端点の集合として表示されている。一方、文字列は、TEXTタグにより、線とは区別されてその文字領域の矩形座標、及び文字の向きとともに記述されている。   FIG. 2 shows the DXF format (Non-Patent Document 4) as one example of the editable format drawing data, and the lines are displayed as a set of end points connecting the lines with POLYLINE tags. On the other hand, the character string is distinguished from the line by the TEXT tag and is described together with the rectangular coordinates of the character region and the direction of the character.

図3は、単線結線図のラスター図面の例を示したもので、このようなラスター図面データは、例えば、BMPのモノクロ形式であれば、各座標の位置ごとに、0か1かの値として保持されている。   FIG. 3 shows an example of a raster diagram of a single-line diagram. Such raster diagram data is, for example, a value of 0 or 1 for each coordinate position in the BMP monochrome format. Is retained.

一方、CADデータとしては、図面の表す意味を抽出して登録する必要がある。図3の例では、母線に4個の機器が接続されており、それぞれの機器が、どのようなものかは、母線からぶらさがっている図形の形状から認識し、CADデータ化する必要がある。また、それぞれの機器の機器番号とシーケンス番号は、図の下側の表に記述されており、これらのデータも機器の種類とともにCADデータ化する必要がある。   On the other hand, it is necessary to extract and register the meaning represented by the drawing as CAD data. In the example of FIG. 3, four devices are connected to the bus, and it is necessary to recognize what each device is from the shape of the figure hanging from the bus and convert it to CAD data. The device number and sequence number of each device are described in the lower table of the figure, and these data need to be converted into CAD data together with the device type.

図4に、図1に示す構成の装置を使用し、ラスター図面データと編集可能化フォーマット図面データの2種類のフォーマットを用いて、CADデータを作成する概略処理手順を示す。   FIG. 4 shows a schematic processing procedure for creating CAD data by using the apparatus having the configuration shown in FIG. 1 and using two types of formats: raster drawing data and editable format drawing data.

まず、手順200で、画像データ入力装置1でラスター図面データと編集可能化フォーマット図面データが読み込まれ、画像記憶装置2と編集可能化フォーマット図面データ記憶装置3にそれぞれ格納される。   First, in step 200, raster image data and editable format drawing data are read by the image data input device 1 and stored in the image storage device 2 and editable format drawing data storage device 3, respectively.

手順201では、ラスター記号パターン認識手段5により、あらかじめラスターパターン記憶装置6に格納されている基準となるラスターパターンと、画像記憶装置2に格納されたラスター図面データとがパターン照合され、ラスター図面データの中の記号が認識される。そのための方法としては、直接、形状をなどるテンプレートマッチングの方法(非特許文献6)や、部分特徴を組みあわせたもの(非特許文献7)、それらの処理にフーリエ変換やウエーブレット変換などの画像処理を利用した方法(非特許文献8)などの公知の方法を用いることができる。これらの、処理に必要なテンプレートや部分特徴は、ラスターパターン記憶装置6にあらかじめ登録しておく。図13に、弁の記号のラスターパターンの例を示す。この例は、0と1で表現されるBMPファイルフォーマットの記号テンプレートの例であり、1のところが線のあるところを示している。手順201の処理では、次の手順202の処理でさらに詳細な照合をすることを前提としているため、厳密にパターンが一致しなくても、記号の候補の領域(位置)を取りだしておく。   In step 201, the raster symbol pattern recognition means 5 performs pattern matching between the reference raster pattern stored in the raster pattern storage device 6 in advance and the raster drawing data stored in the image storage device 2. The symbols in are recognized. As a method therefor, a template matching method (Non-patent Document 6) that directly shapes the shape, a combination of partial features (Non-Patent Document 7), a Fourier transform, a wavelet transform, or the like for these processes. A known method such as a method using image processing (Non-patent Document 8) can be used. These templates and partial features necessary for processing are registered in the raster pattern storage device 6 in advance. FIG. 13 shows an example of a raster pattern of valve symbols. This example is an example of a symbol template of the BMP file format expressed by 0 and 1, where 1 indicates a line. In the process of the procedure 201, since it is premised that further detailed collation is performed in the process of the next procedure 202, even if the patterns do not exactly match, the symbol candidate area (position) is extracted.

手順202の処理は、線図化記号パターン認識手段7により実行される。手順201の処理で絞りこまれた記号の候補の領域(位置)に対して、あらかじめ線図化パターン記憶装置8に登録された線図化記号のパターン(線図化パターン)を基準に用いて編集可能化フォーマット図面データ記憶装置3に格納された編集可能化フォーマット図面データと照合し、最終的な記号の認識を実行する。図5は線図化パターン記憶装置8に予め格納されている、認識の基準となる線図化パターンの例を示す。線図化パターンは、記号パターンの基準座標位置に対する相対的な位置に存在する線の位置座標で記述する。このため、本発明のように記号位置の候補を絞りこまないで、図面全体でこのような線図のパターンの照合を行うと大きな計算量が必要となる。   The process of step 202 is executed by the diagrammatic symbol pattern recognition means 7. For the symbol candidate area (position) narrowed down in the process of step 201, the chart symbol pattern (diagram pattern) registered in the chart pattern storage device 8 in advance is used as a reference. The final symbol recognition is executed by comparing with the editable format drawing data stored in the editable format drawing data storage device 3. FIG. 5 shows an example of a plotting pattern that is stored in the plotting pattern storage device 8 in advance and serves as a reference for recognition. The diagram pattern is described by the position coordinates of a line existing at a position relative to the reference coordinate position of the symbol pattern. For this reason, a large amount of calculation is required when collating the pattern of such a diagram in the entire drawing without narrowing down the symbol position candidates as in the present invention.

図5の左側は、パターン対象を目でみてわかるようにラスター表示したもので、符号501の場所が基準点である。右側が対応する線図のパターンの一部をしめしたもので、ラスターの503に対応するのが、線図化パターンの505、ラスターの504に対応するのが線図化パターンの507、ラスターの502に対応するのが線図化パターンの506となる。線図化パターンでは、基準点からの相対位置座標で表されており、この例では、y座標は、下向きとしている。たとえば、505の部分は、4点からなるポリラインで、4点の座標がそれぞれ。(−200.0,50.0),(−200.0,70.0),(−150.0,70.0),(−150.0,50.0)であることを示している。このような記法は、一般的なものである。実際には、ラスター図面データで絞り込まれたパターンの位置が、多少ずれている場合も考えられるので、この周辺に余裕をみて線を探索する。また、編集可能化フォーマット中でのポリラインとしてのグループ分けが必ずしも、パターンと一致しない場合もあるので、探索は、ポリラインで定義された、各点を結ぶそれぞれの線に対して、線があるかどうかを照合して実施される。   The left side of FIG. 5 is a raster display so that the pattern object can be seen visually, and the location of reference numeral 501 is the reference point. The right side shows a part of the corresponding diagram pattern. The raster pattern 505 corresponds to the raster pattern 503, the raster pattern 504 corresponds to the raster pattern 507, and the raster pattern 507 corresponds to the raster pattern 504. The diagram pattern 506 corresponds to 502. In the diagram pattern, it is represented by relative position coordinates from the reference point, and in this example, the y coordinate is downward. For example, the portion 505 is a polyline consisting of 4 points, and the coordinates of 4 points. (−200.0,50.0), (−200.0,70.0), (−150.0,70.0), and (−150.0,50.0). Such a notation is common. Actually, there may be a case where the position of the pattern narrowed down by the raster drawing data is slightly deviated, so a line is searched with a margin around this area. Also, the grouping as polylines in the editable format may not always match the pattern, so the search is a line for each line connecting each point defined in the polyline It is carried out by checking whether or not.

手順203は、記号認識手段9により実行される。手順203では、手順202で認識されたパターンに対して、記号ライブラリ記憶装置15に定義された記号ライブラリを用いて、CADに用いるための記号の種別のIDと、付与すべき属性の数や種類が与えられる。これらは、手順206の統合認識において用いられる。図14に、記号ライブラリ記憶装置15に定義された記号ライブラリの例を示す。この例では、図5の線図化パターンAに対応する記号ライブラリが登録されており、CAD中における記号IDや、付随する属性データが設定されている。   Procedure 203 is executed by the symbol recognition means 9. In step 203, for the pattern recognized in step 202, using the symbol library defined in the symbol library storage device 15, the symbol type ID for use in CAD, and the number and type of attributes to be assigned Is given. These are used in the integrated recognition of procedure 206. FIG. 14 shows an example of a symbol library defined in the symbol library storage device 15. In this example, a symbol library corresponding to the diagrammed pattern A in FIG. 5 is registered, and a symbol ID in CAD and accompanying attribute data are set.

次に、文字領域推定手段10により手順204が実行される。手順204においては、CADデータ化に必要な属性文字列の領域がグループ化して認識される。図面の中の文字列の中には、必ずしもCADデータ化に必要なものだけがあるわけではない。また、たとえば、弁の属性などの文字列のデータは、スペースの都合等で、途中で改行されて図3の下側の表のシーケンス番号のように“QA−”と“231”のように改行されていても、“QA−231”と、ひとつの属性文字列として認識される必要がある。   Next, the procedure 204 is executed by the character area estimation means 10. In step 204, attribute character string areas necessary for CAD data conversion are recognized as a group. Some character strings in the drawings are not necessarily required for CAD data conversion. In addition, for example, the character string data such as the valve attribute is line-breaked in the middle due to space or the like, as in the sequence numbers in the lower table of FIG. 3, such as “QA-” and “231”. Even if there is a line break, it is necessary to recognize “QA-231” as one attribute character string.

このような場合に、ラスター図面データと編集可能化フォーマット図面データを併用して認識精度を上げる方法として、(1)特許文献1に記述された記号の位置と属性文字との相対位置関係を用いて属性文字列を探す方法、(2)文字と記号以外の線をまたいでいる場合は、同じグループの属性文字列になる可能性が低いことを利用する方法、および、(3)記号以外には、残された線と文字列とを区別して文字列属性のグループ化をする方法、の3つの公知の手段がある。ここでは、一例としてこの3つを併用した方法によって、手順204の文字列領域のグループ化の詳細処理手順を説明する。   In such a case, as a method for improving the recognition accuracy by using both the raster drawing data and the editable format drawing data, (1) the relative positional relationship between the position of the symbol and the attribute character described in Patent Document 1 is used. (2) If you straddle lines other than characters and symbols, use the fact that it is unlikely to be an attribute string of the same group, and (3) Other than symbols There are three known means: a method of grouping character string attributes by distinguishing remaining lines and character strings. Here, as an example, a detailed processing procedure for grouping character string regions in step 204 will be described using a method using these three in combination.

図6は手順204の処理の流れを示したもので、おおまかにいえば、輪郭線を線分近似した場合の線分の長さに基づいて、記号以外の残された直線と文字の線を区別し、記号の矩形領域と図中の文字以外の線と記号の矩形の領域を用いて図面を領域分割して、領域をまたいでの文字列のグループ化の閾値を大きくして文字列をグループ化する。   FIG. 6 shows the flow of the process in step 204. Roughly speaking, the remaining straight lines and character lines other than symbols are represented based on the lengths of the line segments when the outline is approximated to the line segments. Separate the drawing using the rectangular area of the symbol, the non-character line in the figure, and the rectangular area of the symbol, and increase the threshold for grouping the character strings across the areas to Group.

まず、手順601で、すでに手順203において認識された記号の領域がラスター図面から削除される。削除の方法としては、ラスター図面から記号として認識された領域を削除する方法や、ラスター図面が編集可能化フォーマット図面データから生成される場合には、編集可能化フォーマット図面データの記号に対応するポリラインデータのみを消去した後、ラスター化する方法で実現できる。   First, in step 601, the symbol area already recognized in step 203 is deleted from the raster drawing. You can delete the area recognized as a symbol from the raster drawing, or if the raster drawing is generated from editable format drawing data, the polyline corresponding to the symbol of the editable format drawing data This can be achieved by rasterizing the data only.

次に手順602で、手順601で残された図面領域の輪郭線が生成される。これは、Cannyのアルゴリズム(非特許文献8)で容易に実現することができる。この輪郭線を設定した近似で線分近似する。これは、ある画素中の近似線分とのずれが閾値以下になるような近似により(非特許文献9)実現できる。通常、CADデータにする属性文字列は、ある大きさの範囲以下であるので、線分近似された一本の線がある閾値より大きいと、CADデータの属性文字の線とは考えられず、文字以外の線と考えられる。   Next, in step 602, the outline of the drawing area left in step 601 is generated. This can be easily realized by Canny's algorithm (Non-Patent Document 8). The line segment is approximated by the approximation in which the contour line is set. This can be realized by approximation such that a deviation from an approximate line segment in a certain pixel is equal to or less than a threshold (Non-Patent Document 9). Usually, the attribute character string to be CAD data is less than a certain size range, so if one line approximated by a line segment is larger than a certain threshold value, it cannot be considered as an attribute character line of CAD data. It is considered as a non-character line.

手順603では、前記線分近似された一本の線がある閾値より大きいかどうかの判定が実施され、閾値以上の長い線分のみが取り出される。閾値は、図面全体で設定するか、記号パターンのデータの属性位置のデータに、図5の511,512,513のように定義しておく。図5の511,512,513は、それぞれ、508、509、510の位置に対応する属性文字列が存在することを定義するデータで、属性文字列の位置はポリラインデータとして、属性名称は属性タグの直後に、たとえば、511の例では、“機器名”として、定義されており、文字列の大きさは、文字サイズタグとして、511の例では、一文字の矩形の大きさが20ピクセルとして定義されている。このように定義された文字列の大きさよりも、例えば2倍以上の長さを持つ線分は、文字列の一部とは考えられないので、文字以外の線とみなすわけである。   In step 603, it is determined whether one line approximated to the line segment is larger than a threshold value, and only a long line segment equal to or greater than the threshold value is extracted. The threshold value is set in the entire drawing or defined in the attribute position data of the symbol pattern data as 511, 512, and 513 in FIG. 511, 512, and 513 in FIG. 5 are data that define the presence of attribute character strings corresponding to the positions of 508, 509, and 510, respectively. The position of the attribute character string is polyline data, and the attribute name is an attribute tag. For example, in the example of 511, it is defined as “device name”, and the size of the character string is defined as a character size tag, and in the example of 511, the size of a rectangle of one character is defined as 20 pixels. Has been. For example, a line segment having a length twice or more than the size of the character string defined in this way is not considered a part of the character string, and is therefore regarded as a line other than a character.

手順604では、こうして認識された線と、記号の矩形領域の上下左右の線を用いて、図面が図7のように領域分割される。   In step 604, the drawing is divided into regions as shown in FIG. 7 using the lines recognized in this way and the upper, lower, left and right lines of the rectangular area of the symbol.

手順605では、短い直線からなる輪郭線の近傍が、図7の領域分割と、図5に示したそれぞれの記号に対する属性位置の両方を考慮してグループ化される。図8は、もとの図7から記号領域と文字以外の線を消去し、文字列と境界線のみを示したものである。この例では、図5の属性文字列の領域と境界をまたいでグループ化が競合しないため、結果として、文字列は、図9の点線枠で示したように、グループ化される。グループ化に際しては、閾値を設定するなどして、図5で定義された同じ属性範囲にある文字列領域の候補は、同じグループになるように、かつ、図7の領域を分割する分割線をまたぐグループ化は、できるだけ避けるようにグループ化される。この2つの要求が競合を生じた場合には、領域を設定している線の位置、(領域を設定している線や、記号の位置が、グループ化しようとする文字列から遠い場合には、分割線の効力は小さいと考えられる)、属性文字列の種類(属性によっては、図5の属性パターンに、文字列の大きさだけでなく、文字の種類(英数、漢字、あるいは、属性名の限定(アルファベット−数字4桁のパターンなど))を総合的に考慮してグループ化をおこなう。   In step 605, the neighborhoods of the contour line composed of short straight lines are grouped in consideration of both the region division in FIG. 7 and the attribute positions for the respective symbols shown in FIG. FIG. 8 shows only the character string and the boundary line by deleting the lines other than the symbol area and the character from the original FIG. In this example, grouping does not compete across the boundary of the attribute character string in FIG. 5 and the boundary. As a result, the character strings are grouped as shown by the dotted frame in FIG. When grouping, by setting a threshold value or the like, the character string region candidates in the same attribute range defined in FIG. 5 are divided into the same group and dividing lines for dividing the region in FIG. Crossing groups are grouped to avoid as much as possible. If these two requests cause a conflict, the position of the line that sets the region (if the line or symbol that sets the region is far from the character string to be grouped) The dividing line is considered to be less effective), the type of attribute string (depending on the attribute, the attribute pattern in FIG. Grouping is performed with comprehensive consideration of name restrictions (alphabet-4-digit pattern, etc.).

手順204で文字列領域が推定、グループ化されたら、手順205に進む。手順205では、文字列認識手段11により、手順204で推定された文字列領域と、編集可能化フォーマット図面データ記憶装置3に記憶されている編集可能化フォーマット図面データの中の、図2の例のように定義されているTEXTの矩形座標を比較して、推定された領域にある文字を編集可能化フォーマットから抽出することで、認識文字列が生成される。あるいは、推定された領域に対して、文字認識ソフトを起動して文字列を抽出することも可能である。   When the character string area is estimated and grouped in step 204, the process proceeds to step 205. In step 205, the character string area estimated in step 204 by the character string recognition means 11 and the editable format drawing data stored in the editable format drawing data storage device 3 are shown in the example of FIG. A recognition character string is generated by comparing the rectangular coordinates of the TEXT defined as described above and extracting characters in the estimated area from the editable format. Alternatively, it is possible to activate character recognition software and extract a character string for the estimated region.

生成された文字列は、統合認識手段12により、図10に概念的に示したように、それぞれの記号に対して属性文字列として付与されることになる(手順206)。どの記号にどの文字列が付与されるのかは、主として、記号と文字の位置関係及び文字の種類、文字の内容により、マッピングは限定される。最終的にCADデータベース4に格納されるデータ(CADデータ)は、図10のように、記号の種類と位置、および、認識された属性データの組となる。   The generated character string is given as an attribute character string to each symbol by the integrated recognition means 12 as conceptually shown in FIG. 10 (step 206). Which character string is assigned to which symbol is mainly limited by the positional relationship between the symbol and the character, the character type, and the character content. The data (CAD data) finally stored in the CAD database 4 is a set of symbol type and position and recognized attribute data as shown in FIG.

生成されたCADデータは、手順207において、認識結果表示手段13によって表示画面に表示され、ユーザにより確認される。必要ならユーザは、表示されたデータをキーボードを介し認識結果修正手段14によって修正する。認識結果表示手段13には、たとえば、DXFデータを表示できる、AutoCADなどのCADソフトや、配管設計や地図データ作成に特有のCADソフトを用いることができる。また、認識結果修正手段14は、上記表示に用いたCADソフトと同じものを用いることができるが、たとえば、図17に示すような、表形式で属性データの修正入力を行うインターフェース画面を用いることも考えられる。   In step 207, the generated CAD data is displayed on the display screen by the recognition result display means 13, and is confirmed by the user. If necessary, the user corrects the displayed data by the recognition result correcting means 14 via the keyboard. As the recognition result display means 13, for example, CAD software such as Auto CAD, which can display DXF data, or CAD software specific to piping design and map data creation can be used. The recognition result correction means 14 can use the same CAD software used for the display, but for example, use an interface screen for inputting correction of attribute data in a table format as shown in FIG. Is also possible.

確認・修正されたCADデータは、手順208において、CADデータベース4に登録される。登録されたCADデータは、必要に応じて、データ出力装置16から取り出して用いることができる。   The confirmed / corrected CAD data is registered in the CAD database 4 in step 208. The registered CAD data can be taken out from the data output device 16 and used as necessary.

本実施の形態によれば、記号の認識に際し、まず、基準となるラスターパターンと、画像記憶装置2に格納されたラスター図面データとをパターン照合してラスター図面データの中の記号が存在する領域を取り出し、次いで、絞りこまれた記号の候補の領域(位置)に対して、あらかじめ線図化パターン記憶装置8に登録された線図化記号のパターンを基準に用いて編集可能化フォーマット図面データ記憶装置3に格納された編集可能化フォーマット図面データと照合し、最終的な記号の認識を実行する。したがって、線図化パターン記憶装置8に登録された線図化記号のパターンを基準に用いて編集可能化フォーマット図面データ記憶装置3に格納された編集可能化フォーマット図面データと照合する場合の対象領域が限定され、演算量が少なくて済むから、図面認識、すなわち、必要な情報のCADデータ化に要する時間が短縮される。
(第2の実施の形態)
本実施の形態においては、編集可能化フォーマット図面データのみを入力として、編集可能化フォーマット図面データを、BMPなどのラスター図面データに変換して用いることにより第1の実施の形態と同様の効果が得られる。このような、編集可能化フォーマット図面データからBMPなどのラスター図面データへの変換は、一般的に可能である。
According to the present embodiment, when a symbol is recognized, first, a region in which the symbol exists in the raster drawing data by pattern matching the reference raster pattern and the raster drawing data stored in the image storage device 2. And then editable format drawing data using the symbolized symbol pattern registered in advance in the diagrammed pattern storage device 8 for the narrowed candidate region (position) of the symbol The final symbol recognition is executed by comparing with the editable format drawing data stored in the storage device 3. Therefore, the target area when collating with the editable format drawing data stored in the editable format drawing data storage device 3 using the diagrammatic symbol pattern registered in the plotting pattern storage device 8 as a reference However, the time required for drawing recognition, that is, conversion of necessary information into CAD data is shortened.
(Second Embodiment)
In the present embodiment, only the editable format drawing data is input, and the editable format drawing data is converted into raster drawing data such as BMP, and the same effects as in the first embodiment are obtained. can get. Such conversion from editable format drawing data to raster drawing data such as BMP is generally possible.

図11に、本発明の第2の実施の形態に係る機能ブロック図を示す。本実施の形態の構成が前記第1の実施の形態の構成と異なるのは、次ぎのイ〜ハの点であり、他の構成は前記第1の実施の形態と同じであるので、同一の符号を付して説明を省略する。
イ.画像データ入力装置1101が、非文字部画像データ生成手段1122と文字列データ抽出手段1121を含んで構成されている点
ロ.RAMが、非文字部画像データ記憶装置1102と文字以外編集可能化フォーマット図面データ記憶装置1103Aと文字限定編集可能化フォーマット図面データ記憶装置1103Bで構成されている点
ハ.インターフェースが、図面位置対応データ設定手段を欠いている点
図12に、本実施の形態に係る処理手順を、概略フローチャートで示す。まず、手順1200で、画像データ入力装置1101において、編集可能化フォーマット図面データが入力される。次いで、手順1201において、文字列データ抽出手段1121により、そのデータを解析して、文字列のデータのみを抽出し、文字限定編集可能化フォーマット図面データ記憶装置1103Bに、文字列と、文字列の領域(位置情報)からなるデータを記憶する。このような抽出は、たとえば、DXF形式の場合には、図2に示したように、文字列に対しては、TEXTタグがついているため容易に実行することができる。
FIG. 11 shows a functional block diagram according to the second embodiment of the present invention. The configuration of the present embodiment is different from the configuration of the first embodiment in the following points (i) to (c), and the other configurations are the same as those of the first embodiment. The reference numerals are attached and the description is omitted.
I. The image data input device 1101 includes non-character part image data generation means 1122 and character string data extraction means 1121. The RAM comprises a non-character part image data storage device 1102, a non-character editable format drawing data storage device 1103 A, and a character limited editable format drawing data storage device 1103 B. c. FIG. 12 is a schematic flowchart showing a processing procedure according to the present embodiment. First, in step 1200, editable format drawing data is input in the image data input device 1101. Next, in step 1201, the character string data extraction unit 1121 analyzes the data, extracts only the character string data, and stores the character string and the character string in the character limited edit enable format drawing data storage device 1103B. Data consisting of areas (position information) is stored. For example, in the case of the DXF format, such extraction can be easily executed because the TEXT tag is attached to the character string as shown in FIG.

一方で、非文字部画像データ生成手段1122では、この文字列のタグのついた部分だけを除去した編集可能化フォーマット図面データが生成され、そのデータをもとに文字列を除去したラスター図面データが生成され、非文字部画像データ記憶装置1102に記憶される(手順1202)。文字列をあらかじめ除去しておくのは、編集可能化フォーマット図面データでは、文字はあらかじめ電子データとして文字限定編集可能化フォーマット図面データ記憶装置1103に抽出してあるので必要なく、ラスター化した場合文字列が残っていると、記号と混同する可能性があるからである。文字列のタグのついた部分だけを除去した編集可能化フォーマット図面データを文字以外編集可能化フォーマット図面データ記憶装置1103Aに記憶する。   On the other hand, the non-character portion image data generating means 1122 generates editable format drawing data in which only the portion with the tag of the character string is removed, and raster drawing data from which the character string is removed based on the data. Is generated and stored in the non-character part image data storage device 1102 (procedure 1202). The character string is removed in advance in the editable format drawing data because the character is extracted in advance as electronic data in the character-limited editable format drawing data storage device 1103. This is because if the column remains, it can be confused with the symbol. The editable format drawing data from which only the portion with the tag of the character string is removed is stored in the editable format drawing data storage device 1103A other than characters.

次に、手順1203で、ラスター記号パターン認識手段1105により、ラスターパターン記憶装置1106に記憶されているラスターパターンを用いてラスター記号パターンが認識処理されて記号位置が絞り込まれ、次いで、線図化記号パターン認識手段1107により線図化パターン記憶装置1108を参照して記号位置が抽出される。手順1204では、文字領域推定手段1110において、前記抽出された記号位置と、線図化パターン記憶装置1108に、図5の形式で記憶された記号と属性文字との相対的位置関係を用いて、文字領域が推定される。ここが第1の実施の形態と大きく異なるところで、第1の実施の形態では、記号でも線でもない残りの部分を輪郭線処理したものを文字領域のグループ化の初期候補として用いたが、本実施の形態では、文字限定編集可能化フォーマット図面データ記憶装置1103に記憶された、文字限定編集可能化フォーマット図面データをグループ化の初期候補として用いる。グループ化のための閾値の与え方などは、第1の実施の形態と同様に、図8のように記号の認識結果に基づいて、領域分けした領域線の境界を越えにくいような設定によって行なう。   Next, in step 1203, the raster symbol pattern recognition means 1105 performs the recognition processing of the raster symbol pattern using the raster pattern stored in the raster pattern storage device 1106 to narrow down the symbol position. Symbol positions are extracted by the pattern recognition means 1107 with reference to the diagrammed pattern storage device 1108. In step 1204, the character area estimation unit 1110 uses the extracted symbol position and the relative positional relationship between the symbol and the attribute character stored in the diagram pattern storage device 1108 in the format of FIG. The character area is estimated. This is very different from the first embodiment. In the first embodiment, the remaining portion that is neither a symbol nor a line is subjected to contour processing, and is used as an initial candidate for character region grouping. In the embodiment, the character limited edit enabled format drawing data stored in the character limited edit enabled format drawing data storage device 1103 is used as an initial candidate for grouping. As in the first embodiment, the threshold value for grouping is set based on the recognition result of the symbols as shown in FIG. 8 so that the boundaries of the divided area lines are not easily exceeded. .

手順1205以降の処理は、前記図4で説明したとおりであり、説明は省略する。なお、前記図4の手順では、手順204で文字列の領域をグループ化した後、手順205で文字列を認識するが、本実施の形態では、編集可能化フォーマット図面データでは、図2のTEXTのラインのように、それぞれの文字はすでにわかっているので、改めて文字を認識する必要はない。   The processing after the procedure 1205 is as described in FIG. In the procedure shown in FIG. 4, the character string areas are grouped in step 204 and then recognized in step 205. In this embodiment, the editable format drawing data uses the TEXT shown in FIG. Like the line, each character is already known, so there is no need to recognize the character again.

なお、第1、第2の実施の形態では、記号の認識において、ラスター図面データ、編集可能化フォーマット図面データの両方を用いているが、どちらか一方でも実現可能である。   In the first and second embodiments, both the raster drawing data and the editable format drawing data are used for symbol recognition, but either one can be realized.

本実施の形態は、ラスター図面データがない場合に、編集可能化フォーマット図面データからラスター図面データを生成し、生成したラスター図面データを用いて記号パターンの位置を認識する方式の例であり、前記第1の実施の形態と同様に、線図化記号のパターンを基準に用いて編集可能化フォーマット図面データと照合する場合の対象領域が限定され、演算量が少なくて済むから、図面認識、すなわち、必要な情報のCADデータ化に要する時間が短縮される。   The present embodiment is an example of a method of generating raster drawing data from editable format drawing data when there is no raster drawing data, and recognizing the position of the symbol pattern using the generated raster drawing data. As in the first embodiment, the target area when collating with the editable format drawing data is limited using the diagrammatic symbol pattern as a reference, and the amount of calculation can be reduced. Therefore, the time required for converting necessary information into CAD data is shortened.

本発明の第1の実施の形態に係る図面認識装置の全体構成を示すブロック図である。1 is a block diagram showing an overall configuration of a drawing recognition apparatus according to a first embodiment of the present invention. 本発明の第1の実施の形態に係る編集可能化フォーマット図面データの例を示す図である。It is a figure which shows the example of the editable format drawing data based on the 1st Embodiment of this invention. CADデータ生成の対象となる図面の例を示す平面図である。It is a top view which shows the example of drawing used as the object of CAD data generation. 本発明の第1の実施の形態に係る図面認識の処理手順の例を示すフローチャートである。It is a flowchart which shows the example of the process sequence of drawing recognition which concerns on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る線図化パターンの例を示す図である。It is a figure which shows the example of the diagram pattern based on the 1st Embodiment of this invention. 図4に示すフローチャートにおける文字領域グループ化の実施手順の例を示すフローチャートである。FIG. 5 is a flowchart showing an example of a procedure for character area grouping in the flowchart shown in FIG. 4. FIG. 本発明の第1の実施の形態に係る文字領域グループ化のための図面の領域分割処理の経過の例を示す図である。It is a figure which shows the example of progress of the area | region division process of drawing for character area grouping which concerns on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る文字領域グループ化のための図面の領域分割処理の経過の例を示す図である。It is a figure which shows the example of progress of the area | region division process of drawing for character area grouping which concerns on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る文字領域グループ化処理の結果の例を示す図である。It is a figure which shows the example of the result of the character area grouping process which concerns on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る属性つきCADデータへの変換結果の例を示す図である。It is a figure which shows the example of the conversion result to CAD data with an attribute which concerns on the 1st Embodiment of this invention. 本発明の第2の実施の形態に係る図面データ認識装置の機能構成を示すブロック図。The block diagram which shows the function structure of the drawing data recognition apparatus which concerns on the 2nd Embodiment of this invention. 本発明の第2の実施の形態に係る図面データ認識の実施手順を示すフローチャート。The flowchart which shows the implementation procedure of drawing data recognition which concerns on the 2nd Embodiment of this invention. 本発明の第1の実施の形態に係るラスターパターンの例を示す図である。It is a figure which shows the example of the raster pattern which concerns on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る記号ライブラリの例を示す図である。It is a figure which shows the example of the symbol library which concerns on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る図面位置対応データ設定手段の入力画面の例を示す平面図である。It is a top view which shows the example of the input screen of the drawing position corresponding | compatible data setting means based on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る図面位置対応データの例を示す図である。It is a figure which shows the example of the drawing position corresponding | compatible data which concern on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る認識結果修正手段の入力画面の例を示す平面図である。It is a top view which shows the example of the input screen of the recognition result correction means which concerns on the 1st Embodiment of this invention.

符号の説明Explanation of symbols

1 画像データ入力装置
2 画像記憶装置
3 編集可能化フォーマット図面データ記憶装置
4 CADデータベース
5 ラスター記号パターン認識手段
6 ラスターパターン記憶装置
7 線図化記号パターン認識手段
8 線図化パターン記憶装置
9 記号認識手段
10 文字領域推定手段
11 文字列認識手段
12 統合認識手段
13 認識結果表示手段
14 認識結果修正手段
15 記号ライブラリ記憶装置
16 データ出力装置
18 図面位置対応データ設定手段
DESCRIPTION OF SYMBOLS 1 Image data input device 2 Image storage device 3 Editable format drawing data storage device 4 CAD database 5 Raster symbol pattern recognition means 6 Raster pattern storage device 7 Diagram symbol pattern recognition device 8 Diagram pattern storage device 9 Symbol recognition Means 10 Character region estimation means 11 Character string recognition means 12 Integrated recognition means 13 Recognition result display means 14 Recognition result correction means 15 Symbol library storage device 16 Data output device 18 Drawing position correspondence data setting means

Claims (5)

文字、記号を含む図面のラスター図面データを記憶する画像記憶装置と、文字と図形を個別に編集することが可能な編集可能化フォーマット図面データで表現された前記図面を記憶する編集可能化フォーマット図面データ記憶装置と、認識結果がCADデータとして格納されるCADデータベースと、記号をラスター図面データ形式で表現したラスターパターンを記憶するラスターパターン記憶装置と、前記記号を編集可能化フォーマット形式で記述した線図化パターン及び前記記号と属性文字の相対的位置関係を記憶する線図化パターン記憶装置と、CADデータベース上での記号種別のID情報と、前記ラスターパターン及び線図化パターンとを対応付ける情報を格納する記号ライブラリ記憶装置と、前記ラスターパターン記憶装置に記憶されたラスターパターンと前記画像記憶装置に格納されたラスター図面データとを照合して前記図面中の記号位置の範囲を絞り込むラスター記号パターン認識手段と、前記線図化パターン記憶装置に記憶された線図化パターンと前記編集可能化フォーマット図面データ記憶装置に格納された編集可能化フォーマット図面データとを照合し、前記絞り込まれた範囲から編集可能化フォーマット形式で記述された記号を認識する線図化記号パターン認識手段と、前記認識された線図化パターンに対して、記号ライブラリ記憶装置の情報を参照して記号の位置CADデータとしてのID情報を付与する記号認識手段と、前記画像記憶装置に記憶されたラスター図面データの文字領域を推定する文字領域推定手段と、推定された文字領域の文字列を認識する文字列認識手段と、文字列の位置情報と文字列の内容、および、線図化記号パターン認識手段で認識された記号位置を用いて、記号の位置と記号に関する属性文字列を認識しCADデータベースに格納する統合認識手段と、を含んで構成されて図面中の文字、記号及びその相互の関係を認識する図面認識装置。   An image storage device for storing raster drawing data of drawings including characters and symbols, and an editable format drawing for storing the drawings expressed by editable format drawing data capable of individually editing characters and graphics A data storage device, a CAD database in which recognition results are stored as CAD data, a raster pattern storage device for storing a raster pattern in which a symbol is expressed in a raster drawing data format, and a line describing the symbol in an editable format format A diagrammatic pattern storage device for storing the diagrammatic pattern and the relative positional relationship between the symbol and the attribute character; symbol type ID information on the CAD database; and information for associating the raster pattern and the diagrammatic pattern. The symbol library storage device to be stored and the raster pattern storage device Raster symbol pattern recognition means for collating the raster pattern thus obtained with raster drawing data stored in the image storage device to narrow down the range of symbol positions in the drawing, and lines stored in the diagrammed pattern storage device A diagram that compares a plotting pattern with editable format drawing data stored in the editable format drawing data storage device and recognizes a symbol described in the editable format format from the narrowed range Symbol pattern recognizing means, symbol recognizing means for giving ID information as symbol position CAD data with reference to information in the symbol library storage device to the recognized diagrammed pattern, and the image storage device Character area estimation means for estimating the character area of the stored raster drawing data, and a character string of the estimated character area The character string recognition means, the character string position information and the contents of the character string, and the symbol position recognized by the diagrammatic symbol pattern recognition means to recognize the symbol position and the attribute character string related to the symbol. A drawing recognition apparatus configured to include integrated recognition means for storing in a CAD database and recognizing characters and symbols in the drawing and their mutual relationship. 請求項1に記載の図面認識装置において、前記文字領域推定手段は、認識された記号の位置情報を利用してラスター図面から文字列の領域分けを行なうよう構成されていることを特徴とする図面認識装置。   2. The drawing recognition apparatus according to claim 1, wherein the character area estimation means is configured to divide a character string from a raster drawing using positional information of recognized symbols. Recognition device. 請求項1または2に記載の図面認識装置において、ラスター図面データと編集可能化フォーマット図面データ相互の位置の対応関係を設定する図面位置対応データ手段を含んでなることを特徴とする図面認識装置。   3. The drawing recognition apparatus according to claim 1, further comprising drawing position correspondence data means for setting a correspondence relation between positions of raster drawing data and editable format drawing data. 請求項1乃至3のいずれかに記載の図面認識装置において、編集可能化フォーマット図面データを入力とし、該データの文字の情報を位置情報とともに抽出するとともに、該編集可能化フォーマット図面データから消去し、文字が消去された該編集可能化フォーマット図面データをラスター図面データに変換する非文字部画像データ生成手段を含んでなることを特徴とする図面認識装置。   4. The drawing recognition apparatus according to claim 1, wherein editable format drawing data is input, character information of the data is extracted together with position information, and deleted from the editable format drawing data. A drawing recognition apparatus comprising: non-character portion image data generation means for converting the editable format drawing data from which characters have been erased into raster drawing data. 文字、記号を含む図面のラスター図面データ及び文字と図形を個別に編集することが可能な編集可能化フォーマット図面データで表現された前記図面を記憶する手順と、前記記憶されたラスター図面データと予め記号をラスター図面データ形式で表現したラスターパターンを参照して該記号の図面上の位置の範囲を絞り込む手順と、前記記号を編集可能化フォーマット形式で記述した線図化パターン、前記ラスターパターンと線図化パターンとを対応付ける情報及び前記文字と図形を個別に編集することが可能な編集可能化フォーマット図面データで表現された前記図面を参照し、前記絞り込まれた図面上の位置の範囲から編集可能化フォーマット形式で記述された記号を認識する手順と、前記認識された記号の線図化パターンに対して、予め設定されているCADデータベース上での記号種別のID情報を参照して記号の位置CADデータとしてのID情報を付与する手順と、前記認識された記号位置を参照して、前記記憶されたラスター図面データの文字領域を推定する手順と、推定された文字領域の文字列を認識する手順と、文字列の位置情報と文字列の内容、予め記憶されている記号と属性文字の相対的位置関係および、前記認識された記号位置を用いて、記号の位置と記号に関する属性文字列を認識しCADデータベースに格納する手順と、を含んで構成されて図面中の文字、記号及びその相互の関係を認識する図面認識方法。
Raster drawing data of drawings including characters and symbols, and a procedure for storing the drawings expressed in editable format drawing data capable of individually editing characters and graphics, and the stored raster drawing data and A procedure for narrowing a range of positions of the symbol on the drawing with reference to a raster pattern representing the symbol in the raster drawing data format, a diagram pattern describing the symbol in an editable format format, the raster pattern and the line Editable from the range of positions on the narrowed-down drawing with reference to the drawing expressed in the editable format drawing data in which the information for associating the drawing pattern and the character and the figure can be individually edited A procedure for recognizing a symbol described in a standardized format and a diagrammatic pattern of the recognized symbol A procedure for assigning ID information as symbol position CAD data with reference to ID information of a symbol type on a set CAD database, and the stored raster drawing with reference to the recognized symbol position A procedure for estimating the character area of the data, a procedure for recognizing the character string of the estimated character area, the position information of the character string and the content of the character string, the relative positional relationship between the symbol and the attribute character stored in advance, and Using the recognized symbol position, and recognizing the character position in the drawing and the mutual relationship between the symbol position and the attribute character string related to the symbol and storing the attribute character string in the CAD database. Drawing recognition method.
JP2005039536A 2005-02-16 2005-02-16 Drawing recognition method and device Pending JP2006227824A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005039536A JP2006227824A (en) 2005-02-16 2005-02-16 Drawing recognition method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005039536A JP2006227824A (en) 2005-02-16 2005-02-16 Drawing recognition method and device

Publications (1)

Publication Number Publication Date
JP2006227824A true JP2006227824A (en) 2006-08-31

Family

ID=36989173

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005039536A Pending JP2006227824A (en) 2005-02-16 2005-02-16 Drawing recognition method and device

Country Status (1)

Country Link
JP (1) JP2006227824A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7526353B2 (en) 2006-11-22 2009-04-28 Hitachi Plant Technologies, Ltd. Sequence design support system
JP2010226341A (en) * 2009-03-23 2010-10-07 Fuji Xerox Co Ltd Image processing apparatus, image processing system, and processing program
KR101448543B1 (en) 2013-04-03 2014-10-13 주식회사 싸이픽소프트 A string merge method for extracting correct information of the notation and the bar arrangement from architectural drawing files
KR20200038006A (en) * 2018-10-02 2020-04-10 경북대학교 산학협력단 Method for providing digital drawing and digital drawing providing device
WO2023199398A1 (en) * 2022-04-12 2023-10-19 三菱電機株式会社 Information processing device, processing method, and processing program

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7526353B2 (en) 2006-11-22 2009-04-28 Hitachi Plant Technologies, Ltd. Sequence design support system
JP2010226341A (en) * 2009-03-23 2010-10-07 Fuji Xerox Co Ltd Image processing apparatus, image processing system, and processing program
KR101448543B1 (en) 2013-04-03 2014-10-13 주식회사 싸이픽소프트 A string merge method for extracting correct information of the notation and the bar arrangement from architectural drawing files
KR20200038006A (en) * 2018-10-02 2020-04-10 경북대학교 산학협력단 Method for providing digital drawing and digital drawing providing device
KR102117323B1 (en) * 2018-10-02 2020-06-09 경북대학교 산학협력단 Method for providing digital drawing and digital drawing providing device
WO2023199398A1 (en) * 2022-04-12 2023-10-19 三菱電機株式会社 Information processing device, processing method, and processing program
JP7450840B1 (en) 2022-04-12 2024-03-15 三菱電機株式会社 Information processing device, processing method, and processing program

Similar Documents

Publication Publication Date Title
JP3822277B2 (en) Character template set learning machine operation method
JP2749020B2 (en) Diagram recognition system
JP2000090195A (en) Method and device for table recognition
JPS61267177A (en) Retrieving system for document picture information
JP2010009509A (en) Image processor, image processing method, program thereof, and storage medium
JPH05151254A (en) Method and system for processing document
JP4704601B2 (en) Character recognition method, program, and recording medium
JP2006227824A (en) Drawing recognition method and device
JP4935459B2 (en) Character recognition method, character recognition program, and character recognition device
JP3070801B2 (en) Drawing management method
JP4795820B2 (en) Map data creation device, map data creation method, map data check program
JP2003296726A (en) Method, device and program for converting drawing and recording medium
JP2020064438A (en) Learning data generation device and learning data generation method
JP5361315B2 (en) Information processing apparatus and information processing method
JP2006323511A (en) Symbol-identifying method and device thereof
JP5067182B2 (en) Image processing apparatus and image processing program
JP2004259076A (en) Picture recognizing method and device
JP2011128687A (en) Character form element determining device and character form element determining method
JPS6395590A (en) Hand-written character recognition device
JP3082467B2 (en) Outline data processing device
JP2009193170A (en) Character recognition device and character recognition method
JP5343584B2 (en) Information processing apparatus and program
JP2578965B2 (en) Graphic processing unit
US10558774B1 (en) Electronic library and design generation using image and text processing
JP2007299321A (en) Information processor, information processing method, information processing program and information storage medium