JP2006227824A - Drawing recognition method and device - Google Patents
Drawing recognition method and device Download PDFInfo
- Publication number
- JP2006227824A JP2006227824A JP2005039536A JP2005039536A JP2006227824A JP 2006227824 A JP2006227824 A JP 2006227824A JP 2005039536 A JP2005039536 A JP 2005039536A JP 2005039536 A JP2005039536 A JP 2005039536A JP 2006227824 A JP2006227824 A JP 2006227824A
- Authority
- JP
- Japan
- Prior art keywords
- symbol
- data
- raster
- pattern
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
Description
本発明は、文字、記号、線分が混在する図面情報を電子データとして表現したものから必要な情報をエンジニアリングデータとして認識する方法と装置に係り、特に図面が表現する文字列・記号および相互の関連性を自動的に認識し設計データに活用可能な電子データとして認識する方法と装置に関する。 The present invention relates to a method and apparatus for recognizing necessary information as engineering data from the representation of drawing information including mixed characters, symbols, and line segments as electronic data, and more particularly to character strings / symbols represented by drawings and mutual information. The present invention relates to a method and apparatus for automatically recognizing relationships and recognizing them as electronic data that can be used for design data.
従来、文字、記号、線分が混在する図面情報を電子データとして表現したものから設計データに活用可能な電子データとして読み取る技術としては、例えば、特許文献1に開示されている、文字、記号、線分間の相対的位置関係と登録されている描画規則とを比較し、その知識を用いて認識結果を修正して精度を向上しているものがある。 Conventionally, as a technique of reading drawing information in which characters, symbols, and line segments are mixed as electronic data that can be used as design data, the character, symbol, In some cases, the relative positional relationship between line segments and a registered drawing rule are compared, and the recognition result is corrected using the knowledge to improve the accuracy.
また、非特許文献1には、認識した文字、記号、線分と、それらの間のあらかじめ登録された相対的位置関係を用い、その部分について再度認識処理を行うことで認識精度を向上させている方法が示されている。
In
特許文献1記載の方法のように、図面のイメージデータから文字列、記号を抽出する場合、特に、文字列の認識精度には限界があり、エンジニアリングデータなど誤りが許されないデータの場合、最終確認に多くの手間を要する。確認に要する手間は、認識誤りが少ないほど小さいと考えられ、また、最終的な品質も自動認識精度よりは、少なくとも高くなると考えられる。
When extracting character strings and symbols from the image data of drawings as in the method described in
一方、近年、設計情報としての意味付けはされていないが、線と文字列だけは、区別して編集可能としたデータフォーマットが広く流布しており(非特許文献2、非特許文献3、非特許文献4)、これを用いれば、特定位置の文字列情報は、100%の精度で求まると考えられる。しかしながら、これらのデータフォーマットで記述されたものは、意味づけを考慮されていない見掛けの形だけのデータのため以下のような問題がある。
(1)文字のグループ化がされていない場合がある。(たとえば、機器のIDが“RA−124”の場合、スペースの都合で“RA”と“124”が改行されていた場合、該編集可能化フォーマット中では、別の文字列として扱われる場合がある。
(2)記号についても、一般には、線の集まりとして、ばらばらに記述されている。ばらばらの線を端点の位置関係から接続関係をたどり、記号として認識するのは、一般的には、非常に大きな計算量を要する。極端な場合、一本の線分でも、任意の箇所で区切られ、内部では、短い線分の連続のデータとして扱われている場合がありうる。
On the other hand, although it has not been given meaning as design information in recent years, only a line and a character string have been widely distributed in a data format that can be edited separately (Non-Patent
(1) Characters may not be grouped. (For example, when the device ID is “RA-124”, if “RA” and “124” are broken due to space limitations, they may be treated as different character strings in the editable format. is there.
(2) In general, symbols are also described separately as a collection of lines. In general, a very large amount of calculation is required for recognizing a disjoint line as a symbol by following the connection relation from the positional relation of the end points. In an extreme case, even a single line segment may be divided at an arbitrary position, and may be handled as continuous data of a short line segment inside.
本発明の課題は、文字情報と線の情報からなるベクトルフォーマットの図面データから、所望のエンジニアリングデータを精度よく、かつ高速に取得することである。 An object of the present invention is to obtain desired engineering data with high accuracy and high speed from drawing data in a vector format composed of character information and line information.
上記課題を達成するために、本発明は、文字、記号を含む図面のイメージデータ、すなわちラスター図面データと、図面を、文字と図形を個別に編集することが可能な形式で表現した編集可能化フォーマット図面データとを併用することにより、ラスター図面データでおおまかな記号の認識を行い、その候補の中で、編集可能化フォーマット図面データを利用してさらに認識対象を絞り組むことを特徴としている。 In order to achieve the above object, the present invention makes it possible to edit image data of a drawing including characters and symbols, that is, raster drawing data, and the drawing in a format in which characters and figures can be individually edited. By using together with the format drawing data, rough symbols are recognized with the raster drawing data, and among the candidates, the recognition target is further narrowed down using the editable format drawing data.
具体的には、上記課題を達成する本発明は、文字、記号を含む図面のラスター図面データを記憶する画像記憶装置と、文字と図形を個別に編集することが可能な編集可能化フォーマット図面データで表現された前記図面を記憶する編集可能化フォーマット図面データ記憶装置と、認識結果がCADデータとして格納されるCADデータベースと、記号をラスター図面データ形式で表現したラスターパターンを記憶するラスターパターン記憶装置と、前記記号を編集可能化フォーマット形式で記述した線図化パターン及び前記記号と属性文字の相対的位置関係を記憶する線図化パターン記憶装置と、CADデータベース上での記号種別のID情報と、前記ラスターパターン及び線図化パターンとを対応付ける情報を格納する記号ライブラリ記憶装置と、前記ラスターパターン記憶装置に記憶されたラスターパターンと前記画像記憶装置に格納されたラスター図面データとを照合して前記図面中の記号位置の範囲を絞り込むラスター記号パターン認識手段と、前記線図化パターン記憶装置に記憶された線図化パターンと前記編集可能化フォーマット図面データ記憶装置に格納された編集可能化フォーマット図面データとを照合し、前記絞り込まれた範囲から編集可能化フォーマット形式で記述された記号を認識する線図化記号パターン認識手段と、前記認識された線図化パターンに対して、記号ライブラリ記憶装置の情報を参照して記号の位置CADデータとしてのID情報を付与する記号認識手段と、前記画像記憶装置に記憶されたラスター図面データの文字領域を推定する文字領域推定手段と、推定された文字領域の文字列を認識する文字列認識手段と、文字列の位置情報と文字列の内容、および、線図化記号パターン認識手段で認識された記号位置を用いて、記号の位置と記号に関する属性文字列を認識しCADデータベースに格納する統合認識手段と、を含んで構成されて図面中の文字、記号及びその相互の関係を認識する図面認識装置である。 Specifically, the present invention that achieves the above-described object includes an image storage device that stores raster drawing data of drawings including characters and symbols, and editable format drawing data that can individually edit characters and graphics. Editable format drawing data storage device for storing the drawing expressed in the above, a CAD database for storing recognition results as CAD data, and a raster pattern storage device for storing a raster pattern in which symbols are expressed in a raster drawing data format A plotting pattern in which the symbol is described in an editable format format, a plotting pattern storage device that stores the relative positional relationship between the symbol and the attribute character, and ID information of the symbol type on the CAD database; A symbol library storage for storing information for associating the raster pattern and the diagrammatic pattern A raster symbol pattern recognizing means for collating a raster pattern stored in the raster pattern storage device with raster drawing data stored in the image storage device and narrowing a range of symbol positions in the drawing; The plotting pattern stored in the plotting pattern storage device is compared with the editable format drawing data stored in the editable format drawing data storage device, and the editable format format is used from the narrowed range. A diagrammatic symbol pattern recognizing unit for recognizing the described symbol, and ID information as symbol position CAD data is given to the recognized diagrammed pattern by referring to information in the symbol library storage device. Symbol recognition means and a character area for estimating a character area of raster drawing data stored in the image storage device The character string recognition means for recognizing the character string of the estimated character area, the character string position information and the content of the character string, and the symbol position recognized by the diagrammatic symbol pattern recognition means And a unified recognition means for recognizing the position of the symbol and the attribute character string related to the symbol and storing them in the CAD database, and a drawing recognition apparatus for recognizing characters and symbols in the drawing and their mutual relationship.
上記構成によれば、文字、記号を含む図面の電子データから記号を認識する際に、図面のビットマップデータ等のイメージデータ、すなわちラスター図面データから、認識しようとする記号をラスター図面データで表現したラスターパターンを参照して記号の候補(位置)を絞り込み、絞り込んだ候補(位置)に対して、記号を編集可能化フォーマットで記述した線図化パターンを用いて、図面を編集可能化フォーマットで表現した編集可能化フォーマット図面データから記号を認識する。 According to the above configuration, when a symbol is recognized from electronic data of a drawing including characters and symbols, the symbol to be recognized is represented by raster drawing data from image data such as bitmap data of the drawing, that is, raster drawing data. Narrow down the candidate (position) of the symbol with reference to the raster pattern, and use the diagram pattern that describes the symbol in the editable format for the narrowed down candidate (position). Recognize symbols from the rendered editable format drawing data.
したがって、記号を編集可能化フォーマットで記述した線図化パターンを用いて、図面を編集可能化フォーマットで表現した編集可能化フォーマット図面データ全体から記号を認識する場合よりも演算量が低減され、図面の認識に要する時間が短縮される。 Therefore, using a diagram pattern in which symbols are described in an editable format, the amount of calculation is reduced compared to the case where symbols are recognized from the entire editable format drawing data in which the drawing is expressed in an editable format. The time required for recognition is reduced.
前記文字領域推定手段は、認識された記号の位置情報を利用してラスター図面データから文字列の領域分けを行なうよう構成されていることが望ましい。このように、認識された記号の位置情報を利用してラスター図面データから文字列の領域分けを行なうことにより、文字列の認識精度が向上する。 The character area estimation means is preferably configured to divide a character string from raster drawing data using position information of recognized symbols. As described above, the character string recognition accuracy is improved by dividing the character string from the raster drawing data using the position information of the recognized symbol.
また、ラスター図面データと編集可能化フォーマット図面データ相互の位置の対応関係を設定する図面位置対応データ手段を設けることが望ましい。 Further, it is desirable to provide a drawing position correspondence data means for setting a correspondence relationship between the raster drawing data and the editable format drawing data.
また、編集可能化フォーマット図面データを入力とし、該データの文字の情報を位置情報とともに抽出するとともに、該編集可能化フォーマット図面データから消去し、文字が消去された該編集可能化フォーマット図面データをラスター図面データに変換する非文字部画像データ生成手段を含んでなる図面認識装置としてもよい。このような手段を設けることにより、編集可能化フォーマット図面データのみが入手可能であるときでも、編集可能化フォーマット図面データから文字が消去されたラスター図面データを生成し、ラスター図面データと編集可能化フォーマット図面データを用いた図面認識装置による図面認識を行なうことができる。 Further, the editable format drawing data is input, and the character information of the data is extracted together with the position information, and the editable format drawing data is deleted from the editable format drawing data, It is good also as a drawing recognition apparatus containing the non-character part image data generation means converted into raster drawing data. By providing such means, even when only editable format drawing data is available, raster drawing data in which characters are deleted from editable format drawing data is generated, and the raster drawing data and editable Drawing recognition by the drawing recognition apparatus using the format drawing data can be performed.
上記の課題は又、文字、記号を含む図面のラスター図面データ及び文字と図形を個別に編集することが可能な編集可能化フォーマット図面データで表現された前記図面を記憶する手順と、前記記憶されたラスター図面データと予め記号をラスター図面データ形式で表現したラスターパターンを参照して該記号の図面上の位置の範囲を絞り込む手順と、前記記号を編集可能化フォーマット形式で記述した線図化パターン、前記ラスターパターンと線図化パターンとを対応付ける情報及び前記文字と図形を個別に編集することが可能な編集可能化フォーマット図面データで表現された前記図面を参照し、前記絞り込まれた図面上の位置の範囲から編集可能化フォーマット形式で記述された記号を認識する手順と、前記認識された記号の線図化パターンに対して、予め設定されているCADデータベース上での記号種別のID情報を参照して記号の位置CADデータとしてのID情報を付与する手順と、前記認識された記号位置を参照して、前記記憶されたラスター図面データの文字領域を推定する手順と、推定された文字領域の文字列を認識する手順と、文字列の位置情報と文字列の内容、予め記憶されている記号と属性文字の相対的位置関係および、前記認識された記号位置を用いて、記号の位置と記号に関する属性文字列を認識しCADデータベースに格納する手順と、を含んで構成されて図面中の文字、記号及びその相互の関係を認識する図面認識方法によっても達成される。 The above-described problem is also stored in the raster drawing data of the drawing including characters and symbols, and the procedure of storing the drawing expressed in the editable format drawing data capable of editing the character and the graphic individually. The raster drawing data and the raster pattern in which the symbol is expressed in the raster drawing data format in advance are referred to, and the range of the position of the symbol on the drawing is narrowed, and the diagram is a diagram pattern in which the symbol is described in the editable format format. Referring to the drawing expressed in the editable format drawing data capable of individually editing the character pattern and the figure, and the information for associating the raster pattern with the diagrammed pattern, on the narrowed drawing A procedure for recognizing a symbol described in an editable format from a range of positions, and a diagram of the recognized symbol The ID information as symbol position CAD data by referring to the ID information of the symbol type on a preset CAD database, and the recognized symbol position, A procedure for estimating the character area of the stored raster drawing data, a procedure for recognizing the character string of the estimated character area, position information of the character string and the contents of the character string, pre-stored symbols and attribute characters And a procedure for recognizing a symbol position and an attribute character string related to the symbol and storing them in a CAD database using the recognized symbol position, and the character, symbol, and symbol in the drawing. This is also achieved by a drawing recognition method for recognizing the mutual relationship.
この方法によっても、先に述べたと同様に、図面の認識に要する時間が短縮される。 This method also reduces the time required for recognizing the drawing, as described above.
本発明によれば、文字、記号、線分が混在する図面情報を、編集可能化フォーマット図面データのみを用いて認識する場合よりも、精度よく、短時間で自動認識することができる。 According to the present invention, drawing information in which characters, symbols, and line segments are mixed can be automatically recognized with higher accuracy and in a shorter time than when using only editable format drawing data.
以下、本発明の実施の形態について図面を参照して説明する。
(第1の実施の形態)
図1は本発明の第1の実施の形態に係る図面認識装置の全体構成を示すブロック図である。図示の図面認識装置は、大きく分けて、コンピュータと、このコンピュータに接続された画像データ入力装置1、データ出力装置16、及びインターフェースからなる。
Embodiments of the present invention will be described below with reference to the drawings.
(First embodiment)
FIG. 1 is a block diagram showing the overall configuration of a drawing recognition apparatus according to the first embodiment of the present invention. The drawing recognition apparatus shown in the figure is roughly divided into a computer, an image
インターフェースは、表示画面と、キーボード、マウス及びそれらを制御する装置を含んで構成され、ソフトウエアとして、図面位置対応データ設定手段18、認識結果修正手段14、認識結果表示手段13を備える。 The interface includes a display screen, a keyboard, a mouse, and devices for controlling them, and includes drawing position correspondence data setting means 18, recognition result correction means 14, and recognition result display means 13 as software.
画像データ入力装置1は、紙図面をラスター図面データフォーマットとして読み取る機能を持ったスキャナと処理ソフト、及び、編集可能化フォーマット図面データを読み取るファイル入力装置が組み合わされた装置である。
The image
データ出力装置16は、コンピュータに保持されたデータを、CD−ROMなどの記憶媒体に出力する装置である。
The
コンピュータは、RAM、CPU、記憶装置からなる。RAMは、処理結果を一時的に保持するもので、画像データ入力装置1から入力されるラスター図面データを保持する画像記憶装置2、画像データ入力装置1から入力される編集可能化フォーマット図面データを保持する編集可能化フォーマット図面データ記憶装置3、及び、図面位置対応データ設定手段18から入力されるデータを保持する図面位置対応データ記憶装置17からなる。
The computer includes a RAM, a CPU, and a storage device. The RAM temporarily holds the processing results. The
CPUは、ラスター記号パターン認識手段5、線図化記号パターン認識手段7、記号認識手段9、文字領域推定手段10、文字列認識手段11、統合認識手段12の各ソフトウエアの処理を実行する。 The CPU executes processing of each software of the raster symbol pattern recognizing means 5, the diagrammatic symbol pattern recognizing means 7, the symbol recognizing means 9, the character area estimating means 10, the character string recognizing means 11, and the integrated recognizing means 12.
記憶装置は、データを恒久的に保持するもので、ハードディスク及びその制御装置が対応し、ラスターパターン記憶装置6と、線図化パターン記憶装置8と、記号ライブラリ記憶装置15と、前記認識結果修正手段14と前記統合認識手段12の処理結果が格納されるCADデータベース4と、からなる。ラスターパターン記憶装置6には、予め記号認識の基準となるラスターパターンが格納される。 The storage device retains data permanently, and corresponds to a hard disk and its control device, a raster pattern storage device 6, a diagrammed pattern storage device 8, a symbol library storage device 15, and the recognition result correction. Means 14 and a CAD database 4 in which the processing results of the integrated recognition means 12 are stored. The raster pattern storage device 6 stores a raster pattern as a reference for symbol recognition in advance.
画像データ入力装置1のスキャナに紙図面を入力すると、スキャナからはラスター図面データが出力され、画像記憶装置2に格納される。また、画像データ入力装置1のファイル入力装置に、編集可能化フォーマット図面データを入力すると入力されたデータは、編集可能化フォーマット図面データ記憶装置3に格納される。
When a paper drawing is input to the scanner of the image
ラスター図面データの種類としては、BMP(ビットマップ)形式(非特許文献2)、tiff形式(非特許文献3)などがある。また、編集可能化フォーマットは、DXF(Autodesk社)形式(非特許文献4)、Windows(登録商標)(非特許文献5)メタファイル(マイクロソフト社)形式など、文字と図形とを区別してその位置座標とともに、登録できるフォーマットとする。また、ラスター図面フォーマットの特定の位置座標(X,Y)と、対応する同じ点での編集可能化フォーマットでの座標(X’,Y’)との間には、1対1の対応関係があり、相互に対応点座標を計算可能とする。 The types of raster drawing data include BMP (bitmap) format (Non-Patent Document 2), tiff format (Non-Patent Document 3), and the like. The editable format is distinguished from characters and graphics in the DXF (Autodesk) format (non-patent document 4), Windows (registered trademark) (non-patent document 5) metafile (Microsoft) format, etc. A format that can be registered together with the coordinates. Further, there is a one-to-one correspondence between the specific position coordinates (X, Y) in the raster drawing format and the coordinates (X ′, Y ′) in the corresponding editable format at the same point. Yes, the corresponding point coordinates can be calculated mutually.
この2つの対応関係の設定は、インターフェースに組み込まれた図面位置対応データ設定手段18によって実行される。図15にインターフェース上の表示例を示す。この例では、左側にラスター図面(例えばBMP形式)を、右側に編集可能化フォーマット図面を表示し、ポインティングデバイスで対応点を順次、設定していくことにより、図面中の対応点を設定する。図15の例では、対応点1として、1501の点と、1502の点が、対応点3として、1503の点と1504の点が、それぞれ対応するように、設定されている。設定点を何点対応づけすればよいかは、用いる手法によって異なるが、もっとも一般的な方法であるアフィン変換(非特許文献10)を用いた場合、最低4点の対応関係を設定すれば、2つの図面全体で、対応関係を定義できる。図15では、対応点2,4の記載が省略されている。図15のインターフェースによって設定されたデータは、図面位置対応データ記憶装置17に記憶される。
The setting of the two correspondence relationships is executed by the drawing position correspondence data setting means 18 incorporated in the interface. FIG. 15 shows a display example on the interface. In this example, a raster drawing (for example, BMP format) is displayed on the left side, an editable format drawing is displayed on the right side, and corresponding points are sequentially set with a pointing device, thereby setting corresponding points in the drawing. In the example of FIG. 15, the corresponding
図16に、図面位置対応データ記憶装置17に記憶された図面位置対応データの例を示す。ラスター図面(イメージデータ図面)と、編集可能化フォーマット図面における対応点の組が表形式で記憶されている。図15のような表示を行なうインターフェースがなくても、図16に示すデータをユーザが作成して、図面位置対応データ記憶装置17に取り込むことにより、同様の機能を実現することもできる。 FIG. 16 shows an example of drawing position correspondence data stored in the drawing position correspondence data storage device 17. A set of corresponding points in the raster drawing (image data drawing) and the editable format drawing is stored in a table format. Even if there is no interface for performing the display as shown in FIG. 15, the user can create the data shown in FIG. 16 and import it into the drawing position correspondence data storage device 17 to realize the same function.
図2は、編集可能化フォーマット図面データの例のひとつとして、DXF形式によるもの(非特許文献4)を示したもので、線はPOLYLINEタグで線をつなぐ端点の集合として表示されている。一方、文字列は、TEXTタグにより、線とは区別されてその文字領域の矩形座標、及び文字の向きとともに記述されている。 FIG. 2 shows the DXF format (Non-Patent Document 4) as one example of the editable format drawing data, and the lines are displayed as a set of end points connecting the lines with POLYLINE tags. On the other hand, the character string is distinguished from the line by the TEXT tag and is described together with the rectangular coordinates of the character region and the direction of the character.
図3は、単線結線図のラスター図面の例を示したもので、このようなラスター図面データは、例えば、BMPのモノクロ形式であれば、各座標の位置ごとに、0か1かの値として保持されている。 FIG. 3 shows an example of a raster diagram of a single-line diagram. Such raster diagram data is, for example, a value of 0 or 1 for each coordinate position in the BMP monochrome format. Is retained.
一方、CADデータとしては、図面の表す意味を抽出して登録する必要がある。図3の例では、母線に4個の機器が接続されており、それぞれの機器が、どのようなものかは、母線からぶらさがっている図形の形状から認識し、CADデータ化する必要がある。また、それぞれの機器の機器番号とシーケンス番号は、図の下側の表に記述されており、これらのデータも機器の種類とともにCADデータ化する必要がある。 On the other hand, it is necessary to extract and register the meaning represented by the drawing as CAD data. In the example of FIG. 3, four devices are connected to the bus, and it is necessary to recognize what each device is from the shape of the figure hanging from the bus and convert it to CAD data. The device number and sequence number of each device are described in the lower table of the figure, and these data need to be converted into CAD data together with the device type.
図4に、図1に示す構成の装置を使用し、ラスター図面データと編集可能化フォーマット図面データの2種類のフォーマットを用いて、CADデータを作成する概略処理手順を示す。 FIG. 4 shows a schematic processing procedure for creating CAD data by using the apparatus having the configuration shown in FIG. 1 and using two types of formats: raster drawing data and editable format drawing data.
まず、手順200で、画像データ入力装置1でラスター図面データと編集可能化フォーマット図面データが読み込まれ、画像記憶装置2と編集可能化フォーマット図面データ記憶装置3にそれぞれ格納される。
First, in
手順201では、ラスター記号パターン認識手段5により、あらかじめラスターパターン記憶装置6に格納されている基準となるラスターパターンと、画像記憶装置2に格納されたラスター図面データとがパターン照合され、ラスター図面データの中の記号が認識される。そのための方法としては、直接、形状をなどるテンプレートマッチングの方法(非特許文献6)や、部分特徴を組みあわせたもの(非特許文献7)、それらの処理にフーリエ変換やウエーブレット変換などの画像処理を利用した方法(非特許文献8)などの公知の方法を用いることができる。これらの、処理に必要なテンプレートや部分特徴は、ラスターパターン記憶装置6にあらかじめ登録しておく。図13に、弁の記号のラスターパターンの例を示す。この例は、0と1で表現されるBMPファイルフォーマットの記号テンプレートの例であり、1のところが線のあるところを示している。手順201の処理では、次の手順202の処理でさらに詳細な照合をすることを前提としているため、厳密にパターンが一致しなくても、記号の候補の領域(位置)を取りだしておく。
In
手順202の処理は、線図化記号パターン認識手段7により実行される。手順201の処理で絞りこまれた記号の候補の領域(位置)に対して、あらかじめ線図化パターン記憶装置8に登録された線図化記号のパターン(線図化パターン)を基準に用いて編集可能化フォーマット図面データ記憶装置3に格納された編集可能化フォーマット図面データと照合し、最終的な記号の認識を実行する。図5は線図化パターン記憶装置8に予め格納されている、認識の基準となる線図化パターンの例を示す。線図化パターンは、記号パターンの基準座標位置に対する相対的な位置に存在する線の位置座標で記述する。このため、本発明のように記号位置の候補を絞りこまないで、図面全体でこのような線図のパターンの照合を行うと大きな計算量が必要となる。
The process of
図5の左側は、パターン対象を目でみてわかるようにラスター表示したもので、符号501の場所が基準点である。右側が対応する線図のパターンの一部をしめしたもので、ラスターの503に対応するのが、線図化パターンの505、ラスターの504に対応するのが線図化パターンの507、ラスターの502に対応するのが線図化パターンの506となる。線図化パターンでは、基準点からの相対位置座標で表されており、この例では、y座標は、下向きとしている。たとえば、505の部分は、4点からなるポリラインで、4点の座標がそれぞれ。(−200.0,50.0),(−200.0,70.0),(−150.0,70.0),(−150.0,50.0)であることを示している。このような記法は、一般的なものである。実際には、ラスター図面データで絞り込まれたパターンの位置が、多少ずれている場合も考えられるので、この周辺に余裕をみて線を探索する。また、編集可能化フォーマット中でのポリラインとしてのグループ分けが必ずしも、パターンと一致しない場合もあるので、探索は、ポリラインで定義された、各点を結ぶそれぞれの線に対して、線があるかどうかを照合して実施される。
The left side of FIG. 5 is a raster display so that the pattern object can be seen visually, and the location of
手順203は、記号認識手段9により実行される。手順203では、手順202で認識されたパターンに対して、記号ライブラリ記憶装置15に定義された記号ライブラリを用いて、CADに用いるための記号の種別のIDと、付与すべき属性の数や種類が与えられる。これらは、手順206の統合認識において用いられる。図14に、記号ライブラリ記憶装置15に定義された記号ライブラリの例を示す。この例では、図5の線図化パターンAに対応する記号ライブラリが登録されており、CAD中における記号IDや、付随する属性データが設定されている。
次に、文字領域推定手段10により手順204が実行される。手順204においては、CADデータ化に必要な属性文字列の領域がグループ化して認識される。図面の中の文字列の中には、必ずしもCADデータ化に必要なものだけがあるわけではない。また、たとえば、弁の属性などの文字列のデータは、スペースの都合等で、途中で改行されて図3の下側の表のシーケンス番号のように“QA−”と“231”のように改行されていても、“QA−231”と、ひとつの属性文字列として認識される必要がある。
Next, the
このような場合に、ラスター図面データと編集可能化フォーマット図面データを併用して認識精度を上げる方法として、(1)特許文献1に記述された記号の位置と属性文字との相対位置関係を用いて属性文字列を探す方法、(2)文字と記号以外の線をまたいでいる場合は、同じグループの属性文字列になる可能性が低いことを利用する方法、および、(3)記号以外には、残された線と文字列とを区別して文字列属性のグループ化をする方法、の3つの公知の手段がある。ここでは、一例としてこの3つを併用した方法によって、手順204の文字列領域のグループ化の詳細処理手順を説明する。
In such a case, as a method for improving the recognition accuracy by using both the raster drawing data and the editable format drawing data, (1) the relative positional relationship between the position of the symbol and the attribute character described in
図6は手順204の処理の流れを示したもので、おおまかにいえば、輪郭線を線分近似した場合の線分の長さに基づいて、記号以外の残された直線と文字の線を区別し、記号の矩形領域と図中の文字以外の線と記号の矩形の領域を用いて図面を領域分割して、領域をまたいでの文字列のグループ化の閾値を大きくして文字列をグループ化する。
FIG. 6 shows the flow of the process in
まず、手順601で、すでに手順203において認識された記号の領域がラスター図面から削除される。削除の方法としては、ラスター図面から記号として認識された領域を削除する方法や、ラスター図面が編集可能化フォーマット図面データから生成される場合には、編集可能化フォーマット図面データの記号に対応するポリラインデータのみを消去した後、ラスター化する方法で実現できる。
First, in
次に手順602で、手順601で残された図面領域の輪郭線が生成される。これは、Cannyのアルゴリズム(非特許文献8)で容易に実現することができる。この輪郭線を設定した近似で線分近似する。これは、ある画素中の近似線分とのずれが閾値以下になるような近似により(非特許文献9)実現できる。通常、CADデータにする属性文字列は、ある大きさの範囲以下であるので、線分近似された一本の線がある閾値より大きいと、CADデータの属性文字の線とは考えられず、文字以外の線と考えられる。
Next, in
手順603では、前記線分近似された一本の線がある閾値より大きいかどうかの判定が実施され、閾値以上の長い線分のみが取り出される。閾値は、図面全体で設定するか、記号パターンのデータの属性位置のデータに、図5の511,512,513のように定義しておく。図5の511,512,513は、それぞれ、508、509、510の位置に対応する属性文字列が存在することを定義するデータで、属性文字列の位置はポリラインデータとして、属性名称は属性タグの直後に、たとえば、511の例では、“機器名”として、定義されており、文字列の大きさは、文字サイズタグとして、511の例では、一文字の矩形の大きさが20ピクセルとして定義されている。このように定義された文字列の大きさよりも、例えば2倍以上の長さを持つ線分は、文字列の一部とは考えられないので、文字以外の線とみなすわけである。
In
手順604では、こうして認識された線と、記号の矩形領域の上下左右の線を用いて、図面が図7のように領域分割される。
In
手順605では、短い直線からなる輪郭線の近傍が、図7の領域分割と、図5に示したそれぞれの記号に対する属性位置の両方を考慮してグループ化される。図8は、もとの図7から記号領域と文字以外の線を消去し、文字列と境界線のみを示したものである。この例では、図5の属性文字列の領域と境界をまたいでグループ化が競合しないため、結果として、文字列は、図9の点線枠で示したように、グループ化される。グループ化に際しては、閾値を設定するなどして、図5で定義された同じ属性範囲にある文字列領域の候補は、同じグループになるように、かつ、図7の領域を分割する分割線をまたぐグループ化は、できるだけ避けるようにグループ化される。この2つの要求が競合を生じた場合には、領域を設定している線の位置、(領域を設定している線や、記号の位置が、グループ化しようとする文字列から遠い場合には、分割線の効力は小さいと考えられる)、属性文字列の種類(属性によっては、図5の属性パターンに、文字列の大きさだけでなく、文字の種類(英数、漢字、あるいは、属性名の限定(アルファベット−数字4桁のパターンなど))を総合的に考慮してグループ化をおこなう。
In
手順204で文字列領域が推定、グループ化されたら、手順205に進む。手順205では、文字列認識手段11により、手順204で推定された文字列領域と、編集可能化フォーマット図面データ記憶装置3に記憶されている編集可能化フォーマット図面データの中の、図2の例のように定義されているTEXTの矩形座標を比較して、推定された領域にある文字を編集可能化フォーマットから抽出することで、認識文字列が生成される。あるいは、推定された領域に対して、文字認識ソフトを起動して文字列を抽出することも可能である。
When the character string area is estimated and grouped in
生成された文字列は、統合認識手段12により、図10に概念的に示したように、それぞれの記号に対して属性文字列として付与されることになる(手順206)。どの記号にどの文字列が付与されるのかは、主として、記号と文字の位置関係及び文字の種類、文字の内容により、マッピングは限定される。最終的にCADデータベース4に格納されるデータ(CADデータ)は、図10のように、記号の種類と位置、および、認識された属性データの組となる。 The generated character string is given as an attribute character string to each symbol by the integrated recognition means 12 as conceptually shown in FIG. 10 (step 206). Which character string is assigned to which symbol is mainly limited by the positional relationship between the symbol and the character, the character type, and the character content. The data (CAD data) finally stored in the CAD database 4 is a set of symbol type and position and recognized attribute data as shown in FIG.
生成されたCADデータは、手順207において、認識結果表示手段13によって表示画面に表示され、ユーザにより確認される。必要ならユーザは、表示されたデータをキーボードを介し認識結果修正手段14によって修正する。認識結果表示手段13には、たとえば、DXFデータを表示できる、AutoCADなどのCADソフトや、配管設計や地図データ作成に特有のCADソフトを用いることができる。また、認識結果修正手段14は、上記表示に用いたCADソフトと同じものを用いることができるが、たとえば、図17に示すような、表形式で属性データの修正入力を行うインターフェース画面を用いることも考えられる。
In
確認・修正されたCADデータは、手順208において、CADデータベース4に登録される。登録されたCADデータは、必要に応じて、データ出力装置16から取り出して用いることができる。
The confirmed / corrected CAD data is registered in the CAD database 4 in
本実施の形態によれば、記号の認識に際し、まず、基準となるラスターパターンと、画像記憶装置2に格納されたラスター図面データとをパターン照合してラスター図面データの中の記号が存在する領域を取り出し、次いで、絞りこまれた記号の候補の領域(位置)に対して、あらかじめ線図化パターン記憶装置8に登録された線図化記号のパターンを基準に用いて編集可能化フォーマット図面データ記憶装置3に格納された編集可能化フォーマット図面データと照合し、最終的な記号の認識を実行する。したがって、線図化パターン記憶装置8に登録された線図化記号のパターンを基準に用いて編集可能化フォーマット図面データ記憶装置3に格納された編集可能化フォーマット図面データと照合する場合の対象領域が限定され、演算量が少なくて済むから、図面認識、すなわち、必要な情報のCADデータ化に要する時間が短縮される。
(第2の実施の形態)
本実施の形態においては、編集可能化フォーマット図面データのみを入力として、編集可能化フォーマット図面データを、BMPなどのラスター図面データに変換して用いることにより第1の実施の形態と同様の効果が得られる。このような、編集可能化フォーマット図面データからBMPなどのラスター図面データへの変換は、一般的に可能である。
According to the present embodiment, when a symbol is recognized, first, a region in which the symbol exists in the raster drawing data by pattern matching the reference raster pattern and the raster drawing data stored in the
(Second Embodiment)
In the present embodiment, only the editable format drawing data is input, and the editable format drawing data is converted into raster drawing data such as BMP, and the same effects as in the first embodiment are obtained. can get. Such conversion from editable format drawing data to raster drawing data such as BMP is generally possible.
図11に、本発明の第2の実施の形態に係る機能ブロック図を示す。本実施の形態の構成が前記第1の実施の形態の構成と異なるのは、次ぎのイ〜ハの点であり、他の構成は前記第1の実施の形態と同じであるので、同一の符号を付して説明を省略する。
イ.画像データ入力装置1101が、非文字部画像データ生成手段1122と文字列データ抽出手段1121を含んで構成されている点
ロ.RAMが、非文字部画像データ記憶装置1102と文字以外編集可能化フォーマット図面データ記憶装置1103Aと文字限定編集可能化フォーマット図面データ記憶装置1103Bで構成されている点
ハ.インターフェースが、図面位置対応データ設定手段を欠いている点
図12に、本実施の形態に係る処理手順を、概略フローチャートで示す。まず、手順1200で、画像データ入力装置1101において、編集可能化フォーマット図面データが入力される。次いで、手順1201において、文字列データ抽出手段1121により、そのデータを解析して、文字列のデータのみを抽出し、文字限定編集可能化フォーマット図面データ記憶装置1103Bに、文字列と、文字列の領域(位置情報)からなるデータを記憶する。このような抽出は、たとえば、DXF形式の場合には、図2に示したように、文字列に対しては、TEXTタグがついているため容易に実行することができる。
FIG. 11 shows a functional block diagram according to the second embodiment of the present invention. The configuration of the present embodiment is different from the configuration of the first embodiment in the following points (i) to (c), and the other configurations are the same as those of the first embodiment. The reference numerals are attached and the description is omitted.
I. The image data input device 1101 includes non-character part image data generation means 1122 and character string data extraction means 1121. The RAM comprises a non-character part image
一方で、非文字部画像データ生成手段1122では、この文字列のタグのついた部分だけを除去した編集可能化フォーマット図面データが生成され、そのデータをもとに文字列を除去したラスター図面データが生成され、非文字部画像データ記憶装置1102に記憶される(手順1202)。文字列をあらかじめ除去しておくのは、編集可能化フォーマット図面データでは、文字はあらかじめ電子データとして文字限定編集可能化フォーマット図面データ記憶装置1103に抽出してあるので必要なく、ラスター化した場合文字列が残っていると、記号と混同する可能性があるからである。文字列のタグのついた部分だけを除去した編集可能化フォーマット図面データを文字以外編集可能化フォーマット図面データ記憶装置1103Aに記憶する。
On the other hand, the non-character portion image data generating means 1122 generates editable format drawing data in which only the portion with the tag of the character string is removed, and raster drawing data from which the character string is removed based on the data. Is generated and stored in the non-character part image data storage device 1102 (procedure 1202). The character string is removed in advance in the editable format drawing data because the character is extracted in advance as electronic data in the character-limited editable format drawing data storage device 1103. This is because if the column remains, it can be confused with the symbol. The editable format drawing data from which only the portion with the tag of the character string is removed is stored in the editable format drawing
次に、手順1203で、ラスター記号パターン認識手段1105により、ラスターパターン記憶装置1106に記憶されているラスターパターンを用いてラスター記号パターンが認識処理されて記号位置が絞り込まれ、次いで、線図化記号パターン認識手段1107により線図化パターン記憶装置1108を参照して記号位置が抽出される。手順1204では、文字領域推定手段1110において、前記抽出された記号位置と、線図化パターン記憶装置1108に、図5の形式で記憶された記号と属性文字との相対的位置関係を用いて、文字領域が推定される。ここが第1の実施の形態と大きく異なるところで、第1の実施の形態では、記号でも線でもない残りの部分を輪郭線処理したものを文字領域のグループ化の初期候補として用いたが、本実施の形態では、文字限定編集可能化フォーマット図面データ記憶装置1103に記憶された、文字限定編集可能化フォーマット図面データをグループ化の初期候補として用いる。グループ化のための閾値の与え方などは、第1の実施の形態と同様に、図8のように記号の認識結果に基づいて、領域分けした領域線の境界を越えにくいような設定によって行なう。
Next, in
手順1205以降の処理は、前記図4で説明したとおりであり、説明は省略する。なお、前記図4の手順では、手順204で文字列の領域をグループ化した後、手順205で文字列を認識するが、本実施の形態では、編集可能化フォーマット図面データでは、図2のTEXTのラインのように、それぞれの文字はすでにわかっているので、改めて文字を認識する必要はない。
The processing after the
なお、第1、第2の実施の形態では、記号の認識において、ラスター図面データ、編集可能化フォーマット図面データの両方を用いているが、どちらか一方でも実現可能である。 In the first and second embodiments, both the raster drawing data and the editable format drawing data are used for symbol recognition, but either one can be realized.
本実施の形態は、ラスター図面データがない場合に、編集可能化フォーマット図面データからラスター図面データを生成し、生成したラスター図面データを用いて記号パターンの位置を認識する方式の例であり、前記第1の実施の形態と同様に、線図化記号のパターンを基準に用いて編集可能化フォーマット図面データと照合する場合の対象領域が限定され、演算量が少なくて済むから、図面認識、すなわち、必要な情報のCADデータ化に要する時間が短縮される。 The present embodiment is an example of a method of generating raster drawing data from editable format drawing data when there is no raster drawing data, and recognizing the position of the symbol pattern using the generated raster drawing data. As in the first embodiment, the target area when collating with the editable format drawing data is limited using the diagrammatic symbol pattern as a reference, and the amount of calculation can be reduced. Therefore, the time required for converting necessary information into CAD data is shortened.
1 画像データ入力装置
2 画像記憶装置
3 編集可能化フォーマット図面データ記憶装置
4 CADデータベース
5 ラスター記号パターン認識手段
6 ラスターパターン記憶装置
7 線図化記号パターン認識手段
8 線図化パターン記憶装置
9 記号認識手段
10 文字領域推定手段
11 文字列認識手段
12 統合認識手段
13 認識結果表示手段
14 認識結果修正手段
15 記号ライブラリ記憶装置
16 データ出力装置
18 図面位置対応データ設定手段
DESCRIPTION OF
Claims (5)
Raster drawing data of drawings including characters and symbols, and a procedure for storing the drawings expressed in editable format drawing data capable of individually editing characters and graphics, and the stored raster drawing data and A procedure for narrowing a range of positions of the symbol on the drawing with reference to a raster pattern representing the symbol in the raster drawing data format, a diagram pattern describing the symbol in an editable format format, the raster pattern and the line Editable from the range of positions on the narrowed-down drawing with reference to the drawing expressed in the editable format drawing data in which the information for associating the drawing pattern and the character and the figure can be individually edited A procedure for recognizing a symbol described in a standardized format and a diagrammatic pattern of the recognized symbol A procedure for assigning ID information as symbol position CAD data with reference to ID information of a symbol type on a set CAD database, and the stored raster drawing with reference to the recognized symbol position A procedure for estimating the character area of the data, a procedure for recognizing the character string of the estimated character area, the position information of the character string and the content of the character string, the relative positional relationship between the symbol and the attribute character stored in advance, and Using the recognized symbol position, and recognizing the character position in the drawing and the mutual relationship between the symbol position and the attribute character string related to the symbol and storing the attribute character string in the CAD database. Drawing recognition method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005039536A JP2006227824A (en) | 2005-02-16 | 2005-02-16 | Drawing recognition method and device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005039536A JP2006227824A (en) | 2005-02-16 | 2005-02-16 | Drawing recognition method and device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006227824A true JP2006227824A (en) | 2006-08-31 |
Family
ID=36989173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005039536A Pending JP2006227824A (en) | 2005-02-16 | 2005-02-16 | Drawing recognition method and device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006227824A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7526353B2 (en) | 2006-11-22 | 2009-04-28 | Hitachi Plant Technologies, Ltd. | Sequence design support system |
JP2010226341A (en) * | 2009-03-23 | 2010-10-07 | Fuji Xerox Co Ltd | Image processing apparatus, image processing system, and processing program |
KR101448543B1 (en) | 2013-04-03 | 2014-10-13 | 주식회사 싸이픽소프트 | A string merge method for extracting correct information of the notation and the bar arrangement from architectural drawing files |
KR20200038006A (en) * | 2018-10-02 | 2020-04-10 | 경북대학교 산학협력단 | Method for providing digital drawing and digital drawing providing device |
WO2023199398A1 (en) * | 2022-04-12 | 2023-10-19 | 三菱電機株式会社 | Information processing device, processing method, and processing program |
-
2005
- 2005-02-16 JP JP2005039536A patent/JP2006227824A/en active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7526353B2 (en) | 2006-11-22 | 2009-04-28 | Hitachi Plant Technologies, Ltd. | Sequence design support system |
JP2010226341A (en) * | 2009-03-23 | 2010-10-07 | Fuji Xerox Co Ltd | Image processing apparatus, image processing system, and processing program |
KR101448543B1 (en) | 2013-04-03 | 2014-10-13 | 주식회사 싸이픽소프트 | A string merge method for extracting correct information of the notation and the bar arrangement from architectural drawing files |
KR20200038006A (en) * | 2018-10-02 | 2020-04-10 | 경북대학교 산학협력단 | Method for providing digital drawing and digital drawing providing device |
KR102117323B1 (en) * | 2018-10-02 | 2020-06-09 | 경북대학교 산학협력단 | Method for providing digital drawing and digital drawing providing device |
WO2023199398A1 (en) * | 2022-04-12 | 2023-10-19 | 三菱電機株式会社 | Information processing device, processing method, and processing program |
JP7450840B1 (en) | 2022-04-12 | 2024-03-15 | 三菱電機株式会社 | Information processing device, processing method, and processing program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3822277B2 (en) | Character template set learning machine operation method | |
JP2749020B2 (en) | Diagram recognition system | |
JP2000090195A (en) | Method and device for table recognition | |
JPS61267177A (en) | Retrieving system for document picture information | |
JP2010009509A (en) | Image processor, image processing method, program thereof, and storage medium | |
JPH05151254A (en) | Method and system for processing document | |
JP4704601B2 (en) | Character recognition method, program, and recording medium | |
JP2006227824A (en) | Drawing recognition method and device | |
JP4935459B2 (en) | Character recognition method, character recognition program, and character recognition device | |
JP3070801B2 (en) | Drawing management method | |
JP4795820B2 (en) | Map data creation device, map data creation method, map data check program | |
JP2003296726A (en) | Method, device and program for converting drawing and recording medium | |
JP2020064438A (en) | Learning data generation device and learning data generation method | |
JP5361315B2 (en) | Information processing apparatus and information processing method | |
JP2006323511A (en) | Symbol-identifying method and device thereof | |
JP5067182B2 (en) | Image processing apparatus and image processing program | |
JP2004259076A (en) | Picture recognizing method and device | |
JP2011128687A (en) | Character form element determining device and character form element determining method | |
JPS6395590A (en) | Hand-written character recognition device | |
JP3082467B2 (en) | Outline data processing device | |
JP2009193170A (en) | Character recognition device and character recognition method | |
JP5343584B2 (en) | Information processing apparatus and program | |
JP2578965B2 (en) | Graphic processing unit | |
US10558774B1 (en) | Electronic library and design generation using image and text processing | |
JP2007299321A (en) | Information processor, information processing method, information processing program and information storage medium |