JP7254606B2 - Estimation work support system and estimation work support program - Google Patents

Estimation work support system and estimation work support program Download PDF

Info

Publication number
JP7254606B2
JP7254606B2 JP2019084487A JP2019084487A JP7254606B2 JP 7254606 B2 JP7254606 B2 JP 7254606B2 JP 2019084487 A JP2019084487 A JP 2019084487A JP 2019084487 A JP2019084487 A JP 2019084487A JP 7254606 B2 JP7254606 B2 JP 7254606B2
Authority
JP
Japan
Prior art keywords
text
correct
symbol
correlation coefficient
symbols
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019084487A
Other languages
Japanese (ja)
Other versions
JP2020181405A (en
Inventor
和秀 高桑
直大 今村
安正 内山
和志 中堀
Original Assignee
日本電設工業株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電設工業株式会社 filed Critical 日本電設工業株式会社
Priority to JP2019084487A priority Critical patent/JP7254606B2/en
Publication of JP2020181405A publication Critical patent/JP2020181405A/en
Application granted granted Critical
Publication of JP7254606B2 publication Critical patent/JP7254606B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、イメージデータの設計図面から、電気器具等の品名や個数などを自動的に拾い出すことで、積算業務の支援を行う積算業務支援システム及び積算業務支援プログラムに関する。 TECHNICAL FIELD The present invention relates to an estimation work support system and an estimation work support program for assisting an estimation work by automatically picking up the names and numbers of electric appliances and the like from design drawings of image data.

従来、積算業務の支援を行うシステムが種々提案されてきた(例えば、特許文献1(特開2006-113940号公報)参照。)
特開2006-113940号公報
Conventionally, various systems have been proposed for supporting estimation work (see, for example, Patent Document 1 (Japanese Unexamined Patent Application Publication No. 2006-113940)).
JP-A-2006-113940

発明者らは、顧客から提供される建物の設計図面から、電気器具の品名や個数などを抽出し(拾い出し)、これらを積算することで、電気工事費用を算出する業務を行っている。ところで、顧客から提供される前記設計図面は、CADデータ等によるものではなく、イメージデータであることが特徴となっている。これは、CADデータ等を顧客側から受領してしまうと、万が一誤って改変してしまう可能性も生じてしまうからであり、このようなことを防止するためにイメージデータの設計図面を顧客から受領するようにしている。そこで、従来は、電気工事費用の算出業務においては、イメージデータに基づいて、電気器具の記号や、テキストの拾い出しを行わなければならず、このような拾い出し作業は実質的に人手により行わなければならず、非常に業務効率が悪い、という問題があった。 The inventors extract (pick up) the product names and numbers of electrical appliances from the building design drawings provided by customers, and calculate the electrical work costs by accumulating them. By the way, the design drawing provided by the customer is characterized in that it is image data rather than CAD data or the like. This is because if CAD data etc. are received from the customer side, there is a possibility that they may be erroneously altered. I am trying to receive it. Therefore, conventionally, in the work of calculating the cost of electrical work, it is necessary to pick up symbols and texts of electrical appliances based on image data, and such picking work is substantially done manually. There was a problem that the work efficiency was very poor.

図17、図18を参照して具体的に説明する。図17、図18それぞれの(A)は建物の設計図面の一例を示す図である。図17(A)に関連して図17(B)における凡例表には電気器具のシンボルマークとしての記号と、当該記号に対応して名称などが定義されている。設計図面からの積算作業においては、設計図面の本図の中から、記号を抽出することが必要となる。しかしながら、これまで、凡例表中に定義されている複数の記号を、イメージデータの設計図面本図の中で、コンピューターマッチングを行い、効率的に抽出する技術については知られていなかった。(課題1)
さらに、設計図面においては、例えば、図18(A)に関連して図18(B)における姿図が記述されている。このような姿図においては、「品名」などが記述されている。このような「品名」は、姿図や設計図面においてOCRなどの文字認識技術により、テキストデータに変換されるが、この際しばしば変換ミスが発生してしまう。しかしながら、従来このような変換ミスを修正するためには人に頼るしかなく、自動でこれを効率的に修正する技術が求められていた。(課題2)
A specific description will be given with reference to FIGS. 17 and 18. FIG. (A) of each of FIGS. 17 and 18 is a diagram showing an example of a design drawing of a building. In relation to FIG. 17(A), the legend table in FIG. 17(B) defines symbols as symbol marks of electric appliances and names corresponding to the symbols. In the multiplication work from the design drawing, it is necessary to extract the symbols from the main drawing of the design drawing. However, until now, there has been no known technique for efficiently extracting a plurality of symbols defined in the table of legends by computer matching in the design drawings of the image data. (Task 1)
Furthermore, in the design drawing, for example, the figure in FIG. 18(B) is described in relation to FIG. 18(A). In such a drawing, the "product name" and the like are described. Such "product name" is converted into text data by character recognition technology such as OCR in figure drawings and design drawings, but conversion errors often occur at this time. Conventionally, however, there is no choice but to rely on people to correct such conversion errors, and there has been a demand for a technique for automatically and efficiently correcting them. (Task 2)

このような課題を解決するために、本発明に係る積算業務支援システムは、イメージデータよりなる設計図面から、設計図面における電気器具に係る複数の記号パターンの抽出を行うと共に、設計図面における品名を認識する積算業務支援システムであって、所定の矩形状領域で、複数の記号の矩形状ドットパターンを記憶する工程と、複数の記号のそれぞれの矩形状ドットパターンを1ドットずつずらしながら設計図面との比較を行い、相関係数を算出し、それぞれの記号に対する相関係数関数を求める工程と、求められた相関係数関数が所定の閾値を超える記号であり、かつ、近傍に相関係数関数が所定の閾値を超える記号は存在しない記号を正解として抽出する工程と、指定範囲において、全ての記号に対する相関係数関数の最大値を与える最大値関数を算出する工程と、最大値関数における極大値を与える記号を正解として抽出する工程と、設計図面における品名を文字認識技術に基づいてテキストに変換する工程と、変換されたテキストと、品名の正解テキストとが一致しない場合、変換されたテキストを、編集距離が最も近い正解テキストに修正する工程と、変換されたテキストと、品名の正解テキストとが一致しない場合で、編集距離が最も近い正解テキストが複数存在するとき、変換されたテキストのうち、類似文字を有するものについては類似文字を代表文字に置換処理する工程と、正解テキストのうち、類似文字を有するものについては類似文字を代表文字に置換処理する工程と、置換処理済みの変換されたテキストと、置換処理済みの正解テキストとの間の編集距離を算出する工程と、編集距離がより短い変換されたテキストを、正解テキストに修正する工程と、が実行されることを特徴とする。
In order to solve such a problem, the estimation work support system according to the present invention extracts a plurality of symbol patterns related to electric appliances in the design drawing from the design drawing made up of image data, and extracts the product names in the design drawing. A recognition integration work support system comprising: a step of storing rectangular dot patterns of a plurality of symbols in a predetermined rectangular region; are compared, the correlation coefficient is calculated, and the correlation coefficient function for each symbol is obtained; A step of extracting a symbol as a correct answer for which there are no symbols exceeding a predetermined threshold, a step of calculating a maximum value function that gives the maximum value of the correlation coefficient function for all symbols in the specified range, a step of maximal value in the maximum value function A process of extracting a symbol that gives a value as a correct answer, a process of converting the product name in the design drawing into text based on character recognition technology, and if the converted text and the correct text of the product name do not match, the converted text is corrected to the correct text with the closest edit distance, and when the converted text and the correct text of the product name do not match, when there are multiple correct texts with the closest edit distance, the converted text Of these, a step of replacing similar characters with representative characters for those having similar characters, a step of replacing similar characters with representative characters for those having similar characters among the correct texts, and a conversion that has been replaced calculating an edit distance between the converted text and the replaced correct text; and correcting the converted text with a shorter edit distance to the correct text. do.

また、本発明に係る積算業務支援プログラムは、イメージデータよりなる設計図面から、設計図面における電気器具に係る複数の記号パターンの抽出を行う処理と共に、設計図面における品名を認識する処理をコンピューターに実行させる積算業務支援プログラムであって、所定の矩形状領域で、複数の記号の矩形状ドットパターンを記憶する工程と、複数の記号のそれぞれの矩形状ドットパターンを1ドットずつずらしながら設計図面との比較を行い、相関係数を算出し、それぞれの記号に対する相関係数関数を求める工程と、求められた相関係数関数が所定の閾値を超える記号であり、かつ、近傍に相関係数関数が所定の閾値を超える記号は存在しない記号を正解として抽出する工程と、指定範囲において、全ての記号に対する相関係数関数の最大値を与える最大値関数を算出する工程と、最大値関数における極大値を与える記号を正解として抽出する工程と、設計図面における品名を文字認識技術に基づいてテキストに変換する工程と、変換されたテキストと、品名の正解テキストとが一致しない場合、変換されたテキストを、編集距離が最も近い正解テキストに修正する工程と、変換されたテキストと、品名の正解テキストとが一致しない場合で、編集距離が最も近い正解テキストが複数存在するとき、変換されたテキストのうち、類似文字を有するものについては類似文字を代表文字に置換処理する工程と、正解テキストのうち、類似文字を有するものについては類似文字を代表文字に置換処理する工程と、置換処理済みの変換されたテキストと、置換処理済みの正解テキストとの間の編集距離を算出する工程と、編集距離がより短い変換されたテキストを、正解テキストに修正する工程と、をコンピューターに実行させることを特徴とする。
In addition, the estimation work support program according to the present invention executes a process of extracting a plurality of symbol patterns related to electric appliances in the design drawings from the design drawings made up of image data, and a process of recognizing product names in the design drawings on the computer. and a step of storing rectangular dot patterns of a plurality of symbols in a predetermined rectangular region, and a design drawing while shifting the rectangular dot patterns of each of the plurality of symbols by one dot. performing the comparison, calculating the correlation coefficient, and determining the correlation coefficient function for each symbol; A step of extracting a correct symbol for which there are no symbols exceeding a predetermined threshold, a step of calculating a maximum value function that gives the maximum value of the correlation coefficient function for all symbols in the specified range, and a maximum value in the maximum value function. a step of extracting the symbol that gives , in the process of correcting to the correct text with the closest edit distance, and when the converted text and the correct text of the product name do not match, when there are multiple correct texts with the closest edit distance, out of the converted text , a step of replacing similar characters with representative characters for those having similar characters, a step of replacing similar characters with representative characters for those having similar characters among the correct texts, and calculating the edit distance between the replaced text and the replaced correct text; and correcting the converted text with the shorter edit distance to the correct text. do.

本発明に係る積算業務支援システム及び積算業務支援プログラムは、求められた相関係数関数が所定の閾値を超える記号であり、かつ、近傍に相関係数関数が所定の閾値を超える記号は存在しない記号を正解として抽出するので、このような本発明に係る積算業務支援システム及び積算業務支援プログラムによれば、凡例表中に定義されている複数の記号と同様の記号を、イメージデータの設計図面本図の中から、コンピューターマッチングを行い、効率的に抽出することが可能となる。 In the estimation work support system and the estimation work support program according to the present invention, the obtained correlation coefficient function is a symbol exceeding a predetermined threshold, and there is no nearby symbol having a correlation coefficient function exceeding the predetermined threshold. Since the symbol is extracted as the correct answer, according to the estimation work support system and the estimation work support program according to the present invention, a plurality of symbols similar to the symbols defined in the legend table are extracted from the design drawing of the image data. From this figure, it is possible to perform computer matching and extract efficiently.

また、本発明に係る積算業務支援システム及び積算業務支援プログラムは、変換されたテキストと、姿図に記載された品名の正解テキストとが一致しない場合、変換されたテキストを、編集距離が最も近い正解テキストに修正するので、このような本発明に係る積算業務支援システム及び積算業務支援プログラムによれば、文字認識技術により誤変換されたテキストデータを効率的に修正することが可能となる。 In addition, the estimation work support system and the estimation work support program according to the present invention, when the converted text does not match the correct text of the product name described in the figure drawing, converts the converted text to the closest edit distance. Since the text is corrected to the correct text, according to the estimation work support system and the estimation work support program according to the present invention, it is possible to efficiently correct the text data erroneously converted by the character recognition technology.

本発明の実施形態に係る積算業務支援システム1を実行するコンピューターのシステム構成例を示す図である。1 is a diagram showing a system configuration example of a computer that executes an estimation work support system 1 according to an embodiment of the present invention; FIG. 設計図面における(A)凡例表、(B)姿図の一部を例示する図である。It is a figure which illustrates a part of (A) legend table in a design drawing, and (B) figure drawing. 説明のための簡略化した3種の記号を示す図である。It is a figure which shows three types of symbols simplified for description. 本発明の実施形態に係る積算業務支援システム1における記号抽出処理のフローチャートを示す図である。4 is a diagram showing a flowchart of symbol extraction processing in the estimation work support system 1 according to the embodiment of the present invention; FIG. 本発明の実施形態に係る積算業務支援システム1における相関係数関数算出・記憶処理サブルーチンのフローチャートを示す図である。4 is a diagram showing a flowchart of a correlation coefficient function calculation/storage processing subroutine in the integration work support system 1 according to the embodiment of the present invention; FIG. 基準ドットを有するw×hドットの記号ドットパターンと、スキャン対象範囲であるW×Hドットの設計図面本図(平面図)を示す図である。FIG. 3 is a diagram showing a symbol dot pattern of w×h dots having reference dots, and a main design drawing (plan view) of W×H dots, which is a scan target range; 相関係数の算出の処理を模式的に説明する図である。FIG. 10 is a diagram schematically illustrating processing for calculating a correlation coefficient; 種々の記号に対する相関係数の算出の処理を模式的に説明する図である。FIG. 10 is a diagram schematically illustrating the processing of calculating correlation coefficients for various symbols; 本発明の実施形態に係る積算業務支援システム1における第1抽出処理サブルーチンのフローチャートを示す図である。4 is a diagram showing a flowchart of a first extraction processing subroutine in the estimation work support system 1 according to the embodiment of the present invention; FIG. 図3に示した3種の記号に対する相関係数の値の推移を示す図である。FIG. 4 is a diagram showing changes in values of correlation coefficients for the three types of symbols shown in FIG. 3; 本発明の実施形態に係る積算業務支援システム1における第2抽出処理サブルーチンのフローチャートを示す図である。FIG. 5 is a diagram showing a flowchart of a second extraction processing subroutine in the estimation work support system 1 according to the embodiment of the present invention; 最大値関数c(x,y)と、最大値関数c(x,y)の極大値を与える記号とを説明する図である。FIG. 3 is a diagram illustrating a maximum value function c(x, y) and a symbol that gives a maximum value of the maximum value function c(x, y); マッチング元パターンとして、向きの異なる記号の自動生成について説明する図である。FIG. 10 is a diagram illustrating automatic generation of symbols with different orientations as matching source patterns; 本発明の実施形態に係る積算業務支援システム1における品名認識処理のフローチャートを示す図である。4 is a diagram showing a flow chart of product name recognition processing in the estimation work support system 1 according to the embodiment of the present invention. FIG. 編集距離が近い正解テキストが複数ある場合を示す図である。FIG. 10 is a diagram showing a case where there are multiple correct texts with close edit distances; 代表文字による置換処理と、編集距離算出とによる判定を説明する図である。It is a figure explaining the determination by the replacement process by a representative character, and edit distance calculation. 建物の設計図面の一例を示す図であり、(A)は平面図を、(B)は凡例表を示している。BRIEF DESCRIPTION OF THE DRAWINGS It is a figure which shows an example of the design drawing of a building, (A) has shown the top view, (B) has shown the legend table. 建物の設計図面の一例を示す図であり、(A)は平面図を、(B)は姿図を示している。BRIEF DESCRIPTION OF THE DRAWINGS It is a figure which shows an example of the design drawing of a building, (A) has shown the top view, (B) has shown the floor plan.

以下、本発明の実施の形態を図面を参照しつつ説明する。図1は本発明の実施形態に係る積算業務支援システムのプラグラムを実行させるコンピューターのシステム構成例を示す図である。 BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a diagram showing an example system configuration of a computer that executes a program of an estimation work support system according to an embodiment of the present invention.

図1において、10はシステムバス、11はCPU(Central Processing Unit)、12はRAM(Random Access Memory)、13はROM(Read Only Memory)、14は外部情報機器との通信を司る通信制御部、15はキーボードコントローラなどの入力制御部、16は出力制御部、17は外部記憶装置制御部、18はキーボード、ポインティングデバイス、マウスなどの入力機器からなる入力部、19は印刷装置などの出力部、20はHDD(Hard Disk Drive)等の外部記憶装置、21はグラフィック制御部、22はディスプレイ装置をそれぞれ示している。 In FIG. 1, 10 is a system bus, 11 is a CPU (Central Processing Unit), 12 is a RAM (Random Access Memory), 13 is a ROM (Read Only Memory), 14 is a communication control unit that controls communication with external information equipment, 15 is an input control unit such as a keyboard controller; 16 is an output control unit; 17 is an external storage device control unit; 18 is an input unit including input devices such as a keyboard, pointing device and mouse; Reference numeral 20 denotes an external storage device such as an HDD (Hard Disk Drive); 21, a graphics control unit; and 22, a display device.

図1において、CPU11は、ROM13内のプログラム用ROM、或いは、大容量の外部記憶装置20に記憶されたプログラム等に応じて、外部機器と通信することでデータを検索・取得したり、また、図形、イメージ、文字、表等が混在した出力データの処理を実行したり、更に、外部記憶装置20に格納されているデータベースの管理を実行したり、などといった演算処理を行うものである。 In FIG. 1, the CPU 11 searches and acquires data by communicating with external devices according to programs stored in the program ROM in the ROM 13 or the large-capacity external storage device 20. It performs arithmetic processing such as processing output data in which figures, images, characters, tables, etc. are mixed, and managing the database stored in the external storage device 20.

また、CPU11は、システムバス10に接続される各デバイスを統括的に制御する。ROM13内のプログラム用ROMあるいは外部記憶装置20には、CPU11の制御用の基本プログラムであるオペレーティングシステムプログラム(以下OS)等が記憶されている。また、ROM13あるいは外部記憶装置20には出力データ処理等を行う際に使用される各種データが記憶されている。メインメモリーであるRAM12は、CPU11の主メモリ、ワークエリア等として機能する。 Further, the CPU 11 comprehensively controls each device connected to the system bus 10 . A program ROM in the ROM 13 or an external storage device 20 stores an operating system program (OS), which is a basic program for controlling the CPU 11, and the like. In addition, the ROM 13 or the external storage device 20 stores various data used when performing output data processing and the like. A RAM 12, which is a main memory, functions as a main memory for the CPU 11, a work area, and the like.

入力制御部15は、キーボードや不図示のポインティングデバイスからの入力部18を制御する。また、出力制御部16は、プリンタなどの出力部19の出力制御を行う。 The input control unit 15 controls an input unit 18 from a keyboard or pointing device (not shown). Also, the output control unit 16 controls the output of an output unit 19 such as a printer.

外部記憶装置制御部17は、ブートプログラム、各種のアプリケーション、フォントデータ、ユーザーファイル、編集ファイル、プリンタドライバ等を記憶するHDD(Hard Disk Drive)や、或いはソリッドステートドライブ(SSD)等の外部記憶装置20へのアクセスを制御する。本発明の積算業務支援システムを実現するシステムプログラムは、上記のような外部記憶装置20に記憶されている。また、グラフィック制御部21は、ディスプレイ装置22に表示する情報を描画処理するための構成である。 The external storage device control unit 17 is an external storage device such as an HDD (Hard Disk Drive) or a solid state drive (SSD) that stores boot programs, various applications, font data, user files, edit files, printer drivers, and the like. 20. A system program for realizing the estimation work support system of the present invention is stored in the external storage device 20 as described above. Also, the graphics control unit 21 is a component for drawing processing of information to be displayed on the display device 22 .

また、通信制御部14は、ネットワークを介して、外部機器と通信を制御するものであり、これによりシステムが必要とするデータを、インターネットやイントラネット上の外部機器が保有するデータベースから取得したり、外部機器に情報を送信したりすることができるように構成される。 Further, the communication control unit 14 controls communication with external devices via a network. It is configured to be able to transmit information to an external device.

また、外部記憶装置20には、CPU11の制御プログラムであるオペレーティングシステムプログラム(以下OS)以外に、本発明の積算業務支援システム1をCPU11上で動作させるシステムプログラム、及びこのシステムプログラムで用いるデータなどがインストールされ保存・記憶されている。また、本発明の外部記憶装置20には、表計算処理を実行するExcel(商標)などのスプレッドシートソフトウエアがインストールされ、本発明の積算業務支援システム1と連動可能に動作するようにプログラムされている。 In addition to the operating system program (OS), which is the control program for the CPU 11, the external storage device 20 stores a system program for operating the integration work support system 1 of the present invention on the CPU 11, and data used in this system program. is installed and stored. Spreadsheet software such as Excel (trademark) for executing spreadsheet processing is installed in the external storage device 20 of the present invention, and is programmed to operate in conjunction with the integration work support system 1 of the present invention. ing.

本発明の積算業務支援システム1を実現するシステムプログラムで利用されるデータとしては、基本的には外部記憶装置20に保存されていることが想定されているが、場合によっては、これらのデータを、通信制御部14を介してインターネットやイントラネット上の外部機器から取得するように構成することも可能である。また、本発明の積算業務支援システム1を実現するシステムプログラムで利用されるデータを、USBメモリやCD、DVDなどの各種メディアから取得するように構成することもできる。本発明に係る積算業務支援システムは、以上のように構成されるコンピューターでプログラムが実行されることで実現される。 It is assumed that the data used by the system program that implements the estimation work support system 1 of the present invention is basically stored in the external storage device 20. It is also possible to obtain the information from an external device on the Internet or an intranet via the communication control unit 14 . Also, the data used by the system program that realizes the estimation work support system 1 of the present invention can be configured to be acquired from various media such as a USB memory, CD, and DVD. The estimation work support system according to the present invention is implemented by executing a program on the computer configured as described above.

以下、本実施形態では、電気器具の記号、品名や個数などを設計図面から拾い上げて抽出する例に基づいて説明を行う。また、設計図面のイメージデータは、凡例表や、平面図(本図)や姿図とからなり、これら図面や表から電気器具のシンボルマークとしての記号やテキストデータを抽出する例で、以下の説明を行うが、本発明で用い得るデータが、凡例表や、平面図(本図)や姿図とからなる組み合わせに限定されるものでもない。 In the following, the present embodiment will be described based on an example of picking up and extracting symbols, product names, numbers, etc. of electric appliances from design drawings. In addition, the image data of the design drawing consists of a table of legends, a plan view (this drawing), and a figure. To explain, the data that can be used in the present invention is not limited to a combination of a legend table, a plan view (this view), and a profile view.

発明者らは、顧客から提供される建物の設計図面から、電気器具の品名や個数などを抽出し(拾い出し)、これらを積算することで、電気工事費用を算出する業務を行っている。ここで、顧客から提供される前記設計図面は、CADデータ等によるものではなく、イメージデータであり、従来の電気工事費用の算出業務においては、イメージデータに基づいた照明器具の拾い出しを行っており、実質的に人手による作業となっていた。 The inventors extract (pick up) the product names and numbers of electrical appliances from the building design drawings provided by customers, and calculate the electrical work costs by accumulating them. Here, the design drawings provided by the customer are image data, not CAD data, etc., and in conventional electrical work cost calculation work, lighting fixtures are picked up based on image data. This was essentially manual work.

そこで、本発明に係る積算業務支援システム1においては、顧客から提供される設計図面のイメージデータから、電気工事費用の積算に必要な電気器具の記号や、テキストトデータを抽出しようとするものである。 Therefore, in the estimation work support system 1 according to the present invention, it is intended to extract symbols of electric appliances and text data necessary for estimating electrical work costs from image data of design drawings provided by customers. be.

図2は設計図面における(A)凡例表、(B)姿図の一部を例示する図である。図2(A)の凡例表においては、電気器具のシンボルマークとしての「記号」と、当該記号に対応して「名称」が定義されている。設計図面からの積算作業においては、設計図面の本図の中から、このような記号を抽出することが必要となる。しかしながら、これまで、凡例表中に定義されている複数の記号を、イメージデータの設計図面本図の中で、コンピューターマッチングを行い、効率的に抽出する技術については知られていなかった。(課題1)
また、図2(B)の姿図においては、「品名」などが記述されている。このような姿図や設計図面中からは、OCRなどの文字認識技術により、テキストデータに変換されるが、この際しばしば変換ミスが発生してしまう。しかしながら、従来このような変換ミスを修正するためには人に頼るしかなく、自動でこれを効率的に修正する技術が求められていた。(課題2)
なお、姿図においては、斜視図が含まれることに図面としての特徴を有するものであるが、本発明においては姿図における品名のテキストデータに着目しているところ、図2(B)では斜視図等を省略している。
FIG. 2 is a diagram exemplifying a part of (A) a legend table and (B) a drawing in a design drawing. In the legend table of FIG. 2A, "symbols" as symbol marks of electric appliances and "names" corresponding to the symbols are defined. In the multiplication work from the design drawing, it is necessary to extract such symbols from the main drawing of the design drawing. However, until now, there has been no known technique for efficiently extracting a plurality of symbols defined in the table of legends by computer matching in the design drawings of the image data. (Task 1)
Also, in the drawing of FIG. 2(B), "product name" and the like are described. Such figure drawings and design drawings are converted into text data by character recognition technology such as OCR, but at this time conversion errors often occur. Conventionally, however, there is no choice but to rely on people to correct such conversion errors, and there has been a demand for a technique for automatically and efficiently correcting them. (Task 2)
It should be noted that the drawing is characterized by the inclusion of a perspective view in the figure drawing. Illustrations etc. are omitted.

以下、これらの課題1及び課題2を、本発明に係る積算業務支援システム1及び積算業務支援プログラムによって解決する具体的な方法について説明する。 Specific methods for solving these problems 1 and 2 by the estimation work support system 1 and the estimation work support program according to the present invention will be described below.

まず、「記号」を、設計図面の本図からマッチング処理によって抽出する技術について説明する。図3は説明のための簡略化した3種の記号を示す図である。このような記号は、コンピューターにおけるドット単位の座標でみて水平方向にwドット、垂直方向にhドットのマトリクスを有するものとする。なお、設計図面の本図においてマッチング対象となる記号も、同様に水平方向にwドット、垂直方向にhドットのマトリクスを有している。また、図3に示す記号、設計図面の本図中の記号は2値で構成されている。 First, a technique for extracting a "symbol" from a main drawing of a design drawing by matching processing will be described. FIG. 3 is a diagram showing three simplified symbols for explanation. Such a symbol is assumed to have a matrix of w dots horizontally and h dots vertically in computer dot coordinates. Note that the symbol to be matched in this drawing of the design drawing also has a matrix of w dots in the horizontal direction and h dots in the vertical direction. Also, the symbols shown in FIG. 3 and the symbols in this drawing of the design drawing are composed of binary values.

水平方向のwドット、垂直方向のhドットの左上隅にのドットを基準ドットとして定義する。図3に示すような記号のドットパターンを、設計図面の本図でマッチング処理を行い抽出する際には、この基準ドットと共に記号のドットパターンを1ドットずつ移動させつつ、本図中のドットパターンとの相関係数をとっていく。そして、相関係数が所定の閾値より高い箇所には、記号が存在するものとして扱うようにする。これにより、本図中から記号を抽出することが可能となる。 The dot at the upper left corner of w dots in the horizontal direction and h dots in the vertical direction is defined as the reference dot. When extracting the dot pattern of the symbol as shown in FIG. 3 by performing matching processing on the main drawing of the design drawing, while moving the dot pattern of the symbol along with the reference dot by one dot, Take the correlation coefficient with Then, a location where the correlation coefficient is higher than a predetermined threshold value is treated as if there is a symbol. As a result, symbols can be extracted from the drawing.

ただし、設計図面の本図においては、電気器具の記号のパターンに、建築図の線などが重なっていたり、或いは、そもそも電気器具の記号同士に類似しているものが存在していたりして、判定が困難となる状況があるので、これに対応するために、本発明においては最大値関数という概念を導入して、このような最大値関数に極大値を与えるような記号を抽出するところに本発明の大きな特徴点がある。 However, in the main drawing of the design drawing, the pattern of the symbol of the electrical appliance may overlap with the line of the architectural drawing, or the symbols of the electrical appliance may be similar to each other in the first place, Since there are situations where determination is difficult, in order to deal with this, the concept of a maximum value function is introduced in the present invention, and a symbol that gives a maximum value to such a maximum value function is extracted. There is a major feature of the present invention.

さて、以上を踏まえて、次に設計図面の本図から記号を抽出する際のアルゴリズムの一例を説明する。図4は本発明の実施形態に係る積算業務支援システム1における記号抽出処理のフローチャートを示す図である。 Now, based on the above, an example of an algorithm for extracting symbols from the main drawing of the design drawing will now be described. FIG. 4 is a diagram showing a flowchart of symbol extraction processing in the estimation work support system 1 according to the embodiment of the present invention.

図4において、ステップS100で記号抽出処理が開始されると、続いて、ステップS101に進み、相関係数関数算出・記憶処理のサブルーチンが実行される。このようなサブルーチンについて図5を参照して説明する。なお、このようなサブルーチンは、抽出しようとする全ての記号(本例では図3の(A)乃至(C)の3種類の記号)について実行される。 In FIG. 4, when the symbol extraction process is started in step S100, the process proceeds to step S101, and a correlation coefficient function calculation/storage process subroutine is executed. Such a subroutine will be described with reference to FIG. Such a subroutine is executed for all symbols to be extracted (three types of symbols (A) to (C) in FIG. 3 in this example).

図5で、ステップS200で、相関係数関数算出・記憶処理サブルーチンが開始されると、ステップS201に進み、対象とする記号の基準ドットパターンの座標を初期座標に設定する。このような初期座標としては、設計図面の本図の、例えば左上隅のドット座標が選択される。初期座標から、最終座標まで1ドットずつ隙間なくスキャンすることができればどのような座標をとっても構わない。 In FIG. 5, when the correlation coefficient function calculation/storage processing subroutine is started in step S200, the process advances to step S201 to set the coordinates of the reference dot pattern of the target symbol as the initial coordinates. As such initial coordinates, for example, the dot coordinates of the upper left corner of the main drawing of the design drawing are selected. Any coordinates can be used as long as they can be scanned dot by dot from the initial coordinates to the final coordinates without gaps.

図6は左上隅に基準ドットを有するw×hドットの記号ドットパターンと、スキャン対象範囲であるW×Hドットの設計図面本図(平面図)を示す図である。図6において、水平右方向にx座標を、垂直下方向にy座標を定義する。基本的に、w×hドットの記号ドットパターンは、初期座標(1,1)から順次x座標方向に、設計図面本図(平面図)をスキャンしつつ相関係数を算出していく。右端部(W―w,1)にまで到達すると、次にy座標を+1とし(1,2)から順次x座標方向に、設計図面本図(平面図)をスキャンしつつ相関係数を算出していく。以下同様に、このような工程を繰り返して、記号ドットパターンにより設計図面本図(平面図)をスキャンしつつ相関係数を求めていく。 FIG. 6 shows a symbol dot pattern of w×h dots having a reference dot in the upper left corner, and a design drawing (plan view) of W×H dots, which is the scan target range. In FIG. 6, the x-coordinate is defined horizontally to the right and the y-coordinate is defined vertically downward. Basically, for the symbol dot pattern of w×h dots, the correlation coefficient is calculated while scanning the design drawing main drawing (plan view) sequentially in the x-coordinate direction from the initial coordinates (1, 1). When the right end (W-w, 1) is reached, the y-coordinate is set to +1, and the correlation coefficient is calculated while scanning the design drawing main figure (plan view) sequentially from (1, 2) in the x-coordinate direction. continue. In the same manner, such steps are repeated to obtain the correlation coefficient while scanning the main design drawing (plan view) with the symbol dot pattern.

ステップS202では、記号のドットパターンと、このドットパターンと重なっている本図のドットパターンとの間の相関係数を算出して記憶する。 In step S202, the correlation coefficient between the dot pattern of the symbol and the dot pattern in the figure overlapping this dot pattern is calculated and stored.

ステップS203では、設計図面の全ての領域(スキャン対象範囲)について相関係数が算出・記憶された否かが判定される。(すなわち、(W-w,H-h)まで基準ドットが到達したか否かが判定される。)当該判定がNOであれば、ステップS204に進み、基準ドットパターンの座標を1ドット分ずらして、再びステップS202を実行する。一方、当該判定がYESであると、ステップS205に進み、元のルーチンにリターンする。 In step S203, it is determined whether or not correlation coefficients have been calculated and stored for all areas (scan target range) of the design drawing. (That is, it is determined whether or not the reference dot has reached (Ww, Hh).) If the determination is NO, the process advances to step S204 to shift the coordinates of the reference dot pattern by one dot. Then, step S202 is executed again. On the other hand, if the determination is YES, the process proceeds to step S205 and returns to the original routine.

図7は相関係数の算出の処理を模式的に説明する図である。図7において、斜線の記号は設計図面の本図中の記号を示している。また、x座標を水平方向に右側に進むに連れて座標値が増大する座標として定義し、y座標を垂直方向に下側に進むに連れて座標値が増大する座標として定義している。 FIG. 7 is a diagram schematically explaining the processing of calculating the correlation coefficient. In FIG. 7, hatched symbols indicate symbols in the drawing of the design drawing. The x-coordinate is defined as a coordinate whose coordinate value increases as it proceeds horizontally to the right, and the y-coordinate is defined as a coordinate whose coordinate value increases as it proceeds vertically downward.

また、R1を図3(A)に示す記号のドットパターンと本図のドットパターンとの間の相関係数と定義し、R2を図3(B)に示す記号のドットパターンと本図のドットパターンとの間の相関係数と定義し、R3を図3(C)に示す記号のドットパターンと本図のドットパターンとの間の相関係数と定義する。 Also , R 1 is defined as the correlation coefficient between the dot pattern of the symbols shown in FIG. , and R 3 is defined as the correlation coefficient between the symbol dot pattern shown in FIG. 3C and the dot pattern in FIG.

図7においては、(A)→(B)→(C)→(D)の順で、相関係数算出・記憶処理サブルーチンにおけるステップが進んでいる様子を示している。図7から分かるように、記号のドットパターンと本図のドットパターンと重なり具合によって、それらの間の相関係数の値が変化する。なお、相関係数の最大値は1である。例えば、図7(A)→(B)→(C)→(D)の順で、相関係数R1は0、0.16、0.98、0.30のように推移する。 FIG. 7 shows how the steps in the correlation coefficient calculation/storage processing subroutine proceed in the order of (A)→(B)→(C)→(D). As can be seen from FIG. 7, the value of the correlation coefficient between the dot pattern of the symbol and the dot pattern of this figure changes depending on the overlapping degree. Note that the maximum value of the correlation coefficient is 1. For example, the correlation coefficient R 1 changes from 0 to 0.16 to 0.98 to 0.30 in the order of (A)→(B)→(C)→(D) in FIG.

また、図8は、図3の(A)乃至(C)の3種類の記号に対する相関係数の算出の処理を模式的に説明する図である。本実施形態においては、相関係数算出・記憶処理のサブルーチンで、図3の(A)乃至(C)の3種類の記号の全てについて、図8に示すような形でそれぞれ相関係数が求められていく。 Also, FIG. 8 is a diagram for schematically explaining the processing of calculating the correlation coefficients for the three types of symbols (A) to (C) in FIG. In this embodiment, correlation coefficients are obtained in the form shown in FIG. 8 for all three types of symbols (A) to (C) in FIG. be taken away.

ステップS205においては、上記のように算出した相関係数に基づいて記号ごとの相関係数関数Rn(x,y)を求め(本例では、n=1,2,3)ておき、これを記憶部に記憶する。ステップS206で元のルーチンにリターンする。 In step S205, the correlation coefficient function R n (x, y) for each symbol is calculated based on the correlation coefficients calculated as described above (in this example, n=1, 2, 3). is stored in the storage unit. At step S206, the original routine is returned to.

さて、以上のように相関係数関数算出・記憶処理のサブルーチンが実行され、図4に示す元のルーチンに戻りステップS102に進むと、続いて、図9に示す第1抽出処理サブルーチンが実行される。 After the correlation coefficient function calculation/storage processing subroutine is executed as described above, the process returns to the original routine shown in FIG. 4 and proceeds to step S102. Subsequently, the first extraction processing subroutine shown in FIG. 9 is executed. be.

ステップS300で第1抽出処理のサブルーチンが開始されると、続いて、ステップS301に進み、図5のサブルーチンで算出された相関係数関数を取得する。 After the subroutine of the first extraction process is started in step S300, the process proceeds to step S301 to acquire the correlation coefficient function calculated in the subroutine of FIG.

続く、ステップS302では、算出された相関係数関数が所定の閾値を超える記号であり(条件1とする)、かつ、近傍に相関係数関数が所定の閾値を超える記号は存在しない(条件2とする)かが判定される。 Subsequently, in step S302, the calculated correlation coefficient function is a symbol exceeding a predetermined threshold (Condition 1), and there is no nearby symbol having a correlation coefficient function exceeding a predetermined threshold (Condition 2 ) is determined.

図10は、図3に示した3種の記号のドットパターンと、図8の本図ドットパターンとの相関係数の値の推移を示す図である。図10において、横軸はx座標を示しており、縦軸はそれぞれの相関係数Rの値を示している。ここで、Rthが先の所定の閾値であるものとする。上記の条件1に該当する記号は、図10に示す図において、閾値Rthを超えた記号であり、本例では図3(A)に示す「△」が該当する。 FIG. 10 is a diagram showing changes in correlation coefficient values between the dot patterns of the three types of symbols shown in FIG. 3 and the main dot pattern shown in FIG. In FIG. 10, the horizontal axis indicates the x-coordinate, and the vertical axis indicates the respective correlation coefficient R values. Here, let R th be the above predetermined threshold. The symbol corresponding to condition 1 above is the symbol exceeding the threshold value Rth in the diagram shown in FIG. 10, and in this example, "Δ" shown in FIG.

次に条件2について検討する。2つの記号同士の矩形状のドットパターンが重なっていなければ、それぞれの記号を独立的に相関係数の値を比較することができる。一方、2つの記号同士の矩形状のドットパターン(w×hのパターン)が重なってしまう場合(この場合を2つの記号同士が「近傍」にあると称する)には、両方が閾値Rthを超えてしまうようなことがあり得る。この場合には、精度の高いマッチングができなくなってしまうので、本発明においては、条件2を条件1とのアンド条件とすることで、誤判定を避けるようにしている。 Next, condition 2 will be examined. If the rectangular dot patterns of two symbols do not overlap, the correlation coefficient values of each symbol can be independently compared. On the other hand, when the rectangular dot patterns (w×h patterns) of two symbols overlap each other (this case is called “nearby” the two symbols), both of the threshold values R th It is possible that it may be exceeded. In this case, highly accurate matching cannot be performed. Therefore, in the present invention, condition 2 is ANDed with condition 1 to avoid erroneous determination.

さて、上記の条件1、かつ、条件2を満たしステップS302における判定がYESであると、ステップS303に進み、着目している当該記号についてはマッチングした正解として抽出を行う。 Now, if the above conditions 1 and 2 are satisfied and the determination in step S302 is YES, the process proceeds to step S303, and the target symbol is extracted as a matching correct answer.

一方、先のステップS302における判定がNOであると、ステップS303に進み、着目している当該記号については、とりあえず未確定の記号として処理を行う。 On the other hand, if the determination in step S302 is NO, the process proceeds to step S303, and the symbol of interest is treated as an undetermined symbol for the time being.

ステップS305に進むと元のルーチンにリターンして、図4のフローチャートに戻る。図4のフローチャートにおいて、ステップS103では、対象となっている本図のドットパターンにおいて、未確定の記号が存在するか否かが判定される。 When the process proceeds to step S305, the process returns to the original routine and returns to the flow chart of FIG. In the flowchart of FIG. 4, in step S103, it is determined whether or not an undetermined symbol exists in the target dot pattern of this figure.

ここで、未確定の記号が存在せず、ステップS103の判定がNOであれば、ステップS105に進み、記号抽出処理は終了となる。 Here, if there is no undetermined symbol and the determination in step S103 is NO, the process proceeds to step S105 and the symbol extraction process ends.

一方、未確定の記号が存在し、ステップS103の判定がYESとなると、続いてステップS104に進み、第2抽出処理サブルーチンが実行される。この第2抽出処理サブルーチンを、図11を参照して説明する。 On the other hand, if there is an undetermined symbol and the determination in step S103 is YES, the process proceeds to step S104, and the second extraction processing subroutine is executed. This second extraction processing subroutine will be described with reference to FIG.

図11において第2抽出処理サブルーチンが開始されると、ステップS401に進み、最大値関数の算出が実行される。ここで、図12を参照して最大値関数c(x,y)についての説明を行う。図12は最大値関数c(x,y)と、最大値関数c(x,y)の極大値を与える記号とを説明する図である。なお、図12においては(x,y)を1次元的に簡略的に図示している。 When the second extraction processing subroutine is started in FIG. 11, the process proceeds to step S401 to calculate the maximum value function. Here, the maximum value function c(x, y) will be described with reference to FIG. FIG. 12 is a diagram for explaining the maximum value function c(x, y) and the symbol giving the maximum value of the maximum value function c(x, y). In addition, in FIG. 12, (x, y) is simply illustrated one-dimensionally.

最大値関数c(x,y)は、指定範囲において、全ての記号に対する相関係数関数の最大値を与えるもとして定義する。ここで、指定範囲は(x,y)を基準として、―εの範囲から+εの範囲とする。また、εは、0<ε/w<1、かつ0<ε/h<1の値を満たす正の整数である。 A maximum value function c(x,y) is defined as giving the maximum value of the correlation coefficient function for all symbols in the specified range. Here, the designated range is from -ε to +ε with (x, y) as a reference. ε is a positive integer that satisfies 0<ε/w<1 and 0<ε/h<1.

このような最大値関数c(x,y)は、記憶されている各記号の相関係数関数より求めることができる。 Such a maximum value function c(x, y) can be obtained from the stored correlation coefficient function of each symbol.

さて、上記のようにステップS401で最大値関数c(x,y)を算出した後には、続いて、ステップS402に進み、未確定記号のうち、最大値関数c(x,y)に対して極大値を与えるものがあるか否かを判定する。 Now, after calculating the maximum value function c(x, y) in step S401 as described above, the process proceeds to step S402. Determine if there is any that gives a local maximum.

ステップS402における判定がYESであるとき、ステップS404に進み、極大値を与える当該記号を正解として抽出する。 When the determination in step S402 is YES, the process advances to step S404 to extract the symbol that gives the maximum value as the correct answer.

一方、ステップS402における判定がNOであるとき、ステップS404に進み、正解の抽出に失敗したエラーとして処理する。 On the other hand, when the determination in step S402 is NO, the process advances to step S404, and it is processed as an error that extraction of the correct answer has failed.

ステップS405では、リターンして元のフローチャートに戻る。また、元のフローチャートにおいても、ステップS105に進み処理を終了する。 In step S405, return to the original flow chart. Also in the original flowchart, the process proceeds to step S105 and ends.

以上のように、本発明に係る積算業務支援システム1及び積算業務支援プログラムは、算出された相関係数関数が所定の閾値を超える記号であり、かつ、近傍に相関係数関数が所定の閾値を超える記号は存在しない記号を正解として抽出するので、このような本発明に係る積算業務支援システム1及び積算業務支援プログラムによれば、凡例表中に定義されている複数の記号と同様の記号を、イメージデータの設計図面本図の中から、コンピューターマッチングを行い、効率的に抽出することが可能となる。 As described above, in the estimation work support system 1 and the estimation work support program according to the present invention, the calculated correlation coefficient function is a symbol exceeding a predetermined threshold value, and the correlation coefficient function near the predetermined threshold value symbols that do not exist are extracted as correct answers. can be efficiently extracted from the design drawings of the image data by computer matching.

また、本発明に係る積算業務支援システム1及び積算業務支援プログラムでは、相関係数関数のみでは、的確な抽出を行い得ないときには、最大値関数c(x,y)に基づいて記号の抽出処理を行うので、より確度の高い抽出処理を行うことができる。 Further, in the estimation work support system 1 and the estimation work support program according to the present invention, when accurate extraction cannot be performed only with the correlation coefficient function, symbol extraction processing is performed based on the maximum value function c(x, y). is performed, extraction processing can be performed with higher accuracy.

なお、図3(A)(図13(A)に同じ)の記号「△」は、当該記号に加え、90°右に回転させた図13(B)に示す記号、及び、それをさらに90°右に回転させた図13(C)に示す記号、及び、それをさらに90°右に回転させた図13(D)に示す記号の全てのパターンを、マッチングさせる元の記号としておくことが好ましい。設計図面の本図のイメージデータでは、先の記号「△」が、どのような向きで配置されているか分からないからである。図13(A)のパターンから、図13(B)乃至(D)までのマッチングパターンを自動で生成するようにしておくと利便性が高い。 3(A) (same as FIG. 13(A)) is the symbol shown in FIG. All patterns of the symbol shown in FIG. 13(C) rotated to the right and the symbol shown in FIG. 13(D) rotated by 90° to the right can be used as original symbols to be matched. preferable. This is because it is not known in what direction the above symbol "Δ" is arranged in the image data of this drawing of the design drawing. It is convenient to automatically generate the matching patterns of FIGS. 13B to 13D from the pattern of FIG. 13A.

次に、課題2を本発明に係る積算業務支援システム1及び積算業務支援プログラムによって解決する具体的な方法について説明する。なお、課題2は、従来の文字認識技術による変換ミスを、自動的・効率的に修正する技術が確立されていない、というものであった。 Next, a specific method for solving problem 2 by the estimation work support system 1 and the estimation work support program according to the present invention will be described. Problem 2 was that there was no established technology for automatically and efficiently correcting conversion errors made by conventional character recognition technology.

以下、図2(B)に類する姿図における「品名」を読み取る例に基づいて説明を行う。また、図2(B)における品名「AdOI(エー ディー オー アイ)」、「AcOx(エー シー オー エックス)」、「AeOy(エー イー オー ワイ)」については正解のテキストデータであるものとして説明すると共に、このような正解テキストデータについてはシステムやプログラム側に予め記憶させてあることを前提に説明する。 Hereinafter, description will be made based on an example of reading the "product name" in a drawing similar to FIG. 2(B). Also, the product names "AdOI", "AcOx", and "AeOy" in FIG. In addition, the description will be made on the assumption that such correct text data is stored in advance in the system or program.

図14は本発明の実施形態に係る積算業務支援システム1における品名認識処理のフローチャートを示す図である。なお、本例ではアルゴリズムを「品名認識処理」と称しているが、本発明では認識処理を行い得る対象は姿図の品名に限定されるものではない。 FIG. 14 is a diagram showing a flow chart of product name recognition processing in the estimation work support system 1 according to the embodiment of the present invention. In this example, the algorithm is called "product name recognition processing", but the object for which recognition processing can be performed in the present invention is not limited to the product name in the figure drawing.

図14において、ステップS500で、品名認識処理のフローチャートが開始されると、続いて、ステップS501に進み、対象となる姿図の品名の欄を文字認識技術に基づいてテキストに変換する。なお、読み取る姿図の具体例についてはここでは特に示さない。また、読み取ったデータをテキストデータに変換する文字認識技術は従来周知のものを適宜利用することができる。 In FIG. 14, when the flow chart of product name recognition processing is started at step S500, the flow advances to step S501 to convert the product name column of the target figure drawing into text based on the character recognition technology. A specific example of the figure to be read is not particularly shown here. Further, as a character recognition technique for converting read data into text data, conventionally well-known techniques can be appropriately used.

続く、ステップS502では、ステップS501で変換されたテキストと、正解テキスト(図2(B)の一覧)とを比較する。 Subsequently, in step S502, the text converted in step S501 is compared with the correct text (list in FIG. 2(B)).

ステップS503では、正解テキストの一覧の中に一致するものが存在するか否かが判定される。ステップS503における判定がYESである場合には、ステップS507に進み、変換されたテキストを、修正することなくそのまま正解として、ステップS513に進み、品名認識処理を終了する。 In step S503, it is determined whether or not there is a match in the list of correct texts. If the determination in step S503 is YES, the process proceeds to step S507, the converted text is treated as the correct answer without modification, the process proceeds to step S513, and the product name recognition process ends.

一方、ステップS503における判定がNOである場合には、ステップS504に進み、変換されたテキストと、正解テキストとの間の編集距離を算出する。 On the other hand, if the determination in step S503 is NO, the process advances to step S504 to calculate the edit distance between the converted text and the correct text.

ここで、ある文字列を別の文字列に変換する際、1文字の挿入・削除・置換のいずれかの処理を1回としてカウントするとき、編集距離は、ある文字列を別の文字列に変換するまでに何回の当該処理で変換を行えるかの(最小の)回数として定義することができる。このような編集距離が短い方が、二つの文字列がより近いことを示す。 Here, when converting a character string to another character string, when one character is inserted, deleted, or replaced as one time, the edit distance is the one character string to another character string. It can be defined as the (minimum) number of times that conversion can be performed by the process before conversion. A shorter edit distance indicates that the two character strings are closer.

続く、ステップS505では、編集距離が最も近い正解テキストが1つのみあるか否かが判定される。ステップS505における判定がYESであるときには、ステップS506に進み、文字認識により変換されたテキストは、正解テキストに修正する。すなわち、本ステップで自動修正を行ってしまう。 Subsequently, in step S505, it is determined whether or not there is only one correct text with the closest edit distance. When the determination in step S505 is YES, the process proceeds to step S506, and the text converted by character recognition is corrected to the correct text. That is, automatic correction is performed in this step.

一方、ステップS505における判定がNOであるとき、すなわち、編集距離が近い正解テキストが複数ある場合については、続いてステップS508に進む。 On the other hand, when the determination in step S505 is NO, that is, when there are a plurality of correct texts with close edit distances, the process proceeds to step S508.

図15は編集距離が近い正解テキストが複数ある場合を示す図である。ステップS505では、「AdOI(エー ディー オー アイ)」、「AcOx(エー シー オー エックス)」、「AeOy(エー イー オー ワイ)」の正解テキストに対する、読み取りにより得られた変換されたテキストである「ABOl(エー ビィー オー エル)」の編集距離が検討される。変換されたテキストの文字列「ABOl」から、正解テキストの文字列(「AdOI」、「AcOx」、「AeOy」)までの編集距離はいずれも2である。 FIG. 15 is a diagram showing a case where there are a plurality of correct texts with close edit distances. In step S505, the text " The edit distance of "ABOl" is considered. The edit distance from the character string “ABOl” of the converted text to the character strings of the correct text (“AdOI”, “AcOx”, and “AeOy”) is 2.

図15に示すような場合には、ステップS508では、類似文字を代表文字に置換する。ここでは、仮に0(ゼロ)がO(オー)の代表文字であり、1(イチ)がI(アイ)、l(エル)の代表文字であるものと予め定義されていると仮定する。図15の例では、変換されたテキストの文字列「ABOl」は図16に示すようにステップS508の処理で、「AB01(エー ビィー ゼロ イチ)」へと置換処理される。 In the case shown in FIG. 15, in step S508, similar characters are replaced with representative characters. Here, it is assumed that 0 (zero) is a representative character of O (o), and 1 (ichi) is a representative character of I (eye) and l (el). In the example of FIG. 15, the character string "ABOl" of the converted text is replaced with "AB01" in the process of step S508 as shown in FIG.

ステップS508では、正解テキストについても、類似文字を代表文字に置換する処理が実行される。正解テキスト「AdOI」、「AcOx」、「AeOy」は、本ステップの置換処理によってそれぞれ「Ad01(エー ディー ゼロ イチ)」、「Ac0x(エー シー ゼロ エックス)」、「Ae0y(エー イー ゼロ ワイ)」とされる。 In step S508, processing for replacing similar characters with representative characters is also executed for the correct text. The correct texts "AdOI", "AcOx", and "AeOy" are replaced with "Ad01", "Ac0x", and "Ae0y" by the replacement processing in this step. ”.

続いて、ステップS509に進み、置換処理された変換テキスト(「AB01」)と、置換処理された正解テキスト(「Ad01」、「Ac0x」、「Ae0y」)との間の編集距離を算出する。図16に示すように、置換された変換テキスト「AB01」から置換された正解テキスト「Ac0x」、「Ae0y」までの編集距離は2である。一方、置換された変換テキスト「AB01」から置換された正解テキスト「Ad01」までの編集距離は1である。(後者が、ステップS510における1つのみの組み合わせとなる)
続く、ステップS510においては、編集距離がより短い組み合わせが1つのみあるか否かが判定される。当該判定結果がNOであれば、いずれが正解であるかを決定することができないものとして、ステップS512に進み、エラーの処理がなされる。
Subsequently, the process advances to step S509 to calculate the edit distance between the converted text (“AB01”) that has been replaced and the correct text that has been replaced (“Ad01”, “Ac0x”, and “Ae0y”). As shown in FIG. 16, the edit distance from the replaced converted text "AB01" to the replaced correct texts "Ac0x" and "Ae0y" is two. On the other hand, the edit distance from the replaced converted text "AB01" to the replaced correct text "Ad01" is one. (The latter is the only combination in step S510)
Subsequently, in step S510, it is determined whether or not there is only one combination with a shorter edit distance. If the determination result is NO, it is determined that which is the correct answer cannot be determined, and the process proceeds to step S512 to perform error processing.

一方、ステップS510の判定結果がYESであるときには、ステップS511に進み、変換されたテキストを、正解テキストに修正する、所謂自動修正を行う。図16は、ステップS510に進む例を示している。本ステップによれば、変換されたテキストの文字列「ABOl」は、自動修正により正解テキスト「AdOI」に修正される。 On the other hand, when the determination result in step S510 is YES, the process advances to step S511 to perform so-called automatic correction, in which the converted text is corrected to the correct text. FIG. 16 shows an example of proceeding to step S510. According to this step, the character string "ABOl" of the converted text is automatically corrected to the correct text "AdOI".

ステップS513では、品名認識処理を終了する。これまで説明したように、編集距離による処理と、さらに必要に応じて、代表文字への置換処理の双方を利用することで、文字認識によって誤変換されたテキストを、自動修正できる確率を高めることが可能となる。 In step S513, the product name recognition process is terminated. As explained above, by using both processing based on edit distance and, if necessary, replacement processing with representative characters, it is possible to increase the probability of automatically correcting text that has been erroneously converted by character recognition. becomes possible.

以上のように、本発明に係る積算業務支援システム1及び積算業務支援プログラムは、変換されたテキストと、姿図に記載された品名の正解テキストとが一致しない場合、変換されたテキストを、編集距離が最も近い正解テキストに修正するので、このような本発明に係る積算業務支援システム1及び積算業務支援プログラムによれば、文字認識技術により誤変換されたテキストデータを効率的に修正することが可能となる。 As described above, the estimation work support system 1 and the estimation work support program according to the present invention edit the converted text when the converted text does not match the correct text of the product name described in the figure drawing. Since the text is corrected to the correct text with the closest distance, according to the estimation work support system 1 and the estimation work support program according to the present invention, it is possible to efficiently correct the text data erroneously converted by the character recognition technology. It becomes possible.

1・・・積算業務支援システム
10・・・システムバス
11・・・CPU(Central Processing Unit)
12・・・RAM(Random Access Memory)
13・・・ROM(Read Only Memory)
14・・・通信制御部
15・・・入力制御部
16・・・出力制御部
17・・・外部記憶装置制御部
18・・・入力部
19・・・出力部
20・・・外部記憶装置
21・・・グラフィック制御部
22・・・ディスプレイ装置
Reference Signs List 1: Totalization work support system 10: System bus 11: CPU (Central Processing Unit)
12 RAM (Random Access Memory)
13 ROM (Read Only Memory)
Reference numeral 14: communication control unit 15: input control unit 16: output control unit 17: external storage device control unit 18: input unit 19: output unit 20: external storage device 21 ... graphic control unit 22 ... display device

Claims (2)

イメージデータよりなる設計図面から、設計図面における電気器具に係る複数の記号パターンの抽出を行うと共に、設計図面における品名を認識する積算業務支援システムであって、
所定の矩形状領域で、複数の記号の矩形状ドットパターンを記憶する工程と、
複数の記号のそれぞれの矩形状ドットパターンを1ドットずつずらしながら設計図面との比較を行い、相関係数を算出し、それぞれの記号に対する相関係数関数を求める工程と、
求められた相関係数関数が所定の閾値を超える記号であり、かつ、近傍に相関係数関数が所定の閾値を超える記号は存在しない記号を正解として抽出する工程と、
指定範囲において、全ての記号に対する相関係数関数の最大値を与える最大値関数を算出する工程と、
最大値関数における極大値を与える記号を正解として抽出する工程と、
設計図面における品名を文字認識技術に基づいてテキストに変換する工程と、
変換されたテキストと、品名の正解テキストとが一致しない場合、変換されたテキストを、編集距離が最も近い正解テキストに修正する工程と、
変換されたテキストと、品名の正解テキストとが一致しない場合で、編集距離が最も近い正解テキストが複数存在するとき、
変換されたテキストのうち、類似文字を有するものについては類似文字を代表文字に置換処理する工程と、
正解テキストのうち、類似文字を有するものについては類似文字を代表文字に置換処理する工程と、
置換処理済みの変換されたテキストと、置換処理済みの正解テキストとの間の編集距離を算出する工程と、
編集距離がより短い変換されたテキストを、正解テキストに修正する工程と、
が実行されることを特徴とする積算業務支援システム。
An estimation work support system that extracts a plurality of symbol patterns related to electrical appliances in the design drawings from the design drawings made up of image data and recognizes product names in the design drawings,
storing a rectangular dot pattern of a plurality of symbols in a predetermined rectangular area;
A step of comparing with the design drawing while shifting the rectangular dot patterns of each of the plurality of symbols by one dot, calculating the correlation coefficient, and obtaining the correlation coefficient function for each symbol;
a step of extracting, as a correct symbol, a symbol whose correlation coefficient function exceeds a predetermined threshold and for which there is no nearby symbol whose correlation coefficient function exceeds a predetermined threshold;
calculating a maximum value function that gives the maximum value of the correlation coefficient function for all symbols in the specified range;
A step of extracting a symbol that gives a maximum value in the maximum value function as a correct answer;
A process of converting the product name in the design drawing into text based on character recognition technology;
If the converted text and the correct text of the product name do not match, correcting the converted text to the correct text with the closest edit distance;
When the converted text and the correct text of the product name do not match, and there are multiple correct texts with the closest edit distance,
a step of replacing the similar characters with representative characters for those having similar characters among the converted text;
a step of replacing the similar characters with representative characters for those having similar characters among the correct texts;
calculating an edit distance between the replaced converted text and the replaced correct text;
correcting the converted text with the shorter edit distance to the correct text;
is executed.
イメージデータよりなる設計図面から、設計図面における電気器具に係る複数の記号パターンの抽出を行う処理と共に、設計図面における品名を認識する処理をコンピューターに実行させる積算業務支援プログラムであって、
所定の矩形状領域で、複数の記号の矩形状ドットパターンを記憶する工程と、
複数の記号のそれぞれの矩形状ドットパターンを1ドットずつずらしながら設計図面との比較を行い、相関係数を算出し、それぞれの記号に対する相関係数関数を求める工程と、
求められた相関係数関数が所定の閾値を超える記号であり、かつ、近傍に相関係数関数が所定の閾値を超える記号は存在しない記号を正解として抽出する工程と、
指定範囲において、全ての記号に対する相関係数関数の最大値を与える最大値関数を算出する工程と、
最大値関数における極大値を与える記号を正解として抽出する工程と、
設計図面における品名を文字認識技術に基づいてテキストに変換する工程と、
変換されたテキストと、品名の正解テキストとが一致しない場合、変換されたテキストを、編集距離が最も近い正解テキストに修正する工程と、
変換されたテキストと、品名の正解テキストとが一致しない場合で、編集距離が最も近い正解テキストが複数存在するとき、
変換されたテキストのうち、類似文字を有するものについては類似文字を代表文字に置換処理する工程と、
正解テキストのうち、類似文字を有するものについては類似文字を代表文字に置換処理する工程と、
置換処理済みの変換されたテキストと、置換処理済みの正解テキストとの間の編集距離を算出する工程と、
編集距離がより短い変換されたテキストを、正解テキストに修正する工程と、
をコンピューターに実行させることを特徴とする積算業務支援プログラム。
A cost estimation support program that causes a computer to execute a process of extracting a plurality of symbol patterns related to electrical appliances in the design drawing from the design drawing consisting of image data and a process of recognizing the item name in the design drawing,
storing a rectangular dot pattern of a plurality of symbols in a predetermined rectangular area;
A step of comparing with the design drawing while shifting the rectangular dot patterns of each of the plurality of symbols by one dot, calculating the correlation coefficient, and obtaining the correlation coefficient function for each symbol;
a step of extracting, as a correct symbol, a symbol whose correlation coefficient function exceeds a predetermined threshold and for which there is no nearby symbol whose correlation coefficient function exceeds a predetermined threshold;
calculating a maximum value function that gives the maximum value of the correlation coefficient function for all symbols in the specified range;
A step of extracting a symbol that gives a maximum value in the maximum value function as a correct answer;
A process of converting the product name in the design drawing into text based on character recognition technology;
If the converted text and the correct text of the product name do not match, correcting the converted text to the correct text with the closest edit distance;
When the converted text and the correct text of the product name do not match, and there are multiple correct texts with the closest edit distance,
a step of replacing the similar characters with representative characters for those having similar characters among the converted text;
a step of replacing the similar characters with representative characters for those having similar characters among the correct texts;
calculating an edit distance between the replaced converted text and the replaced correct text;
correcting the converted text with the shorter edit distance to the correct text;
Calculation work support program characterized by causing a computer to execute
JP2019084487A 2019-04-25 2019-04-25 Estimation work support system and estimation work support program Active JP7254606B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019084487A JP7254606B2 (en) 2019-04-25 2019-04-25 Estimation work support system and estimation work support program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019084487A JP7254606B2 (en) 2019-04-25 2019-04-25 Estimation work support system and estimation work support program

Publications (2)

Publication Number Publication Date
JP2020181405A JP2020181405A (en) 2020-11-05
JP7254606B2 true JP7254606B2 (en) 2023-04-10

Family

ID=73024135

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019084487A Active JP7254606B2 (en) 2019-04-25 2019-04-25 Estimation work support system and estimation work support program

Country Status (1)

Country Link
JP (1) JP7254606B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102638388B1 (en) * 2021-06-03 2024-02-19 고려대학교 산학협력단 Object recognition system, object recognition method and computer program stored in a recording medium to execute the method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001307021A (en) 2000-04-19 2001-11-02 Nippon Telegr & Teleph Corp <Ntt> Pattern string extracting method and number plate recognizing method
JP2004234424A (en) 2003-01-31 2004-08-19 Hitachi Ltd Drawing recognition method and device therefor
JP2015191620A (en) 2014-03-28 2015-11-02 富士重工業株式会社 Outside-vehicle environment recognition device
JP2018523188A (en) 2015-08-16 2018-08-16 グーグル エルエルシー Comparison between extracted user name and stored user data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001307021A (en) 2000-04-19 2001-11-02 Nippon Telegr & Teleph Corp <Ntt> Pattern string extracting method and number plate recognizing method
JP2004234424A (en) 2003-01-31 2004-08-19 Hitachi Ltd Drawing recognition method and device therefor
JP2015191620A (en) 2014-03-28 2015-11-02 富士重工業株式会社 Outside-vehicle environment recognition device
JP2018523188A (en) 2015-08-16 2018-08-16 グーグル エルエルシー Comparison between extracted user name and stored user data

Also Published As

Publication number Publication date
JP2020181405A (en) 2020-11-05

Similar Documents

Publication Publication Date Title
RU2429540C2 (en) Image processing apparatus, image processing method, computer readable data medium
US10346681B2 (en) Method and computing device for optically recognizing mathematical expressions
JP6831951B2 (en) Image recognition system
JP7254606B2 (en) Estimation work support system and estimation work support program
JP2017515222A (en) Line segmentation method
CN113420848A (en) Neural network model training method and device and gesture recognition method and device
JP5094682B2 (en) Image processing apparatus, image processing method, and program
JP2013229011A (en) Form identification device and form identification method
JP5147640B2 (en) Image processing apparatus, image processing method, and program
JP7096033B2 (en) Building extraction system
CN111368915A (en) Drawing verification method, device, equipment and storage medium
JP7272037B2 (en) Information processing device and program
JP2015184815A (en) Form definition creation device, form definition creation method and program
Vassiliou et al. On a test for trends in piecewise monotonic data approximation method
JP2022101136A (en) Information processing apparatus, information processing method, and program
JP2021082264A (en) Image processing system, image processing method, and program
KR101761140B1 (en) Mapping method for images
JP2020107272A (en) Information processing apparatus, information processing method, and program
JP2008003812A (en) Piping length measuring system
US7623714B2 (en) Form recognition system, method, program, and storage medium
JP6609181B2 (en) Character attribute estimation apparatus and character attribute estimation program
JP2022191790A (en) Abnormality detection device, abnormality detection method, and abnormality detection program
TWI571753B (en) Electronic calculating apparatus for generating an interaction index map of an image, method thereof and computer program product thereof
US20180211366A1 (en) Flattening and Rectifying A Curved Image
JP7413445B2 (en) Device, method, and program for managing multiple drawing data representing a set of parts

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211101

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230329

R150 Certificate of patent or registration of utility model

Ref document number: 7254606

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150