JP3878174B2 - レコード抽出方法、レコード抽出装置、及びレコード抽出プログラム - Google Patents
レコード抽出方法、レコード抽出装置、及びレコード抽出プログラム Download PDFInfo
- Publication number
- JP3878174B2 JP3878174B2 JP2003418914A JP2003418914A JP3878174B2 JP 3878174 B2 JP3878174 B2 JP 3878174B2 JP 2003418914 A JP2003418914 A JP 2003418914A JP 2003418914 A JP2003418914 A JP 2003418914A JP 3878174 B2 JP3878174 B2 JP 3878174B2
- Authority
- JP
- Japan
- Prior art keywords
- cell
- analysis
- text
- image
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000605 extraction Methods 0.000 title claims description 19
- 238000004458 analytical method Methods 0.000 claims description 125
- 238000001514 detection method Methods 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000003384 imaging method Methods 0.000 claims description 5
- 210000004027 cell Anatomy 0.000 description 198
- 238000000034 method Methods 0.000 description 55
- 238000012545 processing Methods 0.000 description 24
- 238000011960 computer-aided design Methods 0.000 description 8
- 230000010354 integration Effects 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 210000003888 boundary cell Anatomy 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 210000003205 muscle Anatomy 0.000 description 3
- 239000004566 building material Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Description
従って、この様な入力プログラムで作成されたデータファイルには汎用性が無く、当該データファイル対応の積算装置等を利用しない限り、従来と同様にいったん紙面にプリントアウトして上記の如く煩雑な入力作業を行わなければならなかった。
以下に説明する前記レコード抽出装置の例はCAD装置の一機能手段として構成され、コンピュータが、そのコンピュータにインストールされたレコード抽出プログラムに基づく制御指令により、建築部材としての意味づけが何等なされていない画像データからなる画像データファイルの一部又は全部を、建築部材毎にその識別子(以下、部材識別子14と記す。)と詳細情報とを関連づけた基礎データからなる部材データファイルに変換すべく種々の機能手段として稼働するものである。
当該レコード抽出装置は、建築部材の識別子及び詳細情報が組となった複数のレコード1(図20参照)をマトリクス状に配列した画像をディスプレイ画面に出力する為の線及びテキストの表示データからなる画像データファイル2を取り入れる基礎情報登録手段9、前記画像データファイル2に記録された表示データを画像化して前記コンピュータのディスプレイ画面に出力する画像表示手段10、前記ディスプレイ画面の画像上に解析領域3を設定し当該解析領域3に含まれる線及びテキストの表示データを前記画像データファイル2から抽出する領域指定手段11、前記解析領域3に含まれるテキストの表示データから基点キーワード4を検出し、前記基点キーワード4の配置位置を基点として前記解析領域3に含まれる線の表示データから罫線を検出し、前記罫線で仕切られた各セル6に表示されたテキストのデータからラベルキーワード5を検出すると共に、前記罫線で仕切られた各セル6に対し、当該セル6に表示する情報内容を定義する為のセル分類マーク7を前記ラベルキーワード5の配置に基づいて与え、前記ラベルキーワード5の配置に基づき罫線で仕切られたセル群をレコード単位で区分けするセル解析手段12、及び前記セル6に表示された線又はテキストの表示データを前記セル分類マーク7に基づいて解析し、当該解析結果である線及びテキストの基礎データを、各建築部材の部材識別子14とともに前記レコード毎に記録してなる部材データファイル8を作成するセル情報解析手段13を具備するものである。
前記基礎情報登録手段9は、編集手段16と移動・複製手段17とで構成される。前記編集手段16は、前記CAD装置の編集機能をマウスやキーボード等の入力装置の操作による制御指令をもって稼働させ、線及びテキスト、並びにそれらの表示位置及び表示形態といった線画を描く最低限の表示データを含んだDXFファイルからなる画像データファイル2を作成する。一方、前記移動・複製手段17は、前記CAD装置のデータ読込機能を前記入力装置の操作による制御指令をもって稼働させ、各種記録媒体から前記DXFファイルからなる既存の画像データファイル2を読み出し記憶手段15にデータベースとして保存するものである。
4 基点キーワード,5 ラベルキーワード,
6 セル,6a ラベルセル,6T 始端セル,6L 終端セル,
7 セル分類マーク,8 部材データファイル,
9 基礎情報登録手段,10 画像表示手段,
11 領域指定手段,12 セル解析手段,13 セル情報解析手段,
14 部材識別子,15 記憶手段,
16 編集手段,17 移動・複製手段,
18 一覧ブロック,19 キーワードデータベース,
Claims (3)
- 建築部材の識別符号及び詳細情報が組となった複数のレコード(1)をマトリクス状に配列した画像をディスプレイ画面に出力する為の線及びテキストの表示データからなる画像データファイル(2)をコンピュータに保存する基礎情報登録ステップと、
前記画像データファイル(2)に記録された表示データを画像化して前記コンピュータのディスプレイ画面に出力する画像表示ステップと、
前記ディスプレイ画面の画像上に解析領域(3)を設定し当該解析領域(3)に含まれる線及びテキストの表示データを前記画像データファイル(2)から抽出してコンピュータに保存する領域指定ステップと、
前記解析領域(3)に含まれるテキストの表示データから基点キーワード(4)を検出しコンピュータに保存する基点検出ステップと、
前記基点キーワード(4)の配置位置を基点として前記解析領域(3)に含まれる線の表示データから罫線を検出しそれらの線の表示データをコンピュータに保存するセル分布解析ステップと、
前記罫線で仕切られた各セル(6)に表示されたテキストのデータからラベルキーワード(5)を検出すると共に、前記罫線で仕切られた各セル(6)に対し、当該セル(6)に表示する情報内容を定義する為のセル分類マーク(7)を前記ラベルキーワード(5)の配置に基づいて与え、当該セル分類マーク(7)の分布情報をコンピュータに保存するセル情報定義ステップと、
前記ラベルキーワード(5)の配置に基づき罫線で仕切られたセル(6)群をレコード(1)単位で区分けすると共に、当該区分け情報をコンピュータに保存するレコード分布解析ステップと、
前記セル(6)に表示された線又はテキストの表示データを前記セル分類マーク(7)に基づいて解析し、当該解析結果である線及びテキストの基礎データを、各部材の識別子とともに前記レコード(1)毎にコンピュータに保存し部材データファイル(8)を作成するセル情報解析ステップと、
をコンピュータにより行うレコード抽出方法。 - コンピュータで構成された、
建築部材の識別符号及び詳細情報が組となった複数のレコード(1)をマトリクス状に配列した画像をディスプレイ画面に出力する為の線及びテキストの表示データからなる画像データファイル(2)を取り入れる基礎情報登録手段(9)、
前記画像データファイル(2)に記録された表示データを画像化して前記コンピュータのディスプレイ画面に出力する画像表示手段(10)、
前記ディスプレイ画面の画像上に解析領域(3)を設定し当該解析領域(3)に含まれる線及びテキストの表示データを前記画像データファイル(2)から抽出する領域指定手段(11)、
前記解析領域(3)に含まれるテキストの表示データから基点キーワード(4)を検出し、前記基点キーワード(4)の配置位置を基点として前記解析領域(3)に含まれる線の表示データから罫線を検出し、前記罫線で仕切られた各セル(6)に表示されたテキストのデータからラベルキーワード(5)を検出すると共に、前記罫線で仕切られた各セル(6)に対し、当該セル(6)に表示する情報内容を定義する為のセル分類マーク(7)を前記ラベルキーワード(5)の配置に基づいて与え、前記ラベルキーワード(5)の配置に基づき罫線で仕切られたセル(6)群をレコード(1)単位で区分けするセル解析手段(12)、及び
前記セル(6)に表示された線又はテキストの表示データを前記セル分類マーク(7)に基づいて解析し、当該解析結果である線及びテキストの基礎データを、各部材の識別子とともに前記レコード(1)毎に記録してなる部材データファイル(8)を作成するセル情報解析手段(13)、
を具備するレコード抽出装置。 - コンピュータに、
建築部材の識別符号及び詳細情報が組となった複数のレコード(1)をマトリクス状に配列した画像をディスプレイ画面に出力する為の線及びテキストの表示データからなる画像データファイル(2)を取り入れる基礎情報登録手段(9)、
前記画像データファイル(2)に記録された表示データを画像化して前記コンピュータのディスプレイ画面に出力する画像表示手段(10)、
前記ディスプレイ画面の画像上に解析領域(3)を設定し当該解析領域(3)に含まれる線及びテキストの表示データを前記画像データファイル(2)から抽出する領域指定手段(11)、
前記解析領域(3)に含まれるテキストの表示データから基点キーワード(4)を検出し、前記基点キーワード(4)の配置位置を基点として前記解析領域(3)に含まれる線の表示データから罫線を検出し、前記罫線で仕切られた各セル(6)に表示されたテキストのデータからラベルキーワード(5)を検出すると共に、前記罫線で仕切られた各セル(6)に対し、当該セル(6)に表示する情報内容を定義する為のセル分類マーク(7)を前記ラベルキーワード(5)の配置に基づいて与え、前記ラベルキーワード(5)の配置に基づき罫線で仕切られたセル(6)群をレコード(1)単位で区分けするセル解析手段(12)、及び
前記セル(6)に表示された線又はテキストの表示データを前記セル分類マーク(7)に基づいて解析し、当該解析結果である線及びテキストの基礎データを、各部材の識別子とともに前記レコード(1)毎に記録してなる部材データファイル(8)を作成するセル情報解析手段(13)、
として機能させるレコード抽出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003418914A JP3878174B2 (ja) | 2003-12-17 | 2003-12-17 | レコード抽出方法、レコード抽出装置、及びレコード抽出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003418914A JP3878174B2 (ja) | 2003-12-17 | 2003-12-17 | レコード抽出方法、レコード抽出装置、及びレコード抽出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005182224A JP2005182224A (ja) | 2005-07-07 |
JP3878174B2 true JP3878174B2 (ja) | 2007-02-07 |
Family
ID=34780966
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003418914A Expired - Lifetime JP3878174B2 (ja) | 2003-12-17 | 2003-12-17 | レコード抽出方法、レコード抽出装置、及びレコード抽出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3878174B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7268115B1 (ja) | 2021-11-09 | 2023-05-02 | 西松建設株式会社 | 配筋リスト読取装置、リスト読取装置、配筋リスト読取方法及びプログラム |
-
2003
- 2003-12-17 JP JP2003418914A patent/JP3878174B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2005182224A (ja) | 2005-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3425408B2 (ja) | 文書読取装置 | |
US7149347B1 (en) | Machine learning of document templates for data extraction | |
US7561734B1 (en) | Machine learning of document templates for data extraction | |
JP5134628B2 (ja) | 連続する記事部分の媒体資料解析 | |
US9811193B2 (en) | Text entry for electronic devices | |
CN101676838B (zh) | 输入装置 | |
JP5665125B2 (ja) | 画像処理方法、及び、画像処理システム | |
US20140324904A1 (en) | Similar design structure search device and similar design structure search method | |
JPS61267177A (ja) | 文書画像追加情報の蓄積方法 | |
CN103198502A (zh) | 数字漫画编辑器及方法 | |
JP4588037B2 (ja) | ドキュメントの整合性検査支援システムおよび方法、ならびにそのプログラム | |
CN115828874A (zh) | 基于图像识别技术的行业表格数字化处理方法 | |
JP2012190434A (ja) | 帳票定義装置、帳票定義方法、プログラム及び記録媒体 | |
JP2005216203A (ja) | 表フォーマットデータ処理方法並びに表フォーマットデータ処理装置 | |
JP5446877B2 (ja) | 目次構造特定装置 | |
US6421461B1 (en) | Pattern recognition apparatus which compares input pattern feature and size data to registered feature and size pattern data, an apparatus for registering feature and size data, and corresponding methods and memory media therefor | |
JP2008108114A (ja) | 文書処理装置および文書処理方法 | |
JP3878174B2 (ja) | レコード抽出方法、レコード抽出装置、及びレコード抽出プログラム | |
JP3922396B2 (ja) | レイアウト装置および表示装置 | |
JP3878173B2 (ja) | 図面作成方法、図面作成装置、及び図面作成プログラム | |
JP2695784B2 (ja) | 文章を検索・表示する方法 | |
JP4256841B2 (ja) | 情報処理装置、情報処理方法、情報処理プログラム | |
KR102642259B1 (ko) | Ai 학습용 데이터 가공 장치 | |
JPH0689330A (ja) | 画像ファイリングシステム | |
JP4734551B2 (ja) | 表フォーマットデータ処理方法並びに表フォーマットデータ処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061017 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061101 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3878174 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151110 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |