JPH0696274A - 文字等の認識方法 - Google Patents

文字等の認識方法

Info

Publication number
JPH0696274A
JPH0696274A JP3244446A JP24444691A JPH0696274A JP H0696274 A JPH0696274 A JP H0696274A JP 3244446 A JP3244446 A JP 3244446A JP 24444691 A JP24444691 A JP 24444691A JP H0696274 A JPH0696274 A JP H0696274A
Authority
JP
Japan
Prior art keywords
image data
vector
character
partial area
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3244446A
Other languages
English (en)
Inventor
Osamu Shimomura
修 下村
Shusuke Sakai
秀典 酒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Nippon Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp filed Critical Nippon Steel Corp
Priority to JP3244446A priority Critical patent/JPH0696274A/ja
Publication of JPH0696274A publication Critical patent/JPH0696274A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 〔目的〕図面や文書の自動認識において、寸法線や外形
線などの図形要素に接触したり重なったりしている文字
や記号を高精度で認識できる文字等の認識方法を提供す
る。 〔構成〕図面や文書を電子的に走査して(ステップA)
得られる画像データのうち認識対象の文字や記号が存在
する部分領域を指定し(ステップB)、必要に応じてこ
の部分領域の画像データのコピーを作成し(ステップ
C)、この画像データからベクトルデータを作成し(ス
テップD)、より長いベクトルデータを生成するロング
ベクトル化処理を行い(ステップE)、上記部分領域内
のベクトル群のうち所定長以上のベクトルを文字や記号
以外のベクトルと見做して抽出し(ステップF,G)、
これに一定幅を与えた矩形領域内の画像データをこの部
分領域内の画像データから削除し(ステップH)、残っ
た文字や記号を適宜なアルゴリズムに基づき認識する
(ステップI)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、図面自動認識システム
などに利用される文字等の認識方法に関するものであ
り、特に、寸法線や寸法補助線あるいは外形線等に接触
した文字を高い確度で認識できる文字等の認識方法に関
するものである。
【0002】
【従来の技術】図面や表を含む文書中の文字の自動認識
を行なう場合は、図14に示すように図面や文書1をイ
メージスキャナ2で電子的に走査して画像データとして
認識のための処理装置3に取り込み、この画像データに
対して図15に示すような内容の処理を行うことによ
り、文字に相当する画像データをそれ以外の画像データ
から分離抽出した上で任意の文字認識アルゴリズムによ
り認識を行う方法が一般的である。
【0003】図面における文字認識については、198
7年 電子情報通信学会パターン認識理解研究会で発表
された「機械部品図面自動入力システムの開発」(PR
U87ー23、PP51ー58)と題する岩崎氏らの論
文に記載されたように、図面全体の画像データを個々の
連結成分(オブジェクト)毎にその大きさ、例えばオブ
ジェクトに外接する長方形の高さと幅で分類し、認識対
象となる文字の最大の大きさ以下のオブジェクトについ
てのみ文字認識処理を行う方法がある。
【0004】一方、表を含む文書における文字認識につ
いては、1990年 電子情報通信学会パターン認識理
解研究会で発表された「表の構造理解のための枠線抽出
と領域分け」(PRU90ー73、PP33ー)と題す
る田畑氏らの論文に記載されたように、文書の水平方向
と垂直方向のそれぞれの画像データのヒストグラムを作
成してそのヒストグラムのピークに相当する画像データ
を削除して水平線や垂直線を分離することにより文字の
画像データを抽出する方法がある。
【0005】
【発明が解決しようとする課題】上記従来技術に係わる
第1の方法では、文字の画像データが図面の作成者の不
注意やその後の取扱上の汚れ等で文字以外の図形要素、
例えば寸法線などに接触したり重なったりしている場合
には背景の図形から文字に相当するオブジェクトを分離
抽出することが困難になるという問題がある。また、上
記従来技術に係わる第2の方法では、文字の位置が上下
左右に一定の規則を有している場合には有効であるが、
背景の図形を構成する線分が複雑に重なり合っており、
かつ文字が任意の位置に任意の傾きで記入されている図
面中の接触文字の抽出には適用できないという問題があ
る。そこで、本発明は、文字周辺の画像データの中から
文字以外の要素の画像データを削除することにより、寸
法線や寸法補助線あるいは外形線等に接触したり重なっ
たりしている任意の位置の任意の傾きを有する文字の画
像データを抽出したうえで文字認識を行う方法を提供す
ることを目的とする。
【0006】
【課題を解決するための手段】本発明に係わる文字等の
認識方法は、図面や文書を電子的に走査して得られる画
像データ中の認識対象の文字や記号が存在する部分領域
を指定し、画像データからベクトルデータを作成し、こ
のベクトルデータに含まれるベクトル群のうち端点が重
なるか近接しかつ傾きの差が所定のしきい値より小さな
対を両者のベクトルの和に相当する長いベクトルに置換
し更にこの長いベクトルを含む同様な対を一層長いベク
トルに変換して行くロングベクトル化処理を行い、この
ロングベクトル化処理によって得られたベクトル群から
上記部分領域内に全部又は一部が存在しかつ所定値以上
の長さを有するベクトルを抽出しこれに一定幅を与えた
矩形領域内の画像データをこの部分領域の画像データか
ら削除し、この削除を免れた部分領域内の画像データを
適宜な文字や記号の認識アルゴリズムを用いて処理する
ことにより、寸法線や寸法補助線あるいは外形線等に接
触した文字又は記号の認識を行うように構成されてい
る。
【0007】
【作用】画像データ全体をロングベクトル化処理して得
られるベクトル群のうち所定値以上の長さを有するもの
は、寸法線や寸法補助線あるいは外形線などの図形要素
である蓋然性が高い。そこで、このような長いベクトル
のうち部分領域内に全部又は一部が存在するものを文字
や記号以外の図形要素と見做してこの部分領域内の対応
の画像データを削除すれば、この部分領域内には文字や
記号などの画像データだけが残されることになる。この
ような残された画像データについて適宜なアルゴリズム
を用いて認識を行うことにより、寸法線や寸法補助線あ
るいは外形線等に接触した文字又は記号の認識が可能に
なる。
【0008】
【実施例】図1は本発明の一実施に係わる接触文字の認
識方法の処理の流れを示すフローチャートであり、図3
はこの実施例を適用する図面自動認識システムの構成を
示すブロック図である。更に、図4乃至図12は図1の
フローチャートの個々の処理ステップの内容を補足して
説明するための概念図である。
【0009】まず、イメージスキャナ2を用いて図面1
を走査し、得られた2値の画像データを画像処理装置4
のメモリ上に記憶する(ステップA)。次に、ワークス
テーション5のディスプレイ装置5bに画像データを表
示し、図4に示すように、認識対象の文字や文字列を含
む部分領域6をマウス等のポインティングデバイス5d
を使って例えば矩形枠で囲むことによって指定し、あわ
せてこの部分領域6内の文字の傾きを示すパラメータθ
を入力する(ステップB)。この部分領域の設定を図面
全体の画像データの複数個所について繰り返し、更に、
必要に応じて認識対象の文字の最大の大きさを示すパラ
メータ、例えば文字の高さと幅を入力する。
【0010】次に、図5に示すように、上述のようにし
て設定された画像データ中の部分領域6のコピーをメモ
リ上の空き領域に作成し、同時に部分領域6の位置と範
囲とを示すパラメータ、例えば矩形枠の基準点Pの座標
値と高さHと幅Wとを記憶する(ステップC)。引き続
き、図6に例示するように、全体の画像データについ
て、文字に相当するオブジェクトを含む個々のオブジェ
クトを、これらを構成する線分の交差部や分岐部あるい
は屈曲部で分割しつつ適宜なベクトル化アルゴリズムを
用いてベクトル化するというショートベクトル化を行い
(ステップD)、図7に例示するような結果を得る。こ
のショートベクトル化の結果に対し、更に、図8に例示
するように、端点が接する2つのショートベクトルの傾
きの差(α)が所定のしきい値(φ)以下であればその
2つのベクトルの接していない方の端点同士を結んだベ
クトルと置き換えてより長いベクトルに変換するという
ロングベクトル化を行い(ステップE)、図9に例示す
るようなデータを得る。
【0011】ロングベクトル化を行ったデータ(図9)
の中から、図10に例示するように、予め画像データの
コピーを作成した部分領域6内に全部又は一部が存在す
るベクトル群をその位置情報に基づき抽出(切出し)す
る(ステップF)。このようにして切出したベクトル群
のうち所定の長さを超えるベクトル7を文字の構成要素
以外のベクトルと見做して抽出する(ステップG)。続
いて、図11に例示するように、抽出済みのベクトル7
に図面中の線幅より僅かに大きな幅w1を与えて得られ
る細長い矩形状の領域8内に含まれる画像データを、部
分領域6内の画像データから削除する(ステップH)こ
とにより、図12に例示するように、文字に相当するオ
ブジェクトの画像データのみを残す。得られた個々の画
像データに対し適宜な文字認識アルゴリズムを用いて文
字の認識処理を行う(ステップI)。
【0012】図2は、本発明の他の実施に係わる接触文
字の認識方法の処理の流れを示すフローチャートであ
る。図1の処理との相違点は、文字以外のベクトル7に
相当する領域8内の画像データを削除した際に本来文字
の一部である画像データも削除されてしまうという不具
合に対する救済処理を図1の処理に付加した点である。
【0013】すなわち、文字以外のベクトル7に相当す
る画像データを削除した文字だけのオブジェクトを含む
画像データ(図12)に含まれる個々の文字の画像デー
タに外接する矩形9を求め、図13に例示するように、
それぞれの底辺に接しこれらの底辺の長さに等しい長さ
と任意の幅w2とを有する線分の画像データ10を補完
することにより、画像データを作成し(ステップJ)、
この補完後のデータを、図12に例示したような補完前
の画像データとあわせて文字認識アルゴリズムにより認
識し(ステップK)、二つの認識結果のうち認識結果の
確からしさを表わす数値の大なる方を最終的な文字の認
識結果とする(ステップL)。
【0014】以上、図面等を電子的に走査して得られる
2値の画像データに含まれる文字や記号を外形線などの
図形要素から分離して認識する方法について説明した。
しかしながら、文字等の認識を目的とせず単に図形要素
と文字等の分離の方法として本発明の前段部分を利用す
ることもできる。
【0015】また、図面等を走査して得られる2値の画
像データに本発明を適用する例を説明した。しかしなが
ら、濃淡の階調を3値以上の多値で表す画像データやカ
ラーの画像データなどについても適宜なしきいを定めて
2値化することにより本発明を適用できる。
【0016】さらに、画像データ中の認識対象の文字や
記号が存在する部分領域を指定して予めコピーを作成し
ておく方法を例示した。しかしながら、ベクトル化処理
後も原画像データを残しておくような場合には部分領域
を指定しておくだけに留めてコピーの作成を後で行う構
成としもよい。あるいはまた、原画像データから作成し
たベクトルデータに一定の太さを与えることにより原画
像データに近いものを復元することもできるので、コピ
ーの代わりにそのような復元した画像データを使用する
構成としてもよい。
【0017】
【発明の効果】以上詳細に説明したように、本発明を図
面自動入力システムにおける文字や記号の認識方法とし
て付加することにより、図面中の図形要素と接触したり
重なったりした文字や記号について高確度の自動認識が
可能となり、認識結果に対し人手を介入させて行う修正
作業などの効率が向上する。
【0018】すなわち、本発明に係わる文字等の認識方
法を図面自動入力装置の機能の一部として組み込み、実
際の図面中の寸法線等に接触した文字の認識に適用した
場合の次のような有効な結果が得られた。図3に示す構
成の装置で、イメージスキャナの読み取りの解像度は4
00ドット/インチ、画像処理装置のメモリ容量は16
メガバイト、ワークステーションにはパーソナルコンピ
ュータを使用した。ベクトル化のアルゴリズムとしては
距離変換・骨格抽出に基づく手法を用い、文字認識のア
ルゴリズムには4方向指数加重ヒストグラム法を用い
た。また、認識の対象となる文字の最大の大きさは高さ
10mm幅8mm、ショートベクトルの接続条件として
の傾きのしきい値は±5度、文字以外のベクトルを抽出
するための長さのしきい値は10mm、部分領域から削
除するベクトルの幅は0.8mm、文字に対して補完す
る線分の幅は0.5mmとした。更に、文字認識結果の
確からしさを表わす数値としては上記文字認識アルゴリ
ズムの中で計算される多次元特徴空間における距離パラ
メータの逆数を使用した。図面中、寸法線や外形線等の
文字以外の図形に接触あるいは重なった文字の数は52
個で、本発明によるとこれらの全てが抽出可能で、更に
正しく認識できた文字の数は線分の補完を行わない場合
において29個、また線分の補完を行なった場合におい
て41個であった。
【図面の簡単な説明】
【図1】本発明の一実施例に係わる文字等の認識方法の
処理手順を示すフローチャートである。
【図2】本発明の他の実施例に係わる文字等の認識方法
の処理手順を示すフローチャートである。
【図3】上記本発明の実施例を適用する図面の自動認識
システムの構成の一例を示すブロック図である。
【図4】画像データ中の文字を含む部分領域を説明する
概念図である。
【図5】部分領域の画像データのコピーを例示する概念
図である。
【図6】ショートベクトル化の方法を説明する概念図で
ある。
【図7】ショートベクトル化の結果を例示する概念図で
ある。
【図8】ロングベクトル化の方法を説明する概念図であ
る。
【図9】ロングベクトル化の結果を例示する概念図であ
る。
【図10】部分領域に相当するベクトル群を示す概念図
である。
【図11】部分領域の画像データから文字以外の画像デ
ータを削除する方法を説明する概念図である。
【図12】文字だけの画像データを示す概念図である。
【図13】文字の画像データに対して線分を補完する方
法を説明する概念図である。
【図14】図面の自動認識システムの一般的な構成を示
すブロック図である。
【図15】図14のシステムによる従来の処理の内容を
例示するフローチャートである。
【符号の説明】
1 図面あるいは文書 2 イメージスキャナ 3 処理装置 4 画像処理装置 5 ワークステーション 5a ワークステーション本体 5b ディスプレイ装置 5c キーボード 5d ポインティングデバイス 6 文字を含む部分領域 7 文字以外のベクトル 8 文字以外の画像データの削除範囲 9 文字の画像データに外接する長方形 10 文字の画像データに補完する線分の画像データ

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】図面又は文書を電子的に走査して得られる
    画像データについて図形要素のベクトル化と文字又は記
    号の認識を行う図面自動認識方法において、 前記画像データ中の認識対象の文字又は記号が存在する
    部分領域を指定し、 前記画像データからベクトルデータを作成し、 このベクトルデータに含まれるベクトル群のうち端点が
    重なるか近接しかつ傾きの差が所定のしきい値より小さ
    な対を両者のベクトルの和に相当する長いベクトルに置
    換し更にこの長いベクトルを含む同様な対を一層長いベ
    クトルに変換して行く処理を反復し、 この処理によって得られたベクトル群から前記部分領域
    内に全部又は一部が存在しかつ所定値以上の長さを有す
    るベクトルを抽出しこれに一定幅を与えた矩形領域内の
    画像データをこの部分領域の画像データから削除し、 この削除を免れた部分領域内の画像データを適宜な文字
    又は記号の認識アルゴリズムを用いて処理することによ
    り、寸法線や寸法補助線あるいは外形線等に接触した文
    字又は記号の認識を行うことを特徴とする文字等の認識
    方法。
  2. 【請求項2】前記削除を免れた画像データに対しこれに
    外接する矩形状の底辺に接しかつこの底辺にほぼ等しい
    長さと一定の幅とを有する線分の画像データを補完した
    画像データを作成して文字の認識を行い、 前記線分を補完する前と補完した後の画像データについ
    ての認識結果のうち確からしさを表す数値が大きな方の
    結果を最終的な文字の認識結果とすることを特徴とする
    請求項1記載の文字等の認識方法。
  3. 【請求項3】図面又は文書を電子的に走査して得られる
    画像データ中で文字又は記号が存在する部分領域を指定
    し、 前記画像データからベクトルデータを作成し、 このベクトル化データに含まれるベクトル群のうち端点
    が重なるか近接しかつ傾きの差が所定のしきい値より小
    さな対を両者のベクトルの和に相当する長いベクトルに
    置換し更にこの長いベクトルを含む同様な対を一層長い
    ベクトルに変換して行く処理を反復し、 この処理によって得られたベクトル群から前記部分領域
    内に全部又は一部が存在しかつ所定値以上の長さを有す
    るベクトルを抽出し、この部分領域内の他のベクトルと
    分離することを特徴とする図形要素と文字等の分離方
    法。
JP3244446A 1991-08-29 1991-08-29 文字等の認識方法 Withdrawn JPH0696274A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3244446A JPH0696274A (ja) 1991-08-29 1991-08-29 文字等の認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3244446A JPH0696274A (ja) 1991-08-29 1991-08-29 文字等の認識方法

Publications (1)

Publication Number Publication Date
JPH0696274A true JPH0696274A (ja) 1994-04-08

Family

ID=17118777

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3244446A Withdrawn JPH0696274A (ja) 1991-08-29 1991-08-29 文字等の認識方法

Country Status (1)

Country Link
JP (1) JPH0696274A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011054064A (ja) * 2009-09-03 2011-03-17 Ricoh Co Ltd 画像処理装置、画像処理方法及びプログラム
US8542931B2 (en) 2009-02-05 2013-09-24 Fuji Xerox Co., Ltd. Ruled line extraction technique based on comparision results and indentifying noise based on line thickness

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8542931B2 (en) 2009-02-05 2013-09-24 Fuji Xerox Co., Ltd. Ruled line extraction technique based on comparision results and indentifying noise based on line thickness
JP2011054064A (ja) * 2009-09-03 2011-03-17 Ricoh Co Ltd 画像処理装置、画像処理方法及びプログラム

Similar Documents

Publication Publication Date Title
US5048099A (en) Polygon-based method for automatic extraction of selected text in a digitized document
US5335290A (en) Segmentation of text, picture and lines of a document image
EP0434930B1 (en) Editing text in an image
JP3805005B2 (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
Wong et al. Document analysis system
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
US5410611A (en) Method for identifying word bounding boxes in text
US6711292B2 (en) Block selection of table features
US6947596B2 (en) Character recognition method, program and recording medium
JP2006227824A (ja) 図面認識方法および装置
US7336825B2 (en) Segmenting a composite image via minimum areas
JPH0696274A (ja) 文字等の認識方法
US10572751B2 (en) Conversion of mechanical markings on a hardcopy document into machine-encoded annotations
Ye et al. Document image matching and annotation lifting
US6058219A (en) Method of skeletonizing a binary image using compressed run length data
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
EP1229497A2 (en) Run length based connected components and contour following for enhancing the performance of circled region extraction algorithm
JP3586911B2 (ja) 枠線認識装置
JPH02138674A (ja) 文書処理方法及び装置
JPH0728934A (ja) 文書画像処理装置
JP2755299B2 (ja) 画像処理方法
JP3534997B2 (ja) 罫線抽出装置および方法
JP2001175858A (ja) 高速ラベリング方式
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPH08185475A (ja) 画像認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19981112