JPS6366685A - 接触文字分離装置 - Google Patents

接触文字分離装置

Info

Publication number
JPS6366685A
JPS6366685A JP61210923A JP21092386A JPS6366685A JP S6366685 A JPS6366685 A JP S6366685A JP 61210923 A JP61210923 A JP 61210923A JP 21092386 A JP21092386 A JP 21092386A JP S6366685 A JPS6366685 A JP S6366685A
Authority
JP
Japan
Prior art keywords
character
line
characters
recognition
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61210923A
Other languages
English (en)
Inventor
Mayumi Daikuya
大工谷 まゆみ
Toshiharu Hine
日根 俊治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61210923A priority Critical patent/JPS6366685A/ja
Publication of JPS6366685A publication Critical patent/JPS6366685A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、図面等をスキャナ等で読みとり、コンピュー
タシステムで処理することにより、文字や図形を認識さ
せる装置等に関するもので、線図形と任意角方向の文字
列が任意の場所に混在する図面中で、文字の一部分が線
図形に接触している場合の接触文字を線図形から分離抽
出する接触文字分離抽出装置に関するものである。
従来の技術 図面中の文字が他の図形と接触した場合に、所望の文字
だけを分離抽出する方法としては、図形の骨格線の基本
単位ごとに、それらの接続関係および幾可学的性質(長
さや外接長方形の大きさ)を基準として、必要な基本単
位を検出し、幾可学的性質だけでは検出できない複雑な
部分については、マンマシン的に基本単位を指定して検
出する方法がある(例えば、特開昭60−167072
号公報)。
発明が解決しようとする間頂点 しかしながら上記従来例では、文字と線図形が接触した
部分等の複雑な骨格線構造の部分については、マンマシ
ン的に骨格線を指定するという人的介在が必要であると
いう問題点を有していた。
本発明は上記問題点に鑑み、図面等の細線化データから
検出された線分と線分上にある接触点の情報を用い、細
線化データ上で、接触点に接続する線分の追跡を行ない
、複数の文字候補を生成したうえで、それらの文字候補
が任意方向であっても文字認識が可能な文字イメージデ
ータを生成し、生成された複数の文字イメージデータを
文字認識した後に得られた各文字候補の類似度を評価す
ることによって、複雑な接触パターンであっても、接触
する線図形から所望の文字だけを効率よく自動的に分離
抽出し認識する接触文字分離抽出装置を提供するもので
ある。
問題点を解決するための手段 上記問題点を解決するために本発明の接触文字分離抽出
装置は、文字構成要素検出部と、文字候補生成部と、文
字イメージデータ生成部と、文字認識部と、認識結果評
価部という構成を備えたものである。
線図形と文字とが混在する図面内の文字を認識する装置
において、線図形と任意角方向の文字列が混在する図面
等の細線化データから検出された線図形の一部と推定さ
れる線分と、前記線分上に存在する文字の一部と推定さ
れる線分との接触点の情報をもとに、前記細線化データ
上で、各接触点に接続する線分を追跡し、接触文字の構
成要素となる線分を検出した後、文字部分を接触線分か
ら分離し、前記文字構成要素をもとに1文字を形成する
文字構成要素の組合せを生成し、文字認識するだめに前
記文字候補の文字イメージデータを生成して文字認識し
、その認識した文字候補の中から最も適した文字を決定
するために前記文字認識の結果を比較し評価して接触文
字を分離抽出するものである。
作用        ・・ 本発明は上記した構成によって、文字構成要素検出部に
おいて、細線化データ上で接触点から接続する線分を追
跡することによって、文字構成要素を検出し、効率良く
線図形から分離する。文字候補生成部において、検出さ
れた上記各文字構成要素が1文字を形成しうるか否かを
判定し、1文字を形成するに満たない文字構成要素につ
いては他の文字構成要素と組合せることによって、複数
の文字候補を生成する。文字イメージデータ生成部にお
いて、生成された文字候補の細線化データから文字認識
に適した文字イメージデータを生成する。文字認識部に
おいて、生成された複数の文字イメージデータについて
文字認識する。認識結果評価部において、文字認識され
た結果を比較することによって、最終的に文字を決定す
る。
実施例 以下本発明の一実施例について図面を参照しながら説明
する。第1図は本発明の一実施例における接触文字分離
抽出装置のブロック図を示すものである。第1図におい
て、1は線図形と任意角方向の文字列が混在する図面等
の組線化データから検出された線分と線分上に存在する
接触点の情報をもとに、細線化データ上で各接触点に接
続する線分を追跡し、接触文字の構成要素となる線分を
検出した後、文字部分を接触線図形から分離する文字構
成要素検出部を示す。2は文字構成要素をもとに1文字
を形成する文字構成要素の組合せを生成する文字候補生
成部を示す。3は文字認識するために文字候補の文字イ
メージデータを生成する文字イメージデータ生成部を示
す。4は文字イメージデータについて文字認識する文字
認識部を示す。5は文字候補の中から最も適した文字を
決定するだめに文字認識の結果を比較し評価する認識結
果評価部を示す。
第2図は本発明の一実施例における接触文字分離抽出装
置の処理の流れを示すものである。第2図において、A
、B、l:jは接触点、1〜mは線分の最小単位となる
要素を示し、特に、:l”mは線図形の一部分を構成す
る線分要素である。α、β。
γ、/L、λは文字構成要素集合を示す。
以下第1図、第2図を用いてその動作を説明する。まず
、文字構成要素検出部1では、線図形を構成する線分要
素の情報および接触点の情報をもとにして、各接触点か
ら接続する線図形以外の線分要素を順次追跡することに
よって、文字部分を線図形から分離する。すなわち、第
2図(1)の接触点ムに接続する線分要素のうち、まず
、線図形の構成要素でない線分要素Oを検出し、次に線
分要素θに連続する線分要素を順次追跡することによっ
て、接触点Aに接続する文字構成要素の集合α” (’
 + b+’ + d+’ )を検出する。
接触点B、Cについても接触点ムと同様に行ない、それ
ぞれ文字構成要素の集合 β=(f)。
γ=(g、h、1)を検出する(第2図(11))。文
字候補生成部2では、上記集合α、β、γの中から、ま
ず、集合内の要素の数および長さをもとにして、単集合
で1文字を形成しつる集合α、rを検出する。集合α、
γは単独で文字候補になる。
次に1文字を形成できないと判定された接触点Bに関す
る集合βについては、接触点Bと一定距離内に@接する
接触点ムとCに関すS集合α、γのそれぞれと統合し、
接触点間の線分要素を加えることによって、あらたな文
字候補となる集合μ=(a、b、C2d、e、f、k) λ=(f+g* h* 1+1) を作成する(第2図(iiD )。文字イメージデータ
生成部3では、上記4個の文字候補の細線化データそれ
ぞれについて、細線化データの周囲の白画素を1画素な
いし2画素程度黒画素に変えることによって、細線化デ
ータを均一に太らせたイメージデータを生成する(第2
図4V))。文字認識部6では、生成した複数のイメー
ジデータについて例えば、辞書とのパターンマツチング
の方法により文字認識する。認識結果評価部6では、文
字認識結果において、集合αとμおよび集合γとλのそ
れぞれの文字認識結果を比較して最も適した分離抽出文
字を選択する。すなわち、第2図怜における■と■およ
び■と■の各々において、一方の■と■では、文字認識
の結果、■のほうが文字「4」に近いと判断して集合μ
を棄却し、他方の■と■では、■のほうが文字「6」に
近いと判断して集合γを棄却する。以上より、集合αと
λの文字候補を分離抽出文字と決定する。
以上のように本実施例によれば、文字構成要素する線図
形から効率的に分離することができる。
また、文字候補生成部を設けることによって、1文字に
つき2ケ所以上で線図形と接触する場合についても、予
想される文字候補を生成することができる。文字イメー
ジデータ生成部を設けることによって、分離抽出しだ細
線化データから、文字が任意方向であっても文字認識で
きる文字イメージデータを生成することができる。さら
に文字認識部と認識結果評価部を設けることによって、
認識結果を評価し、文字候補の中から最終的に最も適し
た文字を選択することができる。
なお、本実施例において、第2図(1)r 5 Jのよ
うに1文字につき2個の接融点をもち、かつそれぞれの
接触点から接続している線分要素が同一の線分につなが
っているパターンの文字を説明に用いなかったが、これ
らの文字が線図形と接触してもよい。また、文字認識部
においては、如何なる文字認識手法を用いてもよい。
発明の効果 以上のように本発明は、細線化データ上で文字構成要素
を検出することによって、接触する線図形から文字だけ
を効率的に分離抽出することができ、複数の文字候補を
生成した後、文字認識に適したイメージデータを生成し
て文字認識し、文字認識結果を比較することによって、
自動的に認識率の高い接触文字分離抽出を実現できる。
【図面の簡単な説明】
第1図は本発明の一実施例における接触文字分離抽出装
置の全体ブロック構成図、第2図は同装置の接触文字分
離抽出の流れを説明するパターン図である。 1・・・・・・文字構成・要素検出部、2・・自・・文
字候補生成部、3・・・・・・文字イメージデータ生成
部、4・・・・・・文字認識部、6・・・・・・認識結
果評価部。 代理人の氏名 弁理士 中 尾 敏 男 はが1名第1
図 接触文字勿1匪抽出 第2図 点御灸←十−舞鋳dしデーグ

Claims (1)

    【特許請求の範囲】
  1. 線図形と任意方向の文字列が混在する図面等の細線化デ
    ータから、前記線図形の一部と推定される線分と、その
    線分上に存在する文字の一部と推定される線分とを検出
    する手段と、前記線図形の一部と推定される線分と前記
    文字の一部と推定される線分とで前記細線化データ上に
    おいて各接触点に接続する線分を追跡し、接触文字の構
    成要素となる線分を検出して文字部分を接触線分から分
    離する文字構成要素検出手段と、前記文字構成要素をも
    とに1文字を形成する文字構成要素の組合せを生成する
    文字候補生成手段と、前記文字候補の文字イメージデー
    タを生成する手段と、前記文字イメージデータについて
    の文字を認識する文字候補認識手段と、前記認識された
    文字候補を評価して最適の文字を決定する文字認識結果
    評価手段を具備する接触文字分離装置。
JP61210923A 1986-09-08 1986-09-08 接触文字分離装置 Pending JPS6366685A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61210923A JPS6366685A (ja) 1986-09-08 1986-09-08 接触文字分離装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61210923A JPS6366685A (ja) 1986-09-08 1986-09-08 接触文字分離装置

Publications (1)

Publication Number Publication Date
JPS6366685A true JPS6366685A (ja) 1988-03-25

Family

ID=16597311

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61210923A Pending JPS6366685A (ja) 1986-09-08 1986-09-08 接触文字分離装置

Country Status (1)

Country Link
JP (1) JPS6366685A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002074269A (ja) * 2000-08-28 2002-03-15 Nippon Digital Kenkyusho:Kk 文字認識方法
JP2009259291A (ja) * 2000-11-01 2009-11-05 Fujitsu Ltd 文字認識方法,プログラム及び記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002074269A (ja) * 2000-08-28 2002-03-15 Nippon Digital Kenkyusho:Kk 文字認識方法
JP4580520B2 (ja) * 2000-08-28 2010-11-17 株式会社日本デジタル研究所 文字認識方法および文字認識装置
JP2009259291A (ja) * 2000-11-01 2009-11-05 Fujitsu Ltd 文字認識方法,プログラム及び記録媒体

Similar Documents

Publication Publication Date Title
Wang et al. Optical recognition of handwritten Chinese characters by hierarchical radical matching method
Santosh et al. Overlaid arrow detection for labeling regions of interest in biomedical images
JPS60217477A (ja) 手書き文字認識装置
Lerner et al. A classification-driven partially occluded object segmentation (CPOOS) method with application to chromosome analysis
CN113486752A (zh) 基于心电信号的情感识别方法及系统
Mitchell et al. A model-based computer vision system for recognizing handwritten ZIP codes
Sanjrani et al. Handwritten optical character recognition system for Sindhi numerals
JPS6366685A (ja) 接触文字分離装置
JPH0520794B2 (ja)
RU2340941C2 (ru) Способ оценки сходства образцов почерка и способы верификации личности и идентификации почерка с использованием данного способа оценки
JPS6172374A (ja) 文字認識装置
KR102673900B1 (ko) 표 데이터 추출 시스템 및 그 방법
JP2623559B2 (ja) 光学式文字読取装置
Wang et al. A new hierarchical approach for recognition of unconstrained handwritten numerals
JP2722549B2 (ja) 光学文字読取装置
JPH01181177A (ja) 文字検出切出装置
CN108319883B (zh) 一种基于快速独立分量分析的指纹识别方法
JPS6334682A (ja) 文字認識装置
JPH03160585A (ja) 文字認識方法
Raees et al. Continuous number signs recognition
JPS61220081A (ja) パタ−ン切り出し及び認識方式
Babczyński et al. Direct Tensor Voting in line segmentation of handwritten documents
JPH0658689B2 (ja) 線図形分離装置
JPH0586585B2 (ja)
JPH081660B2 (ja) オンライン手書き図形認識装置