JPS59197971A - 文字切出し装置 - Google Patents

文字切出し装置

Info

Publication number
JPS59197971A
JPS59197971A JP58070911A JP7091183A JPS59197971A JP S59197971 A JPS59197971 A JP S59197971A JP 58070911 A JP58070911 A JP 58070911A JP 7091183 A JP7091183 A JP 7091183A JP S59197971 A JPS59197971 A JP S59197971A
Authority
JP
Japan
Prior art keywords
character
characters
cutting
signal line
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58070911A
Other languages
English (en)
Other versions
JPH0514952B2 (ja
Inventor
Teruo Akiyama
秋山 照雄
Seiichiro Naito
内藤 誠一郎
Isao Masuda
功 増田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP58070911A priority Critical patent/JPS59197971A/ja
Publication of JPS59197971A publication Critical patent/JPS59197971A/ja
Publication of JPH0514952B2 publication Critical patent/JPH0514952B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (発明の属する分!l!T) 本発明は文書上の文字を直接機械で読み取るOCR(0
ptical Character Recognit
ion )装置において、はぼ一定のピッチで並んだ文
字の他に、通常の文字の半分程度のピンチしか持たない
英数字、配列等が連続して含まれている文字列からも個
々の文字、記号等を効率良く切出すことの出来る文字切
出し装置に関するものである。
(従来の技術) 従来の方法では、文字列中に通常文字ピッチの半分程度
のピッチを持つ英数字、記号等が連続して出現した場合
、これらの英数字、記号を幾つかまとめて一つの文字と
して切出してし甘うだめ、切出し処理が正常に行なわれ
ないという欠点があった。また、文字認識装置からの情
報を用い、すジェノ1となった文字の切出し処理を改め
て行う手法も考えられているが、その手法では全ての文
字に対して認識処Jljを行なうため、認識用辞書の容
量が大きぐなったり、或いは、文字切出し装置としてシ
ステム全体が大きなものとなるという欠点があった。
(発明の目的) 本発明はこれらの欠点を解決するだめに英数字、記号舌
、通常の文字とは異なるピンチを持つもの又は異なるピ
ンチを持つものと分離文字とのみの認識用辞胚を用怠1
2、一度文字として切出された図形の中で、その図形が
複数個の部分図形に分離出来るもののみを抽出して個々
の部分図形に認識処理を加え、リジェクトされるが否か
を判定し、その結果によって文字として切出した図形が
複数個の英数字、記号性1fC分離出来るか否かを判定
するようにしたものである。
(発明の構成および作用) 第1図は本発明の一実施例の構成を示すブロック図であ
り、1は交会画像から抽出された文字列の画像データを
信号線aを用いて読み込み記憶しておく文字列画像デー
ク記憶装置、2は信号線2を用いて入力された推定ピン
チをもとに文字列画像データ記憶装置1に記憶された文
字列の画像データを信号線Cを用いて読み込み、文字の
1次切出しを行なう文字1次切出し装置、3は文字1次
切出し装置2かも信号線dを用いて入力された文字1次
切出し結果をもとに、文字列画像データ記憶装置1に記
憶された文字列の画像データを信号線eを用いて読込み
、識別処理用辞書4から信号線fを通じて読込んだ標準
文字パターンを用いて必要な文字認識処理を行ない、文
字の1次切出し結果に修正を加える文字2次切出し装置
であり、その文字2次切出し結果は信号線Iを用いて出
力する。以下、それぞれの装置について説明する。
文字列画像データ記憶装置1は通常のOCR、或いは、
別途出願中の特願昭55−126845 r 2次元文
字領域抽出装置」等によって抽出された1文字列分の画
像データを記憶する画像メモリである。文字1次切出し
装置2は外部から入力された推定文字ピンチをもとに個
々の文字を切出す装置で、例えば別途出願中の特願昭5
6−74015r文字切出し装置JKよって実」、可能
でちる。ここで、推定文字ピンチは数値を直接入力して
もよいし、また・例えば漢字は縦と横の比がほぼ1であ
るという性質を利用して文字列を列方向に投影し、文字
列の幅を求めることによっても容易に推定出来る。
第2図は文字列画像配列と文字1次及び2次切出し装置
により抽出された結果の説明図であり、(1)は文字列
画像配列、(2)及び(3)は文字1次切出し装A2及
び文字2次切出し装置3の抽出結果の一例を示す。
第2図(2)で(d第2図(1)の数字II 34 I
Iと11)。1が一文字として抽出されている。本来こ
れらの文字は2つに分離して切出されるべきものである
が、個々の数字、記号が通常文字の半分程度しかなく、
しかも運伏して存在しているだめに2つの数字、記号を
纒めて切出してしまったものであり、従来のQCRでは
対応が困難なものである。逆K ”門11という文字は
矛め求めである文字推定ピッチを用いて切出しを行うこ
とによって正確に切出されている。
文字2次切出し装置3は文字1次切出し装置2の内容を
読み込んで文字として切出しだ図形が複数個の部分図形
に分離出来るものを抽出し、文字として切出しだ個々の
部分図形、又は全体図形及び個々の部分図形について認
識処理をt′:Iない、文字として切出しだ図形がその
捷1単一の文字なのか、或いは複数個の図形に分解出来
るかを判断する装置である。文字が分離しているか否か
の判断は、例えば、文字列の上下方向(横書きの場合)
、又は左右方向(縦(−きの場合)の投影を行ない、文
字−次切出し装置2で文字として抽出された[図形の中
央部に黒画素が存在しガい111分がイj−るか否かを
訳べればよい。
第2図(3)は文字2次切出し装置2によって切出され
た結果を示したもので II F II  11111
1は識別の結果リンエクトとなシ、文字1次切出し装置
2の切出し一結果の11門lがそのま1採用されている
。1だ113嘗1. II  II 、 II ) I
I、 IIollは数字、記号として認識され、文字1
次切出し装置2の結果が修正でれて別々のものとして切
出きれる。
認識処理上必要4は文字2次切出し装置3の認識処理時
に用いられる文字の標準パターンを登録しておくものて
、英数字、2七等通常の文字とはピッチが異なるものの
みの標準パターンが登録されており、このだめ辞シ容量
を極めて小さくすることが出来る。また II門11等
の分離文字の標準パターンを登録して2くことにより、
個々の部分図形たけてなく、分離文字全体の図形につい
ても認識処理を?■なうことにより精度を向」ニするこ
とも可能である3、この場合 II門II、11兆11
等、文字を構成している図形が完全に分離している文字
は少なく、この場合でも文字全体の標準パターンを持つ
よりは、はるかに少々い辞書容量でずむ。首だ認識処理
用辞書4に登録されている標準パターンは予めROM等
に書き込んでおいてもよいし、また切出しの過程で人間
との会話処理により標準パターンを学習させていっても
良い。
(効 果) 以上説明したように本装置では文字列中から文字として
切出したものの中で図形が分離しているもののみを抽出
し、分離した個々の部分図形又は個々の部分図形及び図
形全体の認識処理を行なうことにより、はぼ定ピンチで
並んている通常文字の他に通常文字の半分程度のピンチ
しかない英数字等が連続して存在している文字列からも
個々の文字を効率的に切出すことが出来、寸だ認識処理
上必要な辞Σも極めて小さなものてずむという利点があ
る。また本装置で用いた手法は一度切出した結果を修正
ずろ場合だけでなく、文字列のA1,1から文字を切出
して行く途中の過程に2いても充分応用可能であること
は明らかである0
【図面の簡単な説明】
第1図は本発明の一実施例の構成を示ずプルツク図、第
2図は文字列画像配列と、文字1次及び2次切出し装置
により抽出された結果の説明図である。 1 ・・・・・・・・・文字列画像データ記憶装置、 
2・・・・・・・・・文字1次切出し装置、 3・・・
・・・・・・文字2次切出I〜装置、 4 ・・・ 認
識処理用辞書、 a・・・・・・・・・文字列画像デー
タを転送するための信号線、2 ・・・文字1次切出し
に必要な文字推定ピッチを人力する信号線、 C・・・
・・文字1次切出し装置が文字列画像データを読み込む
だめの信乞線、 d ・・・・・・・・文字1次切出し
結果を出力するだめの信号線、 e ・・・・・・・・
文字2次切出し装置が文字列画像データを読み込むだめ
の信号線、f−・・・・ 文字2次切出し装置が認識処
理用辞書を読み込むだめの信号線、 !・・・・・ 出
力信号線。 特許出願人 日本電信電話公社

Claims (1)

    【特許請求の範囲】
  1. 文4に画像中の文字列部分の画像データを入力し、その
    文字列の画像を記憶しておく文字列画像データ記憶装置
    と、その文字列画像データ記憶装置に格納された文字列
    画像データを用いて外部から入力された推定文字ピンチ
    によって文字切出しを行なう文字1次切出し装置と、そ
    の文字1次切出し装置によって文字として切出された図
    形の中で図形が分離していて2個またはそれ以上の部分
    図形に分解出来るもののみを抽出し、各部分図形又は各
    部分図形と図形全体の認識処理を行ない、前記文字】次
    切出し2霞により切出された図形を単一の文字として切
    出すか或いは複数個の文字として切出すかを判別する文
    字2次切出し装置と、文字2次切出し装置の認識処理時
    に用いられる文字の標準パターンを登録しておく認識処
    理用辞書とを備え、はぼ定ピツチで並んでいる通常文字
    の他に通常文字の半分程度のピッチを有する英数字、記
    号等が連続して存在している文字列から個々の文字を切
    出すようにしたことを特徴とする文字切出し装置。
JP58070911A 1983-04-23 1983-04-23 文字切出し装置 Granted JPS59197971A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58070911A JPS59197971A (ja) 1983-04-23 1983-04-23 文字切出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58070911A JPS59197971A (ja) 1983-04-23 1983-04-23 文字切出し装置

Publications (2)

Publication Number Publication Date
JPS59197971A true JPS59197971A (ja) 1984-11-09
JPH0514952B2 JPH0514952B2 (ja) 1993-02-26

Family

ID=13445165

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58070911A Granted JPS59197971A (ja) 1983-04-23 1983-04-23 文字切出し装置

Country Status (1)

Country Link
JP (1) JPS59197971A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61220081A (ja) * 1985-03-27 1986-09-30 Hitachi Ltd パタ−ン切り出し及び認識方式
JPS63271588A (ja) * 1987-04-28 1988-11-09 Matsushita Electric Ind Co Ltd 文字認識装置
JPH02220188A (ja) * 1989-02-22 1990-09-03 Nec Corp 文字認識装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5210635A (en) * 1975-07-09 1977-01-27 Ibm Pattern separator

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5210635A (en) * 1975-07-09 1977-01-27 Ibm Pattern separator

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61220081A (ja) * 1985-03-27 1986-09-30 Hitachi Ltd パタ−ン切り出し及び認識方式
JPS63271588A (ja) * 1987-04-28 1988-11-09 Matsushita Electric Ind Co Ltd 文字認識装置
JPH02220188A (ja) * 1989-02-22 1990-09-03 Nec Corp 文字認識装置

Also Published As

Publication number Publication date
JPH0514952B2 (ja) 1993-02-26

Similar Documents

Publication Publication Date Title
CA1208784A (en) Method and apparatus for character recognition accommodating diacritical marks
EP0195779A1 (en) Cryptographic analysis system
JPS59197971A (ja) 文字切出し装置
JPH11328315A (ja) 文字認識装置
JP2918666B2 (ja) 文字画像切出し方法
JPS592191A (ja) 手書き日本語文の認識処理方式
JP2746345B2 (ja) 文字認識の後処理方法
JP2939945B2 (ja) ローマ字住所認識装置
JP3151866B2 (ja) 英文字認識方法
JP2895115B2 (ja) 文字切出し方法
Hwang et al. Segmentation of a text printed in Korean and English using structure information and character recognizers
JPS6095689A (ja) 光学的文字読取装置
JPH0528310A (ja) フオーム型文書識別装置
JPH02230484A (ja) 文字認識装置
JPH06131492A (ja) ナンバープレート認識方法
JPH01277989A (ja) 文字列パターン読み取り装置
JPH0351982A (ja) 文字列認識方式
JP3111522B2 (ja) 認識文字修正方法
JP3064508B2 (ja) 文書認識装置
JPH05101220A (ja) 文字認識装置
JPH01201789A (ja) 文字読取装置
JPH0368091A (ja) 文字認識装置
JPH0658694B2 (ja) 文字認識装置
JPS607586A (ja) 文字情報認識装置
JPH0614375B2 (ja) 文字入力装置