JPH0789363B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0789363B2
JPH0789363B2 JP58091808A JP9180883A JPH0789363B2 JP H0789363 B2 JPH0789363 B2 JP H0789363B2 JP 58091808 A JP58091808 A JP 58091808A JP 9180883 A JP9180883 A JP 9180883A JP H0789363 B2 JPH0789363 B2 JP H0789363B2
Authority
JP
Japan
Prior art keywords
address information
character
cut
recognition
cutting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58091808A
Other languages
English (en)
Other versions
JPS59216285A (ja
Inventor
賢一 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP58091808A priority Critical patent/JPH0789363B2/ja
Priority to US06/613,069 priority patent/US4607385A/en
Priority to EP84303504A priority patent/EP0127441A3/en
Publication of JPS59216285A publication Critical patent/JPS59216285A/ja
Publication of JPH0789363B2 publication Critical patent/JPH0789363B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は枠無し用紙等に記載された文字を効果的に認識
処理することのできる書式融通性の高い文字認識装置に
関する。
〔発明の技術的背景とその問題点〕
近時、手書きされた文字を認識して所定の事務処理を実
行する等、文字認識に関する技術が向上してきた。この
ような文字認識を実行する場合、比較的近い観測領域中
から文字が存在する部分画像を検出し、これを切出した
のち所定の画像処理を施してその文字の認識を行ってい
る。上記文字画像の検出、切出し処理は通常「検切」と
称され、文字の認識処理とは独立に行われる。そして、
この検切処理は、従来一般に文字画像のピッチ情報、白
領域の存在、人工的に付加した検切マーク(タイミング
・マーク)等を手掛りとして行われている。この為、認
識処理に供する文字を用紙に記載するに対しては幾つか
の制約条件が加わり、これ故従来では専ら用紙上に文字
記入枠を印刷しておき、これに従って文字を記入する等
の工夫がなされている。
然し乍ら、認識処理に供しようとする文字は通常様々な
形態をとり、白紙に記載されることも多い。この為、認
識対象とする文字についての書式融通性に欠けていた。
〔発明の目的〕
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、認識対象とする文字に対して融
通性を持たせ、例えば枠無し用紙に記載された文字であ
ってもこれを効果的に認識することのできる実用性の高
い文字認識装置を提供することにある。
〔発明の概要〕
本発明に係る文字認識装置は、入力された画像パターン
から複数の切出開始アドレス情報及び切出終了アドレス
情報を予め抽出する抽出手段と、この抽出手段で抽出さ
れた複数の切出開始アドレス情報及び切出終了アドレス
情報を記憶する記憶手段と、この記憶手段に記憶された
複数の切出開始アドレス情報及び切出終了アドレス情報
のうちの1つにより指定される領域の文字画像を切り出
す切出手段と、この切出手段で切り出された文字画像の
文字を認識処理する認識手段と、この認識手段の認識処
理で所定の条件を満たす認識結果が得られなかった場合
に、前記切出手段で用いられた切出開始アドレス情報及
び切出終了アドレス情報とは別の前記記憶手段に記憶さ
れた切出開始アドレス情報及び切出終了アドレス情報を
前記切出手段に与え、変更された領域の文字画像の再切
り出しを行わしめる制御手段とを具備したことを特徴と
する。即ち本発明は、認識結果に応じて、文字の切出領
域の少なくとも大きさあるいは位置を変更し、再度文字
画像の切り出しを行うことを効率良く実現するものであ
る。
〔発明の効果〕
かくして本発明によれば、認識処理対象とする文字が白
紙上に比較的自由に記載されていても、これを効果的に
検切りして認識することができ、文字に対する制約が大
幅に緩和される。従って、書式形式に対する融通性が高
まる等の実用上多大なる効果が奏せられる。
〔発明の実施例〕
以下、図面を参照して本発明の一実施例につき説明す
る。
第1図は実施例装置の概略構成図で、1は文字画像の入
力部、2は文字の認識部、3は検切制御部である。入力
部1は検切制御部3の制御を受けて観測画像中から文字
の存在領域の文字画像を検切りするものであり、この文
字画像に対して認識部2による文字認識処理が行われ
る。認識部2は、上記文字画像の文字に対する認識結果
を得ると共に、前記検切制御部3に対して認識終了信号
a,検切のやり直し指示信号bを与えている。このような
信号a、bを受けて、検切制御部3は前記入力部1に対
して検切開始アドレス情報cおよび検切終了アドレス情
報dを与えている。
さて、入力部1は例えば第2図(a)に示すようにCCD
スキャナ11、A/Dコンバータ12、画像メモリ13およびア
ドレス制御部14によって構成される。アドレス制御部14
は、前記検切りのアドレス情報c、dに従って観測画像
中の部分領域の画像を検切り制御するものである。これ
によって、文字存在領域として指定された領域の文字画
像が検切り出力されて前記認識部2および検切制御部3
に供給される。尚、この入力部1を、例えば第2図
(b)に示すようにフライングスポットスキャナ15を用
いて構成してもよい。この場合には、前記画像メモリ13
が不要となり、指定領域の文字画像を直接得ることが可
能となる。
一方、前記検切制御部3は、例えば第3図に示す如く構
成される。入力部1からの検切された文字画像パターン
は、1ラインバッファ31に順次入力される。オア回路32
は、上記画像の縦1列の画像信号の和をとり、横方向に
画像が白から黒に、また黒から白に変化する時点を見出
すものであり、この反転情報は、プッシュホップ(P/
H)制御部33a,33bに与えられている。このP/H制御部33
a,33bは、アドレスカウンタ34によって制御されるとこ
ろの検切開始アドレス・スタック35および検切終了アド
レス・スタック36をプッシュホップ制御するものであ
り、前記反転情報を得てこれらのアドレス・スタック3
5,36をそれぞれプッシュしている。またP/H制御部33a,3
3bは、前記認識部2からの認識終了信号aを受けて、ス
タック35,36を取り出しポインタの位置までホイップさ
せている。これらのスタック35,36に対する上記取り出
しポインタは、ポインタレジスタ37,38にそれぞれ格納
されたものであって、そのポインタ情報は、前記検切り
のやり直し指示bが与えられたとき、ポインタ制御部39
によって更新されるようになっている。このようなポイ
ンタ制御によりアドレス・スタック35,36から読出され
るアドレス情報が制御され、これが検切開始アドレス情
報cおよび検切終了アドレス情報dとしてそれぞれ出力
される。
このようにして、検切制御部3は、認識部2からの情報
に基ずいて文字画像検切のアドレス制御を行い、その領
域を可変している。
さて、文字の認識部2は、例えば第4図に示す如く構成
される。検切文字パターンは正規化部21、ボケ操作部22
を介して正規化処理、ボケ操作が施されて雑音成分の除
去がなされる。このような処理が施された文字パターン
に対して、複合類似度計算部23は認識辞書メモリ24に登
録された標準文字パターンとの間で、複合類似度法を用
いて照合処理を行っている。この複合類似度法は、例え
ば特公昭49−12778号等に示されるように入力文字パタ
ーンと標準文字パターンとの間の類似度(距離)を複合
計算によって求めるものである。この複合類似度法を用
いた照合処理が、入力文字パターン(検切文字パター
ン)と複数の標準パターンとの間でそれぞれ行われる。
判定部25は、このようにして求められた各カテゴリに対
する類似度のうち、最大値を示すものについて所定の閾
値T1と比較し、上記最大類似度値が上記閾値T1を越える
か否かを判定している。更に最大類似度値と次大類似度
値との差を求め、この差が所定の閾値T2を越えるか否か
を判定している。これらの判定が伴に合格であった場
合、判定部25は、上記最大類似度値を得たカテゴリを入
力文字パターンの認識結果として出力している。また上
記判定のいずれかが否であった場合には、前記検切りの
やり直し指示信号bを発生している。そして、この一連
の処理が終了したとき、判定部25から認識終了信号aが
出力される。このようにして、認識処理結果が検切の制
御情報としてフィードバックされることになる。
尚、この認識部2を第5図に示すように構成することも
できる。即ち、複合類似時計算部23で得た各カテゴリに
対する類似度値をソート処理部26にてその値の高いもの
から順にソート処理する。このようにして得た複数の連
続する文字から、単語後処理部27にてその単語としての
有意な組合せを見出し、これを単語辞書メモリ28を用い
て照合して認識結果を得るようにしてもよい。そして、
意味のある単語が見出されなかったときに、検切りのや
り直しを指示するようにすればよい。
このようにすれば、漢字のヘンとツクリとが離れている
場合であっても、その文字としての適切な検切りを行わ
せることが容易に可能となる等の効果が奏せられる。
このように本発明によれば検切りした文字画像に対する
文字認識結果に従って、上記検切りの領域の大きさある
いは位置を変更するので、比較的自由に記載された文字
であっても、これを効果的に認識することが可能とな
る。従って、用紙上に予め文字記入枠を設けて記入文字
に対する制約を課すことも不必要になり、その実用的利
点は絶大である。
尚、本発明は上記実施例に限定されるものではない。例
えば検切り領域の指定をその中心位置と大きさの情報と
を用いて行うようにしてもよい。また検切り位置の判定
を白黒の変化点の代りに、画像の連続的な濃度変化や、
その投影情報を用いて行うようにしてもよい。その他、
文字認識の対象は、狭義の文字および図形・シンボルマ
ークを含むことは云うまでもない。要するに本発明は、
その要旨を逸脱しない範囲で種々変形して実施すること
ができる。
【図面の簡単な説明】
第1図は本発明の一実施例装置の概略構成図、第2図
(a)(b)は入力部の構成図、第3図は検切制御部の
構成図、第4図および第5図はそれぞれ認識部の構成図
である。 1……入力部、2……認識部、3……検切制御部。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】入力された画像パターンから複数の切出開
    始アドレス情報及び切出終了アドレス情報を予め抽出す
    る抽出手段と、 この抽出手段で抽出された複数の切出開始アドレス情報
    及び切出終了アドレス情報を記憶する記憶手段と、 この記憶手段に記憶された複数の切出開始アドレス情報
    及び切出終了アドレス情報のうちの1つにより指定され
    る領域の文字画像を切り出す切出手段と、 この切出手段で切り出された文字画像の文字を認識処理
    する認識手段と、 この認識手段の認識処理で所定の条件を満たす認識結果
    が得られなかった場合に、前記切出手段で用いられた切
    出開始アドレス情報及び切出終了アドレス情報とは別の
    前記記憶手段に記憶された切出開始アドレス情報及び切
    出終了アドレス情報を前記切出手段に与え、変更された
    領域の文字画像の再切り出しを行わしめる制御手段とを
    具備したことを特徴とする文字認識装置。
  2. 【請求項2】文字の認識処理は、複合類似度法を用いて
    行われるものである特許請求の範囲第1項記載の文字認
    識装置。
  3. 【請求項3】文字の認識処理は、個々の文字を認識した
    のち、認識された複数の文字が有意の単語を構成するか
    否かを判定して認識結果を得るものである特許請求の範
    囲第1項記載の文字認識装置。
JP58091808A 1983-05-25 1983-05-25 文字認識装置 Expired - Lifetime JPH0789363B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP58091808A JPH0789363B2 (ja) 1983-05-25 1983-05-25 文字認識装置
US06/613,069 US4607385A (en) 1983-05-25 1984-05-22 Character recognition apparatus
EP84303504A EP0127441A3 (en) 1983-05-25 1984-05-23 Character recognition apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58091808A JPH0789363B2 (ja) 1983-05-25 1983-05-25 文字認識装置

Publications (2)

Publication Number Publication Date
JPS59216285A JPS59216285A (ja) 1984-12-06
JPH0789363B2 true JPH0789363B2 (ja) 1995-09-27

Family

ID=14036921

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58091808A Expired - Lifetime JPH0789363B2 (ja) 1983-05-25 1983-05-25 文字認識装置

Country Status (3)

Country Link
US (1) US4607385A (ja)
EP (1) EP0127441A3 (ja)
JP (1) JPH0789363B2 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4817186A (en) * 1983-01-07 1989-03-28 International Business Machines Corporation Locating individual images in a field for recognition or the like
JPH0610829B2 (ja) * 1984-06-29 1994-02-09 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 手書き文字認識方法
US4953224A (en) * 1984-09-27 1990-08-28 Hitachi, Ltd. Pattern defects detection method and apparatus
JPS61220081A (ja) * 1985-03-27 1986-09-30 Hitachi Ltd パタ−ン切り出し及び認識方式
US5265242A (en) * 1985-08-23 1993-11-23 Hiromichi Fujisawa Document retrieval system for displaying document image data with inputted bibliographic items and character string selected from multiple character candidates
JPS63239569A (ja) * 1987-03-27 1988-10-05 Matsushita Electric Ind Co Ltd 文字認識装置
JPS63266586A (ja) * 1987-04-24 1988-11-02 Hitachi Ltd 文字認識装置
JPH07107700B2 (ja) * 1987-04-28 1995-11-15 松下電器産業株式会社 文字認識装置
US5253303A (en) * 1988-02-15 1993-10-12 Nec Corporation Character recognizing method and apparatus thereof
JP3017740B2 (ja) * 1988-08-23 2000-03-13 ソニー株式会社 オンライン文字認識装置およびオンライン文字認識方法
JPH03214378A (ja) * 1990-01-19 1991-09-19 Sony Corp 文字認識装置
US5081690A (en) * 1990-05-08 1992-01-14 Eastman Kodak Company Row-by-row segmentation and thresholding for optical character recognition
JP2821285B2 (ja) * 1991-07-23 1998-11-05 キヤノン株式会社 画像処理方法及び装置
US5862246A (en) * 1994-06-20 1999-01-19 Personal Information & Entry Access Control, Incorporated Knuckle profile identity verification system
US5594806A (en) * 1994-06-20 1997-01-14 Personnel Identification & Entry Access Control, Inc. Knuckle profile indentity verification system
US6501855B1 (en) * 1999-07-20 2002-12-31 Parascript, Llc Manual-search restriction on documents not having an ASCII index
US9578429B2 (en) 2006-11-09 2017-02-21 Sonova Ag Support mount for electronic components
US8077358B2 (en) * 2008-04-24 2011-12-13 Xerox Corporation Systems and methods for implementing use of customer documents in maintaining image quality (IQ)/image quality consistency (IQC) of printing devices
US8601003B2 (en) * 2008-09-08 2013-12-03 Apple Inc. System and method for playlist generation based on similarity data
US20110060738A1 (en) 2009-09-08 2011-03-10 Apple Inc. Media item clustering based on similarity data
US10936653B2 (en) 2017-06-02 2021-03-02 Apple Inc. Automatically predicting relevant contexts for media items

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1319158A (en) * 1969-11-05 1973-06-06 Kogyo Gijutsuin Pattern processing systems
US3794761A (en) * 1971-07-15 1974-02-26 Tokyo Shibaura Electric Co Pattern processing apparatus
JPS52119032A (en) * 1976-03-31 1977-10-06 Fujitsu Ltd Pattern recognition unit
SE422714B (sv) * 1979-01-16 1982-03-22 Ibm Svenska Ab Anordning med styrdator for optisk teckenlosning, vilken styrdator bl a bereknar startpunkter for identifiering av ett tecken
SE448922B (sv) * 1980-10-21 1987-03-23 Ibm Svenska Ab Metod for behandling av videodata vid ett optiskt teckenidentifieringssystem jemte en anordning for teckenidentifiering i en optisk dokumentlesare

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子通信学会技術研究報告PRL83−7(昭58−5−20)PP.49−56

Also Published As

Publication number Publication date
JPS59216285A (ja) 1984-12-06
EP0127441A3 (en) 1988-06-22
US4607385A (en) 1986-08-19
EP0127441A2 (en) 1984-12-05

Similar Documents

Publication Publication Date Title
JPH0789363B2 (ja) 文字認識装置
US5561720A (en) Method for extracting individual characters from raster images of a read-in handwritten or typed character sequence having a free pitch
EP0602180B1 (en) Locating characters for character recognition
JPH06215184A (ja) 抽出領域のラベリング装置
JPS6226587A (ja) 光学文字読取装置の文字フイ−ルドフリ−ピツチ処理方式
JPH0728935A (ja) 文書画像処理装置
JP3157557B2 (ja) 文字認識装置
JPH10124615A (ja) 文字認識方法
JPH028348B2 (ja)
JPS61251982A (ja) 光学的文字読取装置
JP2612383B2 (ja) 文字認識処理方式
JP2746345B2 (ja) 文字認識の後処理方法
JPH0797390B2 (ja) 文字認識装置
JPH09167206A (ja) 日英混在文書のスペース検出方法、ピッチ書式判定方法、定ピッチ英数文字列のスペース検出方法、及びプロポーショナルピッチ英数文字列のスペース検出方法
JPH05242299A (ja) 文字認識装置
JP2682456B2 (ja) 光学文字読取装置
JPH05189604A (ja) 光学的文字読取装置
JPS58125184A (ja) 光学的文字読取装置
JPH11232388A (ja) 文書・帳票認識システム
JPS59206987A (ja) 文字認識装置
JPS6225220B2 (ja)
JPH05174190A (ja) 文字認識装置
JPH03217993A (ja) 文字サイズ認識装置
JPH06236454A (ja) 文字認識装置
JPS60140488A (ja) 文字特徴抽出方式