JPS5843069A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS5843069A
JPS5843069A JP56140764A JP14076481A JPS5843069A JP S5843069 A JPS5843069 A JP S5843069A JP 56140764 A JP56140764 A JP 56140764A JP 14076481 A JP14076481 A JP 14076481A JP S5843069 A JPS5843069 A JP S5843069A
Authority
JP
Japan
Prior art keywords
characters
character
pattern
memory
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56140764A
Other languages
English (en)
Other versions
JPH0355874B2 (ja
Inventor
Kunio Sakai
坂井 邦夫
Shozo Abe
省三 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Tokyo Shibaura Electric Co Ltd filed Critical Toshiba Corp
Priority to JP56140764A priority Critical patent/JPS5843069A/ja
Publication of JPS5843069A publication Critical patent/JPS5843069A/ja
Publication of JPH0355874B2 publication Critical patent/JPH0355874B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は入力文字を効果的に認識する汎用性に優れた文
字認識装置に関する。
近時、計14機システムを用いた日本語情報地理が注目
8 n %その漢字文字を自動読取りしてg鐵すること
が行われている。例えば本や雑誌勢の配◆情報の入力や
伝糸悄軸畔の人、力を上記した文字読取り・認識によシ
自動的に行うことが試みられている。
ところで従来一般的には、文字認識は、予め辞書メモリ
に登録された認識対数文字の辞臀ノくターンと、読堆り
入力された文字のノ(ターンとを比軟し、パターン整合
しfclつの縞誠対象文字を選出することによってその
認識を行っている。然し、日常使用される漢字文字は5
〜6万椎もあり、これらの文字の辞書パターンを全て辞
豐メ峰すに登録することは、メモリの容量、処理効率の
点で甚だ不経済であるo’tζで一般的には、使用細直
の為い約2千種の文字をgtm対象とし、その辞書パタ
ーンを記憶することが訪われて−る0これにより入力文
字データの9911@度の認識が可能と、なり、また上
記辞書パターンを記憶するメモリの構成においても集塊
が非常に容易となる0 然し乍ら、残・る4s程度の入力文字については依然と
して認鍼することができず、これらに対してFi絖取り
人力抱合やI#4に−が生じ易くなり、オペレータによ
って訂正処理を行うこと勢が費求される。特に本や雑誌
叫の記事情報を入力する場合、−有名駒や右飴〜の關絃
対敢以外の文字が限定さnた僅かの文字軸であるけnど
も繰返して多数発生する−0この為、文字Wk拒否尋の
#jI&が必然的に増大し、スループット性能の低下を
招いた。
このような欠点を解消すべく、出現頻度の一φ文字の辞
書パターンを1髄しておくことにより、wt瞼対象外文
字の発生知友を74%さくすることが考えられている0
然し、記事情報の内容によってよ記文字の出現頻度が大
きく異なる為、汎用化を図ることは殆んど不可能である
本発引祉このよう力事情を考慮してなされたもので、そ
の目的とするところは、入力χ字の認識拒否やwA認除
の発生を極力少なくして、幅広1文字認識を可能とする
l! Aj性の高1×字社識!に蝋を提供することにあ
る。
本発明の概gIFi、一般的に発生#J皺の高い文字を
@11wIIt対象文字としてその静置パターンを辞書
メモリに登録記憶すると共に、本や雑誌勢に1有的に出
現する上記Ii!一対象文字以外の&Iik対象外文字
の辞書パターンを補助メモリに記憶しておき、上記認識
対象文字としてi&!−てきなかつ圧入力文字に#幽す
る認識対象外文字を補助メモリから選出し、その辞1.
パターンを評誉メ篭りに登録することによって、辞書メ
モリ上の文字棟の組合せを久方文字情報の内容に即して
構成すること#ヒよって、そt以後の入力文字に対する
認識拒否や誤認識等の発止を抑えて上述した目的を効果
的lζ達成したものである。
筐良入力文字情報の内容が代っ九ときにも、辞書メモリ
に登録する認識対象外文字のIi類を変更する仁とによ
り、少ない容量の辞書メモリを有効に利用して効率の良
い文字&!!除処理を可能とし汎用性を高め喪ものであ
る。
以下−図面を参照して本発明の一夾施例−ζりきWlt
明する。
OCR勢によシWIIr、販シ入力された文字情報は1
文字づつ切出さnlそのパターンThk$M出さnて文
字kl&姉1に供給されるO−力、辞書パターンメモリ
2には、一般に使用8度の^い−2000字VIEの悔
準文字が1iilll&対象文字としテソのlIlパタ
ーンが記憶ざnてiる。文字緒隊部Iは入力文字のパタ
ーンと、上記!#誉ノ(ターンメモリ2に予め登録され
fc−’es、数の文字の辞書パターンとを比軟し、パ
ターン整合した1つの文字を退出することによって上記
入力文字をiig謙している。そして、この−陣結果は
コントロールs3を)′「シて読取結釆メ七り4に線区
登録さnるようになっている0また文字に線部1は、入
力文字のパターンに螢合する辞愉ノくターンが辞書パタ
ーンメモリ2に存仕しない一合、上記入力文字の1隊が
できないとして、U−拒否信号を前−己コントロール部
Sに与えるようになってφる。しかして、この鉋mll
!否された文字は、コントロール部3の制憐によってデ
ィスプレイ6にて表示されるようになっている・このデ
ィスプレイ5に表示され九g*拒否文字はオペレータに
よって線繊さnlその結果がキーボード6勢の入力懐籠
を介してコントロール部1に与えらnるようになってい
る0りまシ、認識拒否文字にクーてはオペレータの目視
によプM歇され、その關誠結果が4えら九るようになっ
ている@ 一方、補助メモリ1には、前記辞書パターンメモリ2に
記憶登fjkされた411準文字からなる諺瞭対象文字
以外の非標準文字、即ち同有名−詞文字や古語文字叫の
情報*aによっては発生−縦が為くなる認識対象外文字
の辞書パターンを記憶している。この補助メモリ7に記
tmさtN良認敞対象外文字のうち、上記認識拒否文字
に該蟲するものは、以下に1!明するようにコントロー
ル部1の制麹を受けて選択的に読出され、上記wtII
lk拒否文字の読取)訂正に供されると共に、その辞書
パターンが前記辞書パターン整合り2に登録される。こ
れによって、以後、上記l&敞拒否され丸文字と同じ文
字が入力され良とき、tpP11Fパターンメモリ2に
!lT九に登録された画線対象外文字によって文字11
iI!!瞭ざnることになるO ところで、コントロール都31こは、辞書パターンメ(
す2に登録され九辞誉パターンの文字コードを示す文字
コードリストテーブル8と、補助メモリ1に記憶された
結縁対象外文字を示す文字コードリストテーブル9とが
設けられて−る。文字コードリストテーブル8は、例エ
バ#i&2図擾こメモリー成を示すよう・こ、領域Aに
認識対象文字の文字コードを登録り1、領域Bに補助メ
モリfから選択的に読出されて¥Iip曹パターンメモ
vxi登録されたfg一対象外文字の文字コードを登録
している◇しかして、認識相合された文字に対してキー
ボード6から与えられ九M−結果、例えば文字コードは
、先ず文字コードリストテーブル8に登録された文字コ
ードと対比される。これにより、入力文字が既に辞書パ
ターン・メモリ2に登録されているものか否かがチェッ
クされる0尚、この文字コードリストテーブル8を参照
する仁とによって辞書パターンメモリ月こ登録され九辞
曹パターンの文字をモニタするように構成してもよい。
ま−大文字コードリストテーブル9には、補助メモリ1
に記憶されたW!除対象外文字の文字コードと、その補
助メモリr上の記憶アドレスがディレクトリ情報として
例えは第3図に示す−ように書込まれている◇しかして
、今、Wt繊拒否6れ大文字についてオペレータがgb
し、キーボード6を介して入力された文字コードが、前
記テーブル8を参照して辞書パターンメモリ2に登fI
k8れてぃな1と判定され九とき、文字コードリストテ
ーブル9に書込まれ丸文字コードとの参照比較が行われ
る。この参照比較によって、wtlIm拒否され九客字
に販当する認識対象外文字が選出され、前、和、ディレ
クトリとして示されるアドレス情報に従って、その辞書
パターンが補助メモリrから読出される。そして−この
辞書パターンは前記辞書パターンメモリ2に登録され、
ま九その文字コードが文字コードリストテーブル1の領
域Bに登録6nること憂こなる。
尚、ζこでは、キーボード6を介して入力δれたm1l
li情−に従って補助メモリ1から該尚する対象外文字
を過出し、ζ−nをiI?資パターンメモリ2に登録す
ると盲う夷11!IA例につ9て脱明し友が、これを1
動処理するようにしてもよい。
即ち、入力文字が細繊拒否され九とき、その文字パター
ンについて補助メモリ7#こ配憶され九Ig一対象外文
字のt1f畳パターンと焦合して咳蟲する文字を選出し
、これを辞書パターンメモリ2に登録すること曇こよっ
てその処理の自動化をするようにしてもよい◇tた読取
り対象とする情報内容が裟った場合には、辞書パターン
メモリ2に登録したmwik対象外文字を−Hリセット
し、衝えに一緘拒否され九文字番こ#JI幽する認識対
象外文字の辞書パターンを登録して辞書メモリz上に登
録記憶されるg瞭の対象とする文字li!P−誉パター
ンの組合せを変えるようにして、その入力情報内@に適
合させるようにすれによい〇とのように本装置によれは
、III単的なs庭の為い文字をに鰍対象文字としてV
誓パターンメモリj[予め登録し、入力情報内容に応じ
てその発生m1の為い上記llI準文字以外のM識対象
外文字を選択的に上記辞書パターンメモリ2に登録して
入力文字に対するMu処理を行うので、固有名詞や古語
叫の文字がチく含まnる悄1内容入力時であっても、簡
易にして効率良く正し1文字に敵を行う仁とが可能とな
る。従って、標準文字だけによってカバーすることので
きない峙殊な固有的な文字であっても、一旦、その文字
についてg識対象外文字中から該尚するものを見出し、
認識したのちには、以後認識拒否を招くことなく効率的
に認識することが可能となる・しかも辞書パターンメモ
リ2に登録される文字の組合せは、標準文字であるMl
&対象文字を基本として入力情報に応じて変えられるの
で、汎用性を為めることかできる。しかも辞書パターン
メモリ2を小容量化して、有効利用することが可能であ
り、集用的利点が極めて太きい。故優こ、文字入力の経
Sに伴って、そのスループットの向上を図り、学習桜v
E、を愉えた文字Mlk鋏置装提供できることになる。
尚、本発明は上記実施例に限定されるものではない。例
え#i關縁縁対象文字して設電する榔準文字の数や、補
助メモリに準偏しておく上記蒜準文字以外の認識対象外
文字の敷およびその撫−については、装置に蚤求ざする
扛禄lこ応じて定めれはよい。ま九補助メモリ1として
外部大容量メ毫りを用いても良いこと%A′@うまでも
ない。また&蕾パターンの形態も一々とることができる
0簀するに本発明はその賛−を逸脱しない範囲で変形し
て実施することができ暮。
【図面の簡単な説明】
第1鮪は本発明の一鰐施例装置を示す歓略檎欣図、第2
図および第3図はそれぞn文字コードリストテーブルの
メモ°リー取例を示す1′である0 1:・・文字認瞼部、2・・・1蚤パターンメモリ、3
・・・コントロールhs 4・・・軌蝦結果メ七り、5
・・・ディスプレイ、6・・・キーボード、2・・・補
助メ゛モリ、8.9・・・文字コードリストテーブル。 出り人代理人 弁理士 鈴  江  武  彦さ

Claims (1)

    【特許請求の範囲】
  1. パターンを記憶した辞書メモリと、上記誌一対歇又i以
    外のahのg繊対象外文字の詐書ノzターンを記憶した
    補助メモリと、与えらf′また入力文字のパタ゛−ンを
    11J紀辞書メモシlζ記惺さtLfc辞豊パターンと
    比較して文字認識する飴瞳部と、この認識−が認識でき
    なかった入力文字−に該轟する認識対象外表字を前記補
    助メモリから選出してその辞書パターンを前記W′書メ
    毫りに登録する手*、=を具偏した仁とり徴とする文字
    認識装置。
JP56140764A 1981-09-07 1981-09-07 文字認識装置 Granted JPS5843069A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56140764A JPS5843069A (ja) 1981-09-07 1981-09-07 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56140764A JPS5843069A (ja) 1981-09-07 1981-09-07 文字認識装置

Publications (2)

Publication Number Publication Date
JPS5843069A true JPS5843069A (ja) 1983-03-12
JPH0355874B2 JPH0355874B2 (ja) 1991-08-26

Family

ID=15276194

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56140764A Granted JPS5843069A (ja) 1981-09-07 1981-09-07 文字認識装置

Country Status (1)

Country Link
JP (1) JPS5843069A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0595839A (ja) * 1991-10-04 1993-04-20 Daihan:Kk 電磁加熱式食料品の全自動焼上加工機
JPH06187497A (ja) * 1983-12-28 1994-07-08 Internatl Business Mach Corp <Ibm> 文字認識方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS52109836A (en) * 1976-03-12 1977-09-14 Hitachi Ltd Letter pattern recognition unit

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS52109836A (en) * 1976-03-12 1977-09-14 Hitachi Ltd Letter pattern recognition unit

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06187497A (ja) * 1983-12-28 1994-07-08 Internatl Business Mach Corp <Ibm> 文字認識方法
JPH0595839A (ja) * 1991-10-04 1993-04-20 Daihan:Kk 電磁加熱式食料品の全自動焼上加工機

Also Published As

Publication number Publication date
JPH0355874B2 (ja) 1991-08-26

Similar Documents

Publication Publication Date Title
KR910007752B1 (ko) 문자인식시스템
JPS5843069A (ja) 文字認識装置
JPH0423185A (ja) 自動セル属性判定機能を有する表読取装置
JPS5842904B2 (ja) 手書きカナ・漢字の文字認識装置
JPH09282418A (ja) 認識方式複合化装置および方法
JPS59229683A (ja) 認識処理装置
JPH0366704B2 (ja)
JPS55115176A (en) Character reader
JPS63138479A (ja) 文字認識装置
JPS61114388A (ja) 文字入力装置
JPS6162163A (ja) 日本語ワ−ドプロセツサ装置
JPH09171539A (ja) 文字認識装置
JP2677271B2 (ja) 文字認識装置
KR930012140B1 (ko) 자소 오토마타를 이용한 온라인 필기체 문자인식 방법
JPH0253832B2 (ja)
JPH0565913B2 (ja)
JPH02150980A (ja) 文字及び単語の認識方法
JPS6160189A (ja) 光学的文字読取装置
JPS59117673A (ja) 文字認識装置における後処理方式
JPH0411914B2 (ja)
JPS63131289A (ja) 単語照合装置
JPS60207983A (ja) 文字認識用辞書作成方式
JPS5922255B2 (ja) 漢字入力方法
JPS5975377A (ja) 文字選択方式
JPS5820075B2 (ja) パタ−ン認識装置