JPS58144980A - 文字認識処理用後処理システム - Google Patents

文字認識処理用後処理システム

Info

Publication number
JPS58144980A
JPS58144980A JP57028353A JP2835382A JPS58144980A JP S58144980 A JPS58144980 A JP S58144980A JP 57028353 A JP57028353 A JP 57028353A JP 2835382 A JP2835382 A JP 2835382A JP S58144980 A JPS58144980 A JP S58144980A
Authority
JP
Japan
Prior art keywords
post
processing
dictionary
register
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57028353A
Other languages
English (en)
Inventor
Hideaki Sugawara
菅原 秀明
Eiichiro Yamamoto
山本 栄一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57028353A priority Critical patent/JPS58144980A/ja
Publication of JPS58144980A publication Critical patent/JPS58144980A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (5)発明の技術分野 本発明は0文字認識処理用後処理システム、文字認識装
置部において抽出した認識結果の単語候補文字列と正答
単語群を格納している後処理用辞書の内容とを照合させ
て、上記文字認識装置部による認識結果を補正するよう
にした後処理システムにおいて、当該後処理システムの
機能をいわばそのまま利用して、上記後処理用辞書に格
納されていない新たな正答単語を当該辞書内に登録する
ようにした文字認識処理用後処理システムに関するもの
である。
(Bl  技術の背景と問題点 本発明はそれに限られるものではないが1例えば地名な
どを文字認識装置部に布いて読取った結果にもとづいて
、地名の正答を格納している後処理用辞書の内容と照合
し、上記読取り結果を補正して正しい認識結果を得るよ
うにすることが行われている。このような場番に、後処
理用辞書に未登録の地名があってたまたま当該地名を認
識するようなことが生じると、当職未登録の地名は誤ま
って既登録の地名のうちでいわば最も類似度の高い地名
にすりかえられてしまうこととなる。
(C1発明の目的と構成 本発明は、上記の問題を考慮して、後処理用辞書に対し
て未登録の5ものであるか否かを一簡単にチェックしか
つ登録できるようにすることを目的としている。そして
そのため本発明の文字認識処理用後処理システムは、1
つまたは複数個の文字よりなる入力単語を認識する文字
認識装置部をそなえると共に、当該文字認識装置部によ
って認識されるであろう正答単語群を格納する後処理用
辞書をそなえ、かつ上記文字認識装置部によって認識さ
れた結果の単語候補文字列と上記後処理用辞書から順次
読出される正答単語とを照合するマツチング回路部をそ
なえ、上記文字認識装置部によって認識された結果につ
いて上記後処理用辞書内の正答単語と照合して正しい認
識結果を出力する文字認識処理用後処理システムにおい
て、正解が予め判っている判定用単語を用いて、上記マ
ツチング回路部によって上記後処理用辞書の内容と照合
をとるよう制御せしめ、当該照合結果と上記判定用単語
とに不一致状態が生じていることが判明した際に上記判
定用単語を上記後処理用辞書に登録するよう制御を行な
うことを特徴としている。以下図面を参照しうつ説明す
る。
(9)発明の実織例 図は本発明の一実施例要部構成を示す0図中1は文字認
識装置部、2は認識結果レジスタ群であって単語を構成
する複数の各文字について例えば候補■、候補■、・・
・として出された結果がセットされるもの、3は修正・
登録回路部、4は後処理用入力レジスタ、5は後処理用
辞書、6はマツチング回路部、7は後処理用出力レジス
タを表わしている。
通常の処理の場合、今仮りに、地名「上小田中」を文字
認識装置部lによって読取った結果として。
第1文字について「上」がオl候補とされ、第2文字に
ついて「ト」が21候補で「少」が>2候補とされ、第
3文字について「田」が21候補とされ、第4文字につ
いてr中」が5t’l候補とされたものとすると、レジ
スタ2中に図示の如く認識結果がセットされる。
このような場合、地名「上ト田中」と「上小田中」との
いずれであるかが後処理システムにおいてチェックされ
る。即ち今仮に後処理用辞書5内に地名「上小田中」が
登録されていたとした場合には次のように処理される。
filJ21候補の「上ト田中」がレジスタ4にセット
された上でマツチング回路部6からの読取り指示(RE
AD  REQ)によって後処理用辞書5の内容が読出
される。このとき上記「上ト田中」に近似する地名とし
て「上小田中」が抽出されてレジスタ7にセットされる
。修正・登録回路部3は当該[上小田中Jを読取る。次
いで同様にレジスタ2の内容にもとづいて第2候補の「
上小田中」がレジスタ4にセットされ、マツチング回路
部6は一致する地名「上小田中」を抽出してレジスタ7
にセットし、修正・登録回路部3がその旨を読取る。
上記の如くして、修正・登録回路部3はレジスタ7の内
容を読取った結果を総合的に判断し0文字認識俵置部l
によって認識されるべきものは「上小田中」であったと
決定される。
しかし、仮に後処理用辞書S杓に「上小田中」が未登録
であって「下小田中」が登録されていたとすると、上記
の処理の際に上記「上ト田中」や「上小田中」は正しく
は「下小田中」であるはずとされてしまうことにな−る
i 本発明においては、*a理期用辞書5「上小田中」が登
録されているかを簡単にチェックし、かつ登録できるよ
うにしている。即ち、チェックに当って、オペレータが
レジスタ4に「上小田中」を直接セットするなり、ある
いは「上小田中」と記述した帳票を文字認識装置部lに
よって認識させた結果についてオペレータが正しく「上
小田中」と修正した上でレジスタ4にセットするなリシ
テ。
正答「上小田中Jをレジスタ4に先にセットする。
そして、マツ、チング回路部6によって、当該正答「上
小出中Jと後処理用辞書5の内容とを照合する。この場
合、辞書5内に「上小田中」が存在せずかつ「下牛田中
jが存在していることから、一般には「下小田中」が最
も近似するものとしてレジスタ7にセットされる形とな
る。修正・登録回路部3は1.・このときレジスタ4の
内容「上小田中」とレジスタ7の内容[下小田中Jとに
不一致があることを判定し、レジスタ4の内容「上小田
中」が辞書5内に未登録であるとみる。そして書込み指
示(W?TE  REQ)によって、レジスタ4の内容
[上小田中jを辞書5内に書込むようにする。
(匂 発明の詳細 な説明した如く6本発明によれば、後処理システムの機
能をいわばそのまま利用して、簡単に。
後処理用辞書5の内容をチェックしかつ未登録であった
場合に登録することができる。
【図面の簡単な説明】
図は本発明の一実施例構成を示す。 図中、lは文字認識装置部、2は認識結果レジスタ群、
3は修正・登録回路部、4は後処理用入力レジスタ、5
は1uaq用辞書、6はマツチング回路部、7は後処理
用出力レジスタを表わしている。 特許出願人  富士通株式会社

Claims (1)

  1. 【特許請求の範囲】 1′つまたは複数個の文字よりなる入力単語を認識する
    文字認識装置部をそなえると共に、当職文字認識装置部
    によって認識されるであろう正答単語群を格納する後処
    理用辞書をそなえ、かつ上記文字認識装置部によって認
    識された結果の単語候補文字列と上記後処理用辞書から
    順次読出される正答率語表を照合するマツチング回路部
    をそなえ。 上記文字認識装置部によって認識された結果について上
    記後処理用辞書内の正答単語と照合して正しい認識結果
    を出力する文字認識処理用後処理システムにおいて、正
    解が予め判っている判定用単語を用いて、上記マツチン
    グ回路部によって上記後処理用辞書の内容と照合をとる
    よう制御せしめ。 当部照合結果と上記判定用単語とに不一致状態が生じて
    いることが判明した際に上記判定用単語を上記後処理用
    辞書に登録するよう制御を行なうことを特徴とする文字
    認識処理用後処理システム。
JP57028353A 1982-02-24 1982-02-24 文字認識処理用後処理システム Pending JPS58144980A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57028353A JPS58144980A (ja) 1982-02-24 1982-02-24 文字認識処理用後処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57028353A JPS58144980A (ja) 1982-02-24 1982-02-24 文字認識処理用後処理システム

Publications (1)

Publication Number Publication Date
JPS58144980A true JPS58144980A (ja) 1983-08-29

Family

ID=12246236

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57028353A Pending JPS58144980A (ja) 1982-02-24 1982-02-24 文字認識処理用後処理システム

Country Status (1)

Country Link
JP (1) JPS58144980A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61214084A (ja) * 1985-03-20 1986-09-22 Hitachi Ltd 文字認識装置
JPS6244878A (ja) * 1985-08-23 1987-02-26 Hitachi Ltd 文書フアイリングシステム
EP0437269A2 (en) * 1990-01-10 1991-07-17 Kabushiki Kaisha Toshiba Semiconductor pellet detection method
EP0667590A2 (en) * 1994-02-10 1995-08-16 Canon Kabushiki Kaisha Method of registering a character pattern into a user dictionary and a character recognition apparatus having the user dictionary
US5628003A (en) * 1985-08-23 1997-05-06 Hitachi, Ltd. Document storage and retrieval system for storing and retrieving document image and full text data

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61214084A (ja) * 1985-03-20 1986-09-22 Hitachi Ltd 文字認識装置
JPS6244878A (ja) * 1985-08-23 1987-02-26 Hitachi Ltd 文書フアイリングシステム
US5628003A (en) * 1985-08-23 1997-05-06 Hitachi, Ltd. Document storage and retrieval system for storing and retrieving document image and full text data
EP0437269A2 (en) * 1990-01-10 1991-07-17 Kabushiki Kaisha Toshiba Semiconductor pellet detection method
EP0667590A2 (en) * 1994-02-10 1995-08-16 Canon Kabushiki Kaisha Method of registering a character pattern into a user dictionary and a character recognition apparatus having the user dictionary
EP0667590A3 (en) * 1994-02-10 1996-05-08 Canon Kk Method for registering a character pattern in a user-specific lexicon and character recognition device with this lexicon.
US5754686A (en) * 1994-02-10 1998-05-19 Canon Kabushiki Kaisha Method of registering a character pattern into a user dictionary and a character recognition apparatus having the user dictionary

Similar Documents

Publication Publication Date Title
US4979227A (en) Method for automatic character recognition employing a lexicon having updated character strings
JPS58144980A (ja) 文字認識処理用後処理システム
JPH05258099A (ja) 文字認識処理装置
US9443139B1 (en) Methods and apparatus for identifying labels and/or information associated with a label and/or using identified information
CN109783679B (zh) 一种学习辅助方法及学习设备
JP2732593B2 (ja) 文字読取システム
JP3108121B2 (ja) 音声認識装置の辞書制御方式
JP2746345B2 (ja) 文字認識の後処理方法
JP2839515B2 (ja) 文字読取システム
JPS63138479A (ja) 文字認識装置
JPH0654503B2 (ja) パタ−ン認識装置
JPS6095689A (ja) 光学的文字読取装置
JP2743995B2 (ja) 文字読取装置
JPH0573027A (ja) 個人筆跡辞書作成装置及び個人筆跡辞書を用いた文字出力処理装置
JPH02171876A (ja) パターン認識処理方式
JPH0546814A (ja) 文字読み取り装置
JPS59117673A (ja) 文字認識装置における後処理方式
JPH0554145B2 (ja)
JPH04220787A (ja) 文字読取装置
JPH02212990A (ja) 文字読取装置
JPH0475184A (ja) 入力装置
JPS6011897A (ja) 音声認識装置
JPH02297247A (ja) 仮名漢字変換装置
JPS62160534A (ja) 文字列照合方式
JPH07210623A (ja) 文書画像処理装置