JPH09161014A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH09161014A
JPH09161014A JP7324497A JP32449795A JPH09161014A JP H09161014 A JPH09161014 A JP H09161014A JP 7324497 A JP7324497 A JP 7324497A JP 32449795 A JP32449795 A JP 32449795A JP H09161014 A JPH09161014 A JP H09161014A
Authority
JP
Japan
Prior art keywords
word
dictionary
recognized
registered
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7324497A
Other languages
English (en)
Inventor
Yoshimi Yamada
義美 山田
Hajime Sato
元 佐藤
Susumu Naitsu
将 内津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7324497A priority Critical patent/JPH09161014A/ja
Publication of JPH09161014A publication Critical patent/JPH09161014A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 文字認識用の単語照合辞書に、無意味な単語
が登録されることを回避する。 【解決手段】 入力文字INは、文字認識部10で文字
認識用辞書20と参照され1文字ずつ認識されたあと認
識単語にまとめられる。単語検索手段31は、その認識
単語が単語照合用辞書40に登録済みか否かを検索す
る。未登録のとき仮登録単語検索手段32が起動され、
その認識単語が仮登録単語辞書50に格納済みか否かを
検索する。未格納のときは仮登録単語格納手段33が起
動され、その認識単語を仮登録単語辞書50に格納す
る。格納済みのときは仮登録単語計数手段34が起動さ
れ、その認識単語の検索回数をカウントアップする。そ
の認識単語の検索回数が設定値に達すると、単語登録手
段35はその認識単語を単語照合用辞書40に登録す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文字認識におい
て、認識した単語を辞書と照合して認識率の向上を図る
とともに、認識した単語が自動的に辞書に登録される自
動単語登録方式の文字認識装置に関するものである。
【0002】
【従来の技術】文字情報は、文字のつながりで(即ち、
単語として)意味を持っている。文字認識においては、
この意味情報を有効に利用して認識精度を高める処理が
行われている。図2は、従来の自動単語登録方式の文字
認識装置の一構成例を示す機能ブロック図である。この
文字認識装置は、光学文字センサ等で読み取られた入力
文字の画像データINが入力される文字認識部1を有
し、この文字認識部1には文字認識用辞書2が接続され
ている。文字認識部1の出力側は、単語照合部3に接続
され、この単語照合部3には更に単語照合用辞書4が接
続されている。単語照合部3の認識結果OUTは、図示
されてはいないが、入力文字確認用の表示装置やファイ
ル装置を有するデータ処理装置に接続されている。文字
認識部1に入力文字の画像データINが入力されると、
文字認識部1は、画像データINの特徴をもとに、文字
認識用辞書2を参照し1文字ずつ入力された文字を認識
する。そして、単語にまとめて認識単語WDを単語照合
部3へ出力する。単語照合部3は、入力された認識単語
WDと同一の単語が、単語照合用辞書4に登録されてい
るか否かを照合する。登録されているとき、単語照合部
3は、その認識単語WDをそのまま認識結果OUTとし
て出力する。登録されていないとき、単語照合部3は、
その認識単語WDをそのまま認識結果OUTとして出力
するとともに、その認識単語WDを単語照合用辞書4に
登録する。この結果、単語照合用辞書4は充実され、以
降の認識単語WDに対応することが可能となる。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
自動単語登録方式の文字認識装置では、次のような課題
があった。 (1)記入者が、例えば住所、氏名、会社名等を正確に
把握していなくて、間違って記入した場合、その住所等
は単語照合用辞書4には登録されていない。しかし、こ
の間違って入力された単語は、そのまま単語照合用辞書
4に登録される。 (2)記入された文字のくずれ具合により、文字認識部
1で誤読をした場合、誤読された単語はそのまま単語照
合用辞書4に登録される。 (3)前記(1)、(2)の理由で登録された無意味な
単語の影響で、誤認識が増加する。 (4)前記(1)、(2)の理由で登録された無意味な
単語により、単語照合用 辞書4の容量が膨大になり、処理時間にも影響する。本
発明は、前記従来技術が持っていた課題として、単語照
合用辞書4に登録される無意味な単語について解決した
文字認識装置を提供するものである。
【0004】
【課題を解決するための手段】本発明は、前記課題を解
決するため、認識対象となる文字の特徴が登録されてい
る文字認識用辞書と、前記文字認識用辞書を参照して入
力された文字の特徴から1文字ずつ文字を認識し、単語
にまとめて認識単語を出力する文字認識部とを、備えた
文字認識装置において、次のような手段を設けている。
即ち、本発明の文字認識装置には、出力対象となる単語
が登録される単語照合用辞書と、前記単語照合用辞書に
登録されていない前記認識単語が一時的に格納される仮
登録単語辞書と、前記認識単語を入力し、該認識単語が
前記単語照合用辞書に登録されているか否かを検索し
て、登録の有無を表す第1の検索結果を出力する単語検
索手段と、前記第1の検索結果が無しのときには、前記
認識単語が前記仮登録単語辞書に格納されているか否か
を検索して、格納の有無を表す第2の検索結果を出力す
る仮登録単語検索手段と、前記第2の検索結果が無しの
ときには前記認識単語を前記仮登録単語辞書に格納する
仮登録単語格納手段と、前記第2の検索結果が有りのと
きには前記単語検索手段における前記認識単語の検索回
数を計数する仮登録単語計数手段と、前記仮登録単語計
数手段の計数結果が設定回数に達したときには前記認識
単語を前記単語照合用辞書に登録する単語登録手段と
が、設けられている。
【0005】本発明によれば、以上のように文字認識装
置を構成したので、次のような動作が行われる。文字認
識部に入力文字が入力されると、文字認識部は文字認識
用辞書を参照して1文字ずつ認識し、単語にまとめてそ
の認識単語を単語検索手段に出力する。単語検索手段
は、その認識単語が単語照合用辞書に登録されているか
否かを検索する。もし、登録されていなければ、更に仮
登録単語検索手段が起動され、その認識単語が仮登録単
語辞書に格納されているか否かが検索される。もし、仮
登録単語辞書にも格納されていなければ、仮登録単語格
納手段が起動され、その認識単語を仮登録単語辞書に格
納する。もし、既に仮登録単語辞書に格納されていれ
ば、仮登録単語計数手段が起動され、その認識単語に対
する検索回数がカウントアップされる。そして、この検
索回数が設定された回数に達すると、単語登録手段が起
動され、その認識単語を単語照合用辞書に登録する。
【0006】
【発明の実施の形態】図1は、本発明の実施形態を示す
文字認識装置の機能ブロック図である。この文字認識装
置は、例えば、銀行のユーザ管理システム等において、
データ処理の前処理での手書き文字入力等で使用される
もので、文字認識部10を有している。この文字認識部
10は、光学文字センサ等で読み取られた入力文字の画
像データINを入力し、この画像データINの特徴をも
とに1文字ずつ文字を認識し、認識単語WDにまとめる
ものである。この文字認識部10には、文字を認識する
ために参照する、認識対象となる文字の特徴が登録され
た文字認識用辞書20が接続されている。文字認識部1
0の出力側は、単語照合部30に接続されている。単語
照合部30は、単語検索手段31、仮登録単語検索手段
32、仮登録単語格納手段33、仮登録単語計数手段3
4及び単語登録手段35で構成されている。単語検索手
段31は、文字認識部10に接続され、入力された認識
単語WDが有効な単語であるか否かを検索するため、出
力対象となる単語が登録される単語照合用辞書40が接
続されている。この単語検索手段31の出力側は、図示
されてはいないが、入力文字確認用表示装置やファイル
装置を有するデータ処理装置に接続されている。更に、
単語検索手段31には、その検索の結果、単語照合用辞
書40に認識単語WDが無いときに起動される仮登録単
語検索手段32が接続されている。
【0007】仮登録単語検索手段32には、単語照合用
辞書40に登録されていない認識単語WDと、その検索
回数を計数するためのカウンタCNTとが、一時的に格
納される仮登録単語辞書50が接続されている。また、
この仮登録単語検索手段32には、その検索結果が無し
のときに起動される仮登録単語格納手段33と、有りの
ときに起動される仮登録単語計数手段34とが接続され
ている。この仮登録単語計数手段34には、認識単語W
Dを単語照合辞書40へ登録する単語登録手段35が接
続されている。文字認識部10及び単語照合部30は、
プログラム制御によるプロセッサを使用し、文字認識用
辞書20、単語照合用辞書40及び仮登録単語辞書50
は、記憶装置を用いて構成される。次に、動作を説明す
る。
【0008】文字認識部10に、例えば「東京都 千世
田区 外神田」と書かれた、手書き入力文字の画像デー
タINが入力されたとする。すると、文字認識部10
は、最初にその画像データINを一文字ずつに区分し、
各文字の特徴をもとに、文字認識用辞書20を参照し
て、個々の文字「東」,「京」,「都」,「千」,
「世」,「田」,「区」,「外」,「神」及び「田」を
認識する。次に、これらの文字を連結し、認識単語「東
京都」,「千世田区」及び「外神田」を単語照合部30
へ出力する。単語照合部30の単語検索手段31は、入
力された認識単語「東京都」,「千世田区」及び「外神
田」と同一の単語が、単語照合用辞書40に登録されて
いるか否かを検索する。ここで、単語照合用辞書40に
は、「東京都」は登録されており、「千世田区」及び
「外神田」は登録されていないとする。単語検索手段3
1は、その登録されている認識単語「東京都」をそのま
ま認識結果OUTとして出力する。一方、「千世田区」
及び「外神田」は登録されていないので、単語検索手段
31は、誤読と見なして誤読の標識を付加してその認識
単語「千世田区」及び「外神田」を認識結果OUTとし
て出力するとともに、仮登録単語検索手段32を起動す
る。起動された仮登録単語検索手段32は、認識単語
「千世田区」及び「外神田」が仮登録単語辞書50に格
納されているか否かを検索する。
【0009】ここで、仮登録単語辞書50には、「千世
田区」は格納されておらず、「外神田」は格納されてい
るとする。認識単語「千世田区」は格納されていないの
で、仮登録単語検索手段32は、仮登録単語格納手段3
3を起動する。起動された仮登録単語格納手段33は、
その認識単語「千世田区」を仮登録単語辞書50に格納
し、その認識単語「千世田区」と対になる検索回数計数
用のカウンタCNTを仮登録単語辞書50内に設ける。
一方、認識単語「外神田」は格納済みであるので、仮登
録単語検索手段32は、仮登録単語計数手段34を起動
する。起動された仮登録単語計数手段34は、仮登録単
語辞書50内の認識単語「外神田」と対になっているカ
ウンタCNTに1を加算し、その認識単語「外神田」の
検索回数をカウントアップする。以上のように、入力文
字の画像データINの入力毎に文字認識処理が行われ、
もし、「外神田」の入力が繰り返されると、認識単語
「外神田」の検索回数計数用のカウンタCNTの計数値
は増加する。
【0010】仮登録単語計数手段34は、例えば認識単
語「外神田」の検索回数のカウントアップの結果、その
カンタCNTの計数値が設定された値に達したときに、
単語登録手段35を起動する。起動された単語登録手段
35は、その認識単語「外神田」を単語照合用辞書40
に登録し、仮登録単語辞書50から認識単語「外神田」
及び対になっているカウンタCNTを削除する。この結
果、それ以降、単語検索手段31は、認識単語「外神
田」を誤読とせず、そのまま認識結果OUTとして出力
することになる。なお、「千世田区」は「千代田区」の
誤りであり、同一の誤りが繰り返されることはほとんど
無いので、単語「千世田区」が単語照合用辞書40に登
録されるおそれはない。この様に、構成したので、本実
施形態の文字認識装置は、次のような利点を有する。仮
登録単語辞書50を持ち、単語照合用辞書40に登録さ
れていない認識単語WDを、一時的にこの仮登録単語辞
書50に格納する。そして、同一単語が設定された回数
入力された時点で、この認識単語WDを正規に単語照合
用辞書40に登録するようにして、単語照合用辞書40
の充実を図っている。このため、間違って記入された単
語や誤認識した無意味な単語が、単語照合用辞書40に
登録されることがなく、単語照合用辞書40に存在する
無意味な単語の影響で誤認識が増えるということがない
という利点がある。更にまた、これらの無意味な単語が
登録されることがないので、単語照合用辞書40の容量
が膨大にならず、処理時間への影響も少ないという利点
がある。
【0011】なお、本発明は、前記実施形態に限定され
ず、種々の変形が可能である。この変形例としては、例
えば、次のようなものがある。 (a)図1の単語検索手段31は、認識単語WDと同一
の単語が単語照合用辞書40に存在しない場合、誤読と
見なして誤読の標識を付加してその認識単語WDを認識
結果OUTとして出力している。しかし、存在しない場
合の処理は、この方法に限らず、類似する単語を選択候
補として提示する等、文字認識装置の運用形態に合わせ
て種々の形態が考えられる。 (b)前記実施形態では、認識単語WDの検索回数計数
用のカウンタCNTを、仮登録単語辞書50内に認識単
語WDと対にして設けているが、仮単語計数手段34内
に別個に設けることも可能である。また、カウントアッ
プによる計数を行ったが、カウントダウンによる計数で
も良い。
【0012】
【発明の効果】以上詳細に説明したように、本発明によ
れば、この文字認識装置は仮登録単語辞書を有し、単語
照合用辞書に登録されていない認識単語を、一旦この仮
登録単語辞書に格納する。そして、同一単語が設定され
た回数入力された時点で、この認識単語を正規に単語照
合用辞書に登録するようにしている。このため、間違っ
て記入された単語や誤認識した無意味な単語が、単語照
合用辞書に登録されることがなく、正しい単語によって
単語照合用辞書が充実されることになる。従って、単語
照合用辞書には無意味な単語が登録されることがないの
で、誤認識、辞書容量の過大化、処理時間の増加といっ
た問題を生じさせず、単語照合用辞書の充実により文字
認識率の向上が図られるという効果がある。
【図面の簡単な説明】
【図1】本発明の実施形態を示す文字認識装置の機能ブ
ロック図である。
【図2】従来の文字認識装置の機能ブロック図である。
【符号の説明】
10 文字認識部 20 文字認識用辞書 30 単語照合部 31 単語検索手段 32 仮登録単語検索手段 33 仮登録単語格納手段 34 仮登録単語計数手段 35 単語登録手段 40 単語照合用辞書 50 仮登録単語辞書 IN 入力文字の画像データ OUT 認識結果

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 認識対象となる文字の特徴が登録されて
    いる文字認識用辞書と、 前記文字認識用辞書を参照して入力された文字の特徴か
    ら1文字ずつ文字を認識し、単語にまとめて認識単語を
    出力する文字認識部とを、備えた文字認識装置におい
    て、 出力対象となる単語が登録される単語照合用辞書と、 前記単語照合用辞書に登録されていない前記認識単語が
    一時的に格納される仮登録単語辞書と、 前記認識単語を入力し、該認識単語が前記単語照合用辞
    書に登録されているか否かを検索して登録の有無を表す
    第1の検索結果を出力する単語検索手段と、 前記第1の検索結果が無しのときには前記認識単語が前
    記仮登録単語辞書に格納されているか否かを検索して格
    納の有無を表す第2の検索結果を出力する仮登録単語検
    索手段と、 前記第2の検索結果が無しのときには前記認識単語を前
    記仮登録単語辞書に格納する仮登録単語格納手段と、 前記第2の検索結果が有りのときには前記単語検索手段
    における前記認識単語の検索回数を計数する仮登録単語
    計数手段と、 前記仮登録単語計数手段の計数結果が設定回数に達した
    ときには前記認識単語を前記単語照合用辞書に登録する
    単語登録手段とを、 設けたことを特徴とする文字認識装置。
JP7324497A 1995-12-13 1995-12-13 文字認識装置 Withdrawn JPH09161014A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7324497A JPH09161014A (ja) 1995-12-13 1995-12-13 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7324497A JPH09161014A (ja) 1995-12-13 1995-12-13 文字認識装置

Publications (1)

Publication Number Publication Date
JPH09161014A true JPH09161014A (ja) 1997-06-20

Family

ID=18166470

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7324497A Withdrawn JPH09161014A (ja) 1995-12-13 1995-12-13 文字認識装置

Country Status (1)

Country Link
JP (1) JPH09161014A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010286865A (ja) * 2009-06-09 2010-12-24 Ird:Kk 情報処理装置、情報処理方法、およびプログラム
JP5239863B2 (ja) * 2006-09-07 2013-07-17 日本電気株式会社 自然言語処理システムおよび辞書登録システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5239863B2 (ja) * 2006-09-07 2013-07-17 日本電気株式会社 自然言語処理システムおよび辞書登録システム
JP2010286865A (ja) * 2009-06-09 2010-12-24 Ird:Kk 情報処理装置、情報処理方法、およびプログラム

Similar Documents

Publication Publication Date Title
US5161245A (en) Pattern recognition system having inter-pattern spacing correction
JP3589007B2 (ja) 文書ファイリングシステムおよび文書ファイリング方法
JPH09161014A (ja) 文字認識装置
JP2000089786A (ja) 音声認識結果の修正方法および装置
JPH06215184A (ja) 抽出領域のラベリング装置
JP3812719B2 (ja) 文書検索装置
JPH0441388B2 (ja)
JP3361258B2 (ja) 文字読取装置
JP3188154B2 (ja) 文字認識処理方法
JP2538543B2 (ja) 文字情報認識装置
JP3924899B2 (ja) テキスト検索装置およびテキスト検索方法
JP2908460B2 (ja) 誤認識修正方法及び装置
JP2918380B2 (ja) 文字認識結果の後処理方法
JPH0248938B2 (ja)
JPS63153689A (ja) 住所読取装置
JPH05210635A (ja) 入力装置
JP3725206B2 (ja) 文字認識装置
JP2874199B2 (ja) 単語辞書照合装置
JPH07295988A (ja) 単語訂正方式
JPH0546806A (ja) 文字認識方法
JP2969751B2 (ja) 文字認識処理方式
JP3081622B2 (ja) 電話番号定型化装置及び電話番号定型化方法
JP2935533B2 (ja) 文字処理方法
JP2917310B2 (ja) 単語照合における単語辞書検索方式
JPS61161588A (ja) 文字認識後処理方式

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030304