JPH04256194A - 文字認識処理方式 - Google Patents

文字認識処理方式

Info

Publication number
JPH04256194A
JPH04256194A JP3017312A JP1731291A JPH04256194A JP H04256194 A JPH04256194 A JP H04256194A JP 3017312 A JP3017312 A JP 3017312A JP 1731291 A JP1731291 A JP 1731291A JP H04256194 A JPH04256194 A JP H04256194A
Authority
JP
Japan
Prior art keywords
word
character
character recognition
characters
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3017312A
Other languages
English (en)
Inventor
Takeshi Hasegawa
健 長谷川
Yoshihisa Fujishima
敬久 藤島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP3017312A priority Critical patent/JPH04256194A/ja
Publication of JPH04256194A publication Critical patent/JPH04256194A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は手書き文字や活字を読み
取り認識する文字認識方式に関する。手書き文字や活字
を読み取る文字認識処理において、類似度の差が僅少で
ある場合は該文字の該処理での選択頻度データを考慮し
て認識文字をきめる方法が一般に採用されているが、選
択頻度データを処理時間帯または暦日毎に記録しておく
ことにより文字認識の精度を向上する必要がある。
【0002】
【従来の技術】図7に従来のシステム構成図を、図8に
従来の処理手順図を示す。処理装置20は、帳票21に
記載された顧客名を表す文字の文字パターンを読み取り
文字認識を行う。処理ステップ91で、文字認識処理部
15は入力された帳票21の文字を所定の桁数(本説明
では2桁)読込み、文字認識の処理を開始する。
【0003】入力された文字の認識は、入力文字パター
ンと標準パターンとの比較を行い、入力文字パターンと
最も近い標準パターンを定め、その標準パターンの属す
る文字カテゴリーを認識結果とすることにより行われる
。まず入力された文字は、該文字が持つ画像の濃度値を
光電変換して得られる画像情報を、所定のしきい値を基
準にして白黒の2値にコード化し(入力パターンXと呼
ぶ)、標準パターンの属する文字(文字カテゴリーC)
との比較が行われ、入力文字と字形の類似した文字コー
ドが生成される。認識対象文字の入力パターンXと標準
パターンとの差異(類似性)を評価する尺度を距離(類
似度)と呼び、入力パターンXと文字カテゴリーCとの
該距離(類似度)が最小の文字が認識文字と決定される
【0004】処理ステップ92で、上記文字認識の結果
入力文字の類似度と認識文字(「C1,C2 」)が決
まる。 図9に入力文字の類似度を示す。図9において帳票に記
載された認識対象文字は「石田」であったとすると、文
字認識処理部15が認識した文字は「右田」であり、こ
の二文字のそれぞれの類似度はR1=0.9,R2=0
.9 であったとする。処理ステップ93で該二文字の
類似度との差が所定の値(ここではしきい値と呼び、値
を0.5 とする)を越えない文字が追加されて(文字
「右」に対して文字「石」が、文字「田」に対して文字
「口」がそれぞれ二文字間の類似度の差がしきい値を越
えない文字として追加される)候補文字が決まる。図1
0に候補単語の類似度を示し、処理ステップ93で決ま
った候補単語を図10(a)に示す。
【0005】処理ステップ94で、決定された該候補単
語は、単語生成部25へ渡される。処理ステップ95で
単語生成部25は、候補文字の組合せから生成される候
補単語(「右田」,「右口」,「石口」及び「石田」)
をキーにして単語辞書35を検索する。図11に単語辞
書の説明図を示す。単語辞書35は、帳票記載の顧客名
の単語認識処理において文字認識の対象となる顧客名と
、該顧客名が文字認識の対象となって参照された度数が
、抽出頻度データ(単語iに対応してfi)として記録
されている。
【0006】単語辞書35の検索により単語生成部25
は処理ステップ96で、各々の単語の抽出頻度データを
取り出し候補単語データ表36を作成し、単語選択処理
部45へ渡す。図12に候補単語データ表の説明図を示
す。候補単語は該単語を構成する文字の類似度の合計値
(類似度At)のデータを参照して類似度の順に作成さ
れ、抽出頻度データと合わせて図12(a)の如く候補
単語データ表が作成される。
【0007】図13に従来の単語決定処理手順を示す。 処理ステップ97で、で単語選択処理部45は、候補単
語データ表36の抽出頻度データが最大の候補単語か又
は抽出頻度データが等しい場合は類似度の高い(データ
の値が小さいもの)候補単語をディスプレイ装置56に
表示する。 本例では「右田」が表示される。処理ステップ98で表
示された該候補単語が帳票に記載された文字と同一か否
かが操作員によってチェックされ、同一であれば表示さ
れた候補単語を、同一でなければ候補単語を修正したも
のをディスプレイ装置56から入力する。処理ステップ
99で単語決定処理部55は、ディスプレイ装置56か
ら該候補単語を入力し、該単語に対応する単語辞書35
の抽出頻度データをプラス1して更新する。本例におい
て、「右田」が候補単語として選出されると、帳票に記
載された認識対象文字「石田」と異なるために誤認識と
なり、操作員によりディスプレイ装置56から「石田」
と修正され、単語辞書35の単語「石田」の抽出頻度デ
ータはプラス1されて値が8から9へ更新される。以上
で帳票記載の「石田」の文字認識処理が終わるが続く次
の文字認識が「右田」であった場合の処理を考える。即
ち該文字の認識結果の類似度のデータが図10(b)に
示すような値となり、候補単語データが図12(b)に
示す値となった場合は、図10の処理ステップ97でデ
ィスプレイ装置56に表示される候補単語は、前回の文
字認識「石田」で頻度データが9となった「石田」が選
ばれて誤認識となり、操作員の修正が必要となる。
【0008】
【発明が解決しようとする課題】文字認識処理において
、類似度の値の差が僅少である単語の文字認識において
、該単語の認識処理中の抽出回数を考慮した単語認識方
法は、類似度と抽出回数のデータによって文字の誤認識
が頻発して発生する可能性があった。
【0009】単語の認識処理において生じる単語の抽出
回数を日時毎に記録しておくことにより、文字の入力に
時系列的傾向を持つ帳票の文字認識向上を図る必要があ
る。
【0010】
【課題を解決するための手段】図1は本発明の原理ブロ
ック図である。文字認識処理部1と、単語生成部2と、
単語辞書ファイル3と、単語選択処理部4と、単語決定
処理部5と、ディスプレイ装置51とを有し、単語辞書
ファイル3は文字認識の対象となる単語と、該単語が文
字認識処理された回数を該単語に対応して時系列に頻度
データとして保持し、文字認識処理部1は、帳票に記載
された文字の文字パターンを入力し、該文字パターンの
入力文字が予め保持する標準パターンの文字と一桁ずつ
比較し、該両パターンの差異を評価する類似度が最も標
準パターンに近い文字を選択し、該文字の類似度との差
が所定の値に収まる文字があれば該文字を該選択された
文字と合わせて認識結果の文字として候補単語を生成し
、    単語生成部2は、該候補単語を構成する文字
を各桁に対応していずれかの単語から1文字取り出す組
合せで生成される単語の各文字の類似度から決まる値を
該単語の類似度とし、該単語間での該類似度の差が所定
の値を越えない単語を選び該単語をキーとして単語辞書
ファイル3を検索し、該文字認識処理中の時間帯に対応
する該単語の頻度データを単語辞書ファイル3から読出
し選択単語データ部31を作成し、単語選択処理部1は
、選択単語データ部31の単語の頻度データと類似度か
ら所定の方法で定まる単語を抽出して単語決定処理部5
へ渡し、単語決定処理部5は、該単語をディスプレイ装
置51へ表示し、ディスプレイ装置51に表示された単
語、又は該ディスプレイ装置51から更新入力された単
語を文字認識結果として読込み、該文字認識された単語
辞書ファイル3の該単語に対応する頻度データを所定の
値だけ更新するように構成する。
【0011】
【作用】文字認識の対象となる文字から構成される単語
と、該単語が文字認識の結果採用される頻度データを時
系列で単語辞書ファイル3に記録しておき、単語選択処
理部4が該単語辞書ファイル3から候補単語が保持する
頻度データを抽出して選択単語データ部31を生成する
ことにより、該頻度データを考慮して単語決定処理部5
は、文字認識精度の高い文字の選択が可能となる。
【0012】
【実施例】図2に実施例のシステム構成図を示す。処理
装置10は、帳票11に記載された顧客名を表す文字の
文字パターンを読み取り文字認識を行うが、本実施例で
はまず単語辞書ファイル3が文字認識の対象となる単語
が参照される場合の頻度データが時間帯毎に保持されて
いる場合を説明する。
【0013】文字認識処理部1は入力された帳票11の
文字を所定の桁数読込み(本説明では2桁読込み、帳票
に記載された認識対象文字は「石田」であったとする)
、文字認識を行い入力文字と字形の類似した文字コード
が生成される。この時文字認識処理部1が認識した文字
は「右田」であり、それぞれ類似度はR1=0.9,R
2=0.9 であったとする。該類似度との差が所定の
値(しきい値=0.5 とする)を越えない文字が標準
パターンの中から選択追加されて認識文字(文字「右」
に対して文字「石」が、文字「田」に対して文字「口」
がそれぞれ二文字間の類似度との差がしきい値を越えな
い文字として追加されて候補文字が決まり、従来の方法
と同様にして、図3の候補単語の説明図に示す如く2つ
の候補単語(図3(a))が決まる。文字認識処理部1
は、決定した該候補単語を(図3(a)に示す)単語生
成部14へ渡す。
【0014】図4に実施例における単語決定処理手順を
示す。処理ステップ81で候補単語の文字の組合せから
生成される2文字(「右田」,「右口」,「石口」及び
「石田」)をキーにして単語辞書ファイル3を検索する
【0015】図5に単語辞書ファイルの説明図を示す。 単語辞書ファイル3には文字認識の対象となる顧客名(
単語)が登録されており、文字認識の対象として該単語
が抽出される頻度データが時間帯別に記録されている(
図5(a)に示す)。
【0016】単語生成部2は処理ステップ82で、該検
索処理時の日時情報(「石田」の文字認識処理の時刻が
午前10時30分であったとする)を読込み、該文字認
識処理の時間帯に対応する頻度データを単語辞書ファイ
ル3から候補単語毎に対応して抽出する。次に処理ステ
ップ83で、該頻度データを候補単語に付加した選択単
語データ部31を作成して単語選択処理部4へ渡す。図
6に選択単語データ部の説明図を示す。
【0017】処理ステップ84で単語選択処理部4は、
候補単語の頻度データが最大の候補単語か又は頻度デー
タが等しい場合は類似度の高い(データの値が小さいも
の)候補単語を単語決定処理部5へ渡す。本例の場合は
、図6(a)の如く「右田」の方が類似度(=1.8)
が高いが、時間帯の頻度データは「石田」の方が大きい
(=15)ため認識結果文字として「石田」が選ばれる
。 処理ステップ85で単語決定処理部2は、該候補単語を
ディスプレイ装置51に表示する。本例では「石田」が
表示される。
【0018】処理ステップ86で操作員は、ディスプレ
イ装置3に表示された該候補単語をチェックし、帳票記
載の文字と同一であれば表示された該候補単語を、同一
でなければ候補単語を修正したものをディスプレイ装置
51から入力の指示を行う。
【0019】単語決定処理部5は処理ステップ87で、
ディスプレイ装置3からの単語を読込み、表示した候補
単語が更新されておれば該更新された単語の、更新され
ていなければ表示した候補単語の現在処理中の日時の頻
度データをプラス1して(15+1)、単語辞書ファイ
ル3の頻度データを更新する。
【0020】次に午後1時30分に帳票に「右田」と記
載された文字の認識処理が行われて、候補単語が図3(
b)、選択単語データ部31が図6(b)となった場合
は、類似度が同じであっても時間帯(13時〜)が持つ
頻度データにより正しく「右田」が文字認識される。
【0021】本実施例では時系列の頻度データとして文
字認識処理を行う日の時間帯別のデータを使用する場合
を説明したが、図5(b)に示すように、暦日別の頻度
データを使用して、月始めに文字認識処理の多い文字(
顧客名)か、月末に文字認識処理が多い文字かといった
傾向から文字認識を行うことも可能である。
【0022】
【発明の効果】文字認識の対象となる文字から構成され
る単語と、該単語が文字認識の結果採用される頻度デー
タを時系列で単語辞書ファイル3に記録しておくことに
より、文字入力が時間的傾向を持つ文字の認識精度を向
上することが出来る。
【図面の簡単な説明】
【図1】  本発明の原理ブロック図
【図2】  実施例のシステム構成図
【図3】  候補単語の説明図
【図4】  実施例の文字認識手順
【図5】  単語辞書ファイルの説明図
【図6】  選
択単語データ部の説明図
【図7】  従来のシステム構
成図
【図8】  従来の処理手順図
【図9】  入力文字の類似度
【図10】  候補単語の類似度
【図11】  単語辞書の説明図
【図12】  候補単語データ表
【図13】  従来の単語決定処理手順
【符号の説明】
1、15は文字認識処理部、            
11、21は帳票、2、25は単語生成部、     
           3は単語辞書ファイル、31は
選択単語データ部、              35
は単語辞書、36は候補単語データ表、       
       4、45は単語選択処理部、5、55は
単語決定処理部、            51、56
はディスプレイ装置、81〜87、91〜96、97〜
99は処理ステップを表す。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  文字認識処理部(1)と、単語生成部
    (2)と、単語辞書ファイル(3)と、単語選択処理部
    (4)と、単語決定処理部(5)と、ディスプレイ装置
    (51)とを有し、単語辞書ファイル(3)は文字認識
    の対象となる単語と、該単語が文字認識処理された回数
    を該単語に対応して時系列に頻度データとして保持し、
    文字認識処理部(1)は、帳票に記載された文字の文字
    パターンを入力し、該文字パターンの入力文字が予め保
    持する標準パターンの文字と一桁ずつ比較し、該両パタ
    ーンの差異を評価する類似度が最も標準パターンに近い
    文字を選択し、該文字の類似度との差が所定の値に収ま
    る文字があれば該文字を該選択された文字と合わせて認
    識結果の文字として候補単語を生成し、単語生成部(2
    )は、該候補単語を構成する文字を各桁に対応していず
    れかの単語から1文字取り出す組合せで生成される単語
    の各文字の類似度から決まる値を該単語の類似度とし、
    該単語間での該類似度の差が所定の値を越えない単語を
    選び該単語をキーとして単語辞書ファイル(3)を検索
    し、該文字認識処理中の時間帯に対応する該単語の頻度
    データを単語辞書ファイル(3)から読出し選択単語デ
    ータ部(31)を作成し、単語選択処理部(1)は、選
    択単語データ部(31)の単語の頻度データと類似度か
    ら所定の方法で定まる単語を抽出して単語決定処理部(
    5)へ渡し、単語決定処理部(5)は、該単語をディス
    プレイ装置(51)へ表示し、ディスプレイ装置(51
    )に表示された単語、又は該ディスプレイ装置(51)
     から更新入力された単語を文字認識結果として読込み
    、該文字認識された単語辞書ファイル(3)の該単語に
    対応する頻度データを所定の値だけ更新することを特徴
    とする文字認識処理方式。
JP3017312A 1991-02-08 1991-02-08 文字認識処理方式 Withdrawn JPH04256194A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3017312A JPH04256194A (ja) 1991-02-08 1991-02-08 文字認識処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3017312A JPH04256194A (ja) 1991-02-08 1991-02-08 文字認識処理方式

Publications (1)

Publication Number Publication Date
JPH04256194A true JPH04256194A (ja) 1992-09-10

Family

ID=11940496

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3017312A Withdrawn JPH04256194A (ja) 1991-02-08 1991-02-08 文字認識処理方式

Country Status (1)

Country Link
JP (1) JPH04256194A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019133370A (ja) * 2018-01-31 2019-08-08 セイコーエプソン株式会社 画像処理装置および画像処理プログラム
JP2019191776A (ja) * 2018-04-20 2019-10-31 株式会社東芝 情報管理装置及び情報管理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019133370A (ja) * 2018-01-31 2019-08-08 セイコーエプソン株式会社 画像処理装置および画像処理プログラム
JP2019191776A (ja) * 2018-04-20 2019-10-31 株式会社東芝 情報管理装置及び情報管理方法

Similar Documents

Publication Publication Date Title
JP2726568B2 (ja) 文字認識方法及び装置
KR100412317B1 (ko) 문자인식/수정방법및장치
JP5357711B2 (ja) 文書処理装置
JPH04256194A (ja) 文字認識処理方式
JPH0157837B2 (ja)
JP2001236467A (ja) パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体
JP3727173B2 (ja) 音声認識方法及び装置
US7349846B2 (en) Information processing apparatus, method, program, and storage medium for inputting a pronunciation symbol
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JP2939945B2 (ja) ローマ字住所認識装置
KR100292352B1 (ko) 형태소 분석을 이용한 인식기의 편집방법
JPS58125183A (ja) 光学文字読取装置における認識不能文字表示方法
JP2746345B2 (ja) 文字認識の後処理方法
JPS62281082A (ja) 文字認識装置
JPH05217017A (ja) 光学式文字読取装置
JP3138665B2 (ja) 手書き文字認識方式および記録媒体
JPS5852267B2 (ja) 文字解析方式
JP3162419B2 (ja) 認識辞書更新方法
JP2851865B2 (ja) 文字認識装置
JPH06119483A (ja) 文字読み取り装置
JPS6293776A (ja) 情報認識装置
JPH0944606A (ja) 文字認識処理方法
JPH11238101A (ja) 文字認識装置
JPH03105490A (ja) 光学文字読取装置
JPH11184962A (ja) 光学的文字読取装置、照合修正方法、及び記録媒体

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19980514