JPH0119195B2

JPH0119195B2 -

Info

Publication number: JPH0119195B2
Application number: JP56136144A
Authority: JP
Inventors: Hideaki Sugawara; Eiichiro Yamamoto
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1981-09-01
Filing date: 1981-09-01
Publication date: 1989-04-10
Also published as: JPS5839378A

Description

【発明の詳細な説明】本発明は文字認識後処理方式に関するものであ
つて、特に文字読取手段により入力された入力文
字を文字辞書（例えば漢字辞書）と文字認識処理
を行つたのち認識結果に対しその順位に応じて重
みづけを行なつて単語辞書とのマツチングを行な
うことにより、入力単語を正確に認識できるよう
にした文字認識後処理方式に関するものである。

従来の文字認識方式では、例えば第１図に示す
如く、認識部１において入力文字の特徴抽出を行
ないこれをフアイルと比較してもつとも認識順位
の高いものを出力レジスタ２に出力し、その後、
文字認識後処理としてこの出力レジスタ２に出力
された３ケの文字が都道府県名を示すものである
とあらかじめわかつている場合には、これらの出
力された文字を都道府県辞書３と順次マツチング
回路４にて比較を行ない入力文字を正確に認識す
るようにしている。

すなわち、第１図において、都道府県名の記入
領域に３個の文字の記入されたデータ入力用紙
（図示省略）を例えばOCR（図示省略）で読取り、
これにより得られたデータにもとづき認識部１で
はそれぞれに対する特徴抽出にもとづき認識順位
のもつとも高い「宮」、「埼」、「県」を出力レジス
タ２に出力し、これらをマツチング回路４におい
て都道府県辞書３にセツトされている都道府県名
と順次比較してその一致度のもつとも高い都道府
県名を読取出力として出力するものである。しか
るにこのような後処理方式では、第１図に示す如
く、認識部１から「宮」、「埼」、「県」と出力され
たことにもとづき都道府県名とマツチングを行な
つたとき、「宮崎県」と「宮城県」の２つが同一
優先順位で存在することになり、自動的にこのい
ずれか一方を選択することができなかつた。

そのために、第２図に示す如く、認識部で入力
文字を認識するとき複数順位の候補文字を出力す
ることが提案された。認識部で３文字の都道府県
名を認識したとき第１番目の文字については第２
図に示す如く、第１順位が「科」、第２順位が
「秩」、第３順位が「秋」、第４順位が「材」、第５
順位が「林」であり、第２番目の文字については
第１順位〜第５順位が「田」、「内」、「口」、「円」
、
「由」であり、第３番目の文字については第１順
位〜第５順位が「具」、「県」、「目」、「且」、「旦
」
の場合に、これらの各候補文字を都道府県名と順
次比較する。すなわち都道府県辞書３から第１番
目に「北海道」を読出し、その第１番目の文字
「北」を前記「科、秩、秋、材、林」と比較して
マツチングをとる。そして第２番目の文字「海」
と前記「田、内、口、円、由」と比較して、第３
番目の文字「道」を前記「具、県、目、且、旦」
と比較しそれぞれ一致をとるがいずれも不一致で
ある。次に２番目の単語「青森県」と同様なマツ
チングを行なうが、第３番目の文字「県」が前記
「具、県、目、且、旦」と照合したとき第２順位
の「県」で一致が得られる。そして第３番目の単
語「秋田県」とマツチングを行なうとき、第１番
目の文字「秋」と「科、秩、秋、材、林」と照合
して一致が得られ、同様に第２番目の文字「田」
と「田、内、口、円、由」と照合して一致が得ら
れ、第３番目の文字「県」と「具、県、目、且、
旦」と照合してこれまた一致が得られる。かくし
て「秋田県」ではすべての文字が候補文字の１つ
と一致が得られるので、このマツチング度合のも
つともよい「秋田県」を読取文字として出力す
る。

しかしながらこのような複数順位の候補文字を
単純に比較する場合には、第３図に示す如き例で
は読取出力を１つに確定できないことがある。す
なわち、第１番目の文字に対しては第１番目〜第
５番目の認識順位が「宮、官、富、呂、宙」であ
り、第２番目の文字に対しては同じく認識順位が
「埼、崎、峠、城、地」であり、第３番目の文字
に対しては同じく「具、県、目、且、旦」であ
り、これを文字マトリクス・レジスタ５から各順
位毎に３文字ずつ順位レジスタ６に出力して都道
府県辞書３の単語とマツチング回路４にて照合し
たとき、「宮崎県」と「宮城県」とが同一のマツ
チング度合となり区分することができない場合が
存在する。

したがつて本発明はこのような問題を改善する
ために認識部からの候補出力に対し、その順位毎
に重みを付与して単語辞書とのマツチングを求
め、もつとも上位順位でマツチングのとれた単語
を求めるようにした文字認識後処理方式を提供す
ることを目的とするものである。そしてこのため
に本発明における文字認識後処理方式では、読取
文字を認識する文字認識手段と単語が保持されて
いる単語保持手段と前記文字認識手段にて認識さ
れた文字が単語保持手段に保持された単語と一致
することを検出するマツチング手段を具備する文
字認識後処理方式において、文字認識手段から複
数順位の認識文字候補を出力させ、マツチング手
段において単語保持手段に保持された単語と前記
複数順位の認識文字候補とマツチングを行なうと
ともに、前記認識文字候補の１つの文字と前記単
語の１つの文字がマツチングしたときはその認識
順位に応じた重みを付与して出力する重み付与出
力手段を設けて認識順位に応じたマツチング順位
度が得られるようにすることにより、マツチング
順位度のもつとも高い単語を選択出力するように
したことを特徴とする。

以下本発明の一実施例を第４図にもとづき説明
する。

第４図において他図と同符号部は同一部分を示
し、７はマツチング回路、８は単語辞書、９はマ
ツチング結果出力レジスタ、１０は結果判定回
路、１１は出力レジスタである。

マツチング回路７は単語辞書８から読出した単
語を認識部１から文字マトリクス・レジスタ５に
出力された第１順位〜第５順位までの認識候補文
字とを照合してマツチングを行なうとともにマツ
チングした文字が存在する場合その認識順位に応
じて、例えば第１順位の認識候補文字と一致した
とき「０」、第２順位の認識候補文字と一致した
とき「１」、第３順位の認識候補文字と一致した
とき「２」、第４順位のものと一致したとき
「３」、第５順位のものと一致したとき「４」、第
１順位〜第５順位のいずれのものとも一致しない
とき「５」を出力する。

単語辞書８は後処理に必要な、例えば都道府県
名用の単語集とか、各都道府県毎の例えば秋田県
内の郡市町村名のような分類された複数の単語集
がフアイルされているものであり、マツチング回
路７からの単語毎の制御信号C₂により分類別に、
しかも一定の順序にしたがつて所定の分類の単語
が順次出力されるものである。

マツチング結果出力レジスタ９は文字マトリク
ス・レジスタ５にセツトされた候補文字と単語辞
書８から出力された単語との一致度を単語対応に
保持するレジスタである。

結果判定回路１０はマツチング回路７にて行な
われたマツチングの結果、そのもつともマツチン
グ度合の大きな単語を選択出力するものである。

次に第４図の動作について説明する。

(1) 認識部１から出力された認識候補文字はその
認識順位にしたがつて文字マトリクス・レジス
タ５に出力される。例えば第１番目の文字に対
しては第１順位〜第５順位までの「科、秩、
秋、材、林」が出力され、第２番目の文字に対
しては「田、内、口、円、由」が出力され、第
３番目の文字に対しては「具、県、目、且、
旦」が出力される。そして前記認識部１の出力
が都道府県名であることがあらかじめわかつて
いるので、単語辞書８から都道府県名用の単語
集フアイル部が順次読出される。この場合、マ
ツチング回路７から出力される単語毎の制御信
号C₂により先ず「北海道」が読出される。そ
してマツチング回路７からの順序制御信C_1-0に
より順位レジスタ６に先ず「科田具」がセツト
され「北海道」と比較されるが、このとき第４
番目に文字がないということでのみ一致するが
他は一致しない。次にマツチング回路７から順
序制御信号C_1-1により順位レジスタ６に第２順
位の「秩内県」がセツトされ、同様に「北海
道」と照合される。このようにしてマツチング
回路７からの順序制御信号C_1-2〜C_1-4により順
位レジスタ６に第３順位の「秋口目」に、第４
順位の「材円且」、第５順位の「林由旦」が順
次セツトされ「北海道」とのマツチングが行な
われるが、これらは文字同志では不一致であ
り、その結果第４番目の文字が存在しないとい
うことで一致するのみなので、マツチング結果
出力レジスタ９の区分１の(4)には「０」が記入
され、区分１の(1)〜(3)には「５」が記入され
る。

(2) このようにして第１番目の単語「北海道」と
の照合が終るとマツチング回路７は制御信号
C₂を出力し、第２番目の単語「青森県」を出
力させる。それから順序制御信号C_1-0〜C_1〜4を
出力して順位レジスタ６に第１順位「科田具」
〜第５順位「林由旦」を順次セツトして前記
「青森県」とマツチングする。このとき第２順
位の「秩内県」における「県」と第４番目の文
字がないという２つの点で一致するので、マツ
チング回路７はマツチング結果出力レジスタ９
の区分２の(4)に「０」、(3)に「１」、(2)と(1)にそ
れぞれ「５」が記入されることになる。

(3) 次いでマツチング回路７は制御信号C₂によ
り第３番目の単語「秋田県」を出力させ、それ
から前記(1)、(2)と同様にして順位レジスタ６に
「科田具」〜「林由旦」を順次セツトしてこの
「秋田県」との照合を行なう。この場合には、
第１順位の「科田具」における「田」、第２順
位における「秩内県」の「県」、第３順位の
「秋口目」における「秋」と第４番目の文字が
ないということでそれぞれ一致が得られるの
で、マツチング結果出力レジスタ(9)の区分３の
(2)、(4)には「０」が、(3)には「１」が、(1)には
「２」がそれぞれ記入されることになる。

(4) このようにしてすべての都道府県名との照合
が終了したとき、結果判定回路１０はこのマツ
チング結果出力レジスタ９の各区分の合計点の
もつとも小さい区分を求めてそのマツチング度
合のもつとも大きいものとして選択出力するこ
とになる。したがつてこの場合には区分３が合
計点３のために最小であり、かくして第３番目
の都道府県名の「秋田県」を最終的な読取出力
として出力レジスタ１１に出力する。このよう
にして後処理により「秋田県」を正確に取出す
ことができる。

なお、第５図に示す如く、結果判定回路１
０′に第１入力レジスタ１２、第２入力レジス
タ１３および比較制御部１４を設け、第１入力
レジスタ１２にマツチング回路７からの個々の
区分のマツチング状態を入力してこれを先に入
力されている第２入力レジスタ１３に保持され
ている区分のものとのマツチング状態と比較し
て、新らしく伝達された第１入力レジスタ１２
のマツチング度が大きいとき（第４図の状態で
は合計点の小さいとき）にこれを第２入力レジ
スタ１３に記入し、小さいときにはそのまま第
１入力レジスタ１２に次の単語に対するマツチ
ング度を入力するように構成すれば、第４図に
おけるマツチング結果出力レジスタ９は不必要
となり、単語辞書から読出される被照合単語数
が大きい場合でも、簡単な構成で対処すること
ができる。

かくして、本発明によれば、第６図に示す如
く、文字マトリクス・レジスタ５に第１順位〜
第５順位として「宮埼県」〜「宙地旦」と出力
された場合でも、マツチング回路７において都
道府県辞書３とマツチングを行なう場合、第７
図に示す如く、「宮崎県」に対しては例えばマ
ツチング結果出力レジスタの区分９−０に合計
点が「１」として記入されるが「宮城県」に対
しては同じく区分９−10に合計点が「３」とし
て記入されることになり、これより「宮崎県」
が後処理結果として出力されることになる。

本発明を一般的に説明すれば、第８図に示す如
く、入力単語をL₁，L₂，…L_o（ｎ文字で単語を構
成するものとする）とし、L₁に対する認識候補
をL₁₍₁₎，L₂₍₂₎，…L₁₍₅₎（認識候補として第１順位
〜第５順位までを採用するとき）とする。また重
みを第１順位〜第５順位に対してW₍₁₎〜W₍₅₎とし
第６順位以下のものに対してW₍₆₎とし、W₍₁₎＜
W₍₂₎…＜W₍₆₎としてかつW₍₁₎〜W₍₆₎は直線的な変
化をもつものとする。そして単語辞書に登録され
ている標準単語（北海道とか青森県に相当するも
の）S₁，S₂…S_oと入力単語L₁，L₂…L_oとの相違
度Ｄを各文字ごとの相違度の和として表現する。
各文字L₁，L₂…およびL_oごとの相違度は、例え
ばS₁を考えたとき認識候補L₁₍₄₎でマツチングが得
られたときその相違度ｄ（S₁，L₁）はW₍₄₎となる。
もしもマツチングする認識候補がなければ相違度
はW₍₆₎となる。したがつて単語の相違度Ｄは、Ｄ＝_o 〓ⁱ⁼¹ ｄ（S_i、L_i）となり、このＤが最小となる単語辞書の単語を正
しいものとして判断することになる。

なお上記説明では候補文字を第５順位まで選択
した例について説明したがこれに限定されるもの
でもない。そして順位の高いものを小さな数の重
みづけした例について説明したが、逆の場合でも
同様である。

以上説明の如く、本発明によれば候補文字に対
しその候補順位に応じた重みづけを行なつて単語
単位にこの重みの合計を求めることにより明確な
後処理を行なうことができる。

【図面の簡単な説明】

第１図〜第３図は従来の後処理説明図、第４図
は本発明の一実施例構成図、第５図はその結果判
定回路の他の実施例、第６図〜第８図は本発明の
動作状態説明図である。図中、１は認識部、２は出力レジスタ、３は都
道府県辞書、４はマツチング回路、５は文字マト
リクス・レジスタ、６は順位レジスタ、７はマツ
チング回路、８は単語辞書、９はマツチング結果
出力レジスタ、１０は結果判定回路、１１は出力
レジスタをそれぞれ示す。

Claims

【特許請求の範囲】

１読取文字を認識する文字認識手段と単語が保
持されている単語保持手段と前記文字認識手段に
て認識された文字が単語保持手段に保持された単
語と一致することを検出するマツチング手段を具
備する文字認識後処理方式において、文字認識手
段から複数順位の認識文字候補を出力させ、マツ
チング手段において単語保持手段に保持された単
語と前記複数順位の認識文字候補とマツチングを
行なうとともに、前記認識文字候補の１つの文字
と前記単語の１つの文字がマツチングしたときは
その認識順位に応じた重みを付与して出力する重
み付与出力手段を設けて認識順位に応じたマツチ
ング順位度が得られるようにすることにより、マ
ツチング順位度のもつとも高い単語を選択出力す
るようにしたことを特徴とする文字認識後処理方
式。