JPH11120294A - 文字認識装置および媒体 - Google Patents

文字認識装置および媒体

Info

Publication number
JPH11120294A
JPH11120294A JP9285524A JP28552497A JPH11120294A JP H11120294 A JPH11120294 A JP H11120294A JP 9285524 A JP9285524 A JP 9285524A JP 28552497 A JP28552497 A JP 28552497A JP H11120294 A JPH11120294 A JP H11120294A
Authority
JP
Japan
Prior art keywords
character
category
candidate
similar
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9285524A
Other languages
English (en)
Inventor
Kenji Kondo
堅司 近藤
Yoshihiko Matsukawa
善彦 松川
Tsuyoshi Megata
強司 目片
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP9285524A priority Critical patent/JPH11120294A/ja
Publication of JPH11120294A publication Critical patent/JPH11120294A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 類似文字を効率よく高精度に認識する。 【解決手段】 文字カテゴリ毎の基本字体の特徴量であ
る基本特徴量が類似している前記文字カテゴリの集合で
ある類似文字カテゴリ群を複数個記憶する類似文字情報
記憶手段4と、認識の対象となる文字列に含まれる文字
の文字画像から抽出された特徴量を前記基本特徴量と比
較して、前記文字に対応する前記類似文字カテゴリ群を
選出する候補選出手段5と、候補選出手段5によって前
記文字列の各々の文字に対して選出された前記類似文字
カテゴリ群に属する各々の前記文字カテゴリ同士の組合
せから、辞書を参照して、前記文字列の文字を認識する
辞書参照手段6とを備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識装置に関する
ものである。
【0002】
【従来の技術】文字認識においては、(1) 字種が異なる
が形状が等しい文字(カタカナの「カ」と漢字の「力」
や、カタカナの「ト」と漢字の「卜」等)や、(2) 字種
が等しく、大文字と小文字の関係にある文字(アルファ
ベットの「C」と「c」や、ひらがなの「や」と「ゃ」
等)があるように、文字の形状だけで文字カテゴリを判
断するのは限界があることが知られている。また、(3)
文字の1部分だけが異なる非常に良く似た形状の文字
(「ば」と「ぱ」等の様に濁音・半濁音の部分が違う場
合等)が存在し、これらを正確に判断することも依然と
して難しいのが現状である。
【0003】そこで、単語辞書などからなる後処理部を
用いて認識結果を訂正する手法が数多く提案されてい
る。しかし、その場合、認識候補文字の中から単語を照
合していたので、類似文字への誤認識等により候補文字
群中に正解文字が存在しなければ、正解単語を得ること
ができないという問題点を有している。
【0004】この問題に対して、類似性文字辞書を使っ
て対処する試みもなされている。この方法は、予め、図
13のように、ある文字を類似性文字のインデックスと
し、またその類似性文字のインデックスと誤認識しやす
い文字を候補類似文字の実体として配列に格納してお
き、認識候補文字中に類似性文字のインデックス文字が
存在すれば、その文字を候補類似文字の実体配列中の文
字と置換して、候補単語の照合を行うものである。
【0005】また、後処理部を利用して認識結果を訂正
しても、すべて訂正することは非常に難しく、修正者
(オペレータ)による修正作業が不可欠である。その際
に、上記で述べたような、(1) 字種が異なるが形状が等
しい文字、(2) 字種が等しく、大文字と小文字の関係に
ある文字、(3) 文字の1部分だけが異なる非常に良く似
た形状の文字、等の場合、修正者(オペレータ)が見て
も、正しく認識(あるいは後処理)されているかを判断
するのは難しい場合が存在する。
【0006】この問題に対して、認識結果の文字コード
に対応した属性データを表示して、類似した文字コード
を修正者に判断し易くするという試みもある(特開平8-
272897広報)。これは予め、図14のような文字属性テ
ーブルに類似文字の属性を蓄えておき、文字認識結果の
表示部に、図15のように、認識結果の文字表記と選択
された文字の属性情報も同時に表すことで類似した文字
もオペレータに判断し易くするというものである。
【0007】
【発明が解決しようとする課題】しかしながら、上記従
来の技術では、相変わらず外見的に似たカタカナの
「カ」や漢字の「力」を異なるカテゴリとして認識部に
蓄えておく。つまり、類似したカテゴリを異なるカテゴ
リとして学習するので、ニューラルネット等を用いて学
習する場合には収束しない、または収束が遅いといった
ことが起きたり、カテゴリの境界部分ではしばしば誤認
識が起き、他のカテゴリの識別にも悪影響を及ぼす場合
もある。誤認識が起きやすいということは、認識候補文
字の中にも正解文字が含まれない可能性も高くなり、認
識候補の中に正解文字が含まれなければ、正解単語と照
合ができない。また、類似文字のインデックス文字が含
まれなければ、類似文字辞書が役に立たず、正解単語と
照合できない。同時に、地名または人名において、通常
用いられている読み(カナ表記)が複数存在する場合
(濁点の有無などによることが多い)があるが、この場
合、認識対象の読み(カナ表記)と単語辞書のカナ表記
が異なれば認識結果が訂正できない。例えば、中野区江
古田の「江古田」という地名について考える。この地名
は「エコダ」と呼ばれたり、「エゴタ」と呼ばれたりす
るが、もし、辞書に「エコダ」のみ登録されているとす
ると、認識すべき対象が「エゴタ」の時は、いくら認識
結果が「エゴタ」と正しくても「ゴ」の認識候補文字の
中に「コ」が存在しなかったり、「タ」の認識候補文字
の中に「ダ」が存在しなければ単語辞書中の「エコダ」
と照合することができない。
【0008】また、修正時に属性情報を表示して、修正
者に類似カテゴリを識別しやすくするという試みは有効
ではあるが、より直感的に分かる表示法が求められてい
る。
【0009】本発明は、このような従来の文字認識装置
の有する上述した課題を考慮し、候補文字中に正解文字
が含まれる可能性を高めることによって、類似文字を効
率よく高精度に認識する文字認識装置を提供することを
目的とするものである。また、修正者に直感的にわかり
やすい表示を行うことにより、適切な訂正が行える文字
認識装置を提供することを目的とするものである。
【0010】
【課題を解決するための手段】請求項1の本発明は、文
字画像の形状を数値化して表現した特徴量が、特徴量空
間内において近い関係にある文字カテゴリの集合である
類似文字カテゴリ群を複数個記憶する類似文字情報記憶
手段と、認識の対象となる文字列に含まれる文字の文字
画像から抽出された特徴量をもとに、前記文字に対応す
る類似文字カテゴリ群を選出する候補選出手段と、前記
候補選出手段によって前記文字列の各々の文字に対して
選出された前記類似文字カテゴリ群に属する各々の前記
文字カテゴリ同士の組合せから、辞書を参照して、前記
文字列の文字を認識する辞書参照手段とを備えることを
特徴とする文字認識装置である。
【0011】上記構成によって、前記候補選出手段にお
いては、選出対象の全文字カテゴリ数が減少するため記
憶・認識時の負担が減少する。また、類似した文字の特
徴量は、代表カテゴリとして学習(候補選出手段を構
築)することにより、ニューロ等の識別系を用いる場
合、類似した文字カテゴリの特徴量を異なるカテゴリと
して学習する矛盾に起因する誤認識が減少するので、候
補に正解文字が含まれない状況を回避できる。また、単
語辞書中の表記と認識する対象の表記が濁点・半濁点の
有無により異なる場合も正解単語として抽出できる。
【0012】請求項18の本発明は、認識の対象となる
文字列に含まれる各文字に対応する候補文字同士の組合
せから、辞書を参照して、最終候補文字列を選出する辞
書参照手段と、前記最終候補文字列を訂正する訂正手段
とを備え、前記辞書参照手段は、前記最終候補文字列を
構成する単語に付随する単語付随情報を前記最終候補文
字列に合わせて出力し、前記訂正手段は、前記最終候補
文字または前記最終候補文字列と前記単語付随情報とを
同時に表示する結果表示部と、訂正情報を入力する訂正
情報入力部とを有し、前記単語付随情報は、前記訂正を
適切に行うための情報であることを特徴とする文字認識
装置である。
【0013】上記構成によって、従来の文字属性データ
を参照する文字認識装置よりも、修正者に結果をより直
感的に理解させることが出来る。
【0014】請求項22の本発明は、本発明の文字認識
装置に備えられた各手段の機能の全部または一部をコン
ピュータに実行させるプログラムを格納することを特徴
とする媒体である。
【0015】
【発明の実施の形態】以下に、本発明の実施の形態を図
面を参照して説明する。
【0016】(第1の実施の形態)図1は、本発明の第
1の実施の形態における文字認識装置の構成図である。
本実施の形態における文字認識装置は、図1に示すよう
に、画像入力手段1,文字切り出し手段2,特徴量抽出
手段3,類似文字情報記憶手段4,候補選出手段5,辞
書参照手段6で構成されている。また、類似文字情報記
憶手段4は、類似文字情報入力部4a,類似文字情報記
憶部4bで構成され、辞書参照手段6は、単語照合部6
a,候補単語格納部6b,後処理部6c,単語辞書部6
d,文法辞書部6eで構成されている。
【0017】次に、このような本実施の形態における文
字認識装置の動作について、カタカナ住所を認識対象と
する場合を例にとって説明する。
【0018】最初に、類似文字情報記憶手段4および候
補選出手段5にそれぞれ必要な情報を記憶させる動作に
ついて説明する。設計者は、設計者が設定した、類似し
た文字カテゴリの群を類似文字カテゴリ群として類似文
字情報入力部4aにおいて入力する。入力された類似文
字カテゴリ群を、図2の右欄のような形式で類似文字情
報記憶部4bに記憶させる。この類似文字カテゴリ群を
特定するシンボルとして、その群に属する一つの文字カ
テゴリが左欄のように選択されて、これを各群の代表カ
テゴリとして類似文字情報記憶部4bに記憶させる。本
実施の形態においては、濁点・半濁点が付加することの
出来るカタカナ文字については濁点・半濁点つきの文字
と元の清音文字を類似文字カテゴリ群として、「ヤ」と
「ャ」の様に大文字・小文字を有するカタカナ文字につ
いては大文字・小文字を類似文字カテゴリ群として定義
し、代表カテゴリを清音文字または大文字とした。な
お、1つの文字カテゴリは、複数の類似文字カテゴリ群
には属さないものとする。
【0019】他方、全ての文字カテゴリ各々に対応する
サンプル文字の画像について、画像入力手段1、文字切
り出し手段2を介して、特徴量抽出手段3によってそれ
らのそれぞれの特徴量を抽出する。候補選出手段5は、
これらの特徴量をそれぞれの文字カテゴリに対応する基
本特徴量として記憶する。ただし、当該文字カテゴリが
類似文字カテゴリ群に属している場合は、当該文字カテ
ゴリの替わりに、それが属する類似文字カテゴリ群の代
表カテゴリが前記基本特徴量に対応するものとして記憶
する。すなわち、代表カテゴリには、少なくとも、それ
に対応する類似文字カテゴリ群に属するすべての文字カ
テゴリの数の基本特徴量が対応するとして記憶されてい
る。なお、1つの文字カテゴリについて複数のサンプル
文字の画像から複数の特徴量を抽出して、それらすべて
を当該文字カテゴリに対応する複数の基本特徴量として
記憶してもよい、または、前記複数の特徴量から、例え
ば平均値のような代表値を設定して、これを当該文字カ
テゴリに対応する基本特徴量として記憶してもよい。
【0020】また、単語辞書部6dには、図3のように
全国の地名単語の表記とその属性情報を記憶させてお
き、文法辞書部6eには、図4のように地名単語の階層
構造を記憶させておく。
【0021】次に、認識時の動作について説明する。ま
ず、画像入力手段1で認識すべき文字列の文書画像を入
力する。入力された画像の一例を図5に示す。そして、
文字切り出し手段2にて1文字分の画像を切り出した
後、特徴量抽出手段3において1文字分の画像から特徴
量を抽出する。そして、候補選出手段5において、記憶
されている基本特徴量が、1文字分の画像から抽出され
た特徴量に近い順に第N候補まで(本実施の形態ではN
=5としている)の文字カテゴリを候補文字カテゴリと
して選定する。前述したように、類似文字カテゴリ群に
属する文字カテゴリは代表カテゴリとして記憶されてい
るので、選定された候補文字カテゴリは、代表カテゴ
リ、もしくは、類似文字カテゴリ群に属さない文字カテ
ゴリとなる。したがって、選定された候補文字カテゴリ
は、候補文字カテゴリ自身が、候補として選出され、出
力される。又、選出された候補とともに、各候補に対応
する基本特徴量と前記抽出された特徴量との近さから求
められる数値を、各候補の信頼度として出力する。ただ
し、同一の代表カテゴリを重複して出力しないように、
同一の類似文字カテゴリ群の代表カテゴリに対応する複
数の基本特徴量については、前記抽出された特徴量に最
も近いもののみが選定されるようになっている。この動
作を切り出した全ての文字について行うので、図5に示
す文字列の画像を対象とした場合には、候補の出力は、
文字列全体としては、図6に示すような候補選出結果の
配列となり、この配列を、各候補毎の信頼度とともに、
辞書参照手段6中の単語照合部6aに出力する。
【0022】そして、単語照合部6aでは、類似文字情
報記憶部4bと単語辞書部6dを使用して地名候補単語
を抽出する。まず、候補選出結果配列中に、類似文字情
報記憶部4bにおいて記憶された代表カテゴリが存在す
るかどうか探索する。存在した場合は、その代表カテゴ
リに対応づけられた類似文字カテゴリ群の各要素と置換
する。また、代表カテゴリの信頼度を類似文字カテゴリ
群の各要素にも適用する。図6の配列を順に見ていく
と、1文字目の第1候補「ト」は代表カテゴリとなって
いるので、類似文字カテゴリ群の要素「ト」と「ド」に
置換する。次に第2候補「ヤ」は代表カテゴリとなって
いるので、類似文字カテゴリ群の要素「ヤ」と「ャ」に
置換する。このようにして、認識結果配列中にあるすべ
ての代表カテゴリを、対応する類似文字カテゴリ群の要
素に置換した後、単語辞書6d中の単語と照合する。こ
の場合は、「トウキョウ(東京)」、「ナカノ(中
野)」、「エコダ(江古田)」という単語を正しく照合
できる。これらの単語以外に他の単語も同時に照合され
るが、照合された単語はすべて候補単語格納部6bに格
納される。そして、後処理部6cにおいて、候補単語格
納部6bに格納された単語の中から文法辞書部6eを利
用して接続可能な単語を探す。その結果、後処理部6c
は、最終候補文字列として「トウキョウトナカノクエコ
ダ」を出力する。以上により、正しい認識結果が得られ
ることが分かる。
【0023】本実施の形態においては、類似文字情報記
憶手段4で、類似文字カテゴリ群とその類似文字カテゴ
リ群を代表するカテゴリを定義し、それらを保持してお
く。そして、前述したように、候補選出手段5では、類
似文字カテゴリ群に属する文字カテゴリはすべて、対応
する代表カテゴリとして処理している。よって、候補選
出手段5においては、代表カテゴリに対応する類似文字
カテゴリをそれぞれ異なる別のカテゴリとして処理する
場合に比べて、処理時間を短くすることが出来るととも
に、類似文字カテゴリを細かく分類する必要がなくなる
ので誤認識が減少する。つまり、従来の類似文字辞書を
用いて認識結果に候補文字を追加する方法と比べて、認
識結果に代表カテゴリ(インデックス文字)が存在する
可能性が高くなる。よって、単語照合部6aにおいて、
代表カテゴリと類似文字カテゴリ群の要素を置換するこ
とにより、単語の照合の失敗を減少させることが出来
る。
【0024】また、日本の地名、人名には、「エコダ」
と「エゴタ」、「イバラギ」と「イバラキ」等のよう
に、同じ漢字表記でも濁点を付けて読む場合と、付けな
いで読む場合が多数存在する。従来の方法では、辞書に
複数の読みを登録しなければならなかったが、本実施の
形態では、辞書は片方の読みだけでよく、候補文字の中
に代表カテゴリが存在する可能性は高くなるという利点
がある。
【0025】なお、本実施の形態では、カタカナで表記
された住所文字列を認識対象としたが、ひらがな表記の
ものでもよく、住所文字列ではなく、人名文字列でもよ
い。
【0026】また、代表カテゴリを類似文字カテゴリ群
中の一つのカテゴリを選んだが、同じ類似文字カテゴリ
群中の他のカテゴリでもよいし、設計者が新たに定義し
たカテゴリでもよい。
【0027】なお、本発明の候補選出手段は、第1の実
施の形態においては、各候補の基本特徴量と抽出された
特徴量との近さから求められる数値を、各候補毎の信頼
度として、各候補とともに出力するとして説明したが、
信頼度の出力は行わず、各候補のみの出力としてもよ
い。
【0028】また、本発明の候補選出手段は、第1の実
施の形態においては、文字カテゴリが類似文字カテゴリ
群に属している場合は、当該文字カテゴリの替わりに、
それが属する類似文字カテゴリ群の代表カテゴリが基本
特徴量に対応するものとして記憶し、代表カテゴリが候
補文字カテゴリとして選定されると、代表カテゴリ自身
を候補として選出して出力するとして説明したが、これ
に限らず、例えば、全ての文字カテゴリ各々に対応して
基本特徴量を記憶し、抽出された特徴量に近い基本特徴
量に対応する文字カテゴリ自身を候補文字カテゴリとし
て選定し、前記選定された候補文字カテゴリが類似文字
カテゴリ群に属する場合は、その類似文字カテゴリ群に
対応する代表カテゴリを候補として選出して出力すると
してもよい。
【0029】さらに、本発明の候補選出手段は、第1の
実施の形態においては、代表カテゴリが候補文字カテゴ
リとして選定されると、前記代表カテゴリ自身を各文字
毎の候補として選出して出力するとして説明したが、こ
れに限らず、例えば、類似文字カテゴリ群を特定する記
号を出力するとしてもよい、要するに、選出した基本特
徴量が属する類似文字カテゴリ群を辞書参照手段に認識
させることができさえすればよい。
【0030】また、本発明の対応関係は、第1の実施の
形態においては、文字カテゴリと、前記文字カテゴリ毎
に抽出された特徴量をもとに設定された少なくとも1つ
の基本特徴量との対応づけとして、候補選出手段に記憶
されているとして説明したが、これに限らず、例えば、
ニューラルネットワークにおいて、学習によって形成さ
れた、特徴量空間における各文字カテゴリ間の境界とし
て記憶されているとしてもよい、この場合、各候補毎の
信頼度はニューラルネットワークの出力の大きさから求
められる数値となる。さらに、本発明の対応関係は、候
補選出手段に記憶されている必要はなく、別の記憶手段
に記憶されていてもよい。
【0031】また、本発明の類似文字情報記憶手段は、
第1の実施の形態においては、類似文字情報入力部と類
似文字情報記憶部とを有するとして説明したが、これに
限るものではなく、要するに、文字カテゴリ毎の基本字
体の特徴量である基本特徴量が類似している前記文字カ
テゴリの集合である類似文字カテゴリ群を複数個記憶す
る手段でありさえすればよい。
【0032】また、本発明の文字カテゴリは、第1の実
施の形態においては、認識の対象とするもののうち、類
似文字カテゴリ群に属さない文字カテゴリが存在すると
して説明したが、類似の文字カテゴリがないものについ
ても単独の文字カテゴリのみで類似文字カテゴリ群を構
成し、認識の対象とする全ての文字カテゴリは、前記類
似文字カテゴリ群のいずれかに属しているとしてもよ
い。
【0033】また、本発明の文字認識装置は、第1の実
施の形態においては、画像入力手段と、文字切り出し手
段と、特徴量抽出手段とを備えるとして説明したが、こ
れに限らず、これらの手段を備えることなしに、別の装
置を介して文字画像から抽出された各文字毎の特徴量を
受け取るとしてもよい、すなわち、少なくとも本発明の
類似文字情報記憶手段と候補選出手段と辞書参照手段と
を備え、第1の実施の形態の他の手段が有する機能は、
別の装置に行わせるとしてもよい。
【0034】さらに、本発明の基本特徴量は、第1の実
施の形態においては、全ての文字カテゴリ各々に対応す
るサンプル文字の画像の特徴量を特徴量抽出手段によっ
て抽出し、これらを各文字カテゴリに対応する基本特徴
量として、候補選出手段に記憶させるとして説明した
が、これに限らず、抽出を行わず、別の装置によって作
成された基本特徴量のデータベースを候補選出手段もし
くは別の記憶手段に記憶させるとしてもよい。
【0035】(第2の実施の形態)次に、本発明の第2
の実施の形態を図面を参照して説明する。図7は、本発
明の第2の実施の形態における文字認識装置の構成図で
ある。本実施の形態における文字認識装置は、図7に示
すように、画像入力手段1,文字切り出し手段2,特徴
量抽出手段3,候補選出手段5,辞書参照手段6,訂正
手段7で構成されている。また、辞書参照手段6は、単
語照合部6a,候補単語格納部6b,後処理部6c,単
語辞書部6d,文法辞書部6e,単語付随情報記憶部6
fで構成され、訂正手段7は、結果表示部7a,訂正情
報入力部7bで構成されている。
【0036】次に、このような本実施の形態における文
字認識装置の動作について、カタカナ人名を認識対象と
する場合を例にとって説明する。
【0037】最初に、候補選出手段5に必要な情報を記
憶させる動作について説明する。あらかじめ、認識対象
の全文字カテゴリのサンプル文字の画像を画像入力手段
1において入力する。次に文字切り出し手段2において
1文字分の画像を切り出した後、特徴量抽出手段3にお
いて1文字分の画像から特徴量を抽出する。候補選出手
段5は、これらの特徴量を各文字カテゴリに対応する基
本特徴量として記憶する。この動作をサンプル文字数分
繰り返す。また、単語辞書部6dには図8に示すような
カナ表記の人名データを記憶させておき、単語付随情報
記憶部6fには単語辞書部6dに対応する、図9に示す
ような漢字表記の人名データを記憶させておく。ただ
し、漢字表記は、カナ漢字変換に用いるものでないた
め、同じ読みで漢字表記が異なるものは、どれか1つの
みを選んでおけばよい。また、文法辞書部6eには人名
が認識対象であり、接続情報は考えなくてよいため、今
回の認識例については、何も記憶させておく必要はな
い。
【0038】次に、認識時の動作について説明する。ま
ず、画像入力手段1で認識すべき文字列の文書画像を取
り込む。取り込んだ画像を図10に示す。そして、文字
切り出し手段2にて1文字分の画像を切り出した後、特
徴量抽出手段3において1文字分の画像から特徴量を抽
出する。そして、候補選出手段5において、記憶済みの
基本特徴量を、1文字分の画像から抽出された特徴量に
近い順に第N候補まで(本実施の形態ではN=5として
いる)選出し、これらに対応する文字カテゴリを各文字
毎の候補として出力するとともに、各候補の基本特徴量
と前記抽出された特徴量との近さから求められる数値
を、各候補毎の信頼度として出力する。この動作を切り
出した全ての文字について行うので、図10に示す文字
列の画像を対象とした場合には、候補の出力は、文字列
全体としては、図11に示すような候補選出結果の配列
となり、この配列を、各候補毎の信頼度とともに、辞書
参照手段6中の単語照合部6aに出力する。
【0039】そして、単語照合部6aでは、候補選出結
果配列の文字と単語辞書6d中の単語を照合し、人名候
補単語を抽出する。単語照合部6aにおいて抽出された
単語は、候補単語格納部6bに蓄えられる。本来なら、
後処理部6cは、候補単語格納部6bに格納された単語
の中から文法辞書部6eを利用して接続可能な単語を探
すことになるが、前述したように、今回の認識例は人名
が認識対象であり、接続情報は考えなくてよいため、文
法辞書部6eには、何も記憶させていない。したがっ
て、後処理部6cは、候補単語格納部6bに蓄えられた
候補単語全てを、最終候補文字列として、単語スコアの
高い順に出力する。ここで、単語スコアは、候補選出手
段5において出力された各文字の信頼度の和とする。結
果表示部7aは、図12に示すように、入力文字列と、
後処理部6cで出力された最終候補文字列である候補単
語と、単語付随情報記憶部6fに記憶された各候補単語
に対応する漢字表記を補助情報として同時に表示する。
そして、修正者は、結果表示部7aに表示された結果を
見て、正しく後処理が行われているか判断し、間違って
いれば訂正情報入力部7bにおいて、訂正情報を入力す
る。
【0040】本実施の形態においては、単語辞書部6d
に単語のカナ表記を蓄えておくと共に、単語付随情報記
憶部6fに付随情報として単語辞書部6dに蓄えられた
単語の漢字表記を蓄えておく。そして、後処理の結果を
修正者が目視しながら修正する際に、入力文字画像と後
処理結果を表示するのと同時に漢字表記を表示すること
によって、修正者が見ても紛らわしい類似文字を直感的
に区別することが出来る。
【0041】なお、本実施の形態では、カタカナで表記
された人名文字列を認識対象としたが、ひらがな表記の
ものでもよく、人名文字列ではなく、住所文字列でもよ
い。
【0042】また、本発明の候補選出手段は、第2の実
施の形態においては、各候補の基本特徴量と抽出された
特徴量との近さの度合いを、各候補毎の信頼度として、
各候補とともに出力するとして説明したが、信頼度の出
力は行わず、各候補のみの出力としてもよい。
【0043】また、本発明の確からしさの度合いは、第
2の実施の形態においては、各候補の基本特徴量と抽出
された特徴量との近さから求められる数値であるとして
説明したが、これに限らず、例えば、文字カテゴリとそ
れに対応する特徴量との対応関係を、ニューラルネット
ワークにおいて、特徴量空間における各文字カテゴリ間
の境界として取り扱っている場合は、ニューラルネット
ワークの出力の大きさから求められる数値であるとして
もよい。
【0044】また、本発明の文字認識装置は、第2の実
施の形態においては、画像入力手段と、文字切り出し手
段と、特徴量抽出手段とを備えるとして説明したが、こ
れに限らず、これらの手段を備えることなしに、別の装
置を介して文字画像から抽出された各文字毎の特徴量を
受け取るとしてもよい、すなわち、少なくとも本発明の
辞書参照手段と訂正手段を備え、第2の実施の形態の他
の手段が有する機能は、別の装置に行わすとしてもよ
い。
【0045】さらに、本発明の基本特徴量は、第2の実
施の形態においては、全ての文字カテゴリの基本字体の
画像の特徴量を特徴量抽出手段によって抽出し、これら
を各文字カテゴリに対応する基本特徴量として、候補選
出手段に記憶させるとして説明したが、これに限らず、
記憶を行わず、別の装置によって作成された基本特徴量
のデータベースを候補選出手段に記憶させるとしてもよ
い。
【0046】なお、本発明の訂正手段は、第2の実施の
形態においては、第1の実施の形態のような本発明の類
似文字情報記憶手段を用いない場合に適用するとして説
明したが、これに限らず、本発明の類似文字情報記憶手
段を用いる場合においても適用が可能である。
【0047】なお、上述した第1および第2の実施の形
態においては、本発明の文字認識装置を中心に説明した
が、本発明の媒体は、上述した各手段の全部または一部
をコンピュータに実行させるプログラムを格納するもの
である。
【0048】
【発明の効果】以上説明したところから明らかなよう
に、請求項1の本発明は、候補文字中に正解文字が含ま
れない状態を回避させることにより、類似文字を効率よ
く高精度に認識する文字認識装置を提供することができ
る。
【0049】また、請求項15の本発明は、修正者に直
感的にわかりやすい表示を行うことにより、適切な訂正
が行える文字認識装置を提供することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態における文字認識装
置の構成図。
【図2】本発明の第1の実施の形態における文字認識装
置の類似文字情報記憶部4bに記憶される情報を示す
図。
【図3】本発明の第1の実施の形態における文字認識装
置の単語辞書部6dが有する情報を示す図。
【図4】本発明の第1の実施の形態における文字認識装
置の文法辞書部6eが有する情報を示す図。
【図5】本発明の第1の実施の形態における文字認識装
置の画像入力手段1で入力された文書画像を示す図。
【図6】本発明の第1の実施の形態における文字認識装
置の候補選出手段5で出力された認識結果を示す図。
【図7】本発明の第2の実施の形態における文字認識装
置の構成図。
【図8】本発明の第2の実施の形態における文字認識装
置の単語辞書部6dが有する情報を示す図。
【図9】本発明の第2の実施の形態における文字認識装
置の単語付随情報記憶部6fが有する情報を示す図。
【図10】本発明の第2の実施の形態における文字認識
装置の画像入力手段1で入力された文書画像を示す図。
【図11】本発明の第2の実施の形態における文字認識
装置の候補選出手段5で出力された認識結果を示す図。
【図12】本発明の第2の実施の形態における文字認識
装置の結果表示部7aにおいて表示される情報を示す
図。
【図13】従来の技術における類似性文字辞書を示す
図。
【図14】従来の技術における文字属性テーブルを示す
図。
【図15】従来の技術において、認識結果とその文字の
属性情報を同時に表示していることを示す図。
【符号の説明】
1 画像入力手段 2 文字切り出し手段 3 特徴量抽出手段 4 類似文字情報記憶手段 4a 類似文字情報入力部 4b 類似文字情報記憶部 5 候補選出手段 6 辞書参照手段 6a 単語照合部 6b 候補単語格納部 6c 後処理部 6d 単語辞書部 6e 文法辞書部 6f 単語付随情報記憶部 7 訂正手段 7a 結果表示部 7b 訂正情報入力部

Claims (22)

    【特許請求の範囲】
  1. 【請求項1】 文字画像の形状を数値化して表現した特
    徴量が、特徴量空間内において近い関係にある文字カテ
    ゴリの集合である類似文字カテゴリ群を複数個記憶する
    類似文字情報記憶手段と、認識の対象となる文字列に含
    まれる文字の文字画像から抽出された特徴量をもとに、
    前記文字に対応する類似文字カテゴリ群を選出する候補
    選出手段と、前記候補選出手段によって前記文字列の各
    々の文字に対して選出された前記類似文字カテゴリ群に
    属する各々の前記文字カテゴリ同士の組合せから、辞書
    を参照して、前記文字列の文字を認識する辞書参照手段
    とを備えることを特徴とする文字認識装置。
  2. 【請求項2】 前記文字カテゴリは、複数の前記類似文
    字カテゴリ群に重複して属さないことを特徴とする請求
    項1に記載の文字認識装置。
  3. 【請求項3】 前記候補選出手段は、前記文字カテゴリ
    あたり少なくとも1つの、学習用にあらかじめ用意され
    た前記文字画像から抽出された前記特徴量と、前記文字
    カテゴリとの対応関係を参照することによって、前記類
    似文字カテゴリ群を選出し、前記対応関係は、前記文字
    カテゴリ毎に抽出された前記特徴量をもとに設定された
    少なくとも1つの基本特徴量と、それに対応する前記文
    字カテゴリとの対応づけとして記憶されていることを特
    徴とする請求項1または2に記載の文字認識装置。
  4. 【請求項4】 前記候補選出手段は、前記文字カテゴリ
    あたり少なくとも1つの、学習用にあらかじめ用意され
    た前記文字画像から抽出された前記特徴量と、前記文字
    カテゴリとの対応関係を参照することによって、前記類
    似文字カテゴリ群を選出し、前記対応関係は、ニューラ
    ルネットワークにおいて、学習によって形成された、前
    記特徴量空間における前記各文字カテゴリ間の境界とし
    て記憶されていることを特徴とする請求項1または2に
    記載の文字認識装置。
  5. 【請求項5】 前記候補選出手段は、前記対応関係を参
    照することによって、前記抽出された特徴量に対応する
    前記文字カテゴリを候補文字カテゴリとして選定し、前
    記選定された前記候補文字カテゴリが対応する前記類似
    文字カテゴリ群を選出し、前記辞書参照手段は、前記候
    補選出手段によって選出された前記類似文字カテゴリ群
    を前記文字列に対応して並べ、それらの前記類似文字カ
    テゴリ群に属する前記各文字カテゴリを組合わせること
    を特徴とする請求項3または4に記載の文字認識装置。
  6. 【請求項6】 前記類似文字カテゴリ群は、少なくとも
    一つの前記文字カテゴリから構成された前記集合であ
    り、前記文字カテゴリは、前記類似文字カテゴリ群のい
    ずれかに属していることを特徴とする請求項5に記載の
    文字認識装置。
  7. 【請求項7】 前記類似文字カテゴリ群に属さない文字
    カテゴリである非類似文字カテゴリが存在し、前記候補
    選出手段は、前記対応関係を参照することによって、前
    記抽出された特徴量に対応する前記文字カテゴリを候補
    文字カテゴリとして選定し、前記選定された前記候補文
    字カテゴリが前記非類似文字カテゴリである場合は、前
    記候補文字カテゴリ自身を選出し、前記選定された前記
    候補文字カテゴリに対応する前記類似文字カテゴリ群が
    存在する場合は、その前記類似文字カテゴリ群を選出
    し、前記辞書参照手段は、前記候補選出手段によって選
    出された前記類似文字カテゴリ群および/または前記非
    類似文字カテゴリ自身を前記文字列に対応して並べ、前
    記類似文字カテゴリ群に属する前記各文字カテゴリおよ
    び/または前記非類似文字カテゴリ自身を組合わせるこ
    とを特徴とする請求項3または4に記載の文字認識装
    置。
  8. 【請求項8】 前記類似文字情報記憶手段は、前記類似
    文字カテゴリ群と共にそのインデックスである代表カテ
    ゴリを前記類似文字カテゴリ群に対応づけて記憶し、前
    記候補選出手段は、前記選定された前記候補文字カテゴ
    リに対応する前記類似文字カテゴリ群が存在する場合
    は、前記代表カテゴリを選出し、前記辞書参照手段は、
    前記代表カテゴリをもとに前記類似文字情報記憶手段か
    ら、前記類似文字カテゴリ群に属する前記各文字カテゴ
    リを呼び出すことを特徴とする請求項5〜7のいずれか
    に記載の文字認識装置。
  9. 【請求項9】 前記類似文字情報記憶手段は、前記類似
    文字カテゴリ群と前記代表カテゴリと両者の対応づけと
    を入力する類似文字情報入力部と、それらを記憶する類
    似文字情報記憶部とを有することを特徴とする請求項8
    に記載の文字認識装置。
  10. 【請求項10】 前記対応関係は、前記文字カテゴリが
    前記類似文字カテゴリ群に属している場合は、前記文字
    カテゴリ自身の替わりに、前記文字カテゴリ自身が属す
    る前記類似文字カテゴリ群の前記代表カテゴリを、前記
    特徴量に対応する文字カテゴリとして、記憶されている
    ことを特徴とする請求項8または9に記載の文字認識装
    置。
  11. 【請求項11】 前記辞書参照手段は、前記辞書の情報
    の一部である単語表記情報を記憶する単語辞書部と、前
    記辞書の情報の一部である単語接続情報を記憶する文法
    辞書部と、前記候補選出手段によって出力された前記類
    似文字カテゴリ群および/または前記非類似文字カテゴ
    リ自身を前記文字列に対応して並べ、前記類似文字カテ
    ゴリ群に属する前記各文字カテゴリおよび/または前記
    非類似文字カテゴリ自身を組合わせた後、前記単語表記
    情報と照合し、候補単語を選出する単語照合部と、前記
    候補単語を格納する候補単語格納部と、前記候補単語と
    前記単語接続情報とを参照して、最終候補文字列を選出
    して出力する後処理部とを有することを特徴とする請求
    項5〜10のいずれかに記載の文字認識装置。
  12. 【請求項12】 前記候補選出手段は、前記文字一文字
    に対して、同一の前記類似文字カテゴリ群を重複して選
    出しないことを特徴とする請求項1〜11のいずれかに
    記載の文字認識装置。
  13. 【請求項13】 前記候補選出手段は、前記類似文字カ
    テゴリ群および/または前記非類似文字カテゴリ自身
    を、前記類似文字カテゴリ群に属する前記文字カテゴリ
    または前記非類似文字カテゴリ自身に対応する前記基本
    特徴量が前記抽出された特徴量に近い順に、もしくは、
    前記ニューラルネットワークの出力が大きい順に、あら
    かじめ定めた個数だけ選出することを特徴とする請求項
    12に記載の文字認識装置。
  14. 【請求項14】 前記候補選出手段は、前記類似文字カ
    テゴリ群に属する前記文字カテゴリまたは前記非類似文
    字カテゴリ自身に対応する前記基本特徴量と前記抽出さ
    れた特徴量との近さから求められる数値を、もしくは、
    前記ニューラルネットワークの出力の大きさから求めら
    れる数値を、前記順番と共に信頼度として出力すること
    を特徴とする請求項13に記載の文字認識装置。
  15. 【請求項15】 前記文字列は、ひらがなおよび/また
    はカタカナを含み、前記類似文字カテゴリ群は、清音文
    字と前記清音文字に濁点または半濁点を付加した文字と
    の集合に対応する前記文字カテゴリの群を含むことを特
    徴とする請求項1〜14のいずれかに記載の文字認識装
    置。
  16. 【請求項16】 前記文字列は、アルファベット、ひら
    がな、カタカナのうちの少なくとも一つを含み、前記類
    似文字カテゴリ群は、実質的に同じ形をした大文字と小
    文字との集合に対応する前記文字カテゴリの群を含むこ
    とを特徴とする請求項1〜15のいずれかに記載の文字
    認識装置。
  17. 【請求項17】 前記文字列は、複数の字種で構成され
    ている場合があり、前記類似文字カテゴリ群は、異なる
    前記字種間で類似した文字の集合に対応する前記文字カ
    テゴリの群を含むことを特徴とする請求項1〜16のい
    ずれかに記載の文字認識装置。
  18. 【請求項18】 認識の対象となる文字列に含まれる各
    文字の文字画像をもとに選出された文字カテゴリである
    ところの候補文字の組合せから、辞書を参照して、最終
    候補文字列を選出する辞書参照手段と、前記最終候補文
    字列を訂正する訂正手段とを備え、前記辞書参照手段
    は、前記最終候補文字列を構成する単語に付随する単語
    付随情報を前記最終候補文字列に合わせて出力し、前記
    訂正手段は、前記最終候補文字または前記最終候補文字
    列と前記単語付随情報とを同時に表示する結果表示部
    と、訂正情報を入力する訂正情報入力部とを有し、前記
    単語付随情報は、前記訂正を適切に行うための情報であ
    ることを特徴とする文字認識装置。
  19. 【請求項19】 前記辞書参照手段は、前記辞書の情報
    の一部である単語表記情報を記憶する単語辞書部と、前
    記辞書の情報の一部である単語接続情報を記憶する文法
    辞書部と、前記文字列の前記各文字に対応する前記候補
    文字を組み合わせ、前記単語表記情報と照合し、候補単
    語を選出する単語照合部と、前記候補単語を格納する候
    補単語格納部と、前記単語付随情報を記憶する単語付随
    情報記憶部と、前記候補単語と前記単語接続情報とを参
    照して、前記最終候補文字列を選出して出力する後処理
    部とを有することを特徴とする請求項18に記載の文字
    認識装置。
  20. 【請求項20】 前記文字列の一文字毎の文字画像から
    抽出された特徴量をもとに、前記文字列の一文字毎に対
    応する少なくとも1つの候補文字を選出する候補選出手
    段を備え、前記候補選出手段は、前記候補文字の選出が
    確からしい順番に、あらかじめ定めた個数の前記候補文
    字を選出して出力するとともに、前記確からしさの度合
    いを、前記順番と共に信頼度として出力し、前記辞書参
    照手段は、前記信頼度を加味して前記最終候補文字列を
    出力することを特徴とする請求項18または19に記載
    の文字認識装置。
  21. 【請求項21】 文書画像を入力する画像入力手段と、
    前記文書画像から前記文字画像を切り出す文字切り出し
    手段と、前記文字画像から前記特徴量を抽出する特徴量
    抽出手段とを備えることを特徴とする請求項1〜20の
    いずれかに記載の文字認識装置。
  22. 【請求項22】 請求項1〜21のいずれかに記載の前
    記各手段の機能の全部または一部をコンピュータに実行
    させるプログラムを格納することを特徴とする媒体。
JP9285524A 1997-10-17 1997-10-17 文字認識装置および媒体 Pending JPH11120294A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9285524A JPH11120294A (ja) 1997-10-17 1997-10-17 文字認識装置および媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9285524A JPH11120294A (ja) 1997-10-17 1997-10-17 文字認識装置および媒体

Publications (1)

Publication Number Publication Date
JPH11120294A true JPH11120294A (ja) 1999-04-30

Family

ID=17692654

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9285524A Pending JPH11120294A (ja) 1997-10-17 1997-10-17 文字認識装置および媒体

Country Status (1)

Country Link
JP (1) JPH11120294A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015041371A (ja) * 2013-08-23 2015-03-02 株式会社ダイフク 物品情報認識装置
CN110928915A (zh) * 2018-08-31 2020-03-27 北京京东金融科技控股有限公司 中文姓名模糊匹配的方法、装置、设备及可读存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6414684A (en) * 1987-07-08 1989-01-18 Hitachi Ltd Displaying and selecting method for same shape different character type character of hand-written character recognizing device
JPH0546803A (ja) * 1991-08-20 1993-02-26 Ricoh Co Ltd 認識結果の出力方法
JPH05274482A (ja) * 1992-03-27 1993-10-22 Oki Electric Ind Co Ltd 数字列混在文書の文字認識の後処理方法
JPH064717A (ja) * 1992-06-19 1994-01-14 Pfu Ltd 漢字住所補正処理方法
JPH0773276A (ja) * 1993-09-07 1995-03-17 Matsushita Electric Ind Co Ltd 文字認識装置
JPH087046A (ja) * 1994-06-22 1996-01-12 Matsushita Electric Ind Co Ltd 文書認識装置
JPH08101880A (ja) * 1994-09-30 1996-04-16 Ricoh Co Ltd 文字認識装置
JPH0981665A (ja) * 1995-09-20 1997-03-28 Canon Inc 文字入力装置及びその方法
JPH09171539A (ja) * 1995-12-20 1997-06-30 Oki Electric Ind Co Ltd 文字認識装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6414684A (en) * 1987-07-08 1989-01-18 Hitachi Ltd Displaying and selecting method for same shape different character type character of hand-written character recognizing device
JPH0546803A (ja) * 1991-08-20 1993-02-26 Ricoh Co Ltd 認識結果の出力方法
JPH05274482A (ja) * 1992-03-27 1993-10-22 Oki Electric Ind Co Ltd 数字列混在文書の文字認識の後処理方法
JPH064717A (ja) * 1992-06-19 1994-01-14 Pfu Ltd 漢字住所補正処理方法
JPH0773276A (ja) * 1993-09-07 1995-03-17 Matsushita Electric Ind Co Ltd 文字認識装置
JPH087046A (ja) * 1994-06-22 1996-01-12 Matsushita Electric Ind Co Ltd 文書認識装置
JPH08101880A (ja) * 1994-09-30 1996-04-16 Ricoh Co Ltd 文字認識装置
JPH0981665A (ja) * 1995-09-20 1997-03-28 Canon Inc 文字入力装置及びその方法
JPH09171539A (ja) * 1995-12-20 1997-06-30 Oki Electric Ind Co Ltd 文字認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015041371A (ja) * 2013-08-23 2015-03-02 株式会社ダイフク 物品情報認識装置
CN110928915A (zh) * 2018-08-31 2020-03-27 北京京东金融科技控股有限公司 中文姓名模糊匹配的方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
US20210034850A1 (en) System and method of character recognition using fully convolutional neural networks with attention
KR100292098B1 (ko) 문자 인식 장치 및 방법
US6950555B2 (en) Holistic-analytical recognition of handwritten text
JP2726568B2 (ja) 文字認識方法及び装置
JP3452774B2 (ja) 文字認識方法
WO2018090013A1 (en) System and method of character recognition using fully convolutional neural networks with attention
WO2000036530A1 (fr) Methode de recherche et dispositif correspondant, support enregistre
JPH11120294A (ja) 文字認識装置および媒体
JP3274014B2 (ja) 文字認識装置および文字認識方法
JP2002063197A (ja) 検索装置、記録媒体およびプログラム
JPH07302306A (ja) 文字入力装置
JP2903779B2 (ja) 文字列認識方法及びその装置
JPH08153164A (ja) 手書き文字認識方法及び装置
JP2677271B2 (ja) 文字認識装置
JPH10134141A (ja) 文書照合装置および方法
JP3138665B2 (ja) 手書き文字認識方式および記録媒体
JPH0981690A (ja) 手書き文字オンライン認識装置とその字体登録・学習方法
JPH05298495A (ja) 文字認識装置と誤認識文字修正方法並びに欧文文書処理装置
JPH0458381A (ja) 光学的文字読取装置
JPH05298489A (ja) 文字認識方式
JPH0728944A (ja) 英文字認識装置
JPH0546806A (ja) 文字認識方法
JPS60225987A (ja) パタ−ン認識装置
JPH0765110A (ja) 光学的文字読取装置
JPH0576672B2 (ja)