JP3350127B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3350127B2
JP3350127B2 JP05191893A JP5191893A JP3350127B2 JP 3350127 B2 JP3350127 B2 JP 3350127B2 JP 05191893 A JP05191893 A JP 05191893A JP 5191893 A JP5191893 A JP 5191893A JP 3350127 B2 JP3350127 B2 JP 3350127B2
Authority
JP
Japan
Prior art keywords
character
candidate
unit
phrase
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP05191893A
Other languages
English (en)
Other versions
JPH06266906A (ja
Inventor
寿男 丹羽
一弘 萱嶋
泰治 〆木
英嗣 前川
哲 伊藤
良宏 小島
浩司 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP05191893A priority Critical patent/JP3350127B2/ja
Publication of JPH06266906A publication Critical patent/JPH06266906A/ja
Priority to US08/513,294 priority patent/US6041141A/en
Priority to US08/965,534 priority patent/US5987170A/en
Application granted granted Critical
Publication of JP3350127B2 publication Critical patent/JP3350127B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字を読みとるための
文字認識装置に関するものである。
【0002】
【従来の技術】近年、データベースの発展に伴い、高速
で認識率の高い文字認識装置に対する要求が高まってい
る。
【0003】従来の文字認識装置としては、例えば、特
開平2-214990号広報に示されているような、図9に示し
た文字認識装置が提案されている。文字訂正部8は、文
字認識部1から1文字に付きN個の候補文字を入力とし
て受け取る。自動訂正部61は、候補文字と訂正規則テ
ーブル63を比較し訂正規則により文字を訂正する。自
動訂正部61の訂正出力結果は操作者に表示され、操作
者は誤って認識された文字を訂正する。この訂正の操作
の情報をもとに、手動訂正制御部62で訂正規則を作
り、この規則を訂正規則テーブル63に登録し、以降の
認識結果に訂正規則を適用して認識誤りを自動訂正す
る。これにより、操作者が行った訂正をもとに、文書の
フォントに合わせた文字認識を行うことができる。
【0004】
【発明が解決しようとする課題】しかしながら、上記の
文字認識装置では、操作者が行った訂正をもとに訂正規
則テーブルを作成するために、人手をかけずに自動的に
訂正規則を作成することができない。
【0005】本発明は、このような従来の課題を解決す
るもので、知識処理を用いて修正された文字列をもと
に、文字認識部の認識辞書を自動的に再構成し、これに
より自動的に文書のフォントに合った認識を行い、文字
認識率を高くすることを目的としている。
【0006】
【課題を解決するための手段】本発明は上記目的を達成
するために、文字修正部において訂正された文字を、文
字認識部における候補文字と比較することにより、文字
認識部の誤り易い文字を抽出する。抽出された文字は文
字認識部に送られ、この文字をもとに文字認識部におけ
る認識辞書を再構成することにより、文字認識部の処理
を認識対象の文書の文字に適応させ、認識誤りをなくす
る。
【0007】
【作用】本発明は上記した構成により、文字修正部が文
字を訂正した情報から、文字認識部の誤り易い文字を抽
出し、この文字をもとに文字認識部の認識辞書を再構成
する。これにより、文字認識部における認識誤りが減
り、文字認識率が向上する。
【0008】
【実施例】以下、本発明の第1の発明の実施例について
説明する。図1にこの実施例の文字認識装置の全体の構
成を示す。文字認識部1は、認識辞書16を用いて文書
画像10より文字認識を行い、1文字につき第1候補文
字から第n候補文字までのn個の候補文字を持つ候補文
字集合を出力する。
【0009】単語検索部2は、単語辞書6を検索するこ
とにより候補文字集合11の組み合せの中から、単語辞
書6に存在する単語と一致する候補文字の組み合せであ
る候補単語集合12を選び出す。文節検索部3は、文法
辞書7を参照して候補単語集合12から文節となりえる
単語の組み合せ候補文節集合13を選び出す。文節評価
値演算部4は、文節検索部3で検索された文節の語彙的
および文法的な正しさを文節中の単語の長さや頻度を基
準として評価値を計算する。文節選択部5は、文節の候
補の中で評価値の最も大きい文節を選択し、修正文字列
14を出力する。
【0010】候補文字比較部9は、修正文字列14と候
補文字集合11を比較し、修正文字列と候補文字集合の
第1候補文字とが異なる文字を抽出し、追加学習文字1
5として文字認識部1に送る。
【0011】上記の構成の文字認識装置において次のよ
うにして文字認識を行う。まず、認識対象の文書画像1
0を文字認識部1で認識辞書16を用いて文字認識し
て、1文字につき第1候補文字から第n候補文字までの
n個の候補文字を持つ候補文字集合を出力する。
【0012】さらに、単語検索部2で、単語辞書6を検
索することにより候補文字集合11の組み合せの中か
ら、単語辞書6に存在する単語と一致する候補文字の組
み合せである候補単語集合12を選び出す。さらに、文
節検索部3で、文法辞書7を参照して候補単語集合12
から文節となりえる単語の組み合せである候補文節集合
13を選び出す。文節検索部3で検索された文節の語彙
的および文法的な正しさを文節中の単語の長さや頻度な
どを基準として文節評価値を計算する。文節評価値を求
めた候補文節に対して文節評価値を基準にして、文節選
択部5で正しい文節の組み合せを選択し修正文字列14
を出力する。
【0013】候補文字比較部9は、修正文字列14と候
補文字集合11の比較を行う。同じ文字位置の修正文字
列の文字と候補文字集合の第1候補文字を比較し、これ
らの二つの文字が異なれば、追加学習文字15として出
力する。
【0014】文字認識部1は、追加学習文字15を受け
取り、追加学習文字の文字画像と修正文字列の文字か
ら、追加学習文字が認識できるように認識辞書16に追
加学習文字15の辞書を追加する。
【0015】これにより、文字認識部1における初めの
文字認識で認識できなかった文字も認識辞書に追加文字
の辞書が追加されたことにより認識可能になる。
【0016】なお、文字認識部1における認識辞書16
への追加学習文字15の辞書への追加は、文字認識部1
をニューラルネットワークで構成してネットワークの重
みを追加学習によって変化させて処理を行っても良い。
【0017】また、本実施例では候補文字比較部9で、
修正文字列と第1候補文字との比較を行ったが、修正文
字と第m候補文字(1≦m≦i<n)とを比較し、修正
文字がi個の候補文字の中に含まれていなかったら、修
正文字を追加学習文字15として出力するようにしても
良い。
【0018】次に、本発明の第2の発明の実施例につい
て説明する。図2にこの実施例の文字認識装置の全体の
構成を示す。
【0019】文字認識部1、単語検索部2、文節検索部
3、文節評価演算部4、文節選択部5、候補文字比較部
9は、第1の発明の実施例と同じである。
【0020】同文字抽出部21は、候補文字比較部から
出力された文字に対して、同じ文字を抽出し、さらにそ
の文字が異なる単語に含まれている場合に、その文字を
追加学習文字15として出力する。
【0021】上記の構成の文字認識装置において次のよ
うにして文字認識を行う。まず、認識対象の文書画像1
0を文字認識部1で認識辞書16を用いて文字認識し
て、1文字につき第1候補文字から第n候補文字までの
n個の候補文字を持つ候補文字集合を出力する。
【0022】さらに、単語検索部2で、単語辞書6を検
索することにより候補文字集合11の組み合せの中か
ら、単語辞書6に存在する単語と一致する候補文字の組
み合せである候補単語集合12を選び出す。さらに、文
節検索部3で、文法辞書7を参照して候補単語集合12
から文節となりえる単語の組み合せである候補文節集合
13を選び出す。文節検索部3で検索された文節の語彙
的および文法的な正しさを文節中の単語の長さや頻度な
どを基準として文節評価値を計算する。文節評価値を求
めた候補文節に対して文節評価値を基準にして、文節選
択部5で正しい文節の組み合せを選択し修正文字列14
を出力する。
【0023】候補文字比較部9は、修正文字列14と候
補文字集合11の比較を行う。同じ文字位置の修正文字
列の文字と候補文字集合の第1候補文字を比較し、これ
らが異なる文字を出力する。
【0024】同文字抽出部21は、候補文字比較部9が
出力した文字に対して、同じ文字を抽出し、さらにその
文字が異なる単語に含まれている場合に、その文字を追
加学習文字15として出力する。例えば、文字修正部8
によって訂正文字列が図3に示すように出力されたと
き、候補文字比較部9は、文章の『文』、認識の
『認』、文法の『文』、訂正の『正』を出力する。これ
らの文字に対して、同文字抽出部は、文章の『文』と文
法の『文』が同じ文字であり、かつ異なる単語に含まれ
ているので、『文』を追加学習文字15として出力す
る。
【0025】文字認識部1は、追加学習文字15を受け
取り、追加学習文字の文字画像と修正文字列の文字か
ら、追加学習文字が認識できるように認識辞書16に追
加学習文字15の辞書を追加する。
【0026】これにより、文字認識部1における初めの
文字認識で認識できなかった文字も認識辞書に追加文字
の辞書が追加されたことにより認識可能になる。
【0027】なお、文字認識部1における認識辞書16
への追加学習文字15の辞書への追加は、文字認識部1
をニューラルネットワークで構成してネットワークの重
みを追加学習によって変化させて処理を行っても良い。
【0028】また、本実施例では候補文字比較部9で、
修正文字列と第1候補文字との比較を行ったが、修正文
字と第m候補文字(1≦m≦i<n)とを比較し、修正
文字がi個の候補文字の中に含まれていなかったら、修
正文字を追加学習文字15として出力するようにしても
良い。
【0029】次に、本発明の第3の発明の実施例につい
て説明する。図4にこの実施例の文字認識装置の全体の
構成を示す。
【0030】図5に図4の文字認識部1の構成を示す。
文字認識部1はニューラルネットワークにより、候補文
字を認識する。類似度計算部36は、文字画像と重み係
数37とから各文字との類似度を計算し、候補文字を出
力する。重み係数更新部38は、候補文字と追加学習文
字の誤差とをもとにして重み係数を更新することもでき
る。
【0031】なお、単語検索部2、文節検索部3、文節
評価値演算部4、文節選択部5は、第1の発明の実施例
と同じである。
【0032】図4のキーワード抽出部31は、文節選択
部5の出力の修正文字列14から認識対象の文書のキー
ワードを抽出し、キーワード集合35を作成する。キー
ワードの抽出は、例えば文書中の単語の頻度と一般の文
書における単語の頻度との差から求める。キーワード部
分一致検索部32は、得られたキーワード集合35と候
補文字集合11との部分一致検索を行う。例えば、キー
ワードとして、「認識」が抽出されていれば、修正文字
列14にある「認*」や「*識」が部分一致文字として
抽出される。候補単語付加部33は、部分一致したキー
ワードを候補単語集合に付加する。前述の例では、部分
一致した「認*」や「*識」が「認識」として候補単語
集合12に付加される。これによって、文字認識部1か
ら出力されなかった文字を文字訂正に用いることができ
る。
【0033】候補外文字検出部34は、文節選択部5が
出力した修正文字列14の中で、候補単語付加部33に
よって付加された候補外文字を検出し、その文字を追加
学習文字15として出力する。
【0034】上記の構成の文字認識装置において次のよ
うにして文字認識を行う。まず、認識対象の文書画像1
0を文字認識部1で図5に示した重み係数37を参照し
て類似度計算部36で、1文字につき第1候補文字から
第n候補文字までのn個の候補文字を持つ候補文字集合
を出力する。
【0035】さらに、単語検索部2で、単語辞書6を検
索することにより候補文字集合11の組み合せの中か
ら、単語辞書6に存在する単語と一致する候補文字の組
み合せである候補単語集合12を選び出す。さらに、文
節検索部3で、文法辞書7を参照して候補単語集合12
から文節となりえる単語の組み合せである候補文節集合
13を選び出す。文節検索部3で検索された文節の語彙
的および文法的な正しさを文節中の単語の長さや頻度な
どを基準として文節評価値を計算する。文節評価値を求
めた候補文節に対して文節評価値を基準にして、文節選
択部5で正しい文節の組み合せを選択し修正文字列14
を出力する。
【0036】次いで、キーワード抽出部31で、修正文
字列14からキーワード集合35を抽出する。
【0037】キーワード部分一致検索部32で、キーワ
ード集合35と候補文字集合11との部分一致検索を行
う。次に候補単語付加部33で、キーワード部分一致検
索部32で出力された単語を候補単語集合12に付加す
る。
【0038】再び、文節検索部3と文節評価値演算部4
で、付加された候補単語から候補文節を検索し、文節評
価値を求める。
【0039】さらに、文節選択部5で、文節の候補の中
で評価値の大きい文節を選択し、修正文字列14を出力
する。
【0040】候補外文字検出部34で、修正文字列14
の中で候補単語付加部33によって付加された文字を検
出し、その文字を追加学習文字15として出力する。
【0041】重み係数更新部38は、追加学習文字と候
補文字との誤差をもとに重み係数37を更新し、追加学
習を行う。
【0042】これにより、文字認識部1における初めの
文字認識で認識できなかった文字も認識辞書に追加文字
の辞書が追加されたことにより認識可能になる。
【0043】なお、文字認識部1は、ニューラルネット
ワークを用いない文字認識方式を用いてもよい。この方
式として例えば、各文字の平均値ベクトルを認識辞書と
して有し、それと画像との比較により文字を認識しても
よい。認識辞書を用いた場合は、追加された文字をもと
に認識辞書を再構築して、追加学習を行う。
【0044】次に、本発明の第4の発明の実施例につい
て説明する。図6にこの実施例の文字認識装置の全体の
構成を示す。
【0045】なお、文字認識部1、単語検索部2、文節
検索部3、文節評価値演算部4、文節選択部5は、第1
の発明の実施例と同じである。
【0046】また、キーワード抽出部31、キーワード
部分一致検索部32、候補外文字検出部34は、第4の
発明の実施例と同じである。
【0047】単語誤訂正度演算部41は、修正文字列1
4から訂正された単語が、誤訂正である確からしさ、す
なわち単語誤訂正度を計算する。リジェクト文字決定部
42は、単語誤訂正度演算部41が出力した単語誤訂正
度にもとづきリジェクト文字を決定する。候補単語付加
部43は、キーワード部分一致検索部32で検索された
キーワードの中で、リジェクト文字となっている文字を
候補単語集合に付加する。
【0048】上記の構成の文字認識装置において次のよ
うにして文字認識を行う。まず、認識対象の文書画像1
0を文字認識部1で認識辞書16を用いて文字認識し
て、1文字につき第1候補文字から第n候補文字までの
n個の候補文字を持つ候補文字集合を出力する。
【0049】さらに、単語検索部2で、単語辞書6を検
索することにより候補文字集合11の組み合せの中か
ら、単語辞書6に存在する単語と一致する候補文字の組
み合せである候補単語集合12を選び出す。さらに、文
節検索部3で、文法辞書7を参照して候補単語集合12
から文節となりえる単語の組み合せである候補文節集合
13を選び出す。文節検索部3で検索された文節の語彙
的および文法的な正しさを文節中の単語の長さや頻度な
どを基準として文節評価値を計算する。文節評価値を求
めた候補文節に対して文節評価値を基準にして、文節選
択部5で正しい文節の組み合せを選択し修正文字列14
を出力する。
【0050】次いで、キーワード抽出部31で、修正文
字列14からキーワード集合35を抽出する。
【0051】キーワード部分一致検索部32で、キーワ
ード集合35と候補文字集合12との部分一致検索を行
う。
【0052】次に、修正文字列14中に含まれる単語を
訂正単語、修正文字列14中の文字を訂正文字と呼ぶと
すると、単語誤訂正度演算部41で、訂正単語の長さ、
単語中に含まれる文字の文字認識部1での評価値、訂正
文字と第1候補文字の文字認識部1での評価値の差、単
語を構成する文字の種類、訂正単語が正解である統計確
率などから各訂正単語の単語誤訂正度を計算する。リジ
ェクト文字決定部42で、訂正単語とその前後の単語の
単語誤訂正度などからリジェクト文字を決定する。
【0053】次に候補単語付加部43で、キーワード部
分一致検索部32で出力された単語とリジェクト文字決
定部42で出力された文字とを比較し、両者が一致して
いたら、キーワード部分一致検索部32で出力された
語を候補単語集合12に付加する。
【0054】再び、文節検索部3と文節評価値演算部4
で、付加された候補単語から候補文節を検索し、文節評
価値を求める。
【0055】さらに、文節選択部5で、文節の候補の中
で評価値の大きい文節を選択し、修正文字列14を出力
する。
【0056】候補外文字検出部34で、修正文字列14
の中で候補単語付加部43によって付加された文字を検
出し、その文字を追加学習文字15として出力する。
【0057】文字認識部1は、追加学習文字15を受け
取り、追加学習文字の文字画像と修正文字列の文字か
ら、追加学習文字が認識できるように認識辞書16に追
加学習文字15の辞書を追加する。
【0058】これにより、文字認識部1における初めの
文字認識で認識できなかった文字も認識辞書に追加文字
の辞書が追加されたことにより認識可能になる。
【0059】なお、文字認識部1における認識辞書16
への追加学習文字15の辞書への追加は、文字認識部1
をニューラルネットワークで構成してネットワークの重
みを追加学習によって変化させて処理を行っても良い。
【0060】次に、本発明の第5の発明の実施例につい
て説明する。図7にこの実施例の文字認識装置の全体の
構成を示す。
【0061】なお、文字認識部1、単語検索部2、文節
検索部3、文節評価値演算部4、文節選択部5は、第1
の発明の実施例と同じである。
【0062】文字種決定部51は、修正文字列14から
文字種辞書52を参照して各文字の文字種を決定し出力
する。
【0063】上記の構成の文字認識装置において次のよ
うにして文字認識を行う。まず、認識対象の文書画像1
0を文字認識部1で認識辞書16を用いて文字認識し
て、1文字につき第1候補文字から第n候補文字までの
n個の候補文字を持つ候補文字集合を出力する。
【0064】さらに、単語検索部2で、単語辞書6を検
索することにより候補文字集合11の組み合せの中か
ら、単語辞書6に存在する単語と一致する候補文字の組
み合せである候補単語集合12を選び出す。さらに、文
節検索部3で、文法辞書7を参照して候補単語集合12
から文節となりえる単語の組み合せである候補文節集合
13を選び出す。文節検索部3で検索された文節の語彙
的および文法的な正しさを文節中の単語の長さや頻度な
どを基準として文節評価値を計算する。文節評価値を求
めた候補文節に対して文節評価値を基準にして、文節選
択部5で正しい文節の組み合せを選択し修正文字列14
を出力する。
【0065】文字種決定部51で、修正文字列14から
文字種辞書52に従って文字種を決定する。文字種辞書
52には、例えば、数詞前接頭語(第、約など)と数助
詞(本、個など)の間に挟まれる文字は数字である、片
仮名と片仮名に挟まれている文字は片仮名である確率が
高い、英字と英字に挟まれている文字は英字である確率
が高いなどというルールが登録されており、このルール
に従って文字種を決定する。図8は、修正文字列から文
字種を決定した例である。図8で修正文字列の中の「ニ
ューラねネットワーク」の文字列を片仮名、「9G.
5」の文字列を数字であると決定した。それ以外の部分
は、文字種の決定はされなかった。文字種が決定した文
字は文字認識部1に送られ、文字認識部1では、文字種
決定部の出力に従って文字種を限定して文字認識を再度
行う。
【0066】再度文字認識部1によって出力された文字
を候補文字集合11に付加し、単語検索部2では、再度
候補単語を検索し、検索された候補単語を候補単語集合
12に付加する。さらに、文節検索部3と文節評価値演
算部4で、付加された候補単語から候補文節を検索し、
文節評価値を求める。
【0067】さらに、文節選択部5で、文節の候補の中
で評価値の大きい文節を選択し、修正文字列14を出力
する。
【0068】このように、文字種を限定すると、文字認
識部1は文字種が限定されたことにより認識率が向上す
る。その結果文字修正を行った結果も認識率が向上す
る。
【0069】なお、本実施例では、文字種決定部51に
おいて文字種を決定し文字種の限定を行ったが、文字種
決定部51である一定の数の文字に限定することを行っ
ても良い。例えば、修正文字列14から文字列が都市名
を表していることが決定できたら、都市名に使われてい
る文字だけに限定を行えば良い。
【0070】
【発明の効果】以上の実施例から明らかなように、本発
明の構成の文字認識装置を使用することにより、文字修
正部の訂正結果の情報を用いて追加学習文字を決定し、
認識対象の文書のフォントに合った認識辞書を自動的に
構成することができる。このため、認識対象の文書に合
った文字認識を行うために認識率が向上し、その実用的
効果は大きい。また、文字修正部の訂正結果の情報から
文字認識部における認識文字の文字種を限定することに
より、文字認識部の認識率を向上させることができる。
【図面の簡単な説明】
【図1】本発明の文字認識装置の一実施例の構成図
【図2】本発明の文字認識装置の他の実施例の構成図
【図3】本発明の同文字抽出部の出力図
【図4】本発明の文字認識装置の別の実施例の構成図
【図5】本発明の文字認識部の構成図
【図6】本発明の文字認識装置の他の実施例の構成図
【図7】本発明の文字認識装置の別の実施例の構成図
【図8】本発明の文字種決定部の出力図
【図9】従来の文字認識装置の構成図
【符号の説明】
1 文字認識部 2 単語検索部 3 文節検索部 4 文節評価値演算部 5 文節選択部 6 単語辞書 7 文法辞書 8 文字修正部 9 候補文字比較部 10 文字画像 11 候補文字集合 12 候補単語集合 13 候補文節集合 14 修正文字列 15 追加学習文字 16 認識辞書 21 同文字抽出部 31 キーワード抽出部 32 キーワード部分一致検索部 33 候補単語付加部 34 候補外文字検出部 35 キーワード集合 36 類似度計算部 37 重み係数 38 重み係数更新部 41 単語誤訂正度演算部 42 リジェクト文字決定部 43 候補単語付加部 51 文字種決定部 52 文字種辞書 61 自動訂正部 62 手動訂正制御部 63 訂正規則テーブル
フロントページの続き (72)発明者 〆木 泰治 大阪府門真市大字門真1006番地 松下電 器産業株式会社内 (72)発明者 前川 英嗣 大阪府門真市大字門真1006番地 松下電 器産業株式会社内 (72)発明者 伊藤 哲 大阪府門真市大字門真1006番地 松下電 器産業株式会社内 (72)発明者 小島 良宏 大阪府門真市大字門真1006番地 松下電 器産業株式会社内 (72)発明者 山本 浩司 大阪府門真市大字門真1006番地 松下電 器産業株式会社内 (56)参考文献 特開 平4−372086(JP,A) 特開 平4−67277(JP,A) 特開 平2−39282(JP,A) 「電子情報通信学会研究技術報告 P RU91−135」Vol.91 No.478 P.71−78 ”文字認識後処理方法と後 処理による効果の分析" (58)調査した分野(Int.Cl.7,DB名) G06K 9/62 - 9/82

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】文書画像を認識して1文字に付きN個の候
    補文字を出力する文字認識部と、 候補文字集合から単
    語辞書を用いて候補単語集合を求める単語検索部と、候
    補単語集合から文法辞書を用いて候補文節を求める文節
    検索部と、文節の語彙的及び文法的な正しさを計算する
    文節評価値演算部と、文節の評価値を基準にして文節を
    選択し修正文字列を出力する文節選択部と、候補文字集
    合と修正文字列を比較する候補文字比較部と、異なる単
    語中の同文字を抽出し追加学習文字を出力する同文字抽
    出部とを備えたことを特徴とする文字認識装置。
  2. 【請求項2】文書画像を認識して1文字に付きN個の候
    補文字を出力する文字認識部と、候補文字集合から単語
    辞書を用いて候補単語集合を求める単語検索部と、候補
    単語集合から文法辞書を用いて候補文節を求める文節検
    索部と、文節の語彙的及び文法的な正しさを計算する文
    節評価値演算部と、文節の評価値を基準にして文節を選
    択し修正文字列を出力する文節選択部と、修正文字列か
    ら認識対象の文書のキーワードを抽出するキーワード抽
    出部と、前記候補文字列集合の中で前記キーワードとの
    部分一致検索を行うキーワード部分一致検索部と、部分
    一致したキーワードを候補単語集合に付加する候補単語
    付加部と、修正文字列から候補単語付加部によって付加
    された文字を検出し追加学習文字を出力する候補外文字
    検出部とを備えたことを特徴とする文字認識装置。
  3. 【請求項3】文字認識部が、文字画像と重み係数とから
    文字の類似度を計算して候補文字を出力する類似度計算
    部と、追加学習文字と候補文字の誤差とから重み係数を
    更新する重み係数更新部とからなることを特徴とする、
    請求項記載の文字認識装置。
JP05191893A 1992-09-28 1993-03-12 文字認識装置 Expired - Fee Related JP3350127B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP05191893A JP3350127B2 (ja) 1993-03-12 1993-03-12 文字認識装置
US08/513,294 US6041141A (en) 1992-09-28 1995-08-10 Character recognition machine utilizing language processing
US08/965,534 US5987170A (en) 1992-09-28 1997-11-06 Character recognition machine utilizing language processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05191893A JP3350127B2 (ja) 1993-03-12 1993-03-12 文字認識装置

Publications (2)

Publication Number Publication Date
JPH06266906A JPH06266906A (ja) 1994-09-22
JP3350127B2 true JP3350127B2 (ja) 2002-11-25

Family

ID=12900260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05191893A Expired - Fee Related JP3350127B2 (ja) 1992-09-28 1993-03-12 文字認識装置

Country Status (1)

Country Link
JP (1) JP3350127B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005339039A (ja) 2004-05-25 2005-12-08 Fuji Xerox Co Ltd 文書処理装置および文書処理方法
JP7221143B2 (ja) * 2019-06-17 2023-02-13 株式会社日立製作所 キーワード検出装置、及びキーワード検出方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
「電子情報通信学会研究技術報告 PRU91−135」Vol.91 No.478 P.71−78 "文字認識後処理方法と後処理による効果の分析"

Also Published As

Publication number Publication date
JPH06266906A (ja) 1994-09-22

Similar Documents

Publication Publication Date Title
US5377281A (en) Knowledge-based character recognition
CN111859921A (zh) 文本纠错方法、装置、计算机设备和存储介质
JP3350127B2 (ja) 文字認識装置
Chaudhuri et al. OCR error detection and correction of an inflectional indian language script
JP3975825B2 (ja) 文字認識誤り訂正方法、装置及びプログラム
JP3469375B2 (ja) 認識結果の確信度決定方法及び文字認識装置
JPH076215A (ja) ニューラルネットワークに基づく文字処理装置のための字句の後処理方法
JP3274014B2 (ja) 文字認識装置および文字認識方法
JP3255816B2 (ja) 文字認識装置
JP3085107B2 (ja) 文字認識装置
JP4047895B2 (ja) 文書校正装置およびプログラム記憶媒体
JP3123181B2 (ja) 文字認識装置
JP4318223B2 (ja) 文書校正装置およびプログラム記憶媒体
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JP3924899B2 (ja) テキスト検索装置およびテキスト検索方法
JP2002091961A (ja) コーパス誤りの検出・修正システム,コーパス誤りの検出・修正処理方法およびそのプログラム記録媒体
JPH0757059A (ja) 文字認識装置
Konno et al. Postprocessing algorithm based on the probabilistic and semantic method for Japanese OCR
JP2908460B2 (ja) 誤認識修正方法及び装置
JP3339879B2 (ja) 文字認識装置
JPH09185674A (ja) 誤認識文字検出装置、誤認識文字訂正装置、誤認識文字検出方法、および、誤認識文字訂正方法
JPH0290384A (ja) 文字認識装置の後処理方式
JPH10240736A (ja) 形態素解析装置
JPS646514B2 (ja)
JPS62285189A (ja) 文字認識後処理方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080913

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080913

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090913

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees