JPH0713998A - 文字認識装置およびその方法 - Google Patents

文字認識装置およびその方法

Info

Publication number
JPH0713998A
JPH0713998A JP5180721A JP18072193A JPH0713998A JP H0713998 A JPH0713998 A JP H0713998A JP 5180721 A JP5180721 A JP 5180721A JP 18072193 A JP18072193 A JP 18072193A JP H0713998 A JPH0713998 A JP H0713998A
Authority
JP
Japan
Prior art keywords
character
candidate
characters
certainty
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5180721A
Other languages
English (en)
Inventor
Toru Futaki
徹 二木
Akihiro Matsumoto
昭浩 松本
Tadanori Nakatsuka
忠則 中塚
Kazuyuki Saito
和之 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP5180721A priority Critical patent/JPH0713998A/ja
Publication of JPH0713998A publication Critical patent/JPH0713998A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 精度の高い文字認識を迅速に行う文字認識装
置およびその方法を提供する。 【構成】 文字認識装置10はCPU13、ROM1
5、RAM17の他にイメージスキャナ19、特徴抽出
部39、辞書部28及び表示部31などを備える。イメ
ージスキャナ19で読み込まれた文書イメージデータは
特徴抽出部39、辞書部28によって文字認識されると
その推定確率にしたがって第1候補から第3候補の文字
列を表示部31に表示する。さらに、ROM15に格納
された文字間の結合度テーブルにしたがって第1候補か
ら第3候補の文字列の各文字の推定確率を補正して最適
の候補文字を認識する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、画像データから文字を
認識する文字認識装置およびその方法に関する。
【0002】
【従来の技術】従来の文字認識装置では、日本語の単語
辞書を用いて後処理を行なうことにより文字の認識率を
向上させている。この種の文字認識装置では、原稿に描
かれている画像をイメージスキャナで画像データとして
読み取り1文字毎に切り出しては文字パターンの認識処
理を行なっている。例えば「写真を撮る」という文字列
の画像データから第1候補の文字列として「写直を撮
る」、第2候補の文字列として「軍夏旨揚ろ」、第3候
補の文字列として「宇真ま損3」を認識する。つぎに、
予め登録されている日本語の単語辞書(図8にその一部
を示す)を使用して後処理を行なう。この後処理では、
まず文字認識の結果得られた第1候補の最初の文字
「写」に注目し、「写」の文字をキーとして単語辞書を
検索することにより単語「写植」および「写真」をヒッ
トするが、「写真」という単語が文字認識の結果、前述
の第3候補の2文字目の文字「真」と組み合わせること
によって得られる単語であることがわかる。したがっ
て、「写真」という単語が極めて確からしいと予想され
る。
【0003】さらに、第2候補の最初の文字「軍」及び
第3候補の最初の文字「宇」についても、同様に単語辞
書を検索し、2文字目以降の候補の文字と組み合わせて
一致するような単語が存在するかどうかを調べる。
「軍」や「宇」で始まり、それぞれ2文字目以降の文字
と組み合わせて一致するような単語は存在しないので、
「写真」が正しい認識結果と判定される。この判定に基
づいて、2文字目に関しては「真」を新たに第1候補に
し、「直」を第2候補にし、「夏」を第3候補にする置
換する処理が行われる。
【0004】以上示した例では、文字列の1文字目から
照合を行っているが、一般的には文字列中において、
(1)単語検索によって確定した次の文字から、(2)
文字列中の句読点の次の文字から、或いは(3)第1候
補に関して「ひらがな」から「漢字」に変換される部分
が存在するとき、その漢字の部分から照合を行なうよう
にされている。
【0005】
【発明が解決しようとする課題】しかしながら、従来の
文字認識ではつぎのような問題があり、そのため文字認
識には制限があり、精度の高い文字認識を行えなかっ
た。すなわち、(1)単語の照合を始めるべき位置が必
ずしも正確には得られない。(2)単語辞書を利用する
ために大容量のメモリを必要とする。(3)上記従来例
では第3候補まで対象としていたが、候補数が増加する
と可能な文字列の組合せ数が急激に増加し極めて長い照
合時間を必要とする。(4)補語、数字、送り仮名など
の単語に含まれない文字(「・・・は・・・」「・・・
012・・・」「・・・れば・・・」等)ものについて
は考慮されない。(5)単語検索の結果、一致する単語
が存在するか否かで判断しているので、複数の単語が一
致した場合の優先順序が明確でない。このようにいくつ
かの問題点が存在するために、従来の文字認識では、認
識精度に限界があった。
【0006】本発明は、前述したこの種の文字認識の現
状に鑑みてなされたものであり、その目的は、精度の高
い文字認識を迅速に行う文字認識装置およびその方法を
提供することを目的とする。
【0007】
【課題を解決するための手段】第1の発明の文字認識装
置は、文書を画像データとして記憶する文書記憶手段
と、この画像データから文字単位に連続して文字パター
ンを切り出す文字切り手段と、この文字切り手段によっ
て連続して切り出された前記文字パターンのそれぞれか
ら複数の候補文字およびこの候補文字の確実度を生成す
る文字認識手段と、単語や文節など前後の文字の繋がり
を考慮して設定された文字間の結合度を格納する辞書手
段と、この辞書手段に格納された文字間の結合度にした
がって、前記連続して切り出された文字パターンの各候
補文字の確実度を補正する補正手段と、この補正手段に
よって補正された前記確実度に基づいて、前記複数の候
補文字の中から最も前記確実度の高い候補文字を選択す
る選択手段とを備える。
【0008】第2の発明の文字認識方法は、文書を画像
データとして記憶し、この記憶された画像データから文
字単位に連続して文字パターンを切り出し、この連続し
て切り出された前記文字パターンのそれぞれから複数の
候補文字およびこの候補文字の確実度を生成し、単語や
文節など前後の文字の繋がりを考慮して設定された文字
間の結合度を格納し、この格納された文字間の結合度に
したがって、前記連続して切り出された文字パターンの
各候補文字の確実度を補正し、この補正された前記確実
度に基づいて、前記複数の候補文字の中から最も前記確
実度の高い候補文字を選択する。
【0009】
【作用】第1の発明の文字認識装置は、文書記憶手段に
よって文書を画像データとして記憶し、文字切り手段に
よってこの画像データから文字単位に連続して文字パタ
ーンを切り出し、この文字切り手段によって連続して切
り出された前記文字パターンのそれぞれから複数の候補
文字およびこの候補文字の確実度を文字認識手段によっ
て生成し、辞書手段によって単語や文節など前後の文字
の繋がりを考慮して設定された文字間の結合度を格納
し、この辞書手段に格納された文字間の結合度にしたが
って、前記連続して切り出された文字パターンの各候補
文字の確実度を補正手段によって補正し、この補正手段
によって補正された前記確実度に基づいて、前記複数の
候補文字の中から最も前記確実度の高い候補文字を選択
手段によって選択する。
【0010】
【実施例】以下、本発明の実施例を図1乃至図7を参照
して詳細に説明する。図1は本実施例の文字認識装置1
0の構成を示すブロック図である。文字認識装置10は
CPU(中央処理装置)13、ROM(リードオンリー
メモリ)15、RAM(ランダムアクセスメモリ)17
の他にバス14を介して接続されたイメージスキャナ1
9、日本語文書が保存された外部記憶部25、標準の文
字パターンが登録されている辞書部28、表示部31、
キーボード33、ポインティングデバイス35、カラー
プリンタ37、特徴抽出部39、大分類部40を備えて
構成される。RAM17は画像データの展開や認識処理
のための作業領域として用いられるメモリであり、文書
イメージデータ領域17a、特徴ベクトル領域17b、
文字切り枠の座標データ領域17c、候補文字セット領
域17dおよび文字イメージデータ領域17eが確保さ
れている。ROM15には後述するフローチャートに示
すようなCPU13が実行する文字認識の処理手順のプ
ログラムが記憶されている他、後述する図5の結合確率
テーブルが格納されている。辞書部28は標準の文字パ
ターンに対応する文字コード等を登録する詳細辞書Aを
有する。イメージスキャナ19は1次元に配設されたC
CDからなる光電変換素子を有し、原稿面に対して走査
してアナログ電気信号を得、白黒画像に対応した2値信
号に変換する機能を有する。特徴抽出部39は文字パタ
ーンを記憶する文字バッファ39aを内部に備えてお
り、文字バッファ39aの文字パターンに対して後述す
る特徴ベクトルの抽出を行なう。大分類部40も特徴抽
出部39と同様に文字パターンに対応する文字コード等
が登録された大分類辞書Cを備える。つぎに、文字認識
装置10の文字認識処理について説明する。 [文字認識処理ルーチン]図2は文字認識処理ルーチン
を示すフローチャートである。本ルーチンが開始される
と、イメージスキャナ19が起動し、セットされた原稿
の文書を読み込む(ステップS210)。読み込まれる
文書は画像の濃度値を白黒に量子化するために2値化処
理されてイメージデータとしてRAM17の文書イメー
ジデータ領域17aに記憶される。2値化処理されたイ
メージデータは図3に示すように表示部31に表示され
る(ステップS220)。作業者は表示されたイメージ
データを見ながらキーボード33やマウスなどのポイン
ティングデバイス35を使ってイメージデータのしみ、
欠けなどの雑音を除去したり、不要な文書の箇所を消去
することになる(ステップS230)。さらに、作業者
は文字認識を行う領域Dをポインティングデバイス35
を使ってブロック指定する(ステップS240)。本実
施例では「写真を撮る」を含む範囲がブロック指定され
る。以上の前処理が終了すると、作業者はブロック指定
された領域についてのモード設定を行うことになる(ス
テップS250)。このモード設定では種々の処理条件
も設定されるようになっており、例えば、文字認識の場
合に縦組/横組、改行コードの入れ方、辞書の選択とい
った指定を行なえる。つぎに、文書のイメージデータに
対して文字パターンの切り出しを行なう。 [文字切出し]図4は指定された領域Dの文書のイメー
ジデータについての文字切りを示す図である。本実施例
の文字切りは、行方向の黒画素のヒストグラムeを作成
してヒストグラムeの谷間で行の切れ目と判断し、各行
について行と垂直方向に黒画素のヒストグラムfを作成
しヒストグラムfの谷間で文字の切れ目とする手法によ
り行なわれる(ステップS270)。文字切りされた文
字、例えば本実施例では「写真を撮る」の「を」につい
ての文字切り枠の座標データがRAM17の文字切り枠
の座標データ領域17cに記憶される。文字切り枠の座
標データとは1つの文字を囲む矩形の左上の頂点座標
(x,y)、横辺の長さlx、縦辺の長さlyである。
文字切り枠の座標データは、切り出された文字について
順次、文字切り枠の座標データ領域17Cに格納されて
いき、切り出された文字の連続番号はrで表現される。
このようなヒストグラムを用いた文字の切り出しは手書
き文字に対しても有効である。つぎに、切り出された文
字パターンからパターン認識に用いられる特徴ベクトル
の抽出について説明する。 [特徴抽出]特徴ベクトルの抽出は特公平2−5950
7号公報に詳しく示されているので、ここではその概略
だけを示す。CPU13はRAM17の文書イメージデ
ータ領域17aに記憶された文書イメージデータからス
テップS270で求められた文字切り枠の座標データを
基に文字パターン1つを切り出して特徴抽出部39の中
にある文字バッファ39aに切り出された文字パターン
を転送する。特徴抽出部39では、文字バッファ39a
に格納された例えば、128×128メッシュの文字パ
ターン「を」に対して正規化処理をし、70×70メッ
シュサイズの文字パターンとする。正規化された文字パ
ターン「を」の文字輪郭部を左回りに追跡し、3個の画
素を基準に文字パターンの輪郭線の方向を16方向に量
子化した方向指数を順次求める。さらに、正規化された
70×70メッシュの文字パターンを7×7=49個の
小領域に等分割し、それぞれの小領域で先に求めた方向
指数のヒストグラムHij(k)[i、j=1、2
…、k=1、2、…、16(方向指数)]を作成する。
文字パターン「を」が受けている変動を吸収するために
16方向の方向指数ヒストグラムを空間的、方向的にぼ
かす処理を行う。すなわち、ガウス形の重み係数をもつ
重み付けフィルタ処理により方向指数ヒストグラムHi
j(k)を7×7から3×3の大きさに集約すると共に
さらに方向指数の奇数番号をフィルタ処理することによ
り16の方向指数も8方向に集約して最終的に加重方向
指数ヒストグラムhij(k)[i、j=1、2、3、
k=1、2、3、…、8]を得る。この加重方向指数ヒ
ストグラムhij(k)は文字パターンから抽出された
72次元(3×3×8)の特徴ベクトルXi(i=1,
2,…,72)であり、以下に示す文字認識処理に使用
されることになる(ステップS280)。抽出された特
徴ベクトルXiはCPU13によってRAM17の特徴
ベクトル領域17bに記憶される。つぎに、この特徴ベ
クトルXiを基に文字パターンを大分類する。 [大分類処理]前述したように、大分類部40は大分類
辞書Cを備えており、大分類辞書Cには各文字ごとに5
00個のサンプル文字から求められた特徴ベクトルの平
均値である平均特徴ベクトルがあらかじめ文字コードと
対応して各文字sごとに文字コードc(s)と平均特徴
ベクトルをmi(s)との対応テーブルの形で記憶され
ている。文字番号sでs=1,2,…Nと連続番号とな
っており、N個の文字の集合を認識対象文字セットと呼
ぶ。認識対象文字セットはJIS第一水準漢字と非漢字
を含む規模の3500個の文字の集合である。大分類部
40は、RAM17の特徴ベクトル領域17bに記憶さ
れている特徴ベクトルXiと認識対象文字セット内のす
べての文字の平均特徴ベクトルmi(s)との間で、次
式(10A)で定義されるユークリッド距離D(s)を
計算し、 D(s)=Σi{Xi−mi(s)}2 ……(10A) D(s)が昇順になるように認識対象文字セットをソー
トして上位50個の文字の文字番号s、文字コードc
(s)および距離値D(s)をRAM17の候補文字セ
ット領域17dに記憶する。これら50個の文字を候補
文字セットとして後述する文字パターンの詳細識別に使
用する。 [詳細識別]この詳細識別の認識処理では、上位3個の
候補文字を出力する。各候補文字の認識の確かさの尺度
として標準の文字パターンと認識しようとする文字との
間の距離dが演算される。距離dとして本実施例では
(1)式に示すマハラノビス距離が使用される(ステッ
プS300)。
【0011】 d(k)=−1/2[{x−μ(k)}S(k){x−μ(k)} +log|S(k)|] ・・・ (1)
【0012】ここで、xは前述したように入力文字画像
(文字パターン)から特徴抽出処理によって得られる特
徴ベクトル、k(k=1、2、3・・・50)は大分類
処理で得られた文字種、μ(k)は文字種の平均ベクト
ル、S(k)は共分散行列である。そして、特徴ベクト
ルxの分布が正規分布に従うとすると、文字種kの推定
確率P(k)とマハラノビス距離d(k)との間の関係
式(2)から、文字種kの推定確率P(k)を求めるこ
とができる。
【0013】 logP(k)=d(k) ・・・ (2)
【0014】(2)式から明らかなように、確率的な演
算を行うためには、マハラノビス距離を演算して置くと
都合がよいが、マハラノビス距離以外の距離を使用して
も、近似的には同一の効果が得られる。
【0015】前述の「写真を撮る」という文書イメージ
データの文字パターンに対して前述の認識処理をし、そ
の結果としてRAM17の候補文字セット領域17dに
は図6に示すようにテキスト文字および推定確率P
(k)の値が格納される。第1候補から第3候補までの
テキスト文書を表示部31にテキスト表示する(ステッ
プS340)。図7は表示部31に表示された第1候補
から第3候補までのテキスト文書である。「写真を撮
る」という文書イメージデータに対して「写直を撮
る」、「軍夏旨揚る」、「宇真ま損3」のテキスト文書
が候補として挙げられる。さらに、後に詳述するが、各
候補文字毎にその前後の文字との結合確率に基づいて推
定確率の補正処理を実行する(ステップS350)。補
正処理された距離の小さい順に候補文字をソーティング
し(ステップS360)、最後にソーティングされた候
補文字を表示部31に表示して文字認識ルーチンを実行
する。
【0016】[距離補正処理]ここで、上記補正処理に
ついて詳細に説明する。一般的な日本語文書における字
種(文字の種類)間の結合度は一定でなく、一つの字種
を取り上げると、その字種に結合する字種は、統計的に
それぞれの結合度を有している。文字列中に字種aが存
在する時、字種aの次の字種がbである確率を結合確率
と呼び、φ(a→b)で表すことにすると、このφ(a
→b)は母集団の取り方に依存するので、絶対的な値を
得ることはできないが、多数の文書を調べることにより
そこからデータを得て統計的な値とすることはできる。
【0017】図5はこのようにして統計的な値として得
られた総ての字種に関する結合確率のテーブルの一部を
示す。左端の欄には字種が示され(但し、本実施例の説
明に必要な字種「夏…撮…写…真……」に限って示され
ている。)、その右側の欄には左端の欄の字種に結合さ
れる各字種の結合確率が示されている。但し、右側の欄
には基準となる字種に対して、所定の閾値以上の結合確
率を持つ字種しか登録してないので、右側の欄の登録字
種数は一定ではなく、また、登録されている字種の結合
確率の和は1にはならない。
【0018】前述の認識処理では、図7に示すように文
書イメージデータ「写真を撮る」の文字パターンに対し
て第1候補文字列として「写直を撮る」、第2候補文字
列として「軍夏旨揚ろ」、第3候補文字列として「宇真
ま損3」が得られたが、この例に基づいて距離の補正処
理について詳細に説明する。ここで、第1候補から第3
候補の文字の推定確率P(k)は前述の(2)式に基づ
いて図6の括弧内に示す値である。したがって、この推
定確率P(k)を前後の文字との連結性を考慮して修正
することを考える。
【0019】先ず、第1候補のテキスト文書の2番目の
文字「直」に注目し、直前の文字の推定確率と直前の文
字との連結性とから、2番目の文字が「直」である確率
P(2F)(直)は、(3)式で求められる。ここで、
P(2F)の値「2」は2番目の文字を表し、「F」は
ひとつ前の文字との関係であることを示す。
【0020】 P(2F)(直)=P1(写)φ(写→直)+P1(軍)φ(軍→直) +P1(宇)φ(宇→直) ・・・ (3)
【0021】さらに、この文字「直」の直後の文字の推
定確率と直後の文字との連結性とから、2番目の文字が
「直」である確率P(2B)は、(4)式で求められ
る。ここで、P(2B)の「B」はひとつ後の文字との
関係であることを示す。
【0022】 P(2B)(直)=P3(を)φ(直→を)+P3(旨)φ(直→旨) +P3(ま)φ(直→ま) ・・・ (4)
【0023】(3)式と(4)式で得られるそれぞれの
確率P(2F)及びP(2B)と、(2)式の距離計算
により求めた図6に示す確率P2(直)とから、閾値α
を用いて新たな推定確率P(2T)(直)は(5)式で
求められる。
【0024】 P(2T)(直)=[P2(直)+α{P(2F)(直)+P(2B) (直)}]/(1+α) ・・・ (5)
【0025】このように、新たな推定確率P(2T)を
求めるに際して、確率P2(直)が前後の文字に独立に
求めた確率であるために、単純に和を取ることはでき
ず、前記の一定の閾値αをかけて加えている。ここで、
αは実験的に設定される値である。
【0026】つぎに、図5に示す結合確率テーブルを使
用して(3)式ないし(5)式を具体的に計算する。こ
の結合確率テーブルでは外部記憶部25に記憶されてい
る日本語文書を母集団として選定され統計的な値が設定
されている。したがって、母集団の取り方によっては結
合確率テーブルの値は多少違ってくる。結合確率がこの
結合確率テーブルに登録されていない場合には、結合確
率が十分に小さいと判断し、その結合確率をP0=0.
01とする。
【0027】(3)式から(6)式が求められる。
【0028】 P(2F)(直)=P1(写)φ(写→直)+P1(軍)φ(軍→直) +P1(宇)φ(宇→直) =0.36×P0+0.3×P0+0.18×P0 =0.0078 ・・・ (6)
【0029】(4)式から(7)式が求められる。
【0030】 P(2B)(直)=P3(を)φ(直→を)+P3(旨)φ(直→旨) +P3(ま)φ(直→ま) =0.38×P0+0.18×P0+0.1×P0 =0.0056 ・・・ (7)
【0031】(6)式、(7)式及び(5)式より、新
たな推定確率P(2T)(直)は、α=0.5として
(8)式で与えられる。
【0032】 P(2T)(直)=[P2(直)+α{P(2F)(直)+P(2B) (直)}]/(1+α) ={0.3+0.5(0.0078+0.0056)}/ 1.5 =0.2045 ・・・ (8)
【0033】第2候補の文字列の2番目の文字「夏」
と、第3候補の文字列の2番目の文字「真」とについて
も、同様にして文字列の2番目の文字が「夏」である補
正後の新たな推定確率P(2T)(夏)と、文字列の2
番目の文字が「真」である新たな推定確率P(2T)
(真)とを求めると、それぞれ(9)式と(10)式が
得られる。 P(2T)(夏)=[P2(夏)+α{P(2F)(夏)+P(2B) (夏)}]/(1+α) ={0.28+0.5(0.008+0.045)}/ 1.5 =0.2043 ・・・ (9)
【0034】 P(2T)(真)=[P2(真)+α{P(2F)(真)+P(2B) (真)}]/(1+α) ={0.26+0.5(0.11164+0.0256) }/1.5 =0.219 (10)
【0035】尚、文字列の最初の文字に対しては前の文
字が存在しないのでP(2F)の項は含めず、同様に文
字列の最後の文字に対してはP(2B)の項は含めな
い。補正後の新たな推定確率P(2T)の大きな順に候
補文字のソーティングが行われ、文字列の2番目の文字
の第1候補は「真」と判定される。以下同様にして、文
字列の3番目の文字ないし5番目の文字について、推定
確率の補正が行われ候補文字のソーティングが行われ
る。
【0036】前述の推定確率の補正方法を一般化して説
明すると、次のようになる。或る文字に続く次文字の候
補文字がL個存在するとし、距離から得られるn番目の
候補文字Cni(i=1、2・・・L)の推定確率をP
{Cn(i)}とすると、補正された新たな推定確率P
(T){Cn(i)}は、次式で得られる。
【0037】 P(T){Cn(i)}=P{Cn(i)}+α[Σ(j=1〜L)P{C (n−1)(j)}φ{C(n)→C(n−1)(j)+Σ(j= 1〜L)P{C(n+1)(j)}φ{C(n)→C(n+1) (j)}]/(1+α) ・・・ (11)
【0038】但し、前述したように文字列の最初の文字
に対しては、右辺第2項の大括弧内の第1項は含めず、
文字列の最後の文字に対しては、右辺第2項の大括弧内
の第3項は含めない。
【0039】このようにして得られた、新たな推定確率
P(T){Cn(i)}(i=1、2・・・L)を値の
大きい順にソーティングし、順に第1候補、第2候補・
・・第L候補とすることにより、より精度の高い推定が
可能になる。
【0040】このように、実施例によると、文字認識の
後処理に、結合確率テーブルを使用して、日本語文書に
おける字種間の結合確率を考慮した補正を施すことによ
り、高精度の文字認識を行うことが可能になる。また、
この結合確率テーブルは、日本語の単語や文節などの文
字の繋がりを考慮して、任意の文字に続く確率の高い文
字を選択して格納してあるので、従来の単語辞書に比し
て容量が小さくでき、検索照合する回数も少なくなり、
高速の文字認識が可能になる。
【0041】なお、実施例では読取り手段として、反射
形のスキャナを使用し、マハラノビス距離に基づいて文
字種の推定確率を求めるために使用したが、本発明は実
施例に限定されるものでなく、透過形のスキャナやその
他の読取り手段を使用することができ、マハラノビス距
離以外に特公平2−59507号に示す疑似マハラノビ
ス距離、ベイズ識別式などの距離を用いることも可能で
ある。また、本発明は実施例で説明したような単独の装
置に限らず、複数の装置からなるシステムに適用するこ
とも可能である。
【0042】
【発明の効果】本発明の文字認識装置およびその方法に
よれば、単語辞書の代わりに単語や文節などの文字の繋
がりを考慮して設定された文字間の結合度によって候補
文字の確実度を補正するので、精度の高い文字認識を行
うことができる。しかも、従来の単語辞書に較べて小容
量の辞書の使用で済ますことができ、検索照合回数が少
なく、高速の文字認識が可能となる。
【図面の簡単な説明】
【図1】実施例の文字認識装置の電気的構成を示すブロ
ック図である。
【図2】文字認識制御ルーチンを示すフローチャートで
ある。
【図3】表示部31に表示された文書イメージデータを
示す説明図である。
【図4】文字パターンの切り出しを示す説明図である。
【図5】結合確率テーブルを示す説明図である。
【図6】認識される文字およびその推定確率を示す説明
図である。
【図7】文字認識装置により認識された複数の候補文字
列を表示する説明図である。
【図8】従来の文字認識装置の単語テーブルの説明図で
ある。
【符号の簡単な説明】
10… 文字認識装置 31… 表示部
フロントページの続き (72)発明者 齋藤 和之 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 文書を画像データとして記憶する文書記
    憶手段と、 この画像データから文字単位に連続して文字パターンを
    切り出す文字切り手段と、 この文字切り手段によって連続して切り出された前記文
    字パターンのそれぞれから複数の候補文字およびこの候
    補文字の確実度を生成する文字認識手段と、 単語や文節など前後の文字の繋がりを考慮して設定され
    た文字間の結合度を格納する辞書手段と、 この辞書手段に格納された文字間の結合度にしたがっ
    て、前記連続して切り出された文字パターンの各候補文
    字の確実度を補正する補正手段と、 この補正手段によって補正された前記確実度に基づい
    て、前記複数の候補文字の中から最も前記確実度の高い
    候補文字を選択する選択手段とを備えた文字認識装置。
  2. 【請求項2】 文書を画像データとして記憶し、 この記憶された画像データから文字単位に連続して文字
    パターンを切り出し、 この連続して切り出された前記文字パターンのそれぞれ
    から複数の候補文字およびこの候補文字の確実度を生成
    し、 単語や文節など前後の文字の繋がりを考慮して設定され
    た文字間の結合度を格納し、 この格納された文字間の結合度にしたがって、前記連続
    して切り出された文字パターンの各候補文字の確実度を
    補正し、 この補正された前記確実度に基づいて、前記複数の候補
    文字の中から最も前記確実度の高い候補文字を選択する
    文字認識方法。
JP5180721A 1993-06-25 1993-06-25 文字認識装置およびその方法 Pending JPH0713998A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5180721A JPH0713998A (ja) 1993-06-25 1993-06-25 文字認識装置およびその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5180721A JPH0713998A (ja) 1993-06-25 1993-06-25 文字認識装置およびその方法

Publications (1)

Publication Number Publication Date
JPH0713998A true JPH0713998A (ja) 1995-01-17

Family

ID=16088159

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5180721A Pending JPH0713998A (ja) 1993-06-25 1993-06-25 文字認識装置およびその方法

Country Status (1)

Country Link
JP (1) JPH0713998A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013077243A (ja) * 2011-09-30 2013-04-25 Ntt Docomo Inc 文字入力装置、文字入力システム及び文字入力方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013077243A (ja) * 2011-09-30 2013-04-25 Ntt Docomo Inc 文字入力装置、文字入力システム及び文字入力方法

Similar Documents

Publication Publication Date Title
US8566349B2 (en) Handwritten document categorizer and method of training
US8731300B2 (en) Handwritten word spotter system using synthesized typed queries
US6272242B1 (en) Character recognition method and apparatus which groups similar character patterns
US5642435A (en) Structured document processing with lexical classes as context
EP1312038B1 (en) Orthogonal technology for multi-line character recognition
US6151423A (en) Character recognition with document orientation determination
CA2400345C (en) System and method for creating a searchable word index of a scanned document including multiple interpretations of a word at a given document location
US11790675B2 (en) Recognition of handwritten text via neural networks
JP3452774B2 (ja) 文字認識方法
Borovikov A survey of modern optical character recognition techniques
US5621818A (en) Document recognition apparatus
JPH11203415A (ja) 類似パターンカテゴリ識別辞書作成装置および方法
US8340428B2 (en) Unsupervised writer style adaptation for handwritten word spotting
US5909509A (en) Statistical-based recognition of similar characters
Hong et al. Improving OCR performance with word image equivalence
JP2001337993A (ja) 文字認識結果を利用して情報を検索する検索装置および方法
US6320985B1 (en) Apparatus and method for augmenting data in handwriting recognition system
JPH0713998A (ja) 文字認識装置およびその方法
JP2586372B2 (ja) 情報検索装置及び情報検索方法
JP2906758B2 (ja) 文字読取装置
Park Hierarchical character recognition and its use in handwritten word/phrase recognition
Khoubyari et al. Font identification using visual global context
JPS60138689A (ja) 文字認識方法
JP2866920B2 (ja) 標準パターン作成方法及び装置並びに文字認識装置及び方法
JP4261831B2 (ja) 文字認識処理方法、文字認識処理装置、文字認識プログラム