JPH05174187A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH05174187A
JPH05174187A JP3343517A JP34351791A JPH05174187A JP H05174187 A JPH05174187 A JP H05174187A JP 3343517 A JP3343517 A JP 3343517A JP 34351791 A JP34351791 A JP 34351791A JP H05174187 A JPH05174187 A JP H05174187A
Authority
JP
Japan
Prior art keywords
character
rectangle
candidate
unit
writer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3343517A
Other languages
English (en)
Other versions
JP3187899B2 (ja
Inventor
Koji Yamamoto
浩司 山本
Susumu Maruno
進 丸野
泰治 〆木
Taiji Shimeki
Shigeo Sakagami
茂生 阪上
Toshiyuki Koda
敏行 香田
Toshio Niwa
寿男 丹羽
Yoshihiro Kojima
良宏 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP34351791A priority Critical patent/JP3187899B2/ja
Publication of JPH05174187A publication Critical patent/JPH05174187A/ja
Application granted granted Critical
Publication of JP3187899B2 publication Critical patent/JP3187899B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】文字認識において文字の大きさや形、ピッチ等
が文書毎に異なっていても精度の良い認識を行うこと。 【構成】言語的に正しいと思われる部分の文字を確定文
字検出部3が確定文字として検出し、認識結果出力部6
が認識結果として出力する一方、文字矩形情報検出部4
が確定文字の矩形情報を検出し、矩形評価関数の最適化
を行なう。矩形分割統合部5は最適化された矩形評価関
数に基づいてまだ確定されていない部分の基本矩形の分
割・統合を行うことによって新たな基本矩形を求め、再
び候補文字選出部1以下の処理を行なう。また筆記者推
定部7が確定文字から得た情報を用いて候補文字選出部
1で用いる辞書を最適化する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はパターン認識の分野にお
いて、文書からの文字切り出し処理と認識、言語処理を
相補的に用いることによって認識精度の向上を図った文
字認識装置に関するものである。
【0002】
【従来の技術】従来の文字認識装置としては、例えば
「手書き文字列認識方法の一検討」、佐藤 弥生、津雲
淳、1990年電子情報通信学会春季全国大会予稿、
D−491、7−243に示された装置が知られてい
る。
【0003】図11はこの従来の文字認識装置の主要構
成図を示すものである。
【0004】まず、撮像され、入力された画像文字列2
01は矩形化処理部202に2次元データとして渡され
る。ここで文字列構成成分に含まれる画素は1、含まれ
ない画素は0、文字列方向は便宜上横軸方向であり、文
字列の高さも既知であるとする。
【0005】図12は従来の矩形化処理部202の具体
的な構成図である。矩形化処理部202に入力された文
字列201は文字列データ記憶部211に保持される。
周辺分布算出部212は文字列データ記憶部211に保
持された画素値を縦方向に累積した値を算出し、その結
果をガウシアンフィルタ処理部213に出力する。ガウ
シアンフィルタ処理部213は周辺分布算出部212に
よって求められた文字列データの画素値の縦方向の累積
ヒストグラムに対してガウス型関数を畳み込むことによ
って平滑化を行うことで累積ヒストグラムの高周波成分
を除き、ノイズの影響を抑える。平滑化を受けた累積ヒ
ストグラムは左右端検出部214に入力される。左右端
検出部214は図13に示すように累積ヒストグラムの
値が一定値(いき値)以下の部分を検出して、その境界
座標位置を順に基本矩形の左右端座標として列方向周辺
分布算出部215と基本矩形記憶部217に出力する。
【0006】このとき、いき値はすべての基本矩形の横
幅が文字列の高さの一定倍以下になるように設定される
ものとする。
【0007】列方向周辺分布算出部215は左右端検出
部214からの入力を受けて基本矩形の左右端座標に挟
まれる部分の画素値を文字列データ記憶部211から読
みだして横方向に斜影し、その結果を上下端検出部21
6に出力する。さらに上下端検出部216は図14に示
すように列方向周辺分布算出部215からの斜影結果の
文字構成成分が成す部分の最大値、最小値を求め、その
結果を対応する基本矩形の上下端として基本矩形記憶部
217に出力する。
【0008】以上の処理によって基本矩形記憶部217
には基本矩形がその左右端と上下端で表わされ、検出順
に記憶されることになる。
【0009】図15は、図10の矩形統合認識部203
の具体的な構成図であり、図16はその一部である重み
付きラティス作成部241の具体的な構成図である。以
下に矩形統合認識部203、ラティス作成部241の動
作を図に従って説明する。
【0010】基本矩形組合せ部251は上記基本矩形記
憶部217に保持されている基本矩形の座標値を読みだ
し、隣合う基本矩形を組合せた矩形の外郭幅が文字列の
高さの一定倍以下になるようなすべての組合せを検出
し、その結果を重み付きラティス記憶部252に出力す
る。
【0011】重み付きラティス記憶部252は、図17
に示すように基本矩形組合せ部251によって検出され
たすべての基本矩形の組合せについて、組合せ矩形の上
下、左右端座標を記憶保持し、さらに各組合せ矩形に対
応する重み値及び、候補文字を記憶保持するためのメモ
リを確保する。
【0012】重み値算出部242は、図11の文字評価
値算出部204と矩形評価値算出部205からの入力を
受け、重み付きラティス記憶部252に記憶されている
各組合せ矩形に対応する重み値及び、候補文字を求め、
その結果を再び重み付きラティス記憶部252の対応す
るメモリに出力する。
【0013】ここでまず、文字評価値算出部204と矩
形評価値算出部205の動作について説明する。
【0014】図18は文字評価値算出部204の具体的
な構成図である。特徴量抽出部271は重み付きラティ
ス記憶部252に記憶されている組合せ矩形の上下、左
右端座標を参照し、前記座標内に含まれる画素を文字列
データ記憶部211から読みだして特徴量を得、類似度
算出部273に出力する。特徴量抽出部271によって
抽出される特徴量としては、例えばメッシュ特徴ベクト
ルなどが考えられる。メッシュ特徴ベクトルは以下のよ
うにして得られる。
【0015】入力される画素が含まれる組合せ矩形の一
辺をn等分し、前記矩形全体をn×n個のマスに分割
し、各マス内の文字構成成分に含まれる画素数がそのマ
ス全体の画素数に占める割合の値を順番に並べてできる
n×n次元ベクトルをメッシュ特徴ベクトルとする。
【0016】文字辞書272には、各文字の代表メッシ
ュ特徴ベクトルが記憶保持されている。各文字の代表メ
ッシュ特徴ベクトルは複数の標準文字のメッシュ特徴ベ
クトルの平均ベクトルとする。
【0017】類似度算出部273は各文字の代表メッシ
ュ特徴ベクトルと特徴量抽出部271から入力されたメ
ッシュ特徴ベクトルの2乗誤差の逆数値を求め、どの文
字にどのくらい近いかを示す類似度値として出力選出部
274に出力する。
【0018】出力選出部274はすべての文字に対する
類似度値が入力された後に、その中の最大値xと対応す
る候補文字を重み値算出部242に出力する。
【0019】図19は矩形評価値算出部205の具体的
な構成図である。方形度算出部281は重み付きラティ
ス記憶部252に記憶されている組合せ矩形の上下、左
右端座標を参照し、前記矩形の縦横比(方形度r)を
(数1)に従って算出し、適合度算出部283に出力す
る。
【0020】
【数1】r=矩形の縦長さ/矩形の横長さ 空白度算出部282は重み付きラティス記憶部252に
記憶されている組合せ矩形の上下、左右端座標を参照
し、文字列データ記憶部211から前記矩形内の画素を
読みだし、そのうちの文字構成成分に含まれない画素数
が前記矩形全体の画素数に占める割合(空白度s)を算
出して適合度算出部283に出力する。
【0021】適合度算出部283は(数2)に示す値y
を適合度値として求め、重み値算出部242に出力す
る。
【0022】
【数2】y=ρ1(r)・ρ2(s) 但し、rは方形度算出部281からの入力、sは空白度
算出部272からの入力、ρ1、ρ2は適当な関数であ
り、処理対象によって変化する事はない。
【0023】以上説明したように文字評価値算出部20
4が出力として出力選出部264からxとそれに対応す
る候補文字、矩形評価値算出部205が出力として適合
度算出部273からyを出すとき、重み値算出部242
は(数3)に示す値wを対応する組合せ矩形の重み付き
ラティス記憶部252の重み値として算出する。
【0024】
【数3】 w=1 ・・・(x≧α2) ρ( (C0+C1・x+C2・y+C3・x・y)/C4 ) ・・・(x<α2) 但し、C0=β1・(α2−1)(α2−α1)−α1・β2、 C1=α1・β1−α2・β1+β2、C2=α1・α2−α22+α2、 C3=α2−α1−1、C4=(α2−α1)・(β2−β1)、 ρ(z)=z・・・(z>0)、ρ(z)=0・・・(z≦0)。
【0025】なお、処理パラメータα1、α2、β1、β2
は一定値であり、処理対象によって変化する事はない。
【0026】(数3)は以下の4つ条件を満たし、値が
大きい程文字らしいと考えられる。 1.文字評価値算出部251から得られる評価値xがあ
る値α1より小さく、矩形評価値算出部252から得ら
れる評価値yがある値β1より小さい場合は、文字らし
くないと判断し、w=0とする。 2.xがある値α2より大きいときは、文字らしいと判
断しw=1とする。 3.yがある値β2より大きいときは、文字である可能
性が大きい。 4.重み値wはxとyに関して、単調に増加する。
【0027】次に算出した重み値wと出力選出部264
から入力された候補文字を重み付きラティス記憶部25
2の対応するメモリに出力する。
【0028】以上のようにしてすべての組合せ矩形に対
する重み値とそのときの候補文字が重み付きラティス記
憶部252に記憶保持された後、切り出し位置探索部2
43が以下のようにして切り出し位置及び、認識結果を
決定する。
【0029】重み付きラティス記憶部252の始端から
終端に至る経路のうちで経路上の一矩形当りの重み値が
最大になる経路を選択し、そのときの組合せ矩形を一文
字とし、その候補文字を認識結果206として出力す
る。
【0030】
【発明が解決しようとする課題】しかしながら上記のよ
うな構成では、単一文字のパターンマッチングだけから
得られる類似度値から候補文字列を求めているために、
常に言語的に正しいとは言えない。さらに矩形化処理に
おいて1つの基本矩形内に一文字以上の文字が含まれた
場合にそれにともなって文字切り出し結果や認識結果が
大きく間違ってしまう。さらに一定の矩形評価規準によ
って評価しているために不定ピッチの文字列を含む印刷
文書や手書き文書等のように文書毎、領域毎に最適な矩
形評価規準が異なる場合に矩形評価値の誤りが生じやす
くなる。
【0031】以上の理由から処理系全体としての文字評
価規準の不適性によって認識精度が悪くなるという課題
を有していた。
【0032】本発明はかかる従来の文字認識装置の課題
に鑑み、処理系全体の処理精度の向上を図り、文字の誤
切り出しを減少させ、認識精度の良い文字認識装置を提
供することを目的とする。
【0033】
【課題を解決するための手段】第1の本発明は、候補文
字を組合せて単語辞書との整合性をみることによって複
数の候補単語を決定する候補単語決定部と、候補単語決
定部の結果から文節を推定し、推定した文節と文法辞書
との整合性をみることによって複数の候補文節を決定す
る候補文節決定部と、候補文節決定部によって候補に挙
げられた候補文節について候補文節を構成する文字の類
似度平均、候補文節を構成する単語の文字数とある値と
の差の自乗、候補文節の文字数、候補文節を構成する単
語の頻度とで表わされる評価関数に基づいて評価値を算
出した後、連続する候補文節を組み合わせることによっ
てできる一定長さの文節群について、一文節当りの評価
値が最も良い文節群を選出し、文節群の先頭文節を確定
するとともに確定された文節が持つ評価値を文節として
の言語的正しさを表わす評価値とする文節評価確定部を
備えた言語処理装置である。
【0034】第2の本発明は、入力文字列からの文字切
り出し処理によって生じる文字の外接長方形候補である
矩形の縦横比、矩形の面積と矩形面積に占める文字構成
成分以外の部分の面積の割合とで表わされる評価関数に
基づいて分割すべき矩形(1文字分以上の文字構成成分
を含む矩形)を選出する分割矩形候補選出部と、分割矩
形候補選出部によって選出された矩形を分割する矩形分
割部と、矩形分割部によって分割されて生じた矩形も含
めてすべての矩形を組み合わせて最適な矩形の統合の組
合せを決定する矩形統合部を備えた矩形分割統合装置で
ある。
【0035】第3の本発明は、複数の候補文字を選出す
る候補文字選出部と、候補文字選出部の結果を単語辞
書、文法辞書と照合することによって文章としての確か
らしさの評価値を算出する第1本発明の言語処理装置
と、言語処理装置の結果から文字として確定した矩形を
検出する確定文字検出部と、確定文字検出部の結果から
文字として確定した矩形の特徴を抽出する文字矩形情報
抽出部と、文字矩形情報抽出部よって得られた矩形情報
に基づいて、まだ文字として確定していない矩形の統合
と分割を行なう第2の本発明の矩形分割統合装置と、確
定文字検出部の結果を認識結果として出力する認識結果
出力部を備えた文字認識装置である。
【0036】第4の本発明は、各筆記者が書く文字、あ
るいは印刷文字のフォントの癖(各文字の特徴量の分
布、文字の外接長方形の縦横比)を記憶保持している筆
記者辞書と、筆記者辞書と言語的に正しいと確定された
文字との整合性をみることによって筆記者辞書のどの筆
記者またはどの印刷文字のフォントにどれくらい近いか
を表わす評価値を算出する筆記者評価値算出部と、筆記
者評価値算出部の結果によって入力文字列の筆者または
印刷文字のフォントを特定する筆記者決定部を備えた筆
記者推定装置である。
【0037】第5の本発明は、複数の候補文字を選出す
る候補文字選出部と、候補文字選出部の結果を単語辞
書、文法辞書と照合することによって文章としての確か
らしさの評価値を算出する第1の本発明の言語処理装置
と、言語処理装置の結果から文字として確定した矩形を
検出する確定文字検出部と、確定文字検出部の結果から
文字として確定した矩形の特徴を抽出する文字矩形情報
抽出部と、確定文字検出部の結果と文字矩形情報抽出部
よって得られた矩形情報に基づいて入力文字列の筆記者
または印刷文字のフォントを決定し、その結果を候補文
字選出部に出力する第3の本発明の筆記者推定装置部
と、文字矩形情報抽出部よって得られた矩形情報に基づ
いて、まだ文字として確定していない矩形の統合と分割
を行なう第2の本発明の矩形分割統合装置と、確定文字
検出部の結果を認識結果として出力する認識結果出力部
を備えた文字認識装置である。
【0038】
【作用】第1の本発明は前記した構成により、言語的に
「文節内の一文字当りの類似度が高いほうが良い。」、
「文節内の単語の文字数はある値に近い方が良い。」、
「文節内の文字数は多い方が良い。」、「文節を構成す
る単語の入力文字列中での出現頻度は高い方が良い。」
という仮定に基づき、文節単位で言語的な確からしさの
評価値を算出することができる。
【0039】第2の本発明は前記した構成により、文字
の外接長方形候補である矩形に1文字分以上の文字構成
成分含まれた場合には、「横書き(縦書き)では矩形は
横長(縦長)になり、矩形の面積が他の矩形よりも大き
くなる。さらに矩形面積に占める文字構成成分以外の部
分の面積の割合が一定である。」という仮定に基づき、
上記仮定を満たす矩形(1文字分以上の文字構成成分を
含む矩形)を分割することによって文字の誤切り出しを
減少させることができる。
【0040】第3の本発明は前記した構成により、候補
文字選出手段が出力する複数の候補文字から成る文字列
の中で言語的に正しいと思われる部分の文字を確定文字
検出手段が確定文字として検出し、認識結果出力手段が
認識結果として出力する一方、文字矩形情報検出手段が
確定文字の矩形情報を検出し、矩形評価関数の最適化を
行なう。矩形分割統合手段は最適化された矩形評価関数
に基づいてまだ確定されていない部分の基本矩形の分割
・統合を行うことによって新たな基本矩形を求め、再び
候補文字選出手段以下の処理を行なう。
【0041】このようにして最終的にすべての矩形が言
語的に文字として確定されるまで以上の処理を繰り返
す。
【0042】以上のように文字評価結果をさらに言語処
理で評価した後に認識結果を決定するために認識精度が
高まる。またその結果を用いて矩形の文字らしさを評価
する評価関数自身を推定するために文書毎に最適な処理
が行える。
【0043】第4の本発明は前記した構成により、言語
的に正しいと判断された候補文字あるいは文字列が持つ
特徴から入力文字列が手書きの場合は筆記者または入力
文字列が印刷文字の場合はフォントを特定することがで
きる。
【0044】第5の本発明は前記した構成により、第4
の本発明と同様にして文字評価結果をさらに言語処理で
評価した後に認識結果を決定するために認識精度が高ま
る。さらにその結果を用いて筆記者あるいは印刷文字の
フォントを特定することによって候補文字選出手段にお
ける候補文字決定の際の文字辞書に前記特定された筆記
者、あるいは印刷文字のフォント用の文字辞書を使用す
ることによって候補文字選出手段の精度が向上し、より
最適な処理が行える。
【0045】すなわち、言語的に正しいと思われる部分
の文字を確定文字検出手段が確定文字として検出し、認
識結果出力手段が認識結果として出力する一方、文字矩
形情報検出手段が確定文字の矩形情報を検出し、矩形評
価関数の最適化を行なう。矩形分割統合手段は最適化さ
れた矩形評価関数に基づいてまだ確定されていない部分
の基本矩形の分割・統合を行うことによって新たな基本
矩形を求め、再び候補文字選出手段以下の処理を行な
う。また筆記者推定手段が確定文字から得た情報を用い
て候補文字選出手段で用いる辞書を最適化する。
【0046】
【実施例】以下、本発明の実施例について図面を参照し
て説明する。
【0047】図1は第5の本発明の一実施例における文
字認識装置の構成図を示すものである。本発明の第1、
第2、第3、第4の本発明はこの第5の本発明の構成要
素を成すものであり、第5の本発明の実施例の説明の中
で同時に説明する。
【0048】図1において、入力文字列201は入力さ
れる画像文字、矩形化処理部202はその入力文字を矩
形化するための処理部、候補文字選出部1は候補となる
文字を選出する部、言語処理部2はその候補文字を言語
的に処理する部、確定文字検出部3は確定文字を検出す
る部、文字矩形情報検出部4は文字矩形情報を検出する
部、矩形分割統合部5は矩形を分割統合する部、認識結
果出力部6は認識結果を出力する部、筆記者推定部7は
筆記者を推定する部である。
【0049】以上のように構成された本実施例の文字認
識装置について、以下にその動作を説明する。
【0050】矩形化処理部202は従来の文字認識装置
における場合と同じ構成要素からなり、従来の文字認識
装置と同様にして基本矩形記憶部217に基本矩形を記
憶保持する。
【0051】図2は上記候補文字選出部1の具体的な構
成図であり、特徴抽出部271は特徴を抽出する部、文
字辞書272は文字情報を記憶した辞書、類似度算出部
273は文字辞書273を参照して類似度を算出する
部、文字選択部21は類似度を参照して文字を選択する
部、候補文字記憶部22は候補文字を記憶する部であ
る。
【0052】この候補文字選出部1の動作は次の通りで
ある。特徴抽出部271は基本矩形記憶部217から基
本矩形の座標位置を参照し、前記座標位置内の画素を矩
形化処理部202内の文字列データ記憶部211から読
みだし、従来の文字認識装置の場合と同様にして特徴量
を得て、類似度算出部273に出力する。次に類似度算
出部273は文字辞書272から各文字の代表特徴ベク
トルを読みだし、従来の文字認識装置の場合と同様にし
て各文字との類似度を算出して文字選択部21に出力す
る。文字選択部21は類似度の高い文字から順にm個の
文字とその類似度を候補文字記憶部22に出力し、候補
文字記憶部22は一矩形当りm個の候補文字と類似度を
記憶保持する。
【0053】図3は第1の本発明である言語処理部2の
具体的な構成図である。図3において、候補単語決定部
31は候補単語を決定する部、候補文節決定部32は、
候補文節を決定する部、文節評価確定部33は文節を評
価する部であり、さらに候補文字組合せ部301は候補
文字を組み合わせる部、単語整合部302は端号を整合
する部、単語辞書303は単語の辞書、候補単語記憶部
304は候補単語を記憶する部、候補文節出力部305
は候補文節出力部、文節整合部306は文節を整合する
部、文法辞書307は文法を記憶した辞書、候補文節記
憶部308は候補文節を記憶する部、文節評価値算出部
309は文節評価値を算出する部、候補文節組合せ部3
10は候補文節を組み合わせる部、文節決定部311は
文節を決定する部である。
【0054】候補文字組合せ部301は候補文字記憶部
22から連続する矩形の候補文字を一矩形当り一文字ず
つ選び出し、選びだした文字を一個ないし複数個、組合
せた結果を単語整合部302に出力する。なお前記組合
せは網羅的に行なわれ、すべての組合せについて単語整
合部302に出力されるものとする。単語辞書303に
は各単語が文字毎の整合がとれるように木構造で表現さ
れており、各単語にはその品詞と分別記号が付随して記
憶保持されているものとする。単語整合部302は入力
された文字の組合せと単語辞書303に記憶保持されて
いる単語と一文字毎に整合、不整合の判断を行い、すべ
ての文字が整合した”文字の組合せ”についてその文字
列内の位置と分別記号、品詞を候補単語記憶部304に
出力する。候補単語記憶部304は単語整合部302か
らの入力を順に記憶保持する。
【0055】候補文節出力部305は候補単語記憶30
4に記憶保持されている候補単語の情報を読みだし、隣
合う位置にある候補単語から候補文節を決定し文節整合
部306に出力する。文法辞書307には単語の活用
形、助詞との接続などの情報が記憶保持されているもの
とする。文節整合部306は入力された候補文節と文法
辞書307に記憶保持されている情報との整合、不整合
を判断し、整合した文節の位置及び候補文字記憶部22
から前記文節を構成している文字の個数k、前記文節内
の単語を構成している文字の類似度平均dと個数l、前
記単語の文字列中における頻度qを候補文節記憶部30
8に出力する。候補文節記憶部308は入力された候補
文節の上記の情報を記憶保持するメモリと以下で述べる
ように文節評価値算出部309からフィードバックされ
てくる評価値を記憶保持するメモリとからなり、入力情
報をそれらのメモリ内に記憶保持する。
【0056】文節評価値算出部309は候補文節記憶部
308に記憶保持された上記に述べた文節の情報を読み
だし、(数4)のHを文節の言語的正しさを表わす量と
して算出し、対応する文節の文節評価値として候補文節
記憶部308に出力する。
【0057】
【数4】 H=a1・d+a2・k+a3・(L−l)2+a4・q 但し、dは文節を構成する文字の類似度平均、 kは文節を構成する単語の文字数、Lは一定値、 lは文節の文字数、qは文節を構成する単語の頻度、 a1、a2、a3、a4は正規化係数。
【0058】(数4)は「構成文字の類似度が大きい程
文節として正しい。単語の文字数が多い程文節として正
しい。文節の文字数はLに近い程良い。単語の頻度が高
い程文節として確からしい。」ということを表わしてい
る。
【0059】候補文節記憶部308に記憶保持されてい
るすべての候補文節について評価値が算出された後、候
補文節組合せ部310は候補文節記憶部308に記憶保
持されている候補文節の位置情報から一定の長さになる
ように連続する複数の文節で構成される”文節組合せ”
を抽出し、その結果を文節決定部311に出力する。従
って同じ位置で始まり、同じ位置で終わる”文節組合
せ”が複数、文節決定部311に入力されることにな
る。なお”文節組合せ”は初期状態では入力文字列20
1の先頭から順にすべて抽出するものとし、さらに以下
のようにして文節決定部311によって文節が確定され
る毎に抽出する先頭を確定された文節の次の位置にす
る。
【0060】文節決定部311は入力される”文節組合
せ”のうち構成する文節一つ当りの文節評価値が最大に
なる”文節組合せ”を選び、その先頭の文節を確定され
た文節として位置情報および候補文字、文節評価値を確
定文字検出部3へ出力する。
【0061】以上の処理によって入力文字列201は文
節単位に区切られ、各々の文節には文節の言語的正しさ
を表わす量として文節評価値がつけられる。確定文字検
出部3は入力された文節のうち、一定値以上の文節評価
値を持つ文節内の候補文字を認識結果の確定文字として
矩形情報抽出部4と認識結果出力部6に出力する。なお
矩形情報抽出部4と認識結果出力部6には文節内の文字
の位置情報も出力するものとする。
【0062】認識結果出力部6は確定文字検出部3から
入力される確定文字を前記確定文字に付随して入力され
る位置での認識結果として出力する。
【0063】矩形情報抽出部4は確定された文字から矩
形情報を抽出する。図4は矩形情報抽出部4の具体的な
構成図であり、方形度算出部281は方形度を算出する
部、空白度算出部282は空白度を算出する部、矩形面
積算出部41は矩形面積を算出する部、方形度評価関数
決定部42は方形度評価関数を決定する部、空白度評価
関数決定部43は空白度評価関数を決定する部、矩形面
積評価関数決定部44は矩形面積評価関数を決定する
部、評価関数記憶部45は評価関数を記憶する部であ
る。
【0064】方形度算出部281は入力された確定文字
の位置情報を参照し、基本矩形記憶部217から前記確
定文字の矩形の方形度を算出し、方形度評価関数決定部
42に出力する。同様に空白度算出部282は入力され
た確定文字の位置情報を参照し、矩形化処理部202内
の文字列データ記憶部211から前記座標位置内の画素
のうち文字構成成分に含まれない画素数が全体の画素数
に占める割合(空白度)を算出し、空白度評価関数決定
部43に出力する。矩形面積算出部41は入力された確
定文字の位置情報を参照し、矩形化処理部202内の文
字列データ記憶部211から前記座標位置内の総画素数
を求め矩形面積評価関数決定部44に出力する。
【0065】方形度評価関数決定部42は例えば図5に
示すように入力された方形度の値のヒストグラムをと
り、評価関数の形を決定する。さらにヒストグラム値を
正規化することで評価値を決めることによって方形度評
価関数ρ1を決定する。同様にして空白度評価関数決定
部43は入力された空白度の値のヒストグラムから空白
度評価関数ρ2を決定する。矩形面積評価関数決定部4
4は入力された矩形面積の値のヒストグラムから矩形面
積評価関数ρ3を決定する。
【0066】方形度評価関数決定部42、空白度評価関
数決定部43と矩形面積評価関数44によって決定され
た評価関数は評価関数記憶部45に記憶保持される。
【0067】以上のようにして決定された評価関数は入
力文字列201から言語的に確定された文字から推定し
たものであり、評価関数としての精度は非常に高いと考
えられる。
【0068】図6は第2の本発明の矩形分割統合部5の
具体的な構成図である。
【0069】分割矩形候補選出部61は基本矩形記憶部
217に記憶保持されている矩形の中でまだ文字として
確定していない矩形を読みだし、前記矩形の方形度r、
空白度s、面積Mを求める。次に評価関数記憶部43に
記憶保持されている評価関数から(数5)を満たす矩形
を複数の文字を含むと考えられる矩形として選び出す。
【0070】
【数5】 ρ1(r)<λr かつ ρ2(s)>λs かつ ρ3(M)>
λM 但し、λr、λs、λMは適当な値。
【0071】(数5)は「ある程度以上横長で面積も大
きく、かつ空白度が大きい矩形は複数文字を含む可能性
が高い。」ということを表わしている。
【0072】分割矩形候補選出部61は選出した矩形の
位置情報を矩形分割部62に出力する。
【0073】図7は矩形分割部62の具体的な構成図で
ある。
【0074】周辺分布算出部212は分割矩形候補選出
部61から入力された位置に対応する文字列データ記憶
部211に保持された値を縦方向に累積した値を算出
し、その結果をガウスシアンフィルタ処理部213に出
力する。ガウスシアンフィルタ処理部213は周辺分布
算出部212によって求められた文字データの縦方向の
累積ヒストグラムに対してガウス型関数を畳み込むこと
によって平滑化を行うことで累積ヒストグラムの高周波
成分を除き、ノイズの影響を抑える。平滑化を受けた累
積ヒストグラムは分割点検出部71に入力される。分割
点検出部71は連続して累積ヒストグラムの値が一定値
(いき値)以下の部分を検出し、さらにその部分におい
て累積ヒストグラムの値が最小になる座標位置を現在注
目している矩形の分割点として分割矩形列方向周辺分布
算出部72と分割矩形記憶部74に出力する。
【0075】このとき、いき値は分割されてできるすべ
ての矩形が(数5)を満たさなくなるように設定される
ものとする。
【0076】分割矩形列方向周辺分布算出部72は分割
点検出部71からの入力を受けて基本矩形の左端座標と
入力された分割点及び、入力された分割点と基本矩形の
右端座標とで挟まれる部分の文字データを各々別々に横
方向に斜影し、その結果を分割矩形上下端検出部73に
出力する。なお分割点が複数ある場合にはさらに分割点
間の文字データに対しても同様の処理を行なうものとす
る。
【0077】分割矩形上下端検出部73は図13に示し
たのと同様に分割矩形列方向周辺分布算出部72からの
斜影結果の文字構成成分が成す部分の最大値、最小値を
求め、その結果を対応する分割矩形の上下端として分割
矩形記憶部74に出力する。
【0078】以上の処理によって分割矩形記憶部74に
は分割されてできた矩形がその左右端と上下端で表わさ
れ、検出順に記憶されることになる。
【0079】図8は矩形統合部63の具体的な構成図で
ある。矩形統合部63の動作を以下に図にしたがって説
明する。
【0080】図9は矩形統合部63の統合重み付きラテ
ィス作成部81の具体的な構成図であり、91は矩形組
合せ部、92は統合重み付きラティス記憶部である。矩
形組合せ部91は基本矩形記憶部217及び、分割矩形
記憶部74に保持されている文字として確定していない
部分の矩形の座標値を読みだし、隣合う矩形を組合せた
矩形の外郭幅が文字列の高さの一定倍以下になるような
すべての組合せを検出し、その結果を統合重み付きラテ
ィス記憶部92に出力する。
【0081】統合重み付きラティス記憶部92は、図1
6に示したのと同様に矩形組合せ部81によって検出さ
れたすべての矩形の組合せについて、組合せ矩形の上
下、左右端座標を記憶保持し、さらに各組合せ矩形に対
応する重み値を記憶保持するためのメモリを確保する。
【0082】統合重み値算出部82は評価関数記憶部4
5に記憶保持されている評価関数と統合重み付きラティ
ス記憶部92に記憶保持されている組合せ矩形の情報か
ら前記組合せ矩形の矩形評価値を算出し、前記組合せ矩
形に対応する重み値として統合重み付きラティス記憶部
92に出力する。
【0083】切り出し位置探索部243は重み付きラテ
ィス記憶部の始端から終端に至る経路のうちで経路上の
一矩形当りの重み値が最大になる経路を選択し、そのと
きの組合せ矩形を矩形統合結果として基本矩形記憶部2
17に出力する。
【0084】第3の本発明の文字認識装置では、すべて
の矩形が文字として確定され、認識結果出力部6によっ
て出力されるまで、再びこれまでに述べた候補文字選出
部1以降の処理を繰り返す。なお、繰り返しの処理回数
が一定以上になった場合はその時点での文節決定部31
1の出力を認識結果として認識結果出力部6が出力す
る、あるいはまだ文字として確定されていない部分の認
識を棄却するものとしても良い。
【0085】このように第3の本発明の実施例によれば
最初に矩形化処理部202によって適当な基本矩形に区
切られた入力文字列に対して候補文字選出部1が1つの
基本矩形に付き複数の候補文字を挙げ、それらの候補文
字がつくる文字列を言語処理部2が判断する。次に言語
的に正しいと思われる部分の文字を確定文字検出部3が
確定文字として検出し、認識結果出力部6が認識結果と
して出力する一方、文字矩形情報検出部4が確定文字の
矩形情報を検出し、矩形評価関数の最適化を行なう。矩
形分割統合部5は最適化された矩形評価関数に基づいて
まだ確定されていない部分の基本矩形の分割・統合を行
うことによって新たな基本矩形を求め、再び候補文字選
出部1以下の処理を行なう。このように言語的に確定さ
れた文字を認識結果とし、さらにそれらの文字を処理中
の評価関数の決定に用いることで文書毎に精度の高い評
価関数を自動的に決定することができる。
【0086】第5の本発明の文字認識装置では、以下に
述べるようにして第4の本発明の筆記者推定部によって
筆記者あるいは印刷文字のフォントを決定し、その結果
から候補文字選出部1内の文字辞書272の内容を変更
してからこれまでに述べた候補文字選出部1以降の処理
をを繰り返す。したがって候補文字選出部1での繰り返
し処理の際に文字辞書272が文書に対応して最適化さ
れるためにより精度の高い処理が行える。
【0087】筆記者推定部7は図1に示すように矩形化
処理部202、確定文字検出部3、文字矩形情報抽出部
4からの入力と候補文字選出部1への出力を持つ。
【0088】図10は本発明の第4の本発明である筆記
者推定部7の具体的な構成図である。
【0089】筆記者辞書101は図10に示すように、
あらかじめ文字認識装置の使用が予想される筆記者別、
あるいは文字の特徴量の分布が似ている筆記者群別の文
字辞書1111〜111t(tは筆記者または筆記者群の
数)と方形度辞書1121〜112tから構成されてい
る。但し、方形度辞書1121〜112tは各文字が持つ
方形度の値が記憶保持されているものとする。
【0090】筆記者評価値算出部102は図10に示す
ように特徴抽出部271、類似度平均算出部121から
なり、以下のようにして評価値を算出する。
【0091】まず、特徴抽出部271は確定文字検出部
3から入力される確定文字の位置情報に基づいて画素値
を矩形化処理部202内の文字列データ記憶部211か
ら読みだし、候補文字選出部1と同様にして確定文字の
特徴量ベクトルを得、類似度平均算出部121に出力す
る。
【0092】類似度平均算出部121は特徴抽出部27
1から確定文字の特徴量ベクトルを受け、文字矩形情報
抽出部4からは確定文字の方形度を受ける。類似度平均
算出部121は入力されるすべての確定文字の特徴量ベ
クトルについて候補文字選出部1内の類似度算出部27
3と同様にして文字辞書1111〜111t内の対応する
確定文字の代表ベクトルとの類似度を求め、前記文字辞
書毎の類似度の和μを算出する一方、入力されるすべて
の確定文字の方形度と方形度辞書1121〜112t内の
対応する確定文字の方形度との自乗誤差を求め、前記文
字辞書毎の自乗誤差の和νを算出し、(数6)で表わさ
れるEiを確定文字が文字辞書111iにどのぐらい近い
かを表わす筆記者評価値として筆記者決定部103に出
力する。
【0093】
【数6】Ei=(μ+b1・ν)/N 但し、b1は正規化定数、Nは入力された確定文字の数。
【0094】筆記者決定部103は筆記者評価値算出部
102からの入力の中で最大の筆記者評価値Emaxを持
つ筆記者辞書101内の文字辞書111maxを選出し、
候補文字選出部1内の文字辞書272の内容を文字辞書
111maxの内容に変換する。
【0095】なおこの変換は前記最大の筆記者評価値E
maxがある値以上になるまで行なわないとしても良い。
また筆記者辞書101として文字列から得られる他の情
報(文字間ピッチ、文字の外接長方形の底辺の高さ位
置、文字の外接長方形の重心の高さ位置等)の辞書を持
っていても同様の効果を得ることができるのは明かであ
る。
【0096】本発明の各種手段は、コンピュータを用い
てソフトウェア的に実現するのが通常であるが、各機能
を有するハード回路を用いて実現してもかまわない。
【0097】
【発明の効果】以上説明したように、本発明によれば、
文書毎に処理のための文字らしさを表わす評価関数を自
動的に最適化でき、処理精度、認識率の向上が図れ、そ
の実用的効果は大きい。
【図面の簡単な説明】
【図1】本発明における一実施例の文字認識装置の構成
図である。
【図2】本発明における候補文字選出部1の構成図であ
る。
【図3】本発明における言語処理部2の構成図である。
【図4】本発明における矩形情報抽出部4の構成図であ
る。
【図5】本発明における方形度評価関数の決定法の説明
図である。
【図6】本発明における矩形分割統合部5の構成図であ
る。
【図7】本発明における矩形分割部62の構成図であ
る。
【図8】本発明における矩形統合部63の構成図であ
る。
【図9】本発明における統合重み付きラティス作成部8
1の構成図である。
【図10】本発明における筆記者推定部7の構成図であ
る。
【図11】従来例における文字認識装置の構成図であ
る。
【図12】従来例における文字認識装置の矩形化処理部
201の構成図である。
【図13】従来例における左右端検出部214の動作の
説明図である。
【図14】従来例における上下端検出部216の動作の
説明図である。
【図15】従来例における矩形統合認識部203の構成
図である。
【図16】従来例における重み付きラティス作成部24
1の構成図である。
【図17】従来例における重み付きラティス記憶部25
2の説明図である。
【図18】従来例における文字評価値算出部204の構
成図である。
【図19】従来例における矩形評価値算出部205の構
成図である。
【符号の説明】
1 候補文字選出部(手段) 2 言語処理部(手段) 3 確定文字検出部(手段) 4 文字矩形情報抽出部(手段) 5 矩形分割統合部(手段) 6 認識結果出力部(手段) 7 筆記者推定部(手段) 21 文字選択部(手段) 22 候補文字記憶部(手段) 31 候補単語決定部(手段) 32 候補文節決定部(手段) 33 文節評価確定部(手段) 301 候補文字組合せ部(手段) 302 単語整合部(手段) 303 単語辞書 304 候補単語記憶部(手段) 305 候補文節出力部(手段) 306 文節整合部(手段) 307 文法辞書 308 候補文節記憶部(手段) 309 候補文節組合せ部(手段) 310 文節評価値算出部(手段) 311 文節決定部(手段) 41 矩形面積算出部(手段) 42 方形度関数決定部(手段) 43 空白度評価関数決定部(手段) 44 矩形面積評価関数決定部(手段) 45 評価関数記憶部(手段) 61 分割矩形候補選出部(手段) 62 矩形分割部(手段) 63 矩形統合部(手段) 71 分割点検出部(手段) 72 分割矩形列方向周辺分布算出部(手段) 73 分割矩形上下端検出部(手段) 74 矩形記憶部(手段) 81 統合重み付きラティス作成部(手段) 82 統合重み算出部(手段) 91 矩形組合せ部(手段) 92 統合重み付きラティス記憶部(手段) 101 筆記者辞書 102 筆記者評価値算出部(手段) 103 筆記者決定部(手段) 111 筆記者辞書101内の文字辞書 112 筆記者辞書101内の方形度辞書 121 類似度平均算出部(手段) 201 入力文字列 202 矩形化処理部(手段) 203 矩形統合認識部(手段) 204 文字評価値算出部(手段) 205 矩形評価値算出部(手段) 206 認識結果 211 文字列データ記憶部(手段) 212 周辺分布算出部(手段) 213 ガウシアンフィルタ処理部(手段) 214 左右端検出部(手段) 215 列方向周辺分布算出部(手段) 216 上下端検出部(手段) 217 基本矩形記憶部(手段) 241 重み付きラティス作成部(手段) 242 重み値算出部(手段) 243 切り出し位置探索部(手段) 251 基本矩形組合せ部(手段) 252 重み付きラティス記憶部(手段) 271 特徴量抽出部(手段) 272 文字辞書 273 類似度算出部(手段) 274 出力選出部(手段) 281 方形度算出部(手段) 282 空白度算出部(手段) 283 適合度算出部(手段)
───────────────────────────────────────────────────── フロントページの続き (72)発明者 阪上 茂生 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 (72)発明者 香田 敏行 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 (72)発明者 丹羽 寿男 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 (72)発明者 小島 良宏 大阪府門真市大字門真1006番地 松下電器 産業株式会社内

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】候補文字を組合せて単語辞書との整合性を
    みることによって複数の候補単語を決定する候補単語決
    定手段と、前記候補単語決定手段の結果から文節を推定
    し、前記推定した文節と文法辞書との整合性をみること
    によって複数の候補文節を決定する候補文節決定手段
    と、前記候補文節決定手段によって候補に挙げられた候
    補文節について前記候補文節を構成する文字の類似度平
    均、前記候補文節を構成する単語の文字数と所定値との
    差の自乗、前記候補文節の文字数、前記候補文節を構成
    する単語の頻度とで表わされる評価関数に基づいて評価
    値を算出した後、連続する前記候補文節を組み合わせる
    ことによってできる一定長さの文節群について、一文節
    当りの前記評価値が最も良い文節群を選出し、前記文節
    群の先頭文節を確定するとともに確定された文節が持つ
    評価値を文節としての言語的正しさを表わす評価値とす
    る文節評価確定手段とを備えたことを特徴とする言語処
    理装置。
  2. 【請求項2】入力文字列からの文字切り出し処理によっ
    て生じる文字の外接長方形候補である矩形の縦横比、前
    記矩形の面積と前記矩形面積に占める文字構成成分以外
    の部分の面積の割合とで表わされる評価関数に基づいて
    分割すべき矩形(1文字分以上の文字構成成分を含む矩
    形)を選出する分割矩形候補選出手段と、前記分割矩形
    候補選出手段によって選出された矩形を分割する矩形分
    割手段と、前記矩形分割手段によって分割されて生じた
    矩形も含めてすべての矩形を組み合わせて最適な矩形の
    統合の組合せを決定する矩形統合手段とを備えたことを
    特徴とする矩形分割統合装置。
  3. 【請求項3】入力された文字列構成成分を文字列方向の
    軸に射影してできるヒストグラムの値の小さい部分で分
    割することで文字列構成成分を複数の矩形として分割す
    る矩形化処理手段と、それら矩形内部の文字構成成分か
    ら特徴抽出を行い、どの文字にどれくらい近いかを表わ
    す類似度を各文字について算出することによって複数の
    候補文字を選出する候補文字選出手段と、前記候補文字
    選出手段の結果を単語辞書、文法辞書と照合することに
    よって文章としての確からしさの評価値を算出する請求
    項1記載の言語処理装置と、前記言語処理装置の結果か
    ら文字として確定した矩形を検出する確定文字検出手段
    と、前記確定文字検出手段の結果から文字として確定し
    た矩形の特徴を抽出する文字矩形情報抽出手段と、前記
    文字矩形情報抽出手段よって得られた矩形情報に基づい
    て、まだ文字として確定していない矩形の統合と分割を
    行なう請求項2記載の矩形分割統合装置と、前記確定文
    字検出手段の結果を認識結果として出力する認識結果出
    力手段を備えたことを特徴とする文字認識装置。
  4. 【請求項4】各筆記者が書く文字、あるいは印刷文字の
    フォントの癖(各文字の特徴量の分布、文字の外接長方
    形の縦横比、文字の大きさ)を記憶保持している筆記者
    辞書と、前記筆記者辞書と言語的に正しいと確定された
    文字との整合性をみることによって前記筆記者辞書のど
    の筆記者またはどの印刷文字のフォントにどれくらい近
    いかを表わす評価値を算出する筆記者評価値算出手段
    と、前記筆記者評価値算出手段の結果によって入力文字
    列の筆者または印刷文字のフォントを特定する筆記者決
    定手段を備えたことを特徴とする筆記者推定装置。
  5. 【請求項5】入力された文字列構成成分を文字列方向の
    軸に射影してできるヒストグラムの値の小さい部分で分
    割することで文字列構成成分を複数の矩形として分割す
    る矩形化処理手段と、それら矩形内部の文字構成成分か
    ら特徴抽出を行い、どの文字にどれくらい近いかを表わ
    す類似度を各文字について算出することによって複数の
    候補文字を選出する候補文字選出手段と、前記候補文字
    選出手段の結果を単語辞書、文法辞書と照合することに
    よって文章としての確からしさの評価値を算出する請求
    項1記載の言語処理装置と、前記言語処理装置の結果か
    ら文字として確定した矩形を検出する確定文字検出手段
    と、前記確定文字検出手段の結果から文字として確定し
    た矩形の特徴を抽出する文字矩形情報抽出手段と、前記
    確定文字検出手段の結果と前記文字矩形情報抽出手段よ
    って得られた矩形情報に基づいて入力文字列の筆記者ま
    たは印刷文字のフォントを決定し、その結果を前記候補
    文字選出手段に出力する請求項4記載の筆記者推定装置
    と、前記文字矩形情報抽出手段よって得られた矩形情報
    に基づいて、まだ文字として確定していない矩形の統合
    と分割を行なう請求項2記載の矩形分割統合装置と、前
    記確定文字検出手段の結果を認識結果として出力する認
    識結果出力手段とを備えたことを特徴とする文字認識装
    置。
JP34351791A 1991-12-25 1991-12-25 文字認識装置 Expired - Fee Related JP3187899B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34351791A JP3187899B2 (ja) 1991-12-25 1991-12-25 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34351791A JP3187899B2 (ja) 1991-12-25 1991-12-25 文字認識装置

Publications (2)

Publication Number Publication Date
JPH05174187A true JPH05174187A (ja) 1993-07-13
JP3187899B2 JP3187899B2 (ja) 2001-07-16

Family

ID=18362127

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34351791A Expired - Fee Related JP3187899B2 (ja) 1991-12-25 1991-12-25 文字認識装置

Country Status (1)

Country Link
JP (1) JP3187899B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006323471A (ja) * 2005-05-17 2006-11-30 Fujitsu Ltd サービス処理状況分析プログラム、サービス処理状況分析方法、およびサービス処理状況分析装置
US7480410B2 (en) 2001-11-30 2009-01-20 Matsushita Electric Works, Ltd. Image recognition method and apparatus for the same method
CN103995816A (zh) * 2013-02-14 2014-08-20 富士施乐株式会社 信息处理设备和信息处理方法
CN111798480A (zh) * 2020-07-23 2020-10-20 北京思图场景数据科技服务有限公司 基于单字符及文字间连接关系预测的文字检测方法及装置
CN113420983A (zh) * 2021-06-23 2021-09-21 科大讯飞股份有限公司 一种书写评价方法、装置、设备及存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7480410B2 (en) 2001-11-30 2009-01-20 Matsushita Electric Works, Ltd. Image recognition method and apparatus for the same method
JP2006323471A (ja) * 2005-05-17 2006-11-30 Fujitsu Ltd サービス処理状況分析プログラム、サービス処理状況分析方法、およびサービス処理状況分析装置
CN103995816A (zh) * 2013-02-14 2014-08-20 富士施乐株式会社 信息处理设备和信息处理方法
JP2014157409A (ja) * 2013-02-14 2014-08-28 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
CN103995816B (zh) * 2013-02-14 2018-10-02 富士施乐株式会社 信息处理设备和信息处理方法
CN111798480A (zh) * 2020-07-23 2020-10-20 北京思图场景数据科技服务有限公司 基于单字符及文字间连接关系预测的文字检测方法及装置
CN113420983A (zh) * 2021-06-23 2021-09-21 科大讯飞股份有限公司 一种书写评价方法、装置、设备及存储介质
CN113420983B (zh) * 2021-06-23 2024-04-12 科大讯飞股份有限公司 一种书写评价方法、装置、设备及存储介质

Also Published As

Publication number Publication date
JP3187899B2 (ja) 2001-07-16

Similar Documents

Publication Publication Date Title
US11715014B2 (en) System and method of character recognition using fully convolutional neural networks with attention
US8908961B2 (en) System and methods for arabic text recognition based on effective arabic text feature extraction
CN113158808B (zh) 中文古籍字符识别、组段与版面重建方法、介质和设备
US7336827B2 (en) System, process and software arrangement for recognizing handwritten characters
US6137908A (en) Handwriting recognition system simultaneously considering shape and context information
KR100412317B1 (ko) 문자인식/수정방법및장치
JP3422541B2 (ja) キーワードのモデル化方法及び非キーワードhmmの提供方法
WO2018090013A1 (en) System and method of character recognition using fully convolutional neural networks with attention
Hussain et al. Nastalique segmentation-based approach for Urdu OCR
US8340428B2 (en) Unsupervised writer style adaptation for handwritten word spotting
WO2008138356A2 (en) System and method for arabic omni font written optica character recognition
JP3216800B2 (ja) 手書き文字認識方法
Wang et al. A study on the document zone content classification problem
Nguyen et al. A segmentation method of single-and multiple-touching characters in offline handwritten japanese text recognition
CN107341429B (zh) 手写粘连字符串的切分方法、切分装置和电子设备
JPH05174187A (ja) 文字認識装置
Ball et al. Writer verification of historical documents among cohort writers
Xiu et al. Offline handwritten arabic character segmentation with probabilistic model
JP2002063548A (ja) 手書き文字認識方法
El-Hajj et al. Recognition of Arabic handwritten words using contextual character models
Toselli et al. Viterbi based alignment between text images and their transcripts
Bhardwaj et al. An OCR based approach for word spotting in Devanagari documents
JPH07319880A (ja) キーワード抽出・検索装置
JP2576350B2 (ja) 文字列抽出装置
JP3897999B2 (ja) 手書き文字認識方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees