JP2001344567A - 文字認識装置、その方法およびその方法を実施するためのプログラムを記録した記録媒体 - Google Patents

文字認識装置、その方法およびその方法を実施するためのプログラムを記録した記録媒体

Info

Publication number
JP2001344567A
JP2001344567A JP2000166691A JP2000166691A JP2001344567A JP 2001344567 A JP2001344567 A JP 2001344567A JP 2000166691 A JP2000166691 A JP 2000166691A JP 2000166691 A JP2000166691 A JP 2000166691A JP 2001344567 A JP2001344567 A JP 2001344567A
Authority
JP
Japan
Prior art keywords
character
unit
large classification
dictionary
classification method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000166691A
Other languages
English (en)
Inventor
立 ▲せん▼
Ritsu Sen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2000166691A priority Critical patent/JP2001344567A/ja
Publication of JP2001344567A publication Critical patent/JP2001344567A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 種々の認識辞書部を使う場合、この認識辞書
部の種類や照合対象文字の画像属性に適応した大分類方
法をとることによって、高速かつ高精度に文字の認識処
理を実施する文字認識装置およびその方法を提供する。 【解決手段】 本発明は、文字画像を入力する入力部1
10と、この入力部110で入力された文字画像から特
徴量を抽出する特徴量抽出部120と、入力された文字
画像に対する情報によって大分類方法を決定する大分類
方法決定部132と、この大分類方法決定部132で決
定された大分類方法と特徴量抽出部120で抽出された
特徴量とで候補文字を絞る大分類部134と、この大分
類部134で絞り込まれた候補文字に対して照合用の辞
書部220との相違度を計算する詳細分類部136と、
この詳細分類部136で得た文字カテゴリを候補として
出力する出力部140とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字を認識するた
めの文字認識装置、その方法およびその方法を実施する
ためのプログラムを記録した記録媒体に関し、特に、文
字を認識するとき大分類を行って候補を絞り込んでより
詳細な認識を行うための文字認識装置、その方法および
その方法を実施するためのプログラムを記録した記録媒
体に関する。
【0002】
【従来の技術】従来、文字認識装置においては、入力文
字パターンとカテゴリごとに作成した辞書部との照合を
行うことにより、認識する方法が多く採られている。こ
の場合、認識対象となる字種が数字や記号等のように数
十のオーダーである場合には入力文字パターンとすべて
のカテゴリとの間で照合計算をしても比較的に短い時間
に結果を得られるが、漢字のように字種が数千のオーダ
ーである場合には数字や記号等の計算時間に比較して百
倍以上の時間がかかる。また、これにフォントや字体等
の変化も考慮すると、この照合計算には膨大な時間がか
かることになる。そこで照合時間を短くするために、大
分類を行って候補を比較的少数に絞り、次に絞られた候
補に対して詳細な照合計算を行うという処理が採られて
いる。この大分類を行う方法としては、例えば、大分類
用辞書部と詳細分類用辞書部とを別々に備えて、文字画
像より抽出した大分類用特徴量と大分類用辞書部との照
合計算(大分類)を行うことにより、詳細分類用辞書部
との照合計算(詳細分類)を行うか否か、あるいは、照
合する範囲を決定している(特開昭63−126082
号公報等)。
【0003】
【発明が解決しようとする課題】しかしながら、この大
分類で候補文字数を絞り込んで行う従来の文字認識方法
においては、ユーザの用途や文字認識のアルゴリズムに
よって、種々の認識辞書部を使う場合、この認識辞書部
の種類にかかわらず、共通の方法で大分類するのでは、
認識速度や認識精度の低下が懸念されるという問題があ
る。本発明の課題は、このような問題を解決することに
ある。すなわち、本発明の目的は、辞書部の種類や照合
対象文字の画像属性に適応した分類方法をとることによ
り、文字認識を高速かつ高精度に実施することができる
文字認識装置、その方法およびその方法を実施するため
のプログラムを記録した記録媒体を提供することにあ
る。
【0004】
【課題を解決するための手段】本発明の請求項1の文字
認識装置は、入力した文字画像を大分類で候補文字を絞
り、その候補文字について辞書部と照合して照合結果を
出力する文字認識装置において、前記候補文字を絞る
際、入力された文字画像に対する情報によって大分類方
法を決定する大分類方法決定部を備えるようにしたこと
を特徴とする。また、本発明の請求項2の文字認識装置
は、文字画像を入力する入力部と、前記入力部で入力さ
れた文字画像から特徴量を抽出する特徴量抽出部と、入
力された文字画像に対する情報によって大分類方法を決
定する大分類方法決定部と、前記大分類方法決定部で決
定された大分類方法と前記特徴量抽出部で抽出された特
徴量とで候補文字を絞る大分類部と、前記大分類部で絞
り込まれた候補文字に対して照合用の辞書部と相違度を
計算する詳細分類部と、前記詳細分類部で得た文字カテ
ゴリを候補として出力する出力部とを備えたことを特徴
とする。また、本発明の請求項3の文字認識装置は、請
求項1または請求項2記載の文字認識装置において、前
記大分類方法決定部は、前記文字画像に対する情報とし
て、指定された辞書部の種類または照合用の辞書部中の
照合対象文字属性、あるいは、照合対象文字の画像属性
を有し、これらの情報に対して大分類を行うか、否かを
決定し、大分類を行う場合には、その大分類方法を対応
付けた大分類決定ルールを備えるようにして、大分類方
法を決定するようにしたことを特徴とする。また、本発
明の請求項4の文字認識装置は、請求項1、請求項2、
または請求項3記載の文字認識装置において、前記大分
類方法は、照合の距離による大分類、候補順位による大
分類、照合の距離と画像属性による大分類、または、こ
れらの方法を組み合わせた大分類からなることを特徴と
する。また、本発明の請求項5の文字認識方法は、請求
項3記載の文字認識装置において、前記辞書部の種類
は、漢字だけの辞書部、仮名だけの辞書部、英字だけの
辞書部、記号だけの辞書部、縦長文字だけの辞書部、横
長文字の辞書部、小文字だけの辞書部、または、これら
が混在した辞書部の1つ以上の辞書部を備えたことを特
徴とする。
【0005】また、本発明の請求項6の文字認識方法
は、文字画像を入力する入力工程と、前記入力工程で入
力された文字画像から特徴量を抽出する特徴量抽出工程
と、入力された文字画像に対する情報によって大分類方
法を決定する大分類方法決定工程と、前記大分類方法決
定工程で決定された大分類方法と前記特徴量抽出工程で
抽出された特徴量とで候補文字を絞る大分類工程と、前
記大分類部で絞り込まれた候補文字に対して照合用の辞
書部と相違度を計算する詳細分類工程と、前記詳細分類
工程で得た文字カテゴリを候補として出力する出力工程
とを備えたことを特徴とする。また、本発明の請求項7
の文字認識方法は、請求項6記載の文字認識方法におい
て、前記文字画像に対する情報として、指定された辞書
部の種類または照合用の辞書部中の照合対象文字属性、
あるいは、照合対象文字の画像属性を有し、これらの情
報に対して大分類を行うか、否かを決定し、大分類を行
う場合には、その大分類方法を対応付けた大分類決定ル
ールを備えるようにして、大分類方法を決定するように
したことを特徴とする。また、本発明の請求項8の文字
認識方法は、請求項6または請求項7記載の文字認識方
法において、前記大分類方法は、照合の距離による大分
類、候補順位による大分類、照合の距離と画像属性によ
る大分類、または、これらの方法を組み合わせた大分類
からなることを特徴とする。また、本発明の請求項9の
文字認識方法は、請求項7記載の文字認識方法におい
て、前記辞書部の種類は、漢字だけの辞書部、仮名だけ
の辞書部、英字だけの辞書部、記号だけの辞書部、縦長
文字だけの辞書部、横長文字の辞書部、小文字だけの辞
書部、または、これらが混在した辞書部の1つ以上の辞
書部を備えたことを特徴とする。また、本発明の請求項
10の記録媒体は、コンピュータを、文字認識装置とし
て機能させるためのコンピュータ読み取り可能な記録媒
体であって、このコンピュータを、文字画像を入力する
入力部と、前記入力部で入力された文字画像から特徴量
を抽出する特徴量抽出部と、入力された文字画像に対す
る情報によって大分類方法を決定する大分類方法決定部
と、前記大分類方法決定部で決定された大分類方法と前
記特徴量抽出部で抽出された特徴量とで候補文字を絞る
大分類部と、前記大分類部で絞り込まれた候補文字に対
して照合用の辞書部と相違度を計算する詳細分類部と、
前記詳細分類部で得た文字カテゴリを候補として出力す
る出力部とを備えた文字認識装置として機能させるため
のプログラムを記録した。
【0006】
【発明の実施の形態】以下、本発明の1つの実施の形態
を図面に基づいて詳細に説明する。 (1)文字認識装置の機能構成 図1は、本発明の1つの実施の形態に係る文字認識装置
の機能構成を示すブロック図である。本発明の1つの実
施の形態に係る文字認識装置は、入力部110、特徴量
抽出部120、照合部130、出力部140及び照合用
の辞書部220から構成されている。更に、照合部13
0は、大分類方法決定部132、大分類部134、詳細
分類部136及び大分類方法決定ルール格納部210と
から構成されている。 (2)文字認識の概略的な処理の流れ 入力部110は、次のような文字認識に必要な前処理を
行う。まず、原稿用紙等の画像をスキャナーによって読
み取る。画像の読み取りは、スキャナーだけではなく、
既に読み込まれている画像をファイル等から読み込んで
もよい。この読み込まれた画像をディスプレイへ表示
し、その中からマウスのようなポインティングデバイス
から文字部分を選択する。文字部分は、領域識別の技術
を使って判別されても良い。この選択された文字部分の
画像に対して大きさの正規化や雑音除去を行う。これら
の処理が終了すると、特徴量抽出部120へ送られる。
この入力された文字の画像属性として、面積、形状(縦
長、横長等)、配置(上付き、下付き、真中等)、画素
の密度(白と黒の割合)等を抽出して、一時的に記憶し
ておく。また、文字の画像特性として、面積、形状(縦
長、横長等)、配置(上付き、下付き、真中等)から自
動的にどの辞書部と照合するかを判断する。
【0007】この照合用の辞書部220としては、図3
に示したように漢字だけの辞書部、仮名だけの辞書部、
英字だけの辞書部、記号だけの辞書部、縦長文字(例、
“1”、“i”等)だけの辞書部、横長文字(例、
“ー”、“−”等)の辞書部、小文字
(例:“。”、“、”、“・”等の面積的に小さな文字)
だけの辞書部、または、それら混在している辞書部等が
用意されており、この中から1乃至複数の辞書部を指定
して照合する。特徴量抽出部120は、入力部110か
ら送られた文字画像に対して、認識に用いられる特徴量
である特徴ベクトルを抽出する。この特徴ベクトルは、
特開平1−250184号公報の方向コードヒストグラ
ム等を用いて作成される。照合部130は、入力部11
0で指示された辞書部の種類や照合対象文字の画像属性
に対応する大分類方法を、大分類方法決定ルール格納部
210(図5参照)の大分類方法決定ルールを用いて大
分類方法決定部132(後述)で決定し、その大分類方
法によって入力文字を大分類部134で大雑把に分類分
けして候補を絞り、この候補について詳細分類部136
が、抽出された特徴ベクトルと照合用の辞書部220に
登録された標準パターンの特徴ベクトルとを所定の計算
式を用いて相違度を計算する。この相違度の計算は、例
えば、ユークリッド距離や擬似ベイズ識別関数等によっ
て計算される。また、この大分類方法には、図4にある
ように、マッチングの距離による大分類方法、候補順位
による大分類方法、マッチングの距離と画像属性による
大分類方法、組み合わせによる大分類方法および大分類
を行わない方法とがある。出力部140は、照合対象文
字に対する照合結果である相違度を小さい順に並べ、そ
のうちの一定個数(例えば、10個)につき文字コードを
出力する。照合用の辞書部220は、上記したような種
々の種類があり、それらは登録されている文字毎に、文
字コード、標準パターン特徴ベクトル等の情報を保持し
ている。
【0008】(3)本発明の1つの実施の形態における
処理の流れ 図2は、本発明の1つの実施の形態における処理の流れ
を示している。原稿用紙等の画像をスキャナーによって
読み取る。この画像の読み取りは、スキャナーだけでは
なく、既に読み込まれている画像をファイル等から読み
込んでもよい。この読み込まれた画像をディスプレイへ
表示し、その中からマウスのようなポインティングデバ
イスから文字部分を選択する。文字部分は、領域識別の
技術を使って判別されても良い。この選択された文字部
分の画像に対して大きさの正規化や雑音除去を行う。ま
た、この入力された文字の画像属性として、面積、形状
(縦長、横長等)、配置(上付き、下付き、真中等)、
画素の密度(白と黒の割合)等を抽出して、一時的に記
憶しておく(ステップS100)。この処理する文字を
どの照合用の辞書部(図3参照)によって照合処理する
かは、この文字の画像特性として、面積、形状(縦長、
横長等)、配置(上付き、下付き、真中等)等から判断
する。この選択結果を一時的に記憶しておく(ステップ
S110)。入力された文字画像に対して、認識に用い
られる特徴量である特徴ベクトルを抽出する(ステップ
S120)。一時的に保存された照合に使う辞書部の種
類や照合対象文字の画像属性に対応する大分類方法を、
大分類方法決定ルール210(図5参照)に適用して大
分類方法を決定する(ステップS130)。この決定さ
れた大分類方法(図4参照)によって、入力文字を大雑
把に分類分けして候補を絞る(ステップS140)。こ
の候補について、抽出された特徴ベクトルと指定された
照合用の辞書部220に登録された標準パターンの特徴
ベクトルとを所定の計算式を用いて相違度を計算して、
最終的な候補の絞込みを行う。この相違度の計算は、例
えば、ユークリッド距離や擬似ベイズ識別関数等によっ
て計算される(ステップS150)。照合対象文字に対
する照合結果である相違度を小さい順に並べ、そのうち
の一定個数につき文字コードを最終候補として出力する
(ステップS160)。
【0009】(4)大分類方法決定部132の説明 (A)辞書部の種類を指定された場合 辞書部エントリ数の少ない小文字
(例、“。”、“、”、“,”等の面積の小さな文字)
だけの辞書部を使った場合、大分類によって、候補数は
0になり、正しい認識結果が得られない場合がある。こ
のような場合には、辞書部の種類によって、大分類を行
わないか、または大分類の方法を別のものに代えたほう
が良い。例えば、図5に示すように、小文字だけの辞書
部を指定された場合は、「大分類を使わない」というよ
うにルールを定める。また、混在辞書部の場合は、「マ
ッチング距離による大分類と候補順位による大分類の両
方を用いる」ようにルールを定める。 (B)照合対象文字の画像属性の場合 入力された文字画像の画像属性として、一時的に記憶し
た面積、形状(縦長、横長等)、配置(上付き、下付
き、真中等)、画素の密度(白と黒の割合)等によっ
て、同じ辞書部の中で照合対象の辞書部エントリを指定
することがある。例えば、入力画像の矩形面積が小さい
場合は、辞書部中の小文字(“。”、“、”等)エント
リだけを照合対象する。または、この場合、小文字だけ
の辞書部を対象とする。また、画素の密度によっては漢
字だけの辞書部を指定されたとみなしたり、形状によっ
ては縦長文字だけの辞書部や横長文字だけの辞書部が指
定されたものとみなすことができる。このように対象を
限定されたときには、上記した辞書部の種類を指定され
たときと同様に大分類方法決定ルール格納部210の大
分類方法決定ルールを適用する。
【0010】次に、本発明の他の実施の形態を図面に基
づいて説明する。図6は本発明の他の実施の形態に係る
文字認識装置を示すブロック図である。本発明の他の実
施の形態に係る文字認識装置は、図6に示したハードウ
ェア構成を持つコンピュータ装置により構成されてい
る。このコンピュータ装置は、入力装置1と、表示装置
2と、CPU3と、メモリ4と、記憶装置5と、媒体駆
動装置6とを有している。入力装置1と、表示装置2
と、CPU3と、メモリ4と、記憶装置5と、媒体駆動
装置6は、相互に接続されている。入力装置1はキーボ
ード、マウス、タッチパネル等により構成され、情報の
入力に使用される。また、文字画像を入力するためにス
キャナーが接続されても良い。表示装置2は、種々の出
力情報や入力装置1からの入力された情報などを表示出
力させる。CPU(Central Processing Unit;中央処
理ユニット)3は、種々のプログラムを動作させる。メ
モリ4は、プログラム自身を保持し、またそのプログラ
ムがCPU3によって実行されるときに一時的に作成さ
れる情報等を保持する。記憶装置5は、本装置で扱う大
分類方法決定ルール格納部210や照合用の辞書部22
0及びプログラムやプログラム実行時の一時的な情報等
を保持する。媒体駆動装置6は、プログラムやデータ等
を記憶した記録媒体を装着してそれらを読み込み、メモ
リ4または記憶装置5へ格納するのに用いられる。ま
た、直接データ(例えば、文字認識対象の文書画像デー
タ等)の入出力やプログラム実行するのに使ってもよ
い。このようなコンピュータ装置において、図1に示し
た文字認識装置を構成する各機能をプログラム化し、予
めCD−ROM等の記録媒体に書き込んでおき、このC
D−ROMを各サイトのCD−ROMドライブのような
媒体駆動装置6を搭載したコンピュータに装着して、プ
ログラムをメモリ4あるいは記憶装置5に格納し、その
プログラムを実行することによって、前記実施形態と同
様な機能を実施することができる。
【0011】なお、記録媒体としては半導体媒体(例え
ば、ROM、ICメモリカード等)、光媒体(例えば、
DVD−ROM、MO、MD、CD−R等)、磁気媒体
(例えば、磁気テープ、フレキシブルディスク等)のい
ずれであってもよい。また、本発明の機能を実施するプ
ログラムは、媒体の形で頒布することができる。また、
本発明の機能を実施するプログラムを磁気ディスク等の
記憶装置に格納しておき、有線または無線の通信ネット
ワークによりダウンロード等の形式で頒布することも可
能である。更に、本発明の機能を実施するプログラムを
放送波によって配布することで提供するようにしても良
い。また、クライアント側のコンピュータのスキャナー
から画像を取り込み、取り込んだ画像をサーバー側の入
力部110へ送り、認識処理を行い、認識結果を出力部
140がクライアント側のコンピュータへ送信して、ク
ライアント側のコンピュータでその送られた認識結果を
表示するようにさせても良い。また、クライアント側の
コンピュータで取り込んだ画像の初期処理を行ってか
ら、サーバー側の入力部110へその処理結果を送るよ
うにしても良い。
【0012】
【発明の効果】以上のように、本発明によれば、照合対
象文字に関する情報(指定された辞書部の種類や照合対
象文字の画像属性)によって、適切な大分類方法へ切り
替えることができるので、高速かつ高精度に文字の認識
処理を実施することができる。
【図面の簡単な説明】
【図1】本発明の1つの実施の形態に係る文字認識装置
を示すブロック図である。
【図2】図1の文字認識装置の動作を説明するためのフ
ローチャートである。
【図3】本発明の1つの実施の形態で用いる辞書部の種
類を説明するための図である。
【図4】本発明の1つの実施の形態で用いる大分類方法
の種類を説明するための図である。
【図5】本発明の1つの実施の形態で用いる大分類を決
定するためのルールを説明する図である。
【図6】本発明の他の実施の形態に係る文字認識装置を
示すブロック図である。
【符号の説明】 110 入力部、120 特徴量抽出部、130 照合
部、132 大分類方法決定部、134 大分類部、1
36 詳細分類部、140 出力部、210大分類方法
決定ルール格納部、220 辞書部、1 入力装置、2
表示装置、3 CPU、4 メモリ、5 記憶装置、
6 媒体駆動装置。

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 入力した文字画像を大分類で候補文字を
    絞り、その候補文字について辞書部と照合して照合結果
    を出力する文字認識装置において、前記候補文字を絞る
    際、入力された文字画像に対する情報によって大分類方
    法を決定する大分類方法決定部を備えるようにしたこと
    を特徴とする文字認識装置。
  2. 【請求項2】 文字画像を入力する入力部と、前記入力
    部で入力された文字画像から特徴量を抽出する特徴量抽
    出部と、入力された文字画像に対する情報によって大分
    類方法を決定する大分類方法決定部と、前記大分類方法
    決定部で決定された大分類方法と前記特徴量抽出部で抽
    出された特徴量とで候補文字を絞る大分類部と、前記大
    分類部で絞り込まれた候補文字に対して照合用の辞書部
    と相違度を計算する詳細分類部と、前記詳細分類部で得
    た文字カテゴリを候補として出力する出力部とを備えた
    ことを特徴とする文字認識装置。
  3. 【請求項3】 請求項1または請求項2記載の文字認識
    装置において、前記大分類方法決定部は、前記文字画像
    に対する情報として、指定された辞書部の種類または照
    合用の辞書部中の照合対象文字属性、あるいは、照合対
    象文字の画像属性を有し、これらの情報に対して大分類
    を行うか否かを決定し、大分類を行う場合には、その大
    分類方法を対応付けた大分類決定ルールを格納している
    大分類決定ルール格納部を備えるようにして、大分類方
    法を決定するようにしたことを特徴とする文字認識装
    置。
  4. 【請求項4】 請求項1、請求項2または請求項3記載
    の文字認識装置において、前記大分類方法は、照合の距
    離による大分類、候補順位による大分類、照合の距離と
    画像属性による大分類、または、これらの方法を組み合
    わせた大分類からなることを特徴とする文字認識装置。
  5. 【請求項5】 請求項3記載の文字認識装置において、
    前記辞書部の種類は、漢字だけの辞書部、仮名だけの辞
    書部、英字だけの辞書部、記号だけの辞書部、縦長文字
    だけの辞書部、横長文字の辞書部、小文字だけの辞書
    部、または、これらが混在した辞書部の1つ以上の辞書
    部を備えたことを特徴とする文字認識装置。
  6. 【請求項6】 文字画像を入力する入力工程と、前記入
    力工程で入力された文字画像から特徴量を抽出する特徴
    量抽出工程と、入力された文字画像に対する情報によっ
    て大分類方法を決定する大分類方法決定工程と、前記大
    分類方法決定工程で決定された大分類方法と前記特徴量
    抽出工程で抽出された特徴量とで候補文字を絞る大分類
    工程と、前記大分類部で絞り込まれた候補文字に対して
    照合用の辞書部と相違度を計算する詳細分類工程と、前
    記詳細分類工程で得た文字カテゴリを候補として出力す
    る出力工程とを備えたことを特徴とする文字認識方法。
  7. 【請求項7】 請求項6記載の文字認識方法において、
    前記文字画像に対する情報として、指定された辞書部の
    種類または照合用の辞書部中の照合対象文字属性、ある
    いは、照合対象文字の画像属性を有し、これらの情報に
    対して大分類を行うか、否かを決定し、大分類を行う場
    合には、その大分類方法を対応付けた大分類決定ルール
    を格納している大分類決定ルール格納部を備えるように
    して、大分類方法を決定するsようにしたことを特徴と
    する文字認識方法。
  8. 【請求項8】 請求項6または請求項7記載の文字認識
    方法において、前記大分類方法は、照合の距離による大
    分類、候補順位による大分類、照合の距離と画像属性に
    よる大分類、または、これらの方法を組み合わせた大分
    類からなることを特徴とする文字認識方法。
  9. 【請求項9】 請求項7記載の文字認識方法において、
    前記辞書部の種類は、漢字だけの辞書部、仮名だけの辞
    書部、英字だけの辞書部、記号だけの辞書部、縦長文字
    だけの辞書部、横長文字の辞書部、小文字だけの辞書
    部、または、これらが混在した辞書部の1つ以上の辞書
    部を備えたことを特徴とする文字認識方法。
  10. 【請求項10】 文字画像を入力する入力機能と、前記
    入力機能により入力された文字画像から特徴量を抽出す
    る特徴量抽出機能と、入力された前記文字画像に対する
    情報によって大分類方法を決定する大分類方法決定機能
    と、前記大分類方法決定機能により決定された大分類方
    法と前記特徴量抽出機能により抽出された特徴量とで候
    補文字を絞る大分類機能と、前記大分類機能により絞り
    込まれた候補文字に対して照合用の辞書部との相違度を
    計算する詳細分類機能と、前記詳細分類機能で得た文字
    カテゴリを候補として出力する出力機能部とを実施する
    ためのプログラムを記録したコンピュータ読み取り可能
    な記録媒体。
JP2000166691A 2000-06-02 2000-06-02 文字認識装置、その方法およびその方法を実施するためのプログラムを記録した記録媒体 Pending JP2001344567A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000166691A JP2001344567A (ja) 2000-06-02 2000-06-02 文字認識装置、その方法およびその方法を実施するためのプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000166691A JP2001344567A (ja) 2000-06-02 2000-06-02 文字認識装置、その方法およびその方法を実施するためのプログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2001344567A true JP2001344567A (ja) 2001-12-14

Family

ID=18669969

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000166691A Pending JP2001344567A (ja) 2000-06-02 2000-06-02 文字認識装置、その方法およびその方法を実施するためのプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2001344567A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2005046942A1 (ja) * 2003-11-13 2007-08-23 独立行政法人科学技術振興機構 ロボットの駆動方法
CN104794455A (zh) * 2015-05-04 2015-07-22 北京信息科技大学 一种东巴象形文字识别方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2005046942A1 (ja) * 2003-11-13 2007-08-23 独立行政法人科学技術振興機構 ロボットの駆動方法
US7848850B2 (en) 2003-11-13 2010-12-07 Japan Science And Technology Agency Method for driving robot
JP2011131376A (ja) * 2003-11-13 2011-07-07 Japan Science & Technology Agency ロボットの駆動システム、及び、ロボットの駆動プログラム
JP4878842B2 (ja) * 2003-11-13 2012-02-15 独立行政法人科学技術振興機構 ロボットの駆動方法
CN104794455A (zh) * 2015-05-04 2015-07-22 北京信息科技大学 一种东巴象形文字识别方法
CN104794455B (zh) * 2015-05-04 2017-11-14 北京信息科技大学 一种东巴象形文字识别方法

Similar Documents

Publication Publication Date Title
JP4366108B2 (ja) 文書検索装置、文書検索方法及びコンピュータプログラム
US6970601B1 (en) Form search apparatus and method
JP3822277B2 (ja) 文字テンプレートセット学習マシン動作方法
US8494273B2 (en) Adaptive optical character recognition on a document with distorted characters
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US7580571B2 (en) Method and apparatus for detecting an orientation of characters in a document image
JP2001167131A (ja) 文書シグネチュアを使用する文書の自動分類方法
JPH09179937A (ja) 文書画像のセンテンスの境界の自動識別方法
Elms et al. The advantage of using an HMM-based approach for faxed word recognition
US20080069447A1 (en) Character recognition method, character recognition device, and computer product
US7146047B2 (en) Image processing apparatus and method generating binary image from a multilevel image
US8340428B2 (en) Unsupervised writer style adaptation for handwritten word spotting
US6035062A (en) Character recognition method and apparatus
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2001344567A (ja) 文字認識装置、その方法およびその方法を実施するためのプログラムを記録した記録媒体
US6320985B1 (en) Apparatus and method for augmenting data in handwriting recognition system
JP3730073B2 (ja) テンプレート作成方法、装置、およびテンプレート作成プログラムを記録した記録媒体
JP2751865B2 (ja) 文字列認識装置
CN112560849A (zh) 基于神经网络算法的文理分割方法及系统
CN115131806B (zh) 一种基于深度学习的各类证件ocr图像信息识别方法、系统
Li An implementation of ocr system based on skeleton matching
WO2023062799A1 (ja) 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム
Elmore et al. A morphological image preprocessing suite for ocr on natural scene images
JP4328511B2 (ja) パターン認識装置、パターン認識方法、プログラムおよび記憶媒体
JPH0757040A (ja) Ocr付きファイリング装置