JPH087033A - 情報処理方法及び装置 - Google Patents

情報処理方法及び装置

Info

Publication number
JPH087033A
JPH087033A JP6134194A JP13419494A JPH087033A JP H087033 A JPH087033 A JP H087033A JP 6134194 A JP6134194 A JP 6134194A JP 13419494 A JP13419494 A JP 13419494A JP H087033 A JPH087033 A JP H087033A
Authority
JP
Japan
Prior art keywords
character
information
output
image
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6134194A
Other languages
English (en)
Inventor
Hirotaka Shiiyama
弘隆 椎山
Katsumi Masaki
克己 正木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP6134194A priority Critical patent/JPH087033A/ja
Priority to DE69519256T priority patent/DE69519256T2/de
Priority to EP95304095A priority patent/EP0687991B1/en
Priority to US08/490,739 priority patent/US5905811A/en
Priority to CN95107055A priority patent/CN1106620C/zh
Publication of JPH087033A publication Critical patent/JPH087033A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 OCRにより認識したテキストを登録し、検
索語によりそれらのテキストを検索する際に、OCRに
よる認識の際に御認識されていることによる検索不可能
な状態をなくす。また、そのためにオペレータ及び装置
に負担がかからないような処理とする。 【構成】 記憶されている画像情報を認識し、類似度の
程度に応じて認識結果として出力する候補文字数を切り
替えながら認識結果を出力するOCR処理部2と、認識
結果から検索用の文字列を作成し、検索用ファイルとし
て登録する文書検索部3とを備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、OCRを用いて画像情
報を認識してテキスト情報への変換処理を行い得る情報
処理方法及び装置に関するものであり、また、その認識
結果を用いて検索データベースを生成し得る情報処理方
法及び装置に関するものである。
【0002】
【従来の技術】従来、原稿画像をOCRにより認識した
場合、誤認識対策として類似度が低いものをオペレータ
に報知し、オペレータの手によりキーボード等から訂正
文字を入力するようにしていた。
【0003】また、誤認識された文字の訂正処理を機械
的に行う研究も行われており、単語辞書や知識ベースに
認識結果をつき合わせていき、誤認識文字を訂正するも
のがある。
【0004】
【発明が解決する課題】従来は、オペレータの手により
訂正文字を入力するという、オペレータの負担になる作
業が必要であった。
【0005】また、従来の、認識結果を単語辞書や知識
ベースを用いた誤認識文字の訂正処理は、コンピュータ
にかかる負荷が大きいものであった。
【0006】
【目的】本発明は、誤認識訂正の為のオペレータの手作
業を排除し、かつ誤認識訂正の為のコンピュータの負荷
を軽減して他の処理に有効利用することを可能とするこ
とを目的とする。
【0007】
【課題を解決する為の手段】上記目的を達成する為に、
本発明は画像情報を記憶し、前記記憶してある画像情報
の文字を認識し、文字コードとその類似度を出力し、前
記出力された類似度に応じて、1文字の画像情報に対し
て出力する候補文字数を決定する情報処理方法及び装置
を提供する。
【0008】上記目的を達成する為に、本発明は好まし
くは前記候補文字数の決定は、前記出力された類似度を
閾値との比較により行う。
【0009】上記目的を達成する為に、本発明は好まし
くは前記1文字の画像情報に対して出力する情報は、決
定された候補文字数とその数の候補文字を含む。
【0010】上記目的を達成する為に、本発明は好まし
くは前記1文字の画像情報に対して出力する情報は、1
文字に対する情報であることを識別する為の識別情報に
より区切る。
【0011】上記目的を達成する為に、本発明は好まし
くは前記1文字に対して出力された候補文字数が複数で
ある場合に、該複数の候補文字を連続する文字と組み合
わせて複数の文字列を作成する。
【0012】上記目的を達成する為に、本発明は好まし
くは前記作成された文字列を格納する。
【0013】上記目的を達成する為に、本発明は好まし
くは前記格納された文字列と、検索語との照合を行い、
検索語と合致する文字列に対応して記憶されている画像
情報を呼び出す。
【0014】
【実施例】以下本発明の一実施例について、詳細に説明
する。
【0015】図4は、実施例における処理システムの構
成ブロック図である。
【0016】イメージスキャナ1は認識対象となる文書
の原稿画像を光学的に読み取る画像入力手段であり、キ
ーボード、マウス5はオペレータによる各種コマンド
や、指示情報を入力する為の入力手段であり、検索処理
の際の検索語や検索条件もこのキーボード或いはマウス
により入力される。表示装置6は、例えばCRTや液晶
表示器といった表示手段であって、キーボード、マウス
5から入力された情報や、イメージスキャナ1から入力
された画像情報、処理経過、処理結果を表示する。外部
記憶装置4は、イメージスキャナから入力されたイメー
ジデータ、テキスト情報、検索用ファイルを記憶する記
憶手段である。コンピュータ10はCPU10−1の制
御により各種情報処理を行うものであって、後述するフ
ローチャートに示すような各種情報処理の制御プログラ
ムはメモリ10−2に格納されており、この制御プログ
ラムに従ってCPU10−1は各種処理の実行及び制御
を行う。また、メモリ10−2には、文字認識に用いる
辞書も記憶されている。尚、メモリ10−2に格納され
ている制御プログラムは、外部記憶手段等より必要に応
じて読み込んだものであっても良い。本実施例において
は、このコンピュータ10により実行される主な処理を
行うものとしてOCR処理部2と文書検索部3を設け、
説明する。
【0017】イメージスキャナ1より入力した原稿画像
のイメージデータからテキスト情報への変換処理を図1
のフローチャートに示し、説明する。
【0018】外部記憶装置4に記憶されている、イメー
ジスキャナ1より入力したイメージデータをOCR処理
部2に入力する(S1)。入力されたイメージデータに
文字データが存在するか否か判断し(S2)、存在する
場合には、1文字文のイメージデータを切り出し(S
3)、その切り出した1文字を辞書とマッチングし、認
識結果として複数の文字コード及び各々の文字コードの
示す辞書データとの類似度としての尤度を得る(S
4)。S4における認識結果として得た文字コードのう
ち、最大の尤度を、予め定められ、メモリ10−2に格
納されている閾値、Th1と比較し(S5)、尤度がT
h1より大きい場合は、その認識結果が確かであると判
断し、その1文字を認識結果として出力する(S6)。
S5において尤度がTh1より大きくないと判断される
場合は、その1文字のイメージデータに対する認識結果
を複数格納する為、識別情報としてデリミターを出力す
る(S7)。S8では、オペレータにより指定されたモ
ードもしくはシステムに設定されているモード或いはS
4で得た尤度に応じてS9かS11かに進む。S9で
は、S4で得た複数の尤度のうち、予め定められ、メモ
リ10−2に格納されているTh2を超えた尤度に対応
する文字コードをその1文字のイメージデータに対応す
る結果として出力する。S11では、S4において得ら
れた複数の文字コードのうち、尤度の大きなものから順
にNmax個の文字コードをその1文字のイメージデータ
に対応する結果として出力する。その1文字のイメージ
デー対対応する結果が出力されたら、その文字の結果の
終わりを示す識別情報としてデリミターを出力する(S
10)。
【0019】1文字のイメージデータの認識と結果の出
力が終了したら、S2で残りの文字データが存在しない
と判断されるまで、対象とするイメージデータを更新し
ながらS3からS11の処理を繰り返す。
【0020】これらのS6からS11で出力されたコー
ド情報は、テキスト情報として外部記憶装置4に順次記
憶する。
【0021】このような処理により、OCR認識尤度が
低く、認識に自信がもてない場合に認識結果を1つに絞
ることを避け、認識尤度に応じた最適な複数の認識候補
を選び、有効な認識候補情報を捨てずに蓄積、活用する
ことが可能となる。以上の処理により記憶されたテキス
ト情報を、後に検索に用い得るように検索用ファイルを
作成することが指示された場合の、検索用ファイル作成
処理を図2のフローチャートに示し、説明する。
【0022】外部記憶装置4に記憶されているテキスト
情報に対して検索用ファイルの作成が指示された場合
に、その指示されたテキストデータを検索用ファイルに
登録する際のインデックス用の文字キー種類を指定し
(S21)、指示されたテキスト情報を外部記憶装置4
から文書検索部3にロードする(S22)。ロードした
テキスト情報から1文字のデータを読み込み(S2
4)、その文字コードがデリミターであると判断される
場合には(S25)、次のデリミターまでの複数候補と
これまでの文字列を組み合わせて複数個の文字キーを展
開し、S25においてデリミターでないと判断された場
合には、文字キーの文字列の最後にその1文字を付加す
る(S27)。S28において文字キーの完成であると
判断されるまでS25からS27までの処理を繰り返
す。
【0023】S28において文字キーの完成であると判
断された場合には、作成された文字キー(単数又は複
数)を外部記憶装置4の検索用ファイル中のインデック
ス情報に付加する(S29)。
【0024】S23において全文字データが処理される
までS24からS29の処理を繰り返し、ロードしたテ
キスト情報の検索用ファイルの作成を完成させる。
【0025】このような処理により、入力画像を認識し
て得たテキスト情報から、複数の認識候補文字を前後の
文字と組み合わせ、使用するインデックスの文字キー種
類にあわせて文字列展開を行ってインデックスを予め作
成しておく為、誤認識による検索の洩れを少なくするこ
とができる。
【0026】このように作成された検索用ファイルを用
いて行う検索処理を図3のフローチャートに示し、説明
する。
【0027】検索処理の指示に応じて、検索語を入力し
(S31)、入力された検索語を検索処理に適した検索
キーに分解し(S32)、その検索キーを外部記憶装置
4の検索用ファイルと照合する(S33)。検索キーに
合致するインデックスが発見されたら、そのインデック
スに対応する文書アドレス情報をアプリケーション側に
返す(S34)。
【0028】この文書アドレス情報により特定される外
部記憶装置4に記憶されているイメージデータを表示装
置6に検索結果として表示する。
【0029】図5のフローチャートは、検索ファイルを
予め作成することなく、検索処理が指示されるごとに毎
回テキスト情報から認識候補文字群の前後の文字と組み
合わせて展開を行い、入力された検索語と照合する処理
である。
【0030】外部記憶装置4に記憶されているテキスト
情報に対して検索用ファイルの作成が指示された場合
に、その指示されたテキストデータを検索用ファイルに
登録する際のインデックス用の文字キー種類を指定し
(S41)、次いで検索語を入力し(S42)、入力さ
れた検索語を検索処理に適した検索キーに分解する(S
43)。指示されたテキスト情報を外部記憶装置4から
文書検索部3にロードする(S44)。ロードしたテキ
スト情報から1文字のデータを読み込み(S46)、そ
の文字コードがデリミターであると判断される場合には
(S47)、次のデリミターまでの複数候補とこれまで
の文字列を組み合わせて複数個の文字キーを展開し、S
25においてデリミターでないと判断された場合には、
文字キーの文字列の最後にその1文字を付加する(S4
9)。S50において文字キーの完成であると判断され
るまでS47からS49までの処理を繰り返す。
【0031】S50において文字キーの完成であると判
断された場合には、作成された文字キー(単数又は複
数)とS43において得た検索キーとの照合を行い(S
51)、同一である場合は(S52)検索結果としてそ
の文書のイメージデータが格納されている文書アドレス
を出力する(S53)。
【0032】これらの処理と同様の処理により、データ
ベースに関しても複数のレコードを作成し、これを用い
て洩れの少ない検索を行うことが可能である。
【0033】次ぎに、具体的な例をあげて説明を行う。
【0034】仮に、「新文書ファイリング」という文章
がドキュメント上にあったとする。
【0035】これをイメージスキャナ1により入力し、
OCR処理部2における初期認識ステップS4で”文”
の認識を行ったところこの文字に対する認識尤度がTh
2以下となり、どの認識候補もTh2以下の同程度の尤
度であったとする。その結果、S8においてS11の処
理を選択し、Nmax個の候補を尤度の高いものから出力
する。
【0036】その結果、”女”、”文”、”丈”、”
大”の4候補が出力されたとする。
【0037】OCR処理部2は、以下のフォーマットで
上記複数の候補文字の記述を行う。ここでは、S7及び
S10で出力するデリミターを”★”とすると、以下の
フォーマットとなる。
【0038】★[候補の数][候補文字1][候補文字
2][候補文字3]・・・★
【0039】従って、この例における「文」に対応して
上記4候補が出力され、他の文字はS5において認識尤
度がTh1より大きいと判断されて、S6において尤度
が最大の1文字が候補文字として出力されている場合の
「新文書ファイリング」の表記は、”新★4女文丈大★
書ファイリング”となる。この文字コード群がテキスト
情報として外部記憶装置4に記憶される。
【0040】一方、文書検索部3ではこのフォーマット
を解釈し、図2のフローチャートの処理に従って検索用
ファイルを作成する。
【0041】新女書ファイリング 新文書ファイリング 新丈書ファイリング 新大書ファイリング
【0042】従って、キーボードから「新文書ファイリ
ング」という検索語が入力され、この検索語に従って文
書検索部3が文書検索処理を実行した際にも、この文書
を検索することができる。
【0043】本実施例においては、文書検索に用いる例
を説明したが、データベースを用いた検索にも応用でき
る。
【0044】また、OCRによる文書キーワード、頁キ
ーワード抽出等の応用も可能である。
【0045】更に、OMRやバーコードによる光学読み
取り装置の一部情報の認識尤度が低い場合への応用も同
様の手法で行える。
【0046】
【発明の効果】以上説明した様に本発明によれば、OC
R認識尤度が低く、認識が確実との判断を得られない場
合に認識候補を1つに絞ることを避け、認識尤度に応じ
た最適な複数の認識候補を選び、有効な認識候補情報を
捨てずに蓄積、活用することができる。
【0047】以上説明した様に本発明によれば、認識結
果の人手による訂正作業をなくし、イメージ入力からO
CRを経てイメージデータ、テキストデータの蓄積まで
人の手を介さずすることができ、かつ装置の処理負荷を
軽減し、処理速度をあげることができ、安価な装置を提
供できる。
【0048】以上説明した様に本発明によれば、1文字
の入力画像に対して複数の認識候補を有する場合にも、
前後の文字と組み合わせて展開を行い、複数のインデッ
クスを作成することにより、誤認識による検索の洩れを
少なくすることができる。
【図面の簡単な説明】
【図1】OCR処理のフローチャート
【図2】文書検索用検索ファイル作成処理のフローチャ
ート
【図3】文書検索処理のフローチャート
【図4】本実施例における情報処理装置の構成ブロック
【図5】検索ファイルを予め作成せずに検索を行う処理
のフローチャート

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 画像情報を記憶し、 前記記憶してある画像情報の文字を認識し、文字コード
    とその類似度を出力し、 前記出力された類似度に応じて、1文字の画像情報に対
    して出力する候補文字数を決定することを特徴とする情
    報処理方法。
  2. 【請求項2】 前記候補文字数の決定は、前記出力され
    た類似度を閾値との比較により行うことを特徴とする請
    求項1に記載の情報処理方法。
  3. 【請求項3】 前記1文字の画像情報に対して出力する
    情報は、決定された候補文字数とその数の候補文字を含
    むことを特徴とする請求項1に記載の情報処理方法。
  4. 【請求項4】 前記1文字の画像情報に対して出力する
    情報は、1文字に対する情報であることを識別する為の
    識別情報により区切ることを特徴とする請求項1に記載
    の情報処理方法。
  5. 【請求項5】 前記1文字に対して出力された候補文字
    数が複数である場合に、該複数の候補文字を連続する文
    字と組み合わせて複数の文字列を作成することを特徴と
    する請求項1に記載の情報処理方法。
  6. 【請求項6】 前記作成された文字列を格納することを
    特徴とする請求項5記載の情報処理方法。
  7. 【請求項7】 前記格納された文字列と、検索語との照
    合を行い、検索語と合致する文字列に対応して記憶され
    ている画像情報を呼び出すことを特徴とする請求項6記
    載の情報処理方法。
  8. 【請求項8】 画像情報を記憶する画像記憶手段と、 前記記憶してある画像情報の文字を認識し、文字コード
    とその類似度を出力する文字認識手段と、 前記出力された類似度に応じて、1文字の画像情報に対
    して出力する候補文字数を決定する候補文字数決定手段
    とを有することを特徴とする情報処理装置。
  9. 【請求項9】 前記候補文字数決定手段は、前記文字認
    識手段より出力された類似度を閾値との比較により行う
    ことを特徴とする請求項8記載の情報処理装置。
  10. 【請求項10】 前記文字認識手段により認識された1
    文字の画像情報に対して、前記候補文字数決定手段によ
    り決定された候補文字数とその数の候補文字を含む情報
    を出力する認識結果出力手段を有することを特徴とする
    請求項8に記載の情報処理装置。
  11. 【請求項11】 前記認識結果出力手段により出力され
    る1文字の画像情報に対して出力する情報は、1文字に
    対する情報であることを識別する為の識別情報により区
    切って出力することを特徴とする請求項10記載の情報
    処理装置。
  12. 【請求項12】 前記認識結果出力手段により出力され
    た1文字に対して出力された候補文字数が複数である場
    合に、該複数の候補文字を連続する文字と組み合わせて
    複数の文字列を作成する文字列作成手段を有することを
    特徴とする請求項10記載の情報処理装置。
  13. 【請求項13】 前記文字列作成手段により作成された
    文字列を格納する文字列格納手段を有することを特徴と
    する請求項12記載の情報処理装置。
  14. 【請求項14】 前記文字列格納手段に格納された文字
    列と、指定された検索語との照合を行い、検索語と合致
    する文字列に対応して前記画像記憶手段に記憶されてい
    る画像情報を呼び出す画像検索手段を有することを特徴
    とする請求項13記載の情報処理装置。
JP6134194A 1994-06-16 1994-06-16 情報処理方法及び装置 Pending JPH087033A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP6134194A JPH087033A (ja) 1994-06-16 1994-06-16 情報処理方法及び装置
DE69519256T DE69519256T2 (de) 1994-06-16 1995-06-14 Verfahrenund Gerät zur Informationsverarbeitung und rechnerlesbares Speichermedium
EP95304095A EP0687991B1 (en) 1994-06-16 1995-06-14 Information processing method and apparatus and computer readable memory medium
US08/490,739 US5905811A (en) 1994-06-16 1995-06-15 System for indexing document images
CN95107055A CN1106620C (zh) 1994-06-16 1995-06-16 信息处理方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6134194A JPH087033A (ja) 1994-06-16 1994-06-16 情報処理方法及び装置

Publications (1)

Publication Number Publication Date
JPH087033A true JPH087033A (ja) 1996-01-12

Family

ID=15122638

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6134194A Pending JPH087033A (ja) 1994-06-16 1994-06-16 情報処理方法及び装置

Country Status (5)

Country Link
US (1) US5905811A (ja)
EP (1) EP0687991B1 (ja)
JP (1) JPH087033A (ja)
CN (1) CN1106620C (ja)
DE (1) DE69519256T2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6128616A (en) * 1996-12-27 2000-10-03 Canon Kabushiki Kaisha Document management system using an access-limited character train and password, and method and computer-readable medium therefor
US6678683B1 (en) 1996-12-27 2004-01-13 Canon Kabushiki Kaisha Document management system using an access-limited character train and password, and a method and computer-readable medium therefor
US10977301B2 (en) 2017-03-17 2021-04-13 Fuji Xerox Co., Ltd. Search apparatus, search system, and non-transitory computer readable medium

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6327387B1 (en) * 1996-12-27 2001-12-04 Fujitsu Limited Apparatus and method for extracting management information from image
US6269188B1 (en) * 1998-03-12 2001-07-31 Canon Kabushiki Kaisha Word grouping accuracy value generation
US6243501B1 (en) 1998-05-20 2001-06-05 Canon Kabushiki Kaisha Adaptive recognition of documents using layout attributes
JP4421134B2 (ja) * 2001-04-18 2010-02-24 富士通株式会社 文書画像検索装置
JP4125273B2 (ja) * 2004-08-24 2008-07-30 キヤノン株式会社 画像処理装置及びその方法、プログラム
JP4561474B2 (ja) * 2005-05-24 2010-10-13 株式会社日立製作所 電子化文書保管システム
CN100356392C (zh) * 2005-08-18 2007-12-19 北大方正集团有限公司 一种字符识别的后处理方法
US8155444B2 (en) * 2007-01-15 2012-04-10 Microsoft Corporation Image text to character information conversion
JP2010146185A (ja) * 2008-12-17 2010-07-01 Sharp Corp 画像処理装置、画像読取装置、画像送信装置、画像処理方法、プログラムおよびその記録媒体
US8280196B2 (en) * 2009-05-12 2012-10-02 Canon Kabushiki Kaisha Image retrieval apparatus, control method for the same, and storage medium
JP5230525B2 (ja) * 2009-05-25 2013-07-10 キヤノン株式会社 画像検索装置およびその方法
JP5507962B2 (ja) * 2009-11-05 2014-05-28 キヤノン株式会社 情報処理装置及びその制御方法、プログラム
CN101788849B (zh) * 2009-12-31 2011-11-16 优视科技有限公司 一种用于移动通讯设备系统的光学字符识别输入方法
JP5820236B2 (ja) 2011-10-28 2015-11-24 キヤノン株式会社 画像処理装置及びその制御方法
CN103697838A (zh) * 2013-12-24 2014-04-02 天津森宇科技发展有限公司 一种基于机器视觉技术的贴片件pin针平整度检测设备

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4930077A (en) * 1987-04-06 1990-05-29 Fan David P Information processing expert system for text analysis and predicting public opinion based information available to the public
WO1990001198A1 (en) * 1988-07-20 1990-02-08 Fujitsu Limited Character recognition apparatus
US5265174A (en) * 1989-03-03 1993-11-23 Canon Kabushiki Kaisha Pattern recognition apparatus
US5261112A (en) * 1989-09-08 1993-11-09 Casio Computer Co., Ltd. Spelling check apparatus including simple and quick similar word retrieval operation
US5134669A (en) * 1990-06-13 1992-07-28 National Computer Systems Image processing system for documentary data
US5369577A (en) * 1991-02-01 1994-11-29 Wang Laboratories, Inc. Text searching system
US5237627A (en) * 1991-06-27 1993-08-17 Hewlett-Packard Company Noise tolerant optical character recognition system
US5703962A (en) * 1991-08-29 1997-12-30 Canon Kabushiki Kaisha Image processing method and apparatus
JP3190074B2 (ja) * 1991-09-11 2001-07-16 株式会社東芝 手書き入力装置
US5315668A (en) * 1991-11-27 1994-05-24 The United States Of America As Represented By The Secretary Of The Air Force Offline text recognition without intraword character segmentation based on two-dimensional low frequency discrete Fourier transforms
DE69328640T2 (de) * 1992-02-07 2000-09-28 Canon Kk Verfahren und Einrichtung zur Mustererkennung
US5454046A (en) * 1993-09-17 1995-09-26 Penkey Corporation Universal symbolic handwriting recognition system
US5524066A (en) * 1994-03-31 1996-06-04 Xerox Corporation Text recognition by predictive composed shapes

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6128616A (en) * 1996-12-27 2000-10-03 Canon Kabushiki Kaisha Document management system using an access-limited character train and password, and method and computer-readable medium therefor
US6678683B1 (en) 1996-12-27 2004-01-13 Canon Kabushiki Kaisha Document management system using an access-limited character train and password, and a method and computer-readable medium therefor
US10977301B2 (en) 2017-03-17 2021-04-13 Fuji Xerox Co., Ltd. Search apparatus, search system, and non-transitory computer readable medium

Also Published As

Publication number Publication date
US5905811A (en) 1999-05-18
EP0687991B1 (en) 2000-11-02
CN1106620C (zh) 2003-04-23
DE69519256T2 (de) 2001-04-05
DE69519256D1 (de) 2000-12-07
EP0687991A3 (ja) 1996-01-03
EP0687991A2 (en) 1995-12-20
CN1121605A (zh) 1996-05-01

Similar Documents

Publication Publication Date Title
JP3689455B2 (ja) 情報処理方法及び装置
EP0844583B1 (en) Method and apparatus for character recognition
JPH087033A (ja) 情報処理方法及び装置
JP2726568B2 (ja) 文字認識方法及び装置
KR100412317B1 (ko) 문자인식/수정방법및장치
US5909509A (en) Statistical-based recognition of similar characters
JP3727995B2 (ja) 文書処理方法及び装置
JP2586372B2 (ja) 情報検索装置及び情報検索方法
JP3975825B2 (ja) 文字認識誤り訂正方法、装置及びプログラム
JP3673553B2 (ja) ファイリング装置
JPH113401A (ja) 情報処理装置及びその方法
KR950001061B1 (ko) 문서인식 수정장치
JPH0452509B2 (ja)
JP3548372B2 (ja) 文字認識装置
JPH07271921A (ja) 文字認識装置および文字認識方法
JPH10247237A (ja) 文書画像処理装置および文書画像処理方法および情報記録媒体
JPH11120294A (ja) 文字認識装置および媒体
JP2677271B2 (ja) 文字認識装置
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JP2874815B2 (ja) 日本語文字読取装置
JPH1069494A (ja) 画像検索方法とその装置
JPH0797370B2 (ja) 文字・音声入力変換方式
JP2917310B2 (ja) 単語照合における単語辞書検索方式
JPH05324610A (ja) 住所表記漢字入力装置
JPH09231318A (ja) 文字認識装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030909