JPH113401A - 情報処理装置及びその方法 - Google Patents

情報処理装置及びその方法

Info

Publication number
JPH113401A
JPH113401A JP9155513A JP15551397A JPH113401A JP H113401 A JPH113401 A JP H113401A JP 9155513 A JP9155513 A JP 9155513A JP 15551397 A JP15551397 A JP 15551397A JP H113401 A JPH113401 A JP H113401A
Authority
JP
Japan
Prior art keywords
recognition
character
output
information processing
likelihood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9155513A
Other languages
English (en)
Inventor
Hirotaka Shiiyama
弘隆 椎山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP9155513A priority Critical patent/JPH113401A/ja
Publication of JPH113401A publication Critical patent/JPH113401A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 入力した画像データに含まれる文字の認識を
行った場合に、その認識結果を訂正するためのユーザに
対する負担を軽減し、かつ画像データの検索を効率的に
実行することができる情報処理装置及びその方法を提供
する。 【解決手段】 イメージスキャナ1より入力された画像
データ中に含まれる文字をOCR処理部2で認識する。
次に、認識する文字に対する複数の認識候補の各認識尤
度を獲得する。そして、獲得した各認識尤度に基づい
て、複数の認識候補の内、少なくとも一つを文字の認識
結果として出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された画像デ
ータを認識する情報処理装置及びその方法に関するもの
である。
【0002】
【従来の技術】従来、原稿画像に含まれる文字をOCR
により認識を行う情報処理装置では、原稿画像に含まる
各文字に対する認識結果としてそれぞれ1つの認識結果
を出力していた。このような情報処理装置において、各
文字の誤認識対策は、認識結果として出力する認識候補
の認識尤度が低い場合には、その旨をユーザに報知し、
ユーザにより認識結果の是非を確認させていた。そし
て、認識結果が間違っている場合には、キーボード等か
ら正しい認識結果を入力させていた。
【0003】また、誤認識された文字の訂正処理を機械
的に行う研究も行われており、知識データベースに認識
結果をつき合わせていき、誤認識された文字を自動的に
訂正する提案があった。
【0004】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の情報処理装置では、認識結果が異なる毎にユ
ーザから正しい認識結果を入力してもらわなけらばなら
ず、ユーザに対する負担が大きかった。また、従来の、
知識データベースを用いて行う誤認識された文字の訂正
は、情報処理装置にかかる負荷が大きかった。
【0005】本発明は上記の問題点に鑑みてなされたも
のであり、入力した画像データに含まれる文字の認識を
行った場合に、その認識結果を訂正するためのユーザに
対する負担を軽減し、かつ画像データの検索を効率的に
実行することができる情報処理装置及びその方法を提供
することを目的とする。
【0006】
【課題を解決するための手段】上記の目的を達成するた
めの本発明による情報処理装置は以下の構成を備える。
即ち、入力された画像データを認識する情報処理装置で
あって、 前記画像データ中に含まれる文字を認識する
認識手段と、前記認識手段で認識する文字に対する複数
の認識候補の各認識尤度を獲得する獲得手段と、前記獲
得手段で獲得した各認識尤度に基づいて、前記複数の認
識候補の内、少なくとも一つを前記文字の認識結果とし
て出力する出力手段とを備えることを特徴とする情報処
理装置。
【0007】また、好ましくは、前記出力手段は、前記
獲得手段で獲得した各認識尤度と第1の閾値とを比較
し、その比較結果に基づいて、前記複数の認識候補の
内、少なくとも一つを前記文字の認識結果として出力す
る。また、好ましくは、前記出力手段は、前記獲得手段
で獲得した各認識尤度の最大の認識尤度が前記第1の閾
値より大きい場合、該最大の認識尤度を有する認識候補
を前記文字の認識結果として出力する。
【0008】また、好ましくは、前記出力手段は、前記
獲得手段で獲得した各認識尤度の最大の認識尤度が前記
第1の閾値より小さい場合、更に該各認識尤度と第2の
閾値とを比較し、その比較結果に基づいて、前記複数の
認識候補の内、少なくとも一つを前記文字の認識結果と
して出力する。また、好ましくは、前記出力手段は、前
記獲得手段で獲得した各認識尤度の内、前記第2の閾値
よりも大きい認識尤度を有する認識候補を前記文字の認
識結果として出力する。
【0009】また、好ましくは、前記出力手段は、前記
獲得手段で獲得した各認識尤度が前記第2の閾値よりも
小さい場合、該各認識尤度の内、認識尤度の高いものか
ら所定個の認識候補を前記文字の認識結果として出力す
る。また、好ましくは、前記出力手段は、前記文字の認
識結果として、複数の認識候補群を出力する場合、該認
識候補群の前後に所定文字を付加して該認識候補群を出
力する。
【0010】また、好ましくは、前記出力手段で出力さ
れた認識結果と前記画像データを対応づけて管理する管
理手段とを更に備える。また、好ましくは、検索条件を
入力する入力手段と、前記管理手段に管理されている画
像データに対し、前記入力手段で入力された検索条件に
該当する前記認識結果に対応する画像データを検索する
検索手段とを更に備える。
【0011】上記の目的と達成するための本発明による
情報処理方法は以下の構成を備える。即ち、入力された
画像データを認識する情報処理方法であって、 前記画
像データ中に含まれる文字を認識する認識工程と、前記
認識工程で認識する文字に対する複数の認識候補の各認
識尤度を獲得する獲得工程と、前記獲得工程で獲得した
各認識尤度に基づいて、前記複数の認識候補の内、少な
くとも一つを前記文字の認識結果として出力する出力工
程とを備える。
【0012】上記の目的と達成するための本発明による
コンピュータ可読メモリは以下の構成を備える。即ち、
入力された画像データを認識する情報処理のプログラム
コードが格納されたコンピュータ可読メモリであって、
前記画像データ中に含まれる文字を認識する認識工程の
プログラムコードと、前記認識工程で認識する文字に対
する複数の認識候補の各認識尤度を獲得する獲得工程の
プログラムコードと、前記獲得工程で獲得した各認識尤
度に基づいて、前記複数の認識候補の内、少なくとも一
つを前記文字の認識結果として出力する出力工程のプロ
グラムコードとを備える。
【0013】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を詳細に説明する。図1は本発明の実施形態にお
ける情報処理システムの構成を示すブロック図である。
図1において、イメージスキャナ1は認識対象となる文
書データの原稿画像を光学的に読み取る。キーボード/
マウス5は、オペレータによる各種コマンドや、指示情
報を入力する。また、検索処理を実行する場合の検索語
や検索条件もこのキーボード/マウス5によって入力す
る。表示装置6は、例えば、CRTや液晶表示器等の表
示手段であり、キーボード/マウス5から入力された情
報やイメージスキャナ1から入力された画像情報、処理
経過、処理結果等を表示する。
【0014】外部記憶装置4は、イメージスキャナから
入力されたイメージデータ、テキスト情報、検索用ファ
イルを記憶する。コンピュータ10は、CPU10aの
制御により各種情報処理を行うものである。また、後述
するフローチャートに示すような各種情報処理の制御プ
ログラム101bはメモリ10bに格納されており、こ
の制御プログラム101bに従ってCPU10aは各種
情報処理の実行及び制御を行う。更に、メモリ10bに
は、文字認識に用いる認識用辞書102bも格納されて
いる。
【0015】尚、メモリ10bに格納されている制御プ
ログラム101bは、外部記憶装置4より必要に応じて
読み込んだものであっても良い。また、本実施形態にお
いては、このコンピュータ10により実行される主な処
理を行なうものとして、OCR処理部2と文書検索部3
が構成されている。まず、イメージスキャナ1より入力
した原稿画像のイメージデータからテキスト情報へ変換
する変換処理について、図2を用いて説明する。
【0016】図2は本発明の実施形態で実行される変換
処理を示すフローチャートである。まず、外部記憶装置
4に記憶されているイメージスキャナ1より入力したイ
メージデータをOCR処理部2に入力する(ステップS
1)。次に、入力されたイメージデータに文字として切
り出せる文字データが存在するか否かを判定する(ステ
ップS2)。文字データが存在する場合(ステップS1
でYES)、ステップS3に進む。一方、文字データが
存在しない場合(ステップS1でNO)、処理を終了す
る。
【0017】イメージデータに文字データが存在する場
合、1文字分の文字データを切り出す(ステップS
3)。次に、その切り出した文字データを認識用辞書1
02bとマッチングする。そして、認識候補として複数
の文字コード及び各文字コードの認識尤度を獲得する
(ステップS4)。ステップS4における認識候補とし
て得られた文字コードの各認識尤度のうち、最大の認識
尤度が所定の閾値Th1より大きいか否かを判定する
(ステップS5)。尚、この閾値Th1は、メモリ10
bに格納されている。
【0018】最大の認識尤度が閾値Th1より大きい場
合(ステップS5でYES)、ステップS6に進み、認
識候補が正しいと判断して、その最大の尤認識度を有す
る文字コードを切り出した文字データの認識結果として
出力する。一方、最大の認識尤度が閾値Th1より小さ
い場合(ステップS5でNO)、ステップS7に進む。
【0019】最大の認識尤度が閾値Th1より小さい場
合、 認識候補群である文字コードを識別するために、
その認識候補群である文字コードの先端を示すデリミタ
ーを出力する(ステップS7)。次に、複数の文字コー
ドの各認識尤度が閾値Th2より大きいか否かを判定す
る(ステップS8)。複数の文字コードの各認識尤度の
内、閾値Th2より大きい認識尤度がある場合(ステッ
プS8でYES)、ステップS9に進み、閾値Th2よ
り大きい認識尤度を有する文字コード群を切り出した文
字データの認識結果として出力する。
【0020】一方、複数の文字コードの各認識尤度すべ
てが閾値Th2より小さい場合(ステップS8でN
O)、ステップS11に進み、その複数の文字コードの
内、認識尤度の大きなものから順にNmax個までの文字
コードを切り出した文字データの認識結果として出力す
る。ステップS8あるいはステップS11の処理によっ
て、切り出した文字データの認識結果が出力されたら、
その認識結果である文字コード群の終端を示すデリミタ
ーを出力する(ステップS10)。そして、ステップS
2に戻り、入力したイメージデータに文字データが存在
しないと判断されるまで、上述したステップS3からス
テップS11の処理を繰り返す。
【0021】尚、上述の処理によって、出力された文字
コードのコード情報を、以下説明する検索用ファイルを
作成するためのテキスト情報として保存する必要があれ
ば外部記憶装置4に順次記憶する。一方、検索用ファイ
ルを作成するためのテキスト情報として保存する必要が
なければ、メモリ10b、あるいは外部記憶装置4上に
一時的に格納し、必要がなくなり次第消去する。
【0022】以上説明した処理によって、 認識候補の
認識尤度に応じて、認識結果とする認識候補を出力する
ことができる。特に、認識尤度が低く認識精度が落ちる
可能性がある場合には、認識結果を1つの認識候補に絞
らずに、認識候補の認識尤度に応じて複数の認識候補を
認識結果として出力することが可能になる。次に、図2
のフローチャートで作成されたテキスト情報に基づい
て、検索に用いる検索用ファイルを作成する作成処理に
ついて、図3を用いて説明する。
【0023】図3は本発明の実施形態で実行される作成
処理を示すフローチャートである。まず、作成されたテ
キスト情報の各文字データと、単語辞書に登録されてい
る文字とを比較するために、その比較対象となる単語辞
書中の文字の比較開始位置を示すカウンタiを0に初期
化する。また、カウンタiが示す比較開始位置からの文
字数を計数するカウンタjを0に初期化する(ステップ
S21)。次に、外部記憶装置4に記憶されているある
いはメモリ10b上に一時的に格納されたテキスト情報
を、文書検索部3にロードする(ステップS22)。ロ
ードしたテキスト情報の先頭の文字データを読み出し、
その文字データに該当する単語辞書中の文字を選択する
(ステップS220)。
【0024】尚、単語辞書は、図6に示すように、ある
文字に派生する文字が枝として構成されるツリー構造と
なっており、図6では、「全」という文字に対しては、
その派生する文字として、「体」、「文」、「女」が登
録されている。また、「文」という文字に対しては、そ
の派生する文字として、「献」、「検」が登録されてい
る。また、自身の文字以降に派生する文字がない場合に
は、自身が最終端であることを示す終点マークが付加さ
れる。このような構成からなる単語辞書を用いて、読み
出された文字データに該当する文字を、単語辞書の先頭
から順に探索する。
【0025】次に、テキスト情報中に読み出されていな
い文字データが存在するか否かを判定する(ステップS
24)。文字データが存在する場合(ステップS23で
YES)、ステップS24に進む。一方、文字データが
存在しない場合(ステップS23でNO)、処理を終了
する。次に、カウントiの内容をi、カウンタjの内容
をjとする場合のテキスト情報中のi+j+1番目の文
字データを読み出す(ステップS24)。カウンタjの
内容を1インクリメントする(ステップS240)。読
み出した文字データがデリミターであるか否かを判定す
る(ステップS25)。デリミターである場合(ステッ
プS25でYES)、ステップS26に進み、次のデリ
ミターまでに挟まれる複数の文字データの各文字データ
と単語辞書中の文字を比較し、各文字データに一致する
文字を選択する。一方、デリミターでない場合(ステッ
プS25でNO)、ステップS27に進み、その文字デ
ータと単語辞書中の文字を比較し、その文字データに一
致する文字を選択する。
【0026】尚、文字コードがデリミターである場合に
は、次のデリミターまでの複数の認識候補と単語辞書中
の文字を比較していくが、この際、一致する文字が複数
あればその複数の文字に関して同時進行で比較を行う。
次に、カウンタjの内容を1インクリメントする(ステ
ップS270)。次に、選択された文字に終点マークが
付加されているか否かを判定する(ステップS29)。
終点マークが付加されている場合(ステップS28でY
ES)、ステップS29に進み、選択された文字を外部
記憶装置4の検索用ファイルに検索用のインデックス情
報として格納する。一方、終点マークが付加されていな
い場合(ステップS28でNO)、ステップS30に進
み、カウンタjの内容が最大検索語サイズ(文字数)W
ordMax未満であるか、あるいは単語辞書中に比較
する文字がないかという条件を満たすか否かを判定す
る。
【0027】上記のどちらの条件も満たさない場合(ス
テップS30でNO)、ステップS24に戻る。一方、
上記の条件のどちらかを満たす場合(ステップS30で
YES)、ステップS31に進み、テキスト情報中のi
+1番目の文字データを読み出し、その文字データに該
当する単語辞書中の文字を選択する。次に、カウンタi
の内容を1インクリメントし、カウンタjの内容を0に
リセットして(ステップS32)、ステップS23に戻
る。
【0028】以上説明した処理によって、単語辞書に存
在する文字列の内、入力したイメージデータに含まれる
文字データの複数の認識候補の組み合わせからなる検索
用ファイルを、イメージデータと対応づけて記憶してお
くことができる。つまり、誤認識されそうな認識候補の
組み合わせも検索用ファイルとして記憶しておくので、
検索用ファイルを用いた検索を行う場合の検索の漏れを
少なくすることができる。
【0029】次に、図3のフローチャートで作成された
検索用ファイルを用いた検索処理について、図4を用い
て説明する。図4は本発明の実施形態で実行される検索
処理を示すフローチャートである。まず、キーボード/
マウス5より、検索条件である検索語を入力する(ステ
ップS31)。次に、図3のフローチャートで説明した
処理と同様の処理によって、入力された検索語の各文字
データと単語辞書との比較を行い、検索語を単数あるい
は複数の単語に分解する(ステップS32)。次に、分
解された単語群と、外部記憶装置4の検索用ファイルと
を照合する(ステップS33)。
【0030】次に、照合する検索用ファイルに対応する
イメージデータの格納位置を示す文書アドレスの論理積
演算を行い、これらの単語群を共通に含む文書アドレス
を獲得する(ステップS34)。そして、この獲得され
た文書アドレス情報が示す外部記憶装置4に記憶されて
いるイメージデータを表示装置6に検索結果として表示
する。
【0031】次に、本実施形態の具体例について説明す
る。例えば、原稿画像上に記載されてる文字列「全文検
索」をイメージスキャナ1により入力し、「文」の認識
結果として認識尤度の高い順に「女」、「文」、
「丈」、「大」が得られ、それらの認識尤度がすべてT
h2以下であった場合は、ステップS11の処理が実行
される。そして、ステップS11の処理において、Nma
x個が4である場合は、認識結果として認識結果の認識
尤度の高いものから、「女」、「文」、「丈」、「大」
が出力される。
【0032】また、デリミターを「☆」とすると、
「文」に対する認識結果は、 ☆4女文丈大☆ となる。尚、先頭のデリミターの次の数字は、 Nmax個
が示す値である。更に、上記「全文検索」の「文」以外
の文字の認識結果が正しく認識されたとすると、「全文
字検索」に対する認識結果は、 全☆4女文丈大☆検索 となる。そして、これらの文字列に対応する文字コード
群を、検索用ファイルに用いるならば、テキスト情報と
して外部記憶装置4に記憶する。
【0033】一方、「全文検索」の認識結果として得た
文字コード群をテキスト情報として外部記憶装置4に記
憶した場合、文書検索部3では、このテキスト情報を用
いて、検索用ファイルを作成することができる。まず、
テキスト情報の先頭の文字である「全」に対応する単語
辞書中の「全」を選択する。尚、単語辞書中の「全」
は、図6に示すよう構成になっているとする。
【0034】次に、テキスト情報の次の文字「☆4女文
丈大☆」と単語辞書中の「全」から派生する文字
「体」、「文」、「女」を比較する。この場合、テキス
ト情報(「☆4女文丈大☆」)と一致する文字として
「文」、「女」が選択される。次に、テキスト情報の次
の文字「検」と単語辞書中の「文」、「女」から派生す
る文字を比較する。この場合、テキスト情報(「検」)
として一致する文字として「文」に派生する「検」が選
択される。一方、「女」から派生する文字には、テキス
ト情報(「検」)に一致する文字はないので、「女」に
対する比較はここで終了する。
【0035】次に、テキスト情報の次の文字「索」と単
語辞書中の「検」から派生する文字「策」、「査」を比
較する。この場合、テキスト情報(「索」)と一致する
文字として「策」が選択される。また、「索」には、終
点マークが付加されているので、ここで、テキスト情報
と単語辞書との比較を終了し、検索用ファイルとして
「全文検索」という単語が抽出される。
【0036】以上のような手順によって、検索用ファイ
ルとして、「全文検索」という単語が登録される。これ
により、キーボード/マウス5から「全文検索」という
検索語が入力された場合には、文書検索部3は「全文検
索」という文字を有するイメージデータを検索すること
ができる。尚、本実施形態においては、文書検索に用い
る例を説明したが、データベースを用いた検索にも応用
できる。
【0037】また、OCRによる文書キーワード、頁キ
ーワード抽出等の応用も可能である。更に、OMRやバ
ーコードによる光学読み取り装置の一部情報の認識尤度
が低い場合への応用も同様の手法で行える。また、本実
施形態では、図4に示した検索処理を実行するために、
図3に示した検索用ファイルを作成する作成処理を予め
実行しておく場合を説明したが、以下に示す図5のよう
に、検索処理と並行して検索用ファイルを作成する作成
処理を実行しても良い。つまり、検索用ファイルを予め
作成することなく、検索処理が指示される毎に、テキス
ト情報から認識候補群の前後の文字と組み合わせて展開
を行い、入力された検索語と照合する。
【0038】図5は本発明の他の実施形態で実行される
処理を示すフローチャートである。まず、外部記憶装置
4に記憶されているテキスト情報に対して検索用ファイ
ルの作成が指示された場合に、その指示されたテキスト
情報を検索用ファイルに登録する際のインデックス用の
文字キー種類を指定する(ステップS41)。次に、検
索語を入力する(ステップS42)。次に、入力された
検索語を検索処理に適した検索キーに分解する(ステッ
プS43)。
【0039】次に、指示されたテキスト情報を外部記憶
装置4から文書検索部3にロードする(ステップS4
4)。次に、テキスト情報に文字データが存在するか否
かを判定する(ステップS45)。文字データが存在し
ない場合(ステップS45でNO)、処理を終了する。
一方、文字データが存在する場合(ステップS45でY
ES)、ステップS46に進む。
【0040】文字データが存在する場合、テキスト情報
中の1文字分の文字データを読み込む(ステップS4
6)。次に、読み込んだ文字データがデリミターである
か否かを判定する(ステップS47)。デリミターであ
る場合(ステップS47でYES)、ステップS48に
進み、次のデリミターまでに挟まれる複数の文字データ
とこれまでに確定している文字データ列を組み合わせて
複数個の文字キーを展開する。一方、デリミターでない
場合(ステップS47でNO)、これまでに確定してい
る文字キーの文字列の最後に読み込んだ文字データを付
加する(S49)。
【0041】次に、文字キーの作成が完了したか否かを
判定する(ステップS50)。文字キーの作成が完了し
ていない場合(ステップS50でNO)、ステップS4
5に戻る。一方、文字キーの作成が完了している場合
(ステップS50でYES)、ステップS51に進む。
文字キーの作成が完了した場合には、作成された文字キ
ー(単数又は複数)とステップS43において得た検索
キーとの照合を行い、文字キーと検索キーが同一である
か否かを判定する(ステップS51)。次に、同一であ
る場合(ステップS51でYES)、ステップS53に
進み、 検索結果として、その文字キーを有するイメー
ジデータが格納されている文書アドレスを出力する。一
方、同一でない場合(ステップS52でNO)、処理を
終了する。
【0042】以上説明したように、本実施形態によれ
ば、OCR処理部2の認識尤度が低く認識精度が落ちる
可能性がある場合には、認識結果を1つに絞らずに、認
識尤度に応じた最適な複数の認識結果を出力する。その
ため、有効な認識結果を蓄積、活用することができる。
また、認識尤度に応じて複数の認識候補を認識結果とし
て出力するので、ユーザはその複数の認識結果から所望
の認識結果を選択するだけで、所望の認識結果を決定す
ることができる。つまり、従来のように、間違った認識
結果が出力され場合に、ユーザが改めて正しい認識結果
を入力する作業をなくすことができる。これにより、作
業の効率化を図ることができる。
【0043】また、入力されたイメージデータに含まれ
る文字データの複数の認識候補を組み合わせて、そのイ
メージデータを検索するための検索用ファイルを作成す
るので、誤認識による検索の洩れを少なくすることがで
きる。尚、本発明は、複数の機器(例えば、ホストコン
ピュータ、インタフェース機器、リーダ、プリンタ等)
から構成されるシステムに適用しても、一つの機器から
なる装置(例えば、複写機、ファクシミリ装置等)に適
用してもよい。
【0044】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
【0045】この場合、記憶媒体から読出されたプログ
ラムコード自体が上述した実施の形態の機能を実現する
ことになり、そのプログラムコードを記憶した記憶媒体
は本発明を構成することになる。プログラムコードを供
給するための記憶媒体としては、例えば、フロッピディ
スク、ハードディスク、光ディスク、光磁気ディスク、
CD−ROM、CD−R、磁気テープ、不揮発性のメモ
リカード、ROMなどを用いることができる。
【0046】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施の形態の機能
が実現される場合も含まれることは言うまでもない。
【0047】更に、記憶媒体から読出されたプログラム
コードが、コンピュータに挿入された機能拡張ボードや
コンピュータに接続された機能拡張ユニットに備わるメ
モリに書き込まれた後、そのプログラムコードの指示に
基づき、その機能拡張ボードや機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0048】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明したフローチャートに対応す
るプログラムコードを格納することになるが、簡単に説
明すると、図7のメモリマップ例に示す各モジュールを
記憶媒体に格納することになる。すなわち、少なくとも
「認識モジュール」、「獲得モジュール」および「出力
モジュール」の各モジュールのプログラムコードを記憶
媒体に格納すればよい。
【0049】尚、「認識モジュール」は、画像データ中
に含まれる文字を認識する。「獲得モジュール」は、認
識する文字に対する複数の認識候補の各認識尤度を獲得
する。「出力モジュール」は、獲得した各認識尤度に基
づいて、複数の認識候補の内、少なくとも一つを文字の
認識結果として出力する。
【0050】
【発明の効果】以上説明したように本発明によれば、入
力した画像データに含まれる文字の認識を行った場合
に、その認識結果を訂正するためのユーザに対する負担
を軽減し、かつ画像データの検索を効率的に実行するこ
とができる情報処理装置及びその方法を提供できる。
【図面の簡単な説明】
【図1】本発明の実施形態における情報処理システムの
構成を示すブロック図である。
【図2】本発明の実施形態で実行される変換処理を示す
フローチャートである。
【図3】本発明の実施形態で実行される作成処理を示す
フローチャートである。
【図4】本発明の実施形態で実行される検索処理を示す
フローチャートである。
【図5】本発明の他の実施形態で実行される処理を示す
フローチャートである。
【図6】本発明の単語辞書の構造の一例を示す図であ
る。
【図7】本発明の実施形態を実現するプログラムコード
を格納した記憶媒体のメモリマップの構造を示す図であ
る。
【符号の説明】
1 イメージスキャナ 2 OCR処理部 3 文書検索部 4 外部記憶装置 5 キーボード/マウス 6 表示装置 10 コンピュータ 10a CPU 10b メモリ 101b 制御プログラム 102b 認識用辞書

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】 入力された画像データを認識する情報処
    理装置であって、 前記画像データ中に含まれる文字を認識する認識手段
    と、 前記認識手段で認識する文字に対する複数の認識候補の
    各認識尤度を獲得する獲得手段と、 前記獲得手段で獲得した各認識尤度に基づいて、前記複
    数の認識候補の内、少なくとも一つを前記文字の認識結
    果として出力する出力手段とを備えることを特徴とする
    情報処理装置。
  2. 【請求項2】 前記出力手段は、前記獲得手段で獲得し
    た各認識尤度と第1の閾値とを比較し、その比較結果に
    基づいて、前記複数の認識候補の内、少なくとも一つを
    前記文字の認識結果として出力することを特徴とする請
    求項1に記載の情報処理装置。
  3. 【請求項3】 前記出力手段は、前記獲得手段で獲得し
    た各認識尤度の最大の認識尤度が前記第1の閾値より大
    きい場合、該最大の認識尤度を有する認識候補を前記文
    字の認識結果として出力することを特徴とする請求項2
    に記載の情報処理装置。
  4. 【請求項4】 前記出力手段は、前記獲得手段で獲得し
    た各認識尤度の最大の認識尤度が前記第1の閾値より小
    さい場合、更に該各認識尤度と第2の閾値とを比較し、
    その比較結果に基づいて、前記複数の認識候補の内、少
    なくとも一つを前記文字の認識結果として出力すること
    を特徴とする請求項2に記載の情報処理装置。
  5. 【請求項5】 前記出力手段は、前記獲得手段で獲得し
    た各認識尤度の内、前記第2の閾値よりも大きい認識尤
    度を有する認識候補を前記文字の認識結果として出力す
    ることを特徴とする請求項4に記載の情報処理装置。
  6. 【請求項6】 前記出力手段は、前記獲得手段で獲得し
    た各認識尤度が前記第2の閾値よりも小さい場合、該各
    認識尤度の内、認識尤度の高いものから所定個の認識候
    補を前記文字の認識結果として出力することを特徴とす
    る請求項4に記載の情報処理装置。
  7. 【請求項7】 前記出力手段は、前記文字の認識結果と
    して、複数の認識候補群を出力する場合、該認識候補群
    の前後に所定文字を付加して該認識候補群を出力するこ
    とを特徴とする請求項1に記載の情報処理装置。
  8. 【請求項8】 前記出力手段で出力された認識結果と前
    記画像データを対応づけて管理する管理手段とを更に備
    えることを特徴とする請求項1に記載の情報処理装置。
  9. 【請求項9】 検索条件を入力する入力手段と、 前記管理手段に管理されている画像データに対し、前記
    入力手段で入力された検索条件に該当する前記認識結果
    に対応する画像データを検索する検索手段とを更に備え
    ることを特徴とする請求項8に記載の情報処理装置。
  10. 【請求項10】 入力された画像データを認識する情報
    処理方法であって、 前記画像データ中に含まれる文字を認識する認識工程
    と、 前記認識工程で認識する文字に対する複数の認識候補の
    各認識尤度を獲得する獲得工程と、 前記獲得工程で獲得した各認識尤度に基づいて、前記複
    数の認識候補の内、少なくとも一つを前記文字の認識結
    果として出力する出力工程とを備えることを特徴とする
    情報処理方法。
  11. 【請求項11】 前記出力工程は、前記獲得工程で獲得
    した各認識尤度と第1の閾値とを比較し、その比較結果
    に基づいて、前記複数の認識候補の内、少なくとも一つ
    を前記文字の認識結果として出力することを特徴とする
    請求項10に記載の情報処理方法。
  12. 【請求項12】 前記出力工程は、前記獲得工程で獲得
    した各認識尤度の最大の認識尤度が前記第1の閾値より
    大きい場合、該最大の認識尤度を有する認識候補を前記
    文字の認識結果として出力することを特徴とする請求項
    11に記載の情報処理方法。
  13. 【請求項13】 前記出力工程は、前記獲得工程で獲得
    した各認識尤度の最大の認識尤度が前記第1の閾値より
    小さい場合、更に該各認識尤度と第2の閾値とを比較
    し、その比較結果に基づいて、前記複数の認識候補の
    内、少なくとも一つを前記文字の認識結果として出力す
    ることを特徴とする請求項11に記載の情報処理方法。
  14. 【請求項14】 前記出力工程は、前記獲得工程で獲得
    した各認識尤度の内、前記第2の閾値よりも大きい認識
    尤度を有する認識候補を前記文字の認識結果として出力
    することを特徴とする請求項13に記載の情報処理方
    法。
  15. 【請求項15】 前記出力工程は、前記獲得工程で獲得
    した各認識尤度が前記第2の閾値よりも小さい場合、該
    各認識尤度の内、認識尤度の高いものから所定個の認識
    候補を前記文字の認識結果として出力することを特徴と
    する請求項13に記載の情報処理方法。
  16. 【請求項16】 前記出力工程は、前記文字の認識結果
    として、複数の認識候補群を出力する場合、該認識候補
    群の前後に所定文字を付加して該認識候補群を出力する
    ことを特徴とする請求項10に記載の情報処理方法。
  17. 【請求項17】 前記出力工程で出力された認識結果と
    前記画像データを対応づけて記憶媒体に管理する管理工
    程とを更に備えることを特徴とする請求項10に記載の
    情報処理方法。
  18. 【請求項18】 検索条件を入力する入力工程と、 前記管理工程で前記記憶媒体に管理されている画像デー
    タに対し、前記入力工程で入力された検索条件に該当す
    る前記認識結果に対応する画像データを検索する検索工
    程とを更に備えることを特徴とする請求項17に記載の
    情報処理方法。
  19. 【請求項19】 入力された画像データを認識する情報
    処理のプログラムコードが格納されたコンピュータ可読
    メモリであって、 前記画像データ中に含まれる文字を認識する認識工程の
    プログラムコードと、 前記認識工程で認識する文字に対する複数の認識候補の
    各認識尤度を獲得する獲得工程のプログラムコードと、 前記獲得工程で獲得した各認識尤度に基づいて、前記複
    数の認識候補の内、少なくとも一つを前記文字の認識結
    果として出力する出力工程のプログラムコードとを備え
    ることを特徴とするコンピュータ可読メモリ。
JP9155513A 1997-06-12 1997-06-12 情報処理装置及びその方法 Pending JPH113401A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9155513A JPH113401A (ja) 1997-06-12 1997-06-12 情報処理装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9155513A JPH113401A (ja) 1997-06-12 1997-06-12 情報処理装置及びその方法

Publications (1)

Publication Number Publication Date
JPH113401A true JPH113401A (ja) 1999-01-06

Family

ID=15607704

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9155513A Pending JPH113401A (ja) 1997-06-12 1997-06-12 情報処理装置及びその方法

Country Status (1)

Country Link
JP (1) JPH113401A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4726836U (ja) * 1971-04-15 1972-11-27
US4850047A (en) * 1986-08-29 1989-07-18 Fujitsu Limited Optical bus communication system utilizing frame format signals
JP2012063883A (ja) * 2010-09-14 2012-03-29 Ricoh Co Ltd 情報処理装置、情報処理方法、および情報処理プログラム
JP2016224602A (ja) * 2015-05-28 2016-12-28 株式会社デンソーウェーブ 情報読取装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4726836U (ja) * 1971-04-15 1972-11-27
JPS5126441Y2 (ja) * 1971-04-15 1976-07-05
US4850047A (en) * 1986-08-29 1989-07-18 Fujitsu Limited Optical bus communication system utilizing frame format signals
JP2012063883A (ja) * 2010-09-14 2012-03-29 Ricoh Co Ltd 情報処理装置、情報処理方法、および情報処理プログラム
CN102402576A (zh) * 2010-09-14 2012-04-04 株式会社理光 信息处理设备、信息处理方法及计算机程序产品
JP2016224602A (ja) * 2015-05-28 2016-12-28 株式会社デンソーウェーブ 情報読取装置

Similar Documents

Publication Publication Date Title
JP3689455B2 (ja) 情報処理方法及び装置
US7610193B2 (en) Document based character ambiguity resolution
JP4533920B2 (ja) 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体
JP2973944B2 (ja) 文書処理装置および文書処理方法
EP0844583B1 (en) Method and apparatus for character recognition
US7240062B2 (en) System and method for creating a searchable word index of a scanned document including multiple interpretations of a word at a given document location
JP4740916B2 (ja) 画像文書処理装置、画像文書処理プログラムおよび画像文書処理プログラムを記録した記録媒体
US7647303B2 (en) Document processing apparatus for searching documents, control method therefor, program for implementing the method, and storage medium storing the program
JPH0668298A (ja) 文書書式の文字認識及びデータ修復処理のためのデータ処理システム及び方法
US5905811A (en) System for indexing document images
JPH0682403B2 (ja) 光学式文字読取装置
JPH113401A (ja) 情報処理装置及びその方法
JPH09198404A (ja) 文書処理方法及び装置
JP2586372B2 (ja) 情報検索装置及び情報検索方法
JPH08272813A (ja) ファイリング装置
JPH1069494A (ja) 画像検索方法とその装置
JPH06111079A (ja) 単語読み取り装置
JP4261831B2 (ja) 文字認識処理方法、文字認識処理装置、文字認識プログラム
JP2996823B2 (ja) 文字認識装置
JPH10207909A (ja) 文書検索システムおよび方法
JP2917310B2 (ja) 単語照合における単語辞書検索方式
JPH07160730A (ja) 全文検索装置
JPH0863487A (ja) 文書検索方法及び文書検索装置
JP2008084132A (ja) 文書検索装置、文書検索方法および文書検索プログラム
JPH11191107A (ja) 文書処理方法とその装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040601

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20040601

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20040601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070330

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070720