JP2009245464A - 単語認識プログラム、単語認識方法、単語認識装置 - Google Patents

単語認識プログラム、単語認識方法、単語認識装置 Download PDF

Info

Publication number
JP2009245464A
JP2009245464A JP2009177596A JP2009177596A JP2009245464A JP 2009245464 A JP2009245464 A JP 2009245464A JP 2009177596 A JP2009177596 A JP 2009177596A JP 2009177596 A JP2009177596 A JP 2009177596A JP 2009245464 A JP2009245464 A JP 2009245464A
Authority
JP
Japan
Prior art keywords
word
character
recognition
reliability
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009177596A
Other languages
English (en)
Other versions
JP4985724B2 (ja
Inventor
Yoshinobu Hotta
悦伸 堀田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2009177596A priority Critical patent/JP4985724B2/ja
Publication of JP2009245464A publication Critical patent/JP2009245464A/ja
Application granted granted Critical
Publication of JP4985724B2 publication Critical patent/JP4985724B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】画像データに基づく文字認識において、特別な単語リスト等を予め用意することなく、高精度な文字認識を可能とする技術を提供する。
【解決手段】本装置は、画像に含まれる単語を構成する個々の文字を認識する文字認識部と、前記文字認識部にて認識された個々の文字についての文字認識の信頼度を判定する認識信頼度判定部と、前記認識信頼度判定部にて所定の閾値以下の認識信頼度である低信頼度文字と判定された文字を含む単語について、前記低信頼度文字を所定のワイルドカード記号と置換してワイルドカード検索を行い候補単語を取得する検索処理部と、前記低信頼度文字を含む画像領域部分と、前記低信頼度文字に対応する前記候補単語における文字から形成される文字画像との類似度の判定を行う類似度判定部と、前記類似度判定部による判定結果に基づいて、前記候補単語を前記画像に含まれる単語として判定する単語判定部とを備えてなる。
【選択図】図1

Description

本明細書に開示された技術は、画像データに基づく文字認識を行うための単語認識プログラム、単語認識方法および単語認識装置に関するものである。
従来、単語イメージを含む画像のデータに基づく文字認識を行う場合、いわゆる知識処理を実行する技術が知られている(例えば、非特許文献1参照。)。この処理においては、まず、文字認識の対象となる単語イメージを個々の文字と推定される領域(文字候補領域)にそれぞれ切り出し(分割し)、これら個々の文字候補領域に対して個別に文字認識が行われる。その後、上述の個別の文字認識において生じる認識ミスを修正するために、後処理として、当該個別の文字認識結果からなる文字列が、実在する単語に関する情報である単語辞書と照らし合わされる。
また、上述した文字候補領域への切り出し処理における、切り出しミスの発生を回避するために、単語を個々の文字に切り出さずに、文字認識の対象とする単語を一括して認識する技術も知られる(例えば、特許文献1および特許文献2参照。)。このように単語を一括して認識する技術では、文字認識の対象となる単語に関する単語リストを予め用意しておき、当該単語リストに基づいて、単語を構成する個々の文字の特徴からそれぞれの単語の特徴を合成し、この合成された単語の特徴と認識対象となる単語イメージから抽出された単語の特徴とを照らし合わせて各単語についての認識結果を得る。
なお、文字列の推定に関しては、コンピュータシステムにおける文字列の入力において、入力途中の文字列を補完して候補を決定し、上記候補から絞り込み条件によって絞り込んだ文字列を入力文字列とする技術(例えば、特許文献3参照。)が知られる。また、文字認識の後処理に関しては、知識処理用の知識辞書を装置又はシステムが持つのではなく、インターネット空間を仮想的なデータベースと見なし、インターネット検索した結果をもとに知識処理を行う技術(例えば、特許文献4参照。)が知られる。
特開2000−137766号公報(第3−8頁、第1図) 特開2001−147989号公報(第3−5頁、第1図) 特開平10−11430号公報(第7−20頁、第1図) 特開2004−133565号公報(第6−11頁、第1図)
村瀬 洋,新谷 幹夫,若原 徹,小高 和己,"言語情報を導入した手書き文字列からの文字の切り出しと認識",電子通信学会論文誌(D),vol.J69−D,No.9,pp.1292−1301,1986年9月
認識対象としての単語のイメージに対して、文字候補領域の切り出しおよび個々の文字候補領域に対する文字認識を行う場合、文字のつぶれ等の理由により隣接する文字同士が接触しているような場合に、個々の文字を正確に切り出せず、文字候補領域の中に誤った情報が含まれてしまうおそれがある。この問題を解決するために、後処理において、当該文字列である可能性の高い単語候補を推測することになるが、通常の後処理で用いられる文字bi−gramモデル(ある文字の次に来る可能性の高い文字を統計的に推測する方式)では、対象となる文字列の中に認識不能な文字が複数文字連続して存在すると、当該文字列である可能性のある文字並びの組合せ数が膨大となり、単語候補の推測が困難となる。
一方、単語を個々の文字に分割せずに、単語毎に一括して文字認識を行う方式では、単語のイメージからの個々の文字の切り出し処理を行わないため、上述のような、隣接する文字同士が接触していることによる認識ミスの問題は回避できるが、認識結果の候補となる所定のカテゴリの単語が登録された単語リストを予め用意しておかなければならないという問題がある。
本明細書に開示の技術は上述した問題点を解決するためになされたものであり、画像データに基づく文字認識において、単語イメージを構成する文字列内に認識が困難な文字が含まれている場合でも、特別な単語リスト等を予め用意することなく、高精度な文字認識を可能とする単語認識装置、単語認識方法および単語認識プログラムを提供することを目的とする。
上述した課題を解決するため、本明細書に開示の単語認識プログラムは、単語を含む画像の画像情報に基づいて、該単語の認識を行う処理をコンピュータに実行させる単語認識プログラムであって、
前記画像に含まれる単語を構成する個々の文字を認識する文字認識ステップと、
前記文字認識ステップにて認識された個々の文字についての文字認識の信頼度を判定する認識信頼度判定ステップと、
前記認識信頼度判定ステップにて所定の閾値以下の認識信頼度である低信頼度文字と判定された文字を含む単語について、前記低信頼度文字を所定のワイルドカード記号と置換してワイルドカード検索を行い候補単語を取得する検索処理ステップと、
前記検索処理ステップにおいて、少なくとも2つの単語について候補単語の組み合わせが取得された場合、前記候補単語の組み合わせをキーワードとしてWeb検索を行い、該Web検索の検索結果において最も該当件数が多い組み合わせの候補単語を共起頻度が最も高い組み合わせの候補単語として前記画像に含まれる単語として判定する単語判定ステップと
をコンピュータに実行させる。
また、本明細書に開示の単語認識方法は、単語を含む画像の画像情報に基づいて、該単語の認識を行う単語認識方法であって、
前記画像に含まれる単語を構成する個々の文字を認識する文字認識ステップと、
前記文字認識ステップにて認識された個々の文字についての文字認識の信頼度を判定する認識信頼度判定ステップと、
前記認識信頼度判定ステップにて所定の閾値以下の認識信頼度である低信頼度文字と判定された文字を含む単語について、前記低信頼度文字を所定のワイルドカード記号と置換してワイルドカード検索を行い候補単語を取得する検索処理ステップと、
前記検索処理ステップにおいて、少なくとも2つの単語について候補単語の組み合わせが取得された場合、前記候補単語の組み合わせをキーワードとしてWeb検索を行い、該Web検索の検索結果において最も該当件数が多い組み合わせの候補単語を共起頻度が最も高い組み合わせの候補単語として前記画像に含まれる単語として判定する単語判定ステップと
を有する。
また、本明細書に開示の単語認識装置は、単語を含む画像の画像情報に基づいて、該単語の認識を行う単語認識装置であって、
前記画像に含まれる単語を構成する個々の文字を認識する文字認識部と、
前記文字認識部にて認識された個々の文字についての文字認識の信頼度を判定する認識信頼度判定部と、
前記認識信頼度判定部にて所定の閾値以下の認識信頼度である低信頼度文字と判定された文字を含む単語について、前記低信頼度文字を所定のワイルドカード記号と置換してワイルドカード検索を行い候補単語を取得する検索処理部と、
前記検索処理部において、少なくとも2つの単語について候補単語の組み合わせが取得された場合、前記候補単語の組み合わせをキーワードとしてWeb検索を行い、該Web検索の検索結果において最も該当件数が多い組み合わせの候補単語を共起頻度が最も高い組み合わせの候補単語として前記画像に含まれる単語として判定する単語判定部と
を備えてなる。
以上に詳述したように本明細書に開示された技術によれば、画像データに基づく文字認識において、単語イメージを構成する文字列内に認識が困難な文字が含まれている場合でも、特別な単語リスト等を予め用意することなく、高精度な文字認識を可能とする単語認識装置、単語認識方法および単語認識プログラムを提供することができる。
第1の実施の形態による単語認識装置を示す機能ブロック図である。 本実施の形態による単語認識方法における基本動作の処理の流れについて説明するためのフローチャートである。 ワイルドカード記号の設定方法および候補単語の選択について説明するための図である。 ワイルドカード記号の設定方法および候補単語の選択について説明するための図である。 「descender」および「ascender」の意味を示す図である。 日本語の単語の文字認識の流れを説明するためのフローチャートである。 ワイルドカード記号の設定方法および候補単語の選択について説明するための図である。 第2の実施の形態による単語認識方法における基本動作の処理の流れについて説明するためのフローチャートである。 ワイルドカード記号の設定方法および候補単語の選択について説明するための図である。
(第1の実施の形態)
以下、第1の実施の形態について図面を参照しつつ説明する。図1は、本実施の形態による単語認識装置を示す機能ブロック図である。
本実施の形態による単語認識装置1は、単語を含む画像の画像情報に基づいて、該単語の認識を行う機能を有しており、インターネット等の電気通信回線を介して、インターネット経由で利用可能なワイルドカード検索機能付きのメタ辞書検索サイト(単語辞書検索を行うためのWebサイト)である辞書検索サイト2と通信可能となっている。
本実施の形態による単語認識装置1は、画像情報取得部101と、文字認識部102と、認識信頼度判定部103と、検索処理部104と、候補単語限定部105と、類似度判定部106と、単語判定部107と、CPU108と、記憶部109とを備える。
画像情報取得部101は、CCDカメラ等から構成され、認識対象である単語を含む画像の撮像を行い、当該画像に関する画像情報を取得する。また、画像情報取得部101は、認識対象である単語を含む画像の画像情報を、単語認識装置1と通信可能な外部機器から電子データとして取得する構成とすることもできる。ここで取得する画像は、手書き文字および活字のいずれであってもよい。
文字認識部102は、画像に含まれる単語を構成する個々の文字の認識を行う。
認識信頼度判定部103は、パターン認識に利用される手法としてよく知られるDP(Dynamic Programming)マッチングを行うことにより文字認識部にて認識された個々の文字についての文字認識の信頼度(認識信頼度)を判定する。具体的に、認識信頼度判定部103は、画像における単語の個々の文字領域についての特徴量と、文字認識部102における認識結果である個々の文字の特徴量との距離差(類似度)や尤度を判定する。なお、文字認識を行う際におけるDPマッチングについては、公知の手法であるため、詳細な説明は割愛する。
検索処理部104は、認識信頼度判定部103にて所定の閾値以下の認識信頼度である文字を低信頼度文字と判定し、当該低信頼度文字を含む単語について、当該単語の文字列のうち低信頼度文字を所定のワイルドカード記号と置換して辞書検索サイト2に対してワイルドカード検索を行い、候補単語を取得する。検索処理部104における処理の詳細については後述する。
候補単語限定部105は、検索処理部104により取得された候補単語群に対して、所定の条件に基づいて、候補単語の絞り込みを行う。なお、ここでの候補単語限定部105は、descender判定およびascender判定のうち少なくともいずれか一方を行うことにより、低信頼度文字を含む単語と候補単語との類似度の判定を行い、該判定結果に基づいて候補単語の絞り込みを行う構成となっている。descender判定およびascender判定の詳細については後述する。
類似度判定部106は、低信頼度文字を含む画像領域部分と、当該低信頼度文字に対応する、候補単語限定部により絞り込まれた候補単語における文字から形成される文字画像との類似度の判定を行う。なお、ここでは、類似度判定部106は、候補単語限定部105により絞り込まれた候補単語に基づいて類似度の判定を行っているが、これに限られるものではなく、検索処理部104により取得された全ての候補単語に基づいて類似度の判定を行うようにすることもできる。
単語判定部107は、類似度判定部106による判定結果に基づいて、候補単語を画像に含まれる単語として判定する。ここでは、単語判定部107は、候補単語が複数ある場合に、類似度判定部106において最も類似度が高いと判定された候補単語を画像に含まれる単語として判定する。
記憶部109は、例えばROM(Read Only Memory)およびRAM(Random Access Memory)等から構成される。
以下、図2に示すフローチャートを用いて、本実施の形態による単語認識方法における基本動作の処理の流れについて説明する。
まず、認識対象となる単語を含む画像(ここでは文書の画像)を画像情報取得部101にて取得する(S101)。
次に、文字認識部102にて上述のステップ(S101)で取得された画像に含まれる個々の単語の切り出しを行う。なお、画像領域における各単語の認識は、例えば活字の英文であれば個々の単語がそれぞれ文字間空白によって分離されているので、この空白に基づいて各単語イメージを容易に切り出すことができる。
続いて、文字認識部102は、上述のステップ(S102)にて切り出された個々の単語を入力とし(S103)、単語を構成する文字の切り出しを行う(S104)。
次に、文字認識部102は、上述のステップ(S104)にて切り出した文字の平均文字幅を算出する(S105)。
文字認識部102は、切り出した個々の文字に対して文字認識を行う。ここで、認識の対象となる文字の幅と算出した平均文字幅との差が所定値よりも小さい場合(S106,Yes)、すなわち認識の対象となる文字の幅と算出した平均文字幅とが近い場合、当該文字に対する文字認識を行う(文字認識ステップ)(S107)。続いて文字認識の対象となる文字がある場合(S108,No)、上述のステップ(S106)に戻り、次の認識対象となる文字についての処理を行う。
一方、認識の対象となる文字の幅と算出した平均文字幅との差が所定値以上である場合(S106,No)、当該文字は隣接する文字とつながってしまっているか、文字ではない記号等であると推定できるため、当該文字に対する文字認識は行わない。
このようにして認識対象である文字の候補数分の判定が終了した場合(S108,Yes)、検索処理部104は、当該単語の、上述のステップにて文字幅が平均文字幅よりも大きいと判定された文字および文字認識部102における文字認識の認識信頼度が所定の閾値よりも低い低信頼度文字と判定された部分をワイルドカード記号(任意の1文字を表わす「?」や任意の文字列を表わす「*」など)に置換する(S109)。
なお、ワイルドカード記号と置換する部分の文字数が、文字の画像のつぶれ等により定かでない場合、検索処理部104は、平均文字幅に基づいて認識信頼度の低い部分の文字数を推定し、推定した文字数に応じてワイルドカード記号を設定する。ここで、ワイルドカード記号として「?」を用いた場合、検索される単語長は固定長となるが、「*」を用いた場合は可変長となる。文字のつぶれ等の理由により文字同士が接触している部分が多い場合、文字数の推定自体が難しい。このような場合、文字同士が接触している部分をワイルドカード「*」で表わすことが好ましい。
例えば、「m?stery」でワイルドカード検索を行うと「mastery」「mistery」「mystery」の3単語が出力され、これらはいずれも7文字から成る。一方、「m*stery」でワイルドカード検索を行うと先の3単語に加えて、「magistery」(9文字)、「ministery」(9文字)、「monastery」(9文字)が出力される。
なお、個々の文字を認識した際に認識信頼度が同時に出力される(認識信頼度判定ステップ)構成である場合は、認識信頼度が閾値以上の文字だけをワイルドカード検索のキーワードとして出力する。
次に、検索処理部104は、上述のようにしてワイルドカード記号を設定した文字列を検索クエリとして、辞書検索サイト2に配備された単語辞書データベースに対してワイルドカード検索を行い、当該ワイルドカード記号が設定された文字列の候補となる単語を取得する(検索処理ステップ)(S110)。
例えば、図3(a)に示すように、「command」という単語のイメージについての文字認識を行う場合に、文字認識部102による「mm」の部分の認識信頼度が所定の閾値以下であった場合、この「mm」の部分の文字数を平均文字幅から2文字と推定したときには「co??and」、3文字と推定したときには「co???and」を検索クエリとしてワイルドカード検索を行う(図3(b))。その結果、例えば「co??and」で検索した場合には候補単語として「command」と「corsand」が得られ、「co???and」で検索した場合には候補単語として「cournand」が得られる(図3(c))。
また、図4(a)に示すように、例えば「diplomacy」という単語のイメージについての文字認識を行う場合に、文字認識部102による「omac」の部分の認識信頼度が所定の閾値以下であった場合、この「omac」の部分の文字数の推定が困難な場合には「dipl*y」を検索クエリとしてワイルドカード検索を行う(図4(b))。その結果、例えば12個の候補単語が得られる(図4(c))。
続いて、候補単語限定部105は、上述のようにして得られた候補単語に対してdescender判定およびascender判定のうち少なくともいずれか一方を行うことにより、低信頼度文字を含む単語とワイルドカード検索により得られた候補単語との類似度の判定を行い、該判定結果に基づいて候補単語の絞り込みを行う(候補単語限定ステップ)(S111)。なお、descender判定またはascender判定を行うために、各候補単語についてのdescenderまたはascenderの有無は予め調べておく。図5に、「descender」および「ascender」の意味を示す。
このように、候補単語限定部105による候補単語の絞り込みを行うことにより(図4(d)参照)、後述の処理の負担を軽減することができるとともに、文字認識の精度の向上に寄与することができる。なお、上述のワイルドカード検索において取得された候補単語の数が少ない場合(図3(c)参照)、候補単語限定部105による候補単語の絞り込みの処理は省略することもできる。
このようにして候補単語の絞り込みを行った後、これら絞り込まれた候補単語におけるワイルドカード記号に対応する文字部分と、認識対象である単語の当該ワイルドカードに置換された画像領域部分との類似度を判定する(認識信頼度の低い部分についての部分画像のマッチング)(図3(d)および図4(e)参照)(類似度判定ステップ)(S112)。なお、当該判定は、候補単語の該当文字部の文字コードをもとに、文字画像データから部分画像を生成し、生成された部分画像と認識対象である単語の部分画像との類似度の判定を行ってもよい。
このようにして、単語判定部107は、上述の類似度の判定処理において、最も類似度が高かった文字部分を有する候補単語を、認識結果である単語として判定する(単語判定ステップ)(S113)。
続いて、画像に含まれる単語が日本語である場合について説明する。図6は、日本語の単語の文字認識の流れを説明するためのフローチャートである。なお、図6におけるステップS301〜S304における処理は、図2に示したステップS101〜S110における処理と同様であるため、説明は割愛する。
本実施の形態では、認識対象となる単語が日本語である場合は、descender判定またはascender判定を用いた候補単語の絞り込みは困難であるため、ワイルドカード検索(図7(b))により取得された候補単語すべて(図7(c))を類似度判定部106における類似度の判定(部分画像マッチング)の対象とし(図7(d))、この類似度の判定処理(S305)において、最も類似度が高かった文字部分を有する候補単語を、認識結果である単語として判定する構成としている(S306)。
以上のように、本実施の形態による単語認識装置は、単語イメージに対して、文字切り出しと個別文字認識を行い、その個別文字認識結果において認識信頼度の高い文字を用いて単語辞書に対してワイルドカード検索を行うことで単語候補を取得し、認識信頼度の低い部分画像に対しては個々の文字に分離することなく部分画像マッチングを行うことで単語候補を決定する構成となっている。
本実施の形態によれば、個別文字認識と単語辞書に対するワイルドカード検索、descender判定およびascender判定を組み合わせることで認識信頼度の高い文字だけから単語候補をトップダウンに絞り込むことができる。そして、文字間接触が生じている部分については、部分画像マッチングを用いるため、厳密に個々の文字を切り出す必要がない。
また、ワイルドカード検索において、1文字を代用する「?」だけでなく、任意の文字数を許容する「*」を用いることで、文字数の推定が難しいケースでも対応可能である。
さらに、インターネット接続された端末からはWeb上のメタ辞書検索サイトを利用することができるため、単語辞書を装置内部に備える必要がなくなるとともに単語辞書のメンテナンスも不要となる。特に、新語や造語についても、Web上の辞書は頻繁に更新されるため、それらの大規模な情報を利用することもできる。
(第2の実施の形態)
続いて、第2の実施の形態について説明する。
本実施の形態は、上述の第1の実施の形態の変形例であり、ワイルドカード検索により取得された候補単語についての判定方法が第1の実施の形態と異なる。以下、上述の実施の形態にて述べた部分と同一の部分には同一符号を付し、説明は割愛する。
ワイルドカード検索により候補単語が複数取得された場合に、認識対象である単語を含む画像領域と、複数の単語候補それぞれに対応して形成される画像とが、すべて同程度に類似している場合は候補単語を1つに特定するのが難しい。
このようなとき、当該単語が含まれる画像中に、当該単語に近接する単語や、同じ画像内で既に文字認識結果が確定している単語がある場合、単語共起頻度を用いて当該単語の識別を行う構成としている。
以下、図8に示すフローチャートを用いて、本実施の形態による単語認識方法における基本動作の処理の流れについて説明する。なお、図8におけるステップS401〜S404における処理は、図2に示したステップS101〜S111における処理と同様であるため、説明は割愛する。
図9(a)に示す検索クエリを用いたワイルドカード検索により「affirmative」と「easements」についてそれぞれ取得された候補単語(図9(b))を図9(c)に示すように組み合わせ、当該組み合わせた状態での候補単語の共起頻度を判定する。
このように、単語判定部107は、少なくとも2つの単語について検索処理部により取得された候補単語の組み合わせのうち、最も共起頻度が高い組み合わせの候補単語を画像に含まれる単語として判定する。
具体的に、単語判定部107は、候補単語の組み合わせをキーワードとしてWeb検索を行い(S405)、該候補単語の組み合わせごとのWeb検索の検索結果において最も該当件数が多い組み合わせの候補単語を画像に含まれる単語として判定する(S406)(図9(d))。
なお、候補単語の共起頻度については、あらかじめ大規模な文書データベースを用いて候補単語の組み合わせについて算出した共起頻度を予め管理しておき、それを利用するようにしてもよい。
単語共起を利用する方式では、単語単独では単語判定部における候補単語の判定が困難な場合でも、隣接する単語との組合せや、すでに候補単語が確定された単語との組合せを利用することで尤もらしい文字認識結果を推定することができる。
なお、本明細書に開示された技術に係る単語認識プログラムは、記憶部109(コンピュータにより読取り可能な記録媒体)に記憶させることによって、単語認識装置を構成するCPU108(コンピュータ)に実行させることが可能となる。なお、上記コンピュータにより読取り可能な記録媒体としては、CD−ROMやフレキシブルディスク、DVDディスク、光磁気ディスク、ICカードなどの半導体記憶装置等の可搬型記憶媒体、コンピュータに実装されるROM、RAMや磁気記録装置等の固定型記憶装置や、コンピュータプログラムを保持するデータベース、或いは、他のコンピュータ並びにそのデータベースや、更に回線上の伝送媒体をも含むものである。
このように、単語認識プログラムをコンピュータに実行させることにより、上述した単語認識方法における各ステップが実現される。
なお、上述の各実施の形態では、候補単語を取得するためのワイルドカード検索をインターネットを介して辞書検索サイト2に対して行う構成を示したが、これに限られるものではなく、例えばワイルドカード検索が可能な単語辞書を単語認識装置内に配置することもできる。
また、本実施の形態による単語認識装置は、例えば、文字認識機能が組み込まれたPC(Personal Computer)、携帯情報端末(Personal Digital Assistants)および携帯電話などに適用可能である。
1 単語認識装置、101 画像情報取得部、102 文字認識部、103 認識信頼度判定部、104 検索処理部、105 候補単語限定部、106 類似度判定部、107 単語判定部、108 CPU、109 記憶部。

Claims (6)

  1. 単語を含む画像の画像情報に基づいて、該単語の認識を行う処理をコンピュータに実行させる単語認識プログラムであって、
    前記画像に含まれる単語を構成する個々の文字を認識する文字認識ステップと、
    前記文字認識ステップにて認識された個々の文字についての文字認識の信頼度を判定する認識信頼度判定ステップと、
    前記認識信頼度判定ステップにて所定の閾値以下の認識信頼度である低信頼度文字と判定された文字を含む単語について、前記低信頼度文字を所定のワイルドカード記号と置換してワイルドカード検索を行い候補単語を取得する検索処理ステップと、
    前記検索処理ステップにおいて、少なくとも2つの単語について候補単語の組み合わせが取得された場合、前記候補単語の組み合わせをキーワードとしてWeb検索を行い、該Web検索の検索結果において最も該当件数が多い組み合わせの候補単語を共起頻度が最も高い組み合わせの候補単語として前記画像に含まれる単語として判定する単語判定ステップと
    をコンピュータに実行させる単語認識プログラム。
  2. 請求項1に記載の単語認識プログラムにおいて、
    前記検索処理ステップにより取得された候補単語群に対して、所定の条件に基づいて、候補単語の絞り込みを行う候補単語限定ステップと、
    前記低信頼度文字を含む画像領域部分と、前記低信頼度文字に対応する前記候補単語限定ステップにより絞り込まれた候補単語における文字から形成される文字画像との類似度の判定を行う前記類似度判定ステップと
    をコンピュータに実行させる単語認識プログラム。
  3. 請求項1又は2に記載の単語認識プログラムにおいて、
    前記候補単語限定ステップは、descender判定およびascender判定のうち少なくともいずれか一方を行うことにより、前記低信頼度文字を含む単語と前記候補単語との類似度の判定を行い、該判定結果に基づいて候補単語の絞り込みを行う単語認識プログラム。
  4. 請求項1ないし3のいずれかに記載の単語認識プログラムにおいて、
    前記検索処理ステップは、前記低信頼度文字を含む単語について、前記低信頼度文字を所定のワイルドカード記号と置換して、所定の単語辞書検索サイトに配備された単語辞書データベースに対してワイルドカード検索を行い候補単語を取得する単語認識プログラム。
  5. 単語を含む画像の画像情報に基づいて、該単語の認識を行う単語認識方法であって、
    前記画像に含まれる単語を構成する個々の文字を認識する文字認識ステップと、
    前記文字認識ステップにて認識された個々の文字についての文字認識の信頼度を判定する認識信頼度判定ステップと、
    前記認識信頼度判定ステップにて所定の閾値以下の認識信頼度である低信頼度文字と判定された文字を含む単語について、前記低信頼度文字を所定のワイルドカード記号と置換してワイルドカード検索を行い候補単語を取得する検索処理ステップと、
    前記検索処理ステップにおいて、少なくとも2つの単語について候補単語の組み合わせが取得された場合、前記候補単語の組み合わせをキーワードとしてWeb検索を行い、該Web検索の検索結果において最も該当件数が多い組み合わせの候補単語を共起頻度が最も高い組み合わせの候補単語として前記画像に含まれる単語として判定する単語判定ステップと
    を有する単語認識方法。
  6. 単語を含む画像の画像情報に基づいて、該単語の認識を行う単語認識装置であって、
    前記画像に含まれる単語を構成する個々の文字を認識する文字認識部と、
    前記文字認識部にて認識された個々の文字についての文字認識の信頼度を判定する認識信頼度判定部と、
    前記認識信頼度判定部にて所定の閾値以下の認識信頼度である低信頼度文字と判定された文字を含む単語について、前記低信頼度文字を所定のワイルドカード記号と置換してワイルドカード検索を行い候補単語を取得する検索処理部と、
    前記検索処理部において、少なくとも2つの単語について候補単語の組み合わせが取得された場合、前記候補単語の組み合わせをキーワードとしてWeb検索を行い、該Web検索の検索結果において最も該当件数が多い組み合わせの候補単語を共起頻度が最も高い組み合わせの候補単語として前記画像に含まれる単語として判定する単語判定部と
    を備えてなる単語認識装置。
JP2009177596A 2009-07-30 2009-07-30 単語認識プログラム、単語認識方法、単語認識装置 Expired - Fee Related JP4985724B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009177596A JP4985724B2 (ja) 2009-07-30 2009-07-30 単語認識プログラム、単語認識方法、単語認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009177596A JP4985724B2 (ja) 2009-07-30 2009-07-30 単語認識プログラム、単語認識方法、単語認識装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2004330255A Division JP2006139659A (ja) 2004-11-15 2004-11-15 単語認識装置、単語認識方法、単語認識プログラム

Publications (2)

Publication Number Publication Date
JP2009245464A true JP2009245464A (ja) 2009-10-22
JP4985724B2 JP4985724B2 (ja) 2012-07-25

Family

ID=41307199

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009177596A Expired - Fee Related JP4985724B2 (ja) 2009-07-30 2009-07-30 単語認識プログラム、単語認識方法、単語認識装置

Country Status (1)

Country Link
JP (1) JP4985724B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011113098A (ja) * 2009-11-21 2011-06-09 Kddi R & D Laboratories Inc 伏せ字を含む文章を修正するための伏せ字修正プログラム、方法及び文章解析サーバ
JP2014120059A (ja) * 2012-12-18 2014-06-30 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
KR20140114444A (ko) * 2012-03-14 2014-09-26 오므론 가부시키가이샤 키워드 검출장치, 그 제어방법 및 제어 프로그램, 및 표시기기
JP2014241027A (ja) * 2013-06-11 2014-12-25 富士ゼロックス株式会社 文書処理装置及びプログラム
WO2015087379A1 (ja) * 2013-12-09 2015-06-18 株式会社 東芝 手書き文書情報を処理するための電子機器および方法
KR20200128089A (ko) * 2018-02-28 2020-11-11 캐논 유로파 엔.브이. 영상 처리 방법 및 영상 처리 시스템

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02132577A (ja) * 1988-11-12 1990-05-22 Ricoh Co Ltd 文字認識結果の修正方法
JPH05346974A (ja) * 1992-06-16 1993-12-27 Matsushita Electric Ind Co Ltd 文字認識装置
JP2001022883A (ja) * 1999-07-12 2001-01-26 Ricoh Co Ltd 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
JP2004133565A (ja) * 2002-10-09 2004-04-30 Fujitsu Ltd インターネットを利用した文字認識の後処理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02132577A (ja) * 1988-11-12 1990-05-22 Ricoh Co Ltd 文字認識結果の修正方法
JPH05346974A (ja) * 1992-06-16 1993-12-27 Matsushita Electric Ind Co Ltd 文字認識装置
JP2001022883A (ja) * 1999-07-12 2001-01-26 Ricoh Co Ltd 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
JP2004133565A (ja) * 2002-10-09 2004-04-30 Fujitsu Ltd インターネットを利用した文字認識の後処理装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011113098A (ja) * 2009-11-21 2011-06-09 Kddi R & D Laboratories Inc 伏せ字を含む文章を修正するための伏せ字修正プログラム、方法及び文章解析サーバ
KR20140114444A (ko) * 2012-03-14 2014-09-26 오므론 가부시키가이샤 키워드 검출장치, 그 제어방법 및 제어 프로그램, 및 표시기기
KR101697933B1 (ko) * 2012-03-14 2017-01-19 오므론 가부시키가이샤 키워드 검출장치, 그 제어방법 및 제어 프로그램, 및 표시기기
US9305234B2 (en) 2012-03-14 2016-04-05 Omron Corporation Key word detection device, control method, and display apparatus
JP2014120059A (ja) * 2012-12-18 2014-06-30 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2014241027A (ja) * 2013-06-11 2014-12-25 富士ゼロックス株式会社 文書処理装置及びプログラム
JP6054547B2 (ja) * 2013-12-09 2016-12-27 株式会社東芝 手書き文書情報を処理するための電子機器および方法
WO2015087379A1 (ja) * 2013-12-09 2015-06-18 株式会社 東芝 手書き文書情報を処理するための電子機器および方法
KR20200128089A (ko) * 2018-02-28 2020-11-11 캐논 유로파 엔.브이. 영상 처리 방법 및 영상 처리 시스템
JP2021502628A (ja) * 2018-02-28 2021-01-28 キヤノン オイローパ エヌ.ヴェー. 画像処理方法及び画像処理システム
US11170265B2 (en) 2018-02-28 2021-11-09 I.R.I.S. Image processing method and an image processing system
JP7038988B2 (ja) 2018-02-28 2022-03-22 キヤノン オイローパ エヌ.ヴェー. 画像処理方法及び画像処理システム
KR102504635B1 (ko) * 2018-02-28 2023-02-27 캐논 유로파 엔.브이. 영상 처리 방법 및 영상 처리 시스템

Also Published As

Publication number Publication date
JP4985724B2 (ja) 2012-07-25

Similar Documents

Publication Publication Date Title
US8131087B2 (en) Program and apparatus for forms processing
TWI321294B (en) Method and device for determining at least one recognition candidate for a handwritten pattern
US7142716B2 (en) Apparatus for searching document images using a result of character recognition
JP4985724B2 (ja) 単語認識プログラム、単語認識方法、単語認識装置
JP3919617B2 (ja) 文字認識装置および文字認識方法、プログラムおよび記憶媒体
WO2007137487A1 (en) Method and apparatus for named entity recognition in natural language
JP5710581B2 (ja) 質問応答装置、方法、及びプログラム
JP5646792B2 (ja) 単語分割装置、単語分割方法、及び単語分割プログラム
JP6003705B2 (ja) 情報処理装置及び情報処理プログラム
US10410632B2 (en) Input support apparatus and computer program product
CN112784009B (zh) 一种主题词挖掘方法、装置、电子设备及存储介质
JP2019169025A (ja) 情報処理装置、文字認識エンジン選択方法及びプログラム
CN107148624A (zh) 预处理文本的方法以及用于执行该方法的预处理系统
JP2018025956A (ja) モデル作成装置、推定装置、方法、及びプログラム
JP5812534B2 (ja) 質問応答装置、方法、及びプログラム
WO2016181468A1 (ja) パターン認識装置、パターン認識方法およびプログラム
JP2004133565A (ja) インターネットを利用した文字認識の後処理装置
JP2006139659A (ja) 単語認識装置、単語認識方法、単語認識プログラム
CN115563515A (zh) 文本相似性检测方法、装置、设备及存储介质
CN115455416A (zh) 一种恶意代码检测方法、装置、电子设备及存储介质
JP5594134B2 (ja) 文字列検索装置,文字列検索方法および文字列検索プログラム
CN114492390A (zh) 基于关键词识别的数据扩充方法、装置、设备及介质
JP4148247B2 (ja) 語彙獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP2003242446A (ja) 文字列予測装置及び方法並びに当該方法を具現化するコンピュータ実行可能なプログラム
KR101452638B1 (ko) 유사 문자열 검색 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090730

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120403

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120416

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150511

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees