JP6007720B2 - 情報処理装置及び情報処理プログラム - Google Patents
情報処理装置及び情報処理プログラム Download PDFInfo
- Publication number
- JP6007720B2 JP6007720B2 JP2012230620A JP2012230620A JP6007720B2 JP 6007720 B2 JP6007720 B2 JP 6007720B2 JP 2012230620 A JP2012230620 A JP 2012230620A JP 2012230620 A JP2012230620 A JP 2012230620A JP 6007720 B2 JP6007720 B2 JP 6007720B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- recognition result
- attribute
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
請求項1の発明は、文字画像を認識する文字認識手段と、認識結果と該認識結果の目視検査における文字の紛らわしさを示す指標を対応させて記憶している記憶手段から、前記文字認識手段による認識結果に対応する指標を抽出し、該指標に基づいて、該認識結果の表示態様を示す文字属性を決定する決定手段と、前記決定手段によって決定された文字属性にしたがって、前記文字認識手段による認識結果を表示する表示手段を具備し、前記決定手段は、さらに前記認識結果によって構成される文字列が予め定められた文字列に該当する場合は、該認識結果の文字属性を目立つ表示とはならない文字属性にし、該文字列には、認識の確からしさを示す確度が閾値より低い又は以下である文字を含むことを特徴とする情報処理装置である。
紙文書の電子化において、一般的に文字認識技術(OCR(Optical Character Reader:光学式文字読み取り装置)を含む)を利用して、文字画像を認識して、認識結果である文字コードを紙文書の電子文書(画像)に添付する。これによって、その電子文書に対して文字検索できるようになる。
しかし、一般的に文字認識技術の活字認識率は、紙文書の活字の状況や、スキャン解像度、圧縮率などの状況によっては誤認識が発生する。特に、似たような文字(数字の「1」とアルファベットの小文字「i,l」、全角「A」と半角「A」など)の誤認識が多くなり、手書き文字を対象とした場合は、さらに多くなる可能性が高い。
このため、文字認識技術の誤認識をなくすためには、認識結果に対して目視による全数検査を行っている。しかし、この検査工程においても、人間の誤り率がゼロにできないことから、異なる人による検査を二重以上に行うことで、目視での誤認識率を下げようとしている。
図25は、文字認識結果の目視検査例を示す説明図である。図25(a)は対象画像2510の例を示している。対象画像2510から文字領域だけを抽出(写真等の領域を除去)し、その文字領域内の文字画像を認識する。図25(b)は認識結果2520の例を示している。この認識結果内には誤認識の結果も含まれている。図25(c)は修正結果2530の例を示している。つまり、全文字を人手による目視検査を行い、誤認識の「i」を「1」に、「o」を「O」に、「あ」を「お」に、誤認識していることを検知し、エディタを用いて修正し、修正結果2530を作成している。
人手による目視検査は、図26の例に示すようにスキャンされた文書画像(図26(a))と、文字認識技術で認識した文字コードをラスタライズした文書画像(図26(b))を一対に表示し、その表示を比較しながら、文字認識技術が間違った文字(図26(c)の例では下線が引かれた文字)を発見して修正していく、という方式が一般的である。
しかし、この技術では、多くの色文字が発生し、かえって目視検査担当者の注意が散漫になる可能性がある。
文字認識モジュール2710は、文字属性決定モジュール2720、表示モジュール2730と接続されている。文字認識モジュール2710は、文字画像2705を受け付け、文字画像2705を認識し、認識結果である文字コード2715を文字属性決定モジュール2720、表示モジュール2730に渡す。
文字属性決定モジュール2720は、文字認識モジュール2710、文字種・文字属性対応記憶モジュール2722、表示モジュール2730と接続されている。文字属性決定モジュール2720は、文字認識モジュール2710より文字コード2715を受け付け、文字種・文字属性対応記憶モジュール2722内の文字種・文字属性対応テーブル2800を参照して、文字コード2715に対応する文字属性2725を抽出し、その文字属性2725を表示モジュール2730に渡す。
文字種・文字属性対応記憶モジュール2722は、文字属性決定モジュール2720と接続されている。文字種・文字属性対応記憶モジュール2722は、文字種・文字属性対応テーブル2800を記憶している。図28は、文字種・文字属性対応テーブル2800のデータ構造例を示す説明図である。文字種・文字属性対応テーブル2800は、文字種欄2810、文字属性欄2820を有している。文字種欄2810は、文字種を記憶している。具体的には、その文字種に該当する文字コードの範囲を記憶している。文字属性欄2820は、その文字種に対応する文字属性を記憶している。ここで、文字属性とは、対応する文字コードを表示する場合の属性であり、ここでは文字の色を示している。つまり、ここでは、認識結果の文字コード2715が漢字である場合は赤色で表示されるように文字属性2725として赤色を設定し、文字コード2715が数字である場合は青色で表示されるように文字属性2725として青色を設定し、文字コード2715が英字である場合は黄色で表示されるように文字属性2725として黄色を設定し、文字コード2715がカタカナである場合は緑色で表示されるように文字属性2725として緑色を設定する。
表示モジュール2730は、文字認識モジュール2710、文字属性決定モジュール2720と接続されている。表示モジュール2730は、文字認識モジュール2710より文字コード2715、文字属性決定モジュール2720より文字属性2725を受け付け、文字画像2735を表示する。つまり、表示モジュール2730は、文字認識モジュール2710から受け取った文字コード2715を液晶ディスプレイ等の表示装置に表示する場合に、文字属性2725に従った色で文字画像2735(文字コード2715をラスタライズしたもの)を表示する。
例として、文字コード2715が「7リエイト」であった場合、文字属性決定モジュール2720の処理によって、「7」が青色、「リエイト」が緑色で表示される。このため、目視検査によって、「7」が「ク」の誤りだと認識しやすくなる。
ステップS2902では、文字認識モジュール2710が、文字認識処理を行う。
ステップS2904では、文字属性決定モジュール2720が、文字が漢字であるか否かを判断し、漢字である場合はステップS2906へ進み、それ以外の場合はステップS2908へ進む。
ステップS2906では、文字属性決定モジュール2720が、赤色出力する文字属性を設定する。
ステップS2908では、文字属性決定モジュール2720が、文字が数字であるか否かを判断し、数字である場合はステップS2910へ進み、それ以外の場合はステップS2912へ進む。
ステップS2910では、文字属性決定モジュール2720が、青色出力する文字属性を設定する。
ステップS2912では、文字属性決定モジュール2720が、文字が英字であるか否かを判断し、英字である場合はステップS2914へ進み、それ以外の場合はステップS2916へ進む。
ステップS2914では、文字属性決定モジュール2720が、黄色出力する文字属性を設定する。
ステップS2916では、文字属性決定モジュール2720が、文字がカナであるか否かを判断し、カナである場合はステップS2918へ進み、それ以外の場合はステップS2920へ進む。
ステップS2918では、文字属性決定モジュール2720が、緑色出力する文字属性を設定する。
ステップS2920では、表示モジュール2730が、文字属性にしたがって文字コードを出力する。
図30(a)の例は、認識結果である文字コード2715をそのまま(文字属性をデフォルトの黒色で)表示させたものである。
図30(b)の例は、図27の例に示す情報処理装置による目視検査処理結果を示すものである。赤色で表示している文字に点線の下線を施し、青色で表示している文字に太線の下線を施し、黄色で表示している文字に実線の下線を施し、緑色で表示している文字に二重線の下線を施している。
具体的には、「年頃」、「普及」、「伴」、「様々」、「化」、「化」、「波」、「人々」、「生活」、「大」、「変」、「年」、「新」、「中心」、「更」、「加速」を赤色で表示し、「1995」、「1」、「2」、「12」、「0」を青色で表示し、「T」、「O」、「S」を黄色で表示し、「パーソナノレコンピューター」、「メディア」、「デジタノレ」、「レ」、「スマートフォン」を緑色で表示している。
図27の例に示す情報処理装置による目視検査処理では、以下のようになる。
(1)文字属性による色が多く、目視検査を行う場合に、注意が散漫になる。
(2)同じ文字種のなかで誤認識した文字は判別が困難となる。例えば、誤認識文字群3010、3020では、「ル」を「ノレ」と誤認識されているが色分けされておらず目視による判別は困難である。
(3)日本語以外の他国語が混在する場合、色数が増えて、さらに判別が困難となる。
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
紛らわしさ度対応テーブル300を作成する方法、つまり人間による目視検査において、紛らわしさ度を作成する方法について説明する。紛らわしさ度とは、文字の紛らわしさの度合いを示す値であり、表示装置に表示された場合に、見分けのつきにくさ、類似しているための紛れやすさ、ミスリーリング度合いを示すものである。
まず、認識対象の文字画像(活字、手書きの文字画像であってもよい)を用意し、1文字ずつ認識処理を行う。このとき、用意した全ての文字のなかでその文字コードに間違って認識した別の文字の数(m)(他の文字がその文字と誤認識した数欄340)と、正しく認識された文字数(N)(正しく認識された数欄330)の割合(m/N)(紛らわしさ度欄350)を、紛らわしさ度とする。
例えば、「し」は、「レ」や「L」にも似ているため、たまたま「レ」や「L」も「し」に誤認識してしまい、文字「し」が「し」として正しく10文字認識された場合は、紛らわしさ度を2/10とする。
具体的には、表示モジュール130は、文字コード115と文字属性125の対応表である文字属性対応テーブル400に基づいて表示する。図4は、文字属性対応テーブル400のデータ構造例を示す説明図である。文字属性対応テーブル400は、文字認識結果欄410、文字属性欄420を有している。文字認識結果欄410は、文字認識モジュール110の認識結果である文字コード115を記憶する。文字属性欄420は、その文字コード115に対応する文字属性を記憶する。例えば、文字色、フォントサイズ等である。また、文字属性欄420には、デフォルト値として、予め定められた表示色、形状等を記憶するようにしてもよい。文字認識モジュール110が文字コードだけを認識するのではなく、文字の色、大きさ等も認識する場合は、その認識結果の一部を文字属性として記憶してもよい。そして、文字属性決定モジュール120から文字属性125を受け取った場合は、その文字属性を文字属性125に変更すればよい。
ステップS202では、文字認識モジュール110が、文字認識処理を行う。
ステップS204では、文字属性決定モジュール120が、紛らわしさ度が閾値以上であるか否かを判断し、閾値以上である場合はステップS206へ進み、それ以外の場合はステップS208へ進む。
ステップS206では、文字属性決定モジュール120が、文字属性を対応する値に変更する。
ステップS208では、表示モジュール130が、文字属性にしたがって文字コードを出力する。
紛らわしさ度対応記憶モジュール122は、文字属性決定モジュール520と接続されている。
表示モジュール130は、文字認識モジュール510、文字属性決定モジュール520と接続されている。表示モジュール130は、文字認識モジュール510より文字コード115、文字属性決定モジュール520より文字属性125を受け付け、文字画像135を表示する。
ステップS602では、文字認識モジュール510が、文字認識処理を行う。
ステップS604では、文字属性決定モジュール520が、紛らわしさ度が閾値以上であるか否かを判断し、閾値以上である場合はステップS606へ進み、それ以外の場合はステップS608へ進む。
ステップS606では、文字属性決定モジュール520が、文字属性を対応する値に変更する。例えば、赤色に変更する。
ステップS608では、文字属性決定モジュール520が、確度が閾値未満であるか否かを判断し、閾値未満である場合はステップS610へ進み、それ以外の場合はステップS612へ進む。
ステップS610では、文字属性決定モジュール520が、文字属性を対応する値に変更する。例えば、青色に変更する。ステップS606とは異なる文字属性に変更してもよいし、同じ文字属性に変更してもよい。
ステップS612では、表示モジュール130が、文字属性にしたがって文字コードを出力する。
文字認識モジュール510は、文字属性決定モジュール720、表示モジュール130と接続されている。文字認識モジュール510は、文字画像105を受け付け、文字コード115を文字属性決定モジュール720、表示モジュール130に渡し、確度情報515を文字属性決定モジュール720に渡す。
v=f(確度情報、紛らわしさ度)=a×確度情報+b×文字紛らわしさ度+C ・・・ (式1)
この(式1)によって、平均的な確度情報515である文字でも、紛らわしさ度が高い場合は、文字属性が変更されやすく、逆に確度情報515が低めでも、紛らわしさ度が低い文字は、文字属性は変更されにくくなる。
紛らわしさ度対応記憶モジュール122は、文字属性決定モジュール720と接続されている。
表示モジュール130は、文字認識モジュール510、文字属性決定モジュール720と接続されている。表示モジュール130は、文字認識モジュール110より文字コード115、文字属性決定モジュール720より文字属性125を受け付け、文字画像135を表示する。
ステップS802では、文字認識モジュール510が、文字認識処理を行う。
ステップS804では、f(確度情報、紛らわしさ度)(式1)を算出する。
ステップS806では、文字属性決定モジュール720が、算出値が閾値未満であるか否かを判断し、閾値未満である場合はステップS808へ進み、それ以外の場合はステップS810へ進む。
ステップS808では、文字属性決定モジュール720が、文字属性を対応する値に変更する。
ステップS810では、表示モジュール130が、文字属性にしたがって文字コードを出力する。
文字認識モジュール510は、文字属性決定モジュール920、表示モジュール130と接続されている。文字認識モジュール510は、文字画像105を受け付け、文字コード115を文字属性決定モジュール920、表示モジュール130に渡し、確度情報515を文字属性決定モジュール920に渡す。
一般に文字の生起確率と、誤認識する確率は相関関係にないと考えられる。このため、どの文字もある程度同じ誤認識率だとすると、文字の生起確率が低い文字は、生起確率が高い文字より誤認識である確率が高い傾向にあるといえる。
例えば、「高」という文字より、「響」という文字は生起確率が低い。そのため、ある文字の認識結果が「高」という文字より、「響」という文字の方が誤認識である確率が高くなる傾向があると考えられる。
「生起確率と確度情報515に基づいて」とは、例えば、文字コード115に対応する生起確率と、文字認識モジュール510から受け付けた確度情報515から算出される値が閾値未満又は以下である場合は、対応する文字属性125(例えば青色等)を決定する。文字の生起確率と確度情報515を用いる算出式は、例えば、(式2)等がある。ただし、a、b、Cは、予め定められた定数である。前述の(式1)の定数とは異なる値であってもよい。
v=f(確度情報、生起確率)=a×確度情報+b×確度情報+C ・・・ (式2)
この(式2)によって、平均的な確度情報515である文字でも、生起確率が低い場合は、文字属性が変更されやすく、逆に確度情報515が低めでも、生起確率が高い文字は、文字属性は変更されにくくなる。
また、確度情報、生起確率の他に、前述の紛らわしさ度を含めてもよい。例えば、算出式は、(式3)等がある。ただし、a、b、c、Dは、予め定められた定数である。前述の(式1)、(式2)の定数とは異なる値であってもよい。
v=f(確度情報、生起確率、紛らわしさ度)=a×確度情報+b×確度情報+c×紛らわしさ度+D ・・・ (式3)
ステップS1002では、文字認識モジュール510が、文字認識処理を行う。
ステップS1004では、f(確度情報、生起確率)を算出する。
ステップS1006では、文字属性決定モジュール920が、算出値が閾値未満であるか否かを判断し、閾値未満である場合はステップS1008へ進み、それ以外の場合はステップS1010へ進む。
ステップS1008では、文字属性決定モジュール920が、文字属性を対応する値に変更する。
ステップS1010では、表示モジュール130が、文字属性にしたがって文字コードを出力する。
文字認識モジュール510は、文字属性決定モジュール1120、表示モジュール130と接続されている。文字認識モジュール510は、文字画像105を受け付け、文字コード115を文字属性決定モジュール1120、表示モジュール130に渡し、確度情報515を文字属性決定モジュール1120に渡す。
図13は例として挙げるが、これらは対象とする文字画像105に応じて、文脈辞書1115を構築すればよい。
また、文字属性決定モジュール1120は、文字画像105が含まれている文書の種類、又はその文書内における文字画像105が記載されていた位置等に応じて、文脈辞書1115の種類を選択してもよい。例えば、文書の種類が申込書等である場合は、文書辞書テーブルA1300内の「都道府県」、「市町村」を選択するようにしてもよい。また、文書内の住所の都道府県欄の位置から抽出した文字画像105である場合は、文書辞書テーブルA1300内の「都道府県」を選択するようにしてもよい。
表示モジュール130は、文字認識モジュール510、文字属性決定モジュール1120と接続されている。表示モジュール130は、文字認識モジュール110より文字コード115、文字属性決定モジュール1120より文字属性125を受け付け、文字画像135を表示する。
ステップS1202では、文字認識モジュール510が、文字認識処理を行う。
ステップS1204では、文字属性決定モジュール1120が文書辞書に合うか否かを判断し、合う場合はステップS1214へ進み、それ以外の場合はステップS1206へ進む。
ステップS1206では、紛らわしさ度が閾値以上であるか否かを判断し、閾値以上である場合はステップS1208へ進み、それ以外の場合はステップS1210へ進む。
ステップS1208では、文字属性決定モジュール1120が、文字属性を対応する値に変更する。
ステップS1210では、文字属性決定モジュール1120が、確度が閾値未満であるか否かを判断し、閾値未満である場合はステップS1212へ進み、それ以外の場合はステップS1214へ進む。
ステップS1212では、文字属性決定モジュール1120が、文字属性を対応する値に変更する。
ステップS1214では、表示モジュール130が、文字属性にしたがって文字コードを出力する。ステップS1204でYesの場合又はステップS1210でNoの場合は、文字属性は、デフォルト値である。
例として、図15の文書辞書テーブルB1500に示すようにドイツ語という種類の辞書に合致した場合は、ドイツ語用の判断処理を行う。ドイツ語にはウムラウトがあり、文書辞書テーブルB1500に例示の文字が文字コード115である可能性がある。これらの文字がある場合は、ドイツ語であると判断して、ドイツ語用の処理を行う。図15は、文書辞書テーブルB1500のデータ構造例を示す説明図である。文書辞書テーブルB1500は、文書辞書B欄1510、項目欄1520を有している。内容が異なること以外は、構造として文書辞書テーブルA1300と同等である。
一方で、文字コード115としてO(オー)を0(ゼロ)と区別するために、Oの上に−(バー)を付す文字属性とした場合は、ウムラウトと紛らわしい文字となるため、Oの上に−がついたO(オー)も文字属性が変更されるようにする。
このように文脈辞書によって、紛らわしい文字が変わる場合は処理を変更する。
ステップS1402では、文字認識モジュール510が、文字認識処理を行う。
ステップS1404では、文字属性決定モジュール1120が文書辞書に合うか否かを判断し、合う場合はステップS1414へ進み、それ以外の場合はステップS1406へ進む。
ステップS1406では、紛らわしさ度が閾値以上であるか否かを判断し、閾値以上である場合はステップS1408へ進み、それ以外の場合はステップS1410へ進む。
ステップS1408では、文字属性決定モジュール1120が、文字属性を対応する値に変更する。
ステップS1410では、文字属性決定モジュール1120が、確度が閾値未満であるか否かを判断し、閾値未満である場合はステップS1412へ進み、それ以外の場合はステップS1422へ進む。
ステップS1412では、文字属性決定モジュール1120が、文字属性を対応する値に変更する。
ステップS1414では、紛らわしさ度が閾値以上であるか否かを判断し、閾値以上である場合はステップS1416へ進み、それ以外の場合はステップS1418へ進む。
ステップS1416では、文字属性決定モジュール1120が、文字属性を対応する値に変更する。
ステップS1418では、文字属性決定モジュール1120が、確度が閾値未満であるか否かを判断し、閾値未満である場合はステップS1420へ進み、それ以外の場合はステップS1422へ進む。
ステップS1420では、文字属性決定モジュール1120が、文字属性を対応する値に変更する。
ステップS1422では、表示モジュール130が、文字属性にしたがって文字コードを出力する。
なお、ステップS1406とステップS1414、ステップS1410とステップS1418の処理における閾値は異なるようにしてもよいし、ステップS1408とステップS1416、ステップS1412とステップS1420の処理における変更する文字属性の値を異なるようにしてもよい。
また、この文字属性変更テーブル1600を、目視検査の担当者に提示するようにしてもよい。
ステップS1802では、紛らわしさ度で決まる文字属性を出力する。例えば、図17のグラフを用いて文字属性の濃淡値を決定してもよい。
図19は、文字属性を決定する処理例を示すフローチャートである。
ステップS1902では、確度で決まる文字属性を出力する。例えば、図17のグラフを用いて文字属性の濃淡値を決定してもよい。
図20は、文字属性を決定する処理例を示すフローチャートである。
ステップS2002では、算出値で決まる文字属性を出力する。例えば、図17のグラフを用いて文字属性の濃淡値を決定してもよい。
文字属性決定モジュールは、図21のフローチャート例で示すように、文字認識モジュール510から受け付けた文字コード列より決定される隣接文字生起確率(バイグラム)と確度情報から算出される値が閾値未満又は以下である場合は、対応する文字属性125(例えば青色等)を決定する。文字の紛らわしさ度と確度情報を用いる算出式は、例えば、(式4)等がある。ただし、a、b、Cは、予め定められた定数である。
V=f(確度情報、生起確率)=a×確度情報+b×隣接文字生起確率+C ・・・ (式4)
例えば、隣接する文字コード115の列が「1(数字)O(オー)3(数字)」の場合、隣接する文字生起確率(バイグラム)を「1O」で算出すると、「1(数字)0(数字)」に比べて低い値となる。このためO(オー)は誤認識である確率が高いため、対応する文字属性125(例えば青色等)を決定する。なお、比較対象である「1(数字)0(数字)」は、文字コード115として確度が2位の文字コード「0(数字)」を用いればよい。つまり、第1の文字コード115の次に第2の文字コード115がある隣接文字生起確率と、第1の文字コード115の次に確度が第2位の第2の文字コード115がある隣接文字生起確率とを比較して、前者が後者よりも低い又は以下である場合は、確度が第1位の文字コード115の文字属性を変更する。
ステップS2102では、文字認識モジュール510が、文字認識処理を行う。
ステップS2104では、隣接文字生起確率、確度情報に基づき算出する。
ステップS2106では、算出値が閾値未満であるか否かを判断し、閾値未満である場合はステップS2108へ進み、それ以外の場合はステップS2110へ進む。
ステップS2108では、文字属性を対応する値に変更する。
ステップS2110では、表示モジュール130が、文字属性にしたがって文字コードを出力する。
ステップS2202では、文字認識モジュール510が、文字認識処理を行う。
ステップS2204では、前方の隣接文字生起確率、確度情報に基づき算出する。
ステップS2206では、後方の隣接文字生起確率、確度情報に基づき算出する。
ステップS2208では、両者の積が閾値未満であるか否かを判断し、閾値未満である場合はステップS2110へ進み、それ以外の場合はステップS2212へ進む。
ステップS2210では、文字属性を対応する値に変更する。
ステップS1422では、表示モジュール130が、文字属性にしたがって文字コードを出力する。
また、前述の実施の形態の説明において、予め定められた値等との比較において、「以上」、「以下」、「より大きい」、「より小さい(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい(未満)」、「以上」、「以下」としてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
120…文字属性決定モジュール
122…紛らわしさ度対応記憶モジュール
130…表示モジュール
510…文字認識モジュール
520…文字属性決定モジュール
720…文字属性決定モジュール
920…文字属性決定モジュール
1110…文脈辞書記憶モジュール
1120…文字属性決定モジュール
2710…文字認識モジュール
2720…文字属性決定モジュール
2722…文字種・文字属性対応記憶モジュール
2730…表示モジュール
Claims (7)
- 文字画像を認識する文字認識手段と、
認識結果と該認識結果の目視検査における文字の紛らわしさを示す指標を対応させて記憶している記憶手段から、前記文字認識手段による認識結果に対応する指標を抽出し、該指標に基づいて、該認識結果の表示態様を示す文字属性を決定する決定手段と、
前記決定手段によって決定された文字属性にしたがって、前記文字認識手段による認識結果を表示する表示手段
を具備し、
前記決定手段は、さらに前記認識結果によって構成される文字列が予め定められた文字列に該当する場合は、該認識結果の文字属性を目立つ表示とはならない文字属性にし、該文字列には、認識の確からしさを示す確度が閾値より低い又は以下である文字を含む
ことを特徴とする情報処理装置。 - 前記文字認識手段は、認識の確からしさを示す確度を算出し、
前記決定手段は、前記指標と前記確度に基づいて、前記認識結果の文字属性を決定する
ことを特徴とする請求項1に記載の情報処理装置。 - 文字画像を認識し、認識の確からしさを示す確度を算出する文字認識手段と、
前記文字認識手段による認識結果の文字の生起確率と前記確度に基づいて、該認識結果の表示態様を示す文字属性を決定する決定手段と、
前記決定手段によって決定された文字属性にしたがって、前記文字認識手段による認識結果を表示する表示手段
を具備し、
前記決定手段は、さらに前記認識結果によって構成される文字列が予め定められた文字列に該当する場合は、該認識結果の文字属性を目立つ表示とはならない文字属性にし、該文字列には、確度が閾値より低い又は以下である文字を含む
ことを特徴とする情報処理装置。 - 前記決定手段は、さらに前記認識結果の文字の生起確率に基づいて、該認識結果の文字属性を決定する
ことを特徴とする請求項1又は2に記載の情報処理装置。 - 前記決定手段は、さらに前記認識結果の文字間の生起確率に基づいて、該認識結果の文字属性を決定する
ことを特徴とする請求項1から4のいずれか一項に記載の情報処理装置。 - コンピュータを、
文字画像を認識する文字認識手段と、
認識結果と該認識結果の目視検査における文字の紛らわしさを示す指標を対応させて記憶している記憶手段から、前記文字認識手段による認識結果に対応する指標を抽出し、該指標に基づいて、該認識結果の表示態様を示す文字属性を決定する決定手段と、
前記決定手段によって決定された文字属性にしたがって、前記文字認識手段による認識結果を表示する表示手段
として機能させ、
前記決定手段は、さらに前記認識結果によって構成される文字列が予め定められた文字列に該当する場合は、該認識結果の文字属性を目立つ表示とはならない文字属性にし、該文字列には、認識の確からしさを示す確度が閾値より低い又は以下である文字を含む
ことを特徴とする情報処理プログラム。 - コンピュータを、
文字画像を認識し、認識の確からしさを示す確度を算出する文字認識手段と、
前記文字認識手段による認識結果の文字の生起確率と前記確度に基づいて、該認識結果の表示態様を示す文字属性を決定する決定手段と、
前記決定手段によって決定された文字属性にしたがって、前記文字認識手段による認識結果を表示する表示手段
として機能させ、
前記決定手段は、さらに前記認識結果によって構成される文字列が予め定められた文字列に該当する場合は、該認識結果の文字属性を目立つ表示とはならない文字属性にし、該文字列には、確度が閾値より低い又は以下である文字を含む
ことを特徴とする情報処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012230620A JP6007720B2 (ja) | 2012-10-18 | 2012-10-18 | 情報処理装置及び情報処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012230620A JP6007720B2 (ja) | 2012-10-18 | 2012-10-18 | 情報処理装置及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014081867A JP2014081867A (ja) | 2014-05-08 |
JP6007720B2 true JP6007720B2 (ja) | 2016-10-12 |
Family
ID=50785984
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012230620A Expired - Fee Related JP6007720B2 (ja) | 2012-10-18 | 2012-10-18 | 情報処理装置及び情報処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6007720B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7263720B2 (ja) * | 2018-09-25 | 2023-04-25 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
JP7357030B2 (ja) * | 2021-08-25 | 2023-10-05 | ソフトバンク株式会社 | 通信端末、プログラム、及び表示方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2741575B2 (ja) * | 1994-09-22 | 1998-04-22 | 日本アイ・ビー・エム株式会社 | 文字認識文字補完方法及びコンピュータ・システム |
JP3232991B2 (ja) * | 1995-12-13 | 2001-11-26 | 株式会社日立製作所 | 文字読取り方法及び住所読取り方法 |
JPH1069517A (ja) * | 1996-08-27 | 1998-03-10 | Ricoh Co Ltd | 文字認識装置 |
JP2003108918A (ja) * | 2001-09-29 | 2003-04-11 | Toshiba Corp | 文字認識装置、データ入力装置、文字認識方法、及びデータ入力方法 |
JP3783053B2 (ja) * | 2001-12-26 | 2006-06-07 | 独立行政法人情報通信研究機構 | 負の例予測処理方法、処理プログラムおよび処理装置、負の例予測処理を用いた日本語表記誤り検出処理プログラムおよび処理装置、ならびに負の例予測処理を用いた外の関係検出処理プログラムおよび処理装置 |
JP4660504B2 (ja) * | 2007-05-22 | 2011-03-30 | 株式会社東芝 | テキスト処理装置及びプログラム |
-
2012
- 2012-10-18 JP JP2012230620A patent/JP6007720B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014081867A (ja) | 2014-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10853638B2 (en) | System and method for extracting structured information from image documents | |
JP5663866B2 (ja) | 情報処理装置及び情報処理プログラム | |
US8196030B1 (en) | System and method for comparing and reviewing documents | |
JP4181310B2 (ja) | 数式認識装置および数式認識方法 | |
JP4347677B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
JP2007304864A (ja) | 文字認識処理システムおよび文字認識処理プログラム | |
JP5316021B2 (ja) | 清書支援プログラム及び清書支援方法 | |
JP5862260B2 (ja) | 情報処理装置及び情報処理プログラム | |
KR20130057930A (ko) | 화상 처리 장치 및 화상 처리 방법 | |
EP4402654A1 (en) | Entry detection and recognition for custom forms | |
CN113673294B (zh) | 文献关键信息的提取方法、装置、计算机设备和存储介质 | |
JP6007720B2 (ja) | 情報処理装置及び情報処理プログラム | |
US11551461B2 (en) | Text classification | |
JP2009093305A (ja) | 帳票認識装置 | |
JP5601027B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4347675B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
JP5888222B2 (ja) | 情報処理装置及び情報処理プログラム | |
US20110033114A1 (en) | Image processing apparatus and computer readable medium | |
JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
JP6260350B2 (ja) | 画像処理装置及び画像処理プログラム | |
WO2017013719A1 (ja) | 文字認識装置、文字認識方法及び文字認識プログラム | |
JP2017010187A (ja) | 画像処理装置及び画像処理プログラム | |
JP6547301B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2009223391A (ja) | 画像処理装置及び画像処理プログラム | |
Kaur et al. | Adverse conditions and techniques for cross-lingual text recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150306 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160209 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160331 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160816 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160829 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6007720 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |