JP2014081867A - 情報処理装置及び情報処理プログラム - Google Patents

情報処理装置及び情報処理プログラム Download PDF

Info

Publication number
JP2014081867A
JP2014081867A JP2012230620A JP2012230620A JP2014081867A JP 2014081867 A JP2014081867 A JP 2014081867A JP 2012230620 A JP2012230620 A JP 2012230620A JP 2012230620 A JP2012230620 A JP 2012230620A JP 2014081867 A JP2014081867 A JP 2014081867A
Authority
JP
Japan
Prior art keywords
character
recognition
recognition result
module
character attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012230620A
Other languages
English (en)
Other versions
JP6007720B2 (ja
Inventor
Kazunori So
一憲 宋
Shunichi Kimura
俊一 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2012230620A priority Critical patent/JP6007720B2/ja
Publication of JP2014081867A publication Critical patent/JP2014081867A/ja
Application granted granted Critical
Publication of JP6007720B2 publication Critical patent/JP6007720B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】文字認識結果の目視検査にあたって、誤認識文字を見逃すことを防止するようにした情報処理装置を提供する。
【解決手段】情報処理装置の文字認識手段は、文字画像を認識し、決定手段は、認識結果と該認識結果の目視検査における文字の紛らわしさを示す指標を対応させて記憶している記憶手段から、前記文字認識手段による認識結果に対応する指標を抽出し、該指標に基づいて、該認識結果の表示態様を示す文字属性を決定し、表示手段は、前記決定手段によって決定された文字属性にしたがって、前記文字認識手段による認識結果を表示する。
【選択図】図1

Description

本発明は、情報処理装置及び情報処理プログラムに関する。
特許文献1には、適用業務への適合の柔軟性に富む文字認識修正画面を少ない工数で簡単に作成できるようにすることを課題とし、コンポーネント対応プログラム作成ツールが起動されると、ファイルに格納されている認識データ管理コンポーネントと、認識フィールド、候補文字ウィンドウ、帳票イメージウィンドウ、及びフィールドイメージウィンドウの各文字認識修正画面コンポーネントのアイコンM、F、C、S、Iがコンポーネントボックスに表示され、アイコンMをドラッグ&ドロップ操作してツール(の画面)上に認識データ管理コンポーネントを展開配置し、その後、アイコンF、C、S、Iをドラッグ&ドロップ操作して対応するコンポーネントを認識データ管理コンポーネント(のベース)上に配置すると、この配置されたコンポーネントはコンポーネントの管理下に置かれることが開示されている。
特許文献2には、字体が類似しているが文字種の異なる文字が誤って入力された場合に、誤入力の発見を容易に行い得るデータ入力システムを提供することを目的とし、入力されたキャラクタコードからなる文字列について走査を行って、文字種の変化を検出してゆき、この文字種の変化を特殊表示で表すようにしたことが開示されている。
特開2001−357351号公報 特開平03−156516号公報
本発明は、文字認識結果の目視検査にあたって、誤認識文字を見逃すことを防止するようにした情報処理装置及び情報処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、文字画像を認識する文字認識手段と、認識結果と該認識結果の目視検査における文字の紛らわしさを示す指標を対応させて記憶している記憶手段から、前記文字認識手段による認識結果に対応する指標を抽出し、該指標に基づいて、該認識結果の表示態様を示す文字属性を決定する決定手段と、前記決定手段によって決定された文字属性にしたがって、前記文字認識手段による認識結果を表示する表示手段を具備することを特徴とする情報処理装置である。
請求項2の発明は、前記文字認識手段は、認識の確からしさを示す確度を算出し、前記決定手段は、前記指標と前記確度に基づいて、前記認識結果の文字属性を決定することを特徴とする請求項1に記載の情報処理装置である。
請求項3の発明は、文字画像を認識し、認識の確からしさを示す確度を算出する文字認識手段と、前記文字認識手段による認識結果の文字の生起確率と前記確度に基づいて、該認識結果の表示態様を示す文字属性を決定する決定手段と、前記決定手段によって決定された文字属性にしたがって、前記文字認識手段による認識結果を表示する表示手段を具備することを特徴とする情報処理装置である。
請求項4の発明は、前記決定手段は、さらに前記認識結果の文字の生起確率に基づいて、該認識結果の文字属性を決定することを特徴とする請求項1又は2に記載の情報処理装置である。
請求項5の発明は、前記決定手段は、さらに前記認識結果によって構成される文字列が予め定められた文字列に該当する場合は、該認識結果の文字属性を目立つ表示とはならない文字属性にすることを特徴とする請求項1から4のいずれか一項に記載の情報処理装置である。
請求項6の発明は、前記決定手段は、さらに前記認識結果の文字間の生起確率に基づいて、該認識結果の文字属性を決定することを特徴とする請求項1から5のいずれか一項に記載の情報処理装置である。
請求項7の発明は、コンピュータを、文字画像を認識する文字認識手段と、認識結果と該認識結果の目視検査における文字の紛らわしさを示す指標を対応させて記憶している記憶手段から、前記文字認識手段による認識結果に対応する指標を抽出し、該指標に基づいて、該認識結果の表示態様を示す文字属性を決定する決定手段と、前記決定手段によって決定された文字属性にしたがって、前記文字認識手段による認識結果を表示する表示手段として機能させるための情報処理プログラムである。
請求項8の発明は、コンピュータを、文字画像を認識し、認識の確からしさを示す確度を算出する文字認識手段と、前記文字認識手段による認識結果の文字の生起確率と前記確度に基づいて、該認識結果の表示態様を示す文字属性を決定する決定手段と、前記決定手段によって決定された文字属性にしたがって、前記文字認識手段による認識結果を表示する表示手段として機能させるための情報処理プログラムである。
請求項1の情報処理装置によれば、文字認識結果の目視検査にあたって、誤認識文字を見逃すことを防止することができる。
請求項2の情報処理装置によれば、認識の確からしさに基づいて、認識結果の文字属性を決定することができる。
請求項3の情報処理装置によれば、文字認識結果の目視検査にあたって、誤認識文字を見逃すことを防止することができる。
請求項4の情報処理装置によれば、認識結果の文字の生起確率に基づいて、認識結果の文字属性を決定することができる。
請求項5の情報処理装置によれば、予め定められた文字列である認識結果は、文字属性を目立つ表示とはならない文字属性にすることができる。
請求項6の情報処理装置によれば、認識結果の文字間の生起確率に基づいて、認識結果の文字属性を決定することができる。
請求項7の情報処理プログラムによれば、文字認識結果の目視検査にあたって、誤認識文字を見逃すことを防止することができる。
請求項8の情報処理プログラムによれば、文字認識結果の目視検査にあたって、誤認識文字を見逃すことを防止することができる。
第1の実施の形態の構成例についての概念的なモジュール構成図である。 第1の実施の形態による処理例を示すフローチャートである。 紛らわしさ度対応テーブルのデータ構造例を示す説明図である。 文字属性対応テーブルのデータ構造例を示す説明図である。 第2の実施の形態の構成例についての概念的なモジュール構成図である。 第2の実施の形態による処理例を示すフローチャートである。 第3の実施の形態の構成例についての概念的なモジュール構成図である。 第3の実施の形態による処理例を示すフローチャートである。 第4の実施の形態の構成例についての概念的なモジュール構成図である。 第4の実施の形態による処理例を示すフローチャートである。 第5の実施の形態の構成例についての概念的なモジュール構成図である。 第5の実施の形態による処理例を示すフローチャートである。 文書辞書テーブルAのデータ構造例を示す説明図である。 第5の実施の形態による処理例を示すフローチャートである。 文書辞書テーブルBのデータ構造例を示す説明図である。 文字属性変更テーブルのデータ構造例を示す説明図である。 文字属性を決定する処理例を示す説明図である。 文字属性を決定する処理例を示すフローチャートである。 文字属性を決定する処理例を示すフローチャートである。 文字属性を決定する処理例を示すフローチャートである。 第6の実施の形態による処理例を示すフローチャートである。 第6の実施の形態による処理例を示すフローチャートである。 本実施の形態による処理例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。 文字認識結果の目視検査例を示す説明図である。 文字認識結果の目視検査のための処理例を示す説明図である。 一般的な目視検査処理を行う装置の構成例についての概念的なモジュール構成図である。 文字種・文字属性対応テーブルのデータ構造例を示す説明図である。 一般的な目視検査処理例を示すフローチャートである。 一般的な目視検査処理による処理例を示す説明図である。
まず、本実施の形態を説明する前に、その前提又は本実施の形態を利用する情報処理装置について、図25〜30を用いて説明する。なお、この説明は、本実施の形態の理解を容易にすることを目的とするものである。
紙文書の電子化において、一般的に文字認識技術(OCR(Optical Character Reader:光学式文字読み取り装置)を含む)を利用して、文字画像を認識して、認識結果である文字コードを紙文書の電子文書(画像)に添付する。これによって、その電子文書に対して文字検索できるようになる。
しかし、一般的に文字認識技術の活字認識率は、紙文書の活字の状況や、スキャン解像度、圧縮率などの状況によっては誤認識が発生する。特に、似たような文字(数字の「1」とアルファベットの小文字「i,l」、全角「A」と半角「A」など)の誤認識が多くなり、手書き文字を対象とした場合は、さらに多くなる可能性が高い。
このため、文字認識技術の誤認識をなくすためには、認識結果に対して目視による全数検査を行っている。しかし、この検査工程においても、人間の誤り率がゼロにできないことから、異なる人による検査を二重以上に行うことで、目視での誤認識率を下げようとしている。
図25は、文字認識結果の目視検査例を示す説明図である。図25(a)は対象画像2510の例を示している。対象画像2510から文字領域だけを抽出(写真等の領域を除去)し、その文字領域内の文字画像を認識する。図25(b)は認識結果2520の例を示している。この認識結果内には誤認識の結果も含まれている。図25(c)は修正結果2530の例を示している。つまり、全文字を人手による目視検査を行い、誤認識の「i」を「1」に、「o」を「O」に、「あ」を「お」に、誤認識していることを検知し、エディタを用いて修正し、修正結果2530を作成している。
図26は、文字認識結果の目視検査のための処理例を示す説明図である。
人手による目視検査は、図26の例に示すようにスキャンされた文書画像(図26(a))と、文字認識技術で認識した文字コードをラスタライズした文書画像(図26(b))を一対に表示し、その表示を比較しながら、文字認識技術が間違った文字(図26(c)の例では下線が引かれた文字)を発見して修正していく、という方式が一般的である。
これに対して、文字認識技術が間違った文字は文字形状が似通っている可能性が高いため、目視検査担当者も文字認識技術の誤認識を見逃す可能性を否定できないことから、漢字、英字、数字、カナなどの文字種によって色をつける技術がある。例えば、特許文献2に記載の技術である。
しかし、この技術では、多くの色文字が発生し、かえって目視検査担当者の注意が散漫になる可能性がある。
図27は、一般的な目視検査処理を行う装置の構成例についての概念的なモジュール構成図である。この情報処理装置は、文字認識モジュール2710、文字属性決定モジュール2720、文字種・文字属性対応記憶モジュール2722、表示モジュール2730を有している。
文字認識モジュール2710は、文字属性決定モジュール2720、表示モジュール2730と接続されている。文字認識モジュール2710は、文字画像2705を受け付け、文字画像2705を認識し、認識結果である文字コード2715を文字属性決定モジュール2720、表示モジュール2730に渡す。
文字属性決定モジュール2720は、文字認識モジュール2710、文字種・文字属性対応記憶モジュール2722、表示モジュール2730と接続されている。文字属性決定モジュール2720は、文字認識モジュール2710より文字コード2715を受け付け、文字種・文字属性対応記憶モジュール2722内の文字種・文字属性対応テーブル2800を参照して、文字コード2715に対応する文字属性2725を抽出し、その文字属性2725を表示モジュール2730に渡す。
文字種・文字属性対応記憶モジュール2722は、文字属性決定モジュール2720と接続されている。文字種・文字属性対応記憶モジュール2722は、文字種・文字属性対応テーブル2800を記憶している。図28は、文字種・文字属性対応テーブル2800のデータ構造例を示す説明図である。文字種・文字属性対応テーブル2800は、文字種欄2810、文字属性欄2820を有している。文字種欄2810は、文字種を記憶している。具体的には、その文字種に該当する文字コードの範囲を記憶している。文字属性欄2820は、その文字種に対応する文字属性を記憶している。ここで、文字属性とは、対応する文字コードを表示する場合の属性であり、ここでは文字の色を示している。つまり、ここでは、認識結果の文字コード2715が漢字である場合は赤色で表示されるように文字属性2725として赤色を設定し、文字コード2715が数字である場合は青色で表示されるように文字属性2725として青色を設定し、文字コード2715が英字である場合は黄色で表示されるように文字属性2725として黄色を設定し、文字コード2715がカタカナである場合は緑色で表示されるように文字属性2725として緑色を設定する。
表示モジュール2730は、文字認識モジュール2710、文字属性決定モジュール2720と接続されている。表示モジュール2730は、文字認識モジュール2710より文字コード2715、文字属性決定モジュール2720より文字属性2725を受け付け、文字画像2735を表示する。つまり、表示モジュール2730は、文字認識モジュール2710から受け取った文字コード2715を液晶ディスプレイ等の表示装置に表示する場合に、文字属性2725に従った色で文字画像2735(文字コード2715をラスタライズしたもの)を表示する。
例として、文字コード2715が「7リエイト」であった場合、文字属性決定モジュール2720の処理によって、「7」が青色、「リエイト」が緑色で表示される。このため、目視検査によって、「7」が「ク」の誤りだと認識しやすくなる。
図29は、図27の例に示す情報処理装置による目視検査処理例を示すフローチャートである。
ステップS2902では、文字認識モジュール2710が、文字認識処理を行う。
ステップS2904では、文字属性決定モジュール2720が、文字が漢字であるか否かを判断し、漢字である場合はステップS2906へ進み、それ以外の場合はステップS2908へ進む。
ステップS2906では、文字属性決定モジュール2720が、赤色出力する文字属性を設定する。
ステップS2908では、文字属性決定モジュール2720が、文字が数字であるか否かを判断し、数字である場合はステップS2910へ進み、それ以外の場合はステップS2912へ進む。
ステップS2910では、文字属性決定モジュール2720が、青色出力する文字属性を設定する。
ステップS2912では、文字属性決定モジュール2720が、文字が英字であるか否かを判断し、英字である場合はステップS2914へ進み、それ以外の場合はステップS2916へ進む。
ステップS2914では、文字属性決定モジュール2720が、黄色出力する文字属性を設定する。
ステップS2916では、文字属性決定モジュール2720が、文字がカナであるか否かを判断し、カナである場合はステップS2918へ進み、それ以外の場合はステップS2920へ進む。
ステップS2918では、文字属性決定モジュール2720が、緑色出力する文字属性を設定する。
ステップS2920では、表示モジュール2730が、文字属性にしたがって文字コードを出力する。
図30は、一般的な目視検査処理による処理例を示す説明図である。
図30(a)の例は、認識結果である文字コード2715をそのまま(文字属性をデフォルトの黒色で)表示させたものである。
図30(b)の例は、図27の例に示す情報処理装置による目視検査処理結果を示すものである。赤色で表示している文字に点線の下線を施し、青色で表示している文字に太線の下線を施し、黄色で表示している文字に実線の下線を施し、緑色で表示している文字に二重線の下線を施している。
具体的には、「年頃」、「普及」、「伴」、「様々」、「化」、「化」、「波」、「人々」、「生活」、「大」、「変」、「年」、「新」、「中心」、「更」、「加速」を赤色で表示し、「1995」、「1」、「2」、「12」、「0」を青色で表示し、「T」、「O」、「S」を黄色で表示し、「パーソナノレコンピューター」、「メディア」、「デジタノレ」、「レ」、「スマートフォン」を緑色で表示している。
図27の例に示す情報処理装置による目視検査処理では、以下のようになる。
(1)文字属性による色が多く、目視検査を行う場合に、注意が散漫になる。
(2)同じ文字種のなかで誤認識した文字は判別が困難となる。例えば、誤認識文字群3010、3020では、「ル」を「ノレ」と誤認識されているが色分けされておらず目視による判別は困難である。
(3)日本語以外の他国語が混在する場合、色数が増えて、さらに判別が困難となる。
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
本実施の形態である情報処理装置は、文字認識結果の目視検査をするためのものであって、図1の例に示すように、文字認識モジュール110、文字属性決定モジュール120、紛らわしさ度対応記憶モジュール122、表示モジュール130を有している。
文字認識モジュール110は、文字属性決定モジュール120、表示モジュール130と接続されている。文字認識モジュール110は、文字画像105を受け付け、その文字画像105を認識し、認識結果である文字コード115を文字属性決定モジュール120、表示モジュール130に渡す。文字認識技術は、従来からの技術を用いてもよい。また、受け付ける文字画像105は、画像から切り出されたものであり、文字切り出し技術を用いればよい。
紛らわしさ度対応記憶モジュール122は、文字属性決定モジュール120と接続されている。紛らわしさ度対応記憶モジュール122は、文字コード115とその文字コード115の目視検査における文字の紛らわしさを示す指標(以下、紛らわしさ度ともいう)を対応させて記憶している。例えば、紛らわしさ度対応テーブル300を記憶している。図3は、紛らわしさ度対応テーブル300のデータ構造例を示す説明図である。紛らわしさ度対応テーブル300は、文字欄310、文字コード欄320、正しく認識された数欄330、他の文字がその文字と誤認識した数欄340、紛らわしさ度欄350を有している。なお、紛らわしさ度対応テーブル300は、文字コード欄320、紛らわしさ度欄350によって構成されていてもよい。
紛らわしさ度対応テーブル300を作成する方法、つまり人間による目視検査において、紛らわしさ度を作成する方法について説明する。紛らわしさ度とは、文字の紛らわしさの度合いを示す値であり、表示装置に表示された場合に、見分けのつきにくさ、類似しているための紛れやすさ、ミスリーリング度合いを示すものである。
まず、認識対象の文字画像(活字、手書きの文字画像であってもよい)を用意し、1文字ずつ認識処理を行う。このとき、用意した全ての文字のなかでその文字コードに間違って認識した別の文字の数(m)(他の文字がその文字と誤認識した数欄340)と、正しく認識された文字数(N)(正しく認識された数欄330)の割合(m/N)(紛らわしさ度欄350)を、紛らわしさ度とする。
例えば、「し」は、「レ」や「L」にも似ているため、たまたま「レ」や「L」も「し」に誤認識してしまい、文字「し」が「し」として正しく10文字認識された場合は、紛らわしさ度を2/10とする。
文字属性決定モジュール120は、文字認識モジュール110、紛らわしさ度対応記憶モジュール122、表示モジュール130と接続されている。文字属性決定モジュール120は、文字認識モジュール110より文字コード115を受け付け、文字属性125を表示モジュール130に渡す。文字属性決定モジュール120は、紛らわしさ度対応記憶モジュール122から、文字認識モジュール110による認識結果である文字コード115に対応する紛らわしさ度を抽出し、その紛らわしさ度に基づいて、文字コード115の表示態様を示す文字属性を決定する。文字属性としての表示態様は、色のみでなく、形状(書体、斜体/太字等のスタイル、フォントサイズ、下線付き等)等を含む。「紛らわしさ度に基づいて」とは、例えば、紛らわしさ度と予め定められた閾値と比較して、閾値より大きい又は以上である場合は、文字属性125を決定する処理をいう。また、標準値(デフォルト値:黒)から赤色等に変更する処理であってもよい。
表示モジュール130は、文字認識モジュール110、文字属性決定モジュール120と接続されている。表示モジュール130は、文字認識モジュール110より文字コード115、文字属性決定モジュール120より文字属性125を受け付け、文字画像135を表示する。表示モジュール130は、文字属性決定モジュール120によって決定された文字属性125にしたがって、文字認識モジュール110による認識結果である文字コード115を表示装置に表示する。もちろんのことながら、ここでの表示は、目視検査を行うための表示である。
具体的には、表示モジュール130は、文字コード115と文字属性125の対応表である文字属性対応テーブル400に基づいて表示する。図4は、文字属性対応テーブル400のデータ構造例を示す説明図である。文字属性対応テーブル400は、文字認識結果欄410、文字属性欄420を有している。文字認識結果欄410は、文字認識モジュール110の認識結果である文字コード115を記憶する。文字属性欄420は、その文字コード115に対応する文字属性を記憶する。例えば、文字色、フォントサイズ等である。また、文字属性欄420には、デフォルト値として、予め定められた表示色、形状等を記憶するようにしてもよい。文字認識モジュール110が文字コードだけを認識するのではなく、文字の色、大きさ等も認識する場合は、その認識結果の一部を文字属性として記憶してもよい。そして、文字属性決定モジュール120から文字属性125を受け取った場合は、その文字属性を文字属性125に変更すればよい。
図2は、第1の実施の形態による処理例を示すフローチャートである。
ステップS202では、文字認識モジュール110が、文字認識処理を行う。
ステップS204では、文字属性決定モジュール120が、紛らわしさ度が閾値以上であるか否かを判断し、閾値以上である場合はステップS206へ進み、それ以外の場合はステップS208へ進む。
ステップS206では、文字属性決定モジュール120が、文字属性を対応する値に変更する。
ステップS208では、表示モジュール130が、文字属性にしたがって文字コードを出力する。
図5は、第2の実施の形態の構成例についての概念的なモジュール構成図である。なお、前述の実施の形態と同種の部位には同一符号を付し重複した説明を省略する(以下、同様)。第2の実施の形態は、図5の例に示すように、文字認識モジュール510、文字属性決定モジュール520、紛らわしさ度対応記憶モジュール122、表示モジュール130を有している。
文字認識モジュール510は、文字属性決定モジュール520、表示モジュール130と接続されている。文字認識モジュール510は、文字画像105を受け付け、文字画像105を認識し、文字コード115を文字属性決定モジュール520、表示モジュール130に渡し、その認識の際に認識の確からしさを示す確度である確度情報515を算出し、確度情報515を文字属性決定モジュール520に渡す。確度情報515は、例えば、認識結果の辞書パターンと文字画像105との特徴空間における距離の逆数を正規化すること等によって算出する。
文字属性決定モジュール520は、文字認識モジュール510、紛らわしさ度対応記憶モジュール122、表示モジュール130と接続されている。文字属性決定モジュール520は、文字認識モジュール510より文字コード115、確度情報515を受け付け、文字属性125を表示モジュール130に渡す。文字属性決定モジュール520は、紛らわしさ度と確度情報515に基づいて、文字コード115の文字属性を決定する。例えば、文字属性決定モジュール120と同等の判断処理である紛らわしさ度による判断を行った後に、確度による判断を行うようにしてもよい。つまり、紛らわしさ度を用いて文字属性を変更すると判断したもの以外に対して、確度による判断を行う。確度による判断とは、例えば、確度と予め定められた閾値と比較して、閾値未満又は以下である場合は、文字属性125を決定する処理をいう。また、文字属性125を標準値から変更する処理であってもよい。また、逆に、確度による判断を行った後に、紛らわしさ度による判断を行うようにしてもよい。
紛らわしさ度対応記憶モジュール122は、文字属性決定モジュール520と接続されている。
表示モジュール130は、文字認識モジュール510、文字属性決定モジュール520と接続されている。表示モジュール130は、文字認識モジュール510より文字コード115、文字属性決定モジュール520より文字属性125を受け付け、文字画像135を表示する。
図6は、第2の実施の形態による処理例を示すフローチャートである。
ステップS602では、文字認識モジュール510が、文字認識処理を行う。
ステップS604では、文字属性決定モジュール520が、紛らわしさ度が閾値以上であるか否かを判断し、閾値以上である場合はステップS606へ進み、それ以外の場合はステップS608へ進む。
ステップS606では、文字属性決定モジュール520が、文字属性を対応する値に変更する。例えば、赤色に変更する。
ステップS608では、文字属性決定モジュール520が、確度が閾値未満であるか否かを判断し、閾値未満である場合はステップS610へ進み、それ以外の場合はステップS612へ進む。
ステップS610では、文字属性決定モジュール520が、文字属性を対応する値に変更する。例えば、青色に変更する。ステップS606とは異なる文字属性に変更してもよいし、同じ文字属性に変更してもよい。
ステップS612では、表示モジュール130が、文字属性にしたがって文字コードを出力する。
図7は、第3の実施の形態の構成例についての概念的なモジュール構成図である。第3の実施の形態は、図7の例に示すように、文字認識モジュール510、文字属性決定モジュール720、紛らわしさ度対応記憶モジュール122、表示モジュール130を有している。
文字認識モジュール510は、文字属性決定モジュール720、表示モジュール130と接続されている。文字認識モジュール510は、文字画像105を受け付け、文字コード115を文字属性決定モジュール720、表示モジュール130に渡し、確度情報515を文字属性決定モジュール720に渡す。
文字属性決定モジュール720は、文字認識モジュール510、紛らわしさ度対応記憶モジュール122、表示モジュール130と接続されている。文字認識モジュール510より文字コード115、確度情報515を受け付け、文字属性125を表示モジュール130に渡す。文字属性決定モジュール720は、紛らわしさ度と確度情報515に基づいて、文字コード115の文字属性を決定する。例えば、文字コード115に対応する紛らわしさ度と、文字認識モジュール510から受け付けた確度情報515から算出される値が閾値未満又は以下である場合は、対応する文字属性125(例えば青色等)を決定する。文字の紛らわしさ度と確度情報515を用いる算出式は、例えば、(式1)等がある。ただし、a、b、Cは、予め定められた定数である。
v=f(確度情報、紛らわしさ度)=a×確度情報+b×文字紛らわしさ度+C ・・・ (式1)
この(式1)によって、平均的な確度情報515である文字でも、紛らわしさ度が高い場合は、文字属性が変更されやすく、逆に確度情報515が低めでも、紛らわしさ度が低い文字は、文字属性は変更されにくくなる。
紛らわしさ度対応記憶モジュール122は、文字属性決定モジュール720と接続されている。
表示モジュール130は、文字認識モジュール510、文字属性決定モジュール720と接続されている。表示モジュール130は、文字認識モジュール110より文字コード115、文字属性決定モジュール720より文字属性125を受け付け、文字画像135を表示する。
図8は、第3の実施の形態による処理例を示すフローチャートである。
ステップS802では、文字認識モジュール510が、文字認識処理を行う。
ステップS804では、f(確度情報、紛らわしさ度)(式1)を算出する。
ステップS806では、文字属性決定モジュール720が、算出値が閾値未満であるか否かを判断し、閾値未満である場合はステップS808へ進み、それ以外の場合はステップS810へ進む。
ステップS808では、文字属性決定モジュール720が、文字属性を対応する値に変更する。
ステップS810では、表示モジュール130が、文字属性にしたがって文字コードを出力する。
図9は、第4の実施の形態の構成例についての概念的なモジュール構成図である。第4の実施の形態は、図9の例に示すように、文字認識モジュール510、文字属性決定モジュール920、表示モジュール130を有している。前述の第3の実施の形態における紛らわしさ度の代わりに生起確率を用いるようにしたものである。
文字認識モジュール510は、文字属性決定モジュール920、表示モジュール130と接続されている。文字認識モジュール510は、文字画像105を受け付け、文字コード115を文字属性決定モジュール920、表示モジュール130に渡し、確度情報515を文字属性決定モジュール920に渡す。
文字属性決定モジュール920は、文字認識モジュール510、表示モジュール130と接続されている。文字属性決定モジュール920は、文字認識モジュール510より文字コード115、確度情報515を受け付け、文字属性125を表示モジュール130に渡す。文字属性決定モジュール920は、文字認識モジュール510による認識結果の文字コード115の生起確率と確度情報515に基づいて、文字コード115の表示態様を示す文字属性を決定する。ここでの生起確率(ユニグラム)は、その言語においてその文字が使用される確率であって、予め定められた値である。
一般に文字の生起確率と、誤認識する確率は相関関係にないと考えられる。このため、どの文字もある程度同じ誤認識率だとすると、文字の生起確率が低い文字は、生起確率が高い文字より誤認識である確率が高い傾向にあるといえる。
例えば、「高」という文字より、「響」という文字は生起確率が低い。そのため、ある文字の認識結果が「高」という文字より、「響」という文字の方が誤認識である確率が高くなる傾向があると考えられる。
「生起確率と確度情報515に基づいて」とは、例えば、文字コード115に対応する生起確率と、文字認識モジュール510から受け付けた確度情報515から算出される値が閾値未満又は以下である場合は、対応する文字属性125(例えば青色等)を決定する。文字の生起確率と確度情報515を用いる算出式は、例えば、(式2)等がある。ただし、a、b、Cは、予め定められた定数である。前述の(式1)の定数とは異なる値であってもよい。
v=f(確度情報、生起確率)=a×確度情報+b×確度情報+C ・・・ (式2)
この(式2)によって、平均的な確度情報515である文字でも、生起確率が低い場合は、文字属性が変更されやすく、逆に確度情報515が低めでも、生起確率が高い文字は、文字属性は変更されにくくなる。
また、確度情報、生起確率の他に、前述の紛らわしさ度を含めてもよい。例えば、算出式は、(式3)等がある。ただし、a、b、c、Dは、予め定められた定数である。前述の(式1)、(式2)の定数とは異なる値であってもよい。
v=f(確度情報、生起確率、紛らわしさ度)=a×確度情報+b×確度情報+c×紛らわしさ度+D ・・・ (式3)
表示モジュール130は、文字認識モジュール510、文字属性決定モジュール920と接続されている。表示モジュール130は、文字認識モジュール110より文字コード115、文字属性決定モジュール920より文字属性125を受け付け、文字画像135を表示する。
図10は、第4の実施の形態による処理例を示すフローチャートである。
ステップS1002では、文字認識モジュール510が、文字認識処理を行う。
ステップS1004では、f(確度情報、生起確率)を算出する。
ステップS1006では、文字属性決定モジュール920が、算出値が閾値未満であるか否かを判断し、閾値未満である場合はステップS1008へ進み、それ以外の場合はステップS1010へ進む。
ステップS1008では、文字属性決定モジュール920が、文字属性を対応する値に変更する。
ステップS1010では、表示モジュール130が、文字属性にしたがって文字コードを出力する。
図11は、第5の実施の形態の構成例についての概念的なモジュール構成図である。第5の実施の形態は、図11の例に示すように、文字認識モジュール510、文脈辞書記憶モジュール1110、文字属性決定モジュール1120、紛らわしさ度対応記憶モジュール122、表示モジュール130を有している。
文字認識モジュール510は、文字属性決定モジュール1120、表示モジュール130と接続されている。文字認識モジュール510は、文字画像105を受け付け、文字コード115を文字属性決定モジュール1120、表示モジュール130に渡し、確度情報515を文字属性決定モジュール1120に渡す。
文字属性決定モジュール1120は、文字認識モジュール510、紛らわしさ度対応記憶モジュール122、文脈辞書記憶モジュール1110、表示モジュール130と接続されている。文字属性決定モジュール1120は、文字認識モジュール510より文字コード115、確度情報515を受け付け、文脈辞書記憶モジュール1110より文脈辞書1115を受け付け、文字属性125を表示モジュール130に渡す。文字属性決定モジュール1120は、前述の文字属性決定モジュール120、520、720、920の処理の他に、さらに文字コード115によって構成される文字列が予め定められた文字列に該当する場合は、その文字コード115の文字属性125を目立つ表示とはならない文字属性にする。「予め定められた文字列」とは、文脈辞書記憶モジュール1110から受け付けた文脈辞書1115内の文字列である。「該当する場合」とは、文字コード115の文字列と一致する文字列が文脈辞書1115内にあることをいう。また、「目立つ表示とはならない文字属性」とは、目視検査において目立つ表示とはならない文字属性をいう。具体的には、黒色等のデフォルト値である。また、デフォルト値が設定されている場合は、その文字属性を変更しない。
文脈辞書記憶モジュール1110は、文字属性決定モジュール1120と接続されている。文脈辞書記憶モジュール1110は、文脈辞書1115を文字属性決定モジュール1120に渡す。ここで文脈辞書1115は、文書辞書テーブルA1300内の1行のデータ又は複数行のデータ(文書辞書テーブルA1300全体を含めてもよい)である。図13は、文書辞書テーブルA1300のデータ構造例を示す説明図である。文書辞書テーブルA1300は、文書辞書A欄1310、項目欄1320を有している。文書辞書A欄1310は、文脈辞書の種類を記憶している。項目欄1320は、その文脈辞書に含まれている文字列を記憶している。これらの文字列は、文脈辞書の種類に応じて予め定められた文字列である。例えば、文脈辞書の種類が「都道府県」であれば、各都道府県名が記憶されている。文字コード115の文字列がこれらの文字列であった場合は、誤認識の可能性はきわめて低いため、文字認識モジュール510からの確度情報515が低くても文字属性は出力されない。例えば、「川崎市」の「川」が手書き文字として「lll」のように書かれていて、3つの「1」や「l」として確度が高い認識となってしまい、「川」の文字の確度が低いとしても、「川崎市」という文字列で、文脈辞書A内の文字列に合致するため、確度が閾値よりも低い場合であっても文字属性は出力されない。
図13は例として挙げるが、これらは対象とする文字画像105に応じて、文脈辞書1115を構築すればよい。
また、文字属性決定モジュール1120は、文字画像105が含まれている文書の種類、又はその文書内における文字画像105が記載されていた位置等に応じて、文脈辞書1115の種類を選択してもよい。例えば、文書の種類が申込書等である場合は、文書辞書テーブルA1300内の「都道府県」、「市町村」を選択するようにしてもよい。また、文書内の住所の都道府県欄の位置から抽出した文字画像105である場合は、文書辞書テーブルA1300内の「都道府県」を選択するようにしてもよい。
紛らわしさ度対応記憶モジュール122は、文字属性決定モジュール1120と接続されている。
表示モジュール130は、文字認識モジュール510、文字属性決定モジュール1120と接続されている。表示モジュール130は、文字認識モジュール110より文字コード115、文字属性決定モジュール1120より文字属性125を受け付け、文字画像135を表示する。
図12は、第5の実施の形態による処理例を示すフローチャートである。
ステップS1202では、文字認識モジュール510が、文字認識処理を行う。
ステップS1204では、文字属性決定モジュール1120が文書辞書に合うか否かを判断し、合う場合はステップS1214へ進み、それ以外の場合はステップS1206へ進む。
ステップS1206では、紛らわしさ度が閾値以上であるか否かを判断し、閾値以上である場合はステップS1208へ進み、それ以外の場合はステップS1210へ進む。
ステップS1208では、文字属性決定モジュール1120が、文字属性を対応する値に変更する。
ステップS1210では、文字属性決定モジュール1120が、確度が閾値未満であるか否かを判断し、閾値未満である場合はステップS1212へ進み、それ以外の場合はステップS1214へ進む。
ステップS1212では、文字属性決定モジュール1120が、文字属性を対応する値に変更する。
ステップS1214では、表示モジュール130が、文字属性にしたがって文字コードを出力する。ステップS1204でYesの場合又はステップS1210でNoの場合は、文字属性は、デフォルト値である。
また、第5の実施の形態は、一致する文脈辞書に応じて、紛らわしさ度を決定するためのテーブル(例えば、紛らわしさ度対応テーブル300)を変更するようにしてもよいし、確度、生起確率を用いた判断における閾値を変更するようにしてもよいし、変更する文字属性を変更してもよい。文字属性決定モジュール1120は、図14のフローチャート例で示すように、文字認識モジュール510からの文字コード115が合致する文脈辞書に応じて処理を切り替える。
例として、図15の文書辞書テーブルB1500に示すようにドイツ語という種類の辞書に合致した場合は、ドイツ語用の判断処理を行う。ドイツ語にはウムラウトがあり、文書辞書テーブルB1500に例示の文字が文字コード115である可能性がある。これらの文字がある場合は、ドイツ語であると判断して、ドイツ語用の処理を行う。図15は、文書辞書テーブルB1500のデータ構造例を示す説明図である。文書辞書テーブルB1500は、文書辞書B欄1510、項目欄1520を有している。内容が異なること以外は、構造として文書辞書テーブルA1300と同等である。
一方で、文字コード115としてO(オー)を0(ゼロ)と区別するために、Oの上に−(バー)を付す文字属性とした場合は、ウムラウトと紛らわしい文字となるため、Oの上に−がついたO(オー)も文字属性が変更されるようにする。
このように文脈辞書によって、紛らわしい文字が変わる場合は処理を変更する。
図14は、第5の実施の形態による処理例を示すフローチャートである。
ステップS1402では、文字認識モジュール510が、文字認識処理を行う。
ステップS1404では、文字属性決定モジュール1120が文書辞書に合うか否かを判断し、合う場合はステップS1414へ進み、それ以外の場合はステップS1406へ進む。
ステップS1406では、紛らわしさ度が閾値以上であるか否かを判断し、閾値以上である場合はステップS1408へ進み、それ以外の場合はステップS1410へ進む。
ステップS1408では、文字属性決定モジュール1120が、文字属性を対応する値に変更する。
ステップS1410では、文字属性決定モジュール1120が、確度が閾値未満であるか否かを判断し、閾値未満である場合はステップS1412へ進み、それ以外の場合はステップS1422へ進む。
ステップS1412では、文字属性決定モジュール1120が、文字属性を対応する値に変更する。
ステップS1414では、紛らわしさ度が閾値以上であるか否かを判断し、閾値以上である場合はステップS1416へ進み、それ以外の場合はステップS1418へ進む。
ステップS1416では、文字属性決定モジュール1120が、文字属性を対応する値に変更する。
ステップS1418では、文字属性決定モジュール1120が、確度が閾値未満であるか否かを判断し、閾値未満である場合はステップS1420へ進み、それ以外の場合はステップS1422へ進む。
ステップS1420では、文字属性決定モジュール1120が、文字属性を対応する値に変更する。
ステップS1422では、表示モジュール130が、文字属性にしたがって文字コードを出力する。
なお、ステップS1406とステップS1414、ステップS1410とステップS1418の処理における閾値は異なるようにしてもよいし、ステップS1408とステップS1416、ステップS1412とステップS1420の処理における変更する文字属性の値を異なるようにしてもよい。
前述の実施の形態においては、文字色を変更する例を主に示したが、文字属性変更テーブル1600にしたがって変更するようにしてもよい。図16は、文字属性変更テーブル1600のデータ構造例を示す説明図である。文字属性変更テーブル1600は、紛らわしい文字種類欄1610、文字コード欄1620、文字属性変更欄1630を有している。紛らわしい文字種類欄1610は、文字コード欄1620の種類名を記憶している。文字コード欄1620は、文字コードを記憶している。文字コード115が文字コード欄1620内の文字である場合は、文字属性変更欄1630内の規則を適用する。文字属性変更欄1630は、文字属性の値の変更規則を記憶している。例えば、文字色の変更の他に、半角文字をイタリック文字に変更すること、スペースを□に変更すること、数字をボールド体に変更すること等がある。これらは一例であり、これ以外であってもよく、例えば、手書きの場合は、筆者によっては書き方の癖があるため、筆者毎に異なる文字属性変更テーブル1600としてもよい。
また、この文字属性変更テーブル1600を、目視検査の担当者に提示するようにしてもよい。
前述の実施の形態における文字属性の変更処理を説明する。例えば、図17のグラフに示すように、紛らわしさ度、確度、前述の式の算出値に基づいて、文字を表示する際の濃淡値(文字属性)を決定するようにしてもよい。例えば、紛らわしさ度が高いほど、確度が低いほど、前述の式の算出値が低いほど濃い色で表示するようにしてもよい。また、濃淡値は予め定められた値より下げないようにしてもよい。
図18は、文字属性を決定する処理例を示すフローチャートである。
ステップS1802では、紛らわしさ度で決まる文字属性を出力する。例えば、図17のグラフを用いて文字属性の濃淡値を決定してもよい。
図19は、文字属性を決定する処理例を示すフローチャートである。
ステップS1902では、確度で決まる文字属性を出力する。例えば、図17のグラフを用いて文字属性の濃淡値を決定してもよい。
図20は、文字属性を決定する処理例を示すフローチャートである。
ステップS2002では、算出値で決まる文字属性を出力する。例えば、図17のグラフを用いて文字属性の濃淡値を決定してもよい。
第6の実施の形態は、前述の実施の形態(特に文字属性決定モジュール120、520、720、920、1120)による処理に加えて、さらに認識結果である文字コード115の文字間の生起確率に基づいて、その文字コード115の文字属性を決定する。
文字属性決定モジュールは、図21のフローチャート例で示すように、文字認識モジュール510から受け付けた文字コード列より決定される隣接文字生起確率(バイグラム)と確度情報から算出される値が閾値未満又は以下である場合は、対応する文字属性125(例えば青色等)を決定する。文字の紛らわしさ度と確度情報を用いる算出式は、例えば、(式4)等がある。ただし、a、b、Cは、予め定められた定数である。
V=f(確度情報、生起確率)=a×確度情報+b×隣接文字生起確率+C ・・・ (式4)
例えば、隣接する文字コード115の列が「1(数字)O(オー)3(数字)」の場合、隣接する文字生起確率(バイグラム)を「1O」で算出すると、「1(数字)0(数字)」に比べて低い値となる。このためO(オー)は誤認識である確率が高いため、対応する文字属性125(例えば青色等)を決定する。なお、比較対象である「1(数字)0(数字)」は、文字コード115として確度が2位の文字コード「0(数字)」を用いればよい。つまり、第1の文字コード115の次に第2の文字コード115がある隣接文字生起確率と、第1の文字コード115の次に確度が第2位の第2の文字コード115がある隣接文字生起確率とを比較して、前者が後者よりも低い又は以下である場合は、確度が第1位の文字コード115の文字属性を変更する。
図21は、第6の実施の形態による処理例を示すフローチャートである。
ステップS2102では、文字認識モジュール510が、文字認識処理を行う。
ステップS2104では、隣接文字生起確率、確度情報に基づき算出する。
ステップS2106では、算出値が閾値未満であるか否かを判断し、閾値未満である場合はステップS2108へ進み、それ以外の場合はステップS2110へ進む。
ステップS2108では、文字属性を対応する値に変更する。
ステップS2110では、表示モジュール130が、文字属性にしたがって文字コードを出力する。
図22は、第6の実施の形態による別の処理例を示すフローチャートである。前方の隣接文字生起確率と後方の隣接文字生起確率から式4の算出値の積を算出し、この値が閾値未満又は以下の場合に、文字属性を変更するようにしてもよい。
ステップS2202では、文字認識モジュール510が、文字認識処理を行う。
ステップS2204では、前方の隣接文字生起確率、確度情報に基づき算出する。
ステップS2206では、後方の隣接文字生起確率、確度情報に基づき算出する。
ステップS2208では、両者の積が閾値未満であるか否かを判断し、閾値未満である場合はステップS2110へ進み、それ以外の場合はステップS2212へ進む。
ステップS2210では、文字属性を対応する値に変更する。
ステップS1422では、表示モジュール130が、文字属性にしたがって文字コードを出力する。
図23は、本実施の形態による処理例(表示モジュール130による表示例)を示す説明図である。これは、図30(a)と同じ文字認識結果である図23(a)に対して、本実施の形態による処理を行ったものである。図23(b)の例は、赤色で表示している文字に点線の下線を施し、青色で表示している文字に太線の下線を施している。具体的には、「1」、「ー」、「レ」、「レ」、「1」、「レ」、「O1」、「0」、「ー」を赤色で表示し、「ノ」、「ノ」を青色で表示している。また、同じ文字種が連続している誤認識文字群2310、2320にあっても、「ノ」は青色、「レ」は赤色で表示している。
図24を参照して、本実施の形態の情報処理装置のハードウェア構成例について説明する。図24に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部2417と、プリンタなどのデータ出力部2418を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)2401は、前述の実施の形態において説明した各種のモジュール、すなわち、文字認識モジュール110、文字属性決定モジュール120、表示モジュール130、文字認識モジュール510、文字属性決定モジュール520、文字属性決定モジュール720、文字属性決定モジュール920、文字属性決定モジュール1120等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)2402は、CPU2401が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)2403は、CPU2401の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス2404により相互に接続されている。
ホストバス2404は、ブリッジ2405を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス2406に接続されている。
キーボード2408、マウス等のポインティングデバイス2409は、操作者により操作される入力デバイスである。ディスプレイ2410は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)2411は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU2401によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、文字画像105、文字コード115、文字属性125、文字画像135、紛らわしさ度対応テーブル300、文字属性対応テーブル400、文書辞書テーブルA1300、文書辞書テーブルB1500、文字属性変更テーブル1600などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ2412は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体2413に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース2407、外部バス2406、ブリッジ2405、及びホストバス2404を介して接続されているRAM2403に供給する。リムーバブル記録媒体2413も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート2414は、外部接続機器2415を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート2414は、インタフェース2407、及び外部バス2406、ブリッジ2405、ホストバス2404等を介してCPU2401等に接続されている。通信部2416は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部2417は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部2418は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図24に示す情報処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図24に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図24に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
なお、前述の各種の実施の形態を組み合わせてもよく(例えば、ある実施の形態内のモジュールを他の実施の形態内に追加する、入れ替えをする等も含む)、また、各モジュールの処理内容として背景技術で説明した技術を採用してもよい。
また、前述の実施の形態の説明において、予め定められた値等との比較において、「以上」、「以下」、「より大きい」、「より小さい(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい(未満)」、「以上」、「以下」としてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
110…文字認識モジュール
120…文字属性決定モジュール
122…紛らわしさ度対応記憶モジュール
130…表示モジュール
510…文字認識モジュール
520…文字属性決定モジュール
720…文字属性決定モジュール
920…文字属性決定モジュール
1110…文脈辞書記憶モジュール
1120…文字属性決定モジュール
2710…文字認識モジュール
2720…文字属性決定モジュール
2722…文字種・文字属性対応記憶モジュール
2730…表示モジュール

Claims (8)

  1. 文字画像を認識する文字認識手段と、
    認識結果と該認識結果の目視検査における文字の紛らわしさを示す指標を対応させて記憶している記憶手段から、前記文字認識手段による認識結果に対応する指標を抽出し、該指標に基づいて、該認識結果の表示態様を示す文字属性を決定する決定手段と、
    前記決定手段によって決定された文字属性にしたがって、前記文字認識手段による認識結果を表示する表示手段
    を具備することを特徴とする情報処理装置。
  2. 前記文字認識手段は、認識の確からしさを示す確度を算出し、
    前記決定手段は、前記指標と前記確度に基づいて、前記認識結果の文字属性を決定する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 文字画像を認識し、認識の確からしさを示す確度を算出する文字認識手段と、
    前記文字認識手段による認識結果の文字の生起確率と前記確度に基づいて、該認識結果の表示態様を示す文字属性を決定する決定手段と、
    前記決定手段によって決定された文字属性にしたがって、前記文字認識手段による認識結果を表示する表示手段
    を具備することを特徴とする情報処理装置。
  4. 前記決定手段は、さらに前記認識結果の文字の生起確率に基づいて、該認識結果の文字属性を決定する
    ことを特徴とする請求項1又は2に記載の情報処理装置。
  5. 前記決定手段は、さらに前記認識結果によって構成される文字列が予め定められた文字列に該当する場合は、該認識結果の文字属性を目立つ表示とはならない文字属性にする
    ことを特徴とする請求項1から4のいずれか一項に記載の情報処理装置。
  6. 前記決定手段は、さらに前記認識結果の文字間の生起確率に基づいて、該認識結果の文字属性を決定する
    ことを特徴とする請求項1から5のいずれか一項に記載の情報処理装置。
  7. コンピュータを、
    文字画像を認識する文字認識手段と、
    認識結果と該認識結果の目視検査における文字の紛らわしさを示す指標を対応させて記憶している記憶手段から、前記文字認識手段による認識結果に対応する指標を抽出し、該指標に基づいて、該認識結果の表示態様を示す文字属性を決定する決定手段と、
    前記決定手段によって決定された文字属性にしたがって、前記文字認識手段による認識結果を表示する表示手段
    として機能させるための情報処理プログラム。
  8. コンピュータを、
    文字画像を認識し、認識の確からしさを示す確度を算出する文字認識手段と、
    前記文字認識手段による認識結果の文字の生起確率と前記確度に基づいて、該認識結果の表示態様を示す文字属性を決定する決定手段と、
    前記決定手段によって決定された文字属性にしたがって、前記文字認識手段による認識結果を表示する表示手段
    として機能させるための情報処理プログラム。
JP2012230620A 2012-10-18 2012-10-18 情報処理装置及び情報処理プログラム Expired - Fee Related JP6007720B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012230620A JP6007720B2 (ja) 2012-10-18 2012-10-18 情報処理装置及び情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012230620A JP6007720B2 (ja) 2012-10-18 2012-10-18 情報処理装置及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2014081867A true JP2014081867A (ja) 2014-05-08
JP6007720B2 JP6007720B2 (ja) 2016-10-12

Family

ID=50785984

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012230620A Expired - Fee Related JP6007720B2 (ja) 2012-10-18 2012-10-18 情報処理装置及び情報処理プログラム

Country Status (1)

Country Link
JP (1) JP6007720B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110942075A (zh) * 2018-09-25 2020-03-31 富士施乐株式会社 信息处理装置、存储介质及信息处理方法
JP2023031641A (ja) * 2021-08-25 2023-03-09 ソフトバンク株式会社 通信端末、プログラム、及び表示方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0896085A (ja) * 1994-09-22 1996-04-12 Ibm Japan Ltd 文字認識文字補完方法及びコンピュータ・システム
JPH09161013A (ja) * 1995-12-13 1997-06-20 Hitachi Ltd 文字読取り方法及び住所読取り方法
JPH1069517A (ja) * 1996-08-27 1998-03-10 Ricoh Co Ltd 文字認識装置
JP2003108918A (ja) * 2001-09-29 2003-04-11 Toshiba Corp 文字認識装置、データ入力装置、文字認識方法、及びデータ入力方法
JP2003196094A (ja) * 2001-12-26 2003-07-11 Communication Research Laboratory 負の例予測処理方法、負の例予測処理プログラム、負の例予測処理を用いた日本語表記誤り検出処理プログラム、負の例予測処理を用いた日本語表記誤り検出装置、負の例予測処理を用いた外の関係の文抽出処理プログラム、負の例予測処理を用いた外の関係の文抽出装置
JP2008293109A (ja) * 2007-05-22 2008-12-04 Toshiba Corp テキスト処理装置及びプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0896085A (ja) * 1994-09-22 1996-04-12 Ibm Japan Ltd 文字認識文字補完方法及びコンピュータ・システム
JPH09161013A (ja) * 1995-12-13 1997-06-20 Hitachi Ltd 文字読取り方法及び住所読取り方法
JPH1069517A (ja) * 1996-08-27 1998-03-10 Ricoh Co Ltd 文字認識装置
JP2003108918A (ja) * 2001-09-29 2003-04-11 Toshiba Corp 文字認識装置、データ入力装置、文字認識方法、及びデータ入力方法
JP2003196094A (ja) * 2001-12-26 2003-07-11 Communication Research Laboratory 負の例予測処理方法、負の例予測処理プログラム、負の例予測処理を用いた日本語表記誤り検出処理プログラム、負の例予測処理を用いた日本語表記誤り検出装置、負の例予測処理を用いた外の関係の文抽出処理プログラム、負の例予測処理を用いた外の関係の文抽出装置
JP2008293109A (ja) * 2007-05-22 2008-12-04 Toshiba Corp テキスト処理装置及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110942075A (zh) * 2018-09-25 2020-03-31 富士施乐株式会社 信息处理装置、存储介质及信息处理方法
JP2020052570A (ja) * 2018-09-25 2020-04-02 富士ゼロックス株式会社 情報処理装置及びプログラム
JP7263720B2 (ja) 2018-09-25 2023-04-25 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2023031641A (ja) * 2021-08-25 2023-03-09 ソフトバンク株式会社 通信端末、プログラム、及び表示方法
JP7357030B2 (ja) 2021-08-25 2023-10-05 ソフトバンク株式会社 通信端末、プログラム、及び表示方法

Also Published As

Publication number Publication date
JP6007720B2 (ja) 2016-10-12

Similar Documents

Publication Publication Date Title
US10853638B2 (en) System and method for extracting structured information from image documents
JP4181310B2 (ja) 数式認識装置および数式認識方法
JP5663866B2 (ja) 情報処理装置及び情報処理プログラム
JP4347677B2 (ja) 帳票ocrプログラム、方法及び装置
JP2007304864A (ja) 文字認識処理システムおよび文字認識処理プログラム
JP5316021B2 (ja) 清書支援プログラム及び清書支援方法
JP5862260B2 (ja) 情報処理装置及び情報処理プログラム
KR20130057930A (ko) 화상 처리 장치 및 화상 처리 방법
JP2014157409A (ja) 情報処理装置及び情報処理プログラム
WO2023038722A1 (en) Entry detection and recognition for custom forms
JP6007720B2 (ja) 情報処理装置及び情報処理プログラム
US11551461B2 (en) Text classification
JP5601027B2 (ja) 画像処理装置及び画像処理プログラム
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
US20210042555A1 (en) Information Processing Apparatus and Table Recognition Method
US20110033114A1 (en) Image processing apparatus and computer readable medium
JP2017010187A (ja) 画像処理装置及び画像処理プログラム
Kaur et al. Adverse conditions and techniques for cross-lingual text recognition
JP5888222B2 (ja) 情報処理装置及び情報処理プログラム
CN104346611A (zh) 信息处理设备以及信息处理方法
JP6547301B2 (ja) 情報処理装置及び情報処理プログラム
JP2009223391A (ja) 画像処理装置及び画像処理プログラム
JP6260350B2 (ja) 画像処理装置及び画像処理プログラム
US11574490B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
JP3157530B2 (ja) 文字切り出し方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160331

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160816

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160829

R150 Certificate of patent or registration of utility model

Ref document number: 6007720

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees