JP5853488B2 - 情報処理装置およびプログラム - Google Patents

情報処理装置およびプログラム Download PDF

Info

Publication number
JP5853488B2
JP5853488B2 JP2011179577A JP2011179577A JP5853488B2 JP 5853488 B2 JP5853488 B2 JP 5853488B2 JP 2011179577 A JP2011179577 A JP 2011179577A JP 2011179577 A JP2011179577 A JP 2011179577A JP 5853488 B2 JP5853488 B2 JP 5853488B2
Authority
JP
Japan
Prior art keywords
character
likelihood
decorative
image data
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011179577A
Other languages
English (en)
Other versions
JP2013041535A (ja
Inventor
基行 鷹合
基行 鷹合
増市 博
博 増市
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2011179577A priority Critical patent/JP5853488B2/ja
Publication of JP2013041535A publication Critical patent/JP2013041535A/ja
Application granted granted Critical
Publication of JP5853488B2 publication Critical patent/JP5853488B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報処理装置およびプログラムに関する。
特許文献1には、入力画像から枠線を除去した画像と、予め与えられているフォントの高さおよび幅になるように枠線との接触部分の一部を残した画像の両方で認識を行い、認識用辞書と一致度の高いものを採用する光学式文字読取方法が開示されている。特許文献2には、読みとられた文字領域の罫線との接触の有無を判定する構成を有し、罫線が接触していると判定された文字領域に対して、通常の認識用辞書に加えて罫線接触文字認識用辞書を用いて認識を行う文字認識装置が開示されている。特許文献3には、黒画素の連続かつ実線を含む部分に対して、黒画素のX軸方向への射影のヒストグラムから文字境界を判定する文字復元方法が開示されている。特許文献4には、下線も含んだ文字行の分離ののち、水平方向への画素の出現頻度のヒストグラムから、上部(文字領域)と下部(下線領域)に分離する文字読取方式が開示されている。
特開2000−90196号公報 特開2001−22889号公報 特開昭63−184885号公報 特開平3−62285号公報
本発明の目的の1つは、画像データにより示されるある文字を含む文字列に関する、該文字を非装飾文字として含む文字列とする判定の確からしさを示す第1尤度と、該文字を装飾文字として含む文字列とする判定の確からしさを示す第2尤度と、に基づいて、該文字が非装飾文字および装飾文字のいずれであるか判定する情報処理装置を提供することにある。
上記目的を達成するために、請求項1に記載の発明は、画像読み取り手段により読み取られる画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得される前記画像データにより示される文字を非装飾文字と認識する非装飾文字認識手段と、前記画像データ取得手段により取得される前記画像データにより示される文字を装飾文字と認識する装飾文字認識手段と、前記画像データにより示される前記文字を含む文字列に関する、該文字を前記非装飾文字として含む文字列とする判定の確からしさを示す第1尤度と、該文字を前記装飾文字として含む文字列とする判定の確からしさを示す第2尤度と、を取得する尤度取得手段と、前記尤度取得手段により取得される前記第1尤度と、前記第2尤度と、に基づいて、該文字が前記非装飾文字および前記装飾文字のいずれであるか判定する文字判定手段と、を含むことを特徴とする情報処理装置である。
また、請求項2に記載の発明は、請求項1に記載の情報処理装置であって、前記尤度取得手段は、前記第1尤度と、前記第2尤度と、を前記文字列において装飾文字が続く長さに基づいて取得することを特徴とする情報処理装置である。
また、請求項3に記載の発明は、請求項1に記載の情報処理装置であって、前記尤度取得手段は、前記第1尤度と、前記第2尤度と、を前記文字列における装飾文字の比率に基づいて取得することを特徴とする情報処理装置である。
また、請求項4に記載の発明は、請求項1に記載の情報処理装置であって、前記尤度取得手段は、前記第1尤度と、前記第2尤度と、を前記文字列における1又は複数の装飾文字からなる語の重要度に基づいて取得することを特徴とする情報処理装置である。
また、請求項5に記載の発明は、請求項4に記載の情報処理装置であって、前記文字列を解析して前記語の文法的属性を示す属性情報を取得する属性情報取得手段をさらに有し、前記尤度取得手段は、前記語の重要度を、前記属性情報取得手段により取得される前記属性情報に基づいて取得することを特徴とする情報処理装置である。
また、請求項6に記載の発明は、請求項1に記載の情報処理装置であって、前記尤度取得手段は、前記第1尤度と、前記第2尤度と、を前記文字列における1又は複数の装飾文字からなる複数の語の間の関係に基づいて取得することを特徴とする情報処理装置である。
また、請求項7に記載の発明は、コンピュータを、画像読み取り手段により読み取られる画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得される前記画像データにより示される文字を非装飾文字と認識する非装飾文字認識手段、前記画像データ取得手段により取得される前記画像データにより示される文字を装飾文字と認識する装飾文字認識手段、前記画像データにより示される前記文字を含む文字列に関する、該文字を前記非装飾文字として含む文字列とする判定の確からしさを示す第1尤度と、該文字を前記装飾文字として含む文字列とする判定の確からしさを示す第2尤度と、を取得する尤度取得手段、および前記尤度取得手段により取得される前記第1尤度と、前記第2尤度と、に基づいて、該文字が前記非装飾文字および前記装飾文字のいずれであるか判定する文字判定手段、として機能させるためのプログラムである。
請求項1、7に記載の発明によれば、画像データにより示されるある文字を含む文字列に関する、該文字を非装飾文字として含む文字列とする判定の確からしさを示す第1尤度と、該文字を装飾文字として含む文字列とする判定の確からしさを示す第2尤度と、に基づいて、該文字が非装飾文字および装飾文字のいずれであるかが判定できる。
請求項2に記載の発明によれば、第1尤度と、第2尤度と、は文字列において装飾文字が続く長さに基づいて取得できる。
請求項3に記載の発明によれば、第1尤度と、第2尤度と、は文字列における装飾文字の比率に基づいて取得できる。
請求項4に記載の発明によれば、第1尤度と、第2尤度と、は文字列における1又は複数の装飾文字からなる語の重要度に基づいて取得できる。
請求項5に記載の発明によれば、語の重要度は、属性情報取得手段により取得される、語の文法的属性を示す属性情報に基づいて取得できる。
請求項6に記載の発明によれば、第1尤度と、第2尤度と、は文字列における1又は複数の装飾文字からなる複数の語の間の関係に基づいて取得できる。
本発明の実施形態に係る情報処理装置の構成を示す図である。 画像データ取得部により取得され、文字認識部に入力される画像データの一例を示す図である。 図2に示される画像データについて非装飾文字認識部により文字認識処理が行われた結果の一例を示す図である。 図2に示される画像データについて装飾文字認識部により文字認識処理が行われた結果の一例を示す図である。 装飾長と尤度の対応表の一例を示す図である。 装飾比と尤度の対応表の一例を示す図である。 本実施形態に係る情報処理装置における文字認識処理を示すフローチャートである。
以下、本発明の実施形態について図面に基づき詳細に説明する。図1は、本発明の実施形態に係る情報処理装置100の構成を示す図である。情報処理装置100は、該情報処理装置100に接続されるスキャナ等の画像読み取り装置から入力される画像データから、該画像データにより示される文字を判定し、判定された文字列を該情報処理装置100に接続される記憶装置や表示装置に出力する。
情報処理装置100は、画像データ取得部110、文字認識部120、文字判定部130、および判定結果出力部140を有する。画像データ取得部110、文字認識部120、文字判定部130、および判定結果出力部140は、例えばメモリー等の記憶部(図示しない)に記憶されるプログラムを読み取って動作する、情報処理装置100内のCPU(図示しない)の機能として実現される。
画像データ取得部110は、情報処理装置100に接続される、画像読取手段を有するスキャナ等の画像読み取り装置から入力される画像データを取得し、取得された画像データを文字認識部120に出力する。画像データ取得部110は、画像読み取り手段により読み取られる画像データを取得する画像データ取得手段として機能する。
文字認識部120は、画像データ取得部110から入力される画像データに対して文字認識処理を行い、画像データにより示される複数の文字のそれぞれについて、認識された1つ以上の文字およびその尤度を示す認識結果情報を出力する。文字認識部120の詳細については、後述する。
文字判定部130は、文字認識部120から入力される認識結果情報を用いて画像データにより示される複数の文字のそれぞれについて、何という文字であるかの判定を行い、この結果を示す判定結果情報を判定結果出力部140に出力する。文字判定部130の詳細については、後述する。
判定結果出力部140は、文字判定部130から入力される判定結果情報を基に、前述の画像読み取り装置から入力された画像データにおいて示されていた文字列を示すデータを生成し、生成されたデータを、情報処理装置100に接続される記憶装置や表示装置に出力する。
次に、文字認識部120について詳細に説明する。文字認識部120は、画像データ取得部110から入力される画像データに対して文字認識処理を行い、画像データにより示される複数の文字のそれぞれについて、認識された1つ以上の文字およびその尤度を示す認識結果情報を出力する。文字認識部120は、非装飾文字認識部121、および装飾文字認識部122を有する。
非装飾文字認識部121、および装飾文字認識部122は、それぞれ文字認識の基準となるデータ(教師データ)を有し、既知の文字認識技術により、画像データから抽出される文字と教師データとの比較を行い、認識結果である文字と、その認識結果の尤度(確からしさ)と、を示す認識結果情報を生成する。生成された認識結果情報は、文字判定部130に出力される。
ここで非装飾文字認識部121は、教師データとして、非装飾文字(例えばゴシック体で記述された、下線を有しない文字)のデータを有し、画像データにより示される文字を非装飾文字と認識する非装飾文字認識手段として機能する。装飾文字認識部122は、教師データとして、下線が付された文字(例えばゴシック体で記述された文字に下線が付された文字)のデータを有し、画像データにより示される文字を装飾文字と認識する装飾文字認識手段として機能する。そして非装飾文字認識部121は認識結果情報として、認識された非装飾文字とその尤度とを示す情報を出力し、装飾文字認識部122は認識結果情報として、認識された下線付き文字とその尤度とを示す情報を出力する。なお、非装飾文字認識部121、および装飾文字認識部122は、認識結果として出力すべき文字が教師データになかった場合には認識結果情報として「該当文字なし」を出力し、出力すべき文字が教師データにおいて複数存在した場合にはそれぞれについて、当該文字とその尤度を認識結果情報として出力する。
以下に、文字認識部120による処理の一例を示す。図2は、画像データ取得部110により取得され、文字認識部120に入力される画像データの一例を示す図である。
図3は、図2に示される画像データについて非装飾文字認識部121により文字認識処理が行われた結果の一例を示す図である。例えば、図2の一文字目の領域の画像200について、非装飾文字認識部121は、「あ」という認識結果およびその尤度である0.9、「お」という認識結果およびその尤度である0.3を示す認識結果情報を出力する。
図4は、図2に示される画像データについて装飾文字認識部122により文字認識処理が行われた結果の一例を示す図である。例えば、図2の一文字目の領域の画像200について、装飾文字認識部122は、認識結果情報として「該当文字なし」を出力する。一方、図2の二文字目の領域の画像201については、装飾文字認識部122は、「下線付きの片仮名の“れ”」という認識結果およびその尤度である0.5、「下線付きの片仮名の“と”」という認識結果およびその尤度である0.4を示す認識結果情報を出力する。
次に、文字判定部130について詳細に説明する。文字判定部130は、文字認識部120から入力される認識結果情報を用いて、画像データにより示される文字のそれぞれについて、どの文字が妥当であるかの判定を行い、この結果を示す判定結果情報を判定結果出力部140に出力する。文字判定部130は、例えば「。」で区切られる単位のフレーズ(文)について、該フレーズに含まれる文字のそれぞれについて認識結果情報により示される文字を組み合わせて、得られる組み合わせのそれぞれについて尤度を算出し、最も尤度の高い組み合わせを判定結果とする。例えば、画像データにより示される「XY」という2文字からなるフレーズについて、文字画像「X」に対して文字「X0」「X1」、文字画像「Y」に対して文字「Y0」「Y1」「Y2」という認識結果を示す認識結果情報が得られた場合、文字判定部130は「X0Y0」「X0Y1」「X0Y2」「X1Y0」「X1Y1」「X1Y2」という6通りの組み合わせとなる2文字からなるフレーズのそれぞれについて尤度を求め、尤度が最も高い組み合わせを判定結果とする。すなわち、非装飾文字認識部121により非装飾文字と認識され、かつ装飾文字認識部122により装飾文字と認識されたある文字に着目した場合、文字判定部130は、該文字を含むフレーズ(文字列)に関する、該文字を非装飾文字として含むフレーズとする判定の確からしさを示す尤度(第1尤度)と、該文字を装飾文字として含むフレーズとする判定の確からしさを示す尤度(第2尤度)と、に基づいて、該文字が非装飾文字および装飾文字のいずれであるか判定する文字判定手段として機能する。
文字判定部130は、フレーズデータ取得部131、組み合わせ生成部132、尤度取得部133、および尤度評価部134を有する。
フレーズデータ取得部131は、文字認識部120から入力される認識結果情報から、「。」で区切られる一文に関する認識結果情報(フレーズデータ)を取得し、取得されたフレーズデータを組み合わせ生成部132に出力する。
組み合わせ生成部132は、フレーズデータ取得部131から入力される認識結果情報により示される、文字認識部120において認識された文字を組み合わせて、フレーズを生成する。そして組み合わせ生成部132は、生成されたフレーズ(組み合わせ)の内容を示す情報および組み合わせに使用された文字のそれぞれの尤度を尤度判定部135に、組み合わせの内容を示す情報を装飾長判定部136、および装飾比判定部137に出力する。
尤度判定部135は、組み合わせ生成部132から入力されるフレーズについて、その尤度(乗算尤度)を算出する。乗算尤度は、フレーズの各文字の認識結果の尤度を乗じて算出される。図3および4の例では、「あ」「下線付きの片仮名の“れ”」「下線付きの漢数字の“10”」「下線付きの漢数字の“2”」「個」という組み合わせの乗算尤度は、0.9×0.5×0.9×0.9×0.95≒0.346となる。
装飾長判定部136は、組み合わせ生成部132から入力されるフレーズについて、装飾文字(下線が付された文字)が連続する部分のうち最も短いものの長さに基づく尤度を取得する。長さと尤度の関係は、例えば事前に対応表として設定される。図5は装飾長と尤度の対応表の一例を示す図である。図3および4の例では、「あ」「下線付きの片仮名の“れ”」「下線付きの漢数字の“10”」「下線付きの漢数字の“2”」「個」という組み合わせでは長さ「3」に対応する「0.5」が取得される。なお、対応表は予め正しい文書サンプル等を基に統計的に生成される。また対応表においては、長さ「1」は尤度が最も低く設定される。これは長さ1の文字列(1文字のみ)に対して装飾がなされることは稀であると考えられることによる。
装飾比判定部137は、組み合わせ生成部132から入力されるフレーズについて、装飾(下線)がなされている部分の全体に対する比率を参照し、比率に基づく尤度を取得する。比率と尤度の関係は、例えば事前に対応表として設定される。図6は装飾比と尤度の対応表の一例を示す図である。図3および4の例では、「あ」「下線付きの片仮名の“れ”」「下線付きの漢数字の“10”)」「下線付きの漢数字の“2”」「個」という組み合わせでは比率は0.6であり、比率「0.6」に対応する「0.4」が取得される。なお、対応表は予め正しい文書を基に統計的に生成される。また、対応表においては、比率1.0は尤度が最も低く設定される。これは文の全てに装飾がなされることは稀であると考えられることによる。
尤度評価部134は、尤度取得部133の、尤度判定部135、装飾長判定部136、および装飾比判定部137において得られたフレーズ(組み合わせ)の尤度に基づいて、最も尤度の高いフレーズを判定結果として決定する。尤度評価部134は、尤度取得部133の、尤度判定部135、装飾長判定部136、および装飾比判定部137において得られた尤度のそれぞれに係数を乗じる重み付けを行ったうえで加算して尤度評価値を算出し、この尤度評価値が最も大きい組み合わせを判定結果とする。ここで乗じられる係数は、例えば文書の特性や統計的なデータ等に基づいて予め設定される。
算出される尤度評価値が最大となる組み合わせを取得するために、文字判定部130は、文字認識部120から入力される認識結果情報により示される文字から生成される全ての組み合わせについて、尤度の評価を行う。そして尤度評価部134は、暫定的な尤度評価値(暫定尤度評価値、初期値は0)および暫定的な判定結果(暫定判定結果)を記憶する構成を有する。尤度評価部134は、1つの組み合わせについて尤度評価値を算出すると、暫定尤度評価値との比較を行い、暫定尤度評価値より大きい尤度評価値が得られた場合には、算出された尤度評価値を暫定尤度評価値として記憶し、対応する組み合わせを暫定判定結果として記憶する。そして全ての組み合わせについて尤度評価値の算出および算出された尤度評価値の暫定尤度評価値との比較が実行された時点で、尤度評価部134は暫定判定結果として記憶されている判定結果、すなわち記憶されている暫定尤度評価値(最大の尤度評価値)に対応する判定結果を、最終的な判定結果とする。尤度評価部134は、この最終的な判定結果を判定結果出力部140に出力する。
次に、本実施形態に係る情報処理装置100の動作を、フローチャートを用いて説明する。図7は、本実施形態に係る情報処理装置100における文字認識処理を示すフローチャートである。
まず、画像データ取得部110は、情報処理装置100に接続されるスキャナ等の画像読み取り装置から入力される画像データを取得する(S701)。
次に、文字認識部120の非装飾文字認識部121は、S701において取得された画像データに対して非装飾文字と認識する非装飾文字認識処理を行う(S702)。さらに、文字認識部120の装飾文字認識部122は、S701において取得された画像データに対して装飾文字と認識する装飾文字認識処理を行う(S703)。
次に、文字判定部130は、文字判定処理を行う。まず文字判定部130のフレーズデータ取得部131は、S702およびS703における認識結果情報のうち、処理単位であるフレーズ分の認識結果情報(フレーズデータ)を取得する(S704)。次に文字判定部130の尤度評価部134は、暫定尤度評価値を0に設定する(S705)。
次に文字判定部130の組み合わせ生成部132は、S704においてフレーズデータ取得部131により取得された認識結果情報によって示される文字の、組み合わせを1つ生成する(S706)。そして尤度取得部133の尤度判定部135は、該組み合わせについて乗算尤度を算出する(S707)。また、尤度取得部133の装飾長判定部136は、S706で生成された組み合わせについて、装飾長に基づく尤度を取得する(S708)。さらに尤度取得部133の装飾比判定部137は、S706で生成された組み合わせについて、装飾比に基づく尤度を取得する(S709)。そして文字判定部130の尤度評価部134は、S707、S708、およびS709において得られた尤度から尤度評価値を算出し(S710)、算出された尤度評価値と暫定尤度評価値と比較する(S711)。尤度評価部134は、S710において算出された尤度評価値が暫定尤度評価値よりも大きければ、暫定尤度評価値の値として該尤度評価値を記憶(上書き)するとともに、対応する組み合わせを暫定的な判定結果として記憶(上書き)する(S712)。
文字判定部130は、認識結果情報に示される文字の全ての組み合わせについてS706からS710の尤度評価値の算出処理およびS711の比較処理が行われたか判定を行い(S713)、全ての組み合わせについてこれらの処理が行われていなければS706に戻って未処理の組み合わせについて処理を行い、全ての組み合わせについて処理が行われていれば処理はS714に進む。S714では文字判定部130は、その時点で暫定的な判定結果として記憶されている判定結果を最終的な判定結果と決定し、この結果を示す判定結果情報が、判定結果出力部140を介して出力される。前述のとおり、S704からS714の処理(文字判定処理)では、S702において非装飾文字と認識され、かつS703において装飾文字と認識されたある文字に着目した場合、該文字を含むフレーズ(文字列)に関する、該文字を非装飾文字として含むフレーズとする判定の確からしさを示す尤度(第1尤度)と、該文字を装飾文字として含むフレーズとする判定の確からしさを示す尤度(第2尤度)と、に基づいて、該文字が非装飾文字および装飾文字のいずれであるか判定する文字判定処理が実行される。以上で情報処理装置100における文字認識処理は終了する。
なお、S702の非装飾文字認識処理とS703の装飾文字認識処理については、S704のフレーズデータ取得処理までに実行されていればよく、例えば逆の順序で実行されてもよいし、同時に実行されてもよい。また、S707の乗算尤度算出、S708の装飾長に基づく尤度取得、およびS709の装飾比に基づく尤度取得についても、S710の尤度評価値算出までに実行されていればよく、例えば逆の順序で実行されてもよいし、同時に実行されてもよい。
以上の構成により、画像データにより示されるある文字を含む文字列に関する、該文字を非装飾文字として含む文字列とする判定の確からしさを示す第1尤度と、該文字を装飾文字として含む文字列とする判定の確からしさを示す第2尤度と、に基づいて、該文字が非装飾文字および装飾文字のいずれであるかが判定される。
なお、上述の実施形態においては、認識された文字の尤度、装飾文字が連続する長さに基づく尤度、装飾文字の比率に基づく尤度を用いて文字が判定される構成が示されたが、装飾文字が使用される傾向に着目した他の尤度を用いて判定を行う構成としてもよい。
例えば、1又は複数の装飾文字からなる語の重要度に基づいて尤度を取得する構成としてもよい。これは、重要な語には装飾がなされることが多いことによるものである。その場合、例えば事前に登録された重要な語に装飾がなされた組み合わせの尤度を高くしてもよいし、装飾文字からなる語の文法的属性を示す属性情報を取得する属性情報取得手段を設け、この属性情報に基づいて取得される尤度を用いる構成としてもよい。後者の場合、例えばフレーズデータ取得部131において取得されたフレーズについて、形態素解析等により分割、品詞の特定を行う構成を設け、特定された品詞の種類に基づいて尤度を取得する構成としてもよい。この場合、助詞は重要度が低く、装飾が付されることは稀であると考えられることから、助詞に装飾が付された組み合わせの尤度は低く設定してもよい。また、既存の文書群における単語のtf・idf値を求めておき、装飾文字と認識された部分に含まれる単語のtf・idf値に基づいて尤度を求める構成としてもよい。
また、分割された語の活用形に基づく尤度を使用する構成としてもよい。この場合、例えば命令形や禁止形の語には装飾が付されることが多いと考えられることから、このような組み合わせの尤度は高くする構成としてもよい。また、「○○ならば」等の条件句、「○○できない」「○○しない」等の否定句に装飾が付された組み合わせの尤度を高く設定する構成としてもよい。
また、例えば「○○と××」のように並列表現がなされたそれぞれ(「○○」、「××」)に装飾が付された組み合わせについて、尤度を高くする構成としてもよい。
さらに、装飾文字からなる複数の語の間の関係に基づく尤度を用いる構成としてもよい。この場合、例えば同一の語に装飾が付されている組み合わせは尤度を高くする構成としてもよいし、例えば辞書データベース又は事前の設定により特定される所定の関係にある語(「上部」と「下部」等の対義語、「赤」「青」等の同一カテゴリーの語、発注者名と受注者名等の事前に設定された語)に装飾が付されている組み合わせの尤度を高くする構成としてもよい。
また、上述の実施形態では装飾文字として下線が付された文字が認識される構成が示されたが、その他に太字で記された文字、斜体で記された文字、他と異なるフォントで記された文字が装飾文字として認識される構成としてもよく、その場合、装飾長は同種の装飾が付された文字が連続する長さとする構成や、装飾比はいずれかの装飾がなされた文字の比率とする構成としてもよい。また、尤度の判定においても、それぞれの装飾の特徴に応じて、ある装飾がなされる傾向が強い語に当該装飾がなされた組み合わせの尤度をより高くする構成としてもよい。
また、上述の実施形態では「。」で区切られる文単位での判定が行われる構成が示されたが、情報処理装置100の処理能力、求められる文字認識の精度や読み取られる画像データの解像度等に応じて、判定単位が単語のように短い構成、判定単位が段落や文書全体のように長い構成としてもよい。
なお、ここで述べた情報処理装置100の動作は、情報処理装置100の図示しない記憶部に記憶されるプログラムを動作させることで実現される。このプログラムは通信によって提供されてもよいし、コンピュータによる読み取りが可能な、CD−ROM等の記憶媒体に格納されて提供されてもよい。
100 情報処理装置、110 画像データ取得部、120 文字認識部、121 非装飾文字認識部、122 装飾文字認識部、130 文字判定部、131 フレーズデータ取得部、132 組み合わせ生成部、133 尤度取得部、134 尤度評価部、135 尤度判定部、136 装飾長判定部、137 装飾比判定部、140 判定結果出力部、200 画像、201 画像。

Claims (10)

  1. 画像読み取り手段により読み取られる画像データを取得する画像データ取得手段と、
    前記画像データ取得手段により取得される前記画像データにより示される文字列の各文字を非装飾文字と認識する非装飾文字認識手段と、
    前記画像データ取得手段により取得される前記画像データにより示される文字列の各文字を装飾文字と認識する装飾文字認識手段と、
    前記非装飾文字認識手段及び前記装飾文字認識手段により得られる文字を組み合わせて生成される、前記画像データにより示される文字列の認識結果の複数の候補のそれぞれについて、該文字列において装飾文字が続く長さに基づく尤度を取得する尤度取得手段と、
    前記尤度に基づいて、前記文字列の認識結果の複数の候補のうち1つを選択して出力する判定結果出力手段と、
    を含むことを特徴とする情報処理装置。
  2. 請求項1に記載の情報処理装置であって、
    前記尤度取得手段は、前記尤度を前記文字列の認識結果の候補における装飾文字の比率に基づいて取得することを特徴とする情報処理装置。
  3. 画像読み取り手段により読み取られる画像データを取得する画像データ取得手段と、
    前記画像データ取得手段により取得される前記画像データにより示される文字列の各文字を非装飾文字と認識する非装飾文字認識手段と、
    前記画像データ取得手段により取得される前記画像データにより示される文字列の各文字を装飾文字と認識する装飾文字認識手段と、
    前記非装飾文字認識手段及び前記装飾文字認識手段により得られる文字を組み合わせて生成される、前記画像データにより示される文字列の認識結果の複数の候補のそれぞれについて、該文字列における1又は複数の装飾文字からなる語の解釈結果に基づく尤度を取得する尤度取得手段と、
    前記尤度に基づいて、前記文字列の認識結果の複数の候補のうち1つを選択して出力する判定結果出力手段と、
    を含むことを特徴とする情報処理装置。
  4. 請求項に記載の情報処理装置であって、
    前記尤度取得手段は、前記尤度を前記文字列の認識結果の候補における1又は複数の装飾文字からなる語の重要度に基づいて取得することを特徴とする情報処理装置。
  5. 請求項4に記載の情報処理装置であって、
    前記文字列の認識結果の候補を解析して前記1又は複数の装飾文字からなる語の文法的属性を示す属性情報を取得する属性情報取得手段をさらに有し、
    前記尤度取得手段は、前記1又は複数の装飾文字からなる語の重要度を、前記属性情報取得手段により取得される前記属性情報に基づいて取得することを特徴とする情報処理装置。
  6. 請求項に記載の情報処理装置であって、
    前記尤度取得手段は、前記尤度を前記文字列の認識結果の候補における1又は複数の装飾文字からなる複数の語の間の関係に基づいて取得することを特徴とする情報処理装置。
  7. 画像読み取り手段により読み取られる画像データを取得する画像データ取得手段と、
    前記画像データ取得手段により取得される前記画像データにより示される文字列の各文字を非装飾文字と認識する非装飾文字認識手段と、
    前記画像データ取得手段により取得される前記画像データにより示される文字列の各文字を装飾文字と認識する装飾文字認識手段と、
    前記非装飾文字認識手段及び前記装飾文字認識手段により得られる文字を組み合わせて生成される、前記画像データにより示される文字列の認識結果の複数の候補のそれぞれについて、該文字列に含まれ、前記非装飾文字認識手段により非装飾文字と認識され且つ前記装飾文字認識手段により装飾文字と認識された文字が、非装飾文字として含まれる文字列であるとする判定の確からしさを示す第1尤度と、前記非装飾文字認識手段により非装飾文字と認識され且つ前記装飾文字認識手段により装飾文字と認識された文字が、装飾文字として含まれる文字列であるとする判定の確からしさを示す第2尤度と、を取得する尤度取得手段と、
    前記第1尤度と、前記第2尤度と、に基づいて、前記文字列の認識結果の複数の候補のうち1つを選択して出力する判定結果出力手段と、
    を含むことを特徴とする情報処理装置。
  8. コンピュータを、
    画像読み取り手段により読み取られる画像データを取得する画像データ取得手段、
    前記画像データ取得手段により取得される前記画像データにより示される文字列の各文字を非装飾文字と認識する非装飾文字認識手段、
    前記画像データ取得手段により取得される前記画像データにより示される文字列の各文字を装飾文字と認識する装飾文字認識手段、
    前記非装飾文字認識手段及び前記装飾文字認識手段により得られる文字を組み合わせて生成される、前記画像データにより示される文字列の認識結果の複数の候補のそれぞれについて、該文字列において装飾文字が続く長さに基づく尤度を取得する尤度取得手段、および
    前記尤度に基づいて、前記文字列の認識結果の複数の候補のうち1つを選択して出力する判定結果出力手段、
    として機能させるためのプログラム。
  9. コンピュータを、
    画像読み取り手段により読み取られる画像データを取得する画像データ取得手段、
    前記画像データ取得手段により取得される前記画像データにより示される文字列の各文字を非装飾文字と認識する非装飾文字認識手段、
    前記画像データ取得手段により取得される前記画像データにより示される文字列の各文字を装飾文字と認識する装飾文字認識手段、
    前記非装飾文字認識手段及び前記装飾文字認識手段により得られる文字を組み合わせて生成される、前記画像データにより示される文字列の認識結果の複数の候補のそれぞれについて、該文字列における1又は複数の装飾文字からなる語の解釈結果に基づく尤度を取得する尤度取得手段、および
    前記尤度に基づいて、前記文字列の認識結果の複数の候補のうち1つを選択して出力する判定結果出力手段、
    として機能させるためのプログラム。
  10. コンピュータを、
    画像読み取り手段により読み取られる画像データを取得する画像データ取得手段、
    前記画像データ取得手段により取得される前記画像データにより示される文字列の各文字を非装飾文字と認識する非装飾文字認識手段、
    前記画像データ取得手段により取得される前記画像データにより示される文字列の各文字を装飾文字と認識する装飾文字認識手段、
    前記非装飾文字認識手段及び前記装飾文字認識手段により得られる文字を組み合わせて生成される、前記画像データにより示される文字列の認識結果の複数の候補のそれぞれについて、該文字列に含まれ、前記非装飾文字認識手段により非装飾文字と認識され且つ前記装飾文字認識手段により装飾文字と認識された文字が、非装飾文字として含まれる文字列であるとする判定の確からしさを示す第1尤度と、前記非装飾文字認識手段により非装飾文字と認識され且つ前記装飾文字認識手段により装飾文字と認識された文字が、装飾文字として含まれる文字列であるとする判定の確からしさを示す第2尤度と、を取得する尤度取得手段、および
    前記第1尤度と、前記第2尤度と、に基づいて、前記文字列の認識結果の複数の候補のうち1つを選択して出力する判定結果出力手段、
    として機能させるためのプログラム。
JP2011179577A 2011-08-19 2011-08-19 情報処理装置およびプログラム Active JP5853488B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011179577A JP5853488B2 (ja) 2011-08-19 2011-08-19 情報処理装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011179577A JP5853488B2 (ja) 2011-08-19 2011-08-19 情報処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2013041535A JP2013041535A (ja) 2013-02-28
JP5853488B2 true JP5853488B2 (ja) 2016-02-09

Family

ID=47889842

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011179577A Active JP5853488B2 (ja) 2011-08-19 2011-08-19 情報処理装置およびプログラム

Country Status (1)

Country Link
JP (1) JP5853488B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7172351B2 (ja) * 2018-09-21 2022-11-16 富士フイルムビジネスイノベーション株式会社 文字列認識装置及び文字列認識プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07200734A (ja) * 1993-12-28 1995-08-04 Toshiba Corp 光学的文字読取装置
JPH09114931A (ja) * 1995-10-18 1997-05-02 Canon Inc 文字認識装置及びその方法
JP4055976B2 (ja) * 1999-07-29 2008-03-05 株式会社リコー 文書画像処理方法、文書画像処理装置及び記録媒体
JP2005275996A (ja) * 2004-03-26 2005-10-06 Canon Inc 文書管理装置、文書管理方法、プログラム及び記憶媒体
JP5531493B2 (ja) * 2009-08-04 2014-06-25 株式会社リコー 文字認識装置、文字認識方法、プログラム及び記録媒体

Also Published As

Publication number Publication date
JP2013041535A (ja) 2013-02-28

Similar Documents

Publication Publication Date Title
US20180137349A1 (en) System and method of character recognition using fully convolutional neural networks
KR101376863B1 (ko) 문서 시각 구조의 문법 분석
JP2019091434A (ja) 複数のディープ・ラーニング・ニューラル・ネットワークを動的に重み付けすることによるフォント認識の改善
CN110114776B (zh) 使用全卷积神经网络的字符识别的系统和方法
RU2619712C1 (ru) Оптическое распознавание символов серии изображений
EP2015228A1 (en) Retrieving electronic documents by converting them to synthetic text
JP2014106961A (ja) アラビア語テキストを自動的に認識するためのコンピュータによって実行される方法、およびコンピュータプログラム
RU2643465C2 (ru) Устройства и способы, которые используют иерархически упорядоченную структуру данных, содержащую непараметризованные символы, для преобразования изображений документов в электронные документы
CN101133411A (zh) 非罗马字符的容错罗马化输入方法
EP1732012B1 (en) Method of identifying redundant text in an electronic document
RU2613849C1 (ru) Оптическое распознавание символов серии изображений
JP2005242579A (ja) 文書処理装置、文書処理方法、および文書処理プログラム
JP5664174B2 (ja) 持ち運び可能な電子ファイルからキャラクタの外接矩形を抽出する装置及び方法
US10963717B1 (en) Auto-correction of pattern defined strings
TWI567569B (zh) Natural language processing systems, natural language processing methods, and natural language processing programs
JP5502814B2 (ja) アラビア語テキストに発音区別符号を付与するための方法およびシステム
CN112329390A (zh) 一种基于音形义的中文词相似度检测算法
Luu et al. A pointwise approach for Vietnamese diacritics restoration
RU2625533C1 (ru) Устройства и способы, которые строят иерархически упорядоченную структуру данных, содержащую непараметризованные символы, для преобразования изображений документов в электронные документы
JP5097802B2 (ja) ローマ字変換を用いる日本語自動推薦システムおよび方法
Zelenko et al. Discriminative methods for transliteration
JP2008225695A (ja) 文字認識誤り修正装置およびプログラム
CN103489268B (zh) 一种用于pos平台的阿拉伯语显示方法
JP5853488B2 (ja) 情報処理装置およびプログラム
JP2012173959A (ja) 文字認識装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140711

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151123

R150 Certificate of patent or registration of utility model

Ref document number: 5853488

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350