JP5935324B2 - 情報処理装置及び情報処理プログラム - Google Patents

情報処理装置及び情報処理プログラム Download PDF

Info

Publication number
JP5935324B2
JP5935324B2 JP2012000231A JP2012000231A JP5935324B2 JP 5935324 B2 JP5935324 B2 JP 5935324B2 JP 2012000231 A JP2012000231 A JP 2012000231A JP 2012000231 A JP2012000231 A JP 2012000231A JP 5935324 B2 JP5935324 B2 JP 5935324B2
Authority
JP
Japan
Prior art keywords
character
character string
quasi
module
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012000231A
Other languages
English (en)
Other versions
JP2013140487A (ja
Inventor
瑛一 田中
瑛一 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2012000231A priority Critical patent/JP5935324B2/ja
Priority to CN201210281080.3A priority patent/CN103198291B/zh
Publication of JP2013140487A publication Critical patent/JP2013140487A/ja
Application granted granted Critical
Publication of JP5935324B2 publication Critical patent/JP5935324B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

本発明は、情報処理装置及び情報処理プログラムに関する。
文字列を抽出する技術がある。
これに関連する技術として、例えば、特許文献1には、文書画像の行と段の抽出機能を持つ文書画像認識装置に関し、横行と縦行が混在する文書画像の行・段の抽出を高速かつ高精度に行うことができるようにすることを課題とし、文書画像傾き検出部は、文書画像を参照して文字を構成する成分の集合を抽出し、これをもとに横及び縦の行候補を抽出し、それらの各々の行候補に対して信頼度を推定し、推定した行信頼度に基づいて確度の高い行の集合を抽出し、その結果をもとに確度の高い行の集合の文字成分の配置を用いて傾きを推定し、レイアウト解析部は、文書画像を構成する基礎要素の集合から行方向の確定した行集合を抽出し、行同士の関連付けによる段抽出と段を制約とした行抽出とを相互に実行して行と段を抽出することが開示されている。
また、例えば、特許文献2には、文字認識において誤認識の原因となる分離文字列を誤りなく統合し、分離文字に起因する誤認識を防止することを課題とし、文書画像から文字列矩形を抽出し、文字列矩形内の分離文字列矩形を統合し、ついで、2以上の文字列矩形に分離した分離文字列を次のように統合し、文字列矩形内部の文字数が少ない文字列矩形に注目し、その文字列矩形の上下(横書き)もしくは左右(縦書き)にある文字列を、推定文字列サイズ程度になるように仮統合し、新たに統合してできた文字矩形を文字認識し、文字認識の評価値(例えば距離値)が一定基準を満たすか否かを判定し、分離文字列の仮統合結果を検証することが開示されている。
また、例えば、特許文献3には、独立した文字成分を生成、識別するための文字分割方法に関し、独立した文字成分の抽出、識別を提供することを目的とし、文章のすべての画素連結成分をサーチする第1過程と、第1の画素連結成分とそれを完全にその内部に包含する第2の画素連結成分を1つに結合する第2過程と文字幅、文字ピッチ、行幅、及び行ピッチの参考数値を設定する第3過程と参考数値の規定に合致し同一の文字成分に属する画素連結成分を1つに結合する第4過程と画素連結成分の結合状況に基づき第2〜第4過程を繰り返し実行するか否かを判定する第5過程とを含むフィードバック式連結成分結合演算法により画素連結成分を結合し、複数の独立した文字成分を形成する第6過程と、文字成分を配列する第7過程とからなることが開示されている。
また、例えば、非特許文献1、非特許文献2には、2値画像の連結成分が準文字であり、準文字の統合において、準文字の近接に加え、文字列のサイズと方向を利用し、このとき、文字列の方向を、準文字のセットから推定し、推定に利用する準文字のセットとは、入力画像から得られたすべての準文字から作成した局所的なセットであり、それぞれの局所的なセットに対して、文字列のサイズと方向を与えていることが開示されている。
特開2008−217833号公報 特開2002−015283号公報 特開平08−263589号公報
岩田基, 黄瀬浩一, 松本啓之亮, "Segmentation of page images using the area Voronoi diagram,"情報処理学会論文誌, Vol.49, No.8, pp.3239−3248, Aug 1999. Daniel M. Oliveira, Rafael D. Lins, Gabriel Torreao, Jian Fan, Marcelo Thielo, "A New Method for Text−Line Segmentation for Warped Documents," in Proc. of Int. Conf. on Image Analysis and Recognition, Povoa de Varzim, Portugal, pp.398−408, 2010.
本発明は、文字列に含まれると一旦は誤って判断された準文字であっても、その後に形成される文字列に含まれると正しく判断され得るようにし、文字列に含まれると正しく判断された準文字が、その後に形成される文字列に含まれると誤って判断されることを抑制するようにした情報処理装置及び情報処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、文字列の構成要素である準文字の集合である文字列要素内から、対象としている文字列に含まれる準文字を選択する準文字選択手段と、前記準文字選択手段によって選択された準文字を、前記対象としている文字列に含めることによって文字列を形成する文字列形成手段と、前記文字列形成手段によって形成された文字列の文字列らしさを示す特徴量を算出し、該文字列に含まれている準文字に該特徴量を付与する特徴量付与手段を具備し、前記準文字選択手段によって選択の対象となる準文字として、前記文字列形成手段によって形成された文字列に含まれている準文字を含み、前記準文字選択手段は、前記特徴量付与手段によって準文字に付与された特徴量に基づいて、前記対象としている文字列に含まれる準文字を選択し、前記準文字選択手段は、前記文字列形成手段によって形成途中である文字列の特徴量と既に形成された文字列に含まれている準文字に付与されている特徴量とを比較して、対象としている文字列に含まれる準文字を選択することを特徴とする情報処理装置である。
請求項2の発明は、前記文字列要素内から、前記準文字選択手段によって選択し得る準文字がある範囲を設定する範囲設定手段をさらに具備し、前記準文字選択手段は、前記範囲設定手段によって設定された範囲にある文字列要素内から、対象としている文字列に含まれる準文字を選択することを特徴とする請求項1に記載の情報処理装置である。
請求項の発明は、前記特徴量付与手段は、特徴量として、文字列の長さ、文字列の太さ、文字列の傾き、文字列に含まれている準文字又は複数の準文字群間の距離、文字列の歪み、文字列の長細さのいずれか1つ又はこれらの組み合わせを算出することを特徴とする請求項1又は2に記載の情報処理装置である。
請求項の発明は、前記文字列形成手段によって形成された文字列内の文字を認識し、文字認識結果を出力する文字認識手段をさらに具備することを特徴とする請求項1からのいずれか1項に記載の情報処理装置である。
請求項の発明は、前記文字列形成手段によって形成された文字列の歪みを算出する歪み算出手段と、前記歪み算出手段によって算出された歪みに基づいて、前記文字列を含む文書の歪みを補正する補正手段をさらに具備することを特徴とする請求項1からのいずれか1項に記載の情報処理装置である。
請求項の発明は、コンピュータを、文字列の構成要素である準文字の集合である文字列要素内から、対象としている文字列に含まれる準文字を選択する準文字選択手段と、前記準文字選択手段によって選択された準文字を、前記対象としている文字列に含めることによって文字列を形成する文字列形成手段と、前記文字列形成手段によって形成された文字列の文字列らしさを示す特徴量を算出し、該文字列に含まれている準文字に該特徴量を付与する特徴量付与手段として機能させ、前記準文字選択手段によって選択の対象となる準文字として、前記文字列形成手段によって形成された文字列に含まれている準文字を含み、前記準文字選択手段は、前記特徴量付与手段によって準文字に付与された特徴量に基づいて、前記対象としている文字列に含まれる準文字を選択し、前記準文字選択手段は、前記文字列形成手段によって形成途中である文字列の特徴量と既に形成された文字列に含まれている準文字に付与されている特徴量とを比較して、対象としている文字列に含まれる準文字を選択することを特徴とする情報処理プログラムである。
請求項1の情報処理装置によれば、文字列に含まれると一旦は誤って判断された準文字であっても、その後に形成される文字列に含まれると正しく判断され得るようにし、文字列に含まれると正しく判断された準文字が、その後に形成される文字列に含まれると誤って判断されることを抑制することができる。また、形成途中の文字列の特徴に基づいて、準文字を選択する範囲を定めることができる。
請求項2の情報処理装置によれば、文字列に含めるべき準文字の選択範囲を設定することができる。
請求項の情報処理装置によれば、文字列の長さ、文字列の太さ、文字列の傾き、文字列に含まれている準文字又は複数の準文字群間の距離、文字列の歪みのいずれか1つ又はこれらの組み合わせに基づいて、文字列に含まれる準文字を選択することができる。
請求項の情報処理装置によれば、文字列の文字認識結果を出力することができる。
請求項の情報処理装置によれば、文字列の歪みに基づいて、文書の歪みを補正することができる。
請求項の情報処理プログラムによれば、文字列に含まれると一旦は誤って判断された準文字であっても、その後に形成される文字列に含まれると正しく判断され得るようにし、文字列に含まれると正しく判断された準文字が、その後に形成される文字列に含まれると誤って判断されることを抑制することができる。また、形成途中の文字列の特徴に基づいて、準文字を選択する範囲を定めることができる。
第1の実施の形態の構成例についての概念的なモジュール構成図である。 対象とする文書画像の例を示す説明図である。 誤った文字列抽出の例を示す説明図である。 誤った文字列抽出の例を示す説明図である。 本実施の形態による準文字の選択処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 第1の実施の形態による処理例を示すフローチャートである。 第2の実施の形態の構成例についての概念的なモジュール構成図である。 第2の実施の形態による処理例を示すフローチャートである。 第3の実施の形態の構成例についての概念的なモジュール構成図である。 第4の実施の形態の構成例についての概念的なモジュール構成図である。 第5の実施の形態の構成例についての概念的なモジュール構成図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
まず、実施の形態を説明する前に、本実施の形態の前提となる文字列の抽出技術について説明する。
文字列の抽出技術とは、文書画像(ビットマップ画像、ストローク画像、ベクトル画像)中の、個々の文字列を抽出する技術である。
本実施の形態は、特に、1つの文字列を構成する個々の要素(以下、「準文字」という)を統合することで文字列を形成する、ボトムアップ指向の文字列の抽出技術に属するものである。文字列の抽出は、文字列の切り出し、文字列の検出ともいわれ、本実施の形態の説明において「文字列を形成する」とは、文字列の抽出、文字列の切り出し、文字列の検出と同義である。
文字列の抽出技術は、文書画像の文字認識や歪み補正等の要素技術として用いられている。
図2に文書画像の例を示す。一般に、文書画像中には、複数の文字列がある。さらに、文字列は個々に固有の形状(サイズ、方向、歪曲、等)を持つ。文字列の抽出技術の目的は、文書画像から、個々の文字列を抽出することである。図2に示す例では、2つの文字列が抽出されるべきである。
文字列抽出の一般的な技術について説明する。特許文献1、特許文献2、特許文献3に開示の技術では、いずれも、1つの文字列を成す個々の要素を統合することで文字列を抽出する、ボトムアップ指向の文字列の抽出技術に属する。
準文字は、例えば、文字が画像である場合(文書画像(ビットマップ画像)内の文字の場合)は、連結画素塊(4連結又は8連結で連結されている画素塊)が該当する。また、文書画像(ストローク画像、ベクトル画像)内の文字の場合は、手書き文字のストローク(具体的には、ペンの動き、タッチパネルにおける指の動き等における一筆分の軌跡)が該当する。準文字は、図2の例に示す文書画像200内の準文字201のように単文字を表す場合もあるが、必ずしも単文字であるとは限らず、準文字202(うかんむりの部分)、準文字203(うかんむりの下のにある「子」の部分)のように、単文字が複数の準文字から成る場合がある。また、その逆に、単一の準文字が複数の単文字から成る場合がある。
ボトムアップ指向の文字列の抽出技術は、個々の文字列に対して、個別に統合を行うため、個々に固有の形状を持つ文字列を抽出する目的で採用されることが多い。
特許文献3、非特許文献1に開示の技術では、先に抽出された誤った文字列中の準文字が、後の文字列の抽出で正しく統合されない、ということが生じる。これは、1つの文字列が抽出される度に、抽出された文字列中の準文字を、準文字のセット(文字列に含まれ得る候補としての準文字の集合)から除去するためである。
図3に例を示す。図3に示す例は、誤った文字列を抽出している。図3の例に示す文字列301のように、先に誤った文字列が抽出され、この文字列中の準文字が、準文字のセットから除去されたため、その後も誤った文字列(すなわち、文字列302、303、304)が抽出されている。
特許文献2、非特許文献2に開示の技術は、抽出された文字列同士を統合し、正しい文字列を抽出しようとするアプローチである。しかし、文字列301、文字列304のように、誤って文字列として抽出された準文字の集合が、真の文字列を成す準文字の部分集合でない場合、誤った文字列が抽出される、ということが生じる。
これらは、準文字が単一の文字列に所属する条件下で文字列を抽出しようとすることに起因する。
特許文献1に開示の技術は、単一の準文字が複数の文字列に所属しうる条件下で、文字列の抽出結果の仮定を複数得ようとするアプローチである。しかし、本アプローチには、先に抽出された正しい文字列中の準文字を、後の文字列の抽出で誤って統合される、ということが生じる。すなわち、誤った文字列が抽出される割合も増加することになる。
図4に例を示す。図4に示す例は、誤った文字列を抽出している。図4の例に示す文字列401のように、先に誤った文字列が抽出されているが、単一の準文字が複数の文字列に所属することを許すため、文字列402(「文字列の切り出し」の文字列)のように正しく文字列が抽出される。しかし、同様の理由で、文字列403、404、405、406のように、誤った文字列が抽出されている。図4の例においては、文字列の抽出結果として、下段の文字列に対しては正しい抽出結果がない。
特に、特許文献3、非特許文献1、非特許文献2に開示の技術のような、追跡型の文字列の抽出技術においては、前述の現象は顕著に現れる。ここで、追跡型とは、1つの文字列の抽出が、既に統合した準文字に基づいて、次に統合すべき準文字があるべき範囲を予測し、これに基づいて準文字を観測する、という処理の繰り返しから成るアプローチを指す。
また、本アプローチにおいては、文字列の抽出結果の仮定に対する取捨選択の後処理が生じる。抽出対象の文字列の形状に自由度が高い程、抽出される文字列の仮定の個数は増加し、取捨選択の処理の負荷は増加する。
以下に示す実施の形態では、単一の準文字が複数の文字列に所属しうる条件下において、1つの文字列を抽出する度に、前記文字列中の準文字に対して、前記文字列に基づく特徴量を付与する。そして、後の文字列の抽出における準文字の採用/不採用の判別において、前記特徴量を参照する。なお、文字列に基づく特徴量とは、文字列の文字列らしさを示す値、すなわち抽出された文字列の正しさを評価するための値である。また、本実施の形態では、文字列の抽出結果の仮定に対する取捨選択の後処理は不要である。
図5に例を示す。いま、文字列の抽出によって、文字列511、512が抽出されている。それぞれ、文字列511は誤った文字列であり、文字列512は正しい文字列である。
後の文字列の抽出において、準文字501と同じ文字列に含まれるとして統合されうる準文字に、準文字502と準文字503の候補があるとする。このとき、準文字501と準文字503の準文字を統合することは誤りである。これは、文字列403、文字列404のような誤った文字列の抽出に相当する。
本実施の形態において、準文字に付与された特徴量を参照することで、文字列511よりも、文字列512の文字列の方が正しいと評価される。つまり、文字列511内の準文字に付与されている特徴量と、文字列512内の準文字に付与されている特徴量とを比較した場合、文字列512内の準文字に付与されている特徴量の方がより文字列らしさを表している特徴量であることを示している。このため、準文字503の準文字は既に正しい文字列512に含まれているものである可能性が高く、準文字502は既に文字列511に含まれているが、正しい文字列として抽出されている可能性が低いため、この場合、準文字502を統合すべきと判別される。結果として、図6の例に示すような正しい文字列(文字列611、612)の抽出結果を得る。
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
第1の実施の形態である情報処理装置は、文字列を抽出するものであって、図1の例に示すように、終了判別モジュール110、範囲設定モジュール120、選択モジュール130、文字列形成モジュール140、文字列出力モジュール150、特徴量算出モジュール160、文字列要素保持モジュール170、準文字保持モジュール180を有している。
第1の実施の形態は、準文字のセットに対して、複数の文字列を検出する。また、図1の例に示す実施の形態による処理フロー例を図7に示す。なお、図1、図7の例における破線部内のモジュール、処理は、1つの文字列を検出するものである。
第1の実施の形態は、1つの文字列を検出する度に、その文字列に含まれている準文字に、その文字列に基づく特徴量を付与する。そして、後の文字列の抽出において、抽出している文字列に含めるべき準文字を選択するか否かの判別において、その特徴量を参照する。
文字列要素とは、準文字の集合である。前述の特許文献、非特許文献に示される技術においては、文字列要素は1つの準文字に相当する。また、任意個数の準文字であってもよい。例えば、文書画像内に含まれている準文字が該当する。
終了判別モジュール110は、範囲設定モジュール120、準文字保持モジュール180と接続されている。終了判別モジュール110は、開始信号108を受け付けると、準文字保持モジュール180から文字列の検出を開始するための文字列要素である開始文字列要素112を検出し、範囲設定モジュール120へ出力する。開始文字列要素112の検出は、文字列の最初の準文字となるものであり、例えば、最初においては、横書きの場合は、文書画像内の左上にある準文字を検出すればよく、縦書きの場合は、文書画像内の右上にある準文字を検出すればよい。そして、文字列出力モジュール150によって1つの文字列が出力された後は、次の文字列の最初の準文字を検出すればよい。例えば、横書きの場合は、出力された文字列を除いた領域において、左上にある準文字を検出すればよく、縦書きの場合は、出力された文字列を除いた領域において、右上にある準文字を検出すればよい。
また、開始文字列要素112が検出されなければ、終了信号114を出力する。つまり、この第1の実施の形態による処理を終了する。
範囲設定モジュール120は、終了判別モジュール110、選択モジュール130と接続されている。範囲設定モジュール120は、文字列要素内から、選択モジュール130によって選択し得る準文字がある範囲を設定する。つまり、次に統合すべき準文字があるべき範囲122を選択モジュール130へ出力する。例えば、横書きの場合は、対象としている準文字の右側にあって、予め定められた距離内を範囲とすればよい。また、縦書きの場合は、対象としている準文字の下側にあって、予め定められた距離内を範囲とすればよい。その範囲内にある準文字が、選択モジュール130によって文字列内に含まれるべき準文字として選択されるか否かの判別の対象とされる。
選択モジュール130は、範囲設定モジュール120、文字列形成モジュール140、準文字保持モジュール180と接続されている。選択モジュール130は、文字列の構成要素である準文字の集合である文字列要素内から、対象としている文字列に含まれる準文字を選択する。そして、選択モジュール130は、特徴量算出モジュール160によって準文字に付与された特徴量に基づいて、対象としている文字列に含まれる準文字を選択する。なお、選択モジュール130によって選択の対象となる準文字として、文字列形成モジュール140によって形成された文字列に含まれている準文字を含む。
つまり、選択モジュール130は、範囲122に基づいて、準文字保持モジュール180から条件を満たす準文字を選択し、出力する。このとき、準文字に付与された特徴量を参照する。
また、選択モジュール130は、範囲設定モジュール120によって設定された範囲にある文字列要素内から、対象としている文字列に含まれる準文字を選択するようにしてもよい。
ここで、「特徴量に基づいて」とは、準文字に付与された特徴量を利用することをいい、その準文字が所属する文字列の正しさを評価することに相当する。これは、特許文献1等に開示された技術と同様の方法を用いればよい。
例えば、対象としている文字列について、その傾きやピッチが大きい程、長さや長細さが小さい程、歪みが大きい程、正しい文字列である可能性(すなわち、評価値)が低い、等とすればよい。いずれも、予め定められた値との比較によって、対象としている準文字が含まれている文字列が正しいか否かを判別するようにしてもよいし、ニューラルネットやブースティングといった手段により、機械学習的に設計してもよい。
具体的には、次のような文字列の正しさの判別方法がある。
(1)前述の特徴量から、1つの評価値を算出し、その大小で判別する。
(2)前述の特徴量を組み合わせ、決定木的に判別する。
次に、対象としている準文字における文字列の正しさを判別した後に、複数の準文字の候補から、予め定められた条件を満たす準文字を選択する。
前述の評価値の順に上位N(予め定められた値)個の準文字を採用してもよいし、予め定められた閾値との比較によって、準文字を選択するか否かを判断してもよい。さらに、予め定められた閾値の参照と上位N個の準文字を選択する方式を組み合わせ、選択する準文字数を制限してもよい。
なお、各準文字の特徴量の初期値として、前述の評価値が最低となるような値を設定すればよい。
文字列形成モジュール140は、選択モジュール130、文字列出力モジュール150、文字列要素保持モジュール170と接続されている。文字列形成モジュール140は、選択モジュール130によって選択された準文字を、対象としている文字列に含めることによって文字列を形成する。
つまり、文字列形成モジュール140は、受け付けた準文字132を文字列要素142として統合し、範囲設定モジュール120と文字列要素保持モジュール170へ出力する。準文字がない場合、又は、適切な文字列要素が統合されない場合、観測失敗信号144を文字列出力モジュール150へ出力する。
範囲設定モジュール120から文字列形成モジュール140による処理を、観測失敗信号144が出力されるまで繰り返す。
文字列出力モジュール150は、文字列形成モジュール140、特徴量算出モジュール160、文字列要素保持モジュール170と接続されている。文字列出力モジュール150は、観測失敗信号144を受け付けると、文字列要素保持モジュール170内の文字列要素142を統合し、文字列152を出力する。ここで出力とは、例えば、メモリーカード等の記憶媒体に記憶すること、他の情報処理装置(例えば、図11に例示の文字列認識装置1120、図12に例示の歪み量推定モジュール1220、歪み補正モジュール1230)へ渡すこと等が含まれる。
特徴量算出モジュール160は、文字列出力モジュール150、準文字保持モジュール180と接続されている。特徴量算出モジュール160は、文字列形成モジュール140によって形成された文字列の文字列らしさを示す特徴量を算出し、その文字列に含まれている準文字にその特徴量を付与する。これによって、準文字を参照すれば、その準文字に付与された特徴量も参照することができる。より具体的には、準文字保持モジュール180に記憶されている準文字に、算出した特徴量を付与する。
つまり、特徴量算出モジュール160は、受け付けた文字列152の準文字に対して、文字列152に基づく特徴量を付与する(特徴量付与162)。また、1つの文字列の検出が終了したことを受け、次の文字列の検出を開始するための信号を終了判別モジュール110へ出力する。
また、特徴量算出モジュール160は、特徴量として、文字列の長さ、文字列の太さ、文字列の傾き、文字列に含まれている準文字又は複数の準文字群間の距離、文字列の歪みのいずれか1つ又はこれらの組み合わせを算出するようにしてもよい。
算出する特徴量は、選択モジュール130によって利用されるものであり、例えば、次のような特徴量がある。これらのうち、いずれか1つ、又は組み合わせを抽出する。
(1)文字列の長さ
例えば、横書きの場合は文字列の外接矩形の幅、縦書きの場合は文字列の外接矩形の縦長が該当する。又は、文字行の始点(一方の端)における中心と終点(他方の端)における中心を結ぶ直線の距離であってもよい。又は、その文字列に含まれている準文字や複数の準文字群(いわゆる単文字)の個数であってもよい。
(2)文字列の太さ
例えば、横書きの場合は文字列の外接矩形の縦長、縦書きの場合は文字列の外接矩形の幅が該当する。又は、横書きの場合は文字列の予め定められた距離毎における縦長の統計量(例えば、平均値、最頻値、中央値、最大値等をいう。以下、同様)、空白以外の場所における縦長の統計量、縦書きの場合は文字列の予め定められた距離毎における幅の統計量、空白以外の場所における幅の統計量等が該当する。
(3)文字列の傾き
例えば、文字行の始点(一方の端)における中心と終点(他方の端)における中心を結ぶ直線の傾きが該当する。
(4)文字列のピッチ(文字列に含まれている準文字又は複数の準文字群間の距離)
例えば、その文字列に含まれている準文字であって、隣り合っている準文字(又は準文字の外接矩形)間の距離が該当する。又は、複数の準文字において、その準文字の外接矩形が重なりあっている場合は、重なりあっている準文字群間の距離としてもよい。
(5)文字列の歪み
例えば、その文字列に含まれている準文字であって、隣り合っている準文字(又は準文字の外接矩形)の中心間を結ぶ直線の傾きの微分値(傾きの差分値であってもよい)の合計値等が該当する。又は、傾きの他に、準文字や単文字間の太さ、位置、ピッチ間の微分値としてもよい。
(6)文字列の長細さ
例えば、前述の文字列の長さと文字列の太さとの比率が該当する。
終了判別モジュール110から特徴量算出モジュール160までの処理を、終了信号114が出力されるまで繰り返す。
文字列要素保持モジュール170は、文字列形成モジュール140、文字列出力モジュール150と接続されている。文字列要素保持モジュール170は、文字列形成モジュール140によって形成された1つの文字列の文字列要素142(準文字)を記憶する。そして、1つの文字列が形成された場合(観測失敗信号144が出力された場合)は、文字列出力モジュール150によって、記憶されている文字列要素142が読み出される。
準文字保持モジュール180は、終了判別モジュール110、選択モジュール130、特徴量算出モジュール160と接続されている。準文字保持モジュール180は、文書画像内に含まれている準文字である文字列要素を記憶している。そして、その準文字には特徴量付与162によって特徴量が付与される。また、終了判別モジュール110、選択モジュール130によって、記憶されている準文字、その準文字に付与されている特徴量が読み出される。
図7は、第1の実施の形態による処理例を示すフローチャートである。
ステップS702では、終了判別モジュール110が、開始文字列要素が作成されたか否かを判断し、作成された場合はステップS704へ進み、それ以外の場合は処理を終了する(ステップS799)。
ステップS704では、範囲設定モジュール120が、開始文字列要素を受け付ける。
ステップS706では、範囲設定モジュール120が、文字列要素に基づいて、範囲を設定する。
ステップS708では、選択モジュール130が、設定された範囲中の準文字から文字列に含めるべき準文字を選択する。
ステップS710では、文字列形成モジュール140が、選択された準文字に基づいて、文字列を形成する。
ステップS712では、文字列形成モジュール140が、文字列要素が観測されなかったか否かを判断し、観測されなかった場合はステップS714へ進み、それ以外の場合はステップS718へ進む。
ステップS714では、文字列出力モジュール150が、文字列の出力を行う。
ステップS716では、特徴量算出モジュール160が、特徴量の算出を行う。
ステップS718では、範囲設定モジュール120が、文字列要素を受け付ける。
図8は、第2の実施の形態の構成例についての概念的なモジュール構成図である。第2の実施の形態は、終了判別モジュール110、範囲設定モジュール820、選択モジュール830、文字列形成モジュール140、文字列出力モジュール150、特徴量算出モジュール160、文字列要素保持モジュール170、準文字保持モジュール180を有している。なお、第1の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。
第2の実施の形態は、準文字のセットに対して、複数の文字列を検出する。また、図8の例に示す実施の形態による処理フロー例を図9に示す。なお、図8、図9の例における破線部内のモジュール、処理は、1つの文字列を検出するものである。
終了判別モジュール110は、範囲設定モジュール820、準文字保持モジュール180と接続されている。
範囲設定モジュール820は、終了判別モジュール110、選択モジュール830と接続されている。範囲設定モジュール820は、第1の実施の形態における範囲設定モジュール120と同等の処理を行う。そして、選択モジュール830に対して、統合パラメータ824を渡す。統合パラメータ824とは、1つの文字列の形成において、次に選択すべき準文字があるべき範囲を予測するためのパラメータである。例えば、文字列形成モジュール140によって形成途中である文字列の特徴量が該当する。ここでの特徴量には、特徴量算出モジュール160が算出した特徴量が該当し、具体的には、前述の文字列の長さ、文字列の太さ、文字列の傾き、文字列に含まれている準文字又は複数の準文字群間の距離、文字列の歪みのいずれか1つ又はこれらの組み合わせがある。また、この特徴量は、形成途中である文字列に対して付与されているものである。
選択モジュール830は、範囲設定モジュール820、文字列形成モジュール140、準文字保持モジュール180と接続されている。選択モジュール830は、第1の実施の形態における選択モジュール130が行う処理に加えて、文字列形成モジュール140によって形成途中である文字列の特徴量と既に形成された文字列に含まれている準文字に付与されている特徴量とを比較して、対象としている文字列に含まれる準文字を選択する。つまり、選択モジュール830は、統合パラメータ824を参照して、準文字を選択する。また、統合パラメータ824と比較対象となる「既に形成された文字列」とは、既に文字列形成モジュール140によって形成された文字列であって、文字列出力モジュール150によって出力された文字列が該当する。つまり、第1の実施の形態では、選択すべき準文字に付与された特徴量によって判断されているが、第2の実施の形態では、選択すべき準文字に付与された特徴量と形成途中の文字列の特徴量とを比較することによって、準文字を選択すべきか否かを判別している。
また、選択モジュール830は、さらに、統合パラメータ824を用いた選択と、予め定められた閾値の参照又は上位N個の準文字を選択する方式を組み合わせ、選択する準文字数を制限してもよい。
文字列形成モジュール140は、選択モジュール830、文字列出力モジュール150、文字列要素保持モジュール170と接続されている。
準文字保持モジュール180は、終了判別モジュール110、選択モジュール830、特徴量算出モジュール160と接続されている。
図9は、第2の実施の形態による処理例を示すフローチャートである。
ステップS902では、終了判別モジュール110が、開始文字列要素が作成されたか否かを判断し、作成された場合はステップS904へ進み、それ以外の場合は処理を終了する(ステップS999)。
ステップS904では、範囲設定モジュール820が、開始文字列要素を受け付ける。
ステップS906では、範囲設定モジュール820が、文字列要素に基づいて、範囲を設定し、選択モジュール830に統合パラメータ824を渡す。
ステップS908では、選択モジュール830が、統合パラメータ824に基づいて、設定された範囲中の準文字から文字列に含めるべき準文字を選択する。
ステップS910では、文字列形成モジュール140が、選択された準文字に基づいて、文字列を形成する。
ステップS912では、文字列形成モジュール140が、文字列要素が観測されなかったか否かを判断し、観測されなかった場合はステップS914へ進み、それ以外の場合はステップS918へ進む。
ステップS914では、文字列出力モジュール150が、文字列の出力を行う。
ステップS916では、特徴量算出モジュール160が、特徴量の算出を行う。
ステップS918では、範囲設定モジュール820が、文字列要素を受け付ける。
図10は、第3の実施の形態の構成例についての概念的なモジュール構成図である。第3の実施の形態である文字列処理装置1000は、準文字作成モジュール1010、文字列切り出しモジュール1020、準文字保持モジュール1030を有している。第3の実施の形態は、第1の実施の形態又は第2の実施の形態のいずれか一方を利用して、文書画像1008内の文字列を検出するものである。
準文字作成モジュール1010は、文字列切り出しモジュール1020、準文字保持モジュール1030と接続されている。
文字列切り出しモジュール1020は、準文字作成モジュール1010、準文字保持モジュール1030と接続されている。
準文字保持モジュール1030は、準文字作成モジュール1010、文字列切り出しモジュール1020と接続されている。
文字列切り出しモジュール1020は、第1の実施の形態又は第2の実施の形態のいずれか一方に相当する。説明のため、第1の実施の形態又は第2の実施の形態の準文字保持モジュール180を取り出して準文字保持モジュール1030として図示する(つまり、準文字保持モジュール1030は準文字保持モジュール180と同等である)。
準文字作成モジュール1010は、受け付けた文書画像1008から、準文字1014を抽出し、その準文字1014を準文字保持モジュール1030に記憶させる。文書画像1008中のすべての準文字を抽出し終えたとき、開始信号1012を文字列切り出しモジュール1020へ出力する。
なお、図10内の文字列1022は図1、8内の文字列152に相当し、図10内の特徴量付与1024は図1、8内の特徴量付与162に相当し、図10内の終了信号1026は図1、8内の終了信号114に相当する。
図11は、第4の実施の形態の構成例についての概念的なモジュール構成図である。第4の実施の形態は、文字列処理装置1000、文字列認識装置1120を有しており、第3の実施の形態を文字認識に利用するものである。第4の実施の形態は、第3の実施の形態である文字列処理装置1000の出力である文字列1112(図10内の文字列1022)を、文字列認識装置1120が受け付けて、文字認識する。
文字列処理装置1000は、文字列認識装置1120と接続されている。
文字列認識装置1120は、文字列処理装置1000と接続されている。文字列認識装置1120は、文字列処理装置1000の文字列形成モジュール140によって形成された文字列1112内の文字を認識し、その文字列内の文字認識結果1122を出力する。文字認識結果1122とは、文字列1112に対する、個々の単文字の位置とテキストコードによって構成されている。
図12は、第5の実施の形態の構成例についての概念的なモジュール構成図である。第5の実施の形態は、文字列処理装置1000、歪み量推定モジュール1220、歪み補正モジュール1230を有しており、第3の実施の形態を文書画像の歪み補正に利用するものである。第5の実施の形態は、第3の実施の形態である文字列処理装置1000の出力を、歪み量推定モジュール1220が受け付け、歪み量推定モジュール1220の出力を、歪み補正モジュール1230が受け付けて、文書画像1208の歪みを補正する。例えば、第5の実施の形態をカメラ付きの携帯情報処理装置に内蔵させ、そのカメラで文書を撮影して、撮影結果である文書画像1208の歪みを補正する。
文字列処理装置1000は、歪み量推定モジュール1220、歪み補正モジュール1230と接続されている。
歪み量推定モジュール1220は、文字列処理装置1000、歪み補正モジュール1230と接続されている。歪み量推定モジュール1220は、文字列処理装置1000の文字列形成モジュール140によって形成された文字列の歪みを算出する。つまり、文字列処理装置1000から文字列1212を受け付けて、補正に必要な文字列の歪み量1222を推定する。
歪み補正モジュール1230は、文字列処理装置1000、歪み量推定モジュール1220と接続されている。歪み補正モジュール1230は、歪み量推定モジュール1220によって算出された歪み量1222に基づいて、その文字列を含む文書画像1208の歪みを補正する。つまり、歪み補正モジュール1230は、複数の文字列の歪みを対象としているため、文字列処理装置1000がすべての文字列を検出したことを示す終了信号1214を出力すると、処理を開始する。歪み量推定モジュール1220によって推定された歪み量1222に基づいて、文書画像1208の歪みを補正し、歪み補正文書画像1232を出力する。
なお、「文字列の歪みに基づいて」とは、各文字列の歪みの統計量を解消するように補正することをいう。
図13を参照して、本実施の形態の情報処理装置のハードウェア構成例について説明する。図13に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部1317と、プリンタなどのデータ出力部1318を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)1301は、前述の実施の形態において説明した各種のモジュール、すなわち、終了判別モジュール110、範囲設定モジュール120、選択モジュール130、文字列形成モジュール140、文字列出力モジュール150、特徴量算出モジュール160、範囲設定モジュール820、選択モジュール830、文字列処理装置1000、準文字作成モジュール1010、文字列切り出しモジュール1020、文字列認識装置1120、歪み量推定モジュール1220、歪み補正モジュール1230等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)1302は、CPU1301が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1303は、CPU1301の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス1304により相互に接続されている。
ホストバス1304は、ブリッジ1305を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス1306に接続されている。
キーボード1308、マウス等のポインティングデバイス1309は、操作者により操作される入力デバイスである。ディスプレイ1310は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)1311は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1301によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、対象となる文書画像、形成した文字列などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ1312は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1313に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1307、外部バス1306、ブリッジ1305、及びホストバス1304を介して接続されているRAM1303に供給する。リムーバブル記録媒体1313も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート1314は、外部接続機器1315を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1314は、インタフェース1307、及び外部バス1306、ブリッジ1305、ホストバス1304等を介してCPU1301等に接続されている。通信部1316は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部1317は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1318は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、前述の実施の形態では、文字列の抽出を1回行うが、これを複数回繰り返して行うようにしてもよい。例えば、2回目以降の文字列の抽出は、前回の文字列の抽出の方向とは逆方向から文字列を抽出するようにしてもよい。つまり、2回目以降では、終了判別モジュール110は、前回の抽出した文字列の終端を開始文字列要素112として検出する。そして、範囲設定モジュール120は、前回とは逆方向に準文字を選択する範囲122を設定する。そして、終了条件として、前回の始点が今回の終点と合致したならば終了するようにしてもよいし、予め定められた回数の繰り返しを行うようにしてもよい。
なお、図13に示す情報処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図13に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図13に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
110…終了判別モジュール
120…範囲設定モジュール
130…選択モジュール
140…文字列形成モジュール
150…文字列出力モジュール
160…特徴量算出モジュール
170…文字列要素保持モジュール
180…準文字保持モジュール
820…範囲設定モジュール
830…選択モジュール
1010…準文字作成モジュール
1020…文字列切り出しモジュール
1030…準文字保持モジュール
1220…歪み量推定モジュール
1230…歪み補正モジュール

Claims (6)

  1. 文字列の構成要素である準文字の集合である文字列要素内から、対象としている文字列に含まれる準文字を選択する準文字選択手段と、
    前記準文字選択手段によって選択された準文字を、前記対象としている文字列に含めることによって文字列を形成する文字列形成手段と、
    前記文字列形成手段によって形成された文字列の文字列らしさを示す特徴量を算出し、該文字列に含まれている準文字に該特徴量を付与する特徴量付与手段
    を具備し、
    前記準文字選択手段によって選択の対象となる準文字として、前記文字列形成手段によって形成された文字列に含まれている準文字を含み、
    前記準文字選択手段は、前記特徴量付与手段によって準文字に付与された特徴量に基づいて、前記対象としている文字列に含まれる準文字を選択し、
    前記準文字選択手段は、前記文字列形成手段によって形成途中である文字列の特徴量と既に形成された文字列に含まれている準文字に付与されている特徴量とを比較して、対象としている文字列に含まれる準文字を選択する
    ことを特徴とする情報処理装置。
  2. 前記文字列要素内から、前記準文字選択手段によって選択し得る準文字がある範囲を設定する範囲設定手段
    をさらに具備し、
    前記準文字選択手段は、前記範囲設定手段によって設定された範囲にある文字列要素内から、対象としている文字列に含まれる準文字を選択する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記特徴量付与手段は、特徴量として、文字列の長さ、文字列の太さ、文字列の傾き、文字列に含まれている準文字又は複数の準文字群間の距離、文字列の歪み、文字列の長細さのいずれか1つ又はこれらの組み合わせを算出する
    ことを特徴とする請求項1又は2に記載の情報処理装置。
  4. 前記文字列形成手段によって形成された文字列内の文字を認識し、文字認識結果を出力する文字認識手段
    をさらに具備することを特徴とする請求項1からのいずれか1項に記載の情報処理装置。
  5. 前記文字列形成手段によって形成された文字列の歪みを算出する歪み算出手段と、
    前記歪み算出手段によって算出された歪みに基づいて、前記文字列を含む文書の歪みを補正する補正手段
    をさらに具備することを特徴とする請求項1からのいずれか1項に記載の情報処理装置。
  6. コンピュータを、
    文字列の構成要素である準文字の集合である文字列要素内から、対象としている文字列に含まれる準文字を選択する準文字選択手段と、
    前記準文字選択手段によって選択された準文字を、前記対象としている文字列に含めることによって文字列を形成する文字列形成手段と、
    前記文字列形成手段によって形成された文字列の文字列らしさを示す特徴量を算出し、該文字列に含まれている準文字に該特徴量を付与する特徴量付与手段
    として機能させ、
    前記準文字選択手段によって選択の対象となる準文字として、前記文字列形成手段によって形成された文字列に含まれている準文字を含み、
    前記準文字選択手段は、前記特徴量付与手段によって準文字に付与された特徴量に基づいて、前記対象としている文字列に含まれる準文字を選択し、
    前記準文字選択手段は、前記文字列形成手段によって形成途中である文字列の特徴量と既に形成された文字列に含まれている準文字に付与されている特徴量とを比較して、対象としている文字列に含まれる準文字を選択する
    ことを特徴とする情報処理プログラム。
JP2012000231A 2012-01-04 2012-01-04 情報処理装置及び情報処理プログラム Active JP5935324B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012000231A JP5935324B2 (ja) 2012-01-04 2012-01-04 情報処理装置及び情報処理プログラム
CN201210281080.3A CN103198291B (zh) 2012-01-04 2012-08-08 信息处理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012000231A JP5935324B2 (ja) 2012-01-04 2012-01-04 情報処理装置及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2013140487A JP2013140487A (ja) 2013-07-18
JP5935324B2 true JP5935324B2 (ja) 2016-06-15

Family

ID=48720829

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012000231A Active JP5935324B2 (ja) 2012-01-04 2012-01-04 情報処理装置及び情報処理プログラム

Country Status (2)

Country Link
JP (1) JP5935324B2 (ja)
CN (1) CN103198291B (ja)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3585143B2 (ja) * 1996-07-17 2004-11-04 日本電信電話株式会社 文字列抽出方法および装置
JPH1196288A (ja) * 1997-09-18 1999-04-09 Hitachi Ltd 文字行方向検出方法および文字行方向検出装置
JP4395188B2 (ja) * 1997-11-28 2010-01-06 富士通株式会社 文書画像認識装置および文書画像認識プログラムの記憶媒体
JP2000181993A (ja) * 1998-12-16 2000-06-30 Fujitsu Ltd 文字認識方法および装置
JP2004038530A (ja) * 2002-07-03 2004-02-05 Ricoh Co Ltd 画像処理方法、同方法の実行に用いるプログラム及び画像処理装置
CN101520851A (zh) * 2008-02-29 2009-09-02 富士通株式会社 字符信息识别装置和方法
JP5488077B2 (ja) * 2010-03-15 2014-05-14 オムロン株式会社 文字列検知装置、文字評価装置、画像処理装置、文字列検知方法、文字評価方法、制御プログラムおよび記録媒体
JP5591578B2 (ja) * 2010-04-19 2014-09-17 日本電産サンキョー株式会社 文字列認識装置および文字列認識方法

Also Published As

Publication number Publication date
JP2013140487A (ja) 2013-07-18
CN103198291A (zh) 2013-07-10
CN103198291B (zh) 2017-11-28

Similar Documents

Publication Publication Date Title
JP6119952B2 (ja) 画像処理装置及び画像処理プログラム
US10740899B2 (en) Image processing apparatus for identifying region within image, information processing method, and storage medium
KR101235226B1 (ko) 화상 처리 장치, 화상 처리 방법 및 기록 매체
US9280725B2 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
US20150213332A1 (en) Image processing apparatus, non-transitory computer readable medium, and image processing method
JP6187323B2 (ja) 画像処理装置及び画像処理プログラム
US8787676B2 (en) Image processing apparatus, computer readable medium storing program, and image processing method
JP5935324B2 (ja) 情報処理装置及び情報処理プログラム
JP5821648B2 (ja) 情報処理装置及び情報処理プログラム
JP5640645B2 (ja) 画像処理装置及び画像処理プログラム
JP5724341B2 (ja) 画像処理装置及び画像処理プログラム
JP6003375B2 (ja) 画像処理装置及び画像処理プログラム
JP2017010187A (ja) 画像処理装置及び画像処理プログラム
JP6260350B2 (ja) 画像処理装置及び画像処理プログラム
JP6187307B2 (ja) 画像処理装置及び画像処理プログラム
JP6511942B2 (ja) 情報処理装置および情報処理プログラム
JP5949248B2 (ja) 情報処理装置及び情報処理プログラム
JP5845724B2 (ja) 画像処理装置及び画像処理プログラム
JP2016053797A (ja) 画像処理装置及び画像処理プログラム
JP6409423B2 (ja) 画像処理装置及び画像処理プログラム
JP2016009235A (ja) 情報処理装置及び情報処理プログラム
JP5991076B2 (ja) 画像処理装置及び画像処理プログラム
JP5673033B2 (ja) 画像処理装置及び画像処理プログラム
JP6003677B2 (ja) 画像処理装置及び画像処理プログラム
JP2012008909A (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141211

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160412

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160425

R150 Certificate of patent or registration of utility model

Ref document number: 5935324

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350