JP6119689B2

JP6119689B2 - 電子文書生成システム、電子文書生成装置およびプログラム

Info

Publication number: JP6119689B2
Application number: JP2014143600A
Authority: JP
Inventors: 匡晃坂
Original assignee: Konica Minolta Inc
Current assignee: Konica Minolta Inc
Priority date: 2014-07-11
Filing date: 2014-07-11
Publication date: 2017-04-26
Anticipated expiration: 2034-07-11
Also published as: US20160014299A1; JP2016021086A; US9398191B2; CN105320933A; CN105320933B

Description

本発明は、電子文書を生成する電子文書生成システムおよびそれに関連する技術に関する。

ＭＦＰ（マルチ・ファンクション・ペリフェラル（Multi-Functional Peripheral））などの画像形成装置において、原稿をスキャンして電子文書を作成する技術が存在する。

このような技術においては、原稿のスキャン画像をそのまま取り込んで電子文書を生成するものの他、テキストデータ付き電子文書（次述）を生成するものも存在する（特許文献１等参照）。具体的には、原稿のスキャン画像（特に文字を示す画像）に対して光学文字認識処理（以下、ＯＣＲ（Optical Character Recognition）処理とも称する）が施され、当該スキャン画像内の文字のテキストデータが自動認識され、当該テキストデータが非表示状態で当該スキャン画像に重畳して埋め込まれる。このようにして、たとえば、透明テキスト付きＰＤＦ（Portable Document Format）（あるいはサーチャブルＰＤＦ）などと呼ばれる所定形式の電子文書（テキストデータ付き電子文書）が生成される。

特開２０１２−７３７４９号公報

ところで、各種のアプリケーションソフトウエアに係るサービスをクラウドサーバを用いて提供する技術が存在する。また、このようなクラウドサービス（アプリケーションサービス）として、汎用的なＯＣＲ処理サービスを提供するものも存在する。ただし、汎用のＯＣＲ処理サービスでは、基本的機能のみ（ＯＣＲ処理のみ）が提供され、テキストデータ付き電子文書は生成されない。そのため、テキストデータ付き電子文書の最終的な生成処理は、依頼元装置側で行われることを要する。

汎用的なＯＣＲ処理サービスが利用される場合においては、たとえば、まず依頼元装置（詳細には、依頼元装置で実行中の或るアプリケーション）からクラウドサーバ（詳細には、クラウドサーバで実行中の別アプリケーション）へとスキャン画像が送信される。そして、当該スキャン画像全体に関するＯＣＲ処理がクラウドサーバで実行され、その処理結果がクラウドサーバから依頼元装置へと返信される。当該依頼元装置は、クラウドサーバから受信したＯＣＲ処理結果を元のスキャン画像に埋め込んで、テキストデータ付き電子文書（サーチャブルＰＤＦ（透明テキスト付きＰＤＦ）等）を生成する。なお、汎用ＯＣＲ処理サービスを利用することによれば、ＯＣＲ処理の依頼元装置（たとえば画像形成装置（スキャン画像の生成装置））とは別の装置でＯＣＲ処理を行うことができるので、当該依頼元装置の処理負荷を低減することが可能である。

しかしながら、たとえば依頼元装置から別装置（クラウドサーバ）に対してスキャン画像に関するＯＣＲ処理指示を付与し、そのＯＣＲ処理結果を用いて、上述のようなテキストデータ付き電子文書を生成する場合には、スキャン画像内の文字画像とテキストデータとがずれて配置されるという問題が生じ得る。たとえば、ＯＣＲ処理結果（テキストデータ）に係る文字列とスキャン画像内の文字列（文字画像としての文字列）とがその各文字の大きさが互いに異なる状態で同じページ内に配置される場合には、ＯＣＲ処理結果に係る文字列が、その配列方向において、スキャン画像内の文字画像としての文字列とは大きく異なる位置に配置される。詳細には、両文字列の最初の位置は合っているとしても、特に文字列の配列方向後端側においてその位置ずれが顕著になる。

このような問題は、クラウドサーバから依頼元装置へはＯＣＲ処理結果（文字列認識結果）のみが返送され、認識された文字のサイズは返送されないこと等に起因して生じる。特に、クラウドサーバ側のアプリケーションでの処理結果の出力形態がほぼ固定されている場合（当該出力形態を依頼元の電子文書生成アプリケーションが自由に決定することができない場合等）に、このような問題が顕著に生じ得る。

そこで、この発明は、或る装置から別の装置に対してＯＣＲ処理を依頼し、その処理結果を用いて電子文書を生成する技術において、ＯＣＲ処理結果に係る文字列をその配列方向において比較的正確な位置に配置することが可能な技術を提供することを課題とする。

上記課題を解決すべく、請求項１の発明は、電子文書生成システムであって、原稿のスキャン画像に基づき電子文書を生成する第１の装置と、前記第１の装置からの依頼に基づいて前記スキャン画像に対する光学文字認識処理を実行し、当該光学文字認識処理の処理結果を前記第１の装置に送出する第２の装置と、を備え、前記第１の装置は、前記スキャン画像内にて或る方向に配列された１行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出する抽出手段と、前記行領域の大きさを検出する検出手段と、前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向における文字サイズである配列方向文字サイズを決定する決定手段と、前記光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを、前記第２の装置に送出する指示送出手段と、前記処理対象領域に関する前記光学文字認識処理の処理結果を前記第２の装置から受け取る受取手段と、前記決定手段により決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成する生成手段と、を有し、前記抽出手段は、前記スキャン画像内の複数の部分領域のそれぞれを前記処理対象領域として抽出し、前記指示送出手段は、前記光学文字認識処理を前記複数の部分領域のそれぞれに関して行うべき旨の指示と前記複数の部分領域のそれぞれの画像データとを、前記第２の装置に送出し、前記受取手段は、前記複数の部分領域のそれぞれに関する前記光学文字認識処理の処理結果を前記第２の装置から受け取り、前記生成手段は、前記複数の部分領域のそれぞれに関して前記決定手段により決定された前記配列方向文字サイズに基づいて、前記複数の部分領域のそれぞれに関する前記処理結果に係る文字列を前記複数の部分領域のそれぞれに配置することを特徴とする。

請求項２の発明は、請求項１の発明に係る電子文書生成システムにおいて、前記決定手段は、前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする。

請求項３の発明は、請求項２の発明に係る電子文書生成システムにおいて、前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、前記決定手段は、前記複数行の文字列のうちの任意の１行の文字列に関する領域である前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする。

請求項４の発明は、請求項２の発明に係る電子文書生成システムにおいて、前記抽出手段は、単一行の文字列に係る領域を前記処理対象領域として抽出し、前記決定手段は、前記単一行の文字列に関する領域である前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする。

請求項５の発明は、請求項２の発明に係る電子文書生成システムにおいて、前記抽出手段は、前記１行の文字列の前記配列方向における全範囲のうち一部の範囲の領域を前記処理対象領域として抽出し、前記決定手段は、前記一部の範囲の領域の前記配列方向における長さを前記一部の範囲の領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする。

請求項６の発明は、請求項１の発明に係る電子文書生成システムにおいて、前記決定手段は、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを前記行領域の前記直交方向における長さに基づいて決定するとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする。

請求項７の発明は、請求項６の発明に係る電子文書生成システムにおいて、前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、前記決定手段は、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて前記行領域の前記直交方向における長さを検出し、前記行領域の前記直交方向における当該長さに基づいて前記直交方向文字サイズを決定するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする。

請求項８の発明は、請求項６の発明に係る電子文書生成システムにおいて、前記抽出手段は、単一行の文字列に係る領域を前記処理対象領域として抽出し、前記決定手段は、前記単一行の文字列に係る領域の前記直交方向における長さに基づいて前記直交方向文字サイズを算出するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする。

請求項９の発明は、請求項６の発明に係る電子文書生成システムにおいて、前記抽出手段は、前記１行の文字列の前記配列方向における全範囲のうちの一部の範囲の領域を前記処理対象領域として抽出し、前記決定手段は、前記一部の範囲の領域の前記直交方向における長さに基づいて前記直交方向文字サイズを算出するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする。

請求項１０の発明は、請求項１の発明に係る電子文書生成システムにおいて、前記決定手段は、前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記処理対象領域に関する前記配列方向文字サイズを決定するとともに、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを、前記行領域の前記直交方向における長さに基づいて決定し、前記生成手段は、前記決定手段により決定された前記配列方向文字サイズと前記直交方向文字サイズとに基づいて前記処理結果に係る文字列を前記電子文書内に配置して、前記電子文書を生成することを特徴とする。

請求項１１の発明は、請求項１ないし請求項１０のいずれかの発明に係る電子文書生成システムにおいて、前記検出手段は、前記スキャン画像内での前記処理対象領域の位置をも検出し、前記生成手段は、前記処理対象領域の前記位置にも基づいて前記処理結果に係る文字列を前記電子文書内に配置することを特徴とする。

請求項１２の発明は、請求項１ないし請求項１１のいずれかの発明に係る電子文書生成システムにおいて、前記第１の装置は、画像形成装置であり、前記第２の装置は、クラウドサーバであることを特徴とする。

請求項１３の発明は、請求項１ないし請求項１１のいずれかの発明に係る電子文書生成システムにおいて、前記第１の装置は、画像形成装置であり、前記第２の装置は、通信端末であることを特徴とする。

請求項１４の発明は、請求項１ないし請求項１１のいずれかの発明に係る電子文書生成システムにおいて、前記第１の装置は、通信端末であり、前記第２の装置は、クラウドサーバであることを特徴とする。

請求項１５の発明は、原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置であって、前記スキャン画像内にて或る方向に配列された１行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出する抽出手段と、前記行領域の大きさを検出する検出手段と、前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向における文字サイズである配列方向文字サイズを決定する決定手段と、光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出する指示送出手段と、前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取る受取手段と、前記決定手段により決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成する生成手段と、を備え、前記抽出手段は、前記スキャン画像内の複数の部分領域のそれぞれを前記処理対象領域として抽出し、前記指示送出手段は、前記光学文字認識処理を前記複数の部分領域のそれぞれに関して行うべき旨の指示と前記複数の部分領域のそれぞれの画像データとを、前記外部装置に送出し、前記受取手段は、前記複数の部分領域のそれぞれに関する前記光学文字認識処理の処理結果を前記外部装置から受け取り、前記生成手段は、前記複数の部分領域のそれぞれに関して前記決定手段により決定された前記配列方向文字サイズに基づいて、前記複数の部分領域のそれぞれに関する前記処理結果に係る文字列を前記複数の部分領域のそれぞれに配置することを特徴とする。

請求項１６の発明は、請求項１５の発明に係る電子文書生成装置において、前記決定手段は、前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする。

請求項１７の発明は、請求項１６の発明に係る電子文書生成装置において、前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、前記決定手段は、前記複数行の文字列のうちの任意の１行の文字列に関する領域である前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする。

請求項１８の発明は、請求項１６の発明に係る電子文書生成装置において、前記抽出手段は、単一行の文字列に係る領域を前記処理対象領域として抽出し、前記決定手段は、前記単一行の文字列に関する領域である前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする。

請求項１９の発明は、請求項１６の発明に係る電子文書生成装置において、前記抽出手段は、前記１行の文字列の前記配列方向における全範囲のうち一部の範囲の領域を前記処理対象領域として抽出し、前記決定手段は、前記一部の範囲の領域の前記配列方向における長さを前記一部の範囲の領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする。

請求項２０の発明は、請求項１５の発明に係る電子文書生成装置において、前記決定手段は、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを前記行領域の前記直交方向における長さに基づいて決定するとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする。

請求項２１の発明は、請求項２０の発明に係る電子文書生成装置において、前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、前記決定手段は、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて前記行領域の前記直交方向における長さを算出し、前記行領域の前記直交方向における当該長さに基づいて前記直交方向文字サイズを決定するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする。

請求項２２の発明は、請求項２０の発明に係る電子文書生成装置において、前記抽出手段は、単一行の文字列に係る領域を前記処理対象領域として抽出し、前記決定手段は、前記単一行の文字列に係る領域の前記直交方向における長さに基づいて前記直交方向文字サイズを算出するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする。

請求項２３の発明は、請求項２０の発明に係る電子文書生成装置において、前記抽出手段は、前記１行の文字列の前記配列方向における全範囲のうちの一部の範囲の領域を前記処理対象領域として抽出し、前記決定手段は、前記一部の範囲の領域の前記直交方向における長さに基づいて前記直交方向文字サイズを算出するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする。

請求項２４の発明は、請求項１５の発明に係る電子文書生成装置において、前記決定手段は、前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記処理対象領域に関する前記配列方向文字サイズを決定するとともに、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを、前記行領域の前記直交方向における長さに基づいて決定し、前記生成手段は、前記決定手段により決定された前記配列方向文字サイズと前記直交方向文字サイズとに基づいて前記処理結果に係る文字列を前記電子文書内に配置して、前記電子文書を生成することを特徴とする。

請求項２５の発明は、請求項１５ないし請求項２４のいずれかの発明に係る電子文書生成装置において、前記検出手段は、前記スキャン画像内での前記処理対象領域の位置をも検出し、前記生成手段は、前記処理対象領域の前記位置にも基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成することを特徴とする。

請求項２６の発明は、請求項１５ないし請求項２５のいずれかの発明に係る電子文書生成装置において、前記電子文書生成装置は、画像形成装置であることを特徴とする。

請求項２７の発明は、請求項１５ないし請求項２５のいずれかの発明に係る電子文書生成装置において、前記電子文書生成装置は、前記スキャン画像を生成する画像形成装置とは異なる通信装置であって前記外部装置とも異なる通信装置であることを特徴とする。

請求項２８の発明は、原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置に内蔵されたコンピュータに、ａ）前記スキャン画像内にて或る方向に配列された１行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出するステップと、ｂ）前記行領域の大きさを検出するステップと、ｃ）前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向における文字サイズである配列方向文字サイズを決定するステップと、ｄ）光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出するステップと、ｅ）前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取るステップと、ｆ）前記ステップｃ）にて決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置するステップと、を実行させるためのプログラムであって、前記ステップａ）においては、前記スキャン画像内の複数の部分領域のそれぞれが前記処理対象領域として抽出され、前記ステップｄ）においては、前記光学文字認識処理を前記複数の部分領域のそれぞれに関して行うべき旨の指示と前記複数の部分領域のそれぞれの画像データとが、前記外部装置に送出され、前記ステップｅ）においては、前記複数の部分領域のそれぞれに関する前記光学文字認識処理の処理結果が前記外部装置から受け取られ、前記ステップｆ）においては、前記複数の部分領域のそれぞれに関して前記ステップｃ）にて決定された前記配列方向文字サイズに基づいて、前記複数の部分領域のそれぞれに関する前記処理結果に係る文字列が前記複数の部分領域のそれぞれに配置されることを特徴とする。

請求項２９の発明は、原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置であって、複数行の文字列を含む処理対象領域を前記スキャン画像から抽出する抽出手段と、前記処理対象領域の大きさを検出する検出手段と、前記処理対象領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記処理対象領域内の文字列の配列方向における文字サイズである配列方向文字サイズを決定する決定手段と、光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出する指示送出手段と、前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取る受取手段と、前記決定手段により決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成する生成手段と、を備え、前記決定手段は、前記処理対象領域内の文字の文字サイズであって前記配列方向に直交する直交方向の文字サイズである直交方向文字サイズを、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて決定するとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする。

請求項３０の発明は、原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置に内蔵されたコンピュータに、ａ）複数行の文字列を含む処理対象領域を前記スキャン画像から抽出するステップと、ｂ）前記処理対象領域の大きさを検出するステップと、ｃ）前記処理対象領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記処理対象領域内の文字列の配列方向における文字サイズである配列方向文字サイズを決定するステップと、ｄ）光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出するステップと、ｅ）前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取るステップと、ｆ）前記ステップｃ）にて決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置するステップと、を実行させるためのプログラムであって、前記ステップｃ）は、ｃ−１）前記処理対象領域内の文字の文字サイズであって前記配列方向に直交する直交方向の文字サイズである直交方向文字サイズを、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて決定するステップと、ｃ−２）前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定するステップと、を有することを特徴とする。
請求項３１の発明は、電子文書生成システムであって、原稿のスキャン画像に基づき電子文書を生成する第１の装置と、前記第１の装置からの依頼に基づいて前記スキャン画像に対する光学文字認識処理を実行し、当該光学文字認識処理の処理結果を前記第１の装置に送出する第２の装置と、を備え、前記第１の装置は、前記スキャン画像内にて或る方向に配列された１行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出する抽出手段と、前記行領域の大きさを検出する検出手段と、前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向における文字サイズである配列方向文字サイズを決定する決定手段と、前記光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを、前記第２の装置に送出する指示送出手段と、前記処理対象領域に関する前記光学文字認識処理の処理結果を前記第２の装置から受け取る受取手段と、前記決定手段により決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成する生成手段と、を有し、前記決定手段は、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを前記行領域の前記直交方向における長さに基づいて決定するとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定し、前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、前記決定手段は、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて前記行領域の前記直交方向における長さを検出し、前記行領域の前記直交方向における当該長さに基づいて前記直交方向文字サイズを決定するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする。
請求項３２の発明は、原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置であって、前記スキャン画像内にて或る方向に配列された１行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出する抽出手段と、前記行領域の大きさを検出する検出手段と、前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向における文字サイズである配列方向文字サイズを決定する決定手段と、光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出する指示送出手段と、前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取る受取手段と、前記決定手段により決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成する生成手段と、を備え、前記決定手段は、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを前記行領域の前記直交方向における長さに基づいて決定するとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定し、前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、前記決定手段は、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて前記行領域の前記直交方向における長さを算出し、前記行領域の前記直交方向における当該長さに基づいて前記直交方向文字サイズを決定するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする。
請求項３３の発明は、原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置に内蔵されたコンピュータに、ａ）前記スキャン画像内にて或る方向に配列された１行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出するステップと、ｂ）前記行領域の大きさを検出するステップと、ｃ）前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向における文字サイズである配列方向文字サイズを決定するステップと、ｄ）光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出するステップと、ｅ）前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取るステップと、ｆ）前記ステップｃ）にて決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置するステップと、を実行させるためのプログラムであって、前記ステップｃ）においては、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズが前記行領域の前記直交方向における長さに基づいて決定されるとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズが決定され、前記ステップａ）においては、複数行の文字列を含む領域が前記処理対象領域として抽出され、前記ステップｃ）においては、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて前記行領域の前記直交方向における長さが算出され、前記行領域の前記直交方向における当該長さに基づいて前記直交方向文字サイズが決定されるとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズが決定されることを特徴とする。

請求項１ないし請求項３３に記載の発明によれば、或る装置から別の装置に対してＯＣＲ処理を依頼し、その処理結果を用いて電子文書を生成するに際して、ＯＣＲ処理結果に係る文字列をその配列方向において比較的正確な位置に配置することが可能である。

画像形成システム（電子文書生成システム）を示す図である。画像形成装置の機能ブロックを示す図である。外部端末の概略構成を示す機能ブロック図である。電子文書生成システムにおける動作の概略を示す図である。外部端末の動作を示すフローチャートである。スキャン画像を示す図である。３つの部分領域（処理対象領域）が抽出された様子を示す図である。各部分領域の位置情報等を示す図である。処理対象領域の抽出処理等について説明する図である。ＯＣＲ処理によって生成されるテキストデータ等を示す図である。第１実施形態に係る文字配置結果を示す図である。比較例に係る文字配置結果を示す図である。２つの部分領域が抽出された様子を示す図である（第４実施形態）。部分領域内の行領域を示す図である。別のスキャン画像を示す図である。４つの部分領域（処理対象領域）が抽出された様子を示す図である。第５実施形態に係る文字配置結果を示す図である。別の比較例に係る文字配置結果を示す図である。変形例に係るシステム構成を示す図である。別の変形例に係るシステム構成を示す図である。

以下、本発明の実施形態を図面に基づいて説明する。

＜１．第１実施形態＞
＜１−１．構成概要＞
図１は、本発明に係る画像形成システム１を示す図である。図１に示すように、画像形成システム１は、画像形成装置１０と外部端末５０とクラウドサーバ９０とを備える。

画像形成装置１０と外部端末５０とクラウドサーバ９０とは、ネットワーク（通信ネットワーク）１０８を介して互いに接続される。ネットワーク１０８は、ＬＡＮ（Local Area Network）およびインターネットなどによって構成される。また、ネットワーク１０８に対する接続態様は、有線接続であってもよく、或いは無線接続であってもよい。たとえば、画像形成装置１０およびクラウドサーバ９０はネットワーク１０８に対して有線接続され、外部端末５０はネットワーク１０８に対して無線接続される。

クラウドサーバ９０は、画像形成装置１０とも外部端末５０とも異なる外部装置（外部サーバ）である。クラウドサーバ９０には、アプリケーション１２０（ここでは、汎用のＯＣＲ（Optical Character Recognition）アプリケーション）がインストールされている。クラウドサーバ９０は、汎用的なＯＣＲ処理サービスをアプリケーション１２０を用いて提供するサーバである。ただし、このクラウドサーバ９０（アプリケーション１２０）は、サーチャブルＰＤＦ（Portable Document Format）の生成処理サービスを提供しない。サーチャブルＰＤＦは、後述するように、外部端末５０およびクラウドサーバ９０等が協働することによって生成される。

この画像形成システム１においては、原稿のスキャン画像２００（図４等参照）が画像形成装置１０によって生成され、スキャン画像２００が画像形成装置１０から外部端末５０に送信される。外部端末５０は、画像形成装置１０から受信したスキャン画像２００に基づき、電子文書５００（図４等参照）を生成する。当該電子文書５００の生成動作は、外部端末５０にインストールされている電子文書生成アプリケーション１１０（図４参照）を実行すること等によって実現される。

電子文書生成アプリケーション１１０では、スキャン画像２００から複数の部分領域２３０が抽出される。そして、クラウドサーバ９０のアプリケーション１２０によって提供されるＯＣＲ処理サービスを利用して、当該各部分領域２３０に対するＯＣＲ処理が行われる。各部分領域２３０は、ＯＣＲ処理の処理対象の領域であり、処理対象領域とも称される。また、サーバ９０でのＯＣＲ処理は、外部端末５０から部分領域２３０ごとに依頼される。換言すれば、当該各部分領域２３０は、それぞれ、サーバでのＯＣＲ処理の依頼単位（処理単位）を構成する領域であり、処理単位領域とも称される。

電子文書生成アプリケーション１１０は、各部分領域２３０に対する各処理結果（テキストデータ）を汎用アプリケーション１２０から受け取り、当該各処理結果に基づいて電子文書５００を生成する。当該電子文書５００は、テキストデータ付き電子文書（ここでは、サーチャブルＰＤＦ）として生成される。

なお、画像形成システム１は、電子文書を生成するシステムであることから、電子文書生成システムなどとも表現される。同様に、外部端末５０は電子文書生成装置であるとも表現される。

＜１−２．画像形成装置の構成＞
図２は、画像形成装置１０の機能ブロックを示す図である。ここでは、画像形成装置１０として、ＭＦＰ（マルチ・ファンクション・ペリフェラル（Multi-Functional Peripheral））を例示する。図２においては、ＭＦＰ１０の機能ブロックが示されている。

ＭＦＰ１０は、スキャン機能、コピー機能、ファクシミリ機能およびボックス格納機能などを備える装置（複合機とも称する）である。具体的には、ＭＦＰ１０は、図２の機能ブロック図に示すように、画像読取部２、印刷出力部３、通信部４、格納部５、操作部６およびコントローラ９等を備えており、これらの各部を複合的に動作させることによって、各種の機能を実現する。

画像読取部２は、ＭＦＰ１０の所定の位置に載置された原稿を光学的に読み取って（すなわちスキャンして）、当該原稿の画像データ（原稿画像ないしスキャン画像とも称する）を生成する処理部である。この画像読取部２は、スキャン部であるとも称される。

印刷出力部３は、印刷対象に関するデータに基づいて紙などの各種の媒体に画像を印刷出力する出力部である。

通信部４は、公衆回線等を介したファクシミリ通信を行うことが可能な処理部である。さらに、通信部４は、ネットワーク１０８を介したネットワーク通信を行うことも可能である。このネットワーク通信では、たとえば、ＴＣＰ／ＩＰ（Transmission Control Protocol / Internet Protocol）等の各種のプロトコルが利用される。当該ネットワーク通信を利用することによって、ＭＦＰ１０は、所望の相手先（たとえば、外部端末５０）との間で各種のデータを授受することが可能である。通信部４は、各種データを送信する送信部４ａと各種データを受信する受信部４ｂとを有する。

格納部５は、ハードディスクドライブ（ＨＤＤ）等の記憶装置で構成される。

操作部６は、ＭＦＰ１０に対する操作入力を受け付ける操作入力部６ａと、各種情報の表示出力を行う表示部６ｂとを備えている。

このＭＦＰ１０においては、略板状の操作パネル部６ｃ（図１参照）が設けられている。また、操作パネル部６ｃは、その正面側にタッチパネル２５（図１参照）を有している。タッチパネル２５は、操作入力部６ａの一部としても機能するとともに、表示部６ｂの一部としても機能する。タッチパネル２５は、液晶表示パネルに各種センサ等が埋め込まれて構成され、各種情報を表示するとともに操作者からの各種の操作入力を受け付けることが可能である。

たとえば、タッチパネル２５においては、各種の操作画面（メニュー画面等）（ボタン画像等を含む）が表示される。操作者は、タッチパネル２５の操作画面内に仮想的に配置されるボタンを押下することによって、ＭＦＰ１０の各種動作内容を設定するとともに動作指示を付与することができる。

コントローラ９は、ＭＦＰ１０に内蔵され、ＭＦＰ１０を統括的に制御する制御装置である。コントローラ９は、ＣＰＵおよび各種の半導体メモリ（ＲＡＭおよびＲＯＭ）等を備えるコンピュータシステムとして構成される。コントローラ９は、ＣＰＵにおいて、ＲＯＭ（例えば、ＥＥＰＲＯＭ）内に格納されている所定のソフトウエアプログラム（以下、単にプログラムとも称する）を実行することによって、各種の処理部を実現する。なお、当該プログラム（詳細にはプログラムモジュール群）は、ＵＳＢメモリなどの可搬性の記録媒体、あるいはネットワーク１０８等を介してＭＦＰ１０にインストールされてもよい。

具体的には、図２に示すように、コントローラ９は、当該プログラムの実行により、通信制御部１１と入力制御部１２と表示制御部１３と領域判別部１５とを含む各種の処理部を実現する。

通信制御部１１は、他の装置（外部端末５０等）との間の通信動作を通信部４等と協働して制御する処理部である。たとえば、通信制御部１１は、スキャン画像等を外部端末５０送信する。

入力制御部１２は、操作入力部６ａ（タッチパネル２５等）に対する操作入力動作を制御する制御部である。たとえば、入力制御部１２は、タッチパネル２５に表示された操作画面に対する操作入力を受け付ける動作を制御する。

表示制御部１３は、表示部６ｂ（タッチパネル２５等）における表示動作を制御する処理部である。表示制御部１３は、たとえば、ＭＦＰ１０を操作するための操作画面をタッチパネル２５に表示させる。

領域判別部１５は、スキャン画像２００（図４参照）の領域（領域種別）を判別する処理部である。たとえば、領域判別部１５は、スキャン画像２００内における文字領域２１０と非文字領域（図形領域等）２２０とを区別して判別する。

＜１−３．外部端末の構成＞
次に外部端末５０の構成について説明する。

外部端末５０は、ＭＦＰ１０およびクラウドサーバ９０との間でのネットワーク通信が可能な情報入出力端末装置（通信装置とも称される）である。ここでは、外部端末５０として、タブレット型端末を例示する。ただし、これに限定されず、外部端末５０は、スマートフォンあるいはパーソナルコンピュータなどであってもよい。また、外部端末は、携帯式の装置（携帯情報端末等）（携帯端末）であってもよく、あるいは、据置型の装置であってもよい。

図３は、外部端末５０の概略構成を示す機能ブロック図である。

外部端末５０は、図３の機能ブロック図に示すように、通信部５４、格納部５５、操作部５６およびコントローラ５９等を備えており、これらの各部を複合的に動作させることによって、各種の機能を実現する。

通信部５４は、ネットワーク１０８を介したネットワーク通信を行うことが可能である。このネットワーク通信では、たとえば、ＴＣＰ／ＩＰ（Transmission Control Protocol / Internet Protocol）等の各種のプロトコルが利用される。当該ネットワーク通信を利用することによって、外部端末５０は、所望の相手先（ＭＦＰ１０およびクラウドサーバ９０等）との間で各種のデータを授受することが可能である。通信部５４は、各種データを送信する送信部５４ａと各種データを受信する受信部５４ｂとを有する。たとえば、受信部５４ｂは、スキャン画像２００を画像形成装置１０から受信し、送信部５４ａは、スキャン画像２００における複数の部分領域２３０（図４参照）の画像データをクラウドサーバ９０に送信する。また、受信部５４ｂは、複数の部分領域２３０に関するＯＣＲ処理結果等をクラウドサーバ９０から受信する。

格納部５５は、不揮発性の半導体メモリ等の記憶装置で構成され、各種の情報を格納する。

操作部５６は、外部端末５０に対する操作入力を受け付ける操作入力部５６ａと、各種情報の表示出力を行う表示部５６ｂとを備えている。この外部端末５０においては、液晶表示パネルに各種センサ等が埋め込まれて構成されたタッチパネル７５（図１参照）が設けられている。具体的には、図１に示すように、略板状の外部端末５０の正面側において、その周縁部（枠部）を除くほぼ全面にわたってタッチパネル７５が設けられている。このタッチパネル７５は、ユーザインターフェイス部として機能する。換言すれば、タッチパネル７５は、操作入力部５６ａの一部としても機能するとともに、表示部５６ｂの一部としても機能する。

図３のコントローラ５９は、外部端末５０に内蔵され、外部端末５０を統括的に制御する制御装置である。コントローラ５９は、ＣＰＵおよび各種の半導体メモリ（ＲＡＭおよびＲＯＭ）等を備えるコンピュータシステムとして構成される。コントローラ５９は、ＣＰＵにおいて、記憶部（半導体メモリ等）内に格納されている所定のソフトウエアプログラム（以下、単にプログラムとも称する）を実行することによって、各種の処理部を実現する。なお、当該プログラム（詳細にはプログラムモジュール群）は、ＵＳＢメモリなどの可搬性の記録媒体、あるいはネットワーク１０８等を介して外部端末５０にインストールされるようにしてもよい。

外部端末５０には、画像形成装置１０との連携処理を制御するアプリケーションプログラム（単に、アプリケーションとも称する）１１０がインストールされている。当該アプリケーションプログラム１１０が外部端末５０にて実行されることによって、外部端末５０は、画像形成装置１０にて生成されたスキャン画像を画像形成装置１０から受信するとともに、当該スキャン画像を利用して電子文書を生成する処理を実行する。

具体的には、コントローラ５９は、当該アプリケーションプログラム１１０等の実行により、通信制御部６１と入力制御部６２と表示制御部６３と取得部６４と抽出部６５と検出部６６と指示送出部６７と受取部６８と決定部６９と生成部７０とを含む各種の処理部を実現する。

通信制御部６１は、通信部５４等と協働して、ＭＦＰ１０およびクラウドサーバ９０等との通信動作を制御する処理部である。

入力制御部６２は、操作入力部５６ａ（タッチパネル７５等）に対する操作入力動作を制御する制御部である。たとえば、入力制御部６２は、タッチパネル７５に表示された操作画面に対するタッチ操作入力を受け付ける動作を制御する。

表示制御部６３は、表示部５６ｂ（タッチパネル７５等）における表示動作を制御する処理部である。表示制御部６３は、たとえば、ＭＦＰ１０との連携処理を行うための操作画面をタッチパネル７５に表示する。

なお、入力制御部６２および表示制御部６３は、ユーザインターフェイス制御部とも総称される。

取得部６４は、ＭＦＰ１０で生成されたスキャン画像２００（図４参照）等を取得する処理部である。取得部６４は、通信部５４および通信制御部６１等と協働して、当該スキャン画像２００等をＭＦＰ１０から受信して取得する。

抽出部６５は、スキャン画像２００の文字領域から１又は複数の部分領域２３０（図４参照）を抽出する処理部である。各部分領域２３０は、１行の文字列の領域である文字列領域を含む領域として抽出される。当該文字列領域は、行方向に伸延する文字列領域であり、「行領域」とも称される。この実施形態においては、各部分領域２３０が、単一行の文字列の領域である文字列領域（単一の行領域とも称される）を含む領域として抽出される。なお、これに限定されず、後述するように、各部分領域２３０は、複数行の文字列を含む領域として抽出されてもよい。換言すれば、各部分領域２３０は、複数の行領域（複数行に係る文字列領域）を含む領域として抽出されてもよい。

検出部６６は、スキャン画像２００内における複数の部分領域２３０の位置および大きさをそれぞれ検出する処理部である。また、検出部６６は、各部分領域２３０内に含まれる１行の文字列の領域（行領域）の大きさを検出する処理を実行する処理部でもある。なお、各部分領域２３０が、それぞれ、単一行の文字列の領域（単一の行領域）として構成される場合には、各部分領域２３０の大きさを求める処理が、当該行領域の大きさを求める処理にも相当する。さらに、検出部６６は、行領域（部分領域２３０）内の文字数をも検出する。

決定部６９は、各部分領域（処理対象領域）２３０内の文字の文字サイズ（配列方向文字サイズ（次述）および／または直交方向文字サイズ（次述））を決定する処理部である。たとえば、決定部６９は、後述するように、行領域の大きさに基づいて「配列方向文字サイズ」を決定する。

「配列方向文字サイズ」は、（各部分領域（処理対象領域）２３０内の）文字の文字サイズであって配列方向（詳細には、各部分領域内の行領域における文字列の配列方向）の文字サイズである。横書きの文字列の場合には、文字列の配列方向は左右方向（文字の幅方向）であり、「文字幅」が配列方向文字サイズ（配列方向における文字サイズ）に相当する。縦書きの文字列の場合には、文字列の配列方向は上下方向（文字の高さ方向）であり、「高さ」（文字高さ）が配列方向文字サイズに相当する。

また、「直交方向文字サイズ」は、（各部分領域（処理対象領域）２３０内の）文字の文字サイズであって直交方向（詳細には、各部分領域内の行領域における文字列の配列方向に直交する方向）の文字サイズである。横書きの文字列の場合には、「文字高さ」が「直交方向文字サイズ」に相当し、縦書きの文字列の場合には、「文字幅」が「直交方向文字サイズ」に相当する。

以下では、主に横書きの文字列を前提にして説明を行う。

指示送出部６７は、アプリケーションプログラム１１０から別のアプリケーションプログラム１２０（後述）に向けて所定の処理実行指示等を送出する処理部である。たとえば、指示送出部６７は、スキャン画像２００における複数の部分領域２３０のそれぞれに関して、ＯＣＲ処理（光学文字認識処理）を行うべき旨の指示をクラウドサーバ９０に向けて送出する。当該指示は、複数の部分領域２３０のそれぞれに関する画像データとともに送出される。

受取部６８は、各部分領域２３０に関する各処理結果（ＯＣＲ処理結果）を、クラウドサーバ９０（アプリケーションプログラム１２０）から受け取る処理部である。

生成部７０は、電子文書５００（図４参照）を生成する処理部である。生成部７０は、複数の部分領域２３０のそれぞれについての各ＯＣＲ処理結果（テキスト情報（文字コード群））の文字列を、スキャン画像２００における当該複数の部分領域２３０のそれぞれの検出位置に配置して、電子文書５００（サーチャーブルＰＤＦ等）を生成する。特に、後述するように、各処理結果に係る文字列は、決定部６９により部分領域２３０ごとに決定された配列方向文字サイズ（文字幅）に基づいて、電子文書５００内に配置される。

＜１−４．動作＞
この実施形態においては、外部端末５０は、ＯＣＲ処理の処理対象領域（部分領域）として文字列領域（行領域）を１行ごとにスキャン画像から抽出してクラウドサーバ９０に送信し、各処理対象領域に関するＯＣＲ処理結果をクラウドサーバ９０から受信する。そして、外部端末５０は、当該各処理対象領域に関するＯＣＲ処理結果を埋め込んだ電子文書５００を生成する。この際、各行領域の幅（１行の文字列の配列方向（幅方向）の長さ）等に基づいて、上述の配列方向文字サイズ（文字幅）が決定され、当該配列方向文字サイズを反映して各ＯＣＲ処理結果に係る文字列が電子文書５００に配置される。

以下、このような態様について、図４および図５等を参照しつつ説明する。図４は、電子文書生成システム１における動作の概略を示す図であり、図５は、外部端末５０（より詳細には電子文書生成アプリケーション１１０）の動作を示すフローチャートである。以下、これらの図を参照しながら、電子文書生成システム１の動作について説明する。

＜スキャン画像生成等＞
まず、ユーザは、スキャン対象の原稿をＭＦＰ１０の原稿台（たとえば、自動給紙装置（ＡＤＦ：Auto Document Feeder ）あるいは原稿載置用ガラス面等）に載置する。

その後、ユーザは、外部端末５０を操作することによって、電子文書５００の生成指示を外部端末５０およびＭＦＰ１０に対して付与する。

具体的には、まず、外部端末５０にインストールされているアプリケーション（電子文書生成アプリケーション）１１０の操作画面（不図示）において、スキャン処理を実行すべき装置が指定されるとともに、スキャン処理により最終的に生成される電子文書５００の形式が指定される。ここでは、スキャン処理を実行すべき装置としてＭＦＰ１０が指定され、当該電子文書５００の形式として、サーチャブルＰＤＦ（透明テキスト付きＰＤＦ）が指定されるものとする。そして、ユーザは、電子文書生成アプリケーション１１０の操作画面内に表示された実行開始ボタン（電子文書５００の生成処理の実行開始ボタン）を押下することにより、電子文書（ここではサーチャブルＰＤＦ）５００の生成指示を外部端末５０およびＭＦＰ１０に対して付与する。なお、サーチャブルＰＤＦ（透明テキスト付きＰＤＦ）は、文字画像を有する画像レイヤと当該文字画像に対する文字認識結果が非表示状態で埋め込まれたテキストレイヤとを有するＰＤＦ形式の電子文書である。

外部端末５０は、当該生成指示を受け付けるとともに、当該生成指示（詳細には、当該生成指示に基づくスキャン画像生成指示等）をＭＦＰ１０に転送する。

ＭＦＰ１０は、当該生成指示（スキャン画像生成指示等）を外部端末５０から受信するとスキャン動作を開始し、ＭＦＰ１０の原稿台（ＡＤＦ等）に載置された原稿のスキャン画像２００を生成する（図４の左上参照）。

さらに、ＭＦＰ１０は、スキャン画像２００内における各種の領域を判別する領域判別処理を行う。具体的には、ＭＦＰ１０の領域判別部１５は、スキャン画像２００内における文字領域２１０と非文字領域（図形領域等）２２０とを判別し、スキャン画像２００における文字領域２１０の範囲（詳細にはその位置および大きさ）と非文字領域２２０の範囲とを特定する。また、領域判別部１５は、当該文字領域２１０に対して、当該領域が「文字領域」であることを示す特定コード（たとえば「１」）を付与する。同様に、領域判別部１５は、非文字領域２２０に対して、当該領域が「非文字領域」であることを示す領域種別コード（たとえば「２」、「３」等）を付与する。より詳細には、たとえば、非文字領域である「図形領域」に対して「２」が付与され、非文字領域である「写真領域」に対して「３」が付与される。

そして、領域判別部１５は、これらの情報に基づいて属性指定データ３００を生成する。属性指定データ３００は、スキャン画像２００内の各画素位置に対して上記の領域種別コードが割り付けられたデータ（スキャン画像２００の各画素ごとに領域種別コードが付与されたデータ）として生成される。換言すれば、属性指定データ３００は、スキャン画像２００における文字領域２１０および非文字領域２２０のそれぞれに関する、範囲情報（詳細にはその位置および大きさに関する情報）ならびに領域種別コード等、の情報を含むものとして生成される。

そして、ＭＦＰ１０（通信部４および通信制御部１１等）は、スキャン画像（詳細にはその画像データ）２００と属性指定データ３００とを外部端末５０に送信する。

＜ＯＣＲ処理および電子文書生成処理等＞
その後、外部端末５０は、電子文書生成アプリケーション１１０を実行することによって、図５に示すような処理を実行する。

まず、ステップＳ１１において、外部端末５０（詳細には、取得部６４等）は、ＭＦＰ１０で生成されたスキャン画像２００および属性指定データ３００をＭＦＰ１０から受信して取得する。また、外部端末５０（詳細には、生成部７０等）は、スキャン画像２００を取り込んだＰＤＦ文書を電子文書５００として仮生成する。当該ＰＤＦ文書においては、ＯＣＲ結果に係るテキストデータは未だ埋め込まれていない。

つぎに、ステップＳ１２において、外部端末５０（抽出部６５等）は、ステップＳ１１で取得したスキャン画像２００および属性指定データ３００に基づいて、当該スキャン画像２００の文字領域２１０から所定単位の部分領域２３０を抽出する。この実施形態では、抽出部６５は、文字領域２１０における単一行の文字列に係る領域を、所定単位の部分領域２３０として抽出する。すなわち、抽出部６５は、文字領域２１０から、１行単位の部分領域２３０を抽出する。換言すれば、文字領域２１０における単一行の文字列に係る領域を単位として区分される複数の部分領域２３０（ここでは、そのうち最初の部分領域２３０）が抽出される。

具体的には、スキャン画像２００と属性指定データ３００とに基づき、スキャン画像２００における文字領域２１０が特定される。そして、文字領域２１０に対する画像処理が行われ、文字領域２１０内の１行の領域（横方向に配列された１行の文字列の領域）が認識される。図６においては、３つの行で構成される文字領域２１０（２１１）が例示されており、この文字領域２１０に関しては、まず、第１行の「ABCDE Wireless Digital Radiography」の文字列に係る領域（行領域）２３１が部分領域２３０として抽出される（図７参照）。

また、ステップＳ１３において、外部端末５０（検出部６６等）は、ステップＳ１２で抽出された部分領域２３０の（スキャン画像２００内における）位置（詳細には、その基準位置（Ｘ，Ｙ）（先頭位置等））および大きさ（Ｘ方向サイズ（幅Ｗ）およびＹ方向サイズ（高さＨ））を検出する。また、ステップＳ１３においては、検出部６６は、各部分領域（行領域）２３０内の文字数（詳細には、各行領域に含まれる文字の数）をも検出する。検出された各種の情報（部分領域２３０の位置および大きさ、ならびに部分領域２３０内の文字数に関する情報）（図８参照）は、格納部５５に格納される。

図８の上段においては、これらの各種情報（各部分領域２３０の識別番号、位置（および大きさ）に関する情報、および文字数）が記録されている様子が示されている。なお、ここでは、位置に関する情報として、部分領域２３０に関する４つの情報、具体的には、部分領域２３０（矩形領域）の上辺のＹ方向位置（TOP）、下辺のＹ方向位置（BOTTOM）、左辺のＸ方向位置（LEFT）、右辺のＸ方向位置（RIGHT）が記録されている。これら４つの情報は、たとえば、当該矩形領域の代表位置（たとえば左上の点の位置（TOP,LEFT））と当該矩形領域の大きさ（高さＨおよび幅Ｗ）（図８の下段参照）に変換可能であり、部分領域２３０の位置および大きさに関する情報であるとも表現される。

上述の各部分領域２３０の抽出処理および各種検出処理等（ステップＳ１２，Ｓ１３）は、次のようにして行われる。以下、図９等を参照しながら、より詳細に説明する。なお、図９は、このような処理等を説明するための図である。

具体的には、まず、Ｘ方向（主走査方向）（水平方向ないし左右方向とも称する）に伸びる１ライン（水平ライン）（水平方向画素列）あたりの黒画素の数を水平ライン毎に検出する動作を、Ｙ方向（副走査方向）（垂直方向）に移動しつつ繰り返して行い、各水平ラインの黒画素数を取得する。

図９内の左側に配置されたグラフにおいては、Ｙ方向の各位置における黒画素数を模式的に示す曲線Ｌ０が示されている。なお、当該グラフにおいては、簡略化のため、所定数以上の黒画素数が一律に同じ画素数で示されている。そのため、当該グラフは、方形波形状を有している。

文字が存在する位置の水平ラインにおいては、比較的多数の黒画素が存在する。一方、行と行との間の水平ライン（文字が存在しない行間領域の水平ライン）においては、黒画素がほとんど存在しない。

このような特質を利用して、抽出部６５は、所定数以上の黒画素数を有する水平ラインが存在する範囲Ｖ（Ｙ方向の範囲）を、１行の文字列の範囲（文字列の高さ方向における範囲）として認識する。たとえば、文字列「ＡＢＣ...」の上端から下端までの範囲が１行の文字列の範囲Ｖとして認識される。同様に、文字列「Ｓｙｓ...」の上端から下端までの範囲等も１行の文字列の範囲Ｖとして認識される。

そして、垂直方向（Ｙ方向）においては、当該範囲Ｖに亘る矩形領域がスキャン画像２００における１行の文字列の存在領域（行領域）として認識される。また、水平方向（Ｘ方向）においては、１行の文字列のうち先頭の文字（ここでは左端の文字）から最後尾の文字（右端の文字）までを含む範囲が当該１行の文字列の存在領域として認識される。水平方向における文字列の存在範囲の認識処理は、後述する文字数の認識処理の処理結果を用いて行われればよい。

なお、これに限定されず、水平方向（Ｘ方向）においては、たとえば、文字領域２１０の（当該水平方向の）全範囲（スキャン画像の全幅と同じ範囲）が当該１行の文字列の存在領域として認識されるようにしてもよい。

このようにして認識された行領域（スキャン画像２００における１行の文字列の存在領域）が部分領域２３０として抽出される（ステップＳ１２）。たとえば、最初の１行の文字列「ABCDE Wireless Digital Radiography」（図７参照）の行領域（矩形領域）２３１が部分領域２３０として抽出される。

また、当該部分領域（矩形領域）２３０の左上（あるいは左下等）の点の位置が、当該矩形領域（１行の文字列の存在領域）の位置（代表位置）として認識される（ステップＳ１３）。たとえば、１行の文字列「ABCDE Wireless Digital Radiography」を含む矩形領域２３１の左上の点の位置が、当該１行の文字列の存在領域の位置（先頭位置）として認識される。

さらに、当該矩形領域２３０の大きさ（Ｘ方向サイズ（幅Ｗ）およびＹ方向サイズ（高さＨ））が認識され、検出される。たとえば、矩形領域２３１の大きさ（幅Ｗ１および高さＨ１）が、左上の点Ｐ１の座標値（LEFT,TOP）と左下の点Ｐ２の座標値（RIGHT,BOTTOM）とに基づいて認識される。より具体的には、幅Ｗ１は、両点Ｐ１，Ｐ２のＸ座標値の差分値として算出され（Ｗ１＝RIGHT−LEFT）、高さＨ１は、両点Ｐ１，Ｐ２のＹ座標値の差分値として算出される（Ｈ１＝BOTTOM−TOP）。

また、抽出部６５は、所定数以上の黒画素数を有しない水平ラインが存在する範囲（Ｙ方向の範囲）を、行間領域の範囲（高さ方向における範囲）として認識する。たとえば、文字列「ＡＢＣ...」の下端と文字列「Ｓｙｓ...」の上端との間の空白領域が、第１行と第２行との間の行間領域の範囲として認識される。このような処理により、抽出部６５は、或る行とその次の行との間隔（行間領域のＹ方向の大きさ）を行間間隔ｙ（隣接行間間隔）として算出する。なお、ここでは、所定数以上の黒画素数を有しない水平ラインは、直ちに行間領域である、と判定されているが、これに限定されない。たとえば、「所定数以上の黒画素数を有しない水平ライン」が所定の閾値ＴＨ１（たとえば、数本（１ｍｍ〜２ｍｍ程度相当分））（図７参照）以上連続して存在する場合に、当該水平ライン（群）の存在領域が行間領域であると認識されるようにしてもよい。これによれば、文字列の高さ方向に隣接する複数の行領域を良好に区別して抽出することが可能である。

また、ステップＳ１３においては、検出部６６は、各部分領域２３０（行領域）内の文字数をも検出する。

具体的には、１行の文字列のＹ方向における存在範囲Ｖに対応する領域（Ｘ方向に伸びる帯状領域（矩形領域））においてＹ方向に伸びる１ライン（垂直ライン（縦ライン））あたりの黒画素の数を検出する動作を、Ｘ方向に移動しつつ繰り返して行い、各垂直ラインごとの黒画素数を取得する。これにより、当該帯状領域内における、各文字の存在領域（各文字の幅方向における存在範囲ｗ）を求めることが可能である。

図９内の第１行の文字列の上側に配置されたグラフにおいては、第１行の文字列のＸ方向の各位置における黒画素数を模式的に示す曲線Ｌ１が示されている。なお、当該グラフにおいては、簡略化のため、所定数以上の黒画素数が一律に同じ画素数で示されている。

文字が存在する位置の垂直ラインにおいては、比較的多数の黒画素が存在する。一方、文字と文字との間の垂直ライン（文字が存在しない字間領域の垂直ライン）においては、黒画素がほとんど存在しない。

このような特質を利用して、抽出部６５は、所定数以上の黒画素数を有する垂直ラインが存在する範囲（Ｘ方向の範囲）を、１文字の幅の範囲（幅方向における範囲）ｗとして認識する。たとえば、文字「Ａ」の左端から右端までの範囲が１文字の範囲ｗとして認識される。それに続く各文字「Ｂ」、「Ｃ」、「Ｄ」、「Ｅ」...についても同様である。そして、１行の文字列の存在範囲（行領域）において文字の存在領域として認識された領域の数が、当該行領域内の文字数（当該行領域に含まれる文字の数）として検出される。

なお、このような動作により当該帯状領域（行領域）内の先頭の文字の位置と最後尾の文字の位置とを認識することによれば、行領域に含まれる１行の文字列のうち先頭の文字（ここでは左端の文字）から最後尾の文字（右端の文字）までを含む範囲が当該１行の文字列の存在領域として認識される。

また、当該文字とその右隣の文字との間隔（空隙）、詳細には当該文字の右端と当該文字の右隣の文字の左端との間隔（空隙）が、字間間隔（隣接文字間間隔）ｘとして算出される。

以上のようにして、ステップＳ１３においては、部分領域２３０の位置および大きさが画像処理により検出されるとともに、部分領域２３０内の文字数も画像処理により検出される。

次のステップＳ１４（図５）においては、外部端末５０（指示送出部６７等）は、部分領域２３０に関する処理指示（ＯＣＲ処理を行うべき旨の指示）と当該部分領域２３０に関する画像データとをクラウドサーバ９０にに向けて送出（送信）する。換言すれば、電子文書生成アプリケーション１１０からアプリケーション１２０へとＯＣＲ処理依頼が送出される。ここでは、部分領域２３０に関する画像データとして、スキャン画像２００から当該部分領域２３０に対応する部分を抽出した画像（部分画像）の画像データ（部分領域２３０の画像データとも称する）が送信される。

なお、アプリケーション１２０（ここでは、ＯＣＲ処理を行うＯＣＲ処理アプリケーション）は、電子文書生成アプリケーション１１０とは別のアプリケーションである。ここでは、アプリケーション１２０は、クラウドサーバ９０にインストールされ且つクラウドサーバ９０にて実行されるアプリケーションである。

クラウドサーバ９０にて実行中のアプリケーション１２０が、上述の処理指示と部分領域２３０に関する画像データとを受け取る（受信する）と、クラウドサーバ９０（アプリケーション１２０）は、当該処理指示および画像データに基づいて、ＯＣＲ処理を実行する。

アプリケーション１２０は、電子文書生成アプリケーション１１０から受け取った当該部分領域２３０に関する画像データに対してＯＣＲ処理を施し、当該画像データに含まれる文字列（たとえば「ABCDE Wireless Digital Radiography」）を認識して、当該文字列に係るテキストデータ（文字コード群）２５０を生成する（図１０参照）。そして、アプリケーション１２０は、当該文字列に係るテキストデータ（テキスト情報）２５０をＯＣＲ処理の処理結果として電子文書生成アプリケーション１１０に向けて出力する。換言すれば、クラウドサーバ９０（アプリケーション１２０）から外部端末５０（電子文書生成アプリケーション１１０）に向けて当該処理結果が送出（送信）される。

ステップＳ１５において、外部端末５０（受取部６８等）は、アプリケーション１２０からの当該処理結果（部分領域２３０に関するＯＣＲ処理結果）を受け取る。なお、当該処理結果には、テキストデータ２５０が含まれるものの、位置情報およびフォント情報は含まれない。

また、ステップＳ１６において、外部端末５０（決定部６９等）は、部分領域２３０内の文字の配列方向サイズ（配列方向文字サイズ（ここでは文字幅））を部分領域２３０の大きさに基づいて決定する。具体的には、左右方向（横方向）における部分領域２３０（ここでは単一行の文字列の領域）の長さＷを当該部分領域２３０内の文字数Ｎで除した値Ｑ（＝Ｗ／Ｎ）に基づいて、部分領域２３０に関する文字幅を決定する。

たとえば、値Ｑに対応するフォントサイズ（フォントポイント（ｐｔ）サイズ）が、部分領域２３０の文字の文字幅を表す値として決定される。より詳細には、値Ｑと各フォントポイントサイズ（ポイント数）との対応関係が予め規定されたデータテーブル（各フォントポイントサイズに対応する値Ｑの範囲がそれぞれ規定されたデータテーブル）に基づいて、値Ｑに対応するフォントサイズが決定される。

なお、これに限定されず、値Ｑ自体（たとえば、ｍｍ（ミリメートル）単位の値）が、部分領域２３０の文字の文字幅を表す値として決定されるようにしてもよい。

また、値Ｑは、文字列に含まれる空白領域（空白文字等）を考慮して調整されて算出されるようにしてもよい。より詳細には、元の値Ｑに所定の調整係数（たとえば０．９）を乗じた値が調整後の新たな値Ｑとして用いられるようにしてもよい。

そして、ステップＳ１７にて、外部端末５０（生成部７０等）は、部分領域２３０に関する処理結果であるテキストデータ２５０（ステップＳ１５で受信したデータ）を、電子文書５００内において、部分領域２３０の検出位置（ステップＳ１３での検出位置）に配置する（図４も参照）。当該テキストデータ２５０は、電子文書５００（ＰＤＦ文書）内に取り込まれたスキャン画像２００において、部分領域２３０の（スキャン画像２００における）検出位置（ステップＳ１３での検出位置）に配置される。具体的には、生成部７０は、部分領域２３０に関する処理結果（ＯＣＲ処理結果）に係るテキストデータを、部分領域２３０の検出位置に「非表示状態」で埋め込む。換言すれば、部分領域２３０に関するＯＣＲ結果のテキストデータが、サーチャブルＰＤＦのテキストレイヤ（非表示）において、部分領域２３０の検出位置に配置される。これにより、電子文書（サーチャブルＰＤＦ）５００の内容が更新される。

このとき、部分領域２３０の各文字は、ステップＳ１６で決定された文字幅（配列方向文字サイズ）を有する状態で埋め込まれる。

これにより、図１１に示すように、ＯＣＲ処理結果に係る各文字は、スキャン画像２００内に画像として表示される各文字の位置に対して、比較的近い位置に配置される。図１１は、本実施形態に係る文字配置結果を示す図である。図１１においては、両種類の文字列（ＯＣＲ処理前後の文字列）が重ねて表示されている。ＯＣＲ処理結果に係る各文字（ＯＣＲ処理後の文字列）は淡色で示されており、スキャン画像２００内に画像として表示される各文字（ＯＣＲ処理前の文字列）は通常色で示されている。

なお、図１２は、比較例に係る文字配置結果を示す図である。図１２においても、図１１と同様に、両種類の文字列（ＯＣＲ処理前後の文字列）が重ねて表示されている。図１２は、処理結果に係る各文字のサイズとスキャン画像２００内に画像として表示される各文字のサイズとが大きく異なる場合に、処理結果に係る各文字がスキャン画像２００内に画像として表示される各文字の位置とは大きく異なる位置に配置される状況を示している。図１２においては、特に文字列の後端側（右端側）の文字が、左右方向において本来の位置から大きくずれて配置されている。

これに対して、上記実施形態によれば、図１２のような状況の発生を回避ないし抑制し、図１１に示すように、処理結果に係る各文字を、スキャン画像２００内に画像として表示される各文字の位置に対して、左右方向において比較的近い位置に配置することが可能である。

また、ここでは、ＯＣＲ処理結果に係る各文字は、それぞれ、標準的な縦横比を有するものとみなされる。そして、直交方向文字サイズは配列方向文字サイズと同じフォントポイントサイズ（たとえば２６ｐｔ（ポイント））を有するものとして決定される。より詳細には、共通の１つの文字サイズ（たとえばフォントポイントサイズ（２６ｐｔ（ポイント））によって、配列方向文字サイズと直交方向文字サイズとが共通に指定され、当該共通の指定文字サイズ（フォントポイントサイズ）に基づいて、ＯＣＲ処理結果に係る各文字が電子文書５００に配置される。この結果、ＯＣＲ処理結果に係る各文字は、当該フォントポイントサイズの配列方向文字サイズと当該フォントポイントサイズの直交方向文字サイズとを有する状態で電子文書５００内に配置される。

ただし、本発明は、これに限定されず、上記値Ｑに所定の係数（縦横比に関する変換係数）を乗じることによって、標準的な縦横比を有する文字の直交方向文字サイズ（文字高さ）が配列方向文字サイズ（文字幅）に基づいて決定されるようにしてもよい。

ステップＳ１８においては、スキャン画像２００の文字領域２１０の全面（ここでは文字領域２１０の全ての行（全ての行領域））について処理が終了したか否かが判定される。詳細には、文字領域２１０における次の「行」（ここでは第２行）の存否が検出（判定）される。次の行（未処理の行）が存在する旨が検出される場合には、文字領域２１０の全面についての処理は未だ終了していない旨が判定される。一方、次の行（未処理の行）が存在しない旨が検出される場合には、当該処理が終了した旨が判定される。

スキャン画像２００の全面について処理が未だ終了していないと判定される場合には、ステップＳ１９を経てステップＳ１２に戻り、次の部分領域２３０（ここでは、次の行の画像領域）に関してステップＳ１２〜Ｓ１７の動作が同様に実行される。

一方、スキャン画像２００の全面について処理が終了したと判定される場合には、図５のフローチャートの処理を終了する。スキャン画像２００の文字領域２１０内の複数の部分領域２３０のそれぞれに関してステップＳ１２〜Ｓ１７の処理が実行されることによって、電子文書５００（より詳細には、サーチャブルＰＤＦ）が生成される。なお、当該電子文書５００は、外部端末５０の格納部５５に格納される。なお、上記のような処理の結果、図４に示すように、スキャン画像２００の文字領域２１０は、電子文書５００内の対応領域５１０に配置される。また、スキャン画像２００の非文字領域２２０は、ＯＣＲ処理を経ることなく、電子文書５００内の対応領域５２０にそのまま配置される。

以上のように、この第１実施形態においては、外部端末５０は、当該外部端末５０上で実行される電子文書生成アプリケーション１１０において、画像形成装置１０で生成されたスキャン画像２００等を取得する。電子文書生成アプリケーション１１０は、スキャン画像２００から複数の部分領域２３０を抽出するとともに、当該複数の部分領域２３０のそれぞれの（スキャン画像２００内における）位置情報を取得して格納しておく。そして、電子文書生成アプリケーション１１０は、複数の部分領域２３０ごとにＯＣＲ処理を行うべき旨の指示をアプリケーション１２０（ここでは汎用ＯＣＲ処理アプリケーション）に送出する。アプリケーション１２０はＯＣＲ処理結果を電子文書生成アプリケーション１１０に返信する。電子文書生成アプリケーション１１０は、返信されてきたＯＣＲ処理結果（複数の部分領域２３０のそれぞれのＯＣＲ結果）をスキャン画像２００において複数の部分領域のそれぞれの位置に配置した電子文書（サーチャブルＰＤＦ）を生成する。

これによれば、或る電子文書生成アプリケーション１１０から別のアプリケーション１２０に対してＯＣＲ処理を依頼する場合においても、スキャン画像２００内の適切な位置にＯＣＲ結果（テキストデータ）を配置した電子文書を生成することが可能である。

また、外部端末５０は、スキャン画像２００から、１行の文字列の領域（行領域）を処理対象領域として抽出し、当該行領域の大きさに基づいて、処理対象領域内の文字の配列方向文字サイズ（横書き時は「文字幅」）を決定する。そして、当該配列方向文字サイズに基づいて、ＯＣＲ処理結果に係る文字列が電子文書内に配置される（図１１参照）。より詳細には、ＯＣＲ処理結果に係る文字列が当該配列方向文字サイズで電子文書内に配置される。したがって、上述の図１２のような状況の発生を回避ないし抑制し、ＯＣＲ処理結果に係る各文字を、スキャン画像２００内に画像として表示される各文字の位置に対して、文字列の配列方向において比較的近い位置に配置することが可能である。すなわち、ＯＣＲ処理結果に係る文字列をその配列方向において比較的正確な位置に配置することが可能である。

また、上記実施形態においては、ＭＦＰ１０の外部の装置（クラウドサーバ９０）によって提供されるＯＣＲ処理サービスが利用されている。これによれば、ＯＣＲ処理の依頼元装置（たとえば外部端末５０）とは別の装置（クラウドサーバ）でＯＣＲ処理を行うことができるので、当該依頼元装置の処理負荷を低減することが可能である。

さらに、上記実施形態においては、スキャン画像２００の生成装置であるＭＦＰ１０とは別の装置（外部端末５０）によって、電子文書５００の生成処理（各部分領域２３０の抽出処理および位置検出処理等）が行われているので、ＭＦＰ１０の処理負荷を低減することが可能である。換言すれば、ＭＦＰ１０と外部端末５０との間で処理負荷を適宜に分散することが可能である。

なお、上記実施形態では、属性指定データ３００がＭＦＰ１０において生成されて外部端末５０に送信されているが、これに限定されず、属性指定データ３００が外部端末５０において生成されるようにしてもよい。

＜２．第２実施形態＞
第２実施形態は、第１実施形態の変形例である。以下では、第１実施形態との相違点を中心に説明する。

上記第１実施形態においては、１行の文字列の配列方向の長さに基づいて、配列方向文字サイズ（文字列の配列方向における１文字あたりの大きさ（文字幅））が決定されている。

一方、この第２実施形態においては、１行の文字列の配列方向に直交する方向（直交方向）における当該１行の文字列の存在領域（「行領域」）の大きさ（ここでは「高さ」）に基づいて直交方向文字サイズ（「文字高さ」）が決定されるとともに、当該直交方向文字サイズに基づいて配列方向文字サイズ（文字列の配列方向における１文字あたりの大きさ（文字幅））が決定（推定）される。端的に言えば、文字列の高さに基づいて、文字列中の各文字の文字幅が間接的に決定される。

この第２実施形態においては、まず、図５のステップＳ１３では行領域内の文字数を検出する処理は行われない点で、第１実施形態とは異なる。

さらに、この第２実施形態においては、図５のステップＳ１６において、第１実施形態と相違する処理が行われる。

具体的には、まず、部分領域２３０の高さ（ステップＳ１３で検出された値）に基づいて、処理対象領域（部分領域２３０）に含まれる１行の文字列に関する「直交方向文字サイズ」（当該１行の文字列の配列方向に直交する直交方向（ここでは高さ方向）の文字サイズ）が決定される。すなわち、当該１行の文字列に関する「文字高さ」が決定される。そして、当該直交方向文字サイズ（文字高さ）に基づいて、処理対象領域内の文字の配列方向文字サイズ（ここでは「文字幅」）が決定（より詳細には推定して決定）される。

たとえば、部分領域２３１（図７）の高さＨ１が値ｈ１（ｍｍ（ミリメートル））であると判定されるときには、部分領域２３１に含まれる１行の文字列に関する「文字高さ」が当該値ｈ１自体（あるいは値ｈ１に所定の係数（たとえば０．９）を乗じた値等）であると判定される。つぎに、この「文字高さ」に対応するフォントポイントサイズ（たとえば２６ポイント）が求められる。そして、部分領域２３０内の文字の「文字幅」は当該フォントポイントサイズに相当する大きさであると推定され決定される。謂わば、「文字高さ」に対応する標準的な「文字幅」が推定され決定される。

なお、部分領域２３０内の文字の「文字幅」は、フォントポイントサイズ（たとえば２６ポイント）で指定されてもよく、あるいは、当該フォントポイントサイズに対応するｍｍ（ミリメートル）単位の文字幅で指定されてもよい。

そして、ステップＳ１７において、ステップＳ１６にて決定された配列方向文字サイズに基づいて、ＯＣＲ処理結果に係る文字列（テキスト情報）が埋め込まれる。具体的には、処理対象領域内の文字列を構成する各文字は、その配列方向において上述の配列方向文字サイズ（文字幅）として決定された大きさを有する状態で配置される。このようにして、配列方向文字サイズに基づいて、ＯＣＲ処理結果に係る文字列が電子文書５００内に配置されて、当該電子文書５００が生成される。

なお、ＯＣＲ処理結果に係る各文字の「直交方向文字サイズ」は、上記の値ｈ１であるとして指定されればよい。そして、指定された直交方向文字サイズにも基づいて、ＯＣＲ処理結果の各文字が電子文書５００内に配置されればよい。あるいは、ＯＣＲ処理結果に係る各文字の直交方向文字サイズは、その配列方向文字サイズと同じフォントポイントサイズを有するものとして指定されるようにしてもよい。換言すれば、共通の指定文字サイズ（フォントポイントサイズ）に基づいて、ＯＣＲ処理結果に係る各文字が電子文書５００に配置されるようにしてもよい。

＜３．第３実施形態＞
上記各実施形態においては、各部分領域（処理対象領域）２３０に関する配列方向文字サイズ（「文字幅」等）が決定されるとともに、当該各部分領域２３０に関する直交方向文字サイズ（「文字高さ」等）は、当該配列方向文字サイズに連動して決定されている。より詳細には、ＯＣＲ処理結果の各文字が標準的な縦横比を有するものとして、配列方向文字サイズと直交方向文字サイズとが決定されている。

しかしながら、本発明は、これに限定されない。たとえば、当該各部分領域２３０に関する直交方向文字サイズ（「文字高さ」等）は、当該配列方向文字サイズ（「文字幅」等）とは独立して決定されるようにしてもよい。

なお、上記第２実施形態においては、ステップＳ１３の処理のうち、行領域に関する文字数の検出処理は行われないが、この第３実施形態においては、ステップＳ１３において、行領域に関する文字数の検出処理も行われる。

具体的には、ステップＳ１３において、各部分領域２３０内の或る１行の行領域の文字数も検出される。たとえば、部分領域２３６の最初の１行に関する行領域２３１の文字数が検出される。ただし、これに限定されず、任意の１行に関する行領域の文字数が検出されればよい。たとえば、複数の行のうち最も横幅が大きい行に関する行領域の文字数が検出されるようにしてもよい。

そして、ステップＳ１４，Ｓ１５の処理の後、ステップＳ１６において次のような処理が行われる。

具体的には、まず、処理対象領域に関する配列方向文字サイズ（たとえば「文字幅」）は、第１実施形態と同様にして決定される。具体的には、行領域の配列方向における長さを行領域内の文字数で除した値に基づいて、処理対象領域に関する配列方向文字サイズ（たとえば「文字幅」）が決定される（ステップＳ１６等）。

また、処理対象領域に関する直交方向文字サイズ（たとえば「文字高さ」）は、第２実施形態と同様にして決定される。具体的には、処理対象領域に含まれる１行の文字列に関する文字サイズであって文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズに基づいて、処理対象領域に関する直交方向文字サイズが決定される（ステップＳ１６）。

そして、ステップＳ１７において、ステップＳ１６にて決定された２種類のサイズ（配列方向文字サイズおよび直交方向文字サイズ）に基づいて、ＯＣＲ処理結果に係る文字列（テキスト情報）が、２つの方向において独立した文字サイズで埋め込まれる。具体的には、処理対象領域内の文字列を構成する各文字は、上述の配列方向文字サイズ（文字幅）として決定された大きさ（たとえば、２６ポイント幅）を当該文字列の配列方向において有し、且つ、上述の直交方向文字サイズ（文字高さ）として決定された大きさ（たとえば、２８ポイント幅）を当該文字列の直交方向において有するものとして配置される。このようにして、２方向において独立したサイズ（配列方向文字サイズおよび直交方向文字サイズ）に基づいて、ＯＣＲ処理結果に係る文字列が電子文書５００内に配置されて、当該電子文書５００が生成される。

なお、配列方向文字サイズおよび直交方向文字サイズは、それぞれ、各サイズを示す実際の値自体で（たとえば「ｍｍ（ミリメートル）」単位で）表現されてもよく、「フォントポイント数」で表現されてもよい。あるいは、一方のサイズは、他方のサイズに対する比率等で相対的に表現されるようにしてもよい。たとえば、配列方向文字サイズは、直交方向文字サイズ（フォントポイントサイズ等）の「１５０％」であると表現されるようにしてもよい。あるいは、逆に、直交方向文字サイズは、配列方向文字サイズ（フォントポイントサイズ等）の「６６％」であると表現されるようにしてもよい。他の実施形態においても同様である。

＜４．第４実施形態＞
上記各実施形態においては、文字領域２１０において１行単位で複数の部分領域２３０が抽出され送信される態様（換言すれば、各部分領域２３０が単一行の文字列の領域（単一の行領域）で構成される態様）が例示されているが、これに限定されない。たとえば、複数行に跨がる領域単位で複数の部分領域２３０が抽出され送信されるようにしてもよい。すなわち、文字領域２１０における複数行の文字列に係る領域を単位として複数の部分領域２３０が抽出され送信されるようにしてもよい。より詳細には、文字領域の段落ごとに区分された複数の部分領域が（段落単位で）抽出され送信されるようにしてもよい。これによれば、第１実施形態に比べて、処理対象領域は大きくなり、スキャン画像から抽出される処理対象領域の数が減少する。したがって、１つのＯＣＲ処理依頼あたりの画像データ量（データ転送量）が増大するとともにＯＣＲ処理の依頼回数が低減され、通信のオーバーヘッドが低減されること等により、効率的な通信を行うことが可能である。すなわち、処理の効率化を図ることができる。

この第４実施形態では、そのような改変を第２実施形態に対して行う態様について説明する。以下では、第２実施形態との相違点を中心に説明する。

具体的には、ステップＳ１１の後のステップＳ１２（図５参照）において、処理対象領域（部分領域２３０）がスキャン画像２００の文字領域２１０から段落単位で抽出される。すなわち、１行または複数行の文字列を含む領域（換言すれば、１又は複数の行領域を含む領域）が、部分領域２３０として抽出される。

より詳細には、第１実施形態と同様にして、１行の文字列の領域である行領域を抽出した後に行間間隔ｙを算出する。或る行と次の行との行間間隔ｙが所定の閾値ＴＨ２よりも小さいか否かに応じて、当該或る行と当該次の行とが同一の段落に属するか否かが判定される。ここで、閾値ＴＨ２は、上述の閾値ＴＨ１よりも大きな値であり（ＴＨ２＞ＴＨ１）、たとえば、数ミリメートル〜十数ミリメートルである。

上述の各実施形態では、図６のスキャン画像から、図７のような３つの部分領域２３０（２３１，２３２，２３３）がそれぞれ処理対象領域（処理単位領域）として抽出される。

一方、この第４実施形態では、図６のスキャン画像から、図１３のような２つの部分領域２３０（２３６，２３７）がそれぞれ処理対象領域（処理単位領域）として抽出される。図７における２つの行領域２３１，２３２の相互間の行間間隔ｙは上述の閾値ＴＨ２より小さいと判定され、行領域２３１，２３２は同一の段落に属する旨が判定される。一方、行領域２３２と当該行領域２３２の次の行領域２３３との行間間隔ｙ（Ｈ２１）は上述の閾値ＴＨ２よりも大きいと判定され（Ｈ２１＞ＴＨ２）、行領域２３３は行領域２３２とは別の段落に属する旨が判定される。

その結果、図１３に示すように、２つの行領域２３１，２３２を纏めた部分領域２３６が１つの処理対象領域として抽出される。また、別段落と判定された部分領域２３７が、部分領域２３６とは分離され、別の処理対象領域として抽出される。

また、この第４実施形態においては、ステップＳ１２において、各部分領域２３０内に存在する１または複数の「行領域（１行の文字列の領域）」もそれぞれ抽出される。具体的には、上述のように、閾値ＴＨ１による行領域の識別処理が行われる。これにより、たとえば、部分領域２３６に含まれる２つの行領域２３１，２３２も抽出される。

ステップＳ１３以後においては、第２実施形態と同様の処理が各部分領域（１または複数の行領域を含む領域）について実行される。

たとえば、ステップＳ１３においては、部分領域２３０（２３６，２３７）の位置および大きさが検出される。

また、部分領域が複数行の文字列を含む場合には、当該複数行のそれぞれに関する行領域（文字列領域）の位置および大きさも検出される。たとえば、複数行に係る部分領域２３６に含まれる各行領域２３１，２３２の位置および大きさも検出される（図１４参照）。

さらに、ステップＳ１３においては、各部分領域２３０内の行領域の個数（換言すれば、各処理対象領域２３０に含まれる文字列の行数）も検出される。たとえば、部分領域２３６の行領域の個数は「２」であり、部分領域２３７の行領域の個数は「１」である。

その後、ステップＳ１４〜Ｓ１５の各処理が実行され、その次のステップＳ１６においては配列方向文字サイズが決定される。

具体的には、処理対象領域（たとえば、部分領域２３６）のＹ方向（上下方向）における長さ（高さ）と当該処理対象領域に含まれる文字列の行数とに基づいて、当該処理対象領域に含まれる「行領域」の直交方向（Ｙ方向）における長さ（高さ）が検出される。たとえば、部分領域２３６のＹ方向における長さ（高さ）Ｈ１０（図１４参照）を、当該部分領域２３６に含まれる文字列の行数Ｍ（「２」）で除した値（＝Ｈ１０／Ｍ）が、行領域のＹ方向長さ（直交方向における長さ）として算出される。この実施形態では、部分領域２３６内の複数の行領域に関する「文字高さ」の平均値が、「行領域」の直交方向（Ｙ方向）における長さ（高さ）として検出されるとともに、当該部分領域２３６（処理対象領域）の文字の文字高さとして決定される。

そして、行領域の直交方向における当該長さに基づいて、当該行領域を含む部分領域２３６（処理対象領域）に関する直交方向文字サイズ（文字高さ）が決定される。たとえば、行領域の直交方向における当該長さが、そのまま、部分領域２３６（処理対象領域）に関する直交方向文字サイズ（文字高さ）として決定される。

つぎに、この「文字高さ」（Ｈ１０／Ｍ）に対応するフォントポイントサイズ（たとえば２６ポイント）が求められる。そして、部分領域２３０内の文字の「文字幅」は当該フォントポイントサイズに相当する大きさであると推定され決定される。謂わば、「文字高さ」に対応する標準的な「文字幅」が推定され決定される。

以後、第２実施形態と同様にして、処理対象領域に関する直交方向文字サイズ（文字高さ）に基づいて当該処理対象領域内に関する配列方向文字サイズ（文字幅）が決定されればよい。

また、ステップＳ１７以降の処理も同様に行われる。

たとえば、ステップＳ１７においては、ステップＳ１６にて決定された配列方向文字サイズに基づいて、ＯＣＲ処理結果に係る文字列（テキスト情報）が埋め込まれる。具体的には、処理対象領域内の文字列を構成する各文字は、その配列方向において上述の配列方向文字サイズ（文字幅）として決定された大きさを有する状態で配置される。なお、部分領域に複数行の文字列が含まれる場合には、たとえば、当該部分領域内の全ての行の文字列の各文字が、互いに同じ大きさを有するものとみなされて配置されればよい。

このようにして、配列方向文字サイズに基づいて、ＯＣＲ処理結果に係る文字列が電子文書５００内に配置されて、当該電子文書５００が生成される。

なお、上記第４実施形態では、上述のような改変を第２実施形態に対して行う態様について説明した。しかしながら、本発明はこれに限定されない。たとえば、同様の改変を第１実施形態に対して行うようにしてもよい。あるいは、同様の改変を第３実施形態に対して行うようにしてもよい。

これらの場合において、部分領域２３０内に複数の行領域が含まれるときには、「配列方向文字サイズ」の決定に際して、複数の行領域の全て（全ての行の文字列）について文字数を算出することを必ずしも要さず、当該複数の行領域のうちの任意の１行の行領域について文字数を算出するようにしてもよい。

たとえば、複数の行のうち最初の１行に関する行領域の「文字数」が算出され、当該行領域の幅を当該行領域の文字数で除した値に基づいて「配列方向文字サイズ」が決定されればよい。

そして、当該配列方向文字サイズが、（当該行領域のみならず）当該行領域を含む部分領域２３０内の全ての文字に関する「配列方向文字サイズ」とみなされて、部分領域２３０内の文字列が電子文書５００内に配置されるようにすればよい。これによれば、文字数の算出動作は、複数の行の文字列のうち一部の行の文字列についてのみ行われれば済むので、処理の高速化を図ることができる。同一段落に含まれる複数行の文字列の各文字の大きさは、それぞれ互いに同じであることが多いので、ＯＣＲ処理結果に係る複数行の文字列のそれぞれを配列方向において比較的正確な位置に配置することが可能である。

また、上記第４実施形態においては、処理対象領域（たとえば部分領域２３６）の高さと当該処理対象領域に含まれる文字列の行数とに基づいて、当該処理対象領域に含まれる「行領域」の高さが検出され、当該行領域の「高さ」に基づいて「配列方向文字サイズ」が決定される態様が例示されているが、これに限定されない。

たとえば、複数の行のうち最初の１行に関する行領域の「高さ」が画像処理により検出され、当該行領域の「高さ」に基づいて「配列方向文字サイズ」が決定されるようにしてもよい。

＜５．第５実施形態＞
また、上記第１実施形態〜上記第３実施形態においては、単一行の文字列（詳細には、単一行の文字列の全範囲）を含む領域が処理対象領域（部分領域）として抽出され送信されているが、これに限定されない。たとえば、単一行の文字列内に比較的大きな空隙が存在する場合等を考慮し、当該単一行の文字列を当該空隙で区切った小領域がそれぞれ処理対象領域（部分領域）として抽出され送信されるようにしてもよい。換言すれば、１行の文字列の一部の範囲の領域である行領域（１行内の小領域）が処理対象領域（部分領域）として抽出され送信されるようにしてもよい。

この第５実施形態では、そのような改変を第１実施形態に対して行う態様について説明する。以下では、第１実施形態との相違点を中心に説明する。

ここでは、ステップＳ１２（図５）において、図１５の文字領域２１０（２１２）における最下行の文字列に関して、文字列「１４×１７inch」に係る領域２３４と文字列「１７×１７inch」に係る領域２３５とが、互いに異なる部分領域２３０としてそれぞれ抽出される（図１６も参照）。

より詳細には、抽出部６５は、注目行に関して、注目行内における注目文字と当該注目文字の直前の文字との間隔である前間隔ｐと、当該注目文字と当該注目文字の直後の文字との間隔である後間隔ｑとを算出する。なお、隣接文字間間隔ｐ，ｑは、上述の字間間隔（隣接文字間間隔）ｘと同様にして算出されればよい。

後間隔ｑが前間隔ｐよりも所定程度を超えて大きいと判定される場合には、抽出部６５は、当該注目文字と当該注目文字の直後の文字との間に有意な空白領域があると判定し、当該空白領域の両側の２つの小領域を互いに異なる部分領域として抽出する。換言すれば、当該注目文字と当該注目文字の直後の文字とは、互いに異なる部分領域に属すると判定される。これにより、注目文字と当該注目文字の直前の文字とを含む小領域と当該注目文字の直後の文字を含む小領域とは、互いに異なる部分領域として抽出される。

より具体的には、値ｑの値ｐに対する比の値（ｑ／ｐ）が所定の閾値ＴＨ２（たとえば５００％）より大きい場合には、注目文字と当該注目文字の直後の文字との間に有意な空白領域があると判定する。逆に、当該比の値（ｑ／ｐ）が所定の閾値ＴＨ２より小さい場合には、注目文字と当該注目文字の直後の文字との間に有意な空白領域は存在せず、当該注目文字と当該注目文字の直後の文字との両文字は同一の部分領域に属すると判定される。このような処理が、第１行内の複数の文字に関して、一方側（たとえば左側）から他方側（たとえば右側）に向かう順序で順次に実行される。その結果、有意な空白領域が存在する場合には、当該空白領域によって区分される両側の小領域が抽出される。

これにより、たとえば、図１６に示すように、文字列「１４×１７inch」に係る領域２３４と文字列「１７×１７inch」に係る領域２３５とが、互いに異なる部分領域としてそれぞれ抽出される。

このようにして、１行内の各小領域が、有意な空白部分によって互いに分離され、部分領域２３０として抽出されるようにしてもよい。換言すれば、１行の文字列の配列方向における全範囲のうちの一部の範囲の領域（小領域）が処理対象領域として抽出されるようにしてもよい。

ステップＳ１３以後においては、第１実施形態と同様の処理が各部分領域（小領域）について実行される。たとえば、ステップＳ１３においては、各部分領域（小領域）の位置および大きさの検出処理等が行われ、ステップＳ１４，Ｓ１５においては、ＯＣＲ処理等が当該各部分領域（小領域）ごとに実行される。また、ステップＳ１６においては、上記各小領域（１行の文字列の配列方向における全範囲のうちの一部の範囲の領域）の直交方向における長さに基づいて直交方向文字サイズが算出され、当該直交方向文字サイズに基づいて処理対象領域内の文字に関する配列方向文字サイズが決定される。ステップＳ１７においては、部分領域（小領域）ごとに決定された当該配列方向文字サイズに基づいて、各小領域内の文字列が電子文書５００内に配置される。

以上のような態様で電子文書５００が生成されるようにしてもよい。

図１７は、第５実施形態に係る文字配置結果を示す図である。図１７においても、図１１等と同様に、両種類の文字列（ＯＣＲ処理前後の文字列）が重ねて表示されている。

この第５実施形態によれば、図１７に示すように、ＯＣＲ処理結果に係る各文字は、スキャン画像２００内に画像として表示される各文字の位置に対して、左右方向において比較的近い位置に配置される。たとえば、各部分領域２３１，２３２，２３４（図１６）のＯＣＲ処理結果の文字列は、それぞれ、上述の比較例による文字配置結果を示す図１２と比較すると判るように、その配列方向において比較的正確な位置に配置されている。

なお、図１８は、別の比較例に係る文字配置結果を示す図である。図１８においても、図１７と同様に、両種類の文字列（ＯＣＲ処理前後の文字列）が重ねて表示されている。図１８においては、領域２３４と領域２３５との双方を含む領域が１つの処理対象領域（部分領域）として決定され、第１実施形態と同様の処理が行われた状況が想定されている。図１８においては、行内に存在する比較的大きな幅の空白領域の影響により、複数の部分領域のうち領域２３５の文字が本来の位置から比較的大きくずれて配置されている。

これに対して、図１７においては、（部分領域２３１，２３２，２３４のみならず）部分領域２３５に係るＯＣＲ処理結果の文字列も、その配列方向においてさらに正確な位置に配置されている。このように、１行の文字列の領域である行領域（ただし、ここでは１行の文字列の「一部の範囲の領域」である行領域）を単位として処理対象領域を抽出することによれば、１行の文字列内に存在する比較的大きな空白領域の影響を抑制ないし低減することが可能である。

なお、この第５実施形態では、上述のような改変を第１実施形態に対して行う態様について説明した。しかしながら、本発明はこれに限定されず、同様の改変を第２実施形態および第３実施形態に対して行うようにしてもよい。たとえば、１行の文字列の配列方向における全範囲のうちの一部の範囲の領域が処理対象領域として抽出され、当該一部の範囲の領域の直交方向における長さに基づいて直交方向文字サイズが算出されるようにしてもよい。そして、当該直交方向文字サイズに基づいて処理対象領域内の文字に関する配列方向文字サイズが決定される等の処理が行われればよい。

＜６．変形例等＞
以上、この発明の実施の形態について説明したが、この発明は上記説明した内容のものに限定されるものではない。

たとえば、上記各実施形態では、「文字幅」の決定処理（ステップＳ１６）は、ステップＳ１５の後に実行されているが、これに限定されない。当該決定処理は、ステップＳ１４の前に（具体的には、ステップＳ１３にて）実行されるようにしてもよい。あるいは、当該決定処理は、ステップＳ１４の処理の開始直後（あるいは開始前）にその実行が開始され、クラウドサーバ９０によるＯＣＲ処理と並行して実行されるようにしてもよい。

上記各実施形態においては、スキャン画像２００の文字領域２１０から複数の部分領域２３０が抽出され、各部分領域２３０を単位としてＯＣＲ処理が施される態様が例示されているが、これに限定されない。たとえば、スキャン画像２００の文字領域２１０の全体が１つの処理対象領域として決定され、当該文字領域２１０の全体を１つの単位としてＯＣＲ処理が施されるようにしてもよい。そして、文字領域２１０全体に対するＯＣＲ処理の処理結果がクラウドサーバ９０から外部端末５０によって受信され、当該処理結果に基づいて電子文書が生成されるようにしてもよい。

また、上記各実施形態においては、横書きの文字列について主に説明したが、これに限定されず、縦書きの文字列にも上記の思想を適用することが可能である。なお、上述のように、縦書きの文字列の場合には、文字列の配列方向は上下方向（文字の高さ方向）であり、「文字高さ」が配列方向文字サイズ（文字の配列方向サイズ）に相当し、「文字幅」が直交方向文字サイズに相当する。

また、上記各実施形態においては、スキャン画像の部分領域がＯＣＲ処理の処理対象領域として抽出される態様を例示しているが、本発明はこれに限定されない。たとえば、スキャン画像の部分領域ではなく、スキャン画像の全体領域がＯＣＲ処理の処理対象領域として抽出（設定）されるようにしてもよい。

また、上記各実施形態においては、ＭＦＰ１０にて生成されたスキャン画像が外部端末５０に送信され、当該外部端末５０が当該スキャン画像に基づき電子文書を生成する電子文書生成装置として機能するとともに、クラウドサーバ９０がＯＣＲ処理を実行するＯＣＲ処理装置として機能する態様が例示されているが、これに限定されない。

たとえば、図１９に示すようなシステム構成等において、スキャン画像を生成したＭＦＰ１０自身が、上記の外部端末５０（電子文書生成アプリケーション１１０）と同様の動作を実行する電子文書生成装置として機能するとともに、クラウドサーバ９０がＯＣＲ処理（汎用ＯＣＲアプリケーション１２０）を実行するＯＣＲ処理装置として機能するようにしてもよい。より詳細には、クラウドサーバ９０は、ＭＦＰ１０からの依頼に基づいて当該スキャン画像に対するＯＣＲ処理を実行し、当該ＯＣＲ処理の処理結果をＭＦＰ１０に送信するようにしてもよい。そして、ＭＦＰ１０は、当該ＯＣＲ処理の処理結果と、ＭＦＰ１０内で決定された配列方向文字サイズ（たとえば、「文字幅」等）とに基づいて、ＯＣＲ処理結果に係る文字列を電子文書内に配置して、電子文書を生成するようにしてもよい。

あるいは、図２０に示すようなシステム構成等において、スキャン画像を生成したＭＦＰ１０自身が、上記各実施形態における外部端末５０（電子文書生成アプリケーション１１０）と同様の動作を実行する電子文書生成装置として機能するとともに、今度は外部端末５０が上記のクラウドサーバ９０と同様のＯＣＲ処理（汎用ＯＣＲアプリケーション１２０）を実行するＯＣＲ処理装置として機能するようにしてもよい。より詳細には、外部端末５０は、ＭＦＰ１０からの依頼に基づいて当該スキャン画像に対するＯＣＲ処理を実行し、当該ＯＣＲ処理の処理結果をＭＦＰ１０に送信するようにしてもよい。そして、ＭＦＰ１０は、当該ＯＣＲ処理の処理結果と、ＭＦＰ１０内で決定された配列方向文字サイズ（たとえば、「文字幅」等）とに基づいて、各ＯＣＲ処理結果に係る文字列を電子文書内に配置して、電子文書を生成するようにしてもよい。

また、上記各実施形態等においては、透明テキスト付きＰＤＦ（元の文字画像に重畳して、ＯＣＲ結果の文字列が非表示状態で埋め込まれているＰＤＦ形式のファイル）（サーチャブルＰＤＦ等）が電子文書５００として生成されているが、本発明はこれに限定されず、次のような電子文書５００が生成されてもよい。

具体的には、最終的な電子文書５００において、元の文字画像（文字領域２１０の画像）が削除されるとともに、ＯＣＲ結果のテキストデータが可視化された状態で当該元の文字画像の代わりに表示されてもよい。

より詳細には、スキャン画像２００における文字領域２１０の各部分領域２３０に係る画像が削除され、当該各部分領域２３０の画像に代えて、各部分領域２３０についての処理結果に係る文字列が当該各部分領域２３０のそれぞれの検出位置に「表示状態」で埋め込まれる（配置される）ことによって、電子文書５００が生成されるようにしてもよい。すなわち、文字画像に代えてテキスト文字列を有する電子文書５００が生成されるようにしてもよい。

また、上記各実施形態等においては、ＰＤＦ形式の電子文書が例示されているが、本発明はこれに限定されず、他の各種の形式（ＸＰＳ形式等）の電子文書が生成されるようにしてもよい。

１画像形成システム（電子文書生成システム）
１０ＭＦＰ（画像形成装置）
２５タッチパネル
５０外部端末
９０クラウドサーバ
１１０電子文書生成アプリケーション
１２０汎用ＯＣＲアプリケーション
２００スキャン画像
２１０文字領域
２２０非文字領域
２３０部分領域（処理対象領域）
２３１〜２３３行領域
２５０テキストデータ
３００属性指定データ
５００電子文書

Claims

電子文書生成システムであって、
原稿のスキャン画像に基づき電子文書を生成する第１の装置と、
前記第１の装置からの依頼に基づいて前記スキャン画像に対する光学文字認識処理を実行し、当該光学文字認識処理の処理結果を前記第１の装置に送出する第２の装置と、
を備え、
前記第１の装置は、
前記スキャン画像内にて或る方向に配列された１行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出する抽出手段と、
前記行領域の大きさを検出する検出手段と、
前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向における文字サイズである配列方向文字サイズを決定する決定手段と、
前記光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを、前記第２の装置に送出する指示送出手段と、
前記処理対象領域に関する前記光学文字認識処理の処理結果を前記第２の装置から受け取る受取手段と、
前記決定手段により決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成する生成手段と、
を有し、
前記抽出手段は、前記スキャン画像内の複数の部分領域のそれぞれを前記処理対象領域として抽出し、
前記指示送出手段は、前記光学文字認識処理を前記複数の部分領域のそれぞれに関して行うべき旨の指示と前記複数の部分領域のそれぞれの画像データとを、前記第２の装置に送出し、
前記受取手段は、前記複数の部分領域のそれぞれに関する前記光学文字認識処理の処理結果を前記第２の装置から受け取り、
前記生成手段は、前記複数の部分領域のそれぞれに関して前記決定手段により決定された前記配列方向文字サイズに基づいて、前記複数の部分領域のそれぞれに関する前記処理結果に係る文字列を前記複数の部分領域のそれぞれに配置することを特徴とする電子文書生成システム。
請求項１に記載の電子文書生成システムにおいて、
前記決定手段は、前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする電子文書生成システム。
請求項２に記載の電子文書生成システムにおいて、
前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、
前記決定手段は、前記複数行の文字列のうちの任意の１行の文字列に関する領域である前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする電子文書生成システム。
請求項２に記載の電子文書生成システムにおいて、
前記抽出手段は、単一行の文字列に係る領域を前記処理対象領域として抽出し、
前記決定手段は、前記単一行の文字列に関する領域である前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする電子文書生成システム。
請求項２に記載の電子文書生成システムにおいて、
前記抽出手段は、前記１行の文字列の前記配列方向における全範囲のうち一部の範囲の領域を前記処理対象領域として抽出し、
前記決定手段は、前記一部の範囲の領域の前記配列方向における長さを前記一部の範囲の領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする電子文書生成システム。
請求項１に記載の電子文書生成システムにおいて、
前記決定手段は、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを前記行領域の前記直交方向における長さに基づいて決定するとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成システム。
請求項６に記載の電子文書生成システムにおいて、
前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、
前記決定手段は、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて前記行領域の前記直交方向における長さを検出し、前記行領域の前記直交方向における当該長さに基づいて前記直交方向文字サイズを決定するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成システム。
請求項６に記載の電子文書生成システムにおいて、
前記抽出手段は、単一行の文字列に係る領域を前記処理対象領域として抽出し、
前記決定手段は、前記単一行の文字列に係る領域の前記直交方向における長さに基づいて前記直交方向文字サイズを算出するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成システム。
請求項６に記載の電子文書生成システムにおいて、
前記抽出手段は、前記１行の文字列の前記配列方向における全範囲のうちの一部の範囲の領域を前記処理対象領域として抽出し、
前記決定手段は、前記一部の範囲の領域の前記直交方向における長さに基づいて前記直交方向文字サイズを算出するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成システム。
請求項１に記載の電子文書生成システムにおいて、
前記決定手段は、
前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記処理対象領域に関する前記配列方向文字サイズを決定するとともに、
前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを、前記行領域の前記直交方向における長さに基づいて決定し、
前記生成手段は、前記決定手段により決定された前記配列方向文字サイズと前記直交方向文字サイズとに基づいて前記処理結果に係る文字列を前記電子文書内に配置して、前記電子文書を生成することを特徴とする電子文書生成システム。
請求項１ないし請求項１０のいずれかに記載の電子文書生成システムにおいて、
前記検出手段は、前記スキャン画像内での前記処理対象領域の位置をも検出し、
前記生成手段は、前記処理対象領域の前記位置にも基づいて前記処理結果に係る文字列を前記電子文書内に配置することを特徴とする電子文書生成システム。
請求項１ないし請求項１１のいずれかに記載の電子文書生成システムにおいて、
前記第１の装置は、画像形成装置であり、
前記第２の装置は、クラウドサーバであることを特徴とする電子文書生成システム。
請求項１ないし請求項１１のいずれかに記載の電子文書生成システムにおいて、
前記第１の装置は、画像形成装置であり、
前記第２の装置は、通信端末であることを特徴とする電子文書生成システム。
請求項１ないし請求項１１のいずれかに記載の電子文書生成システムにおいて、
前記第１の装置は、通信端末であり、
前記第２の装置は、クラウドサーバであることを特徴とする電子文書生成システム。
原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置であって、
前記スキャン画像内にて或る方向に配列された１行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出する抽出手段と、
前記行領域の大きさを検出する検出手段と、
前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向における文字サイズである配列方向文字サイズを決定する決定手段と、
光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出する指示送出手段と、
前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取る受取手段と、
前記決定手段により決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成する生成手段と、
を備え、
前記抽出手段は、前記スキャン画像内の複数の部分領域のそれぞれを前記処理対象領域として抽出し、
前記指示送出手段は、前記光学文字認識処理を前記複数の部分領域のそれぞれに関して行うべき旨の指示と前記複数の部分領域のそれぞれの画像データとを、前記外部装置に送出し、
前記受取手段は、前記複数の部分領域のそれぞれに関する前記光学文字認識処理の処理結果を前記外部装置から受け取り、
前記生成手段は、前記複数の部分領域のそれぞれに関して前記決定手段により決定された前記配列方向文字サイズに基づいて、前記複数の部分領域のそれぞれに関する前記処理結果に係る文字列を前記複数の部分領域のそれぞれに配置することを特徴とする電子文書生成装置。
請求項１５に記載の電子文書生成装置において、
前記決定手段は、前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。
請求項１６に記載の電子文書生成装置において、
前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、
前記決定手段は、前記複数行の文字列のうちの任意の１行の文字列に関する領域である前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。
請求項１６に記載の電子文書生成装置において、
前記抽出手段は、単一行の文字列に係る領域を前記処理対象領域として抽出し、
前記決定手段は、前記単一行の文字列に関する領域である前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。
請求項１６に記載の電子文書生成装置において、
前記抽出手段は、前記１行の文字列の前記配列方向における全範囲のうち一部の範囲の領域を前記処理対象領域として抽出し、
前記決定手段は、前記一部の範囲の領域の前記配列方向における長さを前記一部の範囲の領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。
請求項１５に記載の電子文書生成装置において、
前記決定手段は、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを前記行領域の前記直交方向における長さに基づいて決定するとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。
請求項２０に記載の電子文書生成装置において、
前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、
前記決定手段は、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて前記行領域の前記直交方向における長さを算出し、前記行領域の前記直交方向における当該長さに基づいて前記直交方向文字サイズを決定するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。
請求項２０に記載の電子文書生成装置において、
前記抽出手段は、単一行の文字列に係る領域を前記処理対象領域として抽出し、
前記決定手段は、前記単一行の文字列に係る領域の前記直交方向における長さに基づいて前記直交方向文字サイズを算出するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。
請求項２０に記載の電子文書生成装置において、
前記抽出手段は、前記１行の文字列の前記配列方向における全範囲のうちの一部の範囲の領域を前記処理対象領域として抽出し、
前記決定手段は、前記一部の範囲の領域の前記直交方向における長さに基づいて前記直交方向文字サイズを算出するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。
請求項１５に記載の電子文書生成装置において、
前記決定手段は、
前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記処理対象領域に関する前記配列方向文字サイズを決定するとともに、
前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを、前記行領域の前記直交方向における長さに基づいて決定し、
前記生成手段は、前記決定手段により決定された前記配列方向文字サイズと前記直交方向文字サイズとに基づいて前記処理結果に係る文字列を前記電子文書内に配置して、前記電子文書を生成することを特徴とする電子文書生成装置。
請求項１５ないし請求項２４のいずれかに記載の電子文書生成装置において、
前記検出手段は、前記スキャン画像内での前記処理対象領域の位置をも検出し、
前記生成手段は、前記処理対象領域の前記位置にも基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成することを特徴とする電子文書生成装置。
請求項１５ないし請求項２５のいずれかに記載の電子文書生成装置において、
前記電子文書生成装置は、画像形成装置であることを特徴とする電子文書生成装置。
請求項１５ないし請求項２５のいずれかに記載の電子文書生成装置において、
前記電子文書生成装置は、前記スキャン画像を生成する画像形成装置とは異なる通信装置であって前記外部装置とも異なる通信装置であることを特徴とする電子文書生成装置。
原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置に内蔵されたコンピュータに、
ａ）前記スキャン画像内にて或る方向に配列された１行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出するステップと、
ｂ）前記行領域の大きさを検出するステップと、
ｃ）前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向における文字サイズである配列方向文字サイズを決定するステップと、
ｄ）光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出するステップと、
ｅ）前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取るステップと、
ｆ）前記ステップｃ）にて決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置するステップと、
を実行させるためのプログラムであって、
前記ステップａ）においては、前記スキャン画像内の複数の部分領域のそれぞれが前記処理対象領域として抽出され、
前記ステップｄ）においては、前記光学文字認識処理を前記複数の部分領域のそれぞれに関して行うべき旨の指示と前記複数の部分領域のそれぞれの画像データとが、前記外部装置に送出され、
前記ステップｅ）においては、前記複数の部分領域のそれぞれに関する前記光学文字認識処理の処理結果が前記外部装置から受け取られ、
前記ステップｆ）においては、前記複数の部分領域のそれぞれに関して前記ステップｃ）にて決定された前記配列方向文字サイズに基づいて、前記複数の部分領域のそれぞれに関する前記処理結果に係る文字列が前記複数の部分領域のそれぞれに配置されることを特徴とするプログラム。
原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置であって、
複数行の文字列を含む処理対象領域を前記スキャン画像から抽出する抽出手段と、
前記処理対象領域の大きさを検出する検出手段と、
前記処理対象領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記処理対象領域内の文字列の配列方向における文字サイズである配列方向文字サイズを決定する決定手段と、
光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出する指示送出手段と、
前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取る受取手段と、
前記決定手段により決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成する生成手段と、
を備え、
前記決定手段は、前記処理対象領域内の文字の文字サイズであって前記配列方向に直交する直交方向の文字サイズである直交方向文字サイズを、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて決定するとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。
原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置に内蔵されたコンピュータに、
ａ）複数行の文字列を含む処理対象領域を前記スキャン画像から抽出するステップと、
ｂ）前記処理対象領域の大きさを検出するステップと、
ｃ）前記処理対象領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記処理対象領域内の文字列の配列方向における文字サイズである配列方向文字サイズを決定するステップと、
ｄ）光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出するステップと、
ｅ）前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取るステップと、
ｆ）前記ステップｃ）にて決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置するステップと、
を実行させるためのプログラムであって、
前記ステップｃ）は、
ｃ−１）前記処理対象領域内の文字の文字サイズであって前記配列方向に直交する直交方向の文字サイズである直交方向文字サイズを、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて決定するステップと、
ｃ−２）前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定するステップと、
を有することを特徴とするプログラム。
電子文書生成システムであって、
原稿のスキャン画像に基づき電子文書を生成する第１の装置と、
前記第１の装置からの依頼に基づいて前記スキャン画像に対する光学文字認識処理を実行し、当該光学文字認識処理の処理結果を前記第１の装置に送出する第２の装置と、
を備え、
前記第１の装置は、
前記スキャン画像内にて或る方向に配列された１行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出する抽出手段と、
前記行領域の大きさを検出する検出手段と、
前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向における文字サイズである配列方向文字サイズを決定する決定手段と、
前記光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを、前記第２の装置に送出する指示送出手段と、
前記処理対象領域に関する前記光学文字認識処理の処理結果を前記第２の装置から受け取る受取手段と、
前記決定手段により決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成する生成手段と、
を有し、
前記決定手段は、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを前記行領域の前記直交方向における長さに基づいて決定するとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定し、
前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、
前記決定手段は、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて前記行領域の前記直交方向における長さを検出し、前記行領域の前記直交方向における当該長さに基づいて前記直交方向文字サイズを決定するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成システム。
原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置であって、
前記スキャン画像内にて或る方向に配列された１行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出する抽出手段と、
前記行領域の大きさを検出する検出手段と、
前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向における文字サイズである配列方向文字サイズを決定する決定手段と、
光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出する指示送出手段と、
前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取る受取手段と、
前記決定手段により決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成する生成手段と、
を備え、
前記決定手段は、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを前記行領域の前記直交方向における長さに基づいて決定するとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定し、
前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、
前記決定手段は、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて前記行領域の前記直交方向における長さを算出し、前記行領域の前記直交方向における当該長さに基づいて前記直交方向文字サイズを決定するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。
原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置に内蔵されたコンピュータに、
ａ）前記スキャン画像内にて或る方向に配列された１行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出するステップと、
ｂ）前記行領域の大きさを検出するステップと、
ｃ）前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向における文字サイズである配列方向文字サイズを決定するステップと、
ｄ）光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出するステップと、
ｅ）前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取るステップと、
ｆ）前記ステップｃ）にて決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置するステップと、
を実行させるためのプログラムであって、
前記ステップｃ）においては、前記処理対象領域内の文字の文字サイズであって前記１行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズが前記行領域の前記直交方向における長さに基づいて決定されるとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズが決定され、
前記ステップａ）においては、複数行の文字列を含む領域が前記処理対象領域として抽出され、
前記ステップｃ）においては、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて前記行領域の前記直交方向における長さが算出され、前記行領域の前記直交方向における当該長さに基づいて前記直交方向文字サイズが決定されるとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズが決定されることを特徴とするプログラム。