JP6119689B2 - 電子文書生成システム、電子文書生成装置およびプログラム - Google Patents
電子文書生成システム、電子文書生成装置およびプログラム Download PDFInfo
- Publication number
- JP6119689B2 JP6119689B2 JP2014143600A JP2014143600A JP6119689B2 JP 6119689 B2 JP6119689 B2 JP 6119689B2 JP 2014143600 A JP2014143600 A JP 2014143600A JP 2014143600 A JP2014143600 A JP 2014143600A JP 6119689 B2 JP6119689 B2 JP 6119689B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- electronic document
- area
- processing target
- arrangement direction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3872—Repositioning or masking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/95—Hardware or software architectures specially adapted for image or video understanding structured as a network, e.g. client-server architectures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/147—Determination of region of interest
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00204—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
- H04N1/00244—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3871—Composing, repositioning or otherwise geometrically modifying originals the composed originals being of different kinds, e.g. low- and high-resolution originals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0094—Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Character Input (AREA)
- Document Processing Apparatus (AREA)
- Character Discrimination (AREA)
Description
請求項31の発明は、電子文書生成システムであって、原稿のスキャン画像に基づき電子文書を生成する第1の装置と、前記第1の装置からの依頼に基づいて前記スキャン画像に対する光学文字認識処理を実行し、当該光学文字認識処理の処理結果を前記第1の装置に送出する第2の装置と、を備え、前記第1の装置は、前記スキャン画像内にて或る方向に配列された1行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出する抽出手段と、前記行領域の大きさを検出する検出手段と、前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向における文字サイズである配列方向文字サイズを決定する決定手段と、前記光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを、前記第2の装置に送出する指示送出手段と、前記処理対象領域に関する前記光学文字認識処理の処理結果を前記第2の装置から受け取る受取手段と、前記決定手段により決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成する生成手段と、を有し、前記決定手段は、前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを前記行領域の前記直交方向における長さに基づいて決定するとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定し、前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、前記決定手段は、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて前記行領域の前記直交方向における長さを検出し、前記行領域の前記直交方向における当該長さに基づいて前記直交方向文字サイズを決定するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする。
請求項32の発明は、原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置であって、前記スキャン画像内にて或る方向に配列された1行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出する抽出手段と、前記行領域の大きさを検出する検出手段と、前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向における文字サイズである配列方向文字サイズを決定する決定手段と、光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出する指示送出手段と、前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取る受取手段と、前記決定手段により決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成する生成手段と、を備え、前記決定手段は、前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを前記行領域の前記直交方向における長さに基づいて決定するとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定し、前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、前記決定手段は、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて前記行領域の前記直交方向における長さを算出し、前記行領域の前記直交方向における当該長さに基づいて前記直交方向文字サイズを決定するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする。
請求項33の発明は、原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置に内蔵されたコンピュータに、a)前記スキャン画像内にて或る方向に配列された1行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出するステップと、b)前記行領域の大きさを検出するステップと、c)前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向における文字サイズである配列方向文字サイズを決定するステップと、d)光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出するステップと、e)前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取るステップと、f)前記ステップc)にて決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置するステップと、を実行させるためのプログラムであって、前記ステップc)においては、前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズが前記行領域の前記直交方向における長さに基づいて決定されるとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズが決定され、前記ステップa)においては、複数行の文字列を含む領域が前記処理対象領域として抽出され、前記ステップc)においては、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて前記行領域の前記直交方向における長さが算出され、前記行領域の前記直交方向における当該長さに基づいて前記直交方向文字サイズが決定されるとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズが決定されることを特徴とする。
<1−1.構成概要>
図1は、本発明に係る画像形成システム1を示す図である。図1に示すように、画像形成システム1は、画像形成装置10と外部端末50とクラウドサーバ90とを備える。
図2は、画像形成装置10の機能ブロックを示す図である。ここでは、画像形成装置10として、MFP(マルチ・ファンクション・ペリフェラル(Multi-Functional Peripheral))を例示する。図2においては、MFP10の機能ブロックが示されている。
次に外部端末50の構成について説明する。
この実施形態においては、外部端末50は、OCR処理の処理対象領域(部分領域)として文字列領域(行領域)を1行ごとにスキャン画像から抽出してクラウドサーバ90に送信し、各処理対象領域に関するOCR処理結果をクラウドサーバ90から受信する。そして、外部端末50は、当該各処理対象領域に関するOCR処理結果を埋め込んだ電子文書500を生成する。この際、各行領域の幅(1行の文字列の配列方向(幅方向)の長さ)等に基づいて、上述の配列方向文字サイズ(文字幅)が決定され、当該配列方向文字サイズを反映して各OCR処理結果に係る文字列が電子文書500に配置される。
まず、ユーザは、スキャン対象の原稿をMFP10の原稿台(たとえば、自動給紙装置(ADF:Auto Document Feeder )あるいは原稿載置用ガラス面等)に載置する。
その後、外部端末50は、電子文書生成アプリケーション110を実行することによって、図5に示すような処理を実行する。
第2実施形態は、第1実施形態の変形例である。以下では、第1実施形態との相違点を中心に説明する。
上記各実施形態においては、各部分領域(処理対象領域)230に関する配列方向文字サイズ(「文字幅」等)が決定されるとともに、当該各部分領域230に関する直交方向文字サイズ(「文字高さ」等)は、当該配列方向文字サイズに連動して決定されている。より詳細には、OCR処理結果の各文字が標準的な縦横比を有するものとして、配列方向文字サイズと直交方向文字サイズとが決定されている。
上記各実施形態においては、文字領域210において1行単位で複数の部分領域230が抽出され送信される態様(換言すれば、各部分領域230が単一行の文字列の領域(単一の行領域)で構成される態様)が例示されているが、これに限定されない。たとえば、複数行に跨がる領域単位で複数の部分領域230が抽出され送信されるようにしてもよい。すなわち、文字領域210における複数行の文字列に係る領域を単位として複数の部分領域230が抽出され送信されるようにしてもよい。より詳細には、文字領域の段落ごとに区分された複数の部分領域が(段落単位で)抽出され送信されるようにしてもよい。これによれば、第1実施形態に比べて、処理対象領域は大きくなり、スキャン画像から抽出される処理対象領域の数が減少する。したがって、1つのOCR処理依頼あたりの画像データ量(データ転送量)が増大するとともにOCR処理の依頼回数が低減され、通信のオーバーヘッドが低減されること等により、効率的な通信を行うことが可能である。すなわち、処理の効率化を図ることができる。
また、上記第1実施形態〜上記第3実施形態においては、単一行の文字列(詳細には、単一行の文字列の全範囲)を含む領域が処理対象領域(部分領域)として抽出され送信されているが、これに限定されない。たとえば、単一行の文字列内に比較的大きな空隙が存在する場合等を考慮し、当該単一行の文字列を当該空隙で区切った小領域がそれぞれ処理対象領域(部分領域)として抽出され送信されるようにしてもよい。換言すれば、1行の文字列の一部の範囲の領域である行領域(1行内の小領域)が処理対象領域(部分領域)として抽出され送信されるようにしてもよい。
以上、この発明の実施の形態について説明したが、この発明は上記説明した内容のものに限定されるものではない。
10 MFP(画像形成装置)
25 タッチパネル
50 外部端末
90 クラウドサーバ
110 電子文書生成アプリケーション
120 汎用OCRアプリケーション
200 スキャン画像
210 文字領域
220 非文字領域
230 部分領域(処理対象領域)
231〜233 行領域
250 テキストデータ
300 属性指定データ
500 電子文書
Claims (33)
- 電子文書生成システムであって、
原稿のスキャン画像に基づき電子文書を生成する第1の装置と、
前記第1の装置からの依頼に基づいて前記スキャン画像に対する光学文字認識処理を実行し、当該光学文字認識処理の処理結果を前記第1の装置に送出する第2の装置と、
を備え、
前記第1の装置は、
前記スキャン画像内にて或る方向に配列された1行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出する抽出手段と、
前記行領域の大きさを検出する検出手段と、
前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向における文字サイズである配列方向文字サイズを決定する決定手段と、
前記光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを、前記第2の装置に送出する指示送出手段と、
前記処理対象領域に関する前記光学文字認識処理の処理結果を前記第2の装置から受け取る受取手段と、
前記決定手段により決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成する生成手段と、
を有し、
前記抽出手段は、前記スキャン画像内の複数の部分領域のそれぞれを前記処理対象領域として抽出し、
前記指示送出手段は、前記光学文字認識処理を前記複数の部分領域のそれぞれに関して行うべき旨の指示と前記複数の部分領域のそれぞれの画像データとを、前記第2の装置に送出し、
前記受取手段は、前記複数の部分領域のそれぞれに関する前記光学文字認識処理の処理結果を前記第2の装置から受け取り、
前記生成手段は、前記複数の部分領域のそれぞれに関して前記決定手段により決定された前記配列方向文字サイズに基づいて、前記複数の部分領域のそれぞれに関する前記処理結果に係る文字列を前記複数の部分領域のそれぞれに配置することを特徴とする電子文書生成システム。 - 請求項1に記載の電子文書生成システムにおいて、
前記決定手段は、前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする電子文書生成システム。 - 請求項2に記載の電子文書生成システムにおいて、
前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、
前記決定手段は、前記複数行の文字列のうちの任意の1行の文字列に関する領域である前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする電子文書生成システム。 - 請求項2に記載の電子文書生成システムにおいて、
前記抽出手段は、単一行の文字列に係る領域を前記処理対象領域として抽出し、
前記決定手段は、前記単一行の文字列に関する領域である前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする電子文書生成システム。 - 請求項2に記載の電子文書生成システムにおいて、
前記抽出手段は、前記1行の文字列の前記配列方向における全範囲のうち一部の範囲の領域を前記処理対象領域として抽出し、
前記決定手段は、前記一部の範囲の領域の前記配列方向における長さを前記一部の範囲の領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする電子文書生成システム。 - 請求項1に記載の電子文書生成システムにおいて、
前記決定手段は、前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを前記行領域の前記直交方向における長さに基づいて決定するとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成システム。 - 請求項6に記載の電子文書生成システムにおいて、
前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、
前記決定手段は、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて前記行領域の前記直交方向における長さを検出し、前記行領域の前記直交方向における当該長さに基づいて前記直交方向文字サイズを決定するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成システム。 - 請求項6に記載の電子文書生成システムにおいて、
前記抽出手段は、単一行の文字列に係る領域を前記処理対象領域として抽出し、
前記決定手段は、前記単一行の文字列に係る領域の前記直交方向における長さに基づいて前記直交方向文字サイズを算出するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成システム。 - 請求項6に記載の電子文書生成システムにおいて、
前記抽出手段は、前記1行の文字列の前記配列方向における全範囲のうちの一部の範囲の領域を前記処理対象領域として抽出し、
前記決定手段は、前記一部の範囲の領域の前記直交方向における長さに基づいて前記直交方向文字サイズを算出するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成システム。 - 請求項1に記載の電子文書生成システムにおいて、
前記決定手段は、
前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記処理対象領域に関する前記配列方向文字サイズを決定するとともに、
前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを、前記行領域の前記直交方向における長さに基づいて決定し、
前記生成手段は、前記決定手段により決定された前記配列方向文字サイズと前記直交方向文字サイズとに基づいて前記処理結果に係る文字列を前記電子文書内に配置して、前記電子文書を生成することを特徴とする電子文書生成システム。 - 請求項1ないし請求項10のいずれかに記載の電子文書生成システムにおいて、
前記検出手段は、前記スキャン画像内での前記処理対象領域の位置をも検出し、
前記生成手段は、前記処理対象領域の前記位置にも基づいて前記処理結果に係る文字列を前記電子文書内に配置することを特徴とする電子文書生成システム。 - 請求項1ないし請求項11のいずれかに記載の電子文書生成システムにおいて、
前記第1の装置は、画像形成装置であり、
前記第2の装置は、クラウドサーバであることを特徴とする電子文書生成システム。 - 請求項1ないし請求項11のいずれかに記載の電子文書生成システムにおいて、
前記第1の装置は、画像形成装置であり、
前記第2の装置は、通信端末であることを特徴とする電子文書生成システム。 - 請求項1ないし請求項11のいずれかに記載の電子文書生成システムにおいて、
前記第1の装置は、通信端末であり、
前記第2の装置は、クラウドサーバであることを特徴とする電子文書生成システム。 - 原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置であって、
前記スキャン画像内にて或る方向に配列された1行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出する抽出手段と、
前記行領域の大きさを検出する検出手段と、
前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向における文字サイズである配列方向文字サイズを決定する決定手段と、
光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出する指示送出手段と、
前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取る受取手段と、
前記決定手段により決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成する生成手段と、
を備え、
前記抽出手段は、前記スキャン画像内の複数の部分領域のそれぞれを前記処理対象領域として抽出し、
前記指示送出手段は、前記光学文字認識処理を前記複数の部分領域のそれぞれに関して行うべき旨の指示と前記複数の部分領域のそれぞれの画像データとを、前記外部装置に送出し、
前記受取手段は、前記複数の部分領域のそれぞれに関する前記光学文字認識処理の処理結果を前記外部装置から受け取り、
前記生成手段は、前記複数の部分領域のそれぞれに関して前記決定手段により決定された前記配列方向文字サイズに基づいて、前記複数の部分領域のそれぞれに関する前記処理結果に係る文字列を前記複数の部分領域のそれぞれに配置することを特徴とする電子文書生成装置。 - 請求項15に記載の電子文書生成装置において、
前記決定手段は、前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。 - 請求項16に記載の電子文書生成装置において、
前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、
前記決定手段は、前記複数行の文字列のうちの任意の1行の文字列に関する領域である前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。 - 請求項16に記載の電子文書生成装置において、
前記抽出手段は、単一行の文字列に係る領域を前記処理対象領域として抽出し、
前記決定手段は、前記単一行の文字列に関する領域である前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。 - 請求項16に記載の電子文書生成装置において、
前記抽出手段は、前記1行の文字列の前記配列方向における全範囲のうち一部の範囲の領域を前記処理対象領域として抽出し、
前記決定手段は、前記一部の範囲の領域の前記配列方向における長さを前記一部の範囲の領域内の文字数で除した値に基づいて、前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。 - 請求項15に記載の電子文書生成装置において、
前記決定手段は、前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを前記行領域の前記直交方向における長さに基づいて決定するとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。 - 請求項20に記載の電子文書生成装置において、
前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、
前記決定手段は、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて前記行領域の前記直交方向における長さを算出し、前記行領域の前記直交方向における当該長さに基づいて前記直交方向文字サイズを決定するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。 - 請求項20に記載の電子文書生成装置において、
前記抽出手段は、単一行の文字列に係る領域を前記処理対象領域として抽出し、
前記決定手段は、前記単一行の文字列に係る領域の前記直交方向における長さに基づいて前記直交方向文字サイズを算出するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。 - 請求項20に記載の電子文書生成装置において、
前記抽出手段は、前記1行の文字列の前記配列方向における全範囲のうちの一部の範囲の領域を前記処理対象領域として抽出し、
前記決定手段は、前記一部の範囲の領域の前記直交方向における長さに基づいて前記直交方向文字サイズを算出するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。 - 請求項15に記載の電子文書生成装置において、
前記決定手段は、
前記行領域の前記配列方向における長さを前記行領域内の文字数で除した値に基づいて、前記処理対象領域に関する前記配列方向文字サイズを決定するとともに、
前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを、前記行領域の前記直交方向における長さに基づいて決定し、
前記生成手段は、前記決定手段により決定された前記配列方向文字サイズと前記直交方向文字サイズとに基づいて前記処理結果に係る文字列を前記電子文書内に配置して、前記電子文書を生成することを特徴とする電子文書生成装置。 - 請求項15ないし請求項24のいずれかに記載の電子文書生成装置において、
前記検出手段は、前記スキャン画像内での前記処理対象領域の位置をも検出し、
前記生成手段は、前記処理対象領域の前記位置にも基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成することを特徴とする電子文書生成装置。 - 請求項15ないし請求項25のいずれかに記載の電子文書生成装置において、
前記電子文書生成装置は、画像形成装置であることを特徴とする電子文書生成装置。 - 請求項15ないし請求項25のいずれかに記載の電子文書生成装置において、
前記電子文書生成装置は、前記スキャン画像を生成する画像形成装置とは異なる通信装置であって前記外部装置とも異なる通信装置であることを特徴とする電子文書生成装置。 - 原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置に内蔵されたコンピュータに、
a)前記スキャン画像内にて或る方向に配列された1行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出するステップと、
b)前記行領域の大きさを検出するステップと、
c)前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向における文字サイズである配列方向文字サイズを決定するステップと、
d)光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出するステップと、
e)前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取るステップと、
f)前記ステップc)にて決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置するステップと、
を実行させるためのプログラムであって、
前記ステップa)においては、前記スキャン画像内の複数の部分領域のそれぞれが前記処理対象領域として抽出され、
前記ステップd)においては、前記光学文字認識処理を前記複数の部分領域のそれぞれに関して行うべき旨の指示と前記複数の部分領域のそれぞれの画像データとが、前記外部装置に送出され、
前記ステップe)においては、前記複数の部分領域のそれぞれに関する前記光学文字認識処理の処理結果が前記外部装置から受け取られ、
前記ステップf)においては、前記複数の部分領域のそれぞれに関して前記ステップc)にて決定された前記配列方向文字サイズに基づいて、前記複数の部分領域のそれぞれに関する前記処理結果に係る文字列が前記複数の部分領域のそれぞれに配置されることを特徴とするプログラム。 - 原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置であって、
複数行の文字列を含む処理対象領域を前記スキャン画像から抽出する抽出手段と、
前記処理対象領域の大きさを検出する検出手段と、
前記処理対象領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記処理対象領域内の文字列の配列方向における文字サイズである配列方向文字サイズを決定する決定手段と、
光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出する指示送出手段と、
前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取る受取手段と、
前記決定手段により決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成する生成手段と、
を備え、
前記決定手段は、前記処理対象領域内の文字の文字サイズであって前記配列方向に直交する直交方向の文字サイズである直交方向文字サイズを、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて決定するとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。 - 原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置に内蔵されたコンピュータに、
a)複数行の文字列を含む処理対象領域を前記スキャン画像から抽出するステップと、
b)前記処理対象領域の大きさを検出するステップと、
c)前記処理対象領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記処理対象領域内の文字列の配列方向における文字サイズである配列方向文字サイズを決定するステップと、
d)光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出するステップと、
e)前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取るステップと、
f)前記ステップc)にて決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置するステップと、
を実行させるためのプログラムであって、
前記ステップc)は、
c−1)前記処理対象領域内の文字の文字サイズであって前記配列方向に直交する直交方向の文字サイズである直交方向文字サイズを、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて決定するステップと、
c−2)前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定するステップと、
を有することを特徴とするプログラム。 - 電子文書生成システムであって、
原稿のスキャン画像に基づき電子文書を生成する第1の装置と、
前記第1の装置からの依頼に基づいて前記スキャン画像に対する光学文字認識処理を実行し、当該光学文字認識処理の処理結果を前記第1の装置に送出する第2の装置と、
を備え、
前記第1の装置は、
前記スキャン画像内にて或る方向に配列された1行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出する抽出手段と、
前記行領域の大きさを検出する検出手段と、
前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向における文字サイズである配列方向文字サイズを決定する決定手段と、
前記光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを、前記第2の装置に送出する指示送出手段と、
前記処理対象領域に関する前記光学文字認識処理の処理結果を前記第2の装置から受け取る受取手段と、
前記決定手段により決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成する生成手段と、
を有し、
前記決定手段は、前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを前記行領域の前記直交方向における長さに基づいて決定するとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定し、
前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、
前記決定手段は、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて前記行領域の前記直交方向における長さを検出し、前記行領域の前記直交方向における当該長さに基づいて前記直交方向文字サイズを決定するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成システム。 - 原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置であって、
前記スキャン画像内にて或る方向に配列された1行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出する抽出手段と、
前記行領域の大きさを検出する検出手段と、
前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向における文字サイズである配列方向文字サイズを決定する決定手段と、
光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出する指示送出手段と、
前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取る受取手段と、
前記決定手段により決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置し、前記電子文書を生成する生成手段と、
を備え、
前記決定手段は、前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズを前記行領域の前記直交方向における長さに基づいて決定するとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズを決定し、
前記抽出手段は、複数行の文字列を含む領域を前記処理対象領域として抽出し、
前記決定手段は、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて前記行領域の前記直交方向における長さを算出し、前記行領域の前記直交方向における当該長さに基づいて前記直交方向文字サイズを決定するとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズを決定することを特徴とする電子文書生成装置。 - 原稿のスキャン画像に基づき電子文書を生成する電子文書生成装置に内蔵されたコンピュータに、
a)前記スキャン画像内にて或る方向に配列された1行の文字列の全部または一部の範囲の領域である行領域を含む処理対象領域を、前記スキャン画像から抽出するステップと、
b)前記行領域の大きさを検出するステップと、
c)前記行領域の大きさに基づいて、前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向における文字サイズである配列方向文字サイズを決定するステップと、
d)光学文字認識処理を前記処理対象領域に関して行うべき旨の指示と前記処理対象領域の画像データとを外部装置に送出するステップと、
e)前記処理対象領域に関して前記外部装置によって実行された前記光学文字認識処理の処理結果を前記外部装置から受け取るステップと、
f)前記ステップc)にて決定された前記配列方向文字サイズに基づいて前記処理結果に係る文字列を前記電子文書内に配置するステップと、
を実行させるためのプログラムであって、
前記ステップc)においては、前記処理対象領域内の文字の文字サイズであって前記1行の文字列の配列方向に直交する直交方向の文字サイズである直交方向文字サイズが前記行領域の前記直交方向における長さに基づいて決定されるとともに、前記直交方向文字サイズに基づいて前記配列方向文字サイズが決定され、
前記ステップa)においては、複数行の文字列を含む領域が前記処理対象領域として抽出され、
前記ステップc)においては、前記処理対象領域の前記直交方向における長さと前記処理対象領域に含まれる文字列の行数とに基づいて前記行領域の前記直交方向における長さが算出され、前記行領域の前記直交方向における当該長さに基づいて前記直交方向文字サイズが決定されるとともに、当該直交方向文字サイズに基づいて前記配列方向文字サイズが決定されることを特徴とするプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014143600A JP6119689B2 (ja) | 2014-07-11 | 2014-07-11 | 電子文書生成システム、電子文書生成装置およびプログラム |
CN201510404336.9A CN105320933B (zh) | 2014-07-11 | 2015-07-10 | 电子文档生成系统以及电子文档生成装置 |
US14/797,748 US9398191B2 (en) | 2014-07-11 | 2015-07-13 | Electronic document generation system, electronic document generation apparatus, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014143600A JP6119689B2 (ja) | 2014-07-11 | 2014-07-11 | 電子文書生成システム、電子文書生成装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016021086A JP2016021086A (ja) | 2016-02-04 |
JP6119689B2 true JP6119689B2 (ja) | 2017-04-26 |
Family
ID=55068499
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014143600A Active JP6119689B2 (ja) | 2014-07-11 | 2014-07-11 | 電子文書生成システム、電子文書生成装置およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9398191B2 (ja) |
JP (1) | JP6119689B2 (ja) |
CN (1) | CN105320933B (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10084939B2 (en) * | 2016-03-18 | 2018-09-25 | Ricoh Company, Ltd. | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium |
JP6798309B2 (ja) * | 2016-03-18 | 2020-12-09 | 株式会社リコー | 画像処理装置、画像処理方法及びプログラム |
JP6531738B2 (ja) * | 2016-08-08 | 2019-06-19 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
JP2019537103A (ja) * | 2016-09-28 | 2019-12-19 | シストラン インターナショナル カンパニー.,リミテッド.Systran International Co.,Ltd. | 文字を翻訳する方法及びその装置 |
JP6968647B2 (ja) * | 2017-10-03 | 2021-11-17 | キヤノン株式会社 | スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム |
CN108038093B (zh) * | 2017-11-10 | 2021-06-15 | 深圳市亿图软件有限公司 | Pdf文字提取方法和装置 |
KR102138748B1 (ko) * | 2019-02-08 | 2020-07-28 | 네이버 주식회사 | 라인 단위의 문자열을 검출 및 정렬하기 위한 방법 및 시스템 |
CN111914597B (zh) * | 2019-05-09 | 2024-03-15 | 杭州睿琪软件有限公司 | 一种文档对照识别方法、装置、电子设备和可读存储介质 |
US12056331B1 (en) | 2019-11-08 | 2024-08-06 | Instabase, Inc. | Systems and methods for providing a user interface that facilitates provenance tracking for information extracted from electronic source documents |
CN111222314B (zh) * | 2020-01-03 | 2021-12-21 | 北大方正集团有限公司 | 版式文档的比对方法、装置、设备及存储介质 |
US11409981B1 (en) * | 2021-03-31 | 2022-08-09 | Intuit, Inc. | Document classification using signal processing |
US11315353B1 (en) * | 2021-06-10 | 2022-04-26 | Instabase, Inc. | Systems and methods for spatial-aware information extraction from electronic source documents |
US12067039B1 (en) | 2023-06-01 | 2024-08-20 | Instabase, Inc. | Systems and methods for providing user interfaces for configuration of a flow for extracting information from documents via a large language model |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02255996A (ja) * | 1988-12-09 | 1990-10-16 | Ricoh Co Ltd | 文字切出し方法 |
DE69131496T2 (de) * | 1990-05-15 | 2000-01-05 | Canon K.K., Tokio/Tokyo | Bildverarbeitungs-Gerät und Verfahren |
US9143638B2 (en) * | 2004-04-01 | 2015-09-22 | Google Inc. | Data capture from rendered documents using handheld device |
JP4924990B2 (ja) * | 2008-03-13 | 2012-04-25 | 富士ゼロックス株式会社 | 文書処理装置および文書処理プログラム |
JP2012009005A (ja) * | 2010-05-24 | 2012-01-12 | Pfu Ltd | 帳票処理システム、ocr装置、ocr処理プログラム、帳票作成装置、帳票作成プログラム、および帳票処理方法 |
JP2012022571A (ja) | 2010-07-15 | 2012-02-02 | Toshiba Tec Corp | 翻訳制御装置および翻訳制御方法 |
JP2012073749A (ja) | 2010-09-28 | 2012-04-12 | Kyocera Mita Corp | 画像形成装置及び画像形成プログラム |
JP5372110B2 (ja) * | 2011-10-28 | 2013-12-18 | シャープ株式会社 | 情報出力装置、情報出力方法、及びコンピュータプログラム |
JP5622290B2 (ja) * | 2012-03-30 | 2014-11-12 | 京セラドキュメントソリューションズ株式会社 | 電子化装置 |
JP2013236234A (ja) * | 2012-05-08 | 2013-11-21 | Ricoh Co Ltd | 画像処理装置、画像処理システム及びプログラム |
-
2014
- 2014-07-11 JP JP2014143600A patent/JP6119689B2/ja active Active
-
2015
- 2015-07-10 CN CN201510404336.9A patent/CN105320933B/zh active Active
- 2015-07-13 US US14/797,748 patent/US9398191B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20160014299A1 (en) | 2016-01-14 |
JP2016021086A (ja) | 2016-02-04 |
US9398191B2 (en) | 2016-07-19 |
CN105320933A (zh) | 2016-02-10 |
CN105320933B (zh) | 2019-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6119689B2 (ja) | 電子文書生成システム、電子文書生成装置およびプログラム | |
US10432820B2 (en) | Image processing apparatus, image processing system, control method for image processing apparatus, and non-transitory computer readable medium | |
US11386046B2 (en) | Apparatus for setting file name for scan image, method of controlling same, and storage medium | |
US9485368B2 (en) | Electronic document generation apparatus, recording medium, and electronic document generation system | |
JP7030462B2 (ja) | スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム | |
US9473669B2 (en) | Electronic document generation system, electronic document generation apparatus, and recording medium | |
US10222971B2 (en) | Display apparatus, method, and storage medium | |
US11341733B2 (en) | Method and system for training and using a neural network for image-processing | |
US9614984B2 (en) | Electronic document generation system and recording medium | |
US9858513B2 (en) | Document file output apparatus, document file output method, and computer readable medium | |
JP2019159633A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
CN109413294A (zh) | 图像处理装置及其控制方法 | |
JP2012198597A (ja) | 制御装置及びコンピュータプログラム | |
JP6197840B2 (ja) | 画像処理装置、電子ファイル生成方法及びプログラム | |
JP6458351B2 (ja) | 電子文書生成システム、画像形成装置、通信端末およびプログラム | |
JP2012039236A (ja) | 画像処理装置、画像処理方法、及び、画像処理プログラム | |
JP7301529B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2004086436A (ja) | 画像処理装置および画像処理方法、プログラムおよび記憶媒体 | |
JP2014199507A (ja) | 画像処理装置およびコンピュータプログラム | |
JP2013157968A (ja) | 画像処理装置 | |
US20230029990A1 (en) | Image processing system and image processing method | |
US9412033B2 (en) | Image processing apparatus capable of preventing page missing, control method therefor, and storage medium | |
JP2017163407A (ja) | 画像処理装置、情報処理装置、および画像処理方法 | |
JP2016091190A (ja) | 電子文書生成装置、プログラムおよび電子文書生成システム | |
JP2012178197A (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170228 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170313 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6119689 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |