JP4924990B2 - Document processing apparatus and document processing program - Google Patents
Document processing apparatus and document processing program Download PDFInfo
- Publication number
- JP4924990B2 JP4924990B2 JP2008063855A JP2008063855A JP4924990B2 JP 4924990 B2 JP4924990 B2 JP 4924990B2 JP 2008063855 A JP2008063855 A JP 2008063855A JP 2008063855 A JP2008063855 A JP 2008063855A JP 4924990 B2 JP4924990 B2 JP 4924990B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- font
- character
- size
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Editing Of Facsimile Originals (AREA)
- Processing Or Creating Images (AREA)
Description
本発明は、文書処理装置および文書処理プログラムに関する。 The present invention relates to a document processing apparatus and a document processing program.
近年、スキャンした紙文書から検索可能な電子文書を生成する、といったことが行われている。検索可能な電子文書としては、サーチャブルXPS(XML Paper Specification)と呼ばれるものや、サーチャブルPDF(Portable Document Format)またはテキスト付PDFと呼ばれるもの等が知られている。これらの電子文書は、イメージレイヤとテキストレイヤとが重なるように構成されており、背景となる文書画像がイメージレイヤに表示され、その上層側のテキストレイヤに透明の検索用文字がレイアウトされるようになっている。 In recent years, a searchable electronic document is generated from a scanned paper document. As a searchable electronic document, what is called a searchable XPS (XML Paper Specification), what is called a searchable PDF (Portable Document Format), or a PDF with text is known. These electronic documents are configured so that the image layer and text layer overlap, so that the background document image is displayed on the image layer, and transparent search characters are laid out on the upper text layer. It has become.
また、スキャンした文字データについては、置き換え文字用のアウトラインフォントを用意しておき、操作者の判断および操作に基づいて、スキャンした文字と同等のサイズに変倍したアウトラインフォントに置き換えることが提案されている(例えば、特許文献1参照。)。 For scanned character data, it is suggested to prepare an outline font for replacement characters and replace it with an outline font that has been scaled to the same size as the scanned character based on the judgment and operation of the operator. (For example, refer to Patent Document 1).
ところで、上述した検索可能な電子文書では、イメージレイヤとテキストレイヤとが重なる構成のため、当該イメージレイヤに表示される文書画像における文字と、当該テキストレイヤに配される検索用の文字との位置が合致していないと、当該電子文書についての検索を実施した場合に、その検索によって抽出された文字列が文書中のどこに存在しているか正しく特定できないといったことが起こり得る。特に、テキストレイヤで用いるフォントデータの種類によっては、同じポイント数であっても文字幅や文字間距離等が相違することもあるため、イメージレイヤとテキストレイヤとの間で、想定されていなかった文字の位置ずれが生じてしまうことが考えられる。 By the way, in the above-described searchable electronic document, since the image layer and the text layer overlap each other, the position of the character in the document image displayed on the image layer and the search character arranged on the text layer. If they do not match, when a search is performed on the electronic document, it may occur that the character string extracted by the search cannot be correctly specified in the document. In particular, depending on the type of font data used in the text layer, even if the number of points is the same, the character width, distance between characters, etc. may be different, so it was not assumed between the image layer and the text layer. It is conceivable that character misalignment occurs.
ここで、図5(a)に示す「Abc Def」という文字列を例に挙げて考える。この「Abc Def」という文字列について、図5(b)に示すように、イメージレイヤにおける文字(図中における黒色文字参照)と、テキストレイヤにおける文字(図中における灰色文字参照)とは、それぞれの位置が必ずしも合致するとは限らず、それぞれの間にずれが生じてしまうことが考えられる。そして、例えばイメージレイヤにおける文字よりテキストレイヤにおける文字のほうが大きくなるようなずれが生じていると、文書出力を行うビューワによっては、図5(c)に示すように、「Abc」についてのハイライト表示部分が「Def」についてのハイライト表示部分に被ってしまう、いわゆる文字被りが発生してしまうおそれがある。つまり、イメージレイヤとテキストレイヤとの間で文字の位置ずれが生じていると、テキスト検索が可能であっても、その検索結果についての文字選択がし辛かったり、文字位置特定がし難くなったりするおそれがある。 Here, a character string “Abc Def” shown in FIG. Regarding the character string “Abc Def”, as shown in FIG. 5B, a character in the image layer (see black characters in the figure) and a character in the text layer (see gray characters in the figure) are respectively It is conceivable that the positions of do not necessarily match, and a shift occurs between them. Then, for example, if there is a shift that causes the characters in the text layer to be larger than the characters in the image layer, depending on the viewer that outputs the document, as shown in FIG. There is a possibility that a so-called character covering, in which the display part covers the highlight display part of “Def”, may occur. In other words, if there is a character misalignment between the image layer and the text layer, even if text search is possible, it is difficult to select characters for the search results, and it is difficult to specify the character position. There is a risk.
この点については、上記特許文献1に開示されているようにフォント置き換えの際に文字毎にサイズ変倍を行うようにしても、必ずしも解消し得るとは限らない。文字毎のサイズ変倍では、文字列を構成する各文字が固定ピッチとなるため、当該文字列の先頭と後尾の位置が合っても一文字毎の位置ずれが発生し得るからであり、また文字列内でフォント種類やポイント数が異なるものに認識される可能性があり、結果として文字列全体としてのバランスが崩れて見栄えが悪くなることもあり得るからである。さらに、上記特許文献1に開示された技術では、操作者の判断および操作を必要とするため、当該操作者、すなわち電子文書の利用者が煩わしさを感じてしまうことも考えられる。 Regarding this point, even if the size is changed for each character at the time of font replacement as disclosed in Patent Document 1, it is not always possible to eliminate this problem. This is because each character constituting the character string has a fixed pitch in the size scaling for each character, so that even if the position of the beginning and the end of the character string match, a positional shift for each character may occur. This is because there is a possibility that the font type and the number of points in the column are different, and as a result, the balance of the entire character string may be lost and the appearance may deteriorate. Furthermore, since the technique disclosed in Patent Document 1 requires the operator's judgment and operation, the operator, that is, the user of the electronic document may feel annoyed.
そこで、本発明は、イメージレイヤとテキストレイヤとが重なる構成の電子文書について、これを生成または画像出力する際に、イメージレイヤとテキストレイヤとの間での文字の位置ずれを抑制する文書処理装置および文書処理プログラムを提供することを目的とする。 Therefore, the present invention provides a document processing device that suppresses character positional deviation between an image layer and a text layer when generating or outputting an electronic document having a configuration in which an image layer and a text layer overlap. And a document processing program.
請求項1に係る発明は、イメージレイヤとテキストレイヤとが重なる構成の電子文書について、当該電子文書における所定単位の文字列毎に、当該文字列の前記イメージレイヤにおける描画領域に関する位置情報を取得する領域情報取得手段と、前記文字列を構成する各文字について、前記テキストレイヤで使用されるフォントのメトリクス情報を取得するフォント情報取得手段と、前記領域情報取得手段での情報取得結果から特定される前記文字列の描画領域の大きさと前記フォント情報取得手段での情報取得結果から特定される当該文字列のフォントの大きさとの比率を算出する描画計算手段と、前記描画計算手段での算出結果に基づいて、前記文字列の描画領域の大きさと当該文字列のフォントの大きさとが合うように、当該フォントの大きさを変倍して前記テキストレイヤについての描画を行う描画処理手段とを備えることを特徴とする文書処理装置である。
請求項2に係る発明は、コンピュータを、イメージレイヤとテキストレイヤとが重なる構成の電子文書について、当該電子文書における所定単位の文字列毎に、当該文字列の前記イメージレイヤにおける描画領域に関する位置情報を取得する領域情報取得手段と、前記文字列を構成する各文字について、前記テキストレイヤで使用されるフォントのメトリクス情報を取得するフォント情報取得手段と、前記領域情報取得手段での情報取得結果から特定される前記文字列の描画領域の大きさと前記フォント情報取得手段での情報取得結果から特定される当該文字列のフォントの大きさとの比率を算出する描画計算手段と、前記描画計算手段での算出結果に基づいて、前記文字列の描画領域の大きさと当該文字列のフォントの大きさとが合うように、当該フォントの大きさを変倍して前記テキストレイヤについての描画を行う描画処理手段として機能させることを特徴とする文書処理プログラムである。
The invention according to claim 1 acquires, for an electronic document having a configuration in which an image layer and a text layer overlap, for each character string of a predetermined unit in the electronic document, positional information regarding the drawing area in the image layer of the character string. The area information acquisition means, the font information acquisition means for acquiring the metric information of the font used in the text layer for each character constituting the character string, and the information acquisition result by the area information acquisition means The drawing calculation means for calculating the ratio between the size of the drawing area of the character string and the font size of the character string specified from the information acquisition result in the font information acquisition means, and the calculation result in the drawing calculation means Based on the size of the drawing area of the character string and the font size of the character string. A document processing apparatus characterized by comprising a drawing processing means to scale the size for drawing the said text layer.
According to a second aspect of the present invention, for an electronic document having a configuration in which an image layer and a text layer overlap each other, for each character string of a predetermined unit in the electronic document, positional information regarding a drawing area in the image layer of the character string From the information acquisition result in the area information acquisition means, the font information acquisition means for acquiring the metric information of the font used in the text layer for each character constituting the character string, and the information acquisition result in the area information acquisition means A drawing calculation unit that calculates a ratio between the size of the drawing area of the specified character string and the font size of the character string specified from the information acquisition result in the font information acquisition unit; Based on the calculation result, the size of the drawing area of the character string matches the font size of the character string. A document processing program for causing to function as drawing processing means to scale the size of the font for drawing for the text layer.
請求項1,2に係る発明によれば、利用者の判断や操作等を必要とすることなく、またテキストレイヤで使用されるフォント種類にもよらずに、所定単位の文字列について、イメージレイヤにおける文字とテキストレイヤにおける文字との描画位置および大きさを合わせることができ、当該イメージレイヤと当該テキストレイヤとが重なる構成の電子文書の閲覧や検索等をする利用者にとっての利便性向上に貢献することが可能となる。さらには、例えば外国語文(特に、アルファベットにより記述される英文)のように文字毎に字幅や文字間距離等が異なるフォント(プロポーショナルフォント)を用いた場合について、一文字毎の位置ずれ調整をする場合に比べて、文字列のバランスを崩すことなく見栄えの良いものとすることができる。 According to the first and second aspects of the present invention, an image layer is used for character strings in a predetermined unit without requiring user judgment or operation, and without depending on the font type used in the text layer. The drawing position and size of characters in the text layer and characters in the text layer can be matched, contributing to improved convenience for users who browse and search electronic documents with the image layer and text layer overlapping. It becomes possible to do. Furthermore, for example, when using fonts (proportional fonts) with different character widths and distances between characters, such as foreign language sentences (particularly English written in alphabets), the positional deviation of each character is adjusted. Compared to the case, it is possible to improve the appearance without breaking the balance of the character string.
以下、図面に基づき本発明に係る文書処理装置および文書処理プログラムについて説明する。 Hereinafter, a document processing apparatus and a document processing program according to the present invention will be described with reference to the drawings.
先ず、文書処理装置の機能構成例について説明する。ここで例に挙げて説明する文書処理装置は、スキャンした紙文書から、検索可能な電子文書、すなわちイメージレイヤとテキストレイヤとが重なる構成の電子文書を生成するものである。このような文書処理装置としては、スキャン機能およびデータ処理機能を有したデジタル複写機、当該複写機としての機能に他装置(プリンタ装置やファクシミリ装置等)としての機能を統合したもの、スキャナ装置に接続して用いられるコンピュータ装置等が挙げられる。 First, a functional configuration example of the document processing apparatus will be described. The document processing apparatus described as an example here generates a searchable electronic document, that is, an electronic document having a configuration in which an image layer and a text layer overlap from a scanned paper document. Such a document processing apparatus includes a digital copying machine having a scanning function and a data processing function, a function in which the function as the copying machine is integrated with a function as another device (printer device, facsimile device, etc.), and a scanner device. For example, a computer device that is used in connection.
図1は、本発明に係る文書処理装置の機能構成例を示すブロック図である。
図例の文書処理装置は、画像入力部1と、設定部2と、画像処理部3と、蓄積部4と、描画処理部5と、データ転送部6と、を備えて構成されている。
FIG. 1 is a block diagram showing a functional configuration example of a document processing apparatus according to the present invention.
The document processing apparatus shown in the figure includes an image input unit 1, a
画像入力部1は、例えばスキャナ装置としての機能によって実現されるもので、原稿となる紙文書に対するスキャンを行って、当該紙文書からの画像データの読み取りを行うものである。 The image input unit 1 is realized by, for example, a function as a scanner device, and scans a paper document that is a document and reads image data from the paper document.
設定部2は、例えば文書処理装置の利用者が操作するユーザインタフェースパネルによって実現されるもので、当該利用者が、画像入力部1での画像データの読み取りや画像処理部3での画像データの処理に必要となるパラメータ設定を行うためのものである。
The
画像処理部3は、所定プログラムを実行するコンピュータ装置としての機能によって実現されるもので、画像入力部1が読み取った画像データに対して、所定の画像処理を行うものである。
画像処理部3が行う画像処理としては、その一つに、画像データに対する文字認識(Optical Character Reader、以下「OCR」と略す。)処理がある。すなわち、画像処理部3は、文字認識手段3aとしての機能を備えている。この文字認識手段3aは、画像処理部3が所定プログラム(例えば、OCR用ソフトウエア)を実行することによって実現されるものである。
なお、文字認識手段3aが行うOCR処理の手法については、公知技術を利用すればよいため、ここではその詳細な説明を省略する。
また、画像処理部3が行うOCR処理以外の画像処理についても、公知技術を利用したものであればよく、ここではその詳細な説明を省略する。
The image processing unit 3 is realized by a function as a computer device that executes a predetermined program, and performs predetermined image processing on the image data read by the image input unit 1.
Image processing performed by the image processing unit 3 includes character recognition (Optical Character Reader, hereinafter abbreviated as “OCR”) processing for image data. That is, the image processing unit 3 has a function as the character recognition means 3a. The character recognition means 3a is realized by the image processing unit 3 executing a predetermined program (for example, OCR software).
The OCR processing method performed by the
Further, the image processing other than the OCR processing performed by the image processing unit 3 may be any one using a known technique, and detailed description thereof is omitted here.
蓄積部4は、例えばハードディスク装置といった記憶装置によって実現されるもので、各種情報の記憶蓄積を行うものである。
この蓄積部4が記憶蓄積する各種情報としては、例えば画像入力部1が読み取った画像データまたは画像処理部3での画像処理後の画像データが挙げられる。また、文字認識手段3aによる文字認識結果に関する情報についても、ここでいう各種情報に含まれる。
さらには、文書処理装置を機能させるために必要となる所定プログラムや、文書画像を作成する上で必要となるフォントデータ4a等も、ここでいう各種情報に含まれるものとする。すなわち、蓄積部4は、フォントデータ4aを記憶蓄積しているものとする。
なお、ここでいうフォントデータ4aは、フォントそのものを特定するデータの他に、当該フォントのメトリクス(メトリック)情報をも含む。メトリクス情報とは、フォントが占めるスペースの大きさを定義する情報で、カーニング情報も含まれる。
The storage unit 4 is realized by a storage device such as a hard disk device, and stores various types of information.
Examples of various information stored and accumulated by the accumulation unit 4 include image data read by the image input unit 1 or image data after image processing by the image processing unit 3. Information relating to the character recognition result by the character recognition means 3a is also included in the various types of information referred to herein.
Furthermore, it is assumed that a predetermined program necessary for causing the document processing apparatus to function,
Here, the
描画処理部5は、所定プログラムを実行するコンピュータ装置としての機能によって実現されるもので、画像入力部1での画像読み取り結果や画像処理部3での画像処理結果等を用いて、イメージレイヤとテキストレイヤとが重なる構成の電子文書の生成を行うものである。
ただし、描画処理部5は、電子文書の生成を行うために、領域情報取得手段5a、フォント情報取得手段5b、描画計算手段5cおよび描画処理手段5dとしての機能を備えている。
領域情報取得手段5aは、生成すべき電子文書における所定単位の文字列毎に、当該文字列のイメージレイヤにおける描画領域に関する位置情報を取得するものである。位置情報は、詳細を後述するように、画像処理部3の文字認識手段3aから取得することが考えられる。また、文字列の所定単位としては、文字認識手段3aでの文字認識結果から特定される単語単位とすることが考えられるが、必ずしも単語単位である必要はなく、文字認識手段3aでの文字認識結果から特定される文節単位や行単位等といった他の単位であっても構わない。
フォント情報取得手段5bは、所定単位の文字列を構成する各文字について、テキストレイヤで使用されるフォントのメトリクス情報を取得するものである。メトリクス情報の取得は、蓄積部4のフォントデータ4aにアクセスすることによって行うことが考えられる。
描画計算手段5cは、領域情報取得手段5aでの情報取得結果から特定される文字列の描画領域の大きさと、フォント情報取得手段5bでの情報取得結果から特定される当該文字列のフォントの大きさとについて、これらの比率を算出するものである。
描画処理手段5dは、電子文書生成のための描画処理を行うものである。ただし、描画処理手段5dでは、描画計算手段5cでの算出結果に基づいて、所定単位の文字列の描画領域の大きさと当該文字列のフォントの大きさとが合うように、当該フォントの大きさを変倍して、テキストレイヤについての描画を行うようになっている。
なお、描画処理部5が生成する電子文書は、イメージレイヤとテキストレイヤとが重なる構成のものであれば、そのデータフォーマットが特に限定されることはなく、例えばサーチャブルXPSに準拠したものであってもよいし、サーチャブルPDFに準拠したものであってもよいし、あるいはこれら以外のデータフォーマットに準拠したものであってもよい。
The drawing processing unit 5 is realized by a function as a computer device that executes a predetermined program, and uses an image reading result in the image input unit 1, an image processing result in the image processing unit 3, etc. An electronic document having a configuration overlapping with a text layer is generated.
However, the drawing processing unit 5 has functions as a region
The area
The font information acquisition means 5b acquires the metric information of the font used in the text layer for each character constituting a predetermined unit character string. It is conceivable that the metrics information is acquired by accessing the
The drawing
The
The electronic document generated by the drawing processing unit 5 is not particularly limited as long as the image layer and the text layer overlap each other. For example, the electronic document conforms to the searchable XPS. Alternatively, it may be compliant with the searchable PDF, or may be compliant with other data formats.
データ転送部6は、描画処理部5が生成した電子文書について、これをその出力先である外部装置に対して転送するものである。外部装置としては、電子文書の表示出力を行う表示装置、当該電子文書の印刷出力を行う印刷装置、当該電子文書を記憶蓄積するファイルサーバ表示装置等が挙げられるが、特に限定されるものではない。また、当該外部装置への電子文書の転送については、公知のデータ転送技術を用いればよいため、ここでその詳細な説明を省略する。
The
以上のような構成の文書処理装置において、特に描画処理部5が備える各手段5a〜5dは、当該文書処理装置におけるコンピュータとしての機能が、所定プログラムを実行することによって実現されるものとする。つまり、の文書処理装置は、所定プログラムを実行するCPU(Central Processing Unit)や当該所定プログラムを記憶する記憶装置等を備え、当該所定プログラムの実行によって種々の機能を実現し得るように構成されており、このような文書処理装置上で実現される上述の各手段5a〜5dは、当該文書処理装置にインストールされた所定プログラム(文書処理プログラム)によって実現されるものとする。なお、当該文書処理プログラムは、文書処理装置へのインストールに先立ち、コンピュータ読み取り可能な記憶媒体に格納されて提供されるものであっても、または通信回線を介して外部から配信されるものであってもよい。
In the document processing apparatus having the above-described configuration, each of the
次に、以上のように構成された文書処理装置における処理動作例について説明する。
図2は、本発明に係る文書処理装置の処理動作例を示すフローチャートである。
Next, an example of processing operation in the document processing apparatus configured as described above will be described.
FIG. 2 is a flowchart showing an example of processing operation of the document processing apparatus according to the present invention.
上述した構成の文書処理装置では、電子文書を生成するのにあたり、先ず、当該文書処理装置の利用者が当該電子文書の基(原稿)となる紙文書を用意して、当該紙文書を画像入力部1にセットするとともに、設定部2でのパラメータ設定を行い、その後にスタートボタン押下等による動作開始指示を行う(ステップ01、以下ステップを「S」と略す。)。利用者による動作開始指示があると、文書処理装置では、設定部2で設定されたパラメータ(カラー/白黒の別や解像度の指定等)に従いつつ、画像入力部1がセットされた紙文書からの画像データの読み取りを当該紙文書の各ページについて行い(S02)、そのページ毎の画像データに対して画像処理部3が所定の画像処理(解像度変換や色補正等)を行い(S03)、さらに蓄積部4が画像処理後の画像データの記憶蓄積を行う(S04)。そして、原稿となる紙文書の全ページについての処理が終了するまで(S05)、上述した一連の処理を繰り返し行う(S02〜S05)。
In the document processing apparatus having the above-described configuration, when generating an electronic document, first, a user of the document processing apparatus prepares a paper document as a base (original) of the electronic document and inputs the paper document as an image. In addition to setting in the unit 1, parameter setting is performed in the
その後、文書処理装置では、蓄積部4が記憶蓄積している画像データ(すなわち、イメージレイヤに表示される文書画像を特定する画像データ)について、当該画像データにはテキスト(文字)部分とイメージ(画像)部分との両方が含まれている場合があることから、OCR処理として、画像処理部3が、1ページ分毎に、テキスト部分とイメージ部分との分離を行う。そして、テキスト部分については、文字認識手段3aがOCR処理を行う(S06)。テキスト/イメージ分離処理およびOCR処理の手法は、いずれも、公知技術を利用すればよい。
このOCR処理によって、文字認識手段3aは、テキスト部分を構成する文字列を、所定単位である単語単位で、抽出することになる。ここでは、所定単位が単語単位である場合を例に挙げるが、当該所定単位は、予め設定されているものであれば、既に述べたように、文節単位や行単位等であっても構わない。なお、ここで例に挙げる「単語」とは、それぞれ意味をもって文節を構成する一つ一つの言葉のことである。
さらに、このOCR処理によって、文字認識手段3aは、単語単位での文字列の抽出に併せて、当該文字列の描画領域に関する位置情報をも、抽出することになる。文字列の描画領域に関する位置情報とは、画像1ページ分上にて当該文字列を描画すべき領域の大きさを特定するための情報のことをいい、具体的には当該文字列が属する矩形領域の左上座標値および右下座標値からなる情報が挙げられる。ただし、当該文字列の描画領域の大きさを特定し得るものであれば、必ずしも矩形領域の左上座標値および右下座標値からなる情報に限定されることはなく、他の情報(例えば、左下座標値および領域幅の値からなる情報)を用いても構わない。
Thereafter, in the document processing apparatus, for the image data stored and accumulated in the accumulation unit 4 (that is, image data specifying a document image displayed on the image layer), the image data includes a text (character) portion and an image ( Since there are cases where both the (image) portion is included, the image processing unit 3 separates the text portion and the image portion for each page as OCR processing. And about the text part, the character recognition means 3a performs an OCR process (S06). Any known technique may be used for the text / image separation process and the OCR process.
By this OCR processing, the character recognition means 3a extracts the character string constituting the text portion in units of words that are predetermined units. Here, a case where the predetermined unit is a word unit will be described as an example. However, as long as the predetermined unit is set in advance, it may be a phrase unit or a line unit as described above. . The “words” mentioned here are each one of the words that make up a phrase with meaning.
Furthermore, by this OCR process, the character recognition means 3a extracts the position information regarding the drawing area of the character string in conjunction with the extraction of the character string in units of words. The position information related to the drawing area of the character string refers to information for specifying the size of the area in which the character string is to be drawn on one page of the image, specifically, the rectangle to which the character string belongs. Information including the upper left coordinate value and the lower right coordinate value of the region is given. However, as long as the size of the drawing area of the character string can be specified, the information is not necessarily limited to the information including the upper left coordinate value and the lower right coordinate value of the rectangular area, and other information (for example, lower left Information consisting of coordinate values and area width values) may be used.
文字認識手段3aでのOCR処理の結果、テキスト部分を構成する文字列が抽出された場合には(S07)、文書処理装置では、続いて、電子文書を構成するテキストレイヤとなる部分の生成のために、描画処理部5が蓄積部4に記憶蓄積されているフォントデータ4aを用いて当該文字列についての描画処理を行う。このとき、描画処理部5は、単語単位での文字列毎に、以下に述べるような処理を行う。
When a character string constituting the text part is extracted as a result of the OCR process in the character recognition means 3a (S07), the document processing apparatus subsequently generates a part to be a text layer constituting the electronic document. Therefore, the drawing processing unit 5 performs drawing processing for the character string using the
すなわち、描画処理部5では、描画処理対象となる単語単位の文字列(以下、単に「処理対象文字列」という。)について、領域情報取得手段5aがその描画領域に関する位置情報を文字認識手段3aから取得するとともに、フォント情報取得手段5bが蓄積部4のフォントデータ4aにアクセスして当該処理対象文字列を構成する各文字について使用されるフォントのメトリクス情報を取得する。そして、領域情報取得手段5aが描画領域に関する位置情報を取得し、フォント情報取得手段5bがフォントのメトリクス情報を取得すると、描画計算手段5cが、領域情報取得手段5aでの情報取得結果から特定される処理対象文字列の描画領域の大きさと、フォント情報取得手段5bでの情報取得結果から特定される当該処理対象文字列を構成する各文字のフォントの大きさとについて、これらの比率を算出する(S08)。
このような比率の算出を描画計算手段5cが行うと、描画処理部5では、描画処理手段5dが処理対象文字列を構成する各文字の描画処理を行う。ただし、このとき、描画処理手段5dは、描画計算手段5cでの算出結果に基づいて、当該処理対象文字列の描画領域の大きさと当該処理対象文字列を構成する各文字のフォントの大きさとが合うように、当該フォントの大きさを変倍して、当該各文字の描画を行う(S09)。
描画処理部5では、以上のような処理対象文字列についての描画処理を、文字認識手段3aが抽出した全ての文字列について終了するまで、繰り返し行う(S07〜S09)。なお、描画処理部5による各文字の描画結果(フォント文字画像の展開結果)は、例えば蓄積部4内に確保されたバッファ領域に保存しておくことが考えられる。
That is, in the drawing processing unit 5, for a character string in units of words (hereinafter simply referred to as “processing target character string”) to be drawn, the region
When the drawing
The drawing processing unit 5 repeatedly performs the drawing process for the processing target character string as described above until all the character strings extracted by the
全ての文字列についての描画処理を終了すると、その後、文書処理装置では、描画処理部5が、当該描画処理の結果と蓄積部4が記憶蓄積している画像データとについて、イメージレイヤとテキストレイヤとが重なる構成の電子文書としてのフォーマット化を行う(S10)。つまり、描画処理部5は、当該描画処理の結果と当該画像データとを基にして、イメージレイヤとテキストレイヤとが重なる構成の電子文書の生成を行うのである。具体的には、例えばサーチャブルXPSに準拠する場合であれば、イメージレイヤに表示される背景となる文書画像データ、その上層側のテキストレイヤに表示される検索用文字、および、その検索用文字として使用されるフォントデータそのものを、それぞれフォーマット化して電子文書の生成を行う。また、例えばサーチャブルPDFに準拠する場合であれば、イメージレイヤに表示される背景となる文書画像データ、および、その上層側のテキストレイヤに表示される検索用文字を、それぞれフォーマット化して電子文書の生成を行う。なお、このときのフォーマット化の手法およびフォーマットそのものについては、公知技術を利用したものであればよく、ここではその詳細な説明を省略する。 When the drawing processing for all the character strings is completed, the drawing processing unit 5 thereafter performs an image layer and a text layer on the result of the drawing processing and the image data stored and accumulated in the storage unit 4 in the document processing apparatus. Is formatted as an electronic document having an overlapping structure (S10). That is, the drawing processing unit 5 generates an electronic document having a configuration in which the image layer and the text layer overlap based on the result of the drawing process and the image data. Specifically, for example, when conforming to the searchable XPS, the document image data as the background displayed in the image layer, the search characters displayed in the upper text layer, and the search characters The font data itself is formatted to generate an electronic document. For example, when conforming to the searchable PDF, the document image data as the background displayed in the image layer and the search characters displayed in the text layer on the upper layer are respectively formatted to form an electronic document. Generate. It should be noted that the formatting method and the format itself at this time may be those utilizing a known technique, and detailed description thereof is omitted here.
そして、描画処理部5が電子文書の生成を行うと、文書処理装置では、データ転送部6が当該電子文書をその出力先である外部装置に対して転送する(S11)。すなわち、データ転送部6は、当該電子文書についてのデータ転送を転送すべきデータがなくなるまで継続的に行い、転送すべきデータがなくなると当該データ転送を完了する。
When the drawing processing unit 5 generates an electronic document, in the document processing apparatus, the
次に、以上のような一連の処理動作例のうち、描画処理部5が行う処理動作例について、具体例を挙げてさらに詳しく説明する。
図3および図4は、文字描画処理の一具体例を示す説明図である。
Next, among the above-described series of processing operation examples, the processing operation examples performed by the drawing processing unit 5 will be described in more detail with specific examples.
3 and 4 are explanatory diagrams showing a specific example of the character drawing process.
例えば、図3(a)に示す「Abc」という文字列を例に挙げて考える。この「Abc」という文字列について、描画処理部5は、図3(b)に示すように、その描画領域に関する位置情報として、当該「Abc」という文字列を描画すべき矩形領域の左上座標値(X0,Y0)および右下座標値(X1,Y1)を取得する。さらには、当該文字列を構成する「A」、「b」および「c」の各文字について使用されるフォントのメトリクス情報として、当該各文字の高さ方向寸法値Hとそれぞれの幅方向寸法値Wa,Wb,Wcを取得する。 For example, consider the character string “Abc” shown in FIG. For the character string “Abc”, the drawing processing unit 5 uses the upper left coordinate value of the rectangular area in which the character string “Abc” should be drawn as position information related to the drawing area, as shown in FIG. Get (X 0 , Y 0 ) and lower right coordinate (X 1 , Y 1 ). Furthermore, as the metric information of the font used for each of the characters “A”, “b” and “c” constituting the character string, the height direction dimension value H and the width direction dimension value of each character Get Wa, Wb, Wc.
ここで、各文字についてのフォントは、蓄積部4が記憶蓄積しているフォントデータ4aが一種類のみであれば、そのフォントデータ4aによるものが使用される。また、蓄積部4が複数種類のフォントデータ4aを記憶蓄積している場合であれば、所定基準に基づいて選択された種類のフォントデータ4aによるものが使用される。なお、所定基準としては、原画像の文字形状との類似度によるものや、予め設定された各種類別の優先度によるもの等を用いることが考えられるが、特に限定されるものではなく、他の公知技術によるものであっても構わない。
Here, as for the font for each character, if there is only one type of
ところで、フォントデータ4aの種類によっては、同じポイント数であっても、文字幅や文字間距離等が相違することが知られている。そのため、「A」、「b」および「c」の各文字について使用されるフォントをそのまま描画すると、図3(c)に示すように、電子文書の生成後において、イメージレイヤとテキストレイヤとの間で、想定されていなかった文字の位置ずれが生じてしまうことが考えられる。
By the way, it is known that, depending on the type of
このことから、描画処理部5では、図4(a)に示す「Abc」という文字列であれば、当該「Abc」という文字列を描画すべき矩形領域の左上座標値(X0,Y0)および右下座標値(X1,Y1)から、座標値X0と座標値X1との差の絶対値を算出して、当該矩形領域の幅方向の大きさを求める。さらには、「A」、「b」および「c」の各文字の幅方向寸法値Wa,Wb,Wcから、これらの和を算出して、当該各文字のフォント群の幅方向の大きさを求める。そして、図4(b)に示すように、各文字のフォント群の幅方向の大きさ[Wa+Wb+Wc]について、これを矩形領域の幅方向の大きさ|X1−X0|で除して、これらの間の比率Magを算出する。 Therefore, in the drawing processing unit 5, if the character string “Abc” shown in FIG. 4A is used, the upper left coordinate value (X 0 , Y 0) of the rectangular area in which the character string “Abc” is to be drawn. ) And the lower right coordinate value (X 1 , Y 1 ), the absolute value of the difference between the coordinate value X 0 and the coordinate value X 1 is calculated to determine the size of the rectangular area in the width direction. Furthermore, the sum of these from the width direction dimension values Wa, Wb, Wc of each character of “A”, “b” and “c” is calculated, and the size of the font group of each character in the width direction is calculated. Ask. Then, as shown in FIG. 4B, the size [Wa + Wb + Wc] of the font group of each character is divided by the size | X 1 −X 0 | of the width direction of the rectangular area, The ratio Mag between these is calculated.
その後、描画処理部5では、「A」、「b」および「c」の各文字について使用されるそれぞれのフォントに対して、算出した比率Magを変倍率として用いて変倍(拡大または縮小のいずれか)を行って、当該フォントについての描画を行う。つまり、描画処理部5は、図4(c)に示すように、「Abc」という文字列の描画領域の大きさ|X1−X0|と、変倍後における「A」、「b」および「c」の各文字のフォント群の大きさ[Wa*Mag+Wb*Mag+Wc*Mag]とが合うように、各フォントの大きさを変倍して、当該「A」、「b」および「c」の各文字の描画を行うのである。 Thereafter, the drawing processing unit 5 uses the calculated ratio Mag as a scaling factor for each of the fonts used for the characters “A”, “b”, and “c”. Any one) to draw the font. That is, as shown in FIG. 4C, the drawing processing unit 5 determines the drawing area size | X 1 −X 0 | of the character string “Abc” and “A” and “b” after scaling. And the size of each font so that it matches the size of the font group [Wa * Mag + Wb * Mag + Wc * Mag] of each character of “c”, and the “A”, “b” and “c” "Is drawn.
なお、ここでは、各文字の幅方向寸法のみを変倍の対象とし、各文字の高さ方向寸法値Hについては変倍の対象としていないが、当該高さ方向寸法値Hについても変倍の対象としても構わない。すなわち、高さ方向寸法値Hを矩形領域の高さ方向の大きさ|Y0−Y1|で除して、これらの間の変倍率を求め、その変倍率をフォントの描画に反映させることも考えられる。 Here, only the width direction dimension of each character is the object of scaling, and the height direction dimension value H of each character is not subject to scaling, but the height direction dimension value H is also subject to scaling. It does not matter as the target. That is, the height direction dimension value H is divided by the height direction size | Y 0 −Y 1 | of the rectangular area to obtain a scaling factor between them, and the scaling factor is reflected in the font drawing. Is also possible.
以上のような処理手順を経て生成される電子文書は、文書処理装置の利用者による文字変倍のための判断や操作等を必要とすることなく、またテキストレイヤで使用されるフォント種類にもよらずに、所定単位の一例である単語単位の文字列について、イメージレイヤにおける文字とテキストレイヤにおける文字との描画位置および大きさが合致したものとなる。したがって、例えば外国語文(英文、仏文、独文等。特に、アルファベットにより記述される英文。)のように文字毎に字幅や文字間距離等が異なるフォント(プロポーショナルフォント)を用いた場合であっても、一文字毎の位置ずれ調整をする場合に比べて、文字列単位でバランスよく表示できるようになる。 The electronic document generated through the processing procedure described above does not require judgment or operation for character scaling by the user of the document processing apparatus, and the font type used in the text layer. Regardless, for the character string in units of words, which is an example of the predetermined unit, the drawing positions and sizes of the characters in the image layer and the characters in the text layer match. Therefore, for example, when using fonts (proportional fonts) with different character widths and distances between characters, such as foreign language sentences (English, French, German, etc., especially English written in alphabets). However, as compared with the case of adjusting the positional deviation for each character, the character string unit can be displayed in a balanced manner.
なお、本実施形態では、本発明の好適な実施具体例について説明したが、本発明はその内容に限定されるものではない。 In addition, although this embodiment demonstrated the suitable Example of this invention, this invention is not limited to the content.
例えば、本実施形態では、電子文書の生成を行う場合を例に挙げて説明したが、電子文書の画像出力を行う場合についても、全く同様に本発明を適用することが考えられる。すなわち、イメージレイヤとテキストレイヤとが重なる構成の電子文書につき、その表示出力または印刷出力を行う文書処理装置または文書処理プログラムにおいて、当該表示出力または当該印刷出力のための出力データを生成するのにあたり、本実施形態と同様の手順でフォントの変倍を行えば、出力側デバイスが保持するフォントデータの種類によらずに、イメージレイヤとテキストレイヤとの間で文字の位置ずれが生じてしまうことのない表示出力または印刷出力を行うことが実現可能となる。 For example, in the present embodiment, the case of generating an electronic document has been described as an example. However, the present invention can be applied to the case of outputting an image of an electronic document in exactly the same manner. That is, for an electronic document having a configuration in which an image layer and a text layer overlap, a document processing apparatus or document processing program that performs display output or print output generates output data for the display output or print output. If the font scaling is performed in the same procedure as in this embodiment, the character position shifts between the image layer and the text layer regardless of the type of font data held by the output device. It is possible to perform display output or print output without any problem.
このように、本発明は、本実施形態で説明した内容に限定されるものではなく、その要旨を逸脱しない範囲で変更することが可能である。 Thus, the present invention is not limited to the contents described in the present embodiment, and can be changed without departing from the gist thereof.
1…画像入力部、2…設定部、3…画像処理部、3a…文字認識手段、4…蓄積部、4a…フォントデータ、5…描画処理部、5a…領域情報取得手段、5b…フォント情報取得手段、5c…描画計算手段、5d…描画処理手段、6…データ転送部 DESCRIPTION OF SYMBOLS 1 ... Image input part, 2 ... Setting part, 3 ... Image processing part, 3a ... Character recognition means, 4 ... Accumulation part, 4a ... Font data, 5 ... Drawing process part, 5a ... Area information acquisition means, 5b ... Font information Acquisition means, 5c... Drawing calculation means, 5d... Drawing processing means, 6.
Claims (2)
前記テキストレイヤにおける前記文字列を構成する文字のフォントそれぞれの幅方向の大きさを示す第2の値を含むメトリクス情報を取得するフォント情報取得手段と、
前記取得されたメトリクス情報に含まれる前記文字列を構成する文字のフォントそれぞれの第2の値の合計を前記取得された位置情報に含まれる第1の値で除算して、前記第1の値と前記第2の値の合計との比率を算出する描画計算手段と、
前記テキストレイヤにおける前記文字列を構成する文字のフォントそれぞれの幅方向の大きさに、前記算出された比率を乗算することにより、前記文字列の描画領域と前記文字列との幅方向の大きさとを合わせて、前記テキストレイヤに前記文字列を描画する描画処理手段と
を備えることを特徴とする文書処理装置。 Position information including a first value indicating a size in a width direction of a drawing area in which a character string of a predetermined unit is drawn in the image layer of an electronic document configured by superimposing an image layer and a text layer. Area information acquisition means to acquire;
Font information acquisition means for acquiring metric information including a second value indicating the size in the width direction of each font of the characters constituting the character string in the text layer;
The first value is obtained by dividing the sum of the second values of the fonts of the characters constituting the character string included in the acquired metrics information by the first value included in the acquired position information. And a drawing calculation means for calculating a ratio of the total of the second values,
By multiplying the size in the width direction of each font of the characters constituting the character string in the text layer by the calculated ratio, the size in the width direction between the drawing area of the character string and the character string And a drawing processing unit for drawing the character string on the text layer .
イメージレイヤとテキストレイヤとが重ねられて構成される電子文書の前記イメージレイヤにおいて、所定の単位の文字列が描画される描画領域の幅方向の大きさを示す第1の値を含む位置情報を取得する領域情報取得手段と、
前記テキストレイヤにおける前記文字列を構成する文字のフォントそれぞれの幅方向の大きさを示す第2の値を含むメトリクス情報を取得するフォント情報取得手段と、
前記取得されたメトリクス情報に含まれる前記文字列を構成する文字のフォントそれぞれの第2の値の合計を前記取得された位置情報に含まれる第1の値で除算して、前記第1の値と前記第2の値の合計との比率を算出する描画計算手段と、
前記テキストレイヤにおける前記文字列を構成する文字のフォントそれぞれの幅方向の大きさに、前記算出された比率を乗算することにより、前記文字列の描画領域と前記文字列との幅方向の大きさとを合わせて、前記テキストレイヤに前記文字列を描画する描画処理手段と
として機能させることを特徴とする文書処理プログラム。 Computer
Position information including a first value indicating a size in a width direction of a drawing area in which a character string of a predetermined unit is drawn in the image layer of an electronic document configured by superimposing an image layer and a text layer. Area information acquisition means to acquire;
Font information acquisition means for acquiring metric information including a second value indicating the size in the width direction of each font of the characters constituting the character string in the text layer;
The first value is obtained by dividing the sum of the second values of the fonts of the characters constituting the character string included in the acquired metrics information by the first value included in the acquired position information. And a drawing calculation means for calculating a ratio of the total of the second values,
By multiplying the size in the width direction of each font of the characters constituting the character string in the text layer by the calculated ratio, the size in the width direction between the drawing area of the character string and the character string And a document processing program that functions as a drawing processing means for drawing the character string on the text layer .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008063855A JP4924990B2 (en) | 2008-03-13 | 2008-03-13 | Document processing apparatus and document processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008063855A JP4924990B2 (en) | 2008-03-13 | 2008-03-13 | Document processing apparatus and document processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009223363A JP2009223363A (en) | 2009-10-01 |
JP4924990B2 true JP4924990B2 (en) | 2012-04-25 |
Family
ID=41240115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008063855A Expired - Fee Related JP4924990B2 (en) | 2008-03-13 | 2008-03-13 | Document processing apparatus and document processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4924990B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5003394B2 (en) * | 2007-10-05 | 2012-08-15 | セイコーエプソン株式会社 | File generation program, image processing apparatus, and image processing method |
US8416243B2 (en) * | 2011-03-10 | 2013-04-09 | Konica Minolta Laboratory U.S.A., Inc. | Approximating font metrics for a missing font when substituting an available replacement |
JP6201686B2 (en) * | 2013-11-26 | 2017-09-27 | コニカミノルタ株式会社 | Text data embedding apparatus, image processing apparatus including the apparatus, text data embedding method, and embedding program |
JP6119689B2 (en) * | 2014-07-11 | 2017-04-26 | コニカミノルタ株式会社 | Electronic document generation system, electronic document generation apparatus and program |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3594359B2 (en) * | 1995-05-19 | 2004-11-24 | 松下電器産業株式会社 | Information retrieval device |
JPH09231207A (en) * | 1996-02-27 | 1997-09-05 | Canon Inc | Character graphic forming method |
JP2008059527A (en) * | 2006-09-04 | 2008-03-13 | Ricoh Co Ltd | Image processor and program |
-
2008
- 2008-03-13 JP JP2008063855A patent/JP4924990B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009223363A (en) | 2009-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4251629B2 (en) | Image processing system, information processing apparatus, control method, computer program, and computer-readable storage medium | |
JP5733907B2 (en) | Image processing apparatus, image processing method, and computer program | |
JP4405831B2 (en) | Image processing apparatus, control method therefor, and program | |
CN101924851B (en) | Image processing apparatus and image processing method | |
JP5121599B2 (en) | Image processing apparatus, image processing method, program thereof, and storage medium | |
JP4854491B2 (en) | Image processing apparatus and control method thereof | |
JP4533273B2 (en) | Image processing apparatus, image processing method, and program | |
JP5511450B2 (en) | Image processing apparatus, image processing method, and program | |
US8126270B2 (en) | Image processing apparatus and image processing method for performing region segmentation processing | |
JP4785655B2 (en) | Document processing apparatus and document processing method | |
US20080100624A1 (en) | Image processing apparatus and method, and program | |
JP2011100356A (en) | Apparatus, method and computer program for creating document image | |
JP4956319B2 (en) | Image processing apparatus, control method thereof, program thereof, and storage medium | |
US20200104586A1 (en) | Method and system for manual editing of character recognition results | |
JP2009193356A (en) | Image processing apparatus, image processing method, program, and storage medium | |
US20210075919A1 (en) | Image processing apparatus, image processing system, image processing method, and storage medium | |
US20150304510A1 (en) | Electronic document generation system and recording medium | |
JP4924990B2 (en) | Document processing apparatus and document processing program | |
US8355577B2 (en) | Image processing apparatus and method | |
US8339623B2 (en) | Paper document processing apparatus, paper document processing method, and computer readable medium | |
JP5696394B2 (en) | Image processing apparatus, image processing method, and image processing program | |
JP2013152564A (en) | Document processor and document processing method | |
JP2007052613A (en) | Translation device, translation system and translation method | |
JP6205973B2 (en) | Change history output device, program | |
JP6281739B2 (en) | Processing apparatus and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090824 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20091009 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110728 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110915 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120116 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150217 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4924990 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120129 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |