JP2009223363A - 文書処理装置および文書処理プログラム - Google Patents
文書処理装置および文書処理プログラム Download PDFInfo
- Publication number
- JP2009223363A JP2009223363A JP2008063855A JP2008063855A JP2009223363A JP 2009223363 A JP2009223363 A JP 2009223363A JP 2008063855 A JP2008063855 A JP 2008063855A JP 2008063855 A JP2008063855 A JP 2008063855A JP 2009223363 A JP2009223363 A JP 2009223363A
- Authority
- JP
- Japan
- Prior art keywords
- font
- character string
- size
- character
- information acquisition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Document Processing Apparatus (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
【解決手段】所定単位の文字列毎に当該文字列のイメージレイヤにおける描画領域に関する位置情報を取得する領域情報取得手段5aと、前記文字列を構成する各文字についてテキストレイヤで使用されるフォントのメトリクス情報を取得するフォント情報取得手段5bと、前記位置情報から特定される描画領域の大きさと前記メトリクス情報から特定されるフォントの大きさとの比率を算出する描画計算手段5cと、前記描画計算手段5cでの算出結果に基づいて前記描画領域の大きさと前記フォントの大きさとが合うように当該フォントの大きさを変倍して前記テキストレイヤについての描画を行う描画処理手段5dと、を備えて文書処理装置を構成する。
【選択図】図1
Description
請求項2に係る発明は、コンピュータを、イメージレイヤとテキストレイヤとが重なる構成の電子文書について、当該電子文書における所定単位の文字列毎に、当該文字列の前記イメージレイヤにおける描画領域に関する位置情報を取得する領域情報取得手段と、前記文字列を構成する各文字について、前記テキストレイヤで使用されるフォントのメトリクス情報を取得するフォント情報取得手段と、前記領域情報取得手段での情報取得結果から特定される前記文字列の描画領域の大きさと前記フォント情報取得手段での情報取得結果から特定される当該文字列のフォントの大きさとの比率を算出する描画計算手段と、前記描画計算手段での算出結果に基づいて、前記文字列の描画領域の大きさと当該文字列のフォントの大きさとが合うように、当該フォントの大きさを変倍して前記テキストレイヤについての描画を行う描画処理手段として機能させることを特徴とする文書処理プログラムである。
図例の文書処理装置は、画像入力部1と、設定部2と、画像処理部3と、蓄積部4と、描画処理部5と、データ転送部6と、を備えて構成されている。
画像処理部3が行う画像処理としては、その一つに、画像データに対する文字認識(Optical Character Reader、以下「OCR」と略す。)処理がある。すなわち、画像処理部3は、文字認識手段3aとしての機能を備えている。この文字認識手段3aは、画像処理部3が所定プログラム(例えば、OCR用ソフトウエア)を実行することによって実現されるものである。
なお、文字認識手段3aが行うOCR処理の手法については、公知技術を利用すればよいため、ここではその詳細な説明を省略する。
また、画像処理部3が行うOCR処理以外の画像処理についても、公知技術を利用したものであればよく、ここではその詳細な説明を省略する。
この蓄積部4が記憶蓄積する各種情報としては、例えば画像入力部1が読み取った画像データまたは画像処理部3での画像処理後の画像データが挙げられる。また、文字認識手段3aによる文字認識結果に関する情報についても、ここでいう各種情報に含まれる。
さらには、文書処理装置を機能させるために必要となる所定プログラムや、文書画像を作成する上で必要となるフォントデータ4a等も、ここでいう各種情報に含まれるものとする。すなわち、蓄積部4は、フォントデータ4aを記憶蓄積しているものとする。
なお、ここでいうフォントデータ4aは、フォントそのものを特定するデータの他に、当該フォントのメトリクス(メトリック)情報をも含む。メトリクス情報とは、フォントが占めるスペースの大きさを定義する情報で、カーニング情報も含まれる。
ただし、描画処理部5は、電子文書の生成を行うために、領域情報取得手段5a、フォント情報取得手段5b、描画計算手段5cおよび描画処理手段5dとしての機能を備えている。
領域情報取得手段5aは、生成すべき電子文書における所定単位の文字列毎に、当該文字列のイメージレイヤにおける描画領域に関する位置情報を取得するものである。位置情報は、詳細を後述するように、画像処理部3の文字認識手段3aから取得することが考えられる。また、文字列の所定単位としては、文字認識手段3aでの文字認識結果から特定される単語単位とすることが考えられるが、必ずしも単語単位である必要はなく、文字認識手段3aでの文字認識結果から特定される文節単位や行単位等といった他の単位であっても構わない。
フォント情報取得手段5bは、所定単位の文字列を構成する各文字について、テキストレイヤで使用されるフォントのメトリクス情報を取得するものである。メトリクス情報の取得は、蓄積部4のフォントデータ4aにアクセスすることによって行うことが考えられる。
描画計算手段5cは、領域情報取得手段5aでの情報取得結果から特定される文字列の描画領域の大きさと、フォント情報取得手段5bでの情報取得結果から特定される当該文字列のフォントの大きさとについて、これらの比率を算出するものである。
描画処理手段5dは、電子文書生成のための描画処理を行うものである。ただし、描画処理手段5dでは、描画計算手段5cでの算出結果に基づいて、所定単位の文字列の描画領域の大きさと当該文字列のフォントの大きさとが合うように、当該フォントの大きさを変倍して、テキストレイヤについての描画を行うようになっている。
なお、描画処理部5が生成する電子文書は、イメージレイヤとテキストレイヤとが重なる構成のものであれば、そのデータフォーマットが特に限定されることはなく、例えばサーチャブルXPSに準拠したものであってもよいし、サーチャブルPDFに準拠したものであってもよいし、あるいはこれら以外のデータフォーマットに準拠したものであってもよい。
図2は、本発明に係る文書処理装置の処理動作例を示すフローチャートである。
このOCR処理によって、文字認識手段3aは、テキスト部分を構成する文字列を、所定単位である単語単位で、抽出することになる。ここでは、所定単位が単語単位である場合を例に挙げるが、当該所定単位は、予め設定されているものであれば、既に述べたように、文節単位や行単位等であっても構わない。なお、ここで例に挙げる「単語」とは、それぞれ意味をもって文節を構成する一つ一つの言葉のことである。
さらに、このOCR処理によって、文字認識手段3aは、単語単位での文字列の抽出に併せて、当該文字列の描画領域に関する位置情報をも、抽出することになる。文字列の描画領域に関する位置情報とは、画像1ページ分上にて当該文字列を描画すべき領域の大きさを特定するための情報のことをいい、具体的には当該文字列が属する矩形領域の左上座標値および右下座標値からなる情報が挙げられる。ただし、当該文字列の描画領域の大きさを特定し得るものであれば、必ずしも矩形領域の左上座標値および右下座標値からなる情報に限定されることはなく、他の情報(例えば、左下座標値および領域幅の値からなる情報)を用いても構わない。
このような比率の算出を描画計算手段5cが行うと、描画処理部5では、描画処理手段5dが処理対象文字列を構成する各文字の描画処理を行う。ただし、このとき、描画処理手段5dは、描画計算手段5cでの算出結果に基づいて、当該処理対象文字列の描画領域の大きさと当該処理対象文字列を構成する各文字のフォントの大きさとが合うように、当該フォントの大きさを変倍して、当該各文字の描画を行う(S09)。
描画処理部5では、以上のような処理対象文字列についての描画処理を、文字認識手段3aが抽出した全ての文字列について終了するまで、繰り返し行う(S07〜S09)。なお、描画処理部5による各文字の描画結果(フォント文字画像の展開結果)は、例えば蓄積部4内に確保されたバッファ領域に保存しておくことが考えられる。
図3および図4は、文字描画処理の一具体例を示す説明図である。
Claims (2)
- イメージレイヤとテキストレイヤとが重なる構成の電子文書について、当該電子文書における所定単位の文字列毎に、当該文字列の前記イメージレイヤにおける描画領域に関する位置情報を取得する領域情報取得手段と、
前記文字列を構成する各文字について、前記テキストレイヤで使用されるフォントのメトリクス情報を取得するフォント情報取得手段と、
前記領域情報取得手段での情報取得結果から特定される前記文字列の描画領域の大きさと前記フォント情報取得手段での情報取得結果から特定される当該文字列のフォントの大きさとの比率を算出する描画計算手段と、
前記描画計算手段での算出結果に基づいて、前記文字列の描画領域の大きさと当該文字列のフォントの大きさとが合うように、当該フォントの大きさを変倍して前記テキストレイヤについての描画を行う描画処理手段と
を備えることを特徴とする文書処理装置。 - コンピュータを、
イメージレイヤとテキストレイヤとが重なる構成の電子文書について、当該電子文書における所定単位の文字列毎に、当該文字列の前記イメージレイヤにおける描画領域に関する位置情報を取得する領域情報取得手段と、
前記文字列を構成する各文字について、前記テキストレイヤで使用されるフォントのメトリクス情報を取得するフォント情報取得手段と、
前記領域情報取得手段での情報取得結果から特定される前記文字列の描画領域の大きさと前記フォント情報取得手段での情報取得結果から特定される当該文字列のフォントの大きさとの比率を算出する描画計算手段と、
前記描画計算手段での算出結果に基づいて、前記文字列の描画領域の大きさと当該文字列のフォントの大きさとが合うように、当該フォントの大きさを変倍して前記テキストレイヤについての描画を行う描画処理手段
として機能させることを特徴とする文書処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008063855A JP4924990B2 (ja) | 2008-03-13 | 2008-03-13 | 文書処理装置および文書処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008063855A JP4924990B2 (ja) | 2008-03-13 | 2008-03-13 | 文書処理装置および文書処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009223363A true JP2009223363A (ja) | 2009-10-01 |
JP4924990B2 JP4924990B2 (ja) | 2012-04-25 |
Family
ID=41240115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008063855A Expired - Fee Related JP4924990B2 (ja) | 2008-03-13 | 2008-03-13 | 文書処理装置および文書処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4924990B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009093319A (ja) * | 2007-10-05 | 2009-04-30 | Seiko Epson Corp | ファイル生成プログラム、画像処理装置、および画像処理方法 |
JP2012190461A (ja) * | 2011-03-10 | 2012-10-04 | Konica Minolta Laboratory Usa Inc | 利用可能な代替フォントの代用時における欠落フォントのフォントメトリックスへの適合 |
JP2015103114A (ja) * | 2013-11-26 | 2015-06-04 | コニカミノルタ株式会社 | テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム |
JP2016021086A (ja) * | 2014-07-11 | 2016-02-04 | コニカミノルタ株式会社 | 電子文書生成システム、電子文書生成装置およびプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08314494A (ja) * | 1995-05-19 | 1996-11-29 | Matsushita Electric Ind Co Ltd | 情報検索装置 |
JPH09231207A (ja) * | 1996-02-27 | 1997-09-05 | Canon Inc | 文字図形作成方法 |
JP2008059527A (ja) * | 2006-09-04 | 2008-03-13 | Ricoh Co Ltd | 画像処理装置およびプログラム |
-
2008
- 2008-03-13 JP JP2008063855A patent/JP4924990B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08314494A (ja) * | 1995-05-19 | 1996-11-29 | Matsushita Electric Ind Co Ltd | 情報検索装置 |
JPH09231207A (ja) * | 1996-02-27 | 1997-09-05 | Canon Inc | 文字図形作成方法 |
JP2008059527A (ja) * | 2006-09-04 | 2008-03-13 | Ricoh Co Ltd | 画像処理装置およびプログラム |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009093319A (ja) * | 2007-10-05 | 2009-04-30 | Seiko Epson Corp | ファイル生成プログラム、画像処理装置、および画像処理方法 |
JP2012190461A (ja) * | 2011-03-10 | 2012-10-04 | Konica Minolta Laboratory Usa Inc | 利用可能な代替フォントの代用時における欠落フォントのフォントメトリックスへの適合 |
JP2015103114A (ja) * | 2013-11-26 | 2015-06-04 | コニカミノルタ株式会社 | テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム |
JP2016021086A (ja) * | 2014-07-11 | 2016-02-04 | コニカミノルタ株式会社 | 電子文書生成システム、電子文書生成装置およびプログラム |
US9398191B2 (en) | 2014-07-11 | 2016-07-19 | Konica Minolta, Inc. | Electronic document generation system, electronic document generation apparatus, and recording medium |
CN105320933B (zh) * | 2014-07-11 | 2019-01-25 | 柯尼卡美能达株式会社 | 电子文档生成系统以及电子文档生成装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4924990B2 (ja) | 2012-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4251629B2 (ja) | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP5733907B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP4405831B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP4948586B2 (ja) | 文書画像生成装置、文書画像生成方法、コンピュータプログラム及び記録媒体 | |
JP5121599B2 (ja) | 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体 | |
JP5511450B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP4533273B2 (ja) | 画像処理装置及び画像処理方法、プログラム | |
CN101924851B (zh) | 图像处理装置及图像处理方法 | |
JP4854491B2 (ja) | 画像処理装置及びその制御方法 | |
JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
JP2011076581A (ja) | 画像処理装置、画像処理システム、画像処理方法、及びプログラム | |
US20200104586A1 (en) | Method and system for manual editing of character recognition results | |
JP2009193356A (ja) | 画像処理装置、画像処理方法、プログラム、及び記憶媒体 | |
US9614984B2 (en) | Electronic document generation system and recording medium | |
US20090254813A1 (en) | Document processing apparatus and document processing method | |
JP4956319B2 (ja) | 画像処理装置、その制御方法、ならびにそのプログラムおよび記憶媒体 | |
JP4924990B2 (ja) | 文書処理装置および文書処理プログラム | |
JP4232679B2 (ja) | 画像形成装置およびプログラム | |
US8355577B2 (en) | Image processing apparatus and method | |
US8339623B2 (en) | Paper document processing apparatus, paper document processing method, and computer readable medium | |
JP5696394B2 (ja) | 画像処理装置、画像処理方法、及び、画像処理プログラム | |
JP2018151699A (ja) | 情報処理装置及びプログラム | |
JP2013152564A (ja) | 文書処理装置及び文書処理方法 | |
JP2007052613A (ja) | 翻訳装置、翻訳システムおよび翻訳方法 | |
JP6205973B2 (ja) | 変更履歴出力装置、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090824 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20091009 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110728 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110915 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120116 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150217 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4924990 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120129 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |