JP4770285B2 - 画像処理装置及びその制御プログラム - Google Patents

画像処理装置及びその制御プログラム Download PDF

Info

Publication number
JP4770285B2
JP4770285B2 JP2005179783A JP2005179783A JP4770285B2 JP 4770285 B2 JP4770285 B2 JP 4770285B2 JP 2005179783 A JP2005179783 A JP 2005179783A JP 2005179783 A JP2005179783 A JP 2005179783A JP 4770285 B2 JP4770285 B2 JP 4770285B2
Authority
JP
Japan
Prior art keywords
document
attribute
area
character
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005179783A
Other languages
English (en)
Other versions
JP2006350959A (ja
Inventor
康司 西出
保明 水戸部
潤 大槻
統久 加藤
幸一 河原
和範 黒川
貴典 奥岡
誠司 飯野
一哉 橋本
祥宏 大島
文夫 高谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2005179783A priority Critical patent/JP4770285B2/ja
Publication of JP2006350959A publication Critical patent/JP2006350959A/ja
Application granted granted Critical
Publication of JP4770285B2 publication Critical patent/JP4770285B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、複数の文書を結合して1つの文書とする画像処理装置、画像処理方法及び画像処理プログラムの改良に関する。
近年、複数人により一つの文書を作成するという要請があり、各人が分担して作成した複数の文書をプリンタ側で1つの文書にまとめて出力することが行われている。このように、複数の文書を一つにまとめる際には、各文書間において文字フォント等の文書のフォーマットが統一されていないと、一つにまとめられて出力される文書が不自然なものとなる。この不自然さを回避するために、各文書をユーザが端末上で修正することにより、フォーマットの統一を図ることも可能であるが、作業が繁雑になるという問題がある。
そこで、下記特許文献1のように、入力画像から複数の文字領域を抽出し、その類似度により文字領域を分類する技術を使用すれば、上記修正作業の煩雑さを緩和することができる可能性がある。
特開平8−202817号公報
しかし、上記従来の技術においては、一つの文書の中における文字領域の類似度を判断するものであり、複数の文書にまたがって処理を行うものではなく、複数の文書を結合して1つの文書とするための技術には適用できないという問題があった。
また、単に類似度を判断して分類するだけでは、複数の文書間におけるフォーマットの統一をユーザの手を介さずに行うことができず、修正作業の煩雑さの緩和を充分に達成できないという問題もあった。
本発明は、上記従来の課題に鑑みなされたものであり、その目的は、ユーザが煩雑な作業をしなくても、統一性のあるフォーマットで複数の文書を結合できる画像処理装置、画像処理方法及び画像処理プログラムを提供することにある。
上記目的を達成するために、本発明は、複数の文書を結合して一つの文書とする画像処理装置であって、結合される各文書毎に、当該文書を所定の分類項目に基づき文書領域に切り分ける切分手段と、前記切分手段が切り分けた文書領域を、前記分類項目が共通する共通文書領域毎に抽出する抽出手段と、前記抽出された共通文書領域の属性から、結合後の文書の前記各分類項目毎に使用する属性を決定する属性決定手段と、を備えることを特徴とする。
ここで、上記属性には文字のフォント及び/または文字サイズが含まれるのが好適である。また、上記分類項目には、タイトルと本文とが含まれるのが好適である。
また、本発明は、複数の文書を結合して一つの文書とする画像処理方法であって、結合される各文書毎に、当該文書を所定の分類項目に基づき文書領域に切り分けるステップと、前記切り分けられた文書領域を、前記分類項目が共通する共通文書領域毎に抽出するステップと、前記抽出された共通文書領域の属性から、結合後の文書の前記各分類項目毎に使用する属性を決定するステップと、を備えることを特徴とする。
また、本発明は、複数の文書を結合して一つの文書とする画像処理装置の制御プログラムであって、結合される各文書毎に、当該文書を所定の分類項目に基づき文書領域に切り分け、前記切り分けられた文書領域を、前記分類項目が共通する共通文書領域毎に抽出し、前記抽出された共通文書領域の属性から、結合後の文書の前記各分類項目毎に使用する属性を決定する処理を画像処理装置に実行させることを特徴とする。
以下、本発明を実施するための最良の形態(以下、実施形態という)を、図面に従って説明する。
図1には、本発明にかかる画像処理装置の一実施形態の構成のブロック図が示される。図1において、画像処理装置は、操作部10、表示部12、切分部14、抽出部16、属性決定部18、通信部20、結合部22及び記憶部24を含んで構成されている。
操作部10は、キーボード、マウス等のポインティングデバイス、タッチパネル等の入力装置を含み、ユーザが画像処理装置に各種データを入力するために使用する。
表示部12は、例えば液晶ディスプレイ(LCD)、発光ダイオード(LED)等で構成され、操作部10または通信部20等を介して入力され及び/または結合された文種データ等を表示する。
切分部14は、操作部10または通信部20等を介して入力された文書データを所定の分類項目に基づき文書領域に切り分ける処理を実行する。
抽出部16は、上記切分部14が切り分けた文書領域を、分類項目が共通する共通文書領域毎に抽出する処理を実行する。共通文書領域については後述する。
属性決定部18は、抽出部16により抽出された共通文書領域の属性から、結合後の文書における各分類項目毎に使用する属性を決定する処理を実行する。ここで、属性には、文字のフォント、文字サイズ、行頭位置等の文書のフォーマットに関する情報が含まれる。なお、行の文字位置が中央に設定されている場合、一行の文字数が1文字〜数文字のように極端に少ない場合等には、当該文書領域が強調用等特殊なものであると判断し、属性決定部18が属性決定処理を行わないように構成してもよい。
通信部20は、公知の方法により通信ネットワーク等を介してサーバあるいは他の端末等と通信し、文書データその他のデータをやり取りする。
結合部22は、入力された複数の文書データを結合する処理を実行する。
記憶部24は、例えばCPUの作業用のRAM、不揮発性メモリとしてのフラッシュメモリ、磁気記憶媒体等で構成されており、文書データ等のデータ及びプログラムが記憶される。
なお、上述した画像処理装置は、CPUを中心として構成されたコンピュータであってよく、この場合、ハードディスクその他の媒体に格納されたプログラムをCPUが実行することで画像処理装置の各機能が実現される。
図2には、本実施形態にかかる画像処理装置において扱われる文書データの例が示される。図2において、文書データは、タイトル26、本文28、脚注30等の文書領域により構成されている。上記本文28には、複数の段落が含まれていてよく、各段落はインデントにより行頭位置が後退した行から始まるのが好適である。
操作部10及び/または通信部24を介して上記構成の文書データが入力されると、切分部14が、所定の分類項目に基づき文書領域に切り分ける。ここで、分類項目には、タイトル、本文、脚注等が含まれる。また、切り分けられる文書領域は、上記文書に含まれるタイトル26、本文28、脚注30等の文書の内容である。
切分部14による文書領域の切り分けは、例えば当該文書領域に含まれる文字数、行数、フォント、文字サイズ、行頭位置、文字コード、文字の色、文字領域の大きさ等に基づいて、タイトル26、本文28、脚注30等の文書領域のパターンを判別することにより行うことができる。この場合、行数が1で、文字サイズが他の文書領域より大きいときにはタイトル26として切り分け、ページ内で文字数の最も多い部分は本文28に切り分ける等の動作となる。なお、文書領域のパターンは、記憶部24に予めテンプレートとして記憶させておくのが好適である。
図3には、記憶部24に形成された記憶領域の一部の例が示される。図3に示された記憶領域には、結合して一つの文書にするための複数の文書データ毎に切分部14が切り分けた文書領域が記憶されている。図3において、複数の文書データには、それぞれを識別するためのジョブIDが付与されており、各文書データ毎にタイトル、本文、脚注等の分類項目32に従って切り分けられた文書領域が、それぞれ対応する分類項目32毎に記憶されている。このように、各文書データに含まれる文書領域において、分類項目32が共通する文書領域を共通文書領域とする。例えば、分類項目32として「タイトル」に分類された各文書領域の全部が、「タイトル」という共通する分類項目32に分類された共通文書領域となる。
上記抽出部16は、切分部14が切り分け、記憶部24に記憶された文書領域から、分類項目32が共通するものを共通文書領域として抽出する。
図4には、本実施形態にかかる画像処理装置の動作の例のフローが示される。図4において、操作部10または通信部20等を介して文書データが入力されると(S1)、文書データの内容が表示部12に表示される。ここで、ユーザが操作部10から文書データの結合を指示すると、切分部14が、図3に示されるような分類項目32に従い、入力された文書データ毎に文書領域に切り分ける(S2)。切り分けられた文書領域の各々は、図3に示される記憶部24の記憶領域に記憶される(S3)。
次に、抽出部16が、上記記憶部24の記憶領域に記憶された文書領域を、分類項目が共通する共通文書領域毎に抽出する(S4)。この処理により、例えば分類項目32である「タイトル」、「本文」、「脚注」毎に、各分類項目32に含まれる文書領域の全部が共通文書領域として抽出される。
次に、属性決定部18が、抽出部16により抽出された共通文書領域の属性から、結合後の文書における各分類項目毎に使用する属性を決定する(S5)。例えば、「タイトル」の共通文書領域として抽出された文書領域が三つあり、そのうち二つでフォントに「明朝」が使用され、一つで「ゴシック」が使用されている場合には、共通文書領域の属性として「明朝」のフォントが採用される。この場合、結合後の文書における「タイトル」で使用されるフォントも「明朝」と決定される。また、他の属性も、同様にして決定される。なお、属性の統一を行う際には、ユーザにその旨の報知を行うように構成するのが好適である。
次に、結合部22は、複数の文書データを結合し、一つの文書とする処理を行う。この際、入力されている各文書データは、タイトル26、本文28、脚注30等のうち複数の文書領域を含むもの、いずれか一つの文書領域を含むもの等があるが、図3に示された各文書領域を、例えばタイトル、本文、脚注の順序になるように並べて一つの文書とする。このとき、使用するフォント等の属性は、上記属性決定部18が決定した属性を使用する(S6)。なお、結合された文書データの内容は、表示部12に表示される。
以上の各工程により、それぞれフォーマットが異なる複数の文書データを結合する場合に、ユーザがフォーマットの統一作業を行わなくても、結合後の文書のフォーマットを統一することができる。これにより、ユーザが煩雑な作業をしなくても、統一性のあるフォーマットで複数の文書を結合できる画像処理装置を実現することができる。
本発明にかかる画像処理装置の一実施形態の構成のブロック図である。 図1に示された画像処理装置において扱われる文書の例を示す図である。 図1に示された画像処理装置において、記憶部に形成された記憶領域の一部の例を示す図である。 図1に示された画像処理装置の動作の例のフロー図である。
符号の説明
10 操作部、12 表示部、14 切分部、16 抽出部、18 属性決定部、20 通信部、22 結合部、24 記憶部、26 タイトル、28 本文、30 脚注、32 分類項目。

Claims (5)

  1. 複数の文書を結合して一つの文書とする画像処理装置であって、
    結合される文書毎に、当該文書を予め定められた文字の表示形式に基づき文書領域の種類別文書領域に切り分ける切分手段と、
    前記切分手段が切り分けた文書領域から前記文書領域の種類が共通する共通文書領域抽出する抽出手段と、
    前記抽出手段によって抽出された共通文書領域において、結合される前に設定されている文字の属性に基づいて、結合後の文書に対応する文書領域に使用する属性を決定する属性決定手段と、
    を備えることを特徴とする画像処理装置。
  2. 前記属性決定手段は、共通文書領域どうしの中で文字の属性が複数種類設定されている場合、最も設定が多くされている前記文字の表示形式の属性を結合後の文書に対応する文書領域に使用する属性に決定する事を特徴とする請求項1に記載の画像処理装置。
  3. 前記文書領域の種類は、タイトル、本文、脚注のうちいずれかひとつであることを特徴とする請求項1または請求項2に記載の画像処理装置。
  4. 前記予め定められた文字の表示形式は、文字数、行数、フォント、文字サイズ、行頭位置、文字コード、文字の色、文字領域の大きさのうちいずれかひとつであることを特徴とする請求項1から請求項3のいずれか1項に記載の画像処理装置。
  5. 複数の文書を結合して一つの文書とする制御プログラムであって、
    コンピュータに、
    結合される文書毎に、当該文書を予め定められた文字の表示形式に基づき文書領域の種類別文書領域に切り分け、
    前記切り分けられた文書領域から前記文書領域の種類が共通する共通文書領域抽出し、
    前記抽出された共通文書領域において、結合される前に設定されている文字の属性に基づいて、結合後の文書に対応する文書領域に使用する属性を決定する処理を実行させることを特徴とする制御プログラム。
JP2005179783A 2005-06-20 2005-06-20 画像処理装置及びその制御プログラム Expired - Fee Related JP4770285B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005179783A JP4770285B2 (ja) 2005-06-20 2005-06-20 画像処理装置及びその制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005179783A JP4770285B2 (ja) 2005-06-20 2005-06-20 画像処理装置及びその制御プログラム

Publications (2)

Publication Number Publication Date
JP2006350959A JP2006350959A (ja) 2006-12-28
JP4770285B2 true JP4770285B2 (ja) 2011-09-14

Family

ID=37646679

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005179783A Expired - Fee Related JP4770285B2 (ja) 2005-06-20 2005-06-20 画像処理装置及びその制御プログラム

Country Status (1)

Country Link
JP (1) JP4770285B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5667135B2 (ja) * 2012-09-24 2015-02-12 京セラドキュメントソリューションズ株式会社 画像形成装置
JP2016115234A (ja) 2014-12-17 2016-06-23 コニカミノルタ株式会社 プロパティ制御プログラム及びプロパティ制御方法並びに共通ファイル作成システム
KR102538108B1 (ko) * 2023-03-24 2023-05-30 주식회사 올빅뎃 인공지능을 활용한 문서 구조 정보 추출 및 문서 병합 장치

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3026617B2 (ja) * 1991-02-04 2000-03-27 キヤノン株式会社 文書処理装置及び方法
JP2645183B2 (ja) * 1991-02-04 1997-08-25 株式会社東芝 半導体集積回路装置
JPH05108793A (ja) * 1991-10-18 1993-04-30 Ricoh Co Ltd 文書編集装置
JPH05334301A (ja) * 1992-05-29 1993-12-17 Canon Inc 文書処理装置
JP3391103B2 (ja) * 1994-07-07 2003-03-31 富士ゼロックス株式会社 テキスト合成装置
JPH0830587A (ja) * 1994-07-14 1996-02-02 Toshiba Corp 文書作成装置及び書式変更方法
JP3651946B2 (ja) * 1995-01-31 2005-05-25 キヤノン株式会社 画像処理方法
JPH09319747A (ja) * 1996-05-29 1997-12-12 Ricoh Co Ltd 文書画像の構造化方法
JPH10177569A (ja) * 1996-12-18 1998-06-30 Nippon Telegr & Teleph Corp <Ntt> 文書画像部分拡大表示方法および装置
JPH11203305A (ja) * 1998-01-12 1999-07-30 Ricoh Co Ltd 文書画像処理方法および記録媒体
JP2001034763A (ja) * 1999-03-01 2001-02-09 Matsushita Electric Ind Co Ltd 文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法
JP2000293671A (ja) * 1999-04-09 2000-10-20 Canon Inc 画像処理方法、装置及び記憶媒体
JP2001209639A (ja) * 2000-01-26 2001-08-03 Fujitsu Ltd スタイルシート制御方法及びその装置
JP5033277B2 (ja) * 2000-09-12 2012-09-26 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および画像処理方法並びにコンピュータ読み取り可能な記録媒体
JP4142506B2 (ja) * 2003-06-12 2008-09-03 富士通株式会社 Ocr入力装置
JP2005032280A (ja) * 2004-10-18 2005-02-03 Ricoh Co Ltd キー領域抽出処理方法

Also Published As

Publication number Publication date
JP2006350959A (ja) 2006-12-28

Similar Documents

Publication Publication Date Title
US8707208B2 (en) Font selector and method for the same
US6021218A (en) System and method for organizing recognized and unrecognized objects on a computer display
EP2002352B1 (en) Applying effects to a merged text path
JP4311365B2 (ja) 文書処理装置およびプログラム
KR20180048774A (ko) 디지털 노트 필기의 시스템 및 방법
US7773089B2 (en) Displaying character strings based on font information
US11615635B2 (en) Heuristic method for analyzing content of an electronic document
US20060282769A1 (en) Method of identifying redundant text in an electronic document
US8937744B1 (en) Modifying electronic data layout for efficient printing of electronic data
US20210141464A1 (en) Stylizing text by providing alternate glyphs
KR101777521B1 (ko) 스타일 변경이 가능한 폰트 생성 방법 및 장치
JP4770285B2 (ja) 画像処理装置及びその制御プログラム
JP2004046325A (ja) データ入力装置、データ入力プログラムおよびデータ入力プログラムを記録した記録媒体
EP2410487B1 (en) Method for automatically modifying a graphics feature to comply with a resolution limit
US11030388B2 (en) Live text glyph modifications
KR20190066450A (ko) 템플릿을 이용한 개인화 폰트 생성 방법 및 시스템
KR20220137645A (ko) 핸드라이팅에서의 구조 분해
US10755034B2 (en) Information processing apparatus
US20160196676A1 (en) Using Character Classes for Font Selection
JP5645481B2 (ja) 装置、方法、及びプログラム
JP2006040263A (ja) アジア言語用の手書き入力
KR20150085282A (ko) 전자 문서의 첨삭을 위한 단말의 동작 방법
JP2005311729A (ja) ファイル名作成装置及びファイル名作成プログラム
JP4474670B2 (ja) 文書整形装置および文書整形方法
US20210264099A1 (en) Information processing device and computer readable medium

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071114

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071115

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100824

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100831

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110308

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110524

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110606

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140701

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees