JP4086709B2 - 画像処理装置、プログラム及び記憶媒体 - Google Patents
画像処理装置、プログラム及び記憶媒体 Download PDFInfo
- Publication number
- JP4086709B2 JP4086709B2 JP2003126864A JP2003126864A JP4086709B2 JP 4086709 B2 JP4086709 B2 JP 4086709B2 JP 2003126864 A JP2003126864 A JP 2003126864A JP 2003126864 A JP2003126864 A JP 2003126864A JP 4086709 B2 JP4086709 B2 JP 4086709B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- editing
- foreground
- document
- processing apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
Description
【発明の属する技術分野】
この発明は、画像処理装置、プログラム及び記憶媒体に関する。
【0002】
【従来の技術】
従来、文書画像を編集する方法にはさまざまな提案がなされてきた。特許文献1には、スキャナにより読み込まれた文書画像の文字領域、罫線領域、図形領域、写真領域等を識別し、文字領域に重ね書きして合成される図形を、ともに操作パネルの液晶パネルに表示し、選択された図形と文字をレイアウトして印刷装置から画像として出力させる技術が開示されている。この際、文字領域は光学文字認識(OCR)を行ってテキストコードにして表示させる。
【0003】
また、特許文献2には、ハイパーテキスト自動作成のための装置で、タイトルと本文を構成する文字と図形とを識別して切り出し、文字の画像をテキストデータに変換し、本文からタイトルを表す文字を検索し、タイトル検索手段により検索に成功した本文中に含まれる他のページのタイトルを選択することで、そのタイトルのページにリンクするリンク情報を有するハイパーテキストを生成して、画像情報からリンク情報を持ったハイパーテキストを自動作成する技術について開示されている。
【0004】
【特許文献1】
特開平7−221968号公報
【特許文献1】
特開2000−137640公報
【0005】
【発明が解決しようとする課題】
しかしながら、前述の従来技術では、画像をテキストコードに変換するOCRを用いているので、文字認識処理を行うに際して認識誤りが避けられず、その場合、必ず認識誤りの確認と修正作業が必要となり、余計な手間がかかるという不具合がある。
【0006】
本発明の目的は、文字認識処理の誤りによる確認、修正の手間をかけることなく、文書画像の編集を行うことができるようにすることである。
【0007】
【課題を解決するための手段】
本発明は、文書画像を編集するための編集用画像を生成する画像処理装置であって、前記文書画像から切り出した文字部分を、前記文書画像の前景画像として取得する前景画像取得手段と、前記文書画像の背景画像を取得する背景画像取得手段と、取得された前記前景画像を前記背景画像に重ね、前記文書画像を編集するための編集用画像を生成する重ね合わせ手段と、を備え、前記背景画像取得手段は、前記文書画像において、前記前景画像取得手段により切り出された文字部分を前記文字部分の周囲の色で埋めた画像を背景画像として取得することを特徴とする。
【0021】
【発明の実施の形態】
[発明の実施の形態1]
図1は、本実施の形態の画像処理装置1の電気的な接続を示すブロック図である。図1に示すように、画像処理装置1は、いずれもPCなどのコンピュータであり、各種演算を行ない、画像処理装置1の各部を集中的に制御するCPU11と、各種のROM、RAMからなるメモリ12とが、バス13で接続されている。
【0022】
バス13には、所定のインターフェイスを介して、ハードディスクなどの磁気記憶装置14と、キーボード、マウスなどの入力装置15と、表示装置16と、光ディスクなどの記憶媒体17を読み取る記憶媒体読取装置18と、画像を読み取る画像読取装置21とが接続され、また、ネットワーク4と通信を行なう所定の通信インターフェイス19が接続されている。なお、記憶媒体17としては、CD,DVDなどの光ディスク、光磁気ディスク、フレキシブルディスクなどの各種メディアを用いることができる。また、記憶媒体読取装置18は、具体的には記憶媒体17の種類に応じて光ディスク装置、光磁気ディスク装置、フレキシブルディスク装置などが用いられる。
【0023】
画像処理装置1は、この発明の記憶媒体を実施する記憶媒体17から、この発明のプログラムを実施する画像処理プログラム20を読み取って、磁気記憶装置14にインストールする。これらのプログラムはインターネットなどのネットワーク4等を介してダウンロードしてインストールするようにしてもよい。このインストールにより、画像処理装置1は、それぞれ後述の所定の処理の実行が可能な状態となる。なお、画像処理プログラム20は、所定のOS上で動作するものであってもよい。
【0024】
図2は、画像処理装置1が、それぞれ画像処理プログラム20に基づいて実現する機能の機能ブロック図であり、図3は、同フローチャートである。
【0025】
ここでは、画像処理装置1により手軽に新聞のスクラップができるようにする例について説明する。
【0026】
図2、図3に示すように、まず、ユーザは、画像読取装置21により、新聞31の画像を読み取り、画像格納手段41によりメモリ12に取り込む(ステップS1)。
【0027】
次に、ユーザは、前景画像取得手段42により、ステップS1で取り込んだ1枚の画像から文字行の位置を特定し(ステップS2)、この部分を前景画像として画像の切り出しをして(第1の取得手段、第1の取得処理)、切り出し後の前景画像を記憶する(第1の記憶手段、第1の記憶処理)(ステップS3)。ここで、文字行の位置を特定するに、例えば、特開2002−288589公報に開示の技術を用いれば、行の位置を特定することができるので、この位置情報を元に切り出せばよい。
【0028】
そして、背景画像取得手段43により、文字行を除いた画像を背景画像として生成して(第2の取得手段、第2の取得処理)、この背景画像を記憶する(第2の記憶手段、第2の記憶処理)(ステップS4)。これは、例えば、文字行の部分を周囲の色で埋めた画像を作成すればよい。
【0029】
そして、重ねあわせ編集手段44は、前述の背景画像の上に前景画像を重ね合わせ表示する(重ね合わせ手段、重ね合わせ処理)(ステップS5)。この際、前景画像は元々の位置に表示する。
【0030】
重ね合わせ編集手段44には編集機能が備わっている。これは、例えば、以下のような編集処理を受付け、その編集処理を実行する(編集手段、編集処理)(ステップS6)。
【0031】
・文字行にマウスポインタを合わせ、ドラッグすると、その位置を変えることができる、
・deleteボタンを押すと、その画像を非表示にすることができる、
・位置を変え、不要なものを非表示にした後、印刷することができる、
・必要な文字行画像を他のアプリケーションにコピーすることができる、
・編集結果を電子データとして保存することができる、
・右クリックで選ばれるメニューを選択すると、文字認識処理のためのアプリケーションが起動し、指定した行の文字認識処理を行える、
・文字の表示色を変更できる、
等である(図4には、これらの編集を行う場合の編集画面16aの概念図を示す)。
【0032】
ところで、従来、新聞をスクラップする場合には、新聞の特定の記事を切り抜き、保存するスクラップが古くから行われてきたが、紙面のレイアウトの都合から、1枚の紙として切り抜くことができない場合があり、そのような場合には保存などに支障をきたしていた(図5は、このような場合の新聞31の紙面を示しており、矢印32の記事は単一の記事を構成するが、紙面のレイアウトの都合から、1枚の紙として切り抜くことができず、切り抜いた記事は2枚になってしまう)。
【0033】
また、OCR(光学文字認識装置)で画像化した後、文字認識させて文字コードとして情報を取得、保存することも考えられるが、この方法によれば保存は容易であるが、現状の技術レベルでは文字認識の誤りをゼロにすることはきわめて困難であり、修正作業を行わないと正確な記事内容を保存できない。さらに、紙面のレイアウトは一般的にかなり複雑であり、この点からも文字認識の精度が低下しがちな傾向がある。
【0034】
これに対して、本実施の形態の画像処理装置1によれば、重ねあわせ編集手段44により文字の位置を変えたり、不要な文字行を非表示にしたりできるので、新聞紙面のレイアウトの都合で分散してしまった記事を、ある一ヶ所にまとめてスクラップすることが簡単に実行できる。この場合、画像を印刷すれば紙媒体として保存することも可能であり、また、電子データとして保存しておいてもよい。この場合は、OCRを行わずに画像で保存しているので、誤認識による情報の欠落の心配がない。
【0035】
また、もしテキストデータとして保存したい場合は、文字認識アプリケーションを用いるか、生成された電子データを画像化してからOCRソフトに処理すればよい。後者の場合は新聞紙面を撮像した画像に直接OCR処理を行うよりも、レイアウトが単純化されているので認識精度が向上すると考えられる。一方、前者の場合は、行単位に画像が既に切り出されているので新聞のレイアウトの複雑さの影響を受けない。どちらも修正の手間が軽減される。
【0036】
なお、画像処理装置1には、前述の編集の結果を保存する手段、送信する手段、印刷する手段などを備えていてもよい。また、前景画像又は背景画像の取得単位での編集が可能な手段、別の前景画像あるいは背景画像を取得する手段、取得した前景画像あるいは背景画像を情報の取得単位で保存または送出を行う手段などを備えるようにしてもよい。前景画像の単位としては、文字行、タイトル、写真、表、図、文字領域、文字、単語、罫線などを用いることができる。さらに、前景画像と背景画像を別々に符号化する手段を備えるようにしてもよい。
【0037】
[発明の実施の形態2]
図6は、本実施の形態の画像処理装置1の機能ブロック図である。この画像処理装置1は、インターネット51上のサーバコンピュータであり、その電気的な接続は前述の図1の場合と同様であるため、図示、詳細な説明は省略する。
【0038】
図5に示すように、画像処理装置1は、前述の新聞などの文書画像の、背景画像、前景画像、及び、これらを重ね合わせ表示し、あるいは、編集を可能にするHTMLファイル(タグ付言語)を、それぞれ背景画像格納手段52(第2の記憶手段、第2の記憶処理)、前景画像格納手段53(第1の記憶手段、第1の記憶処理)、重ね合せ用HTML格納手段54にそれぞれ格納しておく。本例では、前景画像は2値の画像、背景画像は文字を消去された多値の画像とする。
【0039】
この場合に、2値の前景画像は実施の形態1の場合のようにして切り出した画像を2値化して生成しておく。2値化は、あらかじめ定められた閾値を画素の明度に適用して作成する。この際、2値画像は白黒とは限らず、文字色と透明色からなる2値(2色)画像とすれば再現の際に原画像に近い印象になる。文字色は、例えば2値化して閾値より明度の低い画素の、原画像上における平均画素値を文字色として採用することで求めることができる。
【0040】
サーバである画像処理装置1は、インターネット51を通じて遠隔地のクライアントPC46と接続される。画像処理装置1の情報提供手段55はクライアントPC56からの要求を受け、必要な情報をクライアントPC56側へ提供する。すなわち、背景情報と前景情報が前述のように画像処理装置1に用意され、これらの重ね合わせ画像及び編集機能が、前述のHTMLファイルとJAVA−SCRIPTにより提供される(JAVAは登録商標である)(重ね合わせ手段、編集手段、重ね合わせ処理、編集処理)。
【0041】
よって、クライアントPC56のユーザは、実施の形態1の場合と同様の作業を、汎用WEBブラウザを用いるだけで手軽に利用することができる。
【0042】
また、この実施の形態の場合は、文書画像を直接提供する場合に比べ、サーバ側に格納される情報量や通信回線でやりとりされる情報量が少なくて済む。理由は以下である。
【0043】
(1)まず、背景画像は文字が消去されているので、画素値の起伏が少ない。そのためJPEGなどで圧縮した場合に圧縮効率がよい。また、文字自体はすでに切り取られており、背景には重要な情報がないため、高度な不可逆圧縮をしても情報の欠落の心配がない。
【0044】
(2)文字画像は2値画像であり、文字のある領域は紙面全体から見れば狭い領域であるので、記憶容量が小さくて済む。
【0045】
【発明の効果】
本発明は、前記文書画像において、前記前景画像取得手段により切り出された文字部分を、該文字部分の周囲の色で埋めた画像を背景画像として取得するため、前景画像、背景画像の編集ができるので、新聞のスクラップなどを簡単に実行でき、また、画像の保存はOCRを行わずに行なっているので、OCR誤認識による情報の欠落の心配がなく、その確認や修正に手間を要することがない。
また本発明によれば、1枚の画像から前景画像と背景画像を取得して保存することができる。
また本発明によれば、1枚の画像から前景画像を取得した残りの画像を背景画像とすることができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1である画像処理装置の電気的な接続を示すブロック図である。
【図2】本発明の実施の形態1である画像処理装置の機能ブロック図である。
【図3】本発明の実施の形態1である画像処理装置が実行する処理のフローチャートである。
【図4】重ね合わせ編集手段による編集画面の平面図である。
【図5】従来の新聞のスクラップの不具合について説明する説明図である。
【図6】本発明の実施の形態2である画像処理装置の機能ブロック図である。
【符号の説明】
1 画像処理装置
17 記憶媒体
20 プログラム
Claims (7)
- 文書画像を編集するための編集用画像を生成する画像処理装置であって、
前記文書画像から切り出した文字部分を、前記文書画像の前景画像として取得する前景画像取得手段と、
前記文書画像の背景画像を取得する背景画像取得手段と、
取得された前記前景画像を前記背景画像に重ね、前記文書画像を編集するための編集用画像を生成する重ね合わせ手段と、
を備え、
前記背景画像取得手段は、前記文書画像において、前記前景画像取得手段により切り出された文字部分を前記文字部分の周囲の色で埋めた画像を背景画像として取得することを特徴とする画像処理装置。 - 生成された前記編集用画像を編集する編集手段を備え、
前記編集手段は、所定の指示を受け付けて、前記指示を受けた文字部分に対し文字認識処理を行なうことを特徴とする請求項1に記載の画像処理装置。 - 前記重ね合わせ手段は、前記周囲の色で埋められた文字部分に前記前景画像を重ね合わせることを特徴とする請求項1又は2に記載の画像処理装置。
- コンピュータに、文書画像を編集するための編集用画像を生成する処理を実行させるプログラムであって、
コンピュータに、
前記文書画像から切り出した文字部分を、該文書画像の前景画像として取得する前景画像取得ステップと、
前記文書画像の背景画像を取得する背景画像取得ステップと、
取得された前記前景画像を前記背景画像に重ね、前記文書画像を編集するための編集用画像を生成する重ね合わせステップと、を実行させ、
さらに、前記背景画像取得ステップにおいて、前記文書画像において前記前景画像取得ステップにより切り出された文字部分を前記文字部分の周囲の色で埋めた画像を背景画像として取得させることを特徴とするプログラム。 - 生成された前記編集用画像を編集する編集ステップを実行させ、
前記編集ステップにおいて、所定の指示を受け付けて、前記指示を受けた文字部分に対し文字認識処理を行なわせることを特徴とする請求項4に記載のプログラム。 - 前記重ね合わせステップにおいて、前記周囲の色で埋められた文字部分に前記前景画像を重ね合わせることを特徴とする請求項4又は5に記載のプログラム。
- 請求項4〜6のいずれか一に記載のプログラムを記憶したことを特徴とするコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003126864A JP4086709B2 (ja) | 2003-05-02 | 2003-05-02 | 画像処理装置、プログラム及び記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003126864A JP4086709B2 (ja) | 2003-05-02 | 2003-05-02 | 画像処理装置、プログラム及び記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004336223A JP2004336223A (ja) | 2004-11-25 |
JP4086709B2 true JP4086709B2 (ja) | 2008-05-14 |
Family
ID=33503618
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003126864A Expired - Fee Related JP4086709B2 (ja) | 2003-05-02 | 2003-05-02 | 画像処理装置、プログラム及び記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4086709B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5159588B2 (ja) * | 2008-12-05 | 2013-03-06 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
JP6119259B2 (ja) * | 2013-01-16 | 2017-04-26 | コニカミノルタ株式会社 | 画像処理装置、表示方法、および表示制御プログラム |
-
2003
- 2003-05-02 JP JP2003126864A patent/JP4086709B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004336223A (ja) | 2004-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8331677B2 (en) | Combined image and text document | |
JP5733907B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
US20090249177A1 (en) | Method and apparatus for creating album, and recording medium | |
JP2005176216A (ja) | デジタルカメラおよび画像出力方法およびプログラム | |
JP2006023945A (ja) | 画像処理システム及び画像処理方法 | |
JP2007249429A (ja) | 電子メール編集装置、画像形成装置、電子メール編集方法、およびその方法をコンピュータに実行させるプログラム | |
JP4819723B2 (ja) | 情報抽出装置、情報抽出方法、情報抽出プログラム及び記録媒体 | |
US8144988B2 (en) | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program | |
US7746491B2 (en) | Information processing method and apparatus | |
US20100021059A1 (en) | Image processing apparatus and method | |
JP4127099B2 (ja) | 画像形成装置 | |
JP7467928B2 (ja) | 情報処理装置及びプログラム | |
JP4926589B2 (ja) | 画像合成装置、画像合成方法、およびプログラム | |
JP4086709B2 (ja) | 画像処理装置、プログラム及び記憶媒体 | |
JP2007243362A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP2009271779A (ja) | 画像処理装置、画像処理方法ならびにそのプログラムおよび記憶媒体 | |
JP4804433B2 (ja) | 画像処理装置、画像処理方法、及び、画像処理プログラム | |
JP4690676B2 (ja) | 画像処理システム、画像処理方法及び画像処理プログラム | |
JP4501731B2 (ja) | 画像処理装置 | |
JP4148029B2 (ja) | 文書処理装置 | |
CN100511267C (zh) | 图文影像处理装置及其影像处理方法 | |
US20130104014A1 (en) | Viewer unit, server unit, display control method, digital comic editing method and non-transitory computer-readable medium | |
US6275609B1 (en) | Image processing apparatus and method | |
JP3740335B2 (ja) | 画像処理装置及びその制御方法並びに記憶媒体 | |
JP4192792B2 (ja) | 文書処理装置及び文書の出力プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20041012 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051116 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20051021 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060905 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070710 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070717 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070918 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080219 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110228 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120229 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130228 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130228 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140228 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |