JP5197694B2 - 画像処理装置、画像処理方法、コンピュータプログラム - Google Patents
画像処理装置、画像処理方法、コンピュータプログラム Download PDFInfo
- Publication number
- JP5197694B2 JP5197694B2 JP2010193846A JP2010193846A JP5197694B2 JP 5197694 B2 JP5197694 B2 JP 5197694B2 JP 2010193846 A JP2010193846 A JP 2010193846A JP 2010193846 A JP2010193846 A JP 2010193846A JP 5197694 B2 JP5197694 B2 JP 5197694B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- data
- electronic document
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
図1は画像処理装置の構成を示すブロック図の一例である。
図2は、画像処理装置100が、紙文書をスキャンするなどして取得した画像データから検索可能な電子文書を生成し、画像処理装置110へ当該電子文書を送信する処理の例を示すフローチャートである。
グリフ二値画像の画素値が1に対応する画素:(r’,g’,b’)=(F(r,Cr),F(g,Cg),F(b,Cb))
ここで、F(r,Cr)=(r×A+Cr×(255−A))/255、F(g,Cg)=(g×A+Cg×(255−A))/255、F(b,Cb)=(b×A+Cb×(255−A))/255とする。また、Aは文字色Cに対するアルファチャネル値、Cr,Cg,Cbは文字色Cの各RGB値とする。なお、アルファチャネル値として255が指定されている場合は、当該グリフ二値画像は透明であるので、グリフ二値画像の画素値が1に対応する画素についても、(r’,g’,b’)=(r,g,b)となる。
(ここで、G(r)=255−r,G(g)=255−g,G(b)=255−bであるとする。)
なお、色の反転を行う上記強調処理は一例であり、その他の強調処理でもよい。例えば、グリフ二値画像の画素値が0の画素に対応する画素はそのまま変更せず、グリフ二値画像の画素値が1の画素に対応する画素については、各画素値(r,g,b)を上記(r’,g’,b’)にそれぞれ変更するようにしてもよい。
実施形態1では、図4のステップS405で<Text>要素のグリフIDの属性データを記述する際、各文字の幅情報と行高さとに基づいて、各文字に対応させるグリフを決定していたが、これに限るものではない。
上述した実施形態の図5のステップS516における次の文字の描画開始位置Xを決定するための別実施形態について述べる。
また、上述した実施形態では、スキャン画像に対してJPEG圧縮等を行った全面イメージを<Image>要素に記述し、透明テキストを<Text>要素に記述した電子文書を生成することとしたが、これに限るものではない。
上述した実施形態では、検索した結果に対応する個所を強調表示する際、画像の色(r,g,b)を反転することにより強調表示したが、使用する色はこれに限るものではない。例えば、検索結果を特定させるための予め決めた色(例えば黄色)を、半透明(例えばアルファチャネル128)で描画させるようにしてもよい。また、文字色(Cr,Cg,Cb)を利用して、強調色を決めるようにしてもよい。
また、上述した実施形態では、図3及び図5で説明したように、検索を行う際は、キーワードに一致する文字列を文書の先頭から順に検索していき、最初に検索された文字列を強調表示した。そして、「次を検索」の指示があれば、順次、次に一致する文字列を検索して強調表示するように構成した。このように、上述した実施形態では、検索キーワードに一致する文字列を先頭から順に検索をおこない、検索キーワードがヒットするごとに順次強調表示を行っていたが、これに限るものではない。例えば、電子文書内に含まれる全ての文字列について、検索キーワードと比較を行い、全ての一致する文字列を特定し、そのキーワードに一致した全ての文字列を同時に強調表示するような構成にしてもよい。
なお、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコード(コンピュータプログラム)を記憶した、コンピュータ読取可能な記憶媒体を、システムあるいは装置に供給することによっても達成される。また、システムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても達成される。
Claims (17)
- 文書画像内の複数の文字画像に対して文字認識処理を行うことにより、それぞれの文字画像に対応する文字コードを得る文字認識手段と、
幅の異なる複数種類の字形データの中から、前記文書画像内の各文字画像の文字の幅と該各文字画像が含まれる各文字行の高さとに基づいて、各文字画像に対応する字形データの種類を選択する選択手段と、
前記文書画像と、前記文字認識手段で得た複数の文字コードと、前記複数の文字コードに対応する文字を描画する際に複数の異なる文字コードで共通利用させるための前記複数種類の字形データと、前記複数の文字コードの描画の際に使用する字形データの種類を示すデータと、各文字行の1番目の文字コードの描画開始位置のデータと、各文字行の高さに基づいて定められる各文字行のフォントサイズのデータとを格納した電子文書を生成する生成手段と、
前記生成手段で生成した電子文書を、指定された送信先へ送信する送信手段と、を有し、
前記電子文書に格納される、前記複数の文字コードの描画の際に使用する字形データの種類を示すデータは、前記文書画像内の各文字画像に対して前記選択手段で選択された字形データの種類に基づいて記述され、
前記各文字行における2番目以降の文字コードそれぞれの描画開始位置は、その文字コードの1つ前の文字コードの描画開始位置と、前記電子文書に格納されている各文字行のフォントサイズのデータと、該1つ前の文字コードの描画の際に使用する字形データの種類を示すデータとに基づいて計算される
ことを特徴とする画像処理装置。 - 文書画像内の複数の文字画像に対して文字認識処理を行うことにより、それぞれの文字画像に対応する文字コードを得る文字認識手段と、
幅の異なる複数種類の字形データの中から、前記文書画像内の各文字画像の文字送り幅と該各文字画像が含まれる各文字行の高さとに基づいて、各文字画像に対応する字形データの種類を選択する選択手段と、
前記文書画像と、前記文字認識手段で得た複数の文字コードと、前記複数の文字コードに対応する文字を描画する際に複数の異なる文字コードで共通利用させるための前記複数種類の字形データと、前記複数の文字コードの描画の際に使用する字形データの種類を示すデータと、各文字行の1番目の文字コードの描画開始位置のデータと、各文字行の高さに基づいて定められる各文字行のフォントサイズのデータとを格納した電子文書を生成する生成手段と、
前記生成手段で生成した電子文書を、指定された送信先へ送信する送信手段と、を有し、
前記電子文書に格納される、前記複数の文字コードの描画の際に使用する字形データの種類を示すデータは、前記文書画像内の各文字画像に対して前記選択手段で選択された字形データの種類に基づいて記述され、
前記各文字行における2番目以降の文字コードそれぞれの描画開始位置は、その文字コードの1つ前の文字コードの描画開始位置と、前記電子文書に格納されている各文字行のフォントサイズのデータと、該1つ前の文字コードの描画の際に使用する字形データの種類を示すデータとに基づいて計算される
ことを特徴とする画像処理装置。 - 前記字形データは、矩形または三角または丸または直線のいずれかの形状を有する字形データであることを特徴とする請求項1または2のいずれかに記載の画像処理装置。
- 前記字形データは、文字行の下部に描画を行う字形データであることを特徴とする請求項1または2のいずれかに記載の画像処理装置。
- 前記生成手段は、文字間距離の平均値を更に格納させた前記電子文書を生成し、
前記各文字行における2番目以降の文字コードそれぞれの描画開始位置は、その文字コードの1つ前の文字コードの描画開始位置と、前記電子文書に格納されている各文字行のフォントサイズのデータと、該1つ前の文字コードの描画の際に使用する字形データの種類を示すデータと、前記文字間距離の平均値とに基づいて計算されることを特徴とする請求項1に記載の画像処理装置。 - 前記生成手段で生成された電子文書には、前記複数の文字コードに対応させた字形データを、前記文書画像内の各文字画像に重なる位置に透明色で描画させるための記述が含まれることを特徴とする請求項1乃至5のいずれかに記載の画像処理装置。
- 前記電子文書は、XMLフォーマットまたはXPSフォーマットのいずれかで記述された電子文書であることを特徴とする請求項1乃至6のいずれかに記載の画像処理装置。
- 前記画像処理装置は、前記文書画像を圧縮する圧縮手段を更に有し、
前記電子文書に格納される文書画像は、前記圧縮手段で圧縮処理が施された文書画像であることを特徴とする請求項1乃至7のいずれかに記載の画像処理装置。 - 前記圧縮手段は、前記文書画像内に含まれる領域を解析して適応的に圧縮することを特徴とする請求項8に記載の画像処理装置。
- 前記生成された電子文書に対して、入力されたキーワードで検索し、当該キーワードに一致する部分を強調表示させる検索手段を、更に有することを特徴とする請求項1乃至9のいずれかに記載の画像処理装置。
- 前記検索手段は、前記キーワードに一致する部分の色を反転することにより強調表示させることを特徴とする請求項10に記載の画像処理装置。
- 紙文書をスキャンして前記文書画像を生成するスキャナを更に有することを特徴とする請求項1乃至11のいずれかに記載の画像処理装置。
- 文字認識手段が、文書画像内の複数の文字画像に対して文字認識処理を行うことにより、それぞれの文字画像に対応する文字コードを得る文字認識ステップと、
選択手段が、幅の異なる複数種類の字形データの中から、前記文書画像内の各文字画像の文字の幅と該各文字画像が含まれる各文字行の高さとに基づいて、各文字画像に対応する字形データの種類を選択する選択ステップと、
生成手段が、前記文書画像と、前記文字認識ステップで得た複数の文字コードと、前記複数の文字コードに対応する文字を描画する際に複数の異なる文字コードで共通利用させるための前記複数種類の字形データと、前記複数の文字コードの描画の際に使用する字形データの種類を示すデータと、各文字行の1番目の文字コードの描画開始位置のデータと、各文字行の高さに基づいて定められる各文字行のフォントサイズのデータとを格納した電子文書を生成する生成ステップと、
送信手段が、前記生成ステップで生成した電子文書を、指定された送信先へ送信する送信ステップと、を有し、
前記電子文書に格納される、前記複数の文字コードの描画の際に使用する字形データの種類を示すデータは、前記文書画像内の各文字画像に対して前記選択ステップで選択された字形データの種類に基づいて記述され、
前記各文字行における2番目以降の文字コードそれぞれの描画開始位置は、その文字コードの1つ前の文字コードの描画開始位置と、前記電子文書に格納されている各文字行のフォントサイズのデータと、該1つ前の文字コードの描画の際に使用する字形データの種類を示すデータとに基づいて計算されることを特徴とする画像処理方法。 - 文字認識手段が、文書画像内の複数の文字画像に対して文字認識処理を行うことにより、それぞれの文字画像に対応する文字コードを得る文字認識ステップと、
選択手段が、幅の異なる複数種類の字形データの中から、前記文書画像内の各文字画像の文字送り幅と該各文字画像が含まれる各文字行の高さとに基づいて、各文字画像に対応する字形データの種類を選択する選択ステップと、
生成手段が、前記文書画像と、前記文字認識ステップで得た複数の文字コードと、前記複数の文字コードに対応する文字を描画する際に複数の異なる文字コードで共通利用させるための前記複数種類の字形データと、前記複数の文字コードの描画の際に使用する字形データの種類を示すデータと、各文字行の1番目の文字コードの描画開始位置のデータと、各文字行の高さに基づいて定められる各文字行のフォントサイズのデータとを格納した電子文書を生成する生成ステップと、
送信手段が、前記生成ステップで生成した電子文書を、指定された送信先へ送信する送信ステップと、を有し、
前記電子文書に格納される、前記複数の文字コードの描画の際に使用する字形データの種類を示すデータは、前記文書画像内の各文字画像に対して前記選択ステップで選択された字形データの種類に基づいて記述され、
前記各文字行における2番目以降の文字コードそれぞれの描画開始位置は、その文字コードの1つ前の文字コードの描画開始位置と、前記電子文書に格納されている各文字行のフォントサイズのデータと、該1つ前の文字コードの描画の際に使用する字形データの種類を示すデータとに基づいて計算されることを特徴とする画像処理方法。 - コンピュータを、
文書画像内の複数の文字画像に対して文字認識処理を行うことにより、それぞれの文字画像に対応する文字コードを得る文字認識手段、
幅の異なる複数種類の字形データの中から、前記文書画像内の各文字画像の文字の幅と該各文字画像が含まれる各文字行の高さとに基づいて、各文字画像に対応する字形データの種類を選択する選択手段、
前記文書画像と、前記文字認識手段で得た複数の文字コードと、前記複数の文字コードに対応する文字を描画する際に複数の異なる文字コードで共通利用させるための前記複数種類の字形データと、前記複数の文字コードの描画の際に使用する字形データの種類を示すデータ、各文字行の1番目の文字コードの描画開始位置のデータと、各文字行の高さに基づいて定められる各文字行のフォントサイズのデータとを格納した電子文書とを生成する生成手段、
前記生成手段で生成した電子文書を、指定された送信先へ送信するように制御する送信手段、
として機能させるための、コンピュータプログラムであって、
前記電子文書に格納される、前記複数の文字コードの描画の際に使用する字形データの種類を示すデータは、前記文書画像内の各文字画像に対して前記選択手段で選択された字形データの種類に基づいて記述され、
前記各文字行における2番目以降の文字コードそれぞれの描画開始位置は、その文字コードの1つ前の文字コードの描画開始位置と、前記電子文書に格納されている各文字行のフォントサイズのデータと、該1つ前の文字コードの描画の際に使用する字形データの種類を示すデータとに基づいて計算されることを特徴とするコンピュータプログラム。 - コンピュータを、
文書画像内の複数の文字画像に対して文字認識処理を行うことにより、それぞれの文字画像に対応する文字コードを得る文字認識手段、
幅の異なる複数種類の字形データの中から、前記文書画像内の各文字画像の文字送り幅と該各文字画像が含まれる各文字行の高さとに基づいて、各文字画像に対応する字形データの種類を選択する選択手段、
前記文書画像と、前記文字認識手段で得た複数の文字コードと、前記複数の文字コードに対応する文字を描画する際に複数の異なる文字コードで共通利用させるための前記複数種類の字形データと、前記複数の文字コードの描画の際に使用する字形データの種類を示すデータと、各文字行の1番目の文字コードの描画開始位置のデータと、各文字行の高さに基づいて定められる各文字行のフォントサイズのデータとを格納した電子文書を生成する生成手段、
前記生成手段で生成した電子文書を、指定された送信先へ送信するように制御する送信手段、
として機能させるための、コンピュータプログラムであって、
前記電子文書に格納される、前記複数の文字コードの描画の際に使用する字形データの種類を示すデータは、前記文書画像内の各文字画像に対して前記選択手段で選択された字形データの種類に基づいて記述され、
前記各文字行における2番目以降の文字コードそれぞれの描画開始位置は、その文字コードの1つ前の文字コードの描画開始位置と、前記電子文書に格納されている各文字行のフォントサイズのデータと、該1つ前の文字コードの描画の際に使用する字形データの種類を示すデータとに基づいて計算されることを特徴とするコンピュータプログラム。 - 請求項15または16のいずれかに記載のコンピュータプログラムを記憶した、コンピュータ読取可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010193846A JP5197694B2 (ja) | 2010-08-31 | 2010-08-31 | 画像処理装置、画像処理方法、コンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010193846A JP5197694B2 (ja) | 2010-08-31 | 2010-08-31 | 画像処理装置、画像処理方法、コンピュータプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007172737A Division JP4590433B2 (ja) | 2007-06-29 | 2007-06-29 | 画像処理装置、画像処理方法、コンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011040075A JP2011040075A (ja) | 2011-02-24 |
JP5197694B2 true JP5197694B2 (ja) | 2013-05-15 |
Family
ID=43767699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010193846A Expired - Fee Related JP5197694B2 (ja) | 2010-08-31 | 2010-08-31 | 画像処理装置、画像処理方法、コンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5197694B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9442899B2 (en) | 2013-11-26 | 2016-09-13 | Konica Minolta, Inc. | Image forming apparatus, text data embedding method, and recording medium |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5767549B2 (ja) * | 2011-10-03 | 2015-08-19 | キヤノン株式会社 | 画像処理装置、画像処理方法、およびプログラム |
JP6458351B2 (ja) * | 2014-04-15 | 2019-01-30 | コニカミノルタ株式会社 | 電子文書生成システム、画像形成装置、通信端末およびプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3335844B2 (ja) * | 1996-08-16 | 2002-10-21 | 富士通株式会社 | 文字列方向推定方法および装置 |
US7310769B1 (en) * | 2003-03-12 | 2007-12-18 | Adobe Systems Incorporated | Text encoding using dummy font |
JP4235583B2 (ja) * | 2003-05-26 | 2009-03-11 | 株式会社リコー | 画像処理装置、画像処理用プログラム及び記憶媒体 |
-
2010
- 2010-08-31 JP JP2010193846A patent/JP5197694B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9442899B2 (en) | 2013-11-26 | 2016-09-13 | Konica Minolta, Inc. | Image forming apparatus, text data embedding method, and recording medium |
Also Published As
Publication number | Publication date |
---|---|
JP2011040075A (ja) | 2011-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4590433B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP4402138B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP5376795B2 (ja) | 画像処理装置、画像処理方法、そのプログラム及び記憶媒体 | |
US8320019B2 (en) | Image processing apparatus, image processing method, and computer program thereof | |
JP5274305B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
US8614838B2 (en) | Image processing apparatus and image processing method | |
US8514462B2 (en) | Processing document image including caption region | |
US20100238474A1 (en) | Document image processing apparatus, document image processing method, and computer-readable recording medium having recorded document image processing program | |
JP5197694B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP4892600B2 (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121002 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130205 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160215 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160215 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |