JP2009134579A - 電子データ生成方式 - Google Patents
電子データ生成方式 Download PDFInfo
- Publication number
- JP2009134579A JP2009134579A JP2007310954A JP2007310954A JP2009134579A JP 2009134579 A JP2009134579 A JP 2009134579A JP 2007310954 A JP2007310954 A JP 2007310954A JP 2007310954 A JP2007310954 A JP 2007310954A JP 2009134579 A JP2009134579 A JP 2009134579A
- Authority
- JP
- Japan
- Prior art keywords
- information
- display
- line drawing
- image
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Processing (AREA)
Abstract
【課題】 画像から表示と再利用のどちらにも最適なデータ、より高画質な線画を生成すること。
【解決手段】 画像から抽出したベクトル情報を表示前景層と非表示前景層に分け、さらに入力画像から表示前景層の情報のみを取り除いた表示背景層の3層からなる電子データを生成し、入力画像中の線画領域に対して、輪郭線画ベクトル情報を表示前景層に、細線化線画ベクトル情報を非表示前景層に配置して、表示用途には表示前景層と表示背景層の合成画像を、再利用用途にはすべての層の情報を提供することで、画像から表示と再利用のどちらにも最適なデータを構成する。
【選択図】 図1
【解決手段】 画像から抽出したベクトル情報を表示前景層と非表示前景層に分け、さらに入力画像から表示前景層の情報のみを取り除いた表示背景層の3層からなる電子データを生成し、入力画像中の線画領域に対して、輪郭線画ベクトル情報を表示前景層に、細線化線画ベクトル情報を非表示前景層に配置して、表示用途には表示前景層と表示背景層の合成画像を、再利用用途にはすべての層の情報を提供することで、画像から表示と再利用のどちらにも最適なデータを構成する。
【選択図】 図1
Description
本発明は紙文書を電子的に再利用可能なデータへと変換する技術に関する。
近年、処理能力の高いパーソナルコンピュータが普及することにより、単に文字を打ち込むのみならずフォントや装飾を凝らしたり、また文字だけではなく図を自由に作成したり、あるいは写真等を取りこんだりといった、高度な電子文書を作成することが可能なアプリケーションが日常的に用いられるようになっている。
しかし、作成物の内容が高度になるほど、文書をまったく新規から作成するには大きな労力が必要される。したがってできるだけ過去に作成した文書の一部をそのまま、あるいは加工するなどして編集したものを再利用することが望まれる。
一方、インターネットに代表されるようなネットワークの広がりにより、そのようなアプリケーションで作られた文書が電子的に配布される機会も増えたが、配布先を限定しない、あるいは可搬性や永読性が求められる場合など、電子文書が紙に印刷された状態で配布されることも多い。
そのように紙文書しか手元に存在しない場合でも、その内容を紙から再利用可能なデータとして得られるようにするための技術がこれまでにも存在した。たとえば特許文献1記載の技術では、紙の文書を装置に電子的に読み込ませた際に、その内容と一致する文書をデータベースから検索して取得し、読み込んだ紙面のデータの代わりに利用することができた。また同一の文書がデータベースから特定できなかった場合は、読み込んだ文書の画像をより再利用が容易な電子データへと変換するため、この場合でも文書の内容を再利用することができた。
一方、文書画像に存在するオブジェクトの形状情報を再利用可能容易なデータへと変換する技術としてベクトル化の技術があった。たとえば特許文献2および特許文献3には、二値画像中の連結画素輪郭を関数記述として得る技術が開示されており、これを用いることで文書画像中の文字領域の画像をベクトルデータに変換することが出来た。このデータを文書生成アプリーション中で利用すれば、文字単位の位置やサイズの変更さらに幾何学的変形や色付けなどが容易におこなうことができる。
また、文書画像内の文字の領域、線画の領域、その他自然画や表などの各領域を識別可能な領域識別の手法に関しては、特許文献4にてその技術が開示されている。
特開2004−265384号公報
特許第3026592号公報
特開2005−346137号公報
特開平06−068301号公報
一方、本出願人は、先に二値画像中の線画を交差点で分割し、独立した線および閉曲線からなる部品に分割してそれぞれを関数として記述するベクトル化技術を提案している。この技術を用いて部品単位でベクトル化した線画のデータは、たとえば特許文献2および特許文献3を用いてその全体の輪郭をベクトル化したデータよりも部品単位の再利用性に優れている。たとえば図15(a)の線画をこの技術を用いてベクトル化すると、文書生成アプリーション中では同図(c)のように部品単位に分割した状態でそれぞれを変形したり、色付けすることが可能になる。
また、文書画像存在するオブジェクトの形状情報を再利用可能容易なデータへと変換する技術としては、内部の文字画像を文字コードへと変換する文字認識技術があった。あるいは内部の線画を形状コードに変換する形状認識技術があった。これは入力線画のパターンを図15のようにあらかじめ定められたいくつかの図形のうちひとつに分類することで実現できた。
前記ベクトル化技術や文字認識・形状認識技術を利用して、紙の文書を再利用が容易な記述の電子データに変換してしまえば、紙を保管するよりも効率的に保管しかつ利用することが可能である。
しかしながら、画像を再利用に適したデータに変換した際に、表示上の見た目が元の画像と大きく変わってしまう場合がある。その場合、データを画面上で視認したり、印刷したりした場合に元々の画像と等価な情報が得られないおそれがある。
たとえば前述本出願人によるベクトル化技術で提案しているベクトル化手法を用いると、図15(a)の画像から図15(b)のように線幅が1のベクトル記述データが生成される。このデータは文書編集アプリケーションなどで加工して利用する上では必要十分な情報であるが、表示上の見た目の点では原画像の情報を十分に保持していない。
あるいは同記述データに既存のベクトル化手法に公知の線幅抽出技術を追加して、線幅を持ったデータを生成することも可能であるが、別の画像で線内で幅がランダムに変化する線画があった場合など、その抽出が困難だったり、あるいはベクトル記述的に再現不可能な場合もある。
また、特許文献2および特許文献3のベクトル化手法で画像をベクトル化した場合でも、連結画素内の画素色を得て、ベクトル記述にひとつの色を塗ることは容易であるが、連結画素の周囲と内部で色が異なったり、グラデーションやランダムな色が塗られている場合にはその抽出が困難だったり、ベクトル記述的にも再現不可能な場合がある。
このように、情報抽出力の限界とベクトル記述力の限界の双方の観点から、原画像を再利用性を重視したベクトル記述に変換する場合には、表示の際に重要な見た目の等価性が得られなくなる場合がどうしても存在する。
また、本出願人は、特開2007-272601号公報において、表示に適したベクトルデータと、再利用に適したベクトルデータとを別の層に格納することを提案している。本発明では、更に線画を細線化することにより、線画の表示をより最適におこなえるようにする。
前記課題を解決するために、本発明は、
入力画像から、少なくとも1層の表示前景層と、少なくとも1層の表示背景層と、少なくとも1層の非表示前景層とを持つ、3層以上の層構造を持つ電子データを生成する電子データ生成方式であって、
入力画像中の線画領域に対して、輪郭をベクトル化した輪郭線画ベクトル情報を生成する輪郭線画ベクトル生成手段と、
前記線画領域に対して細線化を施して線ベクトルで構成される細線化線画ベクトル情報を生成する細線化線画ベクトル生成手段とを有し、
前記層構造を生成する際に、入力画像中の文字領域と線画領域の情報を前景情報、それ以外を背景情報に分類する前景情報分類手段と、
前記前景情報を更に文字領域中の情報と線画領域の輪郭線画ベクトル情報を表示前景情報に、線画領域の細線化線画ベクトル情報を非表示前景情報へ分類する表示前景情報分類手段と、
前記表示前景情報の情報を前記表示前景層に、前記背景情報を前記表示背景層に、前記非表示前景情報の情報を前記非表示前景層にそれぞれ配置する情報配置手段と、
を備える。
入力画像から、少なくとも1層の表示前景層と、少なくとも1層の表示背景層と、少なくとも1層の非表示前景層とを持つ、3層以上の層構造を持つ電子データを生成する電子データ生成方式であって、
入力画像中の線画領域に対して、輪郭をベクトル化した輪郭線画ベクトル情報を生成する輪郭線画ベクトル生成手段と、
前記線画領域に対して細線化を施して線ベクトルで構成される細線化線画ベクトル情報を生成する細線化線画ベクトル生成手段とを有し、
前記層構造を生成する際に、入力画像中の文字領域と線画領域の情報を前景情報、それ以外を背景情報に分類する前景情報分類手段と、
前記前景情報を更に文字領域中の情報と線画領域の輪郭線画ベクトル情報を表示前景情報に、線画領域の細線化線画ベクトル情報を非表示前景情報へ分類する表示前景情報分類手段と、
前記表示前景情報の情報を前記表示前景層に、前記背景情報を前記表示背景層に、前記非表示前景情報の情報を前記非表示前景層にそれぞれ配置する情報配置手段と、
を備える。
本発明によれば、画像を再利用に適したベクトルデータに変換する際に、表示にも再利用にも適したデータを生成し、より高画質な線画データを得ることが可能になる。
次に、本発明の詳細を実施例の記述に従って説明する。
図1は本実施例1を用いたシステム構成を示す図の一例である。100は本発明の電子データ生成方式を具備する画像生成装置の例であり、読みとった文書の紙面情報を画像のデータに変換するスキャナ101を備え、画像データに定められた処理を施すプログラムを実行するCPU102、同プログラムを実行し結果や途中のデータを保存するためのメモリ103およびハードディスク104、同プログラムによって生成されたデータを装置外に出力するネットワークI/Fから成る。120のパーソナルコンピュータ装置は、100とLAN110などのネットワークで接続され、100から送信されたデータを受信する装置の一例である。120はこの受信データを表示プロラグム121によって画面に表示したり、受信データの一部を再利用プログラム122によって別の編集アプリにて利用したりすることが可能である。
図2は本実施例1の動作を説明する図である。200はスキャナ101によって入力された画像であり、210はこの入力画像に対し本発明の電子データ生成方式を実施するプログラムのブロック構成、220は同方式によって生成される電子データを示している。
電子データ生成方式210を構成する各ブロックは以下のとおりである。211は入力された文書画像中から文字、自然画、線画などの領域を識別し領域情報として出力する領域識別部、212は領域識別部の領域情報から文字領域の情報を選出する文字領域選出部、213は領域識別部の領域情報から線画領域の情報を選出する線画領域選出部、214はカラーまたはグレーの多値入力画像を白黒の二値画像に変換する二値化部、215は文字領域の二値画像から各文字の輪郭情報を抽出し、ベクトル描画関数に変換する文字ベクトル化部、216は線画領域の二値画像から線画の輪郭情報を抽出し、ベクトル描画関数に変換する線画輪郭ベクトル化部、217は線画領域の二値画像から線画の線素情報を抽出し、ベクトル描画関数に変換する線画細線化ベクトル化部、218は文字領域内や線画領域内で前景に相当する画素情報を入力多値画像上で近傍周辺と同色にすることで塗り潰す前景情報塗り潰し部、219は前景情報が塗り潰された多値画像を背景として圧縮する背景圧縮部、である。
電子データ生成方式210によって生成される電子データ220を構成する要素は以下のとおりである。221は生成電子データ中で表示前景層を構成する情報であり、本例では215文字ベクトル化部で生成されたベクトル描画関数群の記述と216線画輪郭ベクトル化部で生成されたベクトル描画関数群の記述である。222は生成電子データ中で表示背景層を構成する情報であり、本例では219背景圧縮部によって生成された背景画像の圧縮データ記述である。223は生成電子データ中で非表示前景層を構成する情報であり、本例では217線画細線化ベクトル化部で生成されたベクトル描画関数群の記述である。
本発明の実施例1の動作を図3のフローチャートを用いて説明する。
ステップS301では、101スキャナで読みとった文書の画像データを入力する。ここで画像データは24bitRGBカラーとする。なお、この画像データは16bitカラーであったり、YCbCrであったり、または8bitグレーだったりしてもよい。ここでは例えば、図4のような文書が入力されたとする。図中401および402には黒文字、403には黒線画、404には自然画が描かれているものとする。またこれらの下地には薄いグレーの背景405が描かれているものとする。
ステップS302では、214二値化部が入力多値画像を公知の二値化手法により二値化し、白黒の二値画像を生成する。二値化は画像中の文字や線画、自然画など前景にあたる画素が黒に、それ以外の背景画素が白になるようにおこなう。このような二値化は、たとえば多値画像の輝度ヒストグラムを取得し、それらのピークから適応的に求めた閾値を用いる二値化方式が良く行われている。例えば図4の多値画像から図5の輝度ヒストグラムが作成された場合、輝度の高いピークを背景下地の画素集合とみなし、それより低い値を閾値として選ぶことで、図6のような二値化結果を得ることができる。
ステップS303では、211領域識別部が公知の領域識別手法を用いて入力画像中の文字や線画、自然画などの領域を識別し領域情報を生成する。領域情報とは、画像内での領域四辺を特定する座標情報、および領域種別を表す属性情報である。例えば、図4のような入力画像から、図7の701〜704のような4領域の情報が生成される。701と702は文字領域、703は線画領域、704は自然画領域である。
なお領域識別手法には、入力多値画像をそのまま解析する手法や、二値化した画像を解析する手法、あるいは微分エッジ情報などを生成して解析する手法などがあるが、そのいずれを用いてもよい。以下に具体例として、ステップS302で生成されるような二値画像を利用して領域識別をおこなう方法について説明する。
前述本出願人によるベクトル化技術記載の領域識別処理によれば、画像データを文字、線画、写真などの自然画、表、などの文書的、形状的な特徴で分類された領域へと分割することができる。
具体的には、先ず二値画像に対して8連結の黒画素輪郭追跡をおこなって黒画素の塊を抽出する。ここで面積の大きい黒画素の塊についてはその内部から4連結の白画素輪郭追跡をおこなって白画素の塊を抽出し、さらに一定面積以上の白画素の塊の内部からは再び黒画素輪郭追跡をおこなって黒画素の塊を抽出する。
続いて、得られた黒画素の塊を大きさや形状、密度などで分類し、必要であればグループ化して文字/図画/写真/線/表など異なる属性を持つ領域へ分類していく。たとえば、縦横比が1に近く、大きさが定められた範囲のものを文字相当の画素塊とし、そのような文字相当の画素塊が互いに近接して整列良くグループ化が可能な部分を文字領域と判定する。それらを除いた黒画素塊のうち、一定以上扁平な画素塊は単独で線領域、一定大きさ以上でかつ四角系の白画素塊を整列よく内包する黒画素塊の占める範囲を枠および表領域とする。残る不定形の画素塊のうち、黒画素密度の低い画素塊を線画領域、それ以外の画素塊および小画素塊が散在している部分をグループ化した領域を自然画領域と判定してゆく。
図9に、多値画像図9(A)とその二値化画像図9(B)、および同公報記載に領域識別処理によって図9(B)に対し領域識別をおこなった結果図9(C)の例を示す。図9(C)中の901、903、904が文字、902が自然画、905が線画、906が表と識別された領域である。
続くステップS304からステップS311までの処理は、抽出された領域情報の各領域に対して順に注目して処理していくものとする。
ステップS304では212文字領域選出部が、注目領域が文字領域であるかどうかを調べる。ステップS303で生成された領域情報はその種別を属性として持っているので、ここではその属性が文字であるかどうかを調べるだけである。文字であればステップS305に、文字でなければステップS307に進む。
ステップS305では215文字ベクトル化部が、公知の二値画像ベクトル化技術を用い、注目領域内部の文字に対して文字ベクトル情報を生成する。前記二値画像ベクトル化技術の例として、特許文献2および特許文献3に開示されている方法がある。
特許文献2は、二値画像をラスタ走査しながら注目画素とその近傍画素の状態に基づいて、水平方向及び垂直方向の画素間ベクトルを検出し、これら画素間ベクトル同士の接続状態をもとに、画像データの輪郭を抽出することで、アウトラインベクトルと呼ばれる連結画素データの周回を画素間ベクトルの集合で記述する情報を生成する技術を開示している。特許文献3はさらに、このアウトラインベクトルを直線や2次や3次のベジェ曲線で近似することで、大きく変倍しても高画質なベクトル記述データをする技術を開示している。
ベクトル化対象となる文字は、二値画像内で黒色の連結画素の集合として存在しているので、前記特許文献2の技術により各文字からその輪郭をなす画素間のベクトル集合であるアウトラインベクトルが抽出され、さらに特許文献3の技術により直線および曲線の関数集合であらわされるベクトル記述へと変換される。なお、文字色が黒以外の場合に対応するために、連結画素毎に同画素群の色を多値画像から取得し、ベクトル記述に描画色情報として追加してもよい。
ステップS306では218前景情報塗り潰し部が、多値画像の注目領域内部で文字に相当する画素をその周辺画素と同じ色に変更する。例えば図4の文字領域に対し前景情報塗り潰し処理をおこなった結果を図8(a)に示す。
この塗り潰し処理はたとえば以下のようにおこなえばよい。まず多値画像上の注目領域内をさらにN×M画素のブロックに分割する。N、Mは任意の整数であるが、ここではたとえばN=M=16とする。次に各ブロック内で、前景以外の画素値平均を求める。ここで前景画素とはステップS302で生成された二値画像上の黒画素のことであるから、同二値画像上で各ブロック内で黒画素以外、すなわち各白画素について、同画素に対応する多値画像上の画素値をカウントして画素数で割れば求める平均値が得られる。そして今度はブロック内の二値画像上黒画素に対応する多値画像上の画素をこの平均の画素値で埋める。
以上の処理を領域内の全ブロックに対しておこなえば、領域内の前景画素情報を取り去ったのと同じ状態の多値画像が生成できる。もしもブロック内で十分に前景以外の画素値平均が得られなかったら、そのブロックには隣接する既抽出済の平均値を用いればよい。なお、スキャン時のぼけなどで多値画像上の前景の境界が鋭敏でない場合には、二値画像に太らせ処理をしてから上記の処理をおこなうと、処理領域をより平坦な背景面にすることもできる。
ステップS307では212線画領域選出部が、注目領域が線画領域であるかどうかを調べる。線画であればステップS308に、線画でなければステップS311に進む。
ステップS308では、ステップS305と同様にして、公知の二値画像ベクトル化技術を用いて輪郭ベクトル情報を生成する。図14に輪郭ベクトル化の元になる二値画像図14(a)と、輪郭ベクトル化結果のベクトル記述図14(b)を示す。この記述はひとつの外輪郭と3つの内輪郭で構成されている。また、このベクトル記述における線は輪郭ベクトルの間の塗り潰しとして表現されているため、表示上の品質は、元の画像に忠実である。
ステップS309では217線画細線化ベクトル化部が、注目領域内部の細線化線画ベクトル情報を生成する。線画ベクトル情報生成技術としては、前述本出願人によるベクトル化技術で提案している二値画像ベクトル化技術を用いればよい。前述本出願人によるベクトル化技術では、二値画像を細線化方法によりすべての線が幅1になるまで細線化した画像から端点や交差点を検出し、それらの点間をつなぐ独立した線や閉曲線から幅0に芯線化された端点間のベクトル列を生成し、さらにそれらの端点が保存されるように補助ベクトルを挿入してから関数化をおこなっている。
ベクトル化対象となる線画は、この前述本出願人によるベクトル化技術の技術により、その端点と交差点間をむすぶ独立した線および閉曲線である線素に分割され、それぞれの線素が幅1の直線および曲線の関数集合であらわされるベクトル記述へと変換される。
図15に細線化ベクトル化の元になる二値画像図15(a)と、ベクトル化結果図15(b)、およびそれらを線素に分割した状態を明示した例図15(c)を示す。
図14の輪郭ベクトル化した結果と比較すると、輪郭ベクトル化した結果は、ひとつの外輪郭と3つの内輪郭で構成されているため、図15(c)のように部品単位に分割することはできない。またこのベクトル記述における線は輪郭ベクトルの間の塗り潰しとして表現されているため、形を自由に変形させることも難しい。したがって、図15(c)の方が再利用時の加工編集に対して優れていると言える。しかし、図15(c)は図15(a)にあった線の太さの情報を保存していないため、表示上の品質では図14(b)の方が原画像に忠実であると言える。
図3に戻り、ステップS310では、前記ステップS306と同様にして、218前景情報塗り潰し部が、多値画像の注目領域内部で線画に相当する画素をその周辺画素と同じ色に変更する。例えば図8(a)の線画領域に対し前景情報塗り潰し処理をおこなった結果を図8(b)に示す。
ステップS311では、領域情報のすべての領域を処理したかどうかを調べ、処理済ならステップS312に進む。未処理の領域があるならその領域を注目領域としてステップS304からやり直す。
ステップS312では、218背景圧縮部が多値画像の圧縮データを生成する。圧縮方式は公知の手法を用いる。ここではJPEG方式を用いるものとする。
ステップS313では、ステップS309で生成された細線化線画ベクトル情報を図2の223非表示前景層情報、ステップS312で生成された背景圧縮データを図2の222表示背景層情報、ステップS305で生成された文字ベクトル情報とステップS308で生成された輪郭線画ベクトル情報を図2の221表示前景層情報として出力電子データ220を生成する。
出力電子データは、曲線、直線、塗り潰しなどの記述が可能なベクトル描画記述と、指定されたJPEG画像データの描画が可能な画像描画記述が可能なグラフィック言語により記述される。
図10は架空のXML方式グラフィック記述言語で出力電子データを記述した例である。図10の1001は、図2の223非表示前景層情報に相当する細線化線画ベクトルの記述情報であり、具体的には、座標点列とそれらを結ぶ曲線、直線など関数種類を指定するpathという要素で構成される。1002は図2の222表示背景層情報に相当する背景画像の圧縮コードであり、具体的にはASCII文字列に変換した圧縮画像データを有すimageという要素から成る。1003は図2の221表示前景層情報に相当する文字ベクトルの記述情報と輪郭線画ベクトルの記述情報である。具体的には線画同様に座標点列とそれらを結ぶ曲線、直線など関数種類を指定するpath要素で構成される。
以上説明した電子データ生成方式210によって生成された電子データ220を、たとえば図1のパーソナルコンピュータ120が受信し、同120で表示用途、または再利用用途に供した場合について説明する。
まず表示用途に対しては、パーソナルコンピュータ120が実行する表示プログラム121が、図10のようなグラフィック記述に則して表示用の画像データを生成する。この描画の様子を模式的に表したのが図11である。先ず図10の細線化線画のグラフィック1001が、1101に相当する1ページ大の白紙の上に描画され、続いて背景の画像1002がその上の1102として描画され、最後に文字と輪郭線画のグラフィック1003が最上位の1103として描画されている。ここで1103は1ページ全体に及ぶ非等価なデータであるので、表示の際に1101の情報はすべて隠れてしまい表示されることはない。
図12は表示プログラムを具備するアプリケーション画面の例である。上記説明のとおり、図10の背景画像情報1002に文字ベクトル情報と線画ベクトル情報1003を重ねて描画した状態の画像が表示されている。
一方再利用用途に対しては、パーソナルコンピュータ120が実行する再利用プログラム122が、図10のようなグラフィック記述に則して再利用可能なデータを生成する。
図13は再利用プログラムを具備するアプリケーション画面の例である。このアプリケーションは、グラフィックを記述する電子データを読み込んで画面に表示し、その情報の一部あるいは全部をユーザがマウス等の操作によって選択することで、選択部分に対応するグラフィックデータを別のアプリケーションなどに転送し、そこで編集などに再利用可能とする機能を有す。
ここで入力される電子データ220の例として、図10のグラフィック記述データを入力した場合、図13のアプリケーションが表示するのは、図12と同様にグラフィック情報1001、1002、1003をすべて順に描くにことにより生ずる画面1301の他、背景画像情報1002のみを描画する画面1302、前景画像情報1003のみを描画する画面1303、非表示前景画像情報1001のみを描画する画面1307があって、これらはユーザの操作に従って選択的に表示することが可能である。そして画面1303に表示されている文字1304、1305、線画1306は元となるグラフィックデータの記述単位で選択し、別の文書編集アプリケーションに転送することが可能である。
電子データ220から、ユーザが画面1307から線画部分1308を選んで再利用する場合、図10のグラフィック記述であれば細線化線画ベクトル情報1001が利用される。このグラフィック記述は、図3のステップS308が生成した、線画を細線化し線素に分解した状態のグラフィック情報であるため、前述のとおり加工など編集が容易である。その反面、細線化の影響により、図15のように見た目が元データと一致しない場合がある。
一方、電子データ220を図12の表示アプリケーションで表示した場合には、前述のとおり細線化線画ベクトル情報1001のグラフィック記述は前景画像情報1003に覆い隠され、実際に表示されるのは背景画像上に残された線画部分の画像データであるから、当該部分に対しスキャンされた入力画像に忠実な情報を表示することができる。
すなわち、本発明の実施例1によれば、線画のベクトル化記述として細線化した線素で構成されるベクトル記述を用いた場合でも、表示と再利用の両方に適したデータが生成される。
なお、図10のグラフィック記述はあくまで一例であり、同じような記述仕様を持つ他のグラフィック記述言語を用いてもよい。たとえばSVGやPDFなどを用いても同じ効果が得られる。
以上説明したように、本発明の実施例1によれば、スキャンした文書の画像から、前景情報として文字部をベクトル化した情報と線画部を輪郭ベクトル化した情報を抽出し、背景情報として原画像から前景の文字部と線画部の情報を周辺画素によって塗り潰し圧縮を施した画像を抽出し、それらを非表示前景の線画部の細線化ベクトル、表示背景の背景画像、表示前景の文字ベクトルと輪郭線画ベクトルの順に描画するグラフィック記述からなる電子データへと変換する。
かように生成された電子データは、文字、線画部を編集利用に適するよう、それぞれベクトル化する際に特に線画部は細線化された画像からベクトル化をおこなっているので、編集用途に優れている。一方で、同電子データを表示用途に用いる際に、同線画部分に対し編集用に細線化されたベクトル記述ではなく、また前景画像層に配置していて原画像相当の画像情報が表示されるので、表示の品質は維持されている。すなわち、表示と再利用の両方に適する電子データを生成することが可能である。
Claims (2)
- 入力画像から、少なくとも1層の表示前景層と、少なくとも1層の表示背景層と、少なくとも1層の非表示前景層とを持つ、3層以上の層構造を持つ電子データを生成する電子データ生成方式であって、
入力画像中の線画領域に対して、輪郭をベクトル化した輪郭線画ベクトル情報を生成する輪郭線画ベクトル生成手段と、
前記線画領域に対して細線化を施して線ベクトルで構成される細線化線画ベクトル情報を生成する細線化線画ベクトル生成手段とを有し、
前記層構造を生成する際に、入力画像中の文字領域と線画領域の情報を前景情報、それ以外を背景情報に分類する前景情報分類手段と、
前記前景情報を更に文字領域中の情報と線画領域の輪郭線画ベクトル情報を表示前景情報に、線画領域の細線化線画ベクトル情報を非表示前景情報へ分類する表示前景情報分類手段と、
前記表示前景情報の情報を前記表示前景層に、前記背景情報を前記表示背景層に、前記非表示前景情報の情報を前記非表示前景層にそれぞれ配置する情報配置手段と、
を備えることを特徴とする電子データ生成方式。 - 請求項1における電子データ生成方式であって、
前記電子データは、表示前景層および非表示前景層のデータはベクトルデータで記述し、表示背景層のデータは入力画像から前記表示前景層の情報を除いた画像データで記述することを特徴とする電子データ生成方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007310954A JP2009134579A (ja) | 2007-11-30 | 2007-11-30 | 電子データ生成方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007310954A JP2009134579A (ja) | 2007-11-30 | 2007-11-30 | 電子データ生成方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009134579A true JP2009134579A (ja) | 2009-06-18 |
Family
ID=40866393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007310954A Pending JP2009134579A (ja) | 2007-11-30 | 2007-11-30 | 電子データ生成方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009134579A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2309446A3 (en) * | 2009-09-18 | 2015-05-06 | Canon Kabushiki Kaisha | Image processing apparatus, control method and program |
-
2007
- 2007-11-30 JP JP2007310954A patent/JP2009134579A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2309446A3 (en) * | 2009-09-18 | 2015-05-06 | Canon Kabushiki Kaisha | Image processing apparatus, control method and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4764231B2 (ja) | 画像処理装置、制御方法、コンピュータプログラム | |
WO2018223994A1 (zh) | 中文打印字符图像合成方法及装置 | |
JP6139396B2 (ja) | 文書を表す二値画像を圧縮する方法及びプログラム | |
US8417029B2 (en) | Image processing apparatus and method, including fill-up processing | |
US10477063B2 (en) | Character detection and binarization | |
EP2270714A2 (en) | Image processing device and image processing method | |
JP2008257670A (ja) | 画像文書の検索装置、画像文書の検索方法、プログラム、及び記録媒体 | |
US8270037B2 (en) | Digital watermark embedding apparatus and digital watermark detecting apparatus | |
JP2008176521A (ja) | パターン分離抽出プログラム、パターン分離抽出装置及びパターン分離抽出方法 | |
JP4582204B2 (ja) | 画像処理装置、画像変換方法、およびコンピュータプログラム | |
WO2018151043A1 (ja) | 画像処理方法、及びコンピュータプログラム | |
JP2002165105A (ja) | 画像処理装置及びその方法並びに記憶媒体 | |
JP4582200B2 (ja) | 画像処理装置、画像変換方法、およびコンピュータプログラム | |
JP2003244447A (ja) | 画像処理装置及び画像処理方法 | |
JP4441300B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体 | |
JP2006345314A (ja) | 画像処理装置および画像処理方法 | |
JP2009134579A (ja) | 電子データ生成方式 | |
JP5824309B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP2005175641A (ja) | 画像処理装置 | |
JP2006054817A (ja) | ドキュメント処理装置 | |
JP4228905B2 (ja) | 画像処理装置及びプログラム | |
JP5424785B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
Kurilin et al. | Generation of PDF with vector symbols from scanned document | |
JP4736489B2 (ja) | 画像処理装置 | |
JP4193687B2 (ja) | 画像処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Effective date: 20100201 Free format text: JAPANESE INTERMEDIATE CODE: A7424 |
|
RD01 | Notification of change of attorney |
Effective date: 20100630 Free format text: JAPANESE INTERMEDIATE CODE: A7421 |