JP2001216523A - 画像処理方法 - Google Patents

画像処理方法

Info

Publication number
JP2001216523A
JP2001216523A JP2000025760A JP2000025760A JP2001216523A JP 2001216523 A JP2001216523 A JP 2001216523A JP 2000025760 A JP2000025760 A JP 2000025760A JP 2000025760 A JP2000025760 A JP 2000025760A JP 2001216523 A JP2001216523 A JP 2001216523A
Authority
JP
Japan
Prior art keywords
image
file
functionalized
authoring
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000025760A
Other languages
English (en)
Inventor
Kazuo Toraichi
和男 寅市
Koichi Wada
耕一 和田
Koichi Mori
浩一 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FLUENCY KENKYUSHO KK
Original Assignee
FLUENCY KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FLUENCY KENKYUSHO KK filed Critical FLUENCY KENKYUSHO KK
Priority to JP2000025760A priority Critical patent/JP2001216523A/ja
Publication of JP2001216523A publication Critical patent/JP2001216523A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 紙文書を高精細なデジタル画像に変換して表
示することができるとともに、インタラクティビティを
高めることができる画像処理方法を提供すること。 【解決手段】 ドローツールによって、ピクセル画像を
関数化画像に変換して描画オブジェクトを作成する。次
に、オーサリングツールによって、描画オブジェクトの
配置位置と描画オブジェクト内で発生する所定のイベン
トの内容に応じて発生させるアクションとが記述された
オーサリングファイルを作成する。作成されたオーサリ
ングファイルに基づいて、ビューワにより、描画オブジ
ェクトに対応した画像の表示を行うとともに、オーサリ
ングファイルに基づいて、所定のイベントが発生した場
合にはその内容に応じたアクションを実行する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、紙面等に印刷され
た画像を高精細なデジタル画像に変換して表示等を行う
画像処理方法に関する。なお、本明細書中では、関数化
図形によって表現された画像を「関数化画像」と称して
説明を行うものとする。
【0002】
【従来の技術】「デジタルコンテンツ」はコンピュータ
で処理ができて表示・再生できるデータのことであると
言えるが、それらを作成・閲覧するアプリケーションや
サービスの総称に使われることもある。具体的には、W
ebページ、動画、楽曲、仮想3次元空間のような擬似
世界、デジタルマガジン、デジタルブックなどに対して
デジタルコンテンツという言葉が用いられていることが
多い。デジタルコンテンツを構成するデータには多種多
様な物が存在するが、ここではデジタルコンテンツの中
でも2次元画像を中心としたデジタルコンテンツに注目
して議論を進める。
【0003】2次元画像を扱うデジタルコンテンツで最
も一般的なものはWebページであるが、近年ではWe
bコンテンツを構成する画像としてベクタ画像が注目さ
れている。しかし、ベクタ画像の作成は熟練を要す上に
既存の紙媒体のコンテンツを活用することもできない。
その上ベクタ画像の特長を活用するような表示形態・イ
ンタラクションも提供しておらず、あまり普及している
とは言えない。
【0004】デジタルコンテンツと既存のメディアによ
るコンテンツとの違いは、(1)インタラクティビテイ
(対話性)、すなわち、ユーザーの操作によって内容が
変化していく機能と、(2)ネットワーク配信、特にイ
ンターネットを介したデジタルコンテンツの配信、の2
つの特徴であると考えられる。
【0005】しかし、このような特徴を活用するために
は、データの形式や出力形態がこれらの特徴を生かすも
のでなければならない。例えば、画像の表示や変形に時
間がかかってしまえば必然的にインタラクティビティは
低下するし、現状ではバンド幅の広いネットワークばか
りではないので画像データのサイズがあまりに大きくな
ってしまっては配信が困難になる。
【0006】出力形態としての要求の一つは多様な出力
デバイスへの対応である。デジタルコンテンツの出力デ
バイスは、携帯端末、テレビ、PC(パーソナルコンピ
ュータ)、プリンタなど多様な解像度を持っているので
一つの画像ファイルで効率よく多様な解像度の出力に対
応できることが望ましい。現在、デジタルコンテンツを
構成する画像としてはピクセル画像が主流となってい
る。ビットマップ画像はスキャナやデジタルカメラを通
して本や写真など実世界に存在するコンテンツを簡単に
取りこむ事ができるという利点がある。しかし、ディス
プレイ画面に表示する程度の解像度であればファイルサ
イズも小さくて済むが、印刷や拡大表示をすることを考
えた場合、解像度とファイルサイズのトレードオフが生
じてしまう。
【0007】そこで最近ではWebのデジタルコンテン
ツ表現方法として、ベクタ画像が注目され始めている。
ベクタ画像を用いる利点としては、(1)ファイルサイ
ズが画像解像度ではなく画像の複雑さで決まる点、特に
高解像度な出力が必要なときはファイルサイズの大きさ
でピクセル画像と比べて有利である点、(2)高品質な
画像を拡大・縮小が可能であり、高精度な印刷が可能
で、出力デバイスの多様化(携帯端末、テレビ、PC、
プリンタなど)に対応可能な点、(3)高品質な変形が
可能である点、(4)単純な図形であれば描画・変形は
高速である点、などが挙げられる。
【0008】多くのフォーマットでは、図形の記述にベ
ジェ曲線のみを用いている。これに対して関数化画像で
は、線分・円弧・自由曲線を使い分けて図形を記述する
ので、より少ないデータで高精度な記述が可能である。
また、テキストファイルのフォーマットを有するものと
比較しても、はるかにコンパクトなファイルサイズであ
り、関数化画像はデジタルコンテンツを構成する画像と
して非常に適していると言える。
【0009】
【発明が解決しようとする課題】ところで、通常のコン
テンツを作成するシステムは、概ね、ドローツールで画
像を作成し、オーサリングツールで配置やアクションを
設定し、そしてWeb等を通して配布され、ビューワで
再生される、という流れになっている。デジタルコンテ
ンツとしてより普及するためには、画像の生成・編集が
簡単であることと、ベクタ画像ならではの表示方法が必
要である。しかし、現在のベクタ画像のデジタルコンテ
ンツシステムでは、画像の作成には熟練を要し、表示・
インタラクションもベクタ画像ならではというものでは
ない。
【0010】現在のベクタ画像を作成するためのドロー
ツールでは、図形はベジェ曲線で構成されており、これ
を編集するには図17のように全ての制御点を設定しな
くてはならない。したがって、べジェ曲線などを自在に
描けるようになるにはかなりの熟練を要し、仮に熟練し
ていても作成には時間がかかってしまう。ビットマップ
画像の場合、スキャナやデジタルカメラからの入力画像
をそのまま利用できるため、コンテンツ作りが簡単であ
ると同時に、紙媒体のコンテンツの活用という点でもベ
クタ画像に比べて優れている。いくつかの描画ツールに
はビットマップ画像からベクタ画像へ変換できる機能が
ついているが、変換精度が低く、結局ツールを用いて修
正する必要があるため、あまり効率は上がらない。
【0011】また、表示方法に関しても、ベクタ画像で
あることを活用しているものは少ないく、アニメーショ
ンを主眼に置いたものでキーフレームアニメーションに
利用している程度である。関数化画像やベクタ画像の表
示に関する特長の一つとして高精度拡大・縮小が挙げら
れる。そのため、ベクタ画像を用いたデジタルコンテン
ツにはほぼ必ずズーム機能が備わっている。しかし、実
際に作られているコンテンツを見ると積極的にズーム機
能を利用しているものはほとんどない。これは、既存の
ベクタ画像表示のシステムでは定められた倍率でのズー
ム機能しか備わっていないためである。そのような段階
的なズームでは、拡大した際にどの部分を拡大したもの
なのかが非常に把握しづらくなってしまう。
【0012】本発明は、このような点に鑑みて創作され
たものであり、その目的は、紙文書を高精細なデジタル
画像に変換して表示することができるとともに、インタ
ラクティビティを高めることができる画像処理方法を提
供することにある。
【0013】
【課題を解決するための手段】上述した課題を解決する
ために、請求項1の画像処理方法では、ピクセル画像を
関数化画像に変換して描画オブジェクトを作成し、作成
された前記描画オブジェクトの配置位置と前記描画オブ
ジェクト内で発生する所定のイベントの内容に応じて発
生させるアクションとが記述されたオーサリングファイ
ルを作成し、作成された前記オーサリングファイルに基
づいて、前記描画オブジェクトに対応した画像の表示を
行うとともに、前記オーサリングファイルに基づいて、
前記所定のイベントが発生した場合にはその内容に応じ
た前記アクションを実行することを特徴とする。
【0014】
【発明の実施の形態】以下、本発明を適用した一実施形
態のデジタルコンテンツシステムについて、図面を参照
しながら説明する。本実施形態のデジタルコンテンツシ
ステムの特徴は、ピクセル画像(ビットマップ画像)を
高精度にベクタ画像へ変換して利用できることと、画像
をリニアでスムーズなズームを利用したインターフェー
スを有するビューワに表示することである。以下では、
(1)関数化図形を用いたデジタルコンテンツシステム
の概要、(2)関数化画像の再構成と描画に関する手法
と実験、(3)関数化画像のためのインタラクティブビ
ューワ「Fview」の機能と実装、(4)デジタルコ
ンテンツとしての適用例、についてそれぞれ述べてい
く。
【0015】(1)関数化図形を用いたデジタルコンテ
ンツシステムの概要 上述した既存のデジタルコンテンツシステムの欠点を踏
まえ、関数化図形を用いたデジタルコンテンツの概要を
述べる。通常のシステムは概ね、ドローツールで画像を
作成し、オーサリングツールで配置やアクションを設定
し、そしてWeb等を通して配布されビューワで再生さ
れる、という流れになっている。本実施形態のシステム
も似たような構成になっており、画像作成、オーサリン
グ、コンテンツ表示・インタラクションの3つの部分か
らなっている(図1参照)。
【0016】画像作成は、紙文書をスキャナやデジタル
カメラで取り込んだ画像またはペイントツールで描いた
画像を関数化画像に変換する処理を行う。本実施形態に
おけるDynamicProgrammingを用いた
図形関数近似手法は、簡単なシンボルやフォントだけで
なく複雑な文書や図にも適用可能であり、紙媒体の文書
や図を自動処理で簡単にデジタル化できるので、既存の
システムに比べて画像の素材の幅が広がり、作成が容易
になっている。入力画像はカラー画像でもよいが、白黒
画像か色数の少ないカラー画像が望ましく、ディザやア
ンチエイリアスが施された画像は望ましい変換が難し
い。
【0017】オーサリングは、コンテンツの素材として
用いる画像や文章の表示位置、スケールの設定およびイ
ンタラクションに関するイベントやアクションの設定を
行う。本実施形態では、そのようなオーサリングの情報
はオーサリングファイルに書き込む。オーサリングファ
イルで設定できることは、描画オブジェクトを、どこ
に、どの大きさで配置するかということと、描画オブジ
ェクト毎にそのオブジェクト内でどのイベントが起きた
ときにどのアクションを起こすか、といったことであ
る。オーサリングファイルの例を図2に示す。現状のシ
ステムでは特にグラフィカルオーサリングツールを用意
していないので、オーサリングはテキストエディタ等を
用いるか、自動的に生成することになる。
【0018】コンテンツ表示・インタラクションでは、
オーサリングファイルをもとに画像ファイル、サウンド
ファイルなどを読み込んでコンテンツを表示したりイン
タラクションを処理する。コンテンツの利用形態の違い
によりオーサリング、画像作成で作成したファイルの転
送方法は異なる。プレゼンテーションツールのようにロ
ーカルな環境で表示する場合にはファイルシステムから
読み込むことになる。WebコンテンツやWebを利用
したイントラネットアプリケーションなどの場合には、
Webサーバーからファイルを転送する。他にも、メー
ルサービスなどのプッシュ配信によるファイルの転送な
ども考えられる。
【0019】コンテンツの表示・インタラクションは、
関数化画像の特長を十分に活用するようなものである必
要がある。高精度かつ高速な拡大・縮小表示は関数化画
像の特長の一つであるが、リニアでスムーズにズームさ
せることで2次元平面上に一種の奥行き感を持たせ、ズ
ームをインターフェースとして捉えたものに「Zoom
ing User Interface」がある。「Z
ooming User Interface」につい
ては、文献「B.Bederson,J.Hollan,K.Perlin,J.Meyer,
D.Bacon,and F.Furnas.Pad++: A Zoomable Graphical S
ketchpad for Exploring Alternate Interface Physic
s. Journal of Visual Language and Computing,Vol.7,
No.1,pp.3-31,1996 」にその詳細が説明されている。本
実施形態でもこの考え方に基づいてスムーズなズーム機
能を持ったビューワを実装している。
【0020】(2)関数化画像の再構成と描画に関する
手法と実験 デジタルコンテンツにおいては画像の出力は非常に重要
である。ここでは、出力デバイスの解像度とインタラク
ティビティという観点から、関数化画像の再構成と描画
の手法と、その処理時間について行った実験について述
べていく。
【0021】関数化画像を出力するにはファイルに格納
されたデータから輪郭線を再構成すればよいのだが、出
力デバイスの多くがピクセル画像を出力する仕組みにな
っているので最終的にはピクセル画像に変換しなければ
ならない。実際には多くのグラフィック描画ライブラリ
には輪郭を描画(塗りつぶし)する機能が備わっている
ので、通常はその機能を用いて近似関数による図形を輪
郭として出力する。ほとんどの2次元描画ライブラリで
は、最低限ポリゴン描画機能は実装されている。また、
最近の2次元描画ライブラリでは、3次ベジェ曲線を輪
郭のパーツにできるものもあるが、円弧を輪郭のパーツ
として持つことは一般的ではない。
【0022】ここで気をつけなければならないのは、出
力デバイスによって要求が異なるということである。例
えば、プリンタの場合、多少出力に時間をかけてもプリ
ンタの解像度を最大限活かした出力結果が要求される。
これとは対照的に、解像度の低いディスプレイでは高い
表示品質はあまり望めないためプレビュー的な表示が主
目的となる。したがって、表示品質よりも高いインタラ
クティブ性が要求されるので、描画は非常に高速に行わ
れなくてならない。しかし、ディスプレイでも画像の詳
細を見るためには拡大表示する必要があるので、いつで
も低画質でよいわけではなく、デバイスの解像度や拡大
率に合わせて適切な精度でポリゴンを生成し、それを出
力する必要がある。ポリゴンを再構成する処理は近似関
数によって異なるので、以下ではそれぞれの近似関数別
の再構成手法を述べる。
【0023】直線区間では、終点をポリゴンの頂点とし
て加えればよい。円弧区間では、まずデータとして与え
られる始点(一つ前の近似関数の終点)、中点、終点の
3点を通る円弧の半径と円弧の開始角、終了角を算出す
る。描画は開始角から終了角へ向けて円弧を点列として
ポリゴンに加えていくことで行われる。このときにステ
ップ角を調節することで輪郭点の密度を変えることがで
きる(図3(a)参照)。また、自由曲線区間では、x
方向とy方向のそれぞれにおいてスプライン係数と離散
的なBスプラインとの畳み込みを計算して近似輪郭を得
る。畳み込みを計算するときにBスプラインの密度を変
えることで、異なる密度の輪郭点列を構成できる(図3
(b)参照)。実際には多くの描画ライブラリでベジェ
曲線の描画をサポートしているので、その場合には以下
に説明する変換式によりスプライン係数をベジェ曲線の
制御点へ変換して描画することが可能である。
【0024】3次ベジェ曲線は、図4(a)のように通
常4つのパラメータで一つの区間を表す。このパラメー
タをr0 ,r1 ,r2 ,r3 とする。一方、2次Bスプ
ライン曲線は、図4(b)のように3つのスプライン係
数で一つの区間を構成している。この係数をc0 ,c
1 ,c2 とする。変換は、c0 ,c1 ,c2 からr0
1 ,r2 ,r3 を求めることになる。3次ベジェ曲線
は3次関数であるからパラメータを使って表記した3次
式と2次Bスプライン曲線の式を等式でつないだ方程式
が得られる。
【0025】abez3+bbez2+cbezt +r0 =a
spl2+bsplt +cspl ただし、 cbez =3(r1 −r0 )、 bbez =3(r2 −r1 )−cbez 、 abez =r3 −r0 −bbez −cbez 、 aspl =c0 −2c1 +c2 、 bspl =−2c0 +2c1 、 cspl =c0 +c1 、 である。この式は2次の項までしかないので、abez
0となる。この等式が成り立つにはそれぞれの次数の項
の係数が等しい時なので、これを解くと、 r0 =c0 +c1 、 r1 =(c0 +5c1 )/3、 r2 =(5c1 +c2 )/3、 r3 =c1 +c2 、 が得られる。この変換式によって2次Bスプライン曲線
は3次ベジェ曲線に変換される。
【0026】次に、再構成と描画に関する予備実験の結
果について説明する。ここでは、関数化画像ファイルを
読み込んで輪郭を再構成するのに要する時間と、ディス
プレイ画面に画像全体を表示する時間の両方の処理時間
に関して実験を行った。実装には、ローカルに存在する
ファイルを表示・印刷するだけでなく、ネットワークを
介したシステムを想定してJava2(JDK1.2.
2+HotSpot1.0.1)を用いている。Jav
a2を実装に用いる理由としては、クラスライブラリの
豊富さ、メモリ管理の容易さなどによるプログラマビリ
ティの高さ、ネットワークアプリケーション構築の容易
さなどが挙げられる。実行速度もJava登場当時は仮
想マシンでの実行となるために問題とされたが、最近で
はJIT(Just In Time compiler )やその他の手法に
よりネイティブアプリケーションとの性能差はかなり縮
まっている。
【0027】実験環境は、CPUがCeleron(登
録商標)400MHzのPCを用い、OS(オペレーテ
ィングシステム)としてWindows98(登録商
標)を使用した。この実験環境は現時点のPCの性能と
してはローエンドに属する方である。性能の評価は、図
5の5つの文書画像を関数近似した画像に対して処理す
る事で行った。実験では、関数化画像のファイルを読み
込んで輪郭線を再構成する時間と、全ての輪郭線を表示
するのに要する時間を計測した。
【0028】図6の再生時間という項目が、関数化画像
ファイルからデータを読み込んで輪郭線を生成する時間
である。Java2では、閉輪郭の図形は、輪郭にはG
eneralPathというクラスが用意されており、
線分と3次ベジェ曲線が輪郭として登録できる。輪郭線
再構成処理は、0.01秒から0.22秒であり非常に
高速に処理されていることがわかる。再構成にかかる時
間は、領域数との相関係数が0.97となりほぼ比例関
係になっており、複雑な画像ほど再構成に時間がかかっ
ていることが分かる。
【0029】図6の描画時間という項目は、関数化画像
全体の表示に要する時間を示している。描画時間は、
0.04秒から0.55秒であった。この程度の高速描
画であれば、リアルタイムに描画を行わないアプリケー
ションであれば応答性は十分であるといえる。描画する
図形の個数と描画時間の関係は相関関数が0.98とな
りほぼ比例している。
【0030】この実験では、関数化画像全体の表示にす
るという条件で実験したが、拡大した場合には画面上に
現れない描画不要な輪郭が増加するので描画時間は大き
く短縮される。また、描画対象の領域を大きくすると、
逆に描画時間は増加してしまう。描画時間はグラフィッ
クアクセラレータ、CPU速度などのハードウェアだけ
でなくライブラリの実装方法の違いによって大きく変わ
ってしまうため、ここでの実験の結果を全ての実行環境
に当てはめて考えることはできない。しかし、実験に用
いた環境は現時点のPCとしては一般的な構成であり、
PC上で実行するのであれば十分参考になる結果であ
る。
【0031】この実験ではJava2で実装して実験を
行ったが、Javaでは描画機能に関しては近年のグラ
フィックアクセラレータに合わせて最適化されたもので
はないので、やはりネイティブな実行環境に比べどうし
ても実行速度の面で劣るはずである。しかも実験で用い
た画像は輪郭数も多く複雑な文書画像が多かったが、そ
れにもかかわらず高速な再構成・描画が達成されている
ことが確認できた。あまり頻繁に再構成処理、描画が発
生しないアプリケーションでとしては十分な応答が得ら
れるはずである。
【0032】しかし、描画に関してはリアルタイムな描
画を必要とする場合には必ずしも十分とは言えない結果
であった。例えば、文献「Ben Bederson and Jon Meye
r.Implementing a zooming User Interface: experienc
e building Pad++. Software:Practice and Experienc
e, Vol.28,No.10,pp.1079-1099,1998」では、スムーズ
なズームのためには10fps(frame per second)は
必要であるとしている。これに当てはめると、今回の結
果から複雑な画像の場合や、簡単な画像でも多数の画像
を描画しなければならない場合にはスムーズなズームは
実現できないことになる。Javaはクロスプラットフ
ォームでの互換性を重視しているので、特定のグラフィ
ックカードに適した最適化が行われるとは考えにくい。
したがってスムーズなズームのためにはハードウェアに
よる支援よりも、アルゴリズムの工夫が必要になってく
る。
【0033】(3)関数化画像のためのインタラクティ
ブビューワ「Fview」の機能と実装 関数化画像のためのインタラクティブビューワ「Fvi
ew」は、デジタルコンテンツシステムにおいて、コン
テンツを表示し、インタラクションを処理するアプリケ
ーションである。表示するオブジェクトやインタラクシ
ョンに関する設定はオーサリングファイルに書かれてい
るので、Fviewは画像ファイルと共に読み込んで動
作する。この時、ネットワーク経由で読み込むことでネ
ットワーク配信が実現される。Fviewのインターフ
ェースは、Zooming User Interfa
ceの考え方を元にしてスムーズでリニアなズームを基
本にいくつかの独自の付加機能を持っている。
【0034】次に、Fviewに実装されている機能の
詳細を述べる。Fviewで扱える画像は、関数化画
像、ピクセル画像、テキストなどでサウンドも扱えるよ
うになっている。関数化画像は文書画像など複雑なもの
も想定しているので、高速で粗い描画と詳細な描画を使
い分けて、インタラクティビティと高画質を両立させて
いる。Fviewでのインタラクションとしては、ズー
ム、パン、リンク機能が実装されている。ズームは拡大
・縮小であり、パンはスクロール機能のように拡大率そ
のままに表示領域を移動させる機能である。リンク機能
はFview内の別の領域へのジャンプ&ズームであ
り、実際には図7のように、リンクをたどる操作がなさ
れるとリンク先の領域が画面に収まるようにパンとズー
ムが起こることで処理される。
【0035】ズーミング関数化画像ビューワに要求され
ることは、(1)Webブラウザでの使用、(2)基本
的にマウスのみでの操作、(3)自在かつスムーズなズ
ーム、のようなことである。(1)の実現のために、F
viewは、Java2を用いて実装している。操作方
法は図8に図示したとおりで、マウスの左ボタンを押し
ながらドラッグすることで画面のパンを行い(図8
(a)参照)、右ボタンを押すことでズームイン(図8
(c)参照)、シフト+右ボタンでズームアウトする
(図8(d)参照)。その他リンク機能、印刷、リンク
バックなどは左ボタンをクリックすることで起動する
(図8(b)参照)。ズームアウトは、3つボタンマウ
スであれば真中ボタンを割り当ててもよいのだが、PC
では3つボタンマウスはあまり一般的ではないのでこの
ような操作系になっている。
【0036】その他の機能として、簡単なナビゲーショ
ン機能と印刷機能がある。スムーズなズームによりどこ
を表示しているかわからなくなることは減るが完全では
ない。そこでホーム領域を設け、homeキーを押すこ
とで確実にホーム領域へ戻れるようになっている。また
リンク機能により意味のあるつながりを持たせることが
できるが、ユーザーの操作によって移動・ズームしてい
ないのでどこを表示しているのかがわからなくなってし
まう。リンク先に逆にたどるリンクを作っておけばよい
がオーサリングが煩雑になってしまう。そこで、最も最
近たどったリンクの元のリンクへ戻る「リンクバックボ
タン」を用意している。
【0037】次に、オーサリングファイルについて説明
する。現在、オーサリングファイルで設定可能なイベン
トは、(1)マウスカーソルが描画オブジェクト領域内
に入った、(2)マウスカーソルが描画オブジェクト領
域から出た、(3)描画オブジェクト領域内でクリック
された、の3種類である。また、登録可能なアクション
は、現在のところ、(1)リンク(別の描画オブジェク
トへフォーカスを移す)、(2)サウンドを出す、の2
種類である。オーサリングファイルの構文は非常にシン
プルで、1文字目の記号によって登録内容が決まるよう
になっている。詳細は図9に示すとおりである。
【0038】次に、Fviewの実装について説明す
る。実行時のモジュール構成は図10のようになってい
る。fviewCoreはCanvasのサブクラスで
あり、実際に表示される領域であると同時にFview
の全ての機能を有するものである。したがって、コンテ
ナを用意し、そこにfviewCoreをaddしオー
サリングファイルを読み込ませるだけで、独立したアプ
リケーションとしてもアプレットとしても動作させるこ
とが容易にできるようになっている。fviewCor
e内の主なモジュールは、オーサリングファイルの読み
込みと解析を行い描画オブジェクトを生成するFile
Decoder、描画処理を行うDrawingHan
dler、イベント処理を行うActionHandl
er、の3つである。
【0039】FileDecoderが読み込むオーサ
リングファイルは、基本的に、どの描画オブジェクト
を、どこに、どの大きさで配置するか、ということを設
定するものであり、ファイルの内容の詳細は既に述べ
た。FileDecoderではオーサリングファイル
の内容にしたがって描画オブジェクトを生成するが、画
像ファイルのデコードはそれぞれの描画オブジェクトの
クラスに任されている。そして、JPEG(Joint Phot
ographic Expert Group )や関数化画像のように読み込
み・デコードに時間がかかる恐れのある描画オブジェク
トのクラスでは、別のスレッドを起動してバックグラン
ドで読み込み・デコードを行うようになっている。
【0040】全ての動作はユーザーの操作によって発生
するイベントを処理することで行われる。動作にかかわ
るイベントとしては、マウスカーソルの移動、マウスボ
タンの押下、ウィンドウのサイズ変更、などである。こ
れらのイベントはfviewCoreで発生する。描画
のみのイベントであればDrawingHandler
で処理され、リンクなど複雑な処理はActionHa
ndlerで処理される。DrawingHandle
rでは、スムーズなインタラクションのために、高速な
描画と高精細な描画の2種類が実行される。ユーザーが
マウスボタンを押している間(ズームあるいはパンの動
作中)、または、リンクによって別領域へジャンプする
際の描画は高速な描画が行われ、それらが終了した直後
に高精細な描画が実行される。高精細な描画は、ユーザ
ーが何らかのアクションを起こした際には直ちに中断さ
れるようになっている。実際にどのような描画が行われ
るかは描画オブジェクトの実装によって異なるが、関数
化画像の場合、高速な描画にはサムネールビットマップ
を用い、高精細な描画にはアンチエイリアスされたポリ
ゴン描画を行っている。
【0041】リンク機能を有効的に利用するには、大き
すぎる描画オブジェクトや小さい描画オブジェクト、つ
まりその描画オブジェクトにとって適切な拡大率でなく
なった時は描画をしないようにする必要がある。描画オ
ブジェクトの適切な拡大率は、本来描画オブジェクト毎
に異なり画一的に決められないが、描画オブジェクト毎
にそのような設定をするのは非常に手間がかかるので、
現在のところ、表示画面に対する大きさで表示するかど
うかを判断している。また、ズーム時に描画をしなくな
る大きさへ変化するとき、あるしきい値で急に消えてし
まうのは非常に不自然であるため、薄くなりながら消え
るようにしている。この機能は、Java2の描画属性
のアルファ値を描画オブジェクト毎に設定することで実
現している。
【0042】(4)デジタルコンテンツとしての適用例 次に、システムの構築例について説明する。ここでは、
始めに、本実施形態のデジタルコンテンツシステムの特
長を挙げて、これらの特長がどのようなアプリケーショ
ンに適しているかについて述べる。本実施形態のデジタ
ルコンテンツシステムの特長は、(1)1つのファイル
で様々な解像度に対応できる、(2)コンパクトなファ
イルサイズ、(3)高画質な拡大縮小が可能、(4)ズ
ームを利用したビューワ、といったことが挙げられる。
上記(1)〜(3)の特長は、関数化画像そのものの特
長であるので、ここでは、ズームをインタラクティブコ
ンテンツとしてどう活用するかについて考える。
【0043】ズームに効果的な使い方の一つは木構造の
データの閲覧である。親のノードにあたる部分に内部に
葉のノードにあたる部分を縮小させて配置すると、親ノ
ードが通常の大きさで表示されているときには葉ノード
は小さいので表示されないが、拡大していくとそこに属
する葉ノードが現れてくる(図11参照)。実際のデー
タとしては、文書やプレゼンテーションなどかなり多く
のデータが木構造として表現できるので、この表示手法
は非常に応用範囲が広いといえる。これまでに発表され
ているズームを用いたインターフェースの多くも木構造
のデータの表示に利用している。
【0044】これらの特長から、本実施形態のデジタル
コンテンツシステムを効果的に適用できるコンテンツと
して考えられるのは、(1)プレゼンテーションツー
ル、(2)Webコンテンツ、(3)デジタルブック、
(4)ファイリングシステム、などである。以下の説明
では、本発明を適用した一実施形態のプレゼンテーショ
ンツール、Webコンテンツ、ファイリングシステムの
各々について説明を行う。
【0045】(4−1)プレゼンテーションツール 本実施形態のデジタルコンテンツシステムであるFvi
ewは、そのままでプレゼンテーションツールとして応
用することが可能である。プレゼンテーションのコンテ
ンツは、上述したような木構造になっていることが多
く、ズームを用いたインターフェースに適している。一
般的なプレゼンテーションツールにない特徴としては、
紙媒体のコンテンツやペイントツールで描いた画像を素
材として利用できることと、ズームを利用したインター
フェースを用いて木構造を効果的にビジュアライズする
ことができることである。図12に、プレゼンテーショ
ンツールに適用した例のスクリーンショットを示す。
【0046】(4−2)Webコンテンツ FviewをJava appletで実装すること
で、容易にWebコンテンツとして利用することが可能
となる。システムの全体の構成は図13のようになって
いる。今まで述べたように、コンテンツの素材は、紙媒
体のコンテンツやペイントツールで描いた画像である。
これを関数化画像に変換し、ズームを考慮してオーサリ
ングし、画像ファイルやオーサリングファイルをWeb
サーバーに置くことで容易にデジタルコンテンツとして
公開することができる。JDK1.1までのJava
appletでは、セキュリティ保護のために印刷機能
が使えないようになっていた。しかし、Javaの最新
バージョンのJava2では、JAppletクラスを
用いてappletを実装すれば印刷機能が使えるよう
になったので、高精度な印刷という関数化画像の特徴を
活用することが可能になっている。
【0047】このシステムでは、通常のWebページの
ようなコンテンツを作ることはもちろん可能だが、関数
化画像は任意の解像度で印刷できファイルサイズが小さ
いので、図14の例のような地図やデジタルブックのネ
ットワーク配信にも向いている。
【0048】(4−3)ファイリングシステム ファイリングシステムは、紙文書をスキャナで取り込ん
で文書画像として保存・活用するシステムである。多く
のファイリングシステムでは、ファイルサイズを小さく
するために粗い解像度のピクセル画像が用いられている
が、このシステムでは関数化画像を用いるために少ない
データで高い画質が保持される上に印刷にも適してい
る。ファイリングシステムとして保存した文書を活用す
るためには検索機能が必須である。既存の画像を対象と
したファイリングシステムでは、ファイル名や登録した
キーワードからの検索機能しか持たないものが多い。し
かし、ここで扱う画像は文書画像を主体としているの
で、OCR(Optical CharacterReader)を利用してテキ
スト化し全文検索することが考えられる。
【0049】そこで、本実施形態では、より使い易いこ
とを目指した「関数化画像ファイリングシステム」を構
築した。図15は、関数化画像ファイリングシステムの
概要である。本システムの特徴は、文書画像を関数化画
像として保存していること、ユーザーが陽にキーワード
を付加しなくても検索が可能であること、ズーミングビ
ューワを用いて効果的に検索結果を提示できること、な
どが挙げられる。
【0050】本実施形態の関数化画像ファイリングシス
テムは、2つのサブシステムからなっている。1つは文
書を登録するサブシステムで、もう1つはWebブラウ
ザから入力されたキーワードから画像を検索しブラウザ
に表示するサブシステムである。登録サブシステムで
は、紙文書をスキャナで取り込み、それを関数化画像変
換とOCRにかけ、関数化画像とテキストファイルを得
る。OCRは、市販のコンシューマ向けOCRを用い
る。また、本実施形態で用いた全文検索システムでは、
検索対象ファイルをインデックス化し、インデックスを
用いて検索するため、OCRによって得られたテキスト
ファイルをインデックス化する必要がある。ここまでの
処理で、ユーザーが行う作業はスキャナから取り込むこ
とだけであり、後の処理は全て自動で行われる。
【0051】検索サブシステムは、基本的にはWebブ
ラウザとWebサーバーに分かれている。検索するユー
ザーは、検索キーワードを入力し、それがCGIリクエ
ストとしてWebサーバーに渡される。Webサーバー
ではCGIスクリプトを呼び出して検索エンジンを起動
し、キーワードにヒットする関数化画像ファイルのファ
イル名を取得する。CGIスクリプトは、ヒットしたフ
ァイル名からオーサリングファイルを作成してWebブ
ラウザに返す。そして、Webブラウザは、生成された
オーサリングファイルにしたがって画像を表示する、と
いった動作を行う。上述した基本的なデジタルコンテン
ツシステムに当てはめて考えると、オーサリングに相当
することを検索サブシステムが自動的に処理しているこ
とになる。
【0052】本システムの実行例を図16に示す。指定
したキーワードに近い画像が左から順に並べられている
様子がわかる。通常の検索エンジンのような単なるリス
ト+ハイパーリンクによる表示と違い、ズーミングビュ
ーワではヒットした文書全体を眺めたり、それぞれの文
書の詳細を見ることがスムーズに行える。現段階では、
検索結果はヒットした順に並べているだけだが、検索エ
ンジンからの分類情報を2次元+ズームの3次元に射影
して表示することも考えられる。
【0053】このように、本実施形態のデジタルコンテ
ンツシステムでは、図形の関数近似手法を用いて関数化
画像を作成する。したがって、複雑な文書画像でも修正
せずにそのまま高精度な関数化画像として扱えるので、
コンテンツの素材として扱える範囲が大きく広がったと
言える。コンテンツ表示・インタラクションに関しては
スムーズでリニアなズームを積極的に導入したインター
フェースを用いることで高精度な拡大が可能であるとい
う関数化画像の特長を十分に活用したコンテンツの表現
が可能となっている。コンテンツ表示・インタラクショ
ンを処理するアプリケーションはJavaを用いて実装
されており、ローカルなアプリケーションからWebコ
ンテンツのようなネットワークアプリケーションまで対
応している。実際に本発明を適用した例として、プレゼ
ンテーションツール、Webコンテンツ、ファイリング
システムのそれぞれについて説明した。これらのシステ
ムをファイルサイズ、表示精度、インタラクションなど
の観点から見ると、本発明のシステムが既存のシステム
より優れていることが確認された。
【0054】
【発明の効果】上述したように、本発明によれば、図形
の関数近似手法を用いて関数化画像を作成しているの
で、複雑な文書画像でも修正せずにそのまま高精度な関
数化画像として扱うことができ、コンテンツの素材とし
て扱える範囲を広げることができる。また、コンテンツ
表示・インタラクションに関しては、スムーズでリニア
なズームを積極的に導入したインターフェースを用いる
ことで、高精度な拡大が可能であるという関数化画像の
特長を十分に活用したコンテンツの表現が可能となり、
インタラクティビティを高めることができる。
【図面の簡単な説明】
【図1】関数化図形を用いたデジタルコンテンツシステ
ムの概要について説明する図である。
【図2】オーサリングファイルの例を示す図である。
【図3】輪郭再構成の精度について説明する図である。
【図4】3次ベジェ曲線と2次Bスプライン曲線につい
て説明する図である。
【図5】性能の評価に使用した5つの文書画像を示す図
である。
【図6】関数化画像の再構成・描画時間の評価結果につ
いて説明する図である。
【図7】リンク機能について説明する図である。
【図8】Fviewのマウス操作について説明する図で
ある。
【図9】オーサリングファイルの詳細について説明する
図である。
【図10】Fviewの実行時におけるモジュールの構
造について説明する図である。
【図11】ズーム中の画面例について説明する図であ
る。
【図12】プレゼンテーションツールとして適用した例
のスクリーンショットを示す図である。
【図13】インタラクティブWebコンテンツシステム
の構成について説明する図である。
【図14】Webコンテンツの一例を示す図である。
【図15】関数化図形ファイリングシステムの概要を示
す図である。
【図16】ファイリングシステムの検索画面の一例を示
す図である。
【図17】ドローツールにおけるベジェ曲線の編集につ
いて説明する図である。
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B050 BA16 BA18 DA06 EA10 EA21 FA02 FA19 GA08

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 ピクセル画像を関数化画像に変換して描
    画オブジェクトを作成し、作成された前記描画オブジェ
    クトの配置位置と前記描画オブジェクト内で発生する所
    定のイベントの内容に応じて発生させるアクションとが
    記述されたオーサリングファイルを作成し、作成された
    前記オーサリングファイルに基づいて、前記描画オブジ
    ェクトに対応した画像の表示を行うとともに、前記オー
    サリングファイルに基づいて、前記所定のイベントが発
    生した場合にはその内容に応じた前記アクションを実行
    することを特徴とする画像処理方法。
JP2000025760A 2000-02-02 2000-02-02 画像処理方法 Pending JP2001216523A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000025760A JP2001216523A (ja) 2000-02-02 2000-02-02 画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000025760A JP2001216523A (ja) 2000-02-02 2000-02-02 画像処理方法

Publications (1)

Publication Number Publication Date
JP2001216523A true JP2001216523A (ja) 2001-08-10

Family

ID=18551574

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000025760A Pending JP2001216523A (ja) 2000-02-02 2000-02-02 画像処理方法

Country Status (1)

Country Link
JP (1) JP2001216523A (ja)

Similar Documents

Publication Publication Date Title
JP5306429B2 (ja) デジタルドキュメント処理のための方法
RU2405204C2 (ru) Создание диаграмм с использованием фигур
US7194701B2 (en) Video thumbnail
JP5290487B2 (ja) デジタルドキュメント処理のためのシステム及び方法
US8032832B2 (en) Non-linear presentation canvas
US6700589B1 (en) Method, system, and program for magnifying content downloaded from a server over a network
US20040100509A1 (en) Web page partitioning, reformatting and navigation
US20050188304A1 (en) Method and system for browsing a low-resolution image
JP2000172248A (ja) 電子情報表示方法、電子情報閲覧装置および電子情報閲覧プログラム記憶媒体
JP2003529173A (ja) ビデオ編集ワークフロー方法及びその装置
KR20050052421A (ko) 동적 열람이 가능한 전자 문서의 제작 및 열람 방법
CN100485679C (zh) 用于浏览多媒体文档的方法和系统以及计算机产品
EP1457872B1 (en) Digital document processing
JP5829083B2 (ja) 分散型システムにおいて複数の関連付けられたマルチメディア資産の何れかを同期させる技法
TWI234120B (en) Control Information-forming device for image display, image display method, and image display device
JP2007206746A (ja) 情報処理装置及びその制御方法、プログラム、記憶媒体
JP2001216523A (ja) 画像処理方法
JP2011023836A (ja) スライドデータ作成装置、スライドデータ作成方法及びプログラム
WO2001080069A1 (en) Systems and methods for digital document processing
JP2004289598A (ja) 電子アルバム作成装置、電子アルバム作成方法及びプログラム
KR20010044248A (ko) 디지털 웹 페이퍼 서비스 시스템
JPWO2005101232A1 (ja) 電子書籍作成システム