(第1実施形態)
図1は、本発明を適用した画像処理システムの構成を示すブロック図である。図1に示すように、画像処理システムは、MFP100、クライアントPC101、プロキシサーバ103、文書管理サーバ106、文書管理サーバ106のためのデータベース105で構成される。MFP100は、複数種類の機能(複写機能、印刷機能、送信機能等)を実現する複合機である。クライアントPC101または携帯端末107は、例えば、印刷データをMFP100へ送信することで、その印刷データに基づく印刷物をMFP100に印刷させることが可能である。携帯端末上述した各装置は、無線または有線でLAN102に接続されている。LAN(Local Area Network)102は、また、プロキシサーバ103を介してネットワーク104に接続されている。なお、図1に示す構成は一例であり、同様の構成要素を有する複数のオフィスがネットワーク104上に接続されていても良い。
クライアントPC101、プロキシサーバ103はそれぞれ、汎用コンピュータに搭載される標準的な構成要素を備える。例えば、クライアントPC101、プロキシサーバ103は、CPU、RAM、ROM、ハードディスク、ネットワークI/F、ディスプレイ、キーボード、マウス等を備える。CPUは、Central Processing Unitの略称である。RAMは、Random Access Memoryの略称である。ROMは、Read Only Memoryの略称である。また、ネットワーク104は、典型的にはインターネットやLANやWANや電話回線、専用デジタル回線、ATMやフレームリレー回線、通信衛星回線、ケーブルテレビ回線、データ放送用無線回線等のいずれかで実現されている。WANは、Wide Area Networkの略称である。もちろん、それらの組み合わせにより実現されるいわゆる通信ネットワークであっても良いことは言うまでもなく、データの送受信が可能であれば良い。
図2は、図1に示すMFP100の機能構成を示すブロック図である。図2に示すように、MFP100は、画像読み取り部110、記憶装置(以下、BOXとも呼ぶ)111、記録装置112、データ処理装置115、入力装置113、表示装置116、ネットワークI/F114で構成される。
画像読み取り部110は、図示しないAuto Document Feeder(以下、ADF)を有し、束状の或いは1枚の原稿の画像を光源で照射し、反射画像をレンズで固体撮像素子上に結像する。固体撮像素子は所定解像度(例えば600dpi)および所定輝度レベル(例えば8ビット)の画像読み取り信号を生成し、画像読み取り信号からラスターデータの画像データを生成する。データ処理装置115は、画像読み取り部110が生成したビットマップ画像データを後述するスキャン画像処理を行うことにより記録信号に変換する。
記録装置112は、データ処理装置115が変換した記録信号を用いて画像形成(印刷出力)する。記録装置112は、複数枚複写の場合には、1頁分の記録信号を一旦BOX111に記憶保持した後、記録装置112に順次出力して、記録紙上に記録画像を形成する。BOX111は、画像読み取り部110からのデータやローカルPC102からドライバを経由して出力されるPDLデータをレンダリングしたデータを保存できる機能を有する。また、MFP100は、MFP100に設けられたキー操作部(入力装置113)を通じて操作され、操作入力の状態を表示装置116によって表示し得る。
ローカルPC101(もしくは他の汎用PC(不図示))からドライバを介してPDLデータが送信される場合、ネットワークI/F114は、LAN102とネットワークI/F114を介して受信する。そして、記録装置112は、当該受信したPDLデータに基づく画像を記録する。すなわち、ローカルPC101からドライバを経由して出力されるPDLデータは、LAN102からネットワークI/F114を経てデータ処理装置115に入力される。そして、データ処理装置115が言語を解釈・処理することで記録可能な記録信号に変換した後、MFP100は、記録紙上に記録画像として記録することが可能となる。
次に、図3と図4を用いて、ビットマップ画像データ(文書画像データ)の作成について説明する。図3は、MFP100の画像読み取り部110を使用してビットマップ画像データを作成するフローチャートを示す。MFP100を使用した場合、図3のS301において、画像読み取り部110は画像を読み込む。読み込まれた画像は、既にビットマップ画像データである。S302において、そのビットマップ画像データに対して、画像読み取り部110に依存するスキャナ画像処理を行う。ここで言うスキャナ画像処理とは、例えば、色処理やフィルタ処理を指す。
図4は、PC102上のアプリケーションを使用してビットマップ画像データを作成するフローチャートを示す。S401において、PC102上のアプリケーションを使用して作成したデータが、PC102が備えるプリントドライバを介してプリントデータに変換され、MFP100に送信される。ここで言うプリントデータとは、PDLを意味し、例えば、LIPS(商標)、Postscript(商標)等のページ記述言語を指す。次にS402において、MFP100のデータ処理装置115はインタープリタとして機能し、ディスプレイリストを生成する。S403において、データ処理装置115がディスプレイリストをレンダリングすることにより、ビットマップ画像データを生成する。
次に、図5を用いて、アプリケーション画像データの生成フローを説明する。本フローにおいて、MFP100は、ビットマップ画像データから、携帯端末107で表示するための所定のフォーマットのデータ(以下ではアプリケーション画像データと呼ぶこととする)を生成する。ビットマップ画像データは、MFP100の画像読み取り部110により取得される。または、ビットマップ画像データは、ローカルPC102上のアプリケーションソフトで作成されたドキュメントをMFP100内部でデータ処理装置115がレンダリングすることにより生成される。
まず、S501において、データ処理装置115は、ビットマップ画像データを属性毎のオブジェクトに分割するオブジェクト分割処理を行う。本実施形態において、オブジェクト分割後のオブジェクトの属性種類は、文字、写真、グラフィック(図面、線画、表、ライン)、背景を指す。S502において、データ処理装置115は、分割された各々のオブジェクトに対してオブジェクトの種類(文字、写真、グラフィック、背景)を判定する。オブジェクトが写真または背景と判定された場合、S503に処理は進み、データ処理装置115は当該オブジェクトのビットマップ画像をJPEG圧縮する。
一方、オブジェクトが文字またはグラフィックと判定された場合、処理はS504に進み、データ処理装置115はベクトル化処理を行って、パス化されたデータ(ベクトルデータ)に変換する。次に、S505において、データ処理装置115は該オブジェクトが文字かグラフィックであるかを判定する。文字の場合には、更にS506において、データ処理装置115はOCR処理を施し、文字コード化されたデータ(OCR結果の文字コードデータ)を取得する。
データ処理装置115は、S503及びS504で得た各オブジェクトのデータ(JPEGデータ、ベクトルデータ)と、S506で得た文字コードデータとを一つのファイルにまとめる。次に、S507において、データ処理装置115は各オブジェクトに対して、最適なメタデータを付与する。S508において、データ処理装置115は、メタデータを付与した各々のオブジェクトを携帯端末107が表示可能なアプリケーション画像データに生成する。最後に、S509において、データ処理装置115は、生成したアプリケーション画像データをネットワークI/Fを介して携帯端末107に送信する。
図6のフローチャートを用いて、図5のS506で行われるメタデータの付与処理の詳細について説明する。まず、S601において、データ処理装置115は、S501で分割されたオブジェクトのそれぞれについて、各オブジェクトの周囲で一番近くに存在する文字オブジェクトを選択する。次に、S602において、データ処理装置115は、選択した文字オブジェクトに対して、形態素解析を行う。次に、S603において、データ処理装置115は、S602で形態素解析結果により抽出した単語をメタデータとして各オブジェクトに付加する。なお、メタデータは、形態素解析に限定されず、例えば、画像特徴量抽出、構文解析等によっても作成できる。さらに、データ処理装置115は、以下の処理によりメタデータを作成することもできる。つまり、データ処理装置115はMFP100に内蔵されたBOX111や画像処理システムのデータベース105に既に保存されている文書、および、それに含まれるオブジェクトを対象に類似画像検索を行う。そして、データ処理装置115は、類似度の高い類似画像のオブジェクトとの関連付けを行う。
次に、図7と図8を用いて、S501のオブジェクト分割について、詳細に説明する。図7(A)は、入力されたビットマップ画像データを示す。図7(B)はオブジェクト分割処理によって、ビットマップ画像データを複数のオブジェクトに分割した結果の一例である。図8は、オブジェクト分割したときの各オブジェクトのブロック情報および入力ファイル情報を表す。
S501において、データ処理装置115は、図7(A)に示す入力画像(図7の左)に対してオブジェクト分割処理を行うことにより、属性ごとに矩形ブロックに分割する。分割された矩形ブロックを図7(B)に示す。前述のように、矩形ブロックの属性としては、文字、写真、グラフィック(図面、線画、表、ライン)がある。
オブジェクト分割処理の一手法としては、例えば以下のような手法がある。まず、MFP100内のRAM(不図示)に格納されたイメージデータを白黒に2値化し、黒画素輪郭で囲まれる画素塊を抽出する。さらに、抽出された黒画素塊の大きさを評価し、大きさが所定値以上の黒画素塊の内部にある白画素塊に対する輪郭追跡を行う。白画素塊に対する大きさ評価、内部黒画素塊の追跡というように、内部の画素塊が所定値以上である限り、再帰的に内部画素塊の抽出、輪郭追跡を行う。画素塊の大きさは、例えば画素塊の面積によって評価される。データ処理装置115は、このようにして得られた画素塊に外接する矩形ブロックを生成し、矩形ブロックの大きさ、形状に基づき属性を判定する。
例えば、縦横比が1に近く、大きさが一定の範囲の矩形ブロックは文字領域矩形ブロックの可能性がある文字相当ブロックとする。また、近接する文字相当ブロックが規則正しく整列しているときに、これら文字相当ブロックを纏めた新たな矩形ブロックを生成し、新たな矩形ブロックを文字領域矩形ブロックとする。また扁平な画素塊、もしくは、一定大きさ以上でかつ四角形の白画素塊を整列よく内包する黒画素塊をグラフィック領域矩形ブロック、それ以外の不定形の画素塊を写真領域矩形ブロックとする。
次に、生成された矩形ブロックのそれぞれについて、データ処理装置115は、図8に示す属性等のブロック情報および入力ファイル情報を生成する。図8において、ブロック情報は、各ブロックの属性、位置の座標X、座標Y、幅W、高さH、OCR情報を含む。属性は1〜3の数値で与えられ、1は文字領域矩形ブロック、2は写真領域矩形ブロック、3はグラフィック領域矩形ブロックを示す。座標X、座標Yは入力画像における各矩形ブロックの始点のX、Y座標(左上角の座標)である。幅W、高さHは矩形ブロックのX座標方向の幅、Y座標方向の高さである。OCR情報は、S508のOCR処理で文字コード化されたデータへのポインタ情報の有無を示す。さらに入力ファイル情報として矩形ブロックの個数を示すブロック総数Nも保存しておく。
これらの矩形ブロックごとのブロック情報は、特定領域でのベクトル化に利用される。またブロック情報によって、特定領域とその他の領域を合成する際の相対位置関係を特定でき、入力画像のレイアウトを損なわずにベクトル化された領域とビットマップのままの領域を合成することが可能となる。
次に、図9のフローチャートを用いて、図5のS504のベクトル化処理について詳細に説明する。まず、S901において、データ処理装置115は、特定領域が文字領域矩形ブロックであるか否か判断し、文字領域の矩形ブロックであればS902以下のステップに進む。一方、特定領域が文字領域矩形ブロックでないときは、S912に移行する。
S902〜S907では、データ処理装置115は、パターンマッチング等の手法を用いて文字認識処理を行い、対応する文字コードを得る。例えば、S902において、データ処理装置115は、特定領域に対し横書き、縦書きの判定(組み方向判定)を行うために、特定領域内で画素値に対する水平・垂直の射影を取る。次に、S903において、S902の射影の分散を評価する。水平射影の分散が大きい場合は横書き、垂直射影の分散が大きい場合は縦書きと判断する。S904において、S903の評価結果に基づき、組み方向を判定し、行の切り出しを行い、その後文字を切り出して文字画像を得る。文字列および文字への分解は、横書きならば水平方向の射影を利用して行を切り出し、切り出された行に対する垂直方向の射影から、文字を切り出す。縦書きの文字領域に対しては、水平と垂直について逆の処理を行う。行、文字切り出しに際して、文字のサイズも検出し得る。
次に、S905において、データ処理装置115は、S904で切り出された各文字について、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルを生成する。特徴ベクトルの抽出には種々の公知手法があり、例えば、文字をメッシュ状に分割し、各メッシュ内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴ベクトルとする方法がある。
S906において、データ処理装置115は、S905で得られた観測特徴ベクトルと、あらかじめフォントの種類ごとに求められている辞書特徴ベクトルとを比較し、観測特徴ベクトルと辞書特徴ベクトルとの距離を算出する。S907において、S906で算出された距離を評価し、最も距離の近いフォントの種類を認識結果とする。次に、S908において、S907における距離評価の最短距離が所定値よりも大きいか否か、類似度を判断する。最短距離が所定値以上の場合(類似度が低い場合)は、辞書特徴ベクトルにおいて、形状が類似する他の文字に誤認識している可能性が高い。そこで最短距離が所定値以上の場合(類似度が低い場合)は、S907の認識結果を採用せず、S911の処置に進む。類似度が所定値より小さいとき(類似度が高い場合)は、S907の認識結果を採用し、ステップ909に進む。
S909において、データ処理装置115は文字フォントの種類を認識する。文字認識の際に用いる、フォントの種類数分の辞書特徴ベクトルを、文字形状種すなわちフォント種に対して複数用意しておく。これを、パターンマッチングの際に、文字コードとともにフォント種を出力することで、文字フォントを認識し得る。次に、S910において、データ処理装置115は、文字認識およびフォント認識よって得られた文字コードおよびフォント情報を用いて、各々あらかじめ用意されたアウトラインデータを用いて、各文字をベクトルデータに変換する。なお、入力画像がカラーの場合は、カラー画像から各文字の色を抽出してベクトルデータとともに記録する。
一方、S911では、データ処理装置115は、文字をグラフィックと同様に扱い、該文字をアウトライン化する。すなわち誤認識を起こす可能性の高い文字については、見かけ上ビットマップに忠実なアウトラインのベクトルデータを生成する。また、S912では、データ処理装置115は、特定領域が文字領域矩形ブロックでないとき(すなわちグラフィック領域矩形ブロックのとき)、画像の輪郭に基づいてベクトル化の処理を実行する。以上の処理により、文字領域矩形ブロックおよびグラフィック領域矩形ブロックに属するイメージ情報をベクトルデータに変換出来る。
図10と図11、図12を用いて、S912のグラフィック領域矩形ブロックのベクトル化処理について詳細に説明する。グラフィック領域矩形ブロックのベクトル化処理は、該領域内で抽出された黒画素塊の輪郭に基づいてベクトル化を行う。図10は、ベクトル化の処理における角抽出の処理を示す図である。図11は、ベクトル化の処理における輪郭線まとめの処理を示す図である。図12は、グラフィック領域のベクトル化処理の詳細フローチャートである。
図12のS1201において、データ処理装置115は、線画等を直線および/または曲線の組み合わせとして表現するために、曲線を複数の区間(画素列)に区切る「角」を検出する。角とは曲率が極大となる点であり、図10に示すように、データ処理装置115は、曲線上の画素Piが角か否かの判断を以下のように行う。すなわち、Piを起点とし、曲線に沿ってPiから両方向に所定画素(k個とする)ずつ離れた画素Pi−k、Pi+kを線分Lで結ぶ。画素Pi−k、Pi+k間の距離をd1、線分Lと画素Piとの距離をd2、曲線の画素Pi−k
、Pi+k間の弧の長さをAとする。d2が極大となるとき、あるいは比(d1/A)が閾値以下となるときに画素Piを角と判断する。角によって分割された画素列を、直線あるいは曲線で近似する。直線への近似は最小二乗法等により実行し、曲線への近似は3次スプライン関数などを用いる。画素列を分割する角の画素は近似直線あるいは近似直線における、始端または終端となる。
さらに、データ処理装置115は、ベクトル化された輪郭内に白画素塊の内輪郭が存在するか否かを判断し、内輪郭が存在するときはその輪郭をベクトル化し、内輪郭の内輪郭というように、再帰的に反転画素の内輪郭をベクトル化する。以上のように、輪郭の区分線近似を用いれば、任意形状の図形のアウトラインをベクトル化することができる。元原稿がカラーの場合は、カラー画像から図形の色を抽出してベクトルデータとともに記録する。
S1202で、データ処理装置115は、S1201で求めた輪郭線が近接している場合はそれらをまとめて太さを持った線とする処理を行う。図11に示すように、ある注目区間で外輪郭PRjと、内輪郭PRj+1あるいは別の外輪郭が近接している場合、2個あるいは複数の輪郭線をひとまとめにし、太さを持った線として表現することができる。例えば、輪郭PRj+1の各画素Piから輪郭PRj上で最短距離となる画素Qiまでの距離PiQiを算出し、PQiのばらつきが僅かである場合には、注目区間を画素Pi、Qiの中点Miの点列に沿った直線または曲線で近似し得る。近似直線、近似曲線の太さは、例えば距離PiQiの平均値とする。線や線の集合体である表罫線は、太さを持つ線の集合とすることにより、効率よくベクトル表現することができる。
S1203において、データ処理装置115は、各ベクトルデータの始点、終点を算出する。S1204において、S1203で求められた始点、終点情報を用いて、図形要素を検出する。図形要素とは、区分線が構成している閉図形であり、検出に際しては、始点、終端となっている共通の角の画素においてベクトルを連結する。すなわち、閉形状を構成する各ベクトルはその両端にそれぞれ連結するベクトルを有しているという原理を応用する。
S1205において、データ処理装置115は、ベクトルデータより両端に連結していない不要なベクトルを除去し、閉図形を構成するベクトルを抽出する。S1206において、閉図形を構成するベクトルについて、いずれかのベクトルの端点(始点または終点)を開始点とし、一定方向、例えば時計回りに、順にベクトルを探索する。すなわち、他端点において他のベクトルの端点を探索し、所定距離内の最近接端点を連結ベクトルの端点とする。閉図形を構成するベクトルを1まわりして開始点に戻ったとき、通過したベクトルを全て一つの図形要素を構成する閉図形としてグループ化する。また、閉図形内部にある閉図形構成ベクトルも全てグループ化する。さらにまだグループ化されていないベクトルの始点を開始点とし、同様の処理を繰り返す。
S1207において、データ処理装置115は、S1205で除去された不要ベクトルのうち、S1206で閉図形としてグループ化されたベクトルに端点が近接しているベクトルを検出し、一つの図形要素としてグループ化する。これによって、図形要素内に存在する他の図形要素、もしくは区分線をグループ化し、一つの図形オブジェクトとすることが出来る。また、図形要素内に他の図形要素、区分線が存在しない場合は図形要素を図形オブジェクトとする。以上の処理によってグラフィック領域矩形ブロックを、ベクトル化された一つのオブジェクトに変換することが出来る。
次に、図13と図14を用いて、S507のアプリケーション画像データ生成について詳細に説明する。図13は、本実施例に係るベクトル化処理結果のデータ構成を示すマップである。図14は、アプリケーション画像データ生成処理の詳細を示すフローチャートである。
まず、S1401において、S504のベクトル化処理で生成された中間データを取得する。本実施形態において、MFP100は、以下のようなドキュメント・アナリシス・アウトプット・フォーマット(以下、DAOF)と呼ぶ形式で中間データを記憶装置111に保存しているものとする。図13に示すように、DAOFは、ヘッダ1301、レイアウト記述データ部1302、文字認識記述データ部1303、表記述データ部1304、画像記述データ部1305を含む。
ヘッダ1301には、処理対象の入力画像に関する情報が保持される。レイアウト記述データ部1302には、入力画像中の矩形ブロックの属性である文字、グラフィック(線画、図面、表、ライン)、写真等の情報と、これら属性が認識された各矩形ブロックの位置情報が保持される。文字認識記述データ部1303には、文字領域矩形ブロックのうち、文字認識して得られる文字認識結果が保持される。表記述データ部1304には、表の属性を持つグラフィック領域矩形ブロックの表構造の詳細が格納される。画像記述データ部1305には、ベクトル化の処理が指示された特定領域においては、ベクトル化処理により得られたブロックの内部構造や、画像の形状や文字コード等あらわすデータの集合が保持される。一方、ベクトル化処理の対象ではない特定領域以外の矩形ブロックでは、オブジェクトに分割されたビットマップ画像データそのものが保持される。
次に、S1402において、データ処理装置115は、後述する文書構造ツリー生成を行う。S1403において、データ処理装置115は、文書構造ツリーを元にDAOF内の実データを取得し、後述するアプリケーション画像データを生成する。
次に、図15と図16、図17を用いて、S1402の文書構造ツリー生成について説明する。図15は、文書構造ツリー生成の処理を示すフローチャートである。図16は、文書構造ツリー生成処理の対象となる文書の例を示す図である。図17は、文書構造ツリー生成の処理によって生成される文書構造ツリーを示す図である。
図15に示す文書構造ツリー生成の処理における全体制御の基本ルールとして、処理の流れはミクロブロック(単一矩形ブロック)からマクロブロック(矩形ブロックの集合体)へ移行する。以後「矩形ブロック」は、ミクロブロックおよびマクロブロック両者を意味するものとする。
まず、S1501において、データ処理装置115は、矩形ブロック単位で、縦方向の関連性に基づいて、矩形ブロックを再グループ化する。図15の処理は繰り返し実行されることがあるが、処理開始直後はミクロブロック単位での判定となる。ここで、関連性とは、距離が近い、ブロック幅(横方向の場合は高さ)がほぼ同一であることなどの特徴によって定義される。また、データ処理装置115は、DAOFを参照し、距離、幅、高さなどの情報を抽出する。
例えば、図16に示す文書では、最上部で、矩形ブロックT1、T2が横方向に並列されている。矩形ブロックT1、T2の下には横方向セパレータS1が存在し、横方向セパレータS1の下に矩形ブロックT3、T4、T5、T6、T7が存在する。矩形ブロックT3、T4、T5は、横方向セパレータS1下側の領域における左半部において上から下に、縦方向に配列され、矩形ブロックT6、T7は、横方向セパレータS1下側の領域における右半部において上下に配列されている。データ処理装置115がS1501において縦方向の関連性に基づくグルーピングの処理を実行すると、矩形ブロックT3、T4、T5が1個のグループ(矩形ブロック)V1にまとめられる。また、矩形ブロックT6、T7が1個のグループ(矩形ブロック)V2にまとめられる。グループV1、V2は同一階層である。
次に、S1502において、データ処理装置115は、縦方向のセパレータの有無をチェックする。セパレータは、DAOF中でライン属性を持つオブジェクトであり、明示的にブロックを分割する機能をもつ。セパレータを検出すると、処理対象の階層において、入力画像の領域を、セパレータを境界として左右に分割する。図16に示す文書例では、縦方向のセパレータは存在しない。
次に、S1503において、データ処理装置115は、縦方向のグループ高さの合計が入力画像の高さに等しくなったか否か判断する。すなわち縦方向(例えば上から下)に処理対象の領域を移動しながら、横方向のグルーピングを行うとき、入力画像全体の処理が終了したときには、グループの高さの合計が入力画像の高さになることを利用し、処理の終了判断を行う。グルーピングが終了したときはそのまま処理終了し、グルーピングが終了していなかったときはS1504に進む。
次に、S1504において、データ処理装置115は、横方向の関連性に基づくグルーピングの処理を実行する。これによって、例えば図16の矩形ブロックT1、T2が1個のグループ(矩形ブロック)H1にまとめられ、矩形ブロックV1、V2が1個のグループ(矩形ブロック)H2にまとめられる。グループH1、H2は同一階層となる。ここでも、処理開始直後はミクロブロック単位での判定となる。
次に、S1505において、データ処理装置115は、横方向のセパレータの有無をチェックする。セパレータを検出すると、処理対象の階層において、入力画像の領域を、セパレータを境界として上下に分割する。図16に示すように、横方向のセパレータS1が存在する。データ処理装置115は、以上の処理結果を図17に示す文書構造ツリーとして登録する。
図17に示すように、入力された1ページ分のビットマップ画像データV0は、最上位階層にグループH1、H2、セパレータS1を有する。グループH1には第2階層の矩形ブロックT1、T2が属する。グループH2には、第2階層のグループV1、V2が属する。グループV1には、第3階層の矩形ブロックT3、T4、T5が属し、グループV2には、第3階層の矩形ブロックT6、T7が属する。本例では、V0はページを表し、V0の下位階層にあるものがオブジェクトを表す。
最後に、S1506において、データ処理装置115は、横方向のグループ長合計が入力画像の幅に等しくなったか否か判断する。これによって横方向のグルーピングに関する終了判断を行う。横方向のグループ長がページ幅となっている場合は、文書構造ツリー生成の処理を終了する。横方向のグループ長がページ幅となっていないときは、S1501に戻り、データ処理装置115は、再びもう一段上の階層で、縦方向の関連性チェックから繰り返す。
図18は、アプリケーション画像データのフォーマットの一例を示す。本実施形態では、アプリケーション画像データのフォーマットとして、Scalable Vector Graphics(以下、SVG)形式を用いて説明する。
図18では説明のため、各オブジェクトの表記を枠1801と1802、及び1804で囲って示している。各オブジェクトは、オブジェクトの領域を示す領域情報と、DAOF内の実データから取得する描画要素を持つ。また、領域情報のみで描画要素を持たないオブジェクト(例えば図17のH1、H2、V1、V2など)を持つことも可能である。1801は写真属性を示す。写真属性には、写真オブジェクトの領域を示す領域情報と、描画要素としてビットマップ情報が示されている。1802は文字属性を示す。文字属性には、文字オブジェクトのベクトルデータと、1803にS506のOCR処理で得られる文字コードデータ及びS504のベクトル化処理で得られる文字サイズが示される。また、S504のベクトル化処理で得られる文字領域の組み方向(縦書き、もしくは横書き)についても記すことが可能である。1804は、線画などのグラフィックオブジェクトを表す。
なお、本実施例ではアプリケーション画像データをSVG形式で表記しているが、文書の意味や構造を記述・保持できる画像フォーマットであれば良く、これに限定されるものではない。
図19は、本実施形態における携帯端末107のハードウェア構成例を示すブロック図である。携帯端末107は、メインボード1900、LCD1901、タッチパネル1902、ボタンデバイス1903から構成される。また、LCD1901とタッチパネル1902をまとめてタッチUI1904と呼ぶこととする。
メインボード1900の主な構成要素は以下である。CPU1905、無線LANモジュール1906、電源コントローラ1907、ディスプレイコントローラ(DISPC)1908、パネルコントローラ(PANELC)1909、ROM1910、RAM1911、二次電池1912、タイマー1913。それぞれのモジュール1905〜1913は、バス(不図示)によって接続されている。
CPU1905は、バスに接続される各デバイスを制御すると共に、ROM1910に記憶された図20を用いて後述するソフトウェアモジュール2000を、RAM1911に展開して実行するプロセッサである。RAM1911は、CPU1905のメインメモリ、ワークエリア、LCD1901に表示するビデオイメージ用エリア、およびMFP100から送信されるアプリケーション画像データの保存領域として機能する。
ディスプレイコントローラ(DISPC)1908は、CPU1905の要求に応じて、RAM1911に展開されたビデオイメージ出力を高速に切り替えるとともに、LCD1901に同期信号を出力する。結果として、RAM1911のビデオイメージが、DISPC1908の同期信号に同期してLCD1901に出力され、LCD1901上にイメージが表示される。
パネルコントローラ(PANELC)1909は、CPU1905の要求に応じて、タッチパネル1902およびボタンデバイス1903を制御する。その制御によって、タッチパネル1902上の指又はスタイラスペンなどの指示物の押下位置や、ボタンデバイス1903上の押下されたキーコードなどが、CPU1905に通知される。押下位置情報は、タッチパネル1902の横方向の絶対位置を示す座標値(以下x座標)と、縦方向の絶対位置を示す座標値(以下y座標)から成る。タッチパネル1902は複数ポイントの押下を検知することが可能で、その場合CPU1905には押下点数分の押下位置情報が通知される。
電源コントローラ1907は、外部電源(不図示)と接続され電力の供給を受ける。これによって、電源コントローラ1907に接続された二次電池1912を充電しながら、且つ、携帯端末107全体に電力を供給する。外部電源から電力が供給されないときは、二次電池1912が携帯端末107全体に電力を供給する。
無線LANモジュール1906は、CPU1905の制御に基づいて、LAN102に接続された無線アクセスポイント(不図示)上の無線LANモジュールとの無線通信を確立し、携帯端末107とMFP100など図1に示す各装置との通信を仲介する。無線LANモジュール1906には、例えばIEEE802.11bなどがある。
タイマー1913は、CPU1905の制御に基づいて、図20に示すジェスチャイベント発生部2001へのタイマー割込を発生させる。ジェスチャイベント発生部2001については後述する。また、携帯端末107には不図示の地磁気センサや加速度センサがバスに接続されている。タイマー1913は、CPU1905の制御に基づいて、携帯端末107の傾きを検知し、携帯端末107が所定以上の傾きを得ると、携帯端末107の向きを変更し、描画部2003にLCD1901への描画の指示を送る。CPU1905は、携帯端末107の向きが変更されるとき、LCD1901の幅および高さを入れ替えて、以降の処理を行う。
図20は、携帯端末107のCPU1905で実行処理されるソフトウェアモジュール2000の構成を示すブロック図である。ソフトウェアモジュール2000を構成する各モジュールについて説明する。図20に示すように、ソフトウェアモジュール2000は、ジェスチャイベント発生部2001、ジェスチャイベント処理部、描画部2003を備える。
ジェスチャイベント発生部2001は、ユーザのタッチ入力を受けて、後述する各種ジェスチャイベントを発生させる。ジェスチャイベント発生部2001は、発生したジェスチャイベントを、ジェスチャイベント処理部2002へ送信する。ジェスチャイベント処理部2002は、ジェスチャイベント発生部2001で発生したジェスチャイベントを受信して、各ジェスチャイベントと、アプリケーション画像データに記述された文書構造に応じた処理を実行する。描画部2003は、ジェスチャイベント処理部2002の実行結果に応じて、MFP100から送信されるアプリケーション画像データをLCD1901へ描画・表示する。アプリケーション画像データの表示の方法については後述する。
図21は、ジェスチャイベント発生部2001が発生させるジェスチャイベント名の一覧と、ジェスチャイベント発生部2001がジェスチャイベント処理部2200へ送信する各イベントの情報を示す。
図21(A)は、タッチ押下イベントであり、最新のタッチ座標の座標値とタッチ座標数が送信される。タッチ座標とは、タッチパネル1902にユーザの指が触れている1点の座標のことで、x座標とy座標で表される1組の座標値を持つ。また、タッチ座標数とは、タッチパネル1902にユーザの指が接触したタッチ座標の数を示している。なお、タッチ座標は、タッチパネル1902へユーザの指が触れたとき、指が移動したとき、指が離れたとき、タイマー1913からの割り込みが発生したときに更新される。
図21(B)は、スワイプイベントであり、最新のタッチ座標の座標値と、最新と直前の座標値の差分から計算した移動距離がジェスチャイベント処理部2200に送信される。ここで、スワイプとは、指先をタッチパネル1902に接触させたまま、1方向に移動(滑らすような)動作のことをいう。
図21(C)は、ピンチインイベントであり、最新の2点のタッチ座標の中心座標値、及び、2点のタッチ座標を結ぶ直線の縮小距離から計算したピンチインの縮小率がジェスチャイベント処理部2200に送信される。ここで、ピンチインとは、2つの指先をタッチパネル1902に接触させたまま、互いに近づける(つまむような)動作のことをいう。
図21(D)は、ピンチアウトイベントであり、最新の2点のタッチ座標の中心座標値、及び、2点のタッチ座標を結ぶ直線の拡大距離から計算したピンチアウトの拡大率がジェスチャイベント処理部2200に送信される。ここで、ピンチアウトとは、2つの指先をタッチパネル1902に接触させたまま、互いに遠ざける(指を広げるような)動作のことをいう。
図21(E)は、2点スワイプイベントであり、最新の2点のタッチ座標の座標値、及び、2点のタッチ座標の最新と直前の座標値の差分から計算した移動距離がジェスチャイベント処理部2200に送信される。2点スワイプイベントは、2点のタッチ座標が同じ方向に移動している場合に発生する。
図21(F)は、ローテートイベントであり、最新の2点のタッチ座標の座標値から計算した回転の中心座標値、及び、2点のタッチ座標の最新と直前の座標値から計算した回転角度がジェスチャイベント処理部2200に送信される。ここで、ローテートとは、2つの指先をタッチパネル1902に接触させたまま、2つの指先をタッチパネル1902に対して回転させる動作のことを言う。
図21(G)は、フリックイベントであり、最新のタッチ座標の座標値、及び、最新と直前の座標値から計算した指の移動速度がジェスチャイベント処理部2200に送信される。ここで、フリックとは、スワイプ中に指を離す(指をはじくような)動作のことをいう。
図21(H)は、タッチ解除イベントであり、タッチパネル1902からユーザの指が離れたときの最新のタッチ座標の座標値、及び、座標数がジェスチャイベント処理部2200に送信される。
図21(I)は、ダブルタップイベントであり、最新のタッチ座標の座標値がジェスチャイベント処理部2200に送信される。ここで、ダブルタップとは、所定の時間内に後述のシングルタップイベントが発生したことを言う。
図21(J)は、シングルタップイベントであり、最新のタッチ座標の座標値がジェスチャイベント処理部2200に送信される。ここで、シングルタップとは、前述のタッチ押下イベントの後、所定の時間内にタッチ解除イベントが発生したことを言う。
図21(K)は、ロングタップイベントであり、最新のタッチ座標の座標値がジェスチャイベント処理部2200に送信される。ここで、ロングタップとは、前述のタッチ押下イベントの後、所定の時間以上経過してからタッチ解除イベントが発生したことを言う。
図21(L)は、タッチアンドホールドイベントであり、最新のタッチ座標の座標値がジェスチャイベント処理部2200に送信される。ここで、タッチアンドホールドイベントとは、タッチパネル1902にユーザの指が触れてから一度も移動することなく所定の時間以上経過したことを言う。
なお、ここでは、ユーザのタッチ入力の例として指を使った場合を示すが、タッチ入力はスタイラスペンなどによる入力でも良い。
次に、図22と図23を用いて、本実施形態において、携帯端末107がアプリケーション画像データ受信した際の処理について説明する。図22は、携帯端末107がアプリケーション画像データを受信した際のフローチャートである。図23は、携帯端末107のタッチUI1904の画面表示例である。
まず、S2200において、携帯端末107は、無線LANモジュール1906を介してMFP100からアプリケーション画像データを受信すると、RAM1911に受信したアプリケーション画像データを保存する。次に、S2201において、描画部2003は、RAM1911に保存したアプリケーション画像データの構文を解析し、先頭ページと、それに含まれるオブジェクトを読み込む。
次に、S2202において、描画部2003は読み込んだ先頭ページに含まれる背景、文字、写真、グラフィックの全てのオブジェクトを、オブジェクトの始点の座標と幅、高さに応じてレンダリングしてタッチUI1904の表示状態を更新する。このとき、先頭ページは、図23のページ2300に示すように、タッチUI1904の幅に合わせて表示倍率が制御される。また、表示倍率に縮小したときのページの高さがタッチUI1904よりも小さい場合は、タッチUI1904の中央に適合され表示されるように、タッチUI1904上の座標において、ページ2300の始点が制御される。また、表示倍率に縮小したときのページ2300の高さがタッチUI1904よりも大きい場合は、タッチUI1904上の座標において、ページ2300の始点がタッチUI1904の始点(例えば画面の左上)に合うように制御される。このように、タッチUI1904においてページ全体を表示する表示制御方法を、本実施例ではページ表示モードを呼ぶこととする。
なお、本実施形態のアプリケーション画像データに含まれる文字オブジェクトは、図18の文字属性1802に示した通り、ベクトルデータと共に文字コードデータ1803を保持している。描画部2003は、ページ内に文字オブジェクトがある場合、ページ2300のレンダリングにベクトルデータのみを用い、一方で、後述する文字折り返し画像のレンダリングに文字コードデータを用いる。
次に、図23と図24を用いて、携帯端末107のアプリケーション画像データの操作制御を行うソフトウェアモジュールについて説明する。図24は、ジェスチャイベント処理部2002が備える、アプリケーション画像データの操作制御に係わるソフトウェアモジュールの構成を示すブロック図である。ジェスチャイベント処理部2002は、表示変更イベント処理部2400、スワイプイベント処理部2401、拡大・縮小イベント処理部2405、オブジェクト選択処理部2408を備える。
ジェスチャイベント処理部2002は、ジェスチャイベント発生部2001から、図21に示すいずれかのジェスチャイベントを受信する。表示変更イベント処理部2400は、ジェスチャイベント処理部2002が受信するジェスチャイベントの内、シングルタップイベント(図21(J))に対する処理を行う。表示変更イベント処理部2400は、シングルタップイベントを受信すると、シングルタップイベントのタッチ座標の座標値が、図23のモード切替ボタン2301、次へボタン2302、前へボタン2303の何れかの上にあるかを判定する。そして、シングルタップイベントのタッチ座標が「モード切替ボタン」2301上である場合は、表示変更イベント処理部2400は、後述するモード切替処理を行う。また、タッチ座標が「次へボタン」2302上である場合は、表示変更イベント処理部2400は後述する「次選択処理」(次へボタン選択処理)を行う。タッチ座標が「前へボタン」2303上である場合は、表示変更イベント処理部2400は後述する「前選択処理」(前へボタン選択処理)を行う。表示変更イベント処理部2400が備える表示順番制御部2402と表示範囲制御部2403が、「次選択処理」と「前選択処理」を行う。
スワイプイベント処理部2401は、図21(B)のスワイプイベントに対する処理を行う。ジェスチャイベント処理部2002がスワイプイベントを受信すると、スワイプイベント情報が含む移動距離に応じて、タッチUI1904上の座標において、ページ2300および後述する文字折り返し画像の始点を移動させる。そして、その上でタッチUI1904の表示状態を更新する。また、スワイプイベント処理部2401が備える移動範囲制限部2404が、図30を用いて後述する移動範囲制限処理を行って、タッチUI1904に表示される部分領域の移動範囲を制限する。
拡大・縮小イベント処理部2405は、図21(C)のピンチインイベントと、図21(D)のピンチアウトイベントに対する処理を行う。ジェスチャイベント処理部2002は、ピンチインイベントやピンチアウトイベントを受信すると、二つのイベントの縮小率もしくは拡大率に応じてページ2300および後述する文字折り返し画像のレンダリング時の文字サイズを変化させる。そして、拡大・縮小イベント処理部2405は、変更した画像を用いてタッチUI1904の表示状態を更新する。また、拡大・縮小イベント処理部2405が備える縮小時表示モード切替部2406が図34を用いて後述する縮小時表示モード切替処理を行う。また、拡大・縮小イベント処理部2405が備える拡大時表示モード切替部2407が図31を用いて後述する拡大時表示モード切替処理を行う。
オブジェクト選択処理部2408は、図21(I)のダブルタップイベントに対する処理を行う。ジェスチャイベント処理部2002がダブルタップイベントを受信すると、ダブルタップイベントのタッチ座標の座標値を用いて、図32を参照して後述するオブジェクト選択処理を行う。なお、オブジェクト選択処理は、ページ表示モードでのみ動作するようオブジェクト選択処理部2408によって制御される。
次に、図23と図25、図26、図33を用いて、表示変更イベント処理部2400が行うモード切替処理について説明する。図25は、モード切替処理のフローチャートである。図23または図26(B)に示す表示モード切替項目であるモード切替ボタン2301がユーザによりタップ指示されるのに応じて処理が実行される。図26と図33は、携帯端末107のタッチUI1904の画面表示例である。
まず、S2500において、表示変更イベント処理部2400は、モード切替ボタンが指示されたと判定すると、携帯端末107に設定中の表示モードを取得する。表示モードとは、携帯端末107がアプリケーション画像データをタッチUI1904に表示する方法を示し、本実施形態では、携帯端末107は、一例として次の3つの表示モードを有するものとする。第一に、図23に示すようにページ全体を表示するのに適したページ表示モードである。第二に、図26に示すようにページ内の一部の領域を拡大表示するのに適した部分領域表示モードである。すなわち、部分領域表示モードは、ページ画像内の各オブジェクトを拡大表示する第1の表示モードである。第三に、図33に示すように文字オブジェクトの文字を読むのに適した折り返し表示モード(第2の表示モード)である。折り返し表示モードは、図33に示す通り、文字オブジェクトが持つ文字コードデータを、タッチUI1904に合わせてレンダリングする表示モードである。折り返し表示モードへは、部分領域表示モードによって文字コードデータを持つ文字オブジェクトが強調表示されている場合に遷移できる。折り返し表示モードの詳細は後述する。前述した通り、アプリケーション画像データを携帯端末107が受信した直後はページ表示モードが設定されている。部分領域表示モードは、図26に示す通り、ページ2300内の各オブジェクトが大きく表示されるようにページ2300の表示倍率と始点を制御する表示モードである。
表示イベント処理部が、図26に示す文字オブジェクト2601をユーザがシングルタップした際にS2500において、表示モードを切り替えてもよい。あるいは、図23のモード切替ボタン2301がユーザにより押下されて図26(A)に示す画面を表示し、ユーザに拡大対象のオブジェクトを選択させる構成としてもよい。文字オブジェクト2601を拡大表示対象のオブジェクトとしてユーザが選択した場合、図26(B)に示す画像が表示される。
なお、図26(A)のオブジェクト2601を囲む破線は、説明をわかり易くするために描いたもので、ページ2300上には存在しない。また、本実施例では、図26(B)に示すように、拡大表示対象のオブジェクト2601の領域が透明で且つそれ以外の領域が、斜線で示す半透明グレーの半透明マスク2600を、ページ2300の上に重ねて表示する。このようにコントラストを付して表示することで、対象のオブジェクトだけが見やすくなるという効果が得られる。つまり、半透明マスクを重ねて表示することにより、対象のオブジェクト以外が暗く表示されるので、対象のオブジェクトが強調表示され、ユーザは表示対象になっているオブジェクトの領域を特定しやすくなる。
表示変更イベント処理部2400は、モード切替ボタン2301が指示されたときに設定中の表示モードが、部分領域表示モードまたは折り返し表示モードである場合にはS2501に、ページ表示モードである場合にはS2504を実行する。
S2501において、表示変更イベント処理部2400は、図26の半透明マスク2600を非表示設定(半透明マスクOFF)にして、ページ画像全体を表示するページ表示モードへの切り替えを行う。S2502において、表示変更イベント処理部2400は、前述した通り、タッチUI1904の幅に合わせてページ2300の表示倍率を制御すると共に、ページ2300の始点を制御して、ページの表示範囲を決定する。S2503において、表示変更イベント処理部2400は、当該決定されたページの表示範囲に基づいて、タッチUI1904の表示状態を更新する。
また、モード切替ボタン2301が指示されたときに設定中の表示モードがページ表示モードであった場合には、S2504において、表示変更イベント処理部2400は、表示モードを部分領域表示モードへ切り替る。そして、表示変更イベント処理部2400は、半透明マスク2600を表示する設定(半透明マスクON)に変更する。
次に、S2505において、表示変更イベント処理部2400は、ページ2300内の先頭オブジェクトを読み込み、先頭オブジェクトの始点と幅、高さを取得する。ここで、先頭オブジェクトとは、アプリケーション画像データの文書構造ツリーにおいて、最初に読み込まれるオブジェクトである。
表示変更イベント処理部2400内の表示範囲制御部2403は、S2506において、後述する部分領域表示範囲決定処理を行った後、S2503で、当該決定された表示範囲に基づいてタッチUI1904の表示状態を更新する。なお、S2506の部分領域表示範囲決定処理では、S2505で読み込んだオブジェクトの属性に応じて、ページの表示倍率や始点を制御し、タッチUI1904に表示する部分領域の表示範囲を決定する。部分領域表示範囲決定処理の詳細は後述する。また、このとき表示対象となっているオブジェクトの部分領域以外の領域にはグレーの半透明マスクがかけられるので、ユーザは、表示対象となっているオブジェクトを識別しやすくなる。
次に、図25のS2506において表示範囲制御部2403が行う部分領域表示範囲決定処理の詳細について、図27のフローチャートを用いて説明する。まず、S2700において、表示範囲制御部2403は、読み込んだオブジェクトの属性を判定する。属性が文字の場合はS2701に進み、属性が表である場合はS2711に進み、それ以外の属性である場合はS2712に進む。
S2701において、表示範囲制御部2403は、文字属性である当該表示対象のオブジェクトが、箇条書きであるかを判定する。ここでいう箇条書きのオブジェクトとは、各文字列もしくは行の先頭に点や数字といった行頭文字が存在するオブジェクトを指すものとする。なお、行頭文字は、OCR結果から取得することができる。オブジェクトが箇条書きでなく、通常の文字列であった場合にはS2702に進み、箇条書きであった場合にはS2712に進む。
S2702において、表示範囲制御部2403は、オブジェクトの文字の組み方向を取得する。オブジェクトの組み方向は、S504のベクトル化の過程で得られている。S2703において、表示範囲制御部2403は、文字の組み方向を判定し、組み方向が縦書きである場合にはS2704に進み、横書きである場合にはS2705に進む。文字の組み方向が縦書きの場合、S2704において、表示範囲制御部2403は、当該オブジェクトの高さがタッチUI1904の画面の高さに入るようにページの表示倍率を設定する。また、文字の組み方向が横書きの場合、S2705において、表示範囲制御部2403は、当該オブジェクトの幅がタッチUI1904の画面の幅に入るようにページの表示倍率を設定する。
次に、S2706において、S2704またはS2705で設定した表示倍率に拡縮したオブジェクトの全体がタッチUI1904に表示できるかを判断する。オブジェクト全体がタッチUI1904よりも大きく、全体を表示できない場合にはS2707に進み、一方、オブジェクト全体がタッチUI1904よりも小さく、全体を表示できる場合にはS2710に進む。
S2707において、表示範囲制御部2403は、当該オブジェクトにおける文字の組み方向を判定し、縦書きであると判定した場合はS2708に進み、横書きであると判定した場合はS2709に進む。
S2708において、表示範囲制御部2403は、オブジェクト全体がタッチUI1904に表示できない縦書きの文字領域を表示するので、当該オブジェクトの右上端がタッチUI1904の右上端に合うように、ページ2300の始点位置を設定する。すなわち、縦書きの場合の先頭行が表示されるように表示位置を設定する。
S2709において、表示範囲制御部2403は、オブジェクト全体がタッチUI1904に表示できない横書きの文字領域を表示するので、当該オブジェクトの左上端がタッチUI1904の左上端に合うように、ページの始点を設定する。すなわち、横書きの場合の先頭行が表示されるように表示位置を設定する。
また、S2710において、オブジェクト全体がタッチUI1904の画面内に収まるので、表示範囲制御部2403は、当該オブジェクトの中央がタッチUI1904の中央に合うようにページ2300の始点を設定する。
なお、S2700でオブジェクトの属性が表であると判定した場合には、S2711において、表示範囲制御部2403は、表のヘッダ位置を検出する。ヘッダの位置は、例えば、先頭行(一番上の行)と先頭列(一番左の列)の文字のフォント種がボールドであるか否かや、ベクトル化した際のベクトルデータの近似曲線の太さ、表罫線の太さ、表の各セルの背景色などによって判断することができる。S2711で検出した表のヘッダ位置が先頭行である場合には、S2703からS2705に進む。また、表のヘッダ位置が先頭列である場合には、S2703からS2704に進む。また、S2707では、表のヘッダは一番上の行か一番左の列に存在することが一般的であるため、S2709に進み、オブジェクトの左上端がタッチUIの左上端に合うようにページの始点を設定する。このようにすることで、表のヘッダが表示されるように表示位置が設定されることになる。すなわち、上述の処理において表示範囲制御部2403は設定手段として機能し、オブジェクト属性が文字または表の場合に、文字の組み方向の範囲が画面内に入るように表示倍率と先頭オブジェクトの表示位置とを設定する。
また、S2700でオブジェクトの属性がその他の属性(文字・表以外の属性)と判定された場合、または、S2701で箇条書きであると判断された場合、S2712において、表示範囲制御部2403は、以下の処理を行う。すなわち、表示範囲制御部2403は、当該オブジェクト全体がタッチUI1904に入るように、ページの表示倍率を設定する。そして、S2710において、オブジェクトの中央がタッチUI1904の中央に合うようにページ2300の始点を設定する。
「次へボタン」2302がユーザによりタップ(指定)されたときに実行される「次選択処理(次へボタン選択処理)」について、図28のフローチャートを用いて説明する。
S2800において、表示変更イベント処理部2400は、次処理項目である「次へボタン」2302がタップされたときに携帯端末107に設定されている表示モードを取得する。取得した表示モードが部分領域表示モードである場合には、S2801に進み、ページ表示モードである場合にはS2805に進む。
S2801において、表示順番制御部2402は、現在読み込んでいるページの全オブジェクトから、文書構造ツリーに基づいて次に表示すべきオブジェクトを選択し、そのオブジェクトを読み込む。本実施形態において、文書ツリー構造上の表示順番は、文書ツリー構造において、先頭の上位階層のオブジェクト、そのオブジェクトの下位階層に属するオブジェクトの順とする。更に、その下位階層のオブジェクトの表示が全て終わった後、次の上位階層のオブジェクト、その下位階層のオブジェクト、というような順番であるとする。
例えば、図17において、V0はページを表し、最初に読み込まれるオブジェクトはH1である。H1のオブジェクトが部分領域表示モードでタッチUI1904に表示されている状態で、「次選択処理」が行われると、H1は下位階層を持つため、T1のオブジェクトが読み込まれる。さらに、T1のオブジェクトが表示されている状態で「次選択処理」が行われると、T1は下位階層を持たず、同階層にT2が存在するため、T2が読み込まれる。T2のオブジェクトが表示されている状態で「次選択処理」が行われると、T2は下位階層を持たず、同階層に次のオブジェクトは存在しないため、次の上位階層のS1が読み込まれる。なお、本実施例において、描画要素を持たないH1を選択して読み込むとしているが、描画要素を持つT1やT2だけを選択するようにしても良いことは言うまでもない。また、例えば、文字属性のオブジェクトのみなど、特定の属性を持つオブジェクトのみを選択したり、特定の属性のみを除外して選択することも可能である。さらに、H1やV1といったそれ単体では描画要素を持たず、下位下層に描画要素を持つオブジェクトのみを選択することも可能である。
S2802において、表示順番制御部2402は、S2801で次のオブジェクトを読み込めたか否かを判定する。S2801で次のオブジェクトが読み込めた場合(選択可能なオブジェクトがあった場合)は、当該読み込んだオブジェクトを処理対象としてS2809に進む。
S2809において、表示順番制御部2402は、S2800で取得した表示モードが折り返し表示モードであった場合には、S2810において、半透明マスク2600を表示して、表示モードを部分領域表示モードへと切り替える。また、S2800で取得した表示モードが折り返し表示モードでない場合には、処理はS2506に進む。なお、S2506の部分領域表示範囲決定処理は図27で説明した処理と同様であるため、ここでの説明は省く。そして、S2803において、当該読み込まれたオブジェクトの属性および始点と幅、高さに基づいて制御されたページの表示倍率と始点を用いて、タッチUI1904の表示状態を更新する。
一方、S2801で次のオブジェクトが読み込めなかった場合(次に選択可能なオブジェクトが無かった場合)は、既にページ内の最終オブジェクトが読み込まれている状態である。従って、表示順番制御部2402は、S2802で全てのオブジェクトの表示処理が終了したと判断し、S2804に進む。S2804において、表示順番制御部2402は、部分領域表示モードを終了して半透明マスク2600を非表示にして、ページ表示モードへと切り替える。
S2805において、表示モードがページ表示モードであるので、RAM1911に保存したアプリケーション画像データの構文を解析し、次のページと、それに含まれるオブジェクトを読み込む。
S2806において、表示順番制御部2402は、S2805で次のページが読み込めた場合はS2807に進む。一方、既にRAM1911に保存したアプリケーション画像データの最終ページが読み込まれている状態であり、S2805で次に読み込み可能なページが無かった場合は、S2808に進む。S2808では、RAM1911に保存したアプリケーション画像データの構文を解析し、先頭ページと、それに含まれるオブジェクトを読み込む。
次に、S2807において、表示範囲制御部2403は、前述した通り、タッチUI1904の幅に合わせてページの表示倍率を制御すると共に、ページの始点を制御して、ページの表示範囲を決定する。S2803では、表示範囲制御部2403は、当該決定されたページ表示範囲に基づいてタッチUI1904の表示状態を更新する。
次に、「前へボタン」2303がユーザによりタップ(指定)されたときに実行される「前選択処理(前へボタン選択処理)」について、図29のフローチャートを用いて説明する。前選択処理は、次選択処理とほぼ同じ構成であるため、ここでは処理が異なるS2900とS2901、S2902についてのみ説明する。
現在の表示モードが部分領域モードの場合、S2900において、表示順番制御部2402は、現在読み込んでいるページの全オブジェクトから文書構造ツリーに基づいて次に表示すべきオブジェクトを選択し、そのオブジェクトを読み込む。本実施例において、「前へボタン」が指定されたときの文書ツリー構造上の表示順番は、文書ツリー構造において末尾の下位階層のオブジェクト、そのオブジェクトの上位階層のオブジェクトというように、下位階層から上位階層への順番であるとする。すなわち、下位階層のオブジェクトの表示が全て終わった後、その上位階層における他のオブジェクトの表示へと移るものとする。
例えば、図17において、最初に読み込まれるオブジェクトは末尾の下位階層オブジェクトであるT7である。部分領域表示モードで、T7のオブジェクトがタッチUI1904に表示されている状態で、前処理項目である「前へボタン」が押下されると、同じ階層にT6が存在するため、T6のオブジェクトが読み込まれる。さらに、T6のオブジェクトが表示されている状態で「前選択処理」が行われると、同じ階層にその他のオブジェクトが存在しないため、その上位階層であるV2が読み込まれる。V2のオブジェクトが表示されている状態で「前選択処理」が行われると、V2は同じ階層にV1を持ち、更にV1は下位階層にオブジェクトを持つため、V1の下位階層の末尾にあるT5のオブジェクトが読み込まれる。
なお、「前選択処理」においても、「次選択処理」と同様に、描画要素を持つオブジェクトだけを選択するようにしても良く、また、特定の属性を持つオブジェクトのみを選択したり、特定の属性のみを除外して選択することも可能である。さらに、H1やV1といったそれ単体では描画要素を持たず、下位下層に描画要素を持つオブジェクトのみを選択することも可能である。
S2901において、表示モードがページ表示モードであるので、RAM1911に保存したアプリケーション画像データの構文を解析し、前のページと、それに含まれるオブジェクトを読み込む。S2806において、既にRAM1911に保存したアプリケーション画像データの先頭ページが読み込まれている状態である。S2901で次に読み込み可能なページが無かった場合は、S2902において、RAM1911に保存したアプリケーション画像データの構文を解析し、最終ページと、それに含まれるオブジェクトを読み込む。
次に、スワイプイベント処理部2401の移動範囲制限部2404が行う移動範囲制限処理について、図30のフローチャートを用いて説明する。S3000において、移動範囲制限部2404は、スワイプ操作が行われたときの携帯端末107に設定されている表示モードを取得して、現在の表示モードを判定する。移動範囲制限部2404は、表示モードが部分領域表示モードである場合にはS3001に処理を進め、ページ表示モードである場合には何も行わずに処理を終了する。
S3000で表示モードが部分領域表示モードであると判定した場合には、S3001に処理が進む。S3001において、移動範囲制限部2404は、現在のページの表示倍率で表示したときの現在読み込まれているオブジェクトの幅が、タッチUI1904の画面の幅より大きいか否かを判定する。このとき、該オブジェクトの幅がタッチUIの画面幅よりも大きい場合には、S3002に進み、そうでない場合には、S3004に進む。
S3002において、スワイプイベント処理部2401がスワイプイベントの移動距離に応じてオブジェクトを含むページの表示位置を移動した際に、移動範囲制限部2404は、以下の判定を行う。つまり、移動範囲制限部2404は、オブジェクトの左右端のどちらか一端がタッチUI1904の画面内に移動したかを判定する。その結果、オブジェクトの左端または右端がタッチUIの画面内にあると判定した場合には、S3003に進み、そうでない場合には、S3006に進む。
S3003において、移動範囲制限部2404は、画面内に移動された該オブジェクトの左端または右端をタッチUIの画面の端に移動させて、できるだけ該オブジェクトが表示されるように、ページの始点のx座標を補正する。
一方、S3004において、スワイプイベントの移動距離に応じてオブジェクトを含むページの表示位置を移動した際に、移動範囲制限部2404は、オブジェクトの左端または右端がタッチUIの画面外に移動したかを判定する。その結果、オブジェクトの左端または右端がタッチUIの画面外にあると判定した場合には、S3005に進み、そうでない場合には、S3006に進む。
S3005において、移動範囲制限部2404は、当該オブジェクトの左端または右端を画面の端に移動させて、該オブジェクトの全体が表示されるようにページの始点のx座標を補正する。オブジェクトの大きさが画面以下であれば、当該補正によりユーザの視認性が向上する。S3006において、移動範囲制限部2404は、現在のページの表示倍率で表示したときの現在読み込まれているオブジェクトの高さが、タッチUI1904の画面の高さより大きいか否かを判定する。このとき、該オブジェクトの高さがタッチUIの画面高さよりも大きい場合には、S3007に進み、そうでない場合には、S3009に進む。
S3007において、移動範囲制限部2404は、スワイプイベントの移動距離に応じてオブジェクトを含むページの表示位置を移動した際に、オブジェクトの上下端のどちらか一端がタッチUI1904の画面内に移動したかを判定する。その結果、オブジェクトの上端または下端がタッチUIの画面内にあると判定した場合には、S3008に進み、そうでない場合には、S3011に進む。
S3008において、移動範囲制限部2404は、画面内に移動されたオブジェクトの上端または下端を画面の端に移動させて、できるだけ該オブジェクトが表示されるようにページの始点のy座標を補正する。
S3006でオブジェクトの高さがタッチUIの画面高さよりも大きくない場合には、S3009に処理が進む。S3009において、移動範囲制限部2404は、スワイプイベントの移動距離に応じてオブジェクトを含むページの表示位置を移動した際に、オブジェクトの上端または下端がタッチUIの画面外に移動したかを判定する。オブジェクトの上端または下端がタッチUIの画面外に移動したと判定した場合には、S3010に進み、そうでない場合には、S3011に進む。
S3010において、移動範囲制限部2404は、当該オブジェクトの上端または下端を画面内に移動させて、該オブジェクトの全体が表示されるようにページの始点のy座標を補正する。最後に、S3011において、表示変更イベント処理部2400は、ページの表示倍率と始点に応じてタッチUI1904の表示状態を更新する。
このように、オブジェクトの移動範囲を制限することで、ユーザは、スワイプイベントの移動距離が大きい場合でもできるかぎりオブジェクト全体を認識することが可能となる。
次に、ピンチイン操作がなされたときに、拡大・縮小イベント処理部2405の縮小時表示モード切替部2406で行われる縮小時表示モード切替処理について、図31のフローチャートを用いて説明する。S3100において、縮小時表示モード切替部2406は、ユーザにより縮小処理を指示する操作が行われたときの携帯端末107に設定されている表示モードを取得する。取得した表示モードが部分領域表示モードである場合にはS3101に進み、折り返し表示モードあるいはページ表示モードである場合にはS3106に進む。
S3101において、縮小時表示モード切替部2406は、現在のページの表示倍率で表示したときの現在読み込まれているオブジェクトの幅が、タッチUI1904の画面の幅より小さいか否かを判定する。オブジェクトの幅がタッチUIの画面幅よりも小さい場合には、S3102に進み、そうでない場合には切替処理を行わずに処理を終了する。
S3102において、縮小時表示モード切替部2406は、現在のページの表示倍率で表示したときの現在読み込まれているオブジェクトの高さが、タッチUI1904の画面の高さより小さいか否かを判定する。このとき、該オブジェクトの高さがタッチUIの画面高さよりも小さい場合には、S3103に進み、そうでない場合には切替処理を行わずに処理を終了する。
S3103において、該オブジェクトを含むページの表示倍率がさらに縮小されようとしているのかを判断する。すなわち、縮小時表示モード切替部2406が受信したイベントがピンチインイベントであるか否かを判定する。ここで、ページがさらに縮小されようとしていると判断した場合には、S3104に進み、そうでない場合には何も行わずに処理を終了する。
S3104において、縮小時表示モード切替部2406は、半透明マスク2600を非表示にして、携帯端末107の表示モードを部分領域表示モードからページ表示モードに切り替える。つまり、部分領域表示モードにおいてオブジェクト全体が画面内に表示されており、かつピンチイベントが行われている場合に縮小時表示モード切替部2406は第3の表示モードであるページ表示モードに切り替える。最後に、S3105において、表示変更イベント処理部2400は、該ピンチインイベントに基づいて決定されるページの表示倍率と始点に応じてタッチUI1904の表示状態を更新する。
また、S3106において、縮小時表示モード切替部2406は、携帯端末107に設定されている表示モードを取得し、折り返し表示モードであるか否かを判定する。表示モードが折り返し表示モードである場合にはS3107に進み、そうでない場合には切替処理を行わずに処理を終了する。
S3107において、縮小時表示モード切替部2406は、折り返し表示モードで表示しているオブジェクトの文字の組み方向を取得する。オブジェクトの組み方向は、S504のベクトル化の過程で得られている。取得した文字の組み方向が横書きである場合にはS3108に、縦書きである場合にはS3109に進む。
S3108において、縮小時表示モード切替部2406は、受信したピンチインイベントの縮小率に応じてページの表示倍率を変化させたときの現在読み込まれているオブジェクトの幅が、タッチUI1904の画面の幅以下になるかを判定する。このとき、該オブジェクトの幅がタッチUIの画面幅以下になる場合には、S3110に進み、そうでない場合には切替処理を行わずに処理を終了する。
また、S3109において、縮小時表示モード切替部2406は、S3108と同様にページの表示倍率を変化させたときのオブジェクトの高さが、タッチUI1904の画面の高さ以下になるかを判定する。このとき、該オブジェクトの高さがタッチUIの画面高さ以下になる場合には、S3110に進み、そうでない場合には切替処理を行わずに処理を終了する。
次に、S3110において、縮小時表示モード切替部2406は、後述する文字折り返し画像を非表示に、半透明マスク2600とページ2300を表示にして、携帯端末107の表示モードを部分領域表示モードに切り替える。その後、S3105にて、タッチUI1904の表示状態を更新する。
ここで、図26と図33を用いて、前述の折り返し表示モードと文字折り返し画像について詳細に説明する。図33は、本実施例における携帯端末107のタッチUI1904の画面表示例である。
図33は、図26の文字オブジェクト2601を折り返し表示モードでタッチUI1904の画面に表示した一例である。図33にはページ2300と半透明マスク2600は表示されず、代わりに文字折り返し画像3300が表示される。文字折り返し画像3300は、携帯端末107の描画部2003がオブジェクト2601の保持する文字コードデータをタッチUI1904の画面サイズに合わせてレンダリングしたものである。
描画部2003は、ベクトル化処理の過程で得られる文字サイズと組み方向、ピンチインおよびピンチアウトイベントによって更新されるページの表示倍率に従って、文字コードデータを所望の大きさと向きでレンダリングする。図26に示すオブジェクト2601の文字の組み方向は横書きであるため、文字折り返し画像3300は、行毎に1文字ずつ組み方向にレンダリングされ、タッチUI1904の画面右端に達すると、次の行へ折り返してレンダリングされる。また、描画部2003は、文字の組み方向が縦書きであれば、列毎に1文字ずつ組み方向にレンダリングし、タッチUI1904の画面下端に達すると、次の列へ折り返した文字折り返し画像を生成する。
図33(B)は、図33(A)の状態から、さらにユーザのピンチアウト操作によって拡大されたときの一例である。図33(A)の文字折り返し画像3300は全てが画面内に収まっているが、図33(B)の文字折り返し画像3301では図33(A)よりも大きな表示倍率となり、描画部2003は画面内にオブジェクト全体を表示出来ない。その場合には、描画部2003はタッチUI1904の画面にスライドバー3302を表示し、現在タッチUI1904の画面に表示されている文字折り返し画像3300の全体に対する位置をユーザに知らせることが出来る。スワイプイベント処理部2401で文字折り返し画像3300が移動されると、その移動距離に応じて描画部2003がスライドバー3302の表示を変化させる。
次に、ピンチアウト操作がなされたときに、拡大時表示モード切替部2407で行われる拡大時表示モード切替処理について、図34のフローチャートを用いて説明する。まず、S3400において、拡大・縮小イベント処理部2405の拡大時表示モード切替部2407は、ユーザにより拡大処理を指示する操作が行われたときの携帯端末107に設定されている表示モードを取得する。取得した表示モードが部分領域表示モードである場合にはS3401に進み、部分領域表示モードでない場合には何も行わずに処理を終了する。
S3401において、拡大時表示モード切替部2407は、現在読み込まれているオブジェクトの属性を判定する。属性が文字の場合はS3402に進み、属性が文字でない場合には何も行わずに処理を終了する。
S3402において、拡大時表示モード切替部2407は、現在読み込まれているオブジェクトが文字コードデータを保持しているか否かを判定する。読み込まれているオブジェクトが文字コードデータを持つ場合はS3403に進み、持たない場合は何も行わずに処理を終了する。
S3403において、拡大時表示モード切替部2407は、現在読み込まれているオブジェクトの文字の組み方向を取得する。オブジェクトの組み方向は、S504のベクトル化の過程で得られている。取得した文字の組み方向が横書きである場合にはS3404に、縦書きである場合にはS3405に進む。
S3404において、拡大時表示モード切替部2407は、受信したピンチアウトイベントの拡大率に応じてページの表示倍率を変化させたときの現在読み込まれているオブジェクトの幅が、タッチUI1904の画面の幅より大きくなるかを判定する。このとき、オブジェクトの幅がタッチUIの画面幅より大きくなる場合には、S3406に進み、そうでない場合には何も行わずに処理を終了する。
また、S3405において、拡大時表示モード切替部2407は、S3404と同様にページの表示倍率を変化させたときのオブジェクトの高さが、タッチUI1904の画面の高さより大きくなるかを判定する。このとき、オブジェクトの高さがタッチUIの画面高さより大きくなる場合には、S3406に進み、そうでない場合には何も行わずに処理を終了する。
次に、S3406において、拡大時表示モード切替部2407は、半透明マスク2600とページ2300を非表示にし、文字折り返し画像を表示にして、携帯端末107の表示モードを折り返し表示モードに切り替える。その後、S3407にて、タッチUI1904の表示状態を更新する。
つまり、本実施形態では、縮小時表示モード切替処理、及び拡大時表示モード切替処理において、文字属性のオブジェクトが文字の組み方向に対して画面に収まらない大きさになる場合に、表示モードを折り返し表示モードへと切り替える。これにより、ユーザの拡大指示によって、文字を読む際に、少なくとも2方向への移動操作が必要になっていた文字属性のオブジェクトを、どのような表示倍率においても、1方向への移動操作だけで読むことが可能となる。
なお、本実施形態の拡大時表示モード切替処理において、H1やV1といったそれ単体では描画要素を持たないオブジェクトであっても折り返し表示モードに切り替えることが可能である。その場合は、S3401において、下位下層に文字オブジェクトがあるか否かを判定し、S3402でそれらオブジェクトが文字コードデータを保持していれば、携帯端末107の表示モードを折り返し表示モードに切り替える。その際、タッチUI1904の画面に表示する文字折り返し画像の生成には、それらオブジェクトの文字コードデータが用いられる。
次に、オブジェクト選択処理について、図32のフローチャートを用いて説明する。オブジェクト選択処理は、ユーザによりダブルタップ操作が行われた際にオブジェクト選択処理部2408が実行する処理である。まず、S3200において、オブジェクト選択処理部2408は、ユーザにより操作が行われたときの携帯端末107に設定されている表示モードを取得する。取得した表示モードがページ表示モードである場合にはS3201に進み、部分領域表示モードである場合には何も行わすに処理を終了する。
S3201において、オブジェクト選択処理部2408は、受信したダブルタップイベントのタッチ座標の座標値を取得する。タッチ座標の座標値はタッチUI1904上の座標値であるため、タッチUIに表示しているページの表示倍率と始点に基づいて、ページにおける座標値に換算する。
S3202において、タッチUIに表示している現在のページ内の全オブジェクトの中から先頭オブジェクトの情報を読み込む。S3203において、S3201で求めたページにおける座標値が、読み込んだオブジェクトの領域情報内に含まれるか否かを判定する。ページにおける座標値が当該読み込んだオブジェクトの領域情報内にある場合にはS3204に進み、そうでない場合にはS3206に進む。
S3204において、携帯端末107の表示モードをページ表示モードから部分領域表示モードに切り替える。同時に、非表示であった半透明マスク2600を表示することで、当該ダブルタップされたオブジェクト以外の領域に半透明マスクがかかるように制御し、S2506に進む。
S2506において、S3202またはS3206で読み込んだオブジェクト(すなわち、当該ダブルタップされたオブジェクト)の部分領域表示範囲決定処理を行う。部分領域表示範囲決定処理については前述した通りであるので、ここでの詳細な説明は省く。
そして、S3205において、表示変更イベント処理部2400は、部分領域表示範囲決定処理で決定したページの表示倍率と始点に応じてタッチUI1904の表示状態を更新する。
また一方、S3206において、オブジェクト選択処理部2408は、現在のページ内の全オブジェクトの中から、現在読み込んでいるオブジェクトの次のオブジェクトの情報を読み込む。
S3207において、オブジェクト選択処理部2408は、S3206で次のオブジェクトが読み込めたか否かを判定し、読み込めた場合にはS3203に戻り、読み込めなかった場合には何もせずに処理を終了する。
なお、本実施例において、現在タッチUI1904に表示しているページ内の全オブジェクトを対象に、ページにおける座標値がオブジェクトの領域情報内にあるか否かを判定しているが、それに限るものではない。例えば、前選択処理や後選択処理と同様に、描画要素を持たないオブジェクトを無視し、描画要素を持つオブジェクトだけを選択するようにしても良い。また、例えば、文字属性のオブジェクトのみなど、特定の属性を持つオブジェクトのみを選択したり、特定の属性のみを除外して選択することも可能である。さらに、オブジェクト自体は描画要素を持たず、下位下層に描画要素を持つオブジェクトを選択することも可能である。
次に、図26と図33、図35、図36を用いて、本実施形態における部分領域表示モードと折り返し表示モードの表示を具体的に説明する。図35、図36は、本実施例における携帯端末107のタッチUI1904の画面表示例である。
図26において、オブジェクト2601は横書きの文字の属性を持つオブジェクトである。オブジェクト2601は、図26(A)のように破線で示す領域情報を持つ。オブジェクト2601の属性は文字であるため、部分領域表示モードでオブジェクト2601が読み込まれた直後は、部分領域表示範囲決定処理において、オブジェクトの幅がタッチUI1904の画面幅に入る倍率に、ページの表示倍率が設定される。オブジェクト2601の場合、当該設定されたページの表示倍率において、オブジェクトの高さも、タッチUI1904の画面の高さより小さくなる。従って、描画部2003は、該オブジェクトの中心がタッチUI1904の中心に合うように、ページの始点を設定し、図26(B)に示すように表示する。
図33は、オブジェクト2601を折り返し表示モードで表示した場合の画面表示例であり、タッチUI1904の画面には文字折り返し画像3300が表示されている。図26(B)はオブジェクト2601を強調表示した部分領域表示モードであり、この状態でユーザがタッチUI1904に対してピンチアウト操作を行うと、拡大時表示モード切替処理が実行される。オブジェクト2601の文字の組み方向は横書きであり、ピンチアウトイベントの拡大率に応じて変化するオブジェクトの幅が、前述の通りタッチUI1904の画面の幅より大きくなると、図33(A)に示す折り返し表示モードへと移行する。
図33(B)は、図33(A)の折り返し表示モードの状態で、さらにユーザがタッチUI1904に対してピンチアウト操作を行った場合の例である。描画部2003は、ピンチアウトイベントの拡大率に応じて、図33(B)の文字折り返し画像3301を、文字折り返し画像3300よりも大きな文字サイズでレンダリングする。文字折り返し画像3301は、文字折り返し画像3300よりも大きな文字サイズであるため、1行に入る文字数は少なくなる。それによって、文字折り返し画像3301は、タッチUI1904の画面の高さには収まらなくなるため、前述の通りスライドバー3302が表示される。図33(B)に示すように、スライドバー3302は、折り返し表示モードで表示しているオブジェクトの文字の組み方向と直交する方向、すなわち、文字が横書きであれば、垂直方向にスワイプ可能なスライドバーをタッチUI1904の画面上に配置される。
また、図35は、縦書きの文字の属性を持つオブジェクト3500を含むページを示す。オブジェクト3500は、図35(A)のように破線で示す領域情報を持つ。オブジェクト3500の属性は文字であるため、部分領域表示モードでオブジェクト3500が読み込まれた直後は、部分領域表示範囲決定処理において、オブジェクトの高さがタッチUI1904の画面高さに入る倍率に、ページの表示倍率が設定される。また、オブジェクト3500の場合、当該設定されたページの表示倍率において、オブジェクトの幅が、タッチUI1904の画面の幅よりも大きくなる。従って、オブジェクト右上端がタッチUI1904の右上端に合うように、ページの始点が設定され、図35(B)に示すように表示される。このように部分領域表示範囲決定処理を行うことにより、文字を追うためのユーザに必要な操作が一方向に定まる。
図36は、オブジェクト3500を折り返し表示モードで表示した場合の画面表示例であり、タッチUI1904の画面には文字折り返し画像3600が表示されている。図35(B)はオブジェクト3500を強調表示した部分領域表示モードであり、この状態でユーザがタッチUI1904に対してピンチアウト操作を行うと、拡大時表示モード切替処理が実行される。オブジェクト3500の文字の組み方向は縦書きであり、ピンチアウトイベントの拡大率に応じて変化するオブジェクトの高さが、タッチUI1904の画面の高さより大きくなると、図36(A)に示す折り返し表示モードへと移行する。
図36(A)の文字折り返し画像3600は、タッチUI1904の画面の幅に収まらないため、スライドバー3602が表示される。オブジェクト3500の文字の組み方向は縦書きであるので、スライドバー3602は水平方向にスワイプ可能なスライドバーとしてタッチUI1904の画面上に配置される。図36(B)は、図36(A)の折り返し表示モードの状態で、さらにユーザがタッチUI1904に対してピンチアウト操作を行った場合の例である。描画部2003は、ピンチアウトイベントの拡大率に応じて、図36(B)の文字折り返し画像3601を、文字折り返し画像3600よりも大きな文字サイズでレンダリングする。
なお、本実施形態において、MFP100は携帯端末107に表示用のアプリケーション画像データを送付し、携帯端末107は受信したアプリケーション画像データを表示する構成としている。しかしながら、例えば、MFP100において、アプリケーション画像データを内部に保持する携帯端末107で実行可能なアプリケーションを生成し、携帯端末107に配信するような構成にしても良いことは言うまでもない。なお、そのときの携帯端末107で実行可能なアプリケーションは、本実施形態で説明したソフトウェアモジュールであるジェスチャイベント処理部2002を内部に持って、アプリケーション画像データを制御する。
また、MFP100は、生成したアプリケーション画像データを文書管理サーバ106に送信すると共に、携帯端末107にそのアプリケーション画像データの場所を示すアドレスを送付するようにしても良い。この場合、携帯端末107はアプリケーション画像データの実体データは持たず、LAN102を通して、文書管理サーバ106のデータが保持されるデータベース105から随時ページやオブジェクトの情報を取得・表示する。
また、本実施形態の携帯端末107は、折り返し表示モードでタッチUI1904の画面に表示するための文字折り返し画像を、アプリケーション画像データに含まれる文字コードデータを用いて生成するとしたが、これに限るものではない。文字折り返し画像は1文字単位で文字を再配置できれば良く、例えば、ビットマップ画像データから文字の行や列を検出して、画素から成るビットマップの状態で、組み方向に対して画面の大きさに収まるように再配置して生成しても良い。また、文字単位で分離可能なベクトルデータで記述された文字属性のオブジェクトであれば、文字折り返し画像を、1文字単位で組み方向に対して画面の大きさに収まるようにレンダリングしても良い。
以上説明したように、本実施形態によれば、ユーザの拡大指示によって、文字を読む際に、文字属性のオブジェクトを、どのような表示倍率においても、1方向への移動操作だけで読むことが可能となる。従って、ユーザの操作性が向上する。また、文字属性のオブジェクトが文字の組み方向に対しても画面に収まらない大きさになる場合に、1方向への移動操作だけで文字を読むことが可能な折り返し表示モードへと自動で切り替える。従って、ユーザは意識せずに1方向への操作を維持することができる。さらに、オブジェクトが組み方向に対して画面に収まる大きさの表示倍率になる場合には、部分領域表示モードへと自動で切り替えるため、ページに対するオブジェクトや文字の配置を崩すことなく、原稿に忠実なレイアウトで文字を閲覧することが可能となる。
(第2実施形態)
第2実施形態では、折り返し表示モードで文字折り返し画像をタッチUI1904の画面に表示する際、ページおよび半透明マスクを描画した上に重ねて文字折り返し画像を表示する。なお、前述した第1実施形態とは、折り返し表示モードの表示方法が一部異なるのみであるため、第1実施形態と同様の部分に関しては、同一番号を付けて省略し、異なる部分のみを以下に説明する。
図37は、第2実施形態の折り返し表示モードにおける携帯端末107のタッチUI1904の画面表示例であり、第1実施形態(図33)の画面表示例とは、文字折り返し画像の背面に、ページ及び半透明マスクが表示されている点が異なる。
本実施形態において、図26(B)に示すオブジェクト2601の状態から、ユーザがタッチUI1904に対してピンチアウト操作を行うと、図34を用いて説明した拡大時表示モード切替処理が実行される。オブジェクト2601の文字の組み方向は横書きであり、ピンチアウトイベントの拡大率に応じて変化するオブジェクトの幅が、前述の通りタッチUI1904の画面の幅より大きくなると、図37(A)に示す折り返し表示モードへと移行する。本実施形態における折り返し表示モードでは、描画部2003は、部分領域表示モードでタッチUI1904の画面に表示していたページ2300と半透明マスク2600に重ねて、文字折り返し画像3300を表示する。
図37(B)は、図37(A)の折り返し表示モードの状態で、さらにユーザがピンチアウト操作を行った場合の例であり、文字折り返し画像3300よりも大きな文字サイズでレンダリングされた文字折り返し画像3301を表示している。文字折り返し画像3301は、実施例1と同様にタッチUI1904の画面の高さに収まらないため、スライドバー3302がオブジェクトの文字の組み方向と直交する方向に配置される。なお、オブジェクトの文字の組み方向が縦書きである場合には、第1実施形態と同様に描画部2003は、縦書きの文字折り返し画像を生成する。そして、描画部2003は、図37(A)と同様に、ページ2300と半透明マスク2600に重ねて文字折り返し画像を表示する。その際、文字折り返し画像が画面の幅に収まらない場合には、水平方向にスワイプ可能なスライドバーを画面上に配置する。
本実施形態では、描画部2003は、ページ2300および半透明マスク2600の上に、重ねて文字折り返し画像を表示することから、折り返し表示モードを終了させ、部分領域表示モードへと切り替えるボタン3700を画面上に表示する。図24の表示変更イベント処理部2400は、受信したシングルタップイベントのタッチ座標が、図37のボタン3700上にあった場合に、文字折り返し画像を非表示とし、部分領域表示モードへと切り替える。また、本実施例における折り返し表示モードは、ページや半透明マスクを表示したままにするため、「次選択処理」のS2810や、縮小時表示モード切替処理のS3110において、ページと半透明マスクとページを表示することは行わない。さらに、拡大時表示モード切替処理のS3406では、ページと半透明マスクを非表示とすることも行わない。
なお、本実施形態の折り返し表示モードにおいて、文字折り返し画像3300および3301はページ2300上に不透過で重ねて表示しているが、それに限るものではない。例えば、文字折り返し画像の背景色を半透明にし、重ねて表示するなどしても良いことは言うまでもない。その際、文字の可読性を確保するために、文字折り返し画像の背景色を十分低い透過率に設定することが好ましい。
以上説明したように、本実施例によれば、どのような表示倍率において、ユーザは意識することなく1方向への移動操作だけで文字を読み進められると共に、文字折り返し画像の背面に表示されたページを見ることが可能となる。そのため、文章にとって非常に重要なページレイアウトを常に意識しながら文章の操作・閲覧をすることが可能となる。さらには、部分領域表示モードで表示されていた画面が、文字折り返し画像の背面に見えるため、現在、折り返し画像表示モードで表示が行われているか否かが一見してわかり、誤操作を防ぐことができる効果もある。
(第3実施形態)
第3実施形態では、部分領域表示モードで「次へボタン」2302および「前へボタン」2303がユーザによりタップ(指定)された際、オブジェクトの表示されている部分領域に応じて動作の切り替えを行う。なお、前述した第1実施形態とは、「次選択処理」および「次選択処理」の一部異なるのみであるため、第1実施形態と同様の部分に関しては、同一番号を付けて省略し、異なる部分のみを以下に説明する。
本実施形態において、「次へボタン」2302がユーザによりタップ(指定)されたときに実行される「次選択処理(次へボタン選択処理)」について、図38のフローチャートを用いて説明する。第1実施形態(図28)とはほぼ同じ構成であるため、ここでは異なるS3800とS3801、S3802についてのみ説明する。
現在の表示モードが部分領域表示モードの場合、S3800において、表示範囲制御部2403は、タッチUI1904の画面に対する現在読み込まれているオブジェクトの終端の位置を算出する。本実施形態における前記オブジェクトの終端は、オブジェクトの属性や文字の組み方向に応じる。例えば、オブジェクトの属性が文字であり、且つ文字の組み方向が横書きである場合には、オブジェクトの右下となり、また、オブジェクトの属性が文字であり、且つ文字の組み方向が縦書きである場合には、オブジェクトの左下となる。オブジェクトの属性が表である場合には、前記部分領域表示範囲決定処理で求めるヘッダと対角の位置となる。さらに、本実施形態において、その他のオブジェクトの属性である場合には、一意にオブジェクトの右下とする。
ステップS3801において、表示範囲制御部2403は、前記オブジェクトの終端の位置が、タッチUI1904の画面内にあるか否かを判定する。判定の結果、オブジェクトの終端が画面内にある場合には、S2801に進み、次のオブジェクトの読み込みを行う。また、オブジェクトの終端が画面内に無い、すなわち、オブジェクトの終端の表示が未だ終わっていない場合には、ステップS3802に進む。
ステップS3802において、表示範囲制御部2403は、現在読み込まれているオブジェクトの次に表示すべき領域が画面内に表示されるように、ページ2300の始点を設定する。前記領域とは、オブジェクトの属性が文字である場合には、まず文字の組み方向に対して未表示の領域であり、次に文字の組み方向と直行する行方向の領域となる。
なお、当該オブジェクトの属性によっては、前記S3802の処理を行わず、S3801においてS2801へと進み、次のオブジェクトを読み込んでも良く、例えば文字の属性だけ、S3802へと進むように制御しても良いことは言うまでもない。また、本実施形態における「次選択処理」では、第1実施形態(図28)のS2806およびS2808の処理を行わず、現在読み込まれているページが最終ページである場合には、最終ページを表示するよう制御される。しかし、実施形態はこれに限定されず、第1実施形態(図28)と同様に、S2806およびS2808の処理を行っても良いことは言うまでもない。
本実施形態において、「前へボタン」2303がユーザによりタップ(指定)されたときに実行される「前選択処理(前へボタン選択処理)」について、図39のフローチャートを用いて説明する。第1実施形態(図29)とはほぼ同じ構成であるため、ここでは異なるS3900とS3901、S3902についてのみ説明する。
現在の表示モードが部分領域表示モードの場合、S3900において、表示範囲制御部2403は、タッチUI1904の画面に対する現在読み込まれているオブジェクトの始端の位置を算出する。本実施形態における前記オブジェクトの始端は、オブジェクトの属性や文字の組み方向に応じる。例えば、オブジェクトの属性が文字であり、且つ文字の組み方向が横書きである場合には、オブジェクトの左上となり、また、オブジェクトの属性が文字であり、且つ文字の組み方向が縦書きである場合には、オブジェクトの右上となる。オブジェクトの属性が表である場合には、前記部分領域表示範囲決定処理で求めるヘッダの位置となる。さらに、本実施形態において、その他のオブジェクトの属性である場合には、一意にオブジェクトの左上とする。
ステップS3901において、表示範囲制御部2403は、前記オブジェクトの始端の位置が、タッチUI1904の画面内にあるか否かを判定する。判定の結果、オブジェクトの始端が画面内にある場合には、S2900に進み、前のオブジェクトの読み込みを行う。また、オブジェクトの始端が画面内に無い、すなわち、オブジェクトの始端の表示が未だ終わっていない場合には、ステップS3902に進む。
ステップS3902において、表示範囲制御部2403は、現在読み込まれているオブジェクトの始端を含む領域が画面内に表示されるように、ページ2300の始点を設定する。前記領域とは、オブジェクトの属性が文字である場合には、まず文字の組み方向に対して未表示の領域であり、次に文字の組み方向と直行する行方向の領域となる。
なお、当該オブジェクトの属性によっては、前記S3902の処理を行わず、S3901においてS2900へと進み、前のオブジェクトを読み込んでも良く、例えば文字の属性だけ、S3902へと進むように制御しても良いことは言うまでもない。また、本実施形態における「前選択処理」では、第1実施形態(図29)のS2806およびS2902の処理を行わず、現在読み込まれているページが先頭ページである場合には、先頭ページを表示するよう制御される。しかし、実施形態はこれに限定されず、第1実施形態(図29)と同様に、S2806およびS2902の処理を行っても良いことは言うまでもない。
以上説明したように、本実施例によれば、どのような表示倍率において、ユーザは意識することなく1方向への移動操作だけで文字を読み進められると共に、部分領域表示モードにおいても、ボタン操作のみで、文字を読み進めることが可能となる。
(その他の実施例)
本発明は、複数の機器(例えばホストコンピュータ、インターフェース機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。また本発明の目的は、前述の実施例の機能を実現するプログラムコード(コンピュータプログラム)を記録した記録媒体を、システムあるいは装置に供給する。供給されたシステムあるいは装置のコンピュータが記憶媒体に格納されたプログラムコードを読み出し実行することによっても達成される。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体およびプログラムコードを記憶した記憶媒体は本発明を構成することになる。
また、本発明には、プログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施例の機能が実現される場合も含まれる。さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた場合についても、本発明は適用される。その場合、書き込まれたプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施例の機能が実現される。
また、上述した実施形態では、コンピュータがプログラムを実行することにより、各処理部として機能するものとしたが、処理の一部または全部を専用の電子回路(ハードウェア)で構成するようにしても構わない。