JP2017187923A - 文書処理装置、文書処理方法、端末および方法 - Google Patents
文書処理装置、文書処理方法、端末および方法 Download PDFInfo
- Publication number
- JP2017187923A JP2017187923A JP2016076115A JP2016076115A JP2017187923A JP 2017187923 A JP2017187923 A JP 2017187923A JP 2016076115 A JP2016076115 A JP 2016076115A JP 2016076115 A JP2016076115 A JP 2016076115A JP 2017187923 A JP2017187923 A JP 2017187923A
- Authority
- JP
- Japan
- Prior art keywords
- reading order
- order information
- information
- browsing
- electronic document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Document Processing Apparatus (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Analysis (AREA)
Abstract
【課題】閲覧の際にユーザにかかる負荷を低減する。
【解決手段】文書処理装置は、電子文書を取得する取得手段と、電子文書の構造に基づいて該電子文書から複数の閲覧単位領域を抽出する抽出手段と、それぞれが複数の閲覧単位領域の表示の順番を指定する複数の読み順情報を設定する設定手段と、複数の読み順情報が付加された新たな電子文書を生成する生成手段と、を備える。
【選択図】図1
【解決手段】文書処理装置は、電子文書を取得する取得手段と、電子文書の構造に基づいて該電子文書から複数の閲覧単位領域を抽出する抽出手段と、それぞれが複数の閲覧単位領域の表示の順番を指定する複数の読み順情報を設定する設定手段と、複数の読み順情報が付加された新たな電子文書を生成する生成手段と、を備える。
【選択図】図1
Description
本発明は、文書処理装置、文書処理方法、端末および方法に関する。
文書の1ページ全体を画像化したページ画像を、タブレットやスマートフォン等のデバイスの、表示面積の限られたディスプレイで閲覧する場合がある。この際、ページ全体を表示すると、文字などの内容が小さくなり可読性が低下しうる。これに対し、ページ画像の内容を解析し、文字や図、写真等の文書領域を個別に抽出する技術がある。この技術を用いることで、小さいディスプレイに文書領域を個々に拡大して表示し、可読性を上げる閲覧制御方法がある。さらに、ページ内容を解析する際、文書領域の配置から文書構造を仮定することで、文書領域に対する読み順を推定する技術がある。例えば特許文献1には、表示デバイスを備える端末で動作する閲覧制御ソフトウエアが、ページ画像に付与された読み順情報を用いて拡大表示を制御することが記載されている。その結果、ユーザはページ全体を見ることなく、単純な操作で文書領域を順番に移動しながら自動的に読み進めることが可能になる。
しかしながら、ページ解析による読み順の推定は必ずしも正確ではなく、誤った読み順が設定されることがある。この場合、ユーザは手動で読み順を設定しなおす必要がある。もしくは、読み方が一意に定まらないページ画像については、ユーザが自動的な閲覧制御に頼らず自力で表示場所を選んで移動し拡大する必要がある場合が多い。その結果、閲覧の際にユーザにかかる負荷が増大しうる。
本発明はこうした課題に鑑みてなされたものであり、その目的は、閲覧の際にユーザにかかる負荷を低減できる技術の提供にある。
本発明のある態様は文書処理装置に関する。この文書処理装置は、電子文書を取得する取得手段と、電子文書の構造に基づいて該電子文書から複数の閲覧単位領域を抽出する抽出手段と、それぞれが複数の閲覧単位領域の表示の順番を指定する複数の読み順情報を設定する設定手段と、複数の読み順情報が付加された新たな電子文書を生成する生成手段と、を備える。
本発明の別の態様は、端末である。この端末は、複数の閲覧単位領域を有する電子文書を閲覧単位領域ごとにディスプレイに表示させる端末であって、それぞれが複数の閲覧単位領域の表示の順番を指定する複数の読み順情報が付加された電子文書を取得する取得手段と、ユーザから、複数の読み順情報のうちのひとつの選択を受け付ける受付手段と、を備える。
本発明によれば、閲覧の際にユーザにかかる負荷を低減できる。
以下、図面を参照して本発明の実施の形態を説明する。ただし、本発明の実施の形態は以下の実施の形態に限定されるものではない。各図面に示される同一または同等の構成要素、部材、処理には、同一の符号を付するものとし、適宜重複した説明は省略する。また、各図面において説明上重要ではない部材の一部は省略して表示する。
実施の形態では、端末で電子文書を表示する際、電子文書を閲覧単位領域に分けて閲覧単位領域ごとにディスプレイに表示する。電子文書にはそれぞれが閲覧単位領域の表示の順番を指定する複数の読み順情報が付加されている。これらの複数の読み順情報は、電子文書の構造を解析し、解析結果を読み順設定のためのレイアウトのテンプレートと比較することにより、得られる。このように、ひとつではなく複数の読み順情報を電子文書に付加することで、閲覧側に読み順選択の自由度を与えることができ、ユーザが希望する通りの順番で閲覧を進めることができる蓋然性が高まる。
(第1の実施の形態)
図1(a)は、第1の実施の形態に係る文書処理方法による閲覧制御情報の生成と、同情報による閲覧制御を実施するシステムの構成を示す図である。図1(a)に示されるオフィス100内には、紙の文書を画像データに変換するスキャナ101と、画像データを電子文書に変換する文書変換サーバ102と、電子文書を保管・管理する文書管理サーバ103と、がある。これらはオフィス100内のLANなどのネットワーク104に接続され相互に通信可能な状態にある。またオフィス100内のネットワーク104は、プロキシサーバ105を通じて、オフィス100外のネットワーク106と接続される。タブレットやスマートフォンなどの携帯情報端末107は、これらのネットワーク106、104を通じて、文書管理サーバ103に保管される電子文書を取得し表示する。なお、図1(a)の構成は一例であり、携帯情報端末107がオフィス100内のネットワーク104に接続されていてもよい。または、オフィス100内のスキャナ101や文書変換サーバ102や文書管理サーバ103が各々別のネットワークに接続されていてもよい。
図1(a)は、第1の実施の形態に係る文書処理方法による閲覧制御情報の生成と、同情報による閲覧制御を実施するシステムの構成を示す図である。図1(a)に示されるオフィス100内には、紙の文書を画像データに変換するスキャナ101と、画像データを電子文書に変換する文書変換サーバ102と、電子文書を保管・管理する文書管理サーバ103と、がある。これらはオフィス100内のLANなどのネットワーク104に接続され相互に通信可能な状態にある。またオフィス100内のネットワーク104は、プロキシサーバ105を通じて、オフィス100外のネットワーク106と接続される。タブレットやスマートフォンなどの携帯情報端末107は、これらのネットワーク106、104を通じて、文書管理サーバ103に保管される電子文書を取得し表示する。なお、図1(a)の構成は一例であり、携帯情報端末107がオフィス100内のネットワーク104に接続されていてもよい。または、オフィス100内のスキャナ101や文書変換サーバ102や文書管理サーバ103が各々別のネットワークに接続されていてもよい。
図1(b)は、本実施の形態に係る文書処理方法による閲覧制御情報の生成を実施する文書変換サーバ102の機能および構成を示すブロック図である。文書変換サーバ102は、画像取得部201と、領域解析部202と、読み順設定部203と、電子文書出力部204と、制御部205と、記憶部206と、通信部207と、を備える。読み順設定部203は、適合度算出部208と、レイアウト選出部209と、を含む。
画像取得部201は、処理対象である電子文書を取得する。電子文書は構造化されていてもよい。領域解析部202は電子文書のページ画像を解析してページ画像の構造を取得し、取得された構造に基づいてページ画像に含まれる文字・図・写真などの複数の閲覧単位領域を抽出する抽出部として機能する。読み順設定部203は抽出された複数の閲覧単位領域に対する読み進め方を指定する読み順情報を設定する。電子文書出力部204は、ページ画像と、読み順情報が付与された閲覧対象領域の情報である付加情報と、を含む新たな電子文書を生成する生成部として機能する。電子文書出力部204は、生成された電子文書を出力する。制御部205は文書変換サーバ102全体の動作を司るCPUなどから構成される。画像取得部201、領域解析部202、読み順設定部203、電子文書出力部204のそれぞれは、制御部205が実行するソフトウエアとして構成されてもよい。記憶部206は、制御部205の動作に必要なメモリ・HDD等である。通信部207は文書変換サーバ102と外部の装置との間でデータを交換する。
図2は、図1(a)の文書変換サーバ102で実行される閲覧制御情報の生成処理を示すフローチャートである。ステップS301では、画像取得部201は処理対象の電子文書のページ画像を取得する。例えば、画像取得部201は記憶部206の所定領域に配置された対象ページ画像のデータを読み込む。ステップS302では、領域解析部202は、取得されたページ画像中の複数の閲覧単位領域を抽出する。領域解析部202で行われる領域解析は公知の技術により実現されてもよい。領域解析部202で行われる領域解析の一例は以下の通りである。領域解析部202は、取得された画像を二値化し、画素ラベリング処理などで独立黒画素塊を抽出する。領域解析部202は、抽出画素塊を形状や大きさなどで文字、非文字に分類する。領域解析部202は、文字と分類された黒画素塊の集合に対し、近傍との距離の小さいものを文字列としてグループ化する。領域解析部202は、ほぼ均等間隔で横または縦に整列された文字列の集合を囲む矩形を文字領域として判定する。領域解析部202は、それ以外のグループ、あるいは非文字と分類された画素塊のグループを図画領域または写真領域として判定する。
図3(a)は、例示的なページ画像400を示す図である。図3(b)は、図3(a)に示されるページ画像400に対する領域解析の結果を示す図である。ページ画像400は、その内容として、ページのタイトル文字列401と、ページの本文文字列402、403および404と、図画405と、写真406と、を含む。図3(b)に示される領域解析の結果において、閲覧単位領域Aはタイトル文字列401に相当する。閲覧単位領域B、D、Fは本文文字列402に対応し、文字列間の距離が離れた箇所で3つの領域へと分割されている。同様に閲覧単位領域C、Eは本文文字列403に対応する。閲覧単位領域Gは写真406に、閲覧単位領域Hは図画405に、閲覧単位領域Iは本文文字列404にそれぞれ対応する。領域解析の結果のデータは、閲覧単位領域の外接矩形座標(左上のx、y座標値と幅w、高さh)と、閲覧単位領域の属性(TEXT、FIGURE、PHOTOなど)と、で表される。なお、以下では同データの格納順は図3(b)における領域の記号A〜Hの順番とするが、この順番は各領域の左上の座標値が小さい順に並べた仮の順番であり、読み順とは異なる。
読み順設定部203は、続くステップS303〜S306およびS308〜S310の処理を実行する。ステップS303では、読み順設定部203の適合度算出部208は、ステップS302で抽出された複数の閲覧単位領域の電子文書における配置と、異なる複数のレイアウトのテンプレートと、の間の適合度をレイアウトごとに算出する。テンプレートは、予め定められたまたは所与のレイアウトであり、例えば電子文書の作成者が文字列、図、写真といった文書領域をページ上へ意図的に配置する際の典型的なレイアウトである。また、本実施の形態におけるテンプレートは、後述の通り、読み順情報の設定のために使用される情報を含む。読み順設定部203は、テンプレートと複数の閲覧単位領域との適合度を利用して、取得されたページ画像がどのような意図に基づいて生成されたものかを推定する。
図3(c)、図3(d)、図3(e)はそれぞれ、例示的な3つのテンプレート501、502、503を示す図である。テンプレート501は、2つのテンプレート要素枠511と512とを含む。テンプレート要素枠(以下、要素枠と称す)は、1つ以上の文書領域を、指定された縦横いずれかの方向に配置可能な枠であり、ページ文書を構成するセクションや、段組構成におけるひとつの欄に相当する。例えば、要素枠511は、ページ上部にあるタイトル文字列のセクションを配置するための枠であり、要素枠512はタイトル以下の本文セクションを構成する文字列や図・写真を配置するための枠である。要素枠511、512はいずれも内部の文書領域が上から下へ縦方向に配置されることを指定している。テンプレート502は、3個の要素枠521、522、523を含む。要素枠521は上記の要素枠511と同様のタイトル配置枠であり、要素枠522および523はそれぞれ、2段組となる本文セクションの左側の欄、右側の欄に相当する。要素枠521、522、523はいずれも内部の文書領域が上から下へ縦方向に配置されることを指定している。テンプレート503は、4個の要素枠531、532、533、534を含む。要素枠531はタイトル配置枠である。要素枠532、533は上記のテンプレート502の要素枠522、523と同様の2段組セクションの左右の欄である。要素枠532、533と要素枠522、523との違いは前者がページの下端に到達しておらず、下端には別の要素枠534が存在する点である。要素枠531、532、533が内部の文書領域が上から下へ縦方向に配置されることを指定しているのに対し、要素枠534は、左から右へ横方向に配置されることを指定している。
図4は、ステップS303における、複数の閲覧単位領域とテンプレートとの間の適合度の算出処理の例を説明するためのフローチャートである。ステップS601では、適合度算出部208に算出処理の対象となる複数の閲覧単位領域とテンプレートとが入力される。ステップS602では、適合度算出部208は、入力されたテンプレートに属している要素枠のなかで未処理のものを処理対象の要素枠として特定する。以下では、処理対象の要素枠を要素枠Fと称す。ステップS603では、適合度算出部208は、入力された複数の閲覧単位領域のうち、要素枠Fに含まれる閲覧単位領域の集合{R}を特定する。ここで「含まれる」は、閲覧単位領域の重心座標が要素枠Fの内部に存在することを意味する。
図5は、例示的な要素枠700とその中に含まれる閲覧単位領域の集合とを示す図である。要素枠700は、あるテンプレートに属するひとつの要素枠で、その内部には3つの閲覧単位領域701、702、703が含まれている。ここで、適合度算出部208は、ページ全体に対応するテンプレートに対し、各要素枠の大きさを実際の閲覧単位領域の配置にしたがって変更してもよい。具体的には、適合度算出部208は、要素枠と要素枠との隙間が、閲覧単位領域と閲覧単位領域との顕著な隙間の位置と一致するように要素枠を変形してもよい。
ステップS604では、適合度算出部208は、ステップS603で特定された閲覧単位領域の数が0より大きいか否かを判定し、大きければステップS605に進む。適合度算出部208は、0の場合はステップS608に進み、要素枠Fの一致度を0に設定する。ステップS605では、適合度算出部208は、要素枠Fと要素枠Fに含まれる各閲覧単位領域との間で、以下の6種類の距離を計算する。
HL=領域左端から要素枠F左端への距離の絶対値
HR=領域右端から要素枠F右端への距離の絶対値
VT=領域上端から要素枠F上端への距離の絶対値
VB=領域下端から要素枠F下端への距離の絶対値
HN=領域右端から、要素枠F内で右方の最近傍にある領域左端への距離(右方に他領域が存在しない場合HN=0)
VN=領域下端から、要素枠F内で下方の最近傍にある領域上端への距離(下方に他領域が存在しない場合VN=0)
HL=領域左端から要素枠F左端への距離の絶対値
HR=領域右端から要素枠F右端への距離の絶対値
VT=領域上端から要素枠F上端への距離の絶対値
VB=領域下端から要素枠F下端への距離の絶対値
HN=領域右端から、要素枠F内で右方の最近傍にある領域左端への距離(右方に他領域が存在しない場合HN=0)
VN=領域下端から、要素枠F内で下方の最近傍にある領域上端への距離(下方に他領域が存在しない場合VN=0)
ステップS606では、適合度算出部208は、要素枠Fと領域集合{R}との一致度F{R}を、下記の式1により計算する。なお、式1は要素枠Fが上から下へ縦方向に文書領域を配置するよう指定している場合の式である。図3(e)の要素枠534のように、左から右へ横方向に文書領域を配置されるよう指定している場合は、適合度算出部208は式1の縦と横とを交換した式により計算する。
F{R}=1−(a×P1+b×P2+c×P3+d×P4)…(式1)
ここで
P1=(min(VT)+min(VB))/FV
P2=(max(HR)+max(HL))/FH
P3=max(VN)/FV
P4=max(HN)/FH
a、b、c、d = あらかじめ定めた定数値による重み
FV=要素枠Fの高さ
FH=要素枠Fの幅
min(X)、max(X)=領域集合{R}の中で最小のX、最大のXを表す(Xは上記の距離のいずれか)
F{R}=1−(a×P1+b×P2+c×P3+d×P4)…(式1)
ここで
P1=(min(VT)+min(VB))/FV
P2=(max(HR)+max(HL))/FH
P3=max(VN)/FV
P4=max(HN)/FH
a、b、c、d = あらかじめ定めた定数値による重み
FV=要素枠Fの高さ
FH=要素枠Fの幅
min(X)、max(X)=領域集合{R}の中で最小のX、最大のXを表す(Xは上記の距離のいずれか)
上記の一致度F{R}を求める式1において、P1は領域集合{R}が要素枠Fの上端または下端から離れるほど大きくなるペナルティを表す。P2は領域集合{R}のなかに要素枠Fの右端または左端からの距離が大きいものがあれば大きくなるペナルティを表す。P3は要素枠F内で指定方向に配置される閲覧単位領域の間にある間隙が大きいほど大きくなるペナルティを、P4は指定方向とは異なる方向に配置される閲覧単位領域があると大きくなるペナルティを表す。
これらのペナルティP1、P2、P3、P4に対する重みa、b、c、dを実験的に定めることで、要素枠F内の閲覧単位領域の配置とテンプレートで意図したレイアウトとの一致の度合いを表す一致度の式1を定義する。例えば、a=0.1、b=0.1、c=0.5、d=0.5とする。この例では、ペナルティP3およびP4に対する重みを大きくすることで、要素枠F内における閲覧単位領域間の縦・横方向の隙間が大きい配置に対して低い一致度が算出されるようにしている。なお、これは一例であり、異なる重みを設定してもよいし、ペナルティを別の方法で求めてもよい。例えば、図5の領域703のように右端が要素枠からはみだす場合の一致度をそうでない場合の一致度よりも著しく下げるために、ペナルティP2の式のなかの距離に定数を乗じたり二乗したりしてもよい。また、距離以外の条件、例えば閲覧単位領域の面積や形状、文字領域であれば文字サイズや行方向、行間隔などを用いたペナルティを利用してもよい。さらには、それらのペナルティに対する重みを実験的にではなく、公知の機械学習技術を用いて設定してもよい。あるいは、要素枠ごとにペナルティの算出方法や重みを変更してもよい。
ステップS607では、適合度算出部208は、処理対象のテンプレートに属する要素枠のなかで一致度が未計算のものがあるか否かを判定し、ある場合はステップS602に戻る。以降、適合度算出部208は未計算の要素枠を処理対象の要素枠Fとして上記と同じ処理を繰り返す。未計算の要素枠が無い場合は適合度算出部208はステップS609に進む。
ステップS609では、適合度算出部208はテンプレートに属する要素枠に対して算出された一致度から、テンプレートと複数の閲覧単位領域との適合度を決定する。例えば、この適合度はすべての要素枠の一致度の平均値として決定されてもよい。このとき、要素枠の面積を平均値の計算時に考慮してもよい。あるいは、適合度算出部208は、最低の一致度をテンプレートの適合度として決定してもよい。また、上記のステップS603の説明で例示したように、複数の閲覧単位領域の配置にあわせて要素枠を変形した場合は、適合度算出部208はその変形の度合いを適合度に反映させてもよい。
図3(f)、図3(g)、図3(h)はそれぞれ、図3(b)の領域解析の結果とテンプレート501、502、503との適合度の算出結果を示す図である。テンプレート501について、適合度算出部208は、要素枠511の一致度は1.0、要素枠512の一致度は0.2と算出する。適合度算出部208は、要素枠511の面積と要素枠512との面積とを考慮して得た平均値0.29を、複数の閲覧単位領域とテンプレート501との適合度として決定する。同様に、適合度算出部208は、テンプレート502との適合度を0.91、テンプレート503との適合度を0.76と決定する。
図2に戻り、ステップS304では、レイアウト選出部209は、ステップS303で算出された適合度に基づいて、複数のテンプレートのなかから少なくともひとつのテンプレートを選出する。選出されたテンプレートを適合テンプレート(テンプレートはレイアウトのテンプレートであるから、適合テンプレートは適合レイアウトとも表現できる)と称す。例えばレイアウト選出部209は、適合度の算出結果に基づき、適合度の高いテンプレートを選出する。より具体的には、レイアウト選出部209は予め定めた閾値よりも高い適合度を有するテンプレートを選出してもよい。すべてのテンプレートの適合度が閾値を下回る場合は、レイアウト選出部209はそのなかで最も適合度の高いテンプレートを選出してもよい。閾値はユーザにより適宜設定されてもよい。
ステップS305では、読み順設定部203は、ステップS304で複数の適合テンプレートが選出されたか否かを判定する。読み順設定部203は、ステップS304で選出された適合テンプレートの数が1の場合はステップS306に、2以上の場合はステップS308に進む。まず、適合テンプレートの数が1の場合について説明する。例えば、図3(f)、図3(g)、図3(h)の各テンプレートの適合度について、ステップS304における閾値が0.9の場合はテンプレート502のみが適合テンプレートとして選出される。
ステップS306では、読み順設定部203は、選出されたひとつの適合テンプレートに基づきひとつの読み順情報を生成し、生成された読み順情報を含む付加情報を生成する。図6(a)は、読み順情報を含む付加情報800の一例を示すデータ構造図である。付加情報800は、複数の閲覧単位領域の情報とそれらに付与された読み順情報とを含む。付加情報800は、図3(b)の領域解析の結果に対応する各閲覧単位領域のID情報801を含む。ID情報801は、本例ではアルファベットを用いて表現される。付加情報800は、各閲覧単位領域の外接矩形を示す座標情報802と、各閲覧単位領域の属性情報803と、図3(b)の領域解析の結果にテンプレート502を適合させた場合の読み順情報804と、を含む。読み順情報804は、先頭の閲覧単位領域(以下、先頭領域と称す)の情報805と、各閲覧単位領域からの遷移先情報806と、を含む。このような読み順情報を利用する閲覧制御では、情報805が示す先頭領域から閲覧が開始され、各閲覧単位領域の遷移先情報806が示す閲覧単位領域へと順々に、endが指定されるまで遷移が繰り返される。これによりテンプレート502に沿った読み進めが可能となる。
ステップS307では、電子文書出力部204は、ステップS306で生成された付加情報が付加されたページ画像を含む電子文書を生成し、出力する。ここで図2のフローチャートの処理が終わる。
一方、ステップS304で複数の適合テンプレートが選出された場合、処理はステップS305からステップS308へ進む。例えば、図3(f)、図3(g)、図3(h)の各テンプレートの適合度について、ステップS304における閾値が0.7の場合はテンプレート502およびテンプレート503が適合テンプレートとして選出される。
ステップS308では、読み順設定部203は、選出された複数の適合テンプレートについて、適合テンプレートごとにその適合テンプレートに基づいて読み順情報を生成する。その結果、生成された複数の読み順情報のそれぞれは複数の適合テンプレートのそれぞれに基づく。具体的には、読み順設定部203は、各適合テンプレートに対してステップS306で生成される読み順情報と同様の読み順情報を生成する。そして読み順設定部203は、生成された複数の読み順情報を適合度の高い順に1番目の読み順情報、2番目の読み順情報、…というようにソートする。
図6(b)は、2つの読み順情報を含む準付加情報810の一例を示すデータ構造図である。「準」付加情報としたのは、本実施の形態では準付加情報810が電子文書に付加されるわけではないからである。しかしながら、別の実施の形態では、(後述の選択情報を含まない)準付加情報810が電子文書に付加されてもよい。
ステップS308の処理の結果、図6(b)に示される準付加情報810が生成される。図6(b)に示される例では、図3(b)の領域解析の結果に対し、図3(g)のテンプレート502に基づく読み順情報と、図3(h)のテンプレート503に基づく読み順情報と、が付与される。準付加情報810は、上記の図6(a)の付加情報800と同様に、閲覧単位領域のID情報801と、座標情報802と、属性情報803と、を含む。さらに、準付加情報810は、適合度が1番高いテンプレート502に基づく1番目の読み順情報811と、適合度が2番目に高いテンプレート503に基づく2番目の読み順情報821と、を含む。1番目の読み順情報811は先頭領域の情報812としてA[1]を有する。ここでR[N]は、閲覧単位領域Rに遷移したうえで、その先の遷移先としてはN番目の読み順情報に従うことを表す。例えば、A[1]は、先頭領域として閲覧単位領域Aに遷移したうえで、その先の遷移先は1番目の読み順情報811に属する遷移先情報813に従うことを表す。同様に、2番目の読み順情報821は、先頭領域の情報822としてA[2]を有する。A[2]は、先頭領域として領域Aに遷移したうえで、その先の遷移先は2番目の読み順情報821に属する遷移先情報823に従うことを表す。
ステップS309、ステップS310では、読み順設定部203はステップS308で生成された複数の読み順情報の間の選択に関する選択情報を設定する。読み順設定部203は、準付加情報810に選択情報を付与して付加情報840を生成する。ステップS307では、電子文書出力部204は、生成された付加情報840が付加された電子文書を生成する。
選択情報は、ある閲覧単位領域の次に表示されるべき閲覧単位領域(以下、遷移先領域と称す)が、複数の読み順情報に含まれるある読み順情報に従う場合とそれとは異なる読み順情報に従う場合とで異なることを示す分岐情報を含む。図6(b)に示される例で説明する。1番目の読み順情報811に従うと、読み順はA、B、D、F、H、C、E、G、I、(end)となる。2番目の読み順情報821に従うと、読み順はA、B、D、F、C、E、G、H、I、(end)となる。したがって、この場合の分岐情報は、閲覧単位領域Fの遷移先領域が1番目の読み順情報811に従う場合は閲覧単位領域Hとなり、2番目の読み順情報821に従う場合は閲覧単位領域Cとなり、両者は異なることを示す。分岐情報はさらに、遷移先領域について、1番目の読み順情報811および2番目の読み順情報821のいずれが優先されるかを示す遷移確率などの優先情報を含む。この優先情報はステップS304で算出された適合度に基づく。
より具体的には、ステップS309では、読み順設定部203は、ステップS308で生成された複数の読み順情報について、各閲覧単位領域の遷移先領域の情報に遷移確率を付与する。このとき、読み順設定部203は、複数の読み順情報で設定される遷移先領域が同じ場合は、現在設定されている遷移先領域への遷移確率として1を付与する。一方、読み順設定部203は、複数の読み順情報で異なる遷移先領域が設定されている場合は、それらの遷移先領域に遷移確率を付与したうえで遷移先情報として併記する。この遷移確率は、遷移先領域が属する読み順情報を生成する際に使用した適合テンプレートの適合度により決定される。適合度の高いテンプレートに設定された読み順が、正しい読み順である確率(可能性)が高い。
図6(c)は、ステップS309の処理により遷移確率が付与された読み順情報を含む準付加情報830の一例を示すデータ構造図である。準付加情報830では、領域A、B、C、D、Eのいずれについても、1番目の読み順情報811に属する遷移先領域と、2番目の読み順情報821に属する遷移先領域とが同じである。したがって、そのそれぞれの遷移先領域に遷移確率1が付与される。遷移先情報813のB[1]=1は、領域Bに確率1で遷移するという意味の記述である。一方領域F、G、Hはいずれも、異なる読み順情報に属する異なる遷移先を持つため、遷移確率が付与された複数の遷移先が、各々の遷移先情報に併記されている。例えば、遷移先情報814のH[1]=0.6、C[2]=0.4という記述について説明する。これは、次に領域Hに遷移し、以降1番目の読み順情報811に属する遷移先情報に従う確率が0.6であり、次に領域Cに遷移し、以降2番目の読み順情報821に属する遷移先情報に従う確率が0.4であるという意味である。この例で付与されている遷移確率0.6:0.4は、図3(g)におけるテンプレート502の適合度0.91の2乗値と、図3(h)におけるテンプレート503の適合度0.76の2乗値との比率に基づいて設定される。これは一例であり、適合度の大小関係によって固定の配分にしてもよい。また、テンプレート自体の適合度ではなく、テンプレートにおいて対象の遷移先領域が含まれる要素枠の一致度に基づいて遷移確率を設定してもよい。なお、図6(b)、図6(c)、図6(d)の例では、2つの適合テンプレートが選出された例を示すが、3つ以上の適合テンプレートが選出され、それぞれの適合テンプレートに基づく読み順情報を合わせて電子文書に付加してもよい。
ステップS310では、読み順設定部203は、ステップS309で各遷移先領域に付与された遷移確率を補正する。この補正は、読み順の全体的な連続性の観点により行われる。例えば、遷移先が分岐するときに、ある読み順情報にしたがうと複数回表示される閲覧単位領域が生じるかまたは表示されなくなる閲覧単位領域が生じる一方、別の読み順情報にしたがうとそうではない場合がある。そのような場合、読み順設定部203は、前者の読み順情報よりも後者の読み順情報が優先されるように遷移確率を補正する。より具体的には、読み順設定部203は、読み順の分岐点から最後まで連続的に読み進めた場合に、閲覧単位領域の重複や欠落が起きる可能性のある遷移先領域の遷移確率を0とする。もしくは、読み順設定部203は、そのような重複や欠落が生じにくくなるよう、閲覧単位領域の重複や欠落が起きる可能性のある遷移先領域の遷移確率を下げる。
図6(d)は、ステップS310の処理により遷移確率が補正された付加情報840の一例を示すデータ構造図である。図6(d)に示される付加情報840は、図6(c)に示される準付加情報830に対して遷移確率の補正がなされたものである。1番目の読み順情報811に従って読み進める場合、閲覧単位領域A→B→D→Fまでは、各閲覧単位領域の遷移先領域の遷移確率=1であり分岐無く読み進めることができる。しかしながら、閲覧単位領域Fでは、遷移先情報814として2つの遷移先領域H、Cが併記されており、分岐する可能性がある。まず遷移先領域として閲覧単位領域Hが選ばれた場合を説明する。H[1]の記述に従って、表示は閲覧単位領域Hに遷移し、以降1番目の読み順情報811に従う。つまり、閲覧単位領域Hの次の遷移先情報816としてC[1]=0.6、I[2]=0.4が得られる。ただし、ここで閲覧単位領域I[2]に進んでしまうとその次の遷移先領域はendで存在しない。つまり、閲覧単位領域C、Gを読まずに閲覧が終了してしまうことになる。これを避けるために、読み順設定部203は遷移先情報816を補正する。具体的には読み順設定部203は閲覧単位領域Iを遷移先領域とする遷移確率を0に補正する。さらに閲覧単位領域C→E→Gへと1番目の読み順情報811に従って読み進めを継続すると、閲覧単位領域Gの遷移先情報815としてI[1]=0.6、H[2]=0.4が得られる。ここで既に読まれている閲覧単位領域Hに遷移すると、閲覧単位領域Hを2回閲覧してしまうことになるので、読み順設定部203は遷移先情報815を補正する。具体的には読み順設定部203は閲覧単位領域Hを遷移先領域とする遷移確率を0に補正する。そして表示は閲覧単位領域Iに遷移し、次の遷移先領域が無いため現在の読み方による補正は終了する。そして処理は最初に分岐した閲覧単位領域Fに戻り、表示は遷移先情報814で前回選ばなかった閲覧単位領域Iに遷移する。読み順設定部203は、以降同様の処理を繰り返す。読み順設定部203は、すべての分岐を通過するように読み順を処理すると、ステップS310の処理を終了する。補正後の読み順情報の例を図6(d)に示す。なお、上記は一例であり他の補正を行ってもよい。例えば、重複や欠落が発生する遷移先領域への遷移確率を0に補正するのではなく、一定割合で確率を減ずるような補正を行ってもよい。また、ステップS310の処理において、ある閲覧単位領域での分岐の可能性が、同領域へ至るまでの読み順における以前の分岐での選択に依存する場合がある。その際、以前の分岐で行った選択における遷移先確率を考慮して、現在の閲覧単位領域での分岐に対する遷移確率を補正してもよい。
ステップS310の終了後はステップS307に進み、電子文書出力部204は、図6(d)に示されるような付加情報840が付加されたページ画像からなる電子文書を生成し、出力し、本処理を終了する。図6(d)に示される付加情報840のうち、閲覧単位領域Fに対する遷移先情報814は1番目の読み順情報811と2番目の読み順情報821との間の選択に関する選択情報に相当する。また、遷移先情報814は、遷移先領域が1番目の読み順情報811に従う場合と2番目の読み順情報821に従う場合とで異なることを示すので、分岐情報に相当する。
文書変換サーバ102において上記のように処理され出力された電子文書は、携帯情報端末107によって取得され、ユーザの指示に基づいて携帯情報端末107の表示デバイスに表示される。図7は、図1(a)の携帯情報端末107の機能および構成を示すブロック図である。携帯情報端末107は、電子文書取得部250と、指示受付部251と、表示制御部252と、ディスプレイなどの表示デバイス253と、端末制御部254と、記憶部255と、通信部256と、を備える。
端末制御部254は携帯情報端末107全体の動作を司るCPUなどから構成される。電子文書取得部250、指示受付部251、表示制御部252のそれぞれは、端末制御部254が実行するソフトウエアとして構成されてもよい。記憶部255は、端末制御部254の動作に必要なメモリ・HDD等である。通信部256は、携帯情報端末107と外部の装置、例えば文書変換サーバ102との間で、ネットワーク106、プロキシサーバ105およびネットワーク104を介してデータを交換する。
電子文書取得部250は、文書変換サーバ102から、付加情報840が付加された電子文書を取得する。電子文書取得部250は、取得された電子文書を記憶部255に格納する。指示受付部251は、ユーザから不図示のタッチパッドやキーパッドなどの入力デバイスを介して、取得された電子文書の閲覧を開始するための指示を受け付ける。表示制御部252は、記憶部255から閲覧対象の電子文書を読み出し、閲覧単位領域ごとに表示デバイス253に表示させる。
図8(a)は、電子文書のデータに含まれる表示用ページ画像データ900を示す図である。この表示用ページ画像データ900は、図3(a)のページ画像400を入力とした図2のフローチャートで説明した処理により生成された電子文書に含まれる表示用ページ画像データの例である。図8(b)〜(f)はそれぞれ、携帯情報端末107の表示デバイス253に表示される画面を示す図である。表示制御部252は、図8(b)に示されるように、表示デバイス253に表示用ページ画像データ900の全体を表示させることも可能である。しかしながら、表示デバイス253のサイズや解像度の制限により、ユーザがページ画像の内容を理解するのが困難となる場合がある。そこで、携帯情報端末107は、ページ画像中の閲覧単位領域の内容を、表示デバイス253上で視認容易な状態になるよう拡大して表示デバイス253に表示させる。そして携帯情報端末107は、ユーザの指示によって各閲覧単位領域を順次表示するような閲覧制御を行う。例えば、図8(a)に示されるように、携帯情報端末107は、図3(b)のように抽出された複数の閲覧単位領域A〜Iのそれぞれを表示デバイス253に拡大して表示する際の表示領域901〜909を設定する。そして、携帯情報端末107は、ユーザが簡易な操作でこれらの閲覧単位領域を文書内容の順番どおりに閲覧するために、電子文書に付加された読み順情報を利用した閲覧制御をおこなう。
図9は、携帯情報端末107における閲覧制御の処理を示すフローチャートである。なお、図9の例では、制御対象となる電子文書は図6(d)の付加情報840を含む。ステップS1001では、指示受付部251はユーザから閲覧開始の指示を受け付ける。表示制御部252は、指示受付部251が閲覧開始の指示を受け付けると、対象の電子文書の閲覧制御を開始する。ユーザの指示は、例えばタッチパネルを兼ねた表示デバイス253の任意位置へのタップ等より行われる。指示受付部251はタップを検出することで指示を受け付ける。
ステップS1002では、表示制御部252は、最初に閲覧する表示領域および以降従う読み順情報を、電子文書に付加された付加情報840の読み順情報から取得する。図6(d)の例では、表示制御部252は先頭領域の情報812としてA[1]を得る。すなわち最初の表示領域は閲覧単位領域Aに対応する表示領域901で、以降の読み順は1番目の読み順情報811に従う。ここでは、表示制御部252は、1番目の読み順情報811が最も適合度の高いテンプレートに基づく読み順情報であるから、その先頭領域の情報812を選択する。2番目以降の読み順情報が異なる先頭領域を持つ場合は、図8(e)に示されるように、表示制御部252は表示用ページ画像データ900の全域と先頭領域の候補を示す矢印920、921などのインジケータとを表示デバイス253に表示させてもよい。指示受付部251は、矢印920、921で示される候補に対するユーザのタップを、タップされた候補の選択指示として受け付けてもよい。表示制御部252は、選択された候補を先頭領域として閲覧を開始してもよい。先頭領域の候補の選択は、複数の読み順情報のなかからひとつの読み順情報を選択することでもある。
ステップS1003では、表示制御部252は、表示領域を表示デバイス253に表示させる。例えば、図8(c)に示されるように、表示制御部252は閲覧単位領域Aの外接矩形を中心として閲覧単位領域Aが表示デバイス253の画面いっぱいに収まる表示領域901を生成する。表示制御部252は、そのように生成された表示領域901のみを表示デバイス253に拡大して表示させる。
ステップS1004では、ユーザはステップS1003において表示デバイス253に表示された表示領域を閲覧し、次の表示領域に読み進める意図で指示を入力する。指示受付部251は入力された指示を次の表示領域に進める指示として受け付ける。例えば、指示受付部251は、ユーザが画面の任意位置をタッチした際に指示が入力されたと解釈する。
ステップS1005では、表示制御部252は、電子文書に付加されている付加情報840から、現在表示デバイス253に表示されている表示領域に対応する遷移先情報を取得する。表示制御部252は、取得された遷移先情報が遷移先がないことを示す場合、すなわち遷移先情報としてendが指定される場合は閲覧制御を終了する。それ以外の場合は表示制御部252はステップS1006に進む。
ステップS1006では、表示制御部252は、取得された遷移先情報を参照し、遷移先領域が単数の場合はステップS1007に進む。それ以外の場合は表示制御部252はステップS1008に進む。本例では、閲覧単位領域Aの1番目の読み順情報811に属する遷移先情報813を参照すると遷移先領域は閲覧単位領域Bのみであるため、表示制御部252はステップS1007に進む。
ステップS1007では、表示制御部252は単数の遷移先領域を次に表示されるべき閲覧単位領域として設定する。その後処理はステップS1003に戻り、以降同じ処理が繰り返される。図6(d)の例では、閲覧単位領域BからDへの、およびDからFへの閲覧制御はステップS1003〜S1007の繰り返しにより実現される。そして閲覧単位領域Fに対応する表示領域906を表示デバイス253が表示した後のステップS1006において、表示制御部252は遷移先情報814に複数の遷移先領域が示されているため、ステップS1008に進む。
ステップS1008では、表示制御部252は、遷移先領域が複数ある場合に、ユーザが遷移先情報すなわち対応する読み順情報を選択するためのインジケータを表示デバイス253に表示させる。指示受付部251は、ユーザによる読み順情報の選択を受け付ける。より具体的には、ステップS1008では、図8(d)に示されるように、表示制御部252は遷移先領域が複数あることをユーザに示すインジケータ910、911を表示デバイス253に表示させる。図8(d)では、閲覧単位領域Fからの遷移先として、下方にある閲覧単位領域Hと、右上方にある閲覧単位領域Cと、の2つがあることが、それぞれ対応する矢印910、911で示される。このとき、図8(d)に示されるように、表示制御部252は遷移確率が高い方向を太い矢印910で、低い方向を細い矢印911で表すことで、いずれの遷移先領域(読み順情報)が優先されるかをユーザに通知してもよい。このように、表示制御部252は遷移先についてのユーザの判断を補助する情報を表示デバイス253に表示させてもよい。あるいはまた、表示制御部252は、複数の遷移先領域をユーザが視認できるように、少なくとも複数の遷移先領域が含まれるようにズームアウトしたページ画像を表示デバイス253に表示させてもよい。
ステップS1009では、指示受付部251は、複数の遷移先領域からひとつの遷移先領域を選択するためにユーザが行う追加指示の入力を受け付ける。例えば、ユーザは追加指示として図8(d)に示されるいずれかの矢印910、911をタップし、指示受付部251は、そのタップを遷移先を選択する指示として解釈する。
ステップS1010では、表示制御部252はステップS1009で受け付けられた追加指示に従って遷移先領域を決定し、決定された遷移先領域を次に表示されるべき閲覧単位領域として設定する。また表示制御部252は、以降の読み順情報を、決定された遷移先領域が属する読み順情報に決定する。例えば図6(d)の閲覧単位領域Fの遷移先情報814の場合、ユーザが閲覧単位領域Hへの遷移を指定すると、表示制御部252は閲覧単位領域Hを次に表示される閲覧単位領域に設定し、以降の読み順情報を1番目の読み順情報811に決定する。ユーザが閲覧単位領域Cへの遷移を指定した場合は、表示制御部252は閲覧単位領域Cを次に表示される閲覧単位領域に設定し、以降の読み順情報を2番目の読み順情報に決定する。そして処理はステップS1003に戻り、以降の処理が繰り返される。
以上、図9のフローチャートに示される閲覧制御処理を行うことで、ユーザは任意箇所へのタップ等の簡易な操作で、読み順情報に従って次々と閲覧単位領域を読み進めることができる。また、ある表示領域の表示の後、複数の読み順情報に基づき複数の領域への遷移が可能な場合、ユーザにその可能性を提示し、追加指示を得ることで所望の領域へと遷移して読み進めることが可能となる。
また、本実施の形態に係る文書変換サーバ102によると、ページ画像を解析して抽出した複数の閲覧単位領域との適合度が高い複数の適合テンプレートが選出され、該複数の適合テンプレートに基づいて複数の読み順情報が生成される。このように生成された複数の読み順情報は電子文書に付加される。電子文書にはさらに、ひとつの閲覧単位領域に対する複数の読み順情報に基づく複数の遷移先領域、および各遷移先領域の遷移確率が付加される。この遷移確率は、対応する遷移先領域が属する読み順情報の生成に使用された適合テンプレートの適合度に由来する。
本実施の形態に係る読み順情報を利用して閲覧制御を行う場合、ユーザは、読み順に曖昧性がない部分に対しては、簡易な動作で領域を移動して読み進めることができる。読み順に曖昧性があり、特殊な読み方ができる可能性がある部分に対してのみ、ユーザに選択を求める追加動作が要求される。そこでは、複数の遷移先領域に関する情報が遷移確率に基づいて表示されるので、ユーザの選択判断を補助し、ユーザの閲覧行為における負荷を軽減することができる。
なお、ステップS1008のインジケータの表示およびステップS1009のユーザによる追加指示の方法は一例であり、他の方法が採用されてもよい。例えば、ステップS1004でユーザが画面にタッチした瞬間に図8(d)に示される複数の選択先を示す表示が行われる。そしてユーザがそのまま指を離した場合は、遷移確率の高い遷移先が自動的に選択され、ユーザが指を所定方向へドラッグした場合は遷移確率の低い遷移先が選択されてもよい。これにより、ユーザはタップ等の単一の動作をするだけで、遷移確率の高いおそらくはより一般的な読み順で閲覧を実行することができる。そして特殊な読み方になると判断した場合にのみ上記単一の動作とは異なるドラッグ等の動作を行うので、ユーザの閲覧行為における負荷を軽減することができる。あるいは、表示制御部252は表示デバイス253に高遷移確率の遷移先を表示させた後に、ユーザからの追加指示により遷移元に戻って他の低遷移確率の遷移先を選択してもよい。これにより、ユーザはタップ等の単一の動作をするだけで、遷移確率の高いおそらくはより一般的な読み順で閲覧を実行することができる。そしてユーザが意図と異なる領域に遷移したことに気づいたときに、前の分岐のあった領域に戻ってそこから別の領域に遷移する操作が可能となる。したがって、ユーザの閲覧行為における負荷を軽減することができる。
(第2の実施の形態)
第1の実施の形態では、テンプレートを構成する要素枠が示す配置方向に従い閲覧単位領域をひとつずつ順番に閲覧することを指定する読み順情報を複数生成する場合を説明した。該テンプレートでは、複数の領域を個別に閲覧することが前提とされている。これに対し第2の実施の形態では、複数の領域をまとめて閲覧することを前提とするテンプレートも使用される。すなわち、要素枠内で並ぶ複数の領域を、それぞれ個別に閲覧する領域として扱うテンプレートと、一度にまとめて閲覧可能な領域として扱うテンプレートと、を含む複数テンプレートが使用される。
第1の実施の形態では、テンプレートを構成する要素枠が示す配置方向に従い閲覧単位領域をひとつずつ順番に閲覧することを指定する読み順情報を複数生成する場合を説明した。該テンプレートでは、複数の領域を個別に閲覧することが前提とされている。これに対し第2の実施の形態では、複数の領域をまとめて閲覧することを前提とするテンプレートも使用される。すなわち、要素枠内で並ぶ複数の領域を、それぞれ個別に閲覧する領域として扱うテンプレートと、一度にまとめて閲覧可能な領域として扱うテンプレートと、を含む複数テンプレートが使用される。
図10(a)は、第2の実施の形態で使用される例示的なテンプレート1104を示す図である。テンプレート1104を構成する要素枠1131、1132、1133はそれぞれ図3(e)に示されるテンプレート503の要素枠531、532、533と同一である。一方、図3(e)の要素枠534が内部の領域を左から右へ順に読むことを指定するのに対し、図10(a)の要素枠1134は、内部の領域をグループ化して1つの閲覧単位として扱うことを指定する。
図10(b)は、図3(e)のテンプレート503および図10(a)のテンプレート1104に基づく付加情報1200の一例を示すデータ構造図である。付加情報1200に関して、図3(a)に示されるページ画像400から抽出された図3(b)に示される閲覧単位領域A〜Iに対する適合テンプレートとして、図3(e)のテンプレート503および図10(a)のテンプレート1104が選出される。図3(e)のテンプレート503に基づいて1番目の読み順情報1211が生成され、図10(a)のテンプレート1104に基づいて2番目の読み順情報1221が生成される。付加情報1200は、図6(d)に示される付加情報840と同様に、領域IDの情報1201と、座標情報1202と、属性情報1203と、1番目の読み順情報1211と、2番目の読み順情報1221と、を含む。2番目の読み順情報1221において、閲覧単位領域H、Iがひとつの遷移先情報を持っているのは、図10(a)のテンプレート要素枠1134のグループ化指定に対応する。
以下、付加情報1200が付加された電子文書を携帯情報端末107で閲覧する場合を説明する。まず、表示制御部252は、1番目の読み順情報1211に従って、先頭領域Aを表示領域とする。以降ユーザの読み進め指示に対し、表示制御部252は1番目の読み順情報1211に従い閲覧単位領域B、D、F、C、E、Gを順に表示領域とする。閲覧単位領域Gからの遷移先情報1214には、そのまま1番目の読み順情報1211に従い閲覧単位領域Hを遷移先領域とする選択肢と、2番目の読み順情報1221に従い閲覧単位領域H、Iをグループ化して同時に遷移先領域とする選択肢と、が併記されている。第1の実施の形態と同様に、携帯情報端末107は、ユーザに選択肢とその確率とを示すような表示を行い、それに対するユーザの追加指示に従って選択された遷移先の表示を実行する。このユーザへの選択肢の提示およびユーザによる追加指示は様々な態様で実現可能である。
以上説明したように、本実施の形態によると、閲覧単位領域の読み順情報を生成するために使用されるテンプレートは、領域を個別に表示することを前提とするテンプレートと、グループ表示することを前提とするテンプレートと、を含む。これらのテンプレートにより生成された複数の読み順情報を利用して閲覧制御を行う場合、ユーザは、読み順に曖昧性がない部分に対しては、簡易な動作で領域を移動して読み進めることができる。読み順に曖昧性があり、領域を個別に読むか一括で読むかを判断する必要がある部分に対してのみ、ユーザに選択を求める追加動作が要求される。また、複数の読み進め方からひとつを選択するための情報を遷移確率に基づいて生成し表示することで、ユーザの選択判断を補助し、ユーザの閲覧行為における負荷を軽減することができる。あるいはまた、一般的な読み方は通常の指示で、一般的ではない読み方は非通常の指示で選択できるような閲覧動作が可能になり、ユーザの閲覧行為における負荷を軽減することができる。
以上、実施の形態に係る文書変換サーバおよび携帯情報端末の構成と動作について説明した。これらの実施の形態は例示であり、その各構成要素や各処理の組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
第1および第2の実施の形態では、テンプレートに基づいて読み順情報を設定する場合について説明したが、これに限られない。例えば異なる複数のリーディングオーダ解析手法(ページの上から下に読み順付与、ページの左から右に読み順付与、など)に基づいて複数の読み順除法が設定されてもよいし、テンプレートとリーディングオーダ解析手法とが併用されてもよい。
第1および第2の実施の形態では、電子文書出力部204で生成される電子文書に付加されている付加情報は複数の読み順情報の間の選択に関する選択情報を含む場合について説明したが、これに限られない。付加情報は選択情報を含まなくてもよく、この場合は選択情報は受け側の携帯情報端末にて生成されてもよい。あるいはまた、選択情報がなくても、受け側の携帯情報端末は閲覧制御を開始する際に、または閲覧の途中で、どちらの読み順情報を適用するかをユーザに選ばせてもよい。この処理を実現するには読み順情報が複数あればよく、それらの間の選択に関する追加的な情報は不要である。閲覧制御の開始に際にユーザに読み順を選ばせるための画面は、図8(e)に示されるものと同様となる。閲覧の途中でユーザに読み順を選ばせるための画面は、図8(f)に示される。図8(f)では表示デバイス253に別の読み順ボタン940が表示される。ユーザは現在の読み順が違うと判断すると、いつでもこの別の読み順ボタン940をタップすることができる。携帯情報端末107は、別の読み順ボタン940がタップされると、そのとき採用されている読み順情報とは異なる読み順情報に従う閲覧制御を開始する。
第1および第2の実施の形態では、遷移確率を使用する場合について説明したが、これに限られず、優先度を示すデジタル値などの複数の遷移先領域間の優先関係を示す情報が使用されてもよい。
第1および第2の実施の形態では、読み順設定部203において所与のテンプレート群とユーザにより適宜設定される閾値とが使用される場合について説明したが、これに限られない。図11(a)は、複数のテンプレート群440、442、444を説明するための図である。本変形例に係る文書変換サーバの記憶部は、複数のテンプレート群440、442、444を保持する。第1テンプレート群440は複数のテンプレート446、448、450を含む。第2テンプレート群442、第3テンプレート群444についても同様である。テンプレート群の数は3に限られず、各テンプレート群に含まれるテンプレートの数も任意でよい。
テンプレート群は、閲覧対象の電子文書の通常の表示サイズ(例えば、拡大・縮小のない「100%」のサイズ)と該電子文書が表示される表示デバイスのサイズ(例えば、解像度)との比である縮小率に対応する。これは、縮小率に応じて適切なテンプレートは異なることに対応する。図11(b)は、記憶部206に保持される選択テーブル452のデータ構造図である。選択テーブル452は、縮小率と、テンプレート群を特定するテンプレート群IDと、閾値と、を対応付けて保持する。本変形例に係る読み順設定部は、閲覧対象の電子文書とテンプレートとの適合度を算出する前に、縮小率を算出し、算出された縮小率に基づいて使用すべきテンプレート群を特定する。読み順設定部は、選択テーブル452を参照し、算出された縮小率に対応するテンプレート群と閾値とを特定する。読み順設定部は、特定されたテンプレート群に含まれるテンプレートと電子文書との適合度を算出する。読み順設定部は、算出された適合度と特定された閾値とを比較し、少なくともひとつの適合テンプレートを抽出する。
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
201 画像取得部、 202 領域解析部、 203 読み順設定部、 204 電子文書出力部、 205 制御部、 206 記憶部、 207 通信部。
Claims (17)
- 電子文書を取得する取得手段と、
前記電子文書の構造に基づいて該電子文書から複数の閲覧単位領域を抽出する抽出手段と、
それぞれが前記複数の閲覧単位領域の表示の順番を指定する複数の読み順情報を設定する設定手段と、
前記複数の読み順情報が付加された新たな電子文書を生成する生成手段と、を備えることを特徴とする文書処理装置。 - 前記設定手段は、前記複数の読み順情報の間の選択に関する選択情報を設定し、
前記生成手段は、前記複数の読み順情報と前記選択情報とが付加された新たな電子文書を生成することを特徴とする請求項1に記載の文書処理装置。 - 前記選択情報は、ある閲覧単位領域の次に表示されるべき閲覧単位領域が、前記複数の読み順情報に含まれる第1読み順情報に従う場合と前記第1読み順情報とは異なる第2読み順情報に従う場合とで異なることを示す分岐情報を含むことを特徴とする請求項2に記載の文書処理装置。
- 前記分岐情報は、前記次に表示されるべき閲覧単位領域について、前記第1読み順情報および前記第2読み順情報のいずれが優先されるかを示す優先情報を含むことを特徴とする請求項3に記載の文書処理装置。
- 前記優先情報は、前記第2読み順情報に従うと複数回表示される閲覧単位領域が生じるかまたは表示されなくなる閲覧単位領域が生じる一方、前記第1読み順情報に従うとそうではない場合、前記第2読み順情報よりも前記第1読み順情報が優先されることを示すことを特徴とする請求項4に記載の文書処理装置。
- 前記設定手段は、
それぞれが読み順情報の設定のために使用される情報を含む所与の異なる複数のレイアウトと前記複数の閲覧単位領域の前記電子文書における配置との適合度を、レイアウトごとに算出する算出手段と、
前記適合度に基づいて、前記所与の異なる複数のレイアウトのなかから少なくともひとつの適合レイアウトを選出する選出手段と、を含み、
前記選出手段によって複数の適合レイアウトが選出された場合、前記複数の読み順情報のそれぞれは前記複数の適合レイアウトのそれぞれに基づき、
前記優先情報は前記適合度に基づくことを特徴とする請求項4または5に記載の文書処理装置。 - 前記選出手段によってひとつの適合レイアウトが選出された場合、前記ひとつの適合レイアウトに基づくひとつの読み順情報が設定され、
前記生成手段は、前記ひとつの読み順情報が付加された新たな電子文書を生成することを特徴とする請求項6に記載の文書処理装置。 - 前記所与の異なる複数のレイアウトは、複数の領域をまとめて閲覧することを前提とする第1レイアウトと、前記複数の領域を個別に閲覧することを前提とする第2レイアウトと、を含むことを特徴とする請求項6または7に記載の文書処理装置。
- 前記優先情報は、前記第1読み順情報に従う場合の次に表示されるべき閲覧単位領域および前記第2読み順情報に従う場合の次に表示されるべき閲覧単位領域のそれぞれに対する遷移確率を含むことを特徴とする請求項4から8のいずれか1項に記載の文書処理装置。
- 電子文書を取得することと、
前記電子文書の構造に基づいて該電子文書から複数の閲覧単位領域を抽出することと、
それぞれが前記複数の閲覧単位領域の表示の順番を指定する複数の読み順情報を設定することと、
前記複数の読み順情報が付加された新たな電子文書を生成することと、を含むことを特徴とする文書処理方法。 - コンピュータを請求項1乃至9のいずれか1項に記載の装置の各手段として機能させるためのプログラム。
- 複数の閲覧単位領域を有する電子文書を閲覧単位領域ごとにディスプレイに表示させる端末であって、
それぞれが前記複数の閲覧単位領域の表示の順番を指定する複数の読み順情報が付加された前記電子文書を取得する取得手段と、
ユーザから、前記複数の読み順情報のうちのひとつの選択を受け付ける受付手段と、を備えることを特徴とする端末。 - 前記受付手段は、ある閲覧単位領域の次に表示されるべき閲覧単位領域が、前記複数の読み順情報に含まれる第1読み順情報に従う場合と前記第1読み順情報とは異なる第2読み順情報に従う場合とで異なる場合に、前記第1読み順情報および前記第2読み順情報のいずれを選択するかを受け付けることを特徴とする請求項12に記載の端末。
- 前記受付手段は、前記次に表示されるべき閲覧単位領域について、前記第1読み順情報および前記第2読み順情報のいずれが優先されるかを前記ユーザに通知することを特徴とする請求項13に記載の端末。
- 前記受付手段は、前記第1読み順情報より前記第2読み順情報が優先されるべき場合、タップが検出されると前記第2読み順情報を選択し、ドラッグが検出されると前記第1読み順情報を選択することを特徴とする請求項14に記載の端末。
- 複数の閲覧単位領域を有する電子文書を閲覧単位領域ごとにディスプレイに表示させる方法であって、
それぞれが前記複数の閲覧単位領域の表示の順番を指定する複数の読み順情報が付加された前記電子文書を取得することと、
ユーザから、前記複数の読み順情報のうちのひとつの選択を受け付けることと、を含むことを特徴とする方法。 - コンピュータを請求項12乃至15のいずれか1項に記載の端末の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016076115A JP2017187923A (ja) | 2016-04-05 | 2016-04-05 | 文書処理装置、文書処理方法、端末および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016076115A JP2017187923A (ja) | 2016-04-05 | 2016-04-05 | 文書処理装置、文書処理方法、端末および方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017187923A true JP2017187923A (ja) | 2017-10-12 |
Family
ID=60045692
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016076115A Pending JP2017187923A (ja) | 2016-04-05 | 2016-04-05 | 文書処理装置、文書処理方法、端末および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017187923A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6838209B1 (ja) * | 2019-10-31 | 2021-03-03 | 楽天株式会社 | 文書画像解析装置、文書画像解析方法およびプログラム |
-
2016
- 2016-04-05 JP JP2016076115A patent/JP2017187923A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6838209B1 (ja) * | 2019-10-31 | 2021-03-03 | 楽天株式会社 | 文書画像解析装置、文書画像解析方法およびプログラム |
WO2021084702A1 (ja) * | 2019-10-31 | 2021-05-06 | 楽天株式会社 | 文書画像解析装置、文書画像解析方法およびプログラム |
US11900644B2 (en) | 2019-10-31 | 2024-02-13 | Rakuten Group, Inc. | Document image analysis apparatus, document image analysis method and program thereof |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8645901B2 (en) | Visualization and information display for shapes in displayed graphical images based on a cursor | |
US8438531B2 (en) | Visualization and information display for shapes in displayed graphical images | |
JPH10240220A (ja) | 注釈表示機能を持つ情報処理機器 | |
US10296559B2 (en) | Display apparatus, control method therefor, and storage medium | |
JP2007025958A (ja) | プレビュー表示装置及びプレビュー表示方法及びプレビュー表示プログラム | |
JP2015088046A (ja) | 画像表示装置、画像表示方法およびプログラム | |
JP2014164356A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
US8533626B2 (en) | Visualization and information display for shapes in displayed graphical images based on user zone of focus | |
JP2012129754A (ja) | 画像処理装置及びプログラム | |
JP4443194B2 (ja) | 携帯端末の文字認識における処理対象選択方法および携帯端末 | |
JP6671673B1 (ja) | レイアウト解析方法、読書補助装置、回路及び媒体 | |
JP4730775B2 (ja) | 画像処理装置 | |
JP2989072B2 (ja) | 手書き文字入力装置 | |
JP2017187923A (ja) | 文書処理装置、文書処理方法、端末および方法 | |
JP2018067298A (ja) | 手書き内容編集装置および手書き内容編集方法 | |
KR101069843B1 (ko) | 수식 연산 방법 및 장치 | |
US20210409550A1 (en) | Data input support apparatus, data input support method, and storage medium | |
JP2006184415A (ja) | 画像処理装置、画像処理プログラム及び画像処理方法 | |
JP3951492B2 (ja) | 画像処理装置 | |
US10922864B2 (en) | Image processing device, image processing method and program, for object detection in an image | |
JP2017187924A (ja) | 文書処理装置、文書処理方法、端末および方法 | |
CN112463010A (zh) | 信息处理装置及记录媒体 | |
JP6213380B2 (ja) | 表示装置、画像形成装置、表示制御プログラム及び画像形成プログラム | |
JP5666011B1 (ja) | 方法及び電子機器 | |
JP2015225509A (ja) | 情報処理装置、情報処理システム、情報処理装置の制御方法およびコンピュータプログラム |