JP5766257B2 - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
JP5766257B2
JP5766257B2 JP2013243085A JP2013243085A JP5766257B2 JP 5766257 B2 JP5766257 B2 JP 5766257B2 JP 2013243085 A JP2013243085 A JP 2013243085A JP 2013243085 A JP2013243085 A JP 2013243085A JP 5766257 B2 JP5766257 B2 JP 5766257B2
Authority
JP
Japan
Prior art keywords
information processing
processing apparatus
area
output
structured document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013243085A
Other languages
English (en)
Other versions
JP2014081945A (ja
Inventor
青木 伸成
伸成 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2013243085A priority Critical patent/JP5766257B2/ja
Publication of JP2014081945A publication Critical patent/JP2014081945A/ja
Application granted granted Critical
Publication of JP5766257B2 publication Critical patent/JP5766257B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、構造化文書に含まれている、出力候補の要素を選択する情報処理装置、情報処理方法、およびプログラムに関する。
近年、インターネットを介してサーバにアクセスし、Webページを表示して様々な情報を獲ることが可能となった。これらのWebページはHTML(Hyper Text Markup Language)、XHTML(Extensible Hyper Text Markup Language)といった構造化言語(マークアップ言語)で記述された構造化文書で表現される。そして、この構造化文書をブラウザーと呼ばれるソフトウェアが解析し、解析結果に応じてディスプレイに表示させることでWebページの表示が可能となる。
また、これらWebページを印刷する場合、ブラウザーでWebページをディスプレイ上に表示してこの表示中のページを印刷する方法が一般的であるが、Webページの全てではなく、その一部を印刷とするというニーズもある。そこで、Webページをブラウザーで表示し、ユーザがWebページ内の一部矩形をマウス等のポインティングデバイスを用いて選択して、この選択された部分を印刷する方法が提案されている。(例えば[特許文献1]参照)
特登録03588337号公報
しかしながら、上記の従来の方法ではWebページ内に散在する複数の不要な部分を取り除いて印刷するには、Webページの編集処理が必要となり煩雑な操作を必要とした。そこで本発明は、構造化文書に含まれている、出力候補の要素を、適切かつ容易に選択することができる情報処理装置、情報処理方法、およびプログラムを提供することを目的とする。
上記の課題を鑑みて本発明の情報処理装置は、構造化文書に含まれている複数の要素のうちの第1の要素に対応する第1の領域の大きさに対する、当該第1領域に含まれ当該第1の領域よりも小さい、第2の要素に対応する第2の領域の大きさの比率が、所定の閾値より小さい場合、当該第1の要素が選択され、当該比率が当該所定の閾値より小さくない場合、当該第2の要素が選択されるように、当該第1の要素と当該第2の要素のうちの出力候補の要素を選択する選択手段を有し、Webブラウザにより前記構造化文書に基づくWebページが表示され、当該Webブラウザから呼び出されるプラグインソフトウェアをプロセッサが実行することにより前記選択手段による前記選択が行われることを特徴とする。
本発明によれば、構造化文書に含まれている、出力候補の要素を、適切かつ容易に選択することができる。
構造化文書に基づき印刷する印刷システムの例を示す図である。 PC101の構成を示すブロック図である。 PC101上のソフトウェアの構成を示すブロック図である。 構造化文書の一例を示す図である。 構造化文書のDOMツリーの一例を示す図である。 GUI画面の一例を示す図である。 中心要素を示す表示効果が施されたGUI画面を示す図である。 中心要素を示すサムネイル画像を一覧表示したGUI画面を示す図である。 構造化文書の中心要素および中心要素群を抽出する処理手順を示す図である。
以下、添付図面を参照して本発明の好適な実施の形態を詳しく説明する。尚、以下の実施の形態は特許請求の範囲に係る本発明を限定するものでなく、また本実施の形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
図1は、構造化文書に基づき印刷する印刷システムの例を示す図である。図1に示したPC(Personal Computer)101はプリンタ104と接続されており印刷制御装置としてプリンタ104に画像を印刷させる。またPC101は、インターネット102を介してWWWサーバ103と接続されており、構造化言語(マークアップ言語)で記述された構造化文書をダウンロードして、その構造化文書に基づきWebページを表示する。なお、この構造化文書はHTMLやXHTML等の言語で記述されている。さらに、このダウンロードした構造化文書に基づき、プリンタ104に画像を印刷させる。
図2はPC101の構成を示すブロック図である。CPU201は、プログラムに従ってデータの演算や命令を行い、PC101の各部や接続された装置に対する制御を行う。RAM202は、一時記憶領域として使用されるメモリであり、ROM203は、CPU201により実行される各種のプログラムを保存するメモリである。ハードディスク204はオペレーティングシステム(OS)、ブラウザーやその他のアプリケーションソフトのプログラムやデータ等を記録する。つまり、CPU201が、ROM203或いはハードディスク204に格納されたプログラムをRAM202に読出し、RAM202をワークメモリとしてプログラムを実行することで各種の制御が行われる。
USBインターフェース205は、USBケーブルが接続されるインターフェースであり、プリンタ104とのデータ通信を行うためのインターフェースである。なおプリンタ104との通信はUSBケーブル以外でも、例えばSCSIや無線により行われてもよい。
表示装置206はCRTや液晶ディスプレイとグラフィックコントローラとからなり、WWWサーバ103からダウンロードしたWebページや、印刷プレビュー画像、またグラフィックユーザインターフェース(GUI)などの表示が行われる。入力装置207はユーザがPC101に対して各種指示を与えるための装置であり、例えばマウスやキーボードがある。システムバス209は、CPU201やRAM202、ROM203、ハードディスク204等との間のデータのやり取りを行う。
LANインターフェース208はLANケーブルが接続されるインターフェースであり、不図示のルータ、またインターネット102を介して外部のWWWサーバ103とのデータ通信が行われる。なおこのデータ通信は、例えば無線に対応したインターフェースにより、無線で行われてもよい。
また図2では、PC101が表示装置206と入力装置207、CPU201、RAM202等の制御部と一体となった所謂ノート型のPCの場合を示している。しかし本発明はこれに限らず、PCは、表示装置と入力装置とが制御部と別体となった所謂デスクトップ型のものでもよい。
図3はPC101上のソフトウェアの構成を示すブロック図である。この図3に示された各ブロックはROM203やハードディスク204に保存されているプログラムを機能ごとに分類したものであり、これらのプログラムはCPU201により実行される。以下にPC101上で動作するプログラムとそのデータ処理構成について図3を用いて説明する。図3においてブラウザー301はWebページを表示するためのアプリケーションであり、WWWサーバ103に記憶された構造化文書をPC101のハードディスク204へダウンロードし、解析結果に応じて表示装置206にWebページを表示させる。ダウンロードされる構造化文書ファイルはHTMLやXHTML等で記述されており、テキストや画像等の構造化文書を構成する要素がタグを用いて記述されている。
図4は、構造化文書の一例を示す図である。図4で構造化文書401はXHTML形式で記述されている。また、このような構造化文書に含まれる要素の表示スタイルを指定するCascading Style Sheet(以下CSSと略す)と呼ばれる別ファイルが構造化文書内に指定されている。ブラウザー301はこれらの構造化文書ファイルを解析して表示装置206へWebページを表示させる。
図3において構造化文書印刷モジュール302はブラウザー301から呼び出されるプラグインソフトウェアであり、ユーザがブラウザー301に対して要素の自動抽出の指示を行ったときこの構造化文書印刷モジュール302が実行される。なお要素の自動抽出とは、Webページ内の情報の中心となる要素を抽出し、印刷対象領域として確定する処理である。詳細は後述する。
構造化文書印刷モジュール302において、要素自動抽出部303は構造化文書内の要素を解析し、DOM(Document Object Model)ツリーと呼ばれる要素の階層構造データをRAM202等の一時記憶領域に構築する。
図5は、構造化文書のDOMツリーの一例を示す図である。このDOMツリーは構造化文書のデータ構造を示すものであり、構造化文書に含まれる要素と、その要素が有する階層構造を示している。このDOMツリーは、要素自動抽出部303が構造化文書に含まれる要素とその階層構造を解析することで一時記憶領域に記憶される。
図5では、構造化文書401のDOMツリーは文書全体をあらわす<document>ノード501をルートノードにもち、その子ノードに<head>ノード502、<html>ノード503を持つ。<html>ノード503は更にその子ノードに<body>ノード504を持つ。また各要素ノードは、親要素ノードへのポインタ、兄弟要素ノードへのポインタ、子要素ノードリストへのポインタ、属性情報、テキスト情報等のデータを保持する。また、各要素の表示状態やレイアウト情報はCSSファイルで定義され、この情報はDOMツリーの各要素ノードの情報として一時記憶領域に記憶される。例えば要素のフォント種別、フォントサイズ、文字色、表示位置等がこの各要素ノード情報にあたる。
さらに要素自動抽出部303はこのDOMツリーから、各要素が占める面積、テキスト量、要素が占める面積に対するテキスト比率、タグ種別、タグ属性を参照し、Webページ内の情報の中心となる1つまたは複数の要素を特定する。以降、このWebページ内の情報の中心となる複数の要素を中心要素群と呼び、中心要素群の中で最も情報の中心となる要素を中心要素と呼ぶ。本実施例では、この中心要素および中心要素群を印刷対象の候補として優先的に選択可能にする。つまり、ユーザがWebページの一部の領域を印刷する場合には、その中心となる要素を印刷する可能性が高いと思われるため、それを優先的に選択できるようにする。
なお、ここでのテキスト量とは、要素に含まれる文字情報のうちの実際にブラウザーに表示される文字情報のデータ量を表す。またテキスト比率とは要素の全タグサイズに対するテキスト量の比率を表す。具体的には、Webページ内で広告を示す要素の場合、別のWebページへのリンクを有している場合が多い。この場合、要素に含まれる文字情報のうち、URL等のリンクのために割り当てられる情報が多くなるため、要素の全タグサイズに対する実際にブラウザーに表示される文字情報の比率は低くなる。このように、上述のテキスト比率により対象の要素が例えば広告か否かを推測することができるので、つまりはユーザが印刷対象として望む可能性の高い種類の要素か否かを判断することができる。
要素選択部304は、表示装置206に表示されたGUI画面上において、表示されたWebページに含まれる要素自動抽出部303が抽出した1つまたは複数の中心要素群や中心要素を示す表示効果を施す。本実施例においては、この表示効果が施された要素を印刷対象とするため、このときはこの中心要素、または中心要素群が印刷対象となる。これに対してユーザは、マウスやキーボード等の入力装置207を用いてGUI画面において効果を施される要素を変更することができ、つまりは印刷対象となる要素を選択できる。
そして、印刷対象となる要素を決定する指示が入力装置207から要素選択部304に入力されると、要素選択部304は入力した指示を基に印刷対象とする要素を特定するための情報を印刷レイアウト部305に渡す。
印刷レイアウト部305は、要素自動抽出部303が抽出した中心要素、または要素選択部304からの情報を基に中心要素群から印刷対象として特定された要素の用紙に対するレイアウトを決定する。このレイアウトは印刷設定に従って決定され、この印刷設定には用紙サイズ、解像度、印刷可能領域等の情報が含まれる。なお印刷設定を示す情報はOS308を介してプリンタドライバ309から取得される。
印刷プレビュー部306は、印刷レイアウト部305が決定したレイアウトに要素が配置された画像を印刷プレビューとして表示装置206に表示する。印刷処理部307は印刷開始指示を受けた場合に、印刷レイアウト部305でレイアウトした要素の配置情報に従って、OS308を介してプリンタドライバ309に対して描画処理を実行させる。
OS308は構造化文書印刷モジュール302とプリンタドライバ309とが印刷設定データのやり取りを行うためのAPI(Application Programming Interface)や描画処理を行うためのAPIを提供する。またOS308には印刷のジョブを管理するスプーラーシステム、プリンタコマンドをポートへ出力するポートモニター等の各種制御ソフトウェアが含まれるが詳細については省略する。
プリンタドライバ309は印刷処理部307により実行された描画処理にしたがって印刷データを生成し、プリンタコマンドに変換する。そして変換したプリンタコマンドを、OS308を介してプリンタ104に送信し、用紙へ印刷させる。
次に図6、図7を用いて、前述の要素選択部304の表示制御により表示される印刷対象を選択するためのGUI画面について説明する。図6は、GUI画面の一例を示す図である。ブラウザー301には、表示するWebページを切り替えるための戻るボタン601、進むボタン602、アドレス入力領域603などが配置されている。さらにブラウザー301には印刷ボタン604、印刷プレビューボタン605および自動抽出ボタン606が配置されている。この自動抽出ボタン606は、前述した構造化文書に含まれる中心要素群の自動抽出機能を実行させるためのボタンである。ユーザが自動抽出ボタン606を押下すると、ブラウザー301が表示中のWebページに対する構造化文書ファイルをパラメータとして構造化文書印刷モジュール302を呼び出す。構造化文書印刷モジュール302は、指定された構造化文書ファイルから中心要素群および中心要素を抽出してブラウザー301に表示する。この中心要素および中心要素群を抽出する処理の詳細は図9で後述する。
図7は、中心要素を示す表示効果が施されたGUI画面を示す図である。図7では、要素自動抽出部303により抽出された中心要素708の領域に半透明な矩形を合成して表示する。更にブラウザー301には、中心要素群に含まれる他の要素を選択するための「次へ」ボタン702、「戻る」ボタン703および中心要素群の一覧をサムネイル表示するための「サムネイル表示」ボタン704を表示する。例えば、図6で示した状態で自動抽出ボタン606が押されると、まず図7(a)のように要素708に半透明の矩形が合成されたとする。そして、「次へ」ボタン702が押されると、図7(b)に示すように別の要素709に半透明矩形が合成されて表示される。
更に図7に示すGUI画面においては、中心要素を印刷対象として印刷させるための印刷ボタン705、および印刷プレビューを開始するための印刷プレビューボタン706が配置される。また中心要素の表示を中止するためのキャンセルボタン707も同時に表示し、これが押された場合、GUI画面は図6の状態に戻る。また図7(a)に示す中心要素708の領域は、ブラウザー301上でのマウスのドラッグ操作により手動で領域の位置およびサイズの調整を行うことが可能である。
図8は、中心要素を示すサムネイル画像を一覧表示したGUI画面を示す図である。ブラウザー301に含まれる「サムネイル表示」ボタン704が押されると、この図8に示した画面が表示される。GUI画面としてのサムネイル一覧画面801にはサムネイル画像802、803、804、805が含まれ、それぞれのサムネイル画像はWebページを表しており、そのうち半透明の矩形が合成された領域807は、印刷対象となる要素を示している。さらに各サムネイル画像は、印刷対象としての中心要素群に含まれるテキストを表示する領域806を含み、そのテキストの内容からも印刷対象となっている要素を認識することができる。このGUI画面に対してユーザは、画面内のサムネイル画像のいずれかを選択することで、印刷対象となる要素を確定することができる。
なお、図7で示したGUI画面と、図8で示したGUI画面とを組み合わせて表示しても良い。つまりは、図7で示したようにWebページのうち印刷対象となっている要素の領域を示す領域と、図8のように印刷対象とする要素が示されたWebページのサムネイル画像を選択可能に表示する領域とを設ける。そして、サムネイル画像が選択されると、そのサムネイル画像が示すWebページの内容を、Webページが表示された領域に反映させる。これによりユーザは、サムネイルを用いて印刷対象とする要素の選択が容易になるとともに、その要素の内容をWebページで確認することができる。
なお、図7、図8に示すようにWebページの一部の色を変えるなどの効果を加えて印刷対象とする領域を示すのではなく、印刷対象から外れる要素を削除して、印刷対象となった要素に限定して表示させてもよい。つまりこの場合、ユーザは印刷対象領域の候補を選択する必要がなく、自動で印刷領域を決定することできる。また、このように表示させることで印刷する領域をユーザに予め確認させることができるが、表示を省き、すぐに印刷を行ってもよい。これにより、例えばユーザが所定のボタンを1回クリックするだけで、自動的に抽出された領域を印刷させることができる。
図9は、構造化文書の中心要素および中心要素群を抽出する処理手順を示す図である。なお、この図で示す処理は図3で示した要素自動抽出部303に対応しており、これを実行するためのプログラムがROM203やハードディスク204に保存されている。そして、CPU201がこのプログラムをRAM202に読出し実行することにより、ここで説明する処理を行うことができる。
まずS901において、図6で示したブラウザー301の自動抽出ボタン606が押下されて自動抽出指示が出されたとき、構造化文書印刷モジュール302が起動されて要素自動抽出部303の処理を開始する。S902において、要素自動抽出部303は、ブラウザー301を介して読み出された構造化文書に含まれる要素のうち、注目要素Riの初期値を設定する。なお、この注目要素Riは中心要素の候補であり、ここでのiは構造化文書に対応して構築されたDOMツリーのbody要素以下の階層数を表す。具体的には、このときDOMツリー内のbody要素504を注目要素Ri(iは自然数)の初期の注目要素R1とする。
次に要素自動抽出部303は、S903〜S908において、DOMツリーの上位階層から下位階層へ各階層毎に注目要素を抽出する。まずS903において、注目要素Riに含まれる下位階層にある全ての子要素の幅および高さ(単位はピクセル)を取得し、これらから注目要素Riに含まれる下位階層にある全ての子要素の面積を取得する。さらにS904において、注目要素Riの全ての子要素に含まれるテキスト量およびXHTMLタグサイズをそれぞれ取得し、これらから注目要素Riに含まれる下位階層にある全ての子要素のテキスト比率を取得する。
S905では、S903とS904で取得した情報に基づき、注目要素Riに含まれる子要素のうち、テキスト比率があらかじめ定めた閾値以上で、且つその中で面積が最大の要素Rcを判別して、注目要素候補とする。そしてS906において、Riの面積に対するRcの面積比率を求め、それがあらかじめ定めた閾値以上であるかを判定する。面積比率が閾値以上ならばS907に進んでRcを注目要素R(i+1)として確定してS908へ進み、さらに下位の階層の注目要素を抽出するため、階層数iをインクリメントする。上記S903〜S908を繰り返すことで、R1、R2、R3、・・・Rnとなる要素が決定する。なお、S905、S906で示した処理で用いられる閾値はユーザにより変更可能である。
また、S906において面積比率が閾値未満であればS909へ進み、中心要素群と中心要素を抽出する。具体的には、それまでに抽出された注目要素R1〜Rnを中心要素群とし、その中で特にRnを中心要素とする。この中心要素Rnは中心要素群の中で面積が最小であり、ユーザにとって不必要と思われる領域が最も削除されていると考えられるため中心要素として特定する。また中心要素群は、ユーザが印刷対象とする要素を拡大した場合に印刷対象の候補となる要素であり、また図9の処理において抽出の条件を緩和した場合に抽出される要素となる。
以上の処理手順により要素自動抽出部303が構造化文書のDOMツリーを階層ごとに解析し、中心要素および中心要素群を抽出することができる。ここで抽出された中心要素および中心要素群は、要素の中でも面積が大きく、テキスト比率が高い要素が抽出されることがわかる。つまり、ユーザが印刷対象として望むと思われる要素を抽出することができる。
なお、ここで抽出された中心要素群のうち、より下位の階層にある要素はWebページの中でより中心となる要素となるため、ユーザが印刷対象とする可能性がより高いものと思われる。よって、Webページのうち印刷対象とする要素を示す表示効果を施す場合には、中心要素などのより下位階層にある要素をより優先的に表示させるようにしてもよい。また上述のようにWebページを示すサムネイル画像を選択可能に表示させる場合、中心要素群の中でより下位階層にある要素を優先的に選択できるようにしてもよい。
また、上記処理では中心要素の抽出のために要素の面積および要素のテキスト比率を用いているが、それら以外にも要素のタグ種別、タグ属性およびスタイルを用いて中心要素を抽出してもよい。また上記処理ではDOMツリーの上位階層から各階層ごとに1つの注目要素を抽出したが、複数の注目要素を抽出してもよい。またDOMツリーではなく全要素を解析して注目要素および中心要素を抽出してもよい。
さらに、上記の説明では自動で抽出された要素を示す表示を行っていたが、これに限らず、表示を行わずに、自動で抽出された要素をレイアウトして印刷させるものであってもよい。
以上述べたように本実施の形態では、構造化文書内の必要な要素を自動的に抽出して印刷することが可能となる。さらに自動抽出した中心要素群をサムネイル画像として一覧表示し、その中からもっとも適した要素を選択することも可能である。したがってユーザは、Webページ内の必要な領域を容易に選択して印刷することができる。またさらに、選択した中心要素の領域を調整することも可能となるため、印刷のために必要な領域を正確に抽出することも可能となる。
本発明は、前述した実施例の機能を実現するソフトウェアのプログラムコードを記録した記録媒体をシステムあるいは装置に供給するものであってもよい。その場合、そのシステムあるいは装置のコンピュータ(またはCPUまたはMPU)が記録媒体に格納されたプログラムコードを読み出し実行することによって、本発明の目的が達成される。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することとなり、そのプログラムコード自体、またそれを記憶した記憶媒体は本発明を構成することになる。
また本発明は、コンピュータが読み出したプログラムコードを実行することにより、前述した実施例の機能が実現されるだけに限らない。例えば、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOperating System(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施例の機能が実現される場合であってもよい。
101 PC
201 CPU
202 RAM
203 ROM
204 ハードディスク
205 USBインターフェース
206 表示装置
207 入力装置
208 LANインターフェース
209 システムバス

Claims (30)

  1. 構造化文書に含まれている複数の要素のうちの第1の要素に対応する第1の領域の大きさに対する、当該第1領域に含まれ当該第1の領域よりも小さい、第2の要素に対応する第2の領域の大きさの比率が、所定の閾値より小さい場合、当該第1の要素が選択され、当該比率が当該所定の閾値より小さくない場合、当該第2の要素が選択されるように、当該第1の要素と当該第2の要素のうちの出力候補の要素を選択する選択手段を有し、
    Webブラウザにより前記構造化文書に基づくWebページが表示され、当該Webブラウザから呼び出されるプラグインソフトウェアをプロセッサが実行することにより前記選択手段による前記選択が行われることを特徴とする情報処理装置。
  2. 前記第1の領域の大きさと前記第2の領域の大きさとを比較する比較手段をさらに有し、
    前記選択手段は、前記比較手段による比較に基づく前記比率に従って、出力対象の要素を選択することを特徴とする請求項1に記載の情報処理装置。
  3. 前記比較手段は、前記構造化文書が示す前記第1の要素に対応する幅および高さに基づく前記第1の領域の大きさと、前記構造化文書が示す前記第2の要素に対応する幅および高さに基づく前記第2の領域の大きさとを比較することを特徴とする請求項2に記載の情報処理装置。
  4. 前記比較手段は、前記選択手段により前記第2の要素が選択され、且つ前記第2の領域に含まれる、当該領域よりも小さい領域に対応する第3の要素が前記複数の要素に含まれている場合、当該第2の要素に対応する前記第2の領域の大きさと当該第3の要素に対応する第3の領域の大きさとをさらに比較し、
    前記選択手段は、前記比較手段による前記比較の結果、前記第2の領域に対する前記第3の領域の大きさの比率が所定の閾値より小さい場合、前記第2の要素が選択され、当該比較の結果、当該比率が当該所定の閾値より小さくない場合、前記第3の要素が選択されるように、前記出力候補の要素を選択することを特徴とする請求項2または3に記載の情報処理装置。
  5. 前記構造化文書の解析に基づく前記複数の要素の階層構造において、前記第1の要素は前記第2の要素よりも上位の階層に割り当てられる要素であることを特徴とする請求項1乃至4のいずれか1項に記載の情報処理装置。
  6. 前記選択手段により選択された出力候補の要素を出力する出力手段を有することを特徴とする請求項1乃至5のいずれか1項に記載の情報処理装置。
  7. 前記第1の要素に、前記第2の要素と、前記構造化文書の解析に基づく前記複数の要素の階層構造において当該第2の要素と同じ階層に割り当てられる当該第2の要素とは異なる第4の要素とが含まれ、且つ前記選択手段により当該第1の要素が選択された場合、前記出力手段は当該第2の要素と当該第4の要素を出力することを特徴とする請求項6に記載の情報処理装置。
  8. 前記出力手段は、前記選択手段により選択された出力候補の要素に対応する領域の外の領域に対応する第5の要素が前記複数の要素に含まれている場合、当該出力候補の要素と当該第5の要素の両方を、区別して出力することを特徴とする請求項6または7に記載の情報処理装置。
  9. 前記出力手段は、前記選択手段により選択された出力候補の要素に対応する領域の外の領域に対応する第5の要素が前記複数の要素に含まれている場合、当該出力候補の要素を出力し、当該第5の要素を出力しないことを特徴とする請求項6または7に記載の情報処理装置。
  10. 前記出力手段は、前記選択手段により選択された要素に対応する画像を印刷装置に印刷させることを特徴とする請求項6乃至9のいずれか1項に記載の情報処理装置。
  11. 前記出力手段は、前記選択手段により選択された要素に対応する画像を、所定の印刷設定に応じたレイアウトに従って前記印刷装置に印刷媒体へ印刷させることを特徴とする請求項10に記載の情報処理装置。
  12. 前記出力手段は、前記選択手段により選択された要素に対応する画像を表示装置に表示させることを特徴とする請求項6乃至9のいずれか1項に記載の情報処理装置。
  13. 前記出力手段は、前記複数の要素に対応し且つ前記選択手段により選択された要素が他の要素と区別されている第1の画像と、前記選択手段により選択された当該要素のみに対応する第2の画像とを共に表示させることを特徴とする請求項12に記載の情報処理装置。
  14. 前記出力手段は、前記要素に対応する表示に基づくユーザの指示に応じて、当該要素に対応する画像を印刷装置に印刷させることを特徴とする請求項12または13に記載の情報処理装置。
  15. 前記選択手段により選択された出力候補の要素を出力する出力手段を有し、
    前記出力手段は、前記構造化文書に含まれている前記第1の要素と前記第2の要素のうちの前記選択手段により選択された出力候補の要素を、前記比較手段による比較が行われなかった当該構造化文書に含まれている要素と区別して出力することを特徴とする請求項2または3に記載の情報処理装置。
  16. ユーザによる指示に応じて、前記選択手段により選択された要素から、前記構造化文書に含まれている他の要素に出力候補を変更する変更手段を有することを特徴とする請求項1乃至15のいずれか1項に記載の情報処理装置。
  17. 前記変更手段は、前記選択手段により選択された出力候補の要素に対応する出力候補の領域を含み当該出力候補の領域よりも大きい領域に対応する要素に、出力候補を変更することを特徴とする請求項16に記載の情報処理装置。
  18. 前記第1の要素と前記第2の要素は、所定のサイズよりも大きい領域に対応する要素であることを特徴とする請求項1乃至17のいずれか1項に記載の情報処理装置。
  19. 前記第1の要素と前記第2の要素はそれぞれ、前記構造化文書の解析に基づく前記複数の要素の階層構造における当該第1の要素と当該第2の要素のそれぞれに対応する階層における所定のサイズよりも大きい領域に対応する要素であることを特徴とする請求項18に記載の情報処理装置。
  20. 前記第1の要素と前記第2の要素のそれぞれに対応する階層における他の要素に対応する領域の大きさを前記所定のサイズとして、当該第1の要素と当該第2の要素はそれぞれ、当該第1の要素と当該第2の要素のそれぞれに対応する当該所定のサイズよりも大きい領域に対応する要素であることを特徴とする請求項19に記載の情報処理装置。
  21. 前記複数の要素は、前記構造化文書においてタグを用いて区切られている要素であることを特徴とする請求項1乃至20のいずれか1項に記載の情報処理装置。
  22. 前記構造化文書は、HTMLまたはXHTMLにより記述されていることを特徴とする請求項1乃至21のいずれか1項に記載の情報処理装置。
  23. 前記選択手段はさらに、前記第1の要素と前記第2の要素のそれぞれに対応するテキストの量に基づいて、前記出力対象の要素を選択することを特徴とする請求項1乃至22のいずれか1項に記載の情報処理装置。
  24. Webブラウザにより前記構造化文書に基づく前記Webページが表示されている表示画面に、前記選択手段による前記選択を指示するための第1の表示項目が表示され、
    前記選択手段は、前記表示制御手段により表示された前記第1の表示項目に対するユーザの指示に応じて、前記選択を実行することを特徴とする請求項1乃至23のいずれか1項に記載の情報処理装置。
  25. 前記表示画面における前記Webブラウザのウィンドウ内であって且つ前記Webページ外の領域に、前記第1の表示項目が表示され、当該表示された第1の表示項目がユーザにより指示されたことに応じて、当該Webブラウザにより前記プラグインソフトウェアが呼び出され、当該呼び出されたプラグインソフトウェアにより前記選択手段による前記選択が行われることを特徴とする請求項24に記載の情報処理装置。
  26. 前記第1の表示項目がユーザにより指示されたことに応じて、前記プラグインソフトウェアにより前記選択手段による前記選択が行われ、且つ当該選択された出力候補の要素の出力を指示するための第2の表示項目が表示されることを特徴とする請求項24または25に記載の情報処理装置。
  27. 前記第2の表示項目は、前記選択された出力候補の要素の印刷または表示を指示するための表示項目であることを特徴とする請求項26に記載の情報処理装置。
  28. 構造化文書に含まれている複数の要素のうちの第1の要素に対応する第1の領域の大きさに対する、当該第1の領域に含まれ当該第2の領域よりも小さい、第2の要素に対応する第2の領域の大きさの比率が、所定の閾値より小さい場合、当該第1の要素を出力候補の要素として選択し、
    当該比率が当該所定の閾値より小さくない場合、当該第2の要素を出力候補の要素として選択し、
    Webブラウザにより前記構造化文書に基づくWebページが表示され、当該Webブラウザから呼び出されるプラグインソフトウェアをプロセッサが実行することにより前記選択が行われることを特徴とする情報処理方法。
  29. 前記プラグインソフトウェアに対応するプログラムであって、コンピュータを請求項1乃至27のいずれか1項に記載の情報処理装置における各手段として機能させるためのプログラム。
  30. 前記プラグインソフトウェアに対応するプログラムであって、請求項28に記載の情報処理方法をコンピュータに実行させるためのプログラム。
JP2013243085A 2013-11-25 2013-11-25 情報処理装置、情報処理方法、およびプログラム Active JP5766257B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013243085A JP5766257B2 (ja) 2013-11-25 2013-11-25 情報処理装置、情報処理方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013243085A JP5766257B2 (ja) 2013-11-25 2013-11-25 情報処理装置、情報処理方法、およびプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2009138398A Division JP5483934B2 (ja) 2009-06-09 2009-06-09 情報処理装置、情報処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2014081945A JP2014081945A (ja) 2014-05-08
JP5766257B2 true JP5766257B2 (ja) 2015-08-19

Family

ID=50786026

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013243085A Active JP5766257B2 (ja) 2013-11-25 2013-11-25 情報処理装置、情報処理方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP5766257B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4033764B2 (ja) * 2002-06-27 2008-01-16 沖電気工業株式会社 情報抽出装置および方法
JP5483934B2 (ja) * 2009-06-09 2014-05-07 キヤノン株式会社 情報処理装置、情報処理方法、およびプログラム

Also Published As

Publication number Publication date
JP2014081945A (ja) 2014-05-08

Similar Documents

Publication Publication Date Title
JP5801545B2 (ja) 情報処理装置、その情報処理方法及びプログラム
JP5692968B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP5455456B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP5629435B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US9659107B2 (en) Image processing apparatus, image processing method, and storage medium
JP5483934B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US9389811B2 (en) Image processing apparatus, image processing method, and recording medium
JP5735778B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP5792942B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
RU2573271C2 (ru) Устройство обработки информации, способ управления web-браузером и носитель хранения, сохраняющий программу для него
JP5766257B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP5646019B2 (ja) 画像処理装置、画像処理方法及びプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A132

Effective date: 20141202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150519

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150616

R151 Written notification of patent or utility model registration

Ref document number: 5766257

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151