JP2012150638A

JP2012150638A - コンテンツ推奨装置、コンテンツ推奨方法及びプログラム

Info

Publication number: JP2012150638A
Application number: JP2011008668A
Authority: JP
Inventors: Taisuke Ishiguro; 泰輔石黒
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2011-01-19
Filing date: 2011-01-19
Publication date: 2012-08-09

Abstract

【課題】ユーザが所望するクリップを簡単に推奨できるようにする。
【解決手段】コンテンツの一部を画像として切り取るクリップ処理手段と、前記クリップ処理手段により切り取られた画像のメタデータを解析するクリップメタデータ解析手段と、前記コンテンツのメタデータを解析するコンテンツメタデータ解析手段と、前記クリップメタデータ解析手段により解析されたメタデータと前記コンテンツメタデータ解析手段により解析されたメタデータとを比較するメタデータ比較手段と、前記メタデータ比較手段による比較結果に基づいて前記コンテンツから領域を特定する領域特定手段とを備える。
【選択図】図３

Description

本発明はコンテンツ推奨装置、コンテンツ推奨方法及びプログラムに関し、例えば、コンテンツの一部を選択するために用いて好適な技術に関する。

Ｗｅｂページを印刷する場合に、単純に印刷処理を行うとユーザにとって不要な部分が含まれる可能性がある。このように、ユーザにとって必要な部分はＷｅｂページの全てではなく、一部である可能性がある。そこで、ユーザの所望の部分を画像として切り出し、当該画像のみを印刷することによりユーザにとって必要な部分の情報のみを印刷可能にするアプリケーションが知られている。

しかしながら、必要な部分を設定するためにユーザによるクリップ作業は煩雑な操作を必要とする。そこで、ユーザ操作の煩雑さを解消するものとして、ユーザの操作履歴に基づき所望する情報を推奨する技術が知られている（例えば、特許文献１参照）。

特開２００６−２１７４４０号公報

しかしながら特許文献１に記載の方法はテレビ番組を推奨する方法に関するものであって、Ｗｅｂページにおいてクリップを推奨することはできない。

本発明は前述の問題点に鑑み、ユーザが所望するクリップを簡単に推奨できるようにすることを目的としている。

本発明のコンテンツ推奨装置は、コンテンツの一部を画像として切り取るクリップ処理手段と、前記クリップ処理手段により切り取られた画像のメタデータを解析するクリップメタデータ解析手段と、前記コンテンツのメタデータを解析するコンテンツメタデータ解析手段と、前記クリップメタデータ解析手段により解析されたメタデータと前記コンテンツメタデータ解析手段により解析されたメタデータとを比較するメタデータ比較手段と、前記メタデータ比較手段による比較結果に基づいて前記コンテンツから領域を特定する領域特定手段とを備えることを特徴とする。

本発明によれば、ユーザの所望するクリップを推奨することができる。

クリップを選択するための画面の一例を示す図である。コンテンツ推奨装置のハードウェア構成例を示すブロック図である。コンテンツ推奨装置の機能構成例を示すブロック図である。コンテンツ推奨処理の手順の一例を示すフローチャートである。メタデータ解析処理の手順の一例を示すフローチャートである。クリップ推奨処理の手順の一例を示すフローチャートである。具体的なＨＴＭＬの一例を示す図である。メタデータセットの一例を示す図である。図７に示すＨＴＭＬを描画した結果を示す図である。

（第１の実施形態）
まず、本実施形態の概要について図１を用いて説明する。図１は、本実施形態のコンテンツ推奨処理を実現するアプリケーションの一例を示す図であり、Ｗｅｂブラウザのプラグインとして実現されている。

図１（ａ）は、Ｗｅｂブラウザ上でプラグインが動作している画面の一例を示す図であり、ブラウザメニュー１０１、プラグインメニュー１０２、クリップ表示エリア１０３、Ｗｅｂページ表示エリア１０４、推奨クリップ表示エリア１０５から構成される。ブラウザメニュー１０１は、Ｗｅｂブラウザのメニューを提示している。ユーザは、ブラウザメニュー１０１に表示されるメニューに対して指示を行うことによりＷｅｂブラウズに必要な各種処理を実現する。例えば、「戻る」、「保存」等の処理を行うことができる。

プラグインメニュー１０２は、プラグイン機能を利用するための各種メニューの提示部である。当該メニューは、クリップボタン１０６と編集ボタン１０７とから構成される。ユーザによりクリップボタン１０６が指示されると、図１（ｂ）に示すＷｅｂページ表示エリアに表示されているＷｅｂページのクリップ処理を行うクリップ画面に移行する。また、編集ボタン１０７が指示された場合は、図１（ｃ）に示すクリップ表示エリアに表示されるクリップ群のレイアウト編集画面に移行する。

クリップ表示エリア１０３は、ユーザによりクリップされたデータ群の表示領域である。Ｗｅｂページ表示エリア１０４は、Ｗｅｂページを表示するエリアである。推奨クリップ表示エリア１０５は、ユーザの操作履歴に基づいてシステムが提示する推奨クリップを表示する領域である。ユーザは、当該領域のクリップを選択することにより所望のクリップデータを取得することができる。選択されたクリップデータは画像化されてクリップ表示エリア１０３に表示される。また、推奨クリップ表示エリア１０５には、クリップとともに推奨クリップに含まれるメタデータ及びクリップ元のＵＲＬが表示されている。当該メタデータ及びＵＲＬを表示することにより、推奨クリップの補助的な情報としてユーザによるクリップ内容理解の手助けとすることができる。

図１（ｂ）は、ユーザによるクリップ作業を行うクリップ画面の一例を示す図である。クリップ画面にはＷｅｂページとクリップ選択矩形１０８が表示される。クリップ選択矩形１０８は、予め定められた位置と大きさ（表示形態、表示対象）で表示される。ユーザは、このクリップ選択矩形１０８の位置及び大きさをマウス等のデバイスにより変更することによりクリップ領域を決定する。クリップ領域を決定した後、クリップ確定ボタン１０９を指示することにより、図１（ａ）に示した通常のＷｅｂブラウザの画面に戻るとともにクリップ領域が画像化されてクリップ表示エリア１０３に表示される。

図１（ｃ）は、クリップ群のレイアウト編集画面の一例を示す図である。レイアウト編集画面は、編集領域１１０、及びクリップ表示エリア１１１から構成される。編集領域１１０は、クリップ表示エリア１１１に表示されるクリップ画像を編集する領域であり、既存のＤＴＰアプリケーションと同様の操作によりクリップ画像の配置やサイズを編集することができる。クリップ表示エリア１１１に表示されているクリップ群は、図１（ａ）に示すクリップ表示エリア１０３に表示されていたものと同様である。ユーザは、クリップ表示エリア１１１に提示されているクリップ画像をドラッグ＆ドロップ等の操作により編集領域に移動させ、編集に使用するクリップ画像を選択することができる。

図２は、本実施形態におけるコンテンツ推奨装置のハードウェア構成の一例を示すブロック図である。
図２において、２０２はＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）であり、各種処理のための演算や論理判断などを行い、バス２０１に接続された各種要素を制御する。本実施形態におけるコンテンツ推奨装置は、プログラムメモリとデータメモリを含むメモリが搭載されている。プログラムメモリには、フローチャートにより後述する各種処理手順を含むＣＰＵによる制御のためのプログラムを格納する。このメモリはＲＯＭ（Ｒｅａｄ−ＯｎｌｙＭｅｍｏｒｙ）２０３であってもよいし、外部記憶装置などからプログラムがロードされるＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）２０４であってもよい。あるいは、これらの組合せで実現しても構わない。

２０５は、本実施形態に係るデータやプログラムを記憶しておくためのハードディスクなどの記憶装置である。また、本実施形態では、コンテンツを保持しておくためにも利用される。なお、コンテンツを保持しておく装置としては、外部接続やネットワークに接続されたコンテンツ保持装置を用いてもよい。また、記憶装置２０５と同様の役割を果たすものとして、外部記憶装置２０６を用いてもよい。ここで、外部記憶装置２０６は、例えば、メディア（記録媒体）と、当該メディアへのアクセスを実現するための外部記憶ドライブとで実現することができる。このようなメディアとしては、例えば、フレキシブルディスク（ＦＤ）、ＣＤ−ＲＯＭ、ＤＶＤ、ＵＳＢメモリ、ＭＯ、フラッシュメモリ等である。

２０７は、ユーザからの指示を入力するための入力装置である。ユーザは入力装置２０７を介して、当該コンテンツ推奨装置に指示を行う。入力装置２０７は、例えば、キーボードやポインティングデバイスにより実現することができる。２０８は処理結果等を表示出力する表示手段（表示対象）としての出力装置である。出力装置２０８は、例えば、出力のための回路を含むＣＲＴ（Ｃａｔｈｏｄｅ−ＲａｙＴｕｂｅ）や液晶表示器などのディスプレイ装置により実現することができる。本実施形態では、画像を出力装置（表示装置）２０８に表示する。２０９はインタフェース（以下、Ｉ／Ｆという）であり、このＩ／Ｆ２０９を介して外部装置とのデータのやり取りを行う。

図３は、本実施形態を構成するコンテンツ推奨装置の機能構成例を示すブロック図である。
図３において、３０１は入力装置であり、ユーザの指示を受け付ける。３０２は検索部であり、検索機能を備えており、ユーザによる指示に基づきＷｅｂページの検索を行う。また、ユーザの操作履歴に基づいて検索処理を行う。

３０３はクリップ処理部であり、ユーザによる指示に基づきＷｅｂページの所定の範囲から画像データを生成するとともに、後述するクリップ推奨部３０５により推奨されたＷｅｂページの一部を画像データ化する。３０４はメタデータ解析部であり、クリップメタデータ解析手段及びコンテンツメタデータ解析手段として機能し、Ｗｅｂページのメタデータ解析を行う。

３０５はクリップ推奨部であり、メタデータ比較手段及び領域特定手段として機能する。クリップ推奨部３０５は、ユーザの操作履歴とメタデータ解析部３０４によるメタデータの解析結果とに基づいてユーザに推奨するクリップデータの領域を検出する。当該検出された領域はクリップ処理部３０３により画像データ化されて、推奨クリップとしてユーザに提示される。検索部３０２〜クリップ推奨部３０５における処理は、図２のＣＰＵ２０２によって制御されている。当該処理の詳細は後述する。

３０６は、図２の記憶装置２０５に該当し、ユーザの操作履歴を格納するユーザ情報ＤＢ（データベース）である。検索部３０２、メタデータ解析部３０４、及びクリップ推奨部３０５にてユーザの操作履歴を用いる際に参照される。３０７は出力装置であり、ユーザ操作を支援する各種ユーザインターフェースや処理結果等を表示出力する。

図４は、本実施形態におけるコンテンツ推奨処理の手順の一例を示すフローチャートである。ここで、各ステップの説明に入る前に、当該処理の概要について説明する。

コンテンツ推奨処理では、ユーザによる検索処理及びクリップ処理の操作履歴を保持しておき、当該操作履歴に基づいて推奨クリップを決定する。すなわち、処理の第一段階として、ユーザ処理の操作履歴をＤＢへ保持する（後述するステップＳ４０００及びＳ４０１０に相当）。そして、第二段階として、当該操作履歴に基づいてクリップ推奨処理を行う（後述するステップＳ４０２０〜Ｓ４０５０に相当）。

また、操作履歴として保持される具体的データは、検索処理ではユーザにより入力された検索クエリであり、クリップ処理では、クリップ画像に含まれるメタデータである。コンテンツ推奨処理では、まず、ユーザにより入力された検索クエリと関連するクエリを用いた検索処理を行う。当該検索結果内で前記クリップ画像に含まれるメタデータと合致するメタデータを持つＷｅｂページを検索し、ユーザが所望するであろうＷｅｂページを特定する。続いて、特定されたＷｅｂページ内で前記クリップ画像に含まれるメタデータと合致するメタデータを持つＷｅｂページ内の部分領域を見つけることにより、推奨クリップ領域を特定する。以降、各処理の詳細を説明する。

まず、ステップＳ４０００は、ユーザの操作に応じて行うＷｅｂページ検索処理であり、図３における検索部３０２により処理される。ユーザにより検索クエリとしてキーワードが入力されることによりＷｅｂページを検索する。ユーザにより入力された検索クエリは、ユーザの操作履歴としてユーザ情報ＤＢ３０６に格納される。検索処理は、既存の検索技術を用いる。ここで、検索処理はキーワード入力をクエリとすることとしたが、他の検索技術を用いてもよい。自然文をクエリとして入力する概念検索技術や画像をクエリとして入力する類似画像検索技術等を用いることも可能である。

次のステップＳ４０１０は、ユーザの操作に応じて行われるクリップ処理であり、図３におけるクリップ処理部３０３により処理される。前述したように、ユーザは検索処理によって見つけたＷｅｂページから所望の領域を選択する。そして、当該選択領域をクリップ画像として生成してクリップ表示エリアに表示する。クリップ処理では、ユーザにより選択されたＷｅｂページ内の領域に対するメタデータが解析され、ユーザ情報ＤＢ３０６に格納される。この解析は、ユーザによるクリップ領域と対応するＨＴＭＬデータを特定し、当該ＨＴＭＬに対するメタデータ解析を行うことにより実現する。ＨＴＭＬデータの特定処理は、既存のＷｅｂブラウザ技術を用いることにより、ＨＴＭＬと当該ＨＴＭＬが描画された結果との対応を判断することによって特定が可能になる。メタデータの解析処理については後に詳細を説明する。

次のステップＳ４０２０では、関連情報検索を行い、図３における検索部３０２により処理される。関連情報検索処理は、ユーザ情報ＤＢ３０６を参照し、ユーザにより入力された検索クエリを取得する。取得した検索クエリとの関連語を取得することにより、ユーザによる検索処理と関連する関連語をクエリとした検索処理を行う。関連後の取得処理は、既存の関連キーワード取得技術を用いる。例えば、類義語辞書を用いることにより検索クエリの類義語を取得し、当該類義語を関連キーワードとすることができる。また、検索処理に入力される様々なユーザの検索クエリを解析して検索クエリ間の共起関係を求める。そして、共起関係の認められた検索クエリを入力検索クエリとともに検索される関連キーワードとすることができる。

次のステップＳ４０３０は、クリップ推奨処理であり、図３におけるクリップ推奨部３０５により処理される。クリップ推奨処理では、ユーザ情報ＤＢ３０６に格納されているユーザの操作履歴に基づいて、ステップＳ４０２０での検索結果内に推奨すべき領域があるか判定する。具体的には、操作履歴に含まれるメタデータと検索結果に含まれるメタデータとの比較により推奨すべき領域があるか判定する。そして、判定の結果に基づき、推奨すべき領域を特定し、当該領域を画像データとして生成する。クリップ推奨処理の詳細は後述する。

次のステップＳ４０４０では、ステップＳ４０３０において生成されたクリップ画像をユーザに提示する。そして、ステップＳ４０５０では、ユーザ操作を判定する。この判定の結果、ステップＳ４０４０において提示されたクリップ画像をユーザが選択せず、異なる検索処理を行う場合は、ステップＳ４０００へ移行し、新たな検索指示を行う。一方、ステップＳ４０５０の判定の結果、ステップＳ４０４０で提示されたクリップ画像を選択した場合は、ス当該クリップ画像のメタデータを解析し、解析結果をユーザ情報ＤＢに格納した後、ステップＳ４０２０に移行する。また、ステップＳ４０５０の判定の結果、ユーザにより検索処理もしくは推奨クリップ選択が行われない場合は、処理を完了する。

図５は、本実施形態において、メタデータ解析部３０４により行われるメタデータ解析処理の手順の一例を示すフローチャートである。
まず、ステップＳ５０００は、ＨＴＭＬ取得処理である。メタデータ解析対象となるＷｅｂページからＨＴＭＬを取得する。

次に、ステップＳ５０１０では、ステップＳ５０００で取得したＨＴＭＬが示すコンテンツを解析する。コンテンツ解析処理は、ＨＴＭＬに含まれるタグを用いて行う。この解析の結果、ＨＴＭＬ内に画像データを示すタグが存在しない場合、コンテンツはテキストであると判断し、ステップＳ５０２０へ移行する。また、ＨＴＭＬ内に画像データを示すタグが含まれ、テキストを示すタグが存在しない場合は、コンテンツは画像であると判断し、ステップＳ５０４０へ移行する。さらに、ＨＴＭＬ内にテキスト及び画像を示すタグが共に存在する場合は、コンテンツはテキストと画像の混在であると判断し、ステップＳ５０７０へ移行する。

ステップＳ５０２０では、ＨＴＭＬ内のメタデータを示すメタタグに基づきメタデータを抽出する。メタタグは予め規定されており、当該タグ内に記載されるデータをメタデータとして抽出する。例えば、メタタグとして、ｍｅｔａタグ、ｔｉｔｌｅタグを規定しておき、当該タグに含まれるデータをメタデータとすることができる。

次のステップＳ５０３０では、ＨＴＭＬ内のテキストデータに対してキーワードを抽出することによりメタデータを取得する。具体的には、キーワードとして抽出されたデータをメタデータとする。キーワード抽出処理は、既存のキーワード抽出技術を用いることができる。

一方、ステップＳ５０４０では、ＨＴＭＬ内のメタデータを示すメタタグに基づきメタデータを抽出する。当該処理はステップＳ５０２０において説明した処理と同じである。次のステップＳ５０５０では、画像データに付与されるメタデータを取得する。この処理は、画像フォーマットに付与されているＥｘｉｆ等のメタデータ（日時、場所等）を取得することで実現される。

そして、ステップＳ５０６０では、画像データに対する画像認識・解析処理によりキーワードを抽出し、当該キーワードをメタデータとして取得する。画像認識・解析処理は既存の画像認識・解析処理を用いることができる。例えば、既存のオブジェクト認識技術により認識されたオブジェクトをキーワードとして抽出することができる。また、既存のシーン解析技術により解析されたシーンをキーワードとすることも可能である。

一方、ステップＳ５０７０では、ＨＴＭＬ内のメタデータを示すメタタグに基づきメタデータを抽出する。当該処理はステップＳ５０２０及びＳ５０４０の処理と同様のものである。次のステップＳ５０８０は、ＨＴＭＬ内のテキストデータに対するキーワード抽出処理であり、ステップＳ５０３０において説明した処理と同様のものである。次のステップＳ５０９０は、画像データに付与されるメタデータを取得する処理であり、ステップＳ５０５０における処理と同じである。次のステップＳ５１００は、画像データに対する画像認識・解析処理によるキーワード抽出結果をメタデータとするものであり、ステップＳ５０６０で説明した処理と同じものである。

そして、ステップＳ５１１０では、抽出されたメタデータを１つのセットとして構成し、当該メタデータセットをユーザ情報ＤＢ３０６に格納する。

図６は、本実施形態において、ステップＳ４０３０においてクリップ推奨部３０５により行われるクリップ推奨処理の手順の一例を示すフローチャートである。
まず、ステップＳ６０００は、関連検索結果取得処理である。関連検索結果取得処理では、ユーザによる検索クエリと類義語辞書とを用いて得られた当該クエリの関連語を用いて検索処理を行った結果に対し、メタデータ解析を行う対象を決定する。メタデータ解析対象の決定には、予め規定しておいた解析対象スコア値に基づいて行う。具体的には、解析対象とする検索結果のスコアを定めておき、当該スコア以上の検索結果に対してメタデータ解析の対象とすることとする。

例えば、検索結果に対するスコア算出が可能な検索処理システムにおいてスコアが１００〜０であり、解析対象スコア値が８０の場合を考える。この場合、検索結果のうち８０以上のスコアとなったもののみをメタデータの解析処理対象として決定する。ここで、メタデータの解析対象はスコア値を閾値とした場合を説明したが、他の方法でもよい。例えば、検索結果数を予め決めておき、当該結果数に達した際に関連検索処理を終了し、関連検索処理結果すべてをメタデータ解析対象とすることもできる。

次のステップＳ６０１０では、ユーザ情報ＤＢ３０６からメタデータを取得する。具体的には、ユーザ情報ＤＢ３０６に登録されている全メタデータセットを取得する。次のステップＳ６０２０では、ステップＳ６０００もしくは後述するステップＳ６０６０で決定したメタデータ解析対象のＷｅｂページに対してメタデータ解析を行う。メタデータ解析処理は、図５を用いて説明を行った処理のうち、ステップＳ５０００〜ステップＳ５１００と同様のものであり、解析結果は一時記憶として保持される。

次のステップＳ６０３０は、メタデータマッチング処理である。メタデータのマッチング処理では、ステップＳ６０１０で解析されたメタデータセットとステップＳ６０２０で取得したメタデータセットとが合致するか否かを判定する。メタデータセットの合致処理は、メタデータセットに含まれるメタデータをキーワードとして、キーワードが完全一致したか否かを判断することによって合致判定を行う。メタデータセットの全キーワードが完全一致した場合、すなわち比較結果が合致した場合は、メタデータセットが合致したと判定する。ここで、キーワードの合致判定処理を完全一致と説明したが、他の方法でも問題ない。例えば、類義語辞書等を用いて関連すると判定されたキーワードも合致したとみなしてもよい。また、メタデータセット内の全キーワードが一致した場合、メタデータセットが合致したと判定していたが、異なる処理を用いることもできる。例えば、メタデータセット内の所定の割合のキーワードが合致した場合、メタデータセットが合致したと判定してもよい。

次のステップＳ６０４０では、領域タグを特定する。領域タグは予め規定されており、ＨＴＭＬにおいてデータのかたまりを示すものである。例えば、段落を示すｐタグやブロックを示すｄｉｖタグを領域タグとして用いることができる。

以下、領域タグの具体的内容を説明する。領域タグ特定処理では、まずステップＳ６０３０において合致したと判断されたメタデータセット内の各キーワードが含まれるＨＴＭＬタグを特定する。そして、当該タグが領域タグであるか否かを判定する。判定の結果、領域タグであった場合は、クリップ対象タグとして一時記憶に保持しておく。一方、領域タグではないと判定された場合は、キーワードが含まれていたＨＴＭＬタグを基点とし、ＨＴＭＬ等の構造化言語の上位階層に領域タグがないか探索する。探索の結果、領域タグが存在する場合には、当該領域タグをクリップ対象タグとして一時記憶に保持する。一方、領域タグが見つからない場合は、ＨＴＭＬのルート、すなわちＷｅｂページ全体をクリップ対象として一時記憶に保持する。

次のステップＳ６０５０では、一時記憶に保持されているクリップ対象タグ以下にリンクデータが存在するか否かを判定する。この判定の結果、リンクデータが存在する場合は、ステップＳ６０６０へ移行する。一方、リンクデータが存在しない場合、ステップＳ６０７０へ移行する。

ステップＳ６０６０では、一時記憶に保持されているクリップ対象タグ以下に存在するリンク先のＨＴＭＬを取得する。取得したＨＴＭＬをメタデータ解析対象として決定し、ステップＳ６０２０へ移行する。当該処理を行うことにより、リンク先のＷｅｂページからも推奨すべきクリップ領域がある場合も処理することが可能になる。Ｗｅｂページでは、リンクによる情報探索を前提として、複数のページにより単一の情報が表現されている場合もあるが、本実施形態による手法によればこのような場合にも対応することができる。

一方、ステップＳ６０７０では、一時記憶に保持されていたクリップ対象タグを画像データとして生成する。クリップ画像生成処理では、Ｗｅｂページを画像として生成した後、各クリップ対象タグの示す領域を含む外接矩形を切り出すことにより実現する。リンクにより複数ページに分割されていた場合は、各Ｗｅｂページから生成された画像に対しクリップ対象タグの示す領域を切り出した後、切り出した画像同士を結合して１つの画像を形成する。結合処理は、リンク元のページから切り出された画像の下側にリンク先から切り出された画像を配置することにより行う。画像間の大きさが異なる場合は、画像の左端を合わせて配置した後、外接矩形領域となる画像を構成しなおす。

以下、ステップＳ６０７０の具体例として、図７のＨＴＭＬを用いて説明する。ユーザ情報ＤＢ３０６に格納されているメタデータセットが図８に示すものの場合、合致するメタデータを含むタグは、図７のタグ７０１、７０２である。タグ７０１は領域タグではないので、上位階層を探索し、領域タグ７０３が見つかる。一方、タグ７０２は領域タグであるため探索処理は行わない。このようにここで見つかった領域タグ７０３がクリップ対象のタグとなる。すなわち、領域タグ７０３、及びタグ７０２がクリップ対象のタグとなる。

図９（ａ）は、図７のＨＴＭＬを描画した結果を示す図であり、画像として生成した結果を示している。クリップ対象タグである領域タグ７０３、及びタグ７０２と対応する領域が、それぞれ領域９０１、９０２である。図９（ｂ）は、図９（ａ）から推奨クリップとして切り出された画像例を示す図であり、領域９０１、９０２を含む外接矩形として切り出されている。

本実施形態では、複数のクリップ対象領域が１つのＷｅｂページ内に存在した場合、クリップ対象領域を含む外接矩形としたが、異なる方法でもよい。例えば、クリップ対象領域となるタグ以下のＨＴＭＬを抽出し、ＨＴＭＬルートと当該ＨＴＭＬからのみで構成される新たなＨＴＭＬを構成してもよい。図９（ｃ）は、図７及び図８に示すデータを用いた場合の推奨クリップの例を示す図である。クリップ対象領域の外接矩形ではないため、クリップ対象領域とは関連のないデータは一切画像に含まれていない。

（第２の実施形態）
第１の実施形態では、ＨＴＭＬによりＷｅｂページが構成されている場合について説明したが、クリップ対象となるデータはＨＴＭLでなくてもよく、データと表示が対応づけられている構造をもつ構造化言語により表現される形式に適用することができる。例えば、ＨＴＭＬの代わりに独自に定義したＸＭＬデータを用いてもよい。ワープロソフト等で作成可能な文書のデータ形式をＸＭＬにより表記し、当該文書が蓄積されたシステムにおいても本発明は適用可能である。

具体的には、ワープロソフトで作成された文書を不図示のデータベースに蓄積しておき、当該文書群の検索・クリップ・クリップ推奨機能を提供することができる。そして、図３に示した各機能ブロックの処理対象が当該文書群となることにより実現することができる。

本実施形態では、ＨＴＭＬではなく独自のＸＭＬで表現されたコンテンツ群に対する適用例を説明したが、コンテンツ群は単独のフォーマットで表現されている必要はない。例えば、ＨＴＭＬで表現されたコンテンツと独自のＸＭＬで表現されたコンテンツが混在している場合も対応することができる。当該処理は、ＨＴＭＬ、及び独自のＸＭＬに対するメタタグ及び領域タグを定義しておくことにより実現可能である。双方の形式に対するメタタグが定義されていることにより全てのコンテンツからメタデータの抽出を行うことが可能になる（図５におけるステップＳ５０２０、Ｓ５０４０、Ｓ５０７０に相当）。また、領域タグが定義されていることにより推奨すべきクリップ領域を特定することが可能になる（図６におけるステップＳ６０４０に相当）。

（第３の実施形態）
第２の実施形態では、予め構造化言語によりコンテンツが作成されている例を説明したが、画像等の構造化言語により表現されていないコンテンツに対しても適用可能である。具体的には、画像等の構造化言語により表現されていないコンテンツから構造化言語を作成することにより本発明が適用可能である。例えば、スキャンされた文書画像に対して文書画像解析処理を行い、解析結果を用いて論理情報を抽出し、当該情報を構造化言語として表現することができる。文書画像に対する解析処理および論理情報処理は、既存技術を用いる。

以上、第１〜第３の実施形態に示したように、ユーザの操作履歴に基づいてクリップを推奨することにより、ユーザによる情報探索、クリップ作業の負荷を軽減することが可能になる。

（その他の実施形態）
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア（プログラム）を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ（またはＣＰＵやＭＰＵ等）がプログラムを読み出して実行する処理である。

３０３クリップ処理部
３０４メタデータ解析部
３０５クリップ推奨部

Claims

コンテンツの一部を画像として切り取るクリップ処理手段と、
前記クリップ処理手段により切り取られた画像のメタデータを解析するクリップメタデータ解析手段と、
前記コンテンツのメタデータを解析するコンテンツメタデータ解析手段と、
前記クリップメタデータ解析手段により解析されたメタデータと前記コンテンツメタデータ解析手段により解析されたメタデータとを比較するメタデータ比較手段と、
前記メタデータ比較手段による比較結果に基づいて前記コンテンツから領域を特定する領域特定手段とを備えることを特徴とするコンテンツ推奨装置。
前記コンテンツは、表示形態と表示対象とが構造化言語により表現されており、
前記領域特定手段は、前記構造化言語から表示領域を示すタグを特定することを特徴とする請求項１に記載のコンテンツ推奨装置。
前記領域特定手段は、特定されたタグが複数ある場合に、各タグを含む外接矩形を特定することを特徴とする請求項２に記載のコンテンツ推奨装置。
コンテンツの一部を画像として切り取るクリップ処理工程と、
前記クリップ処理工程において切り取られた画像のメタデータを解析するクリップメタデータ解析工程と、
前記コンテンツのメタデータを解析するコンテンツメタデータ解析工程と、
前記クリップメタデータ解析工程において解析されたメタデータと前記コンテンツメタデータ解析工程において解析されたメタデータとを比較するメタデータ比較工程と、
前記メタデータ比較工程における比較結果に基づいてコンテンツから領域を特定する領域特定工程とを備えることを特徴とするコンテンツ推奨方法。
請求項４に記載のコンテンツ推奨方法の各工程をコンピュータに実行させるためのプログラム。