JP2012150638A - コンテンツ推奨装置、コンテンツ推奨方法及びプログラム - Google Patents
コンテンツ推奨装置、コンテンツ推奨方法及びプログラム Download PDFInfo
- Publication number
- JP2012150638A JP2012150638A JP2011008668A JP2011008668A JP2012150638A JP 2012150638 A JP2012150638 A JP 2012150638A JP 2011008668 A JP2011008668 A JP 2011008668A JP 2011008668 A JP2011008668 A JP 2011008668A JP 2012150638 A JP2012150638 A JP 2012150638A
- Authority
- JP
- Japan
- Prior art keywords
- metadata
- clip
- content
- image
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】ユーザが所望するクリップを簡単に推奨できるようにする。
【解決手段】コンテンツの一部を画像として切り取るクリップ処理手段と、前記クリップ処理手段により切り取られた画像のメタデータを解析するクリップメタデータ解析手段と、前記コンテンツのメタデータを解析するコンテンツメタデータ解析手段と、前記クリップメタデータ解析手段により解析されたメタデータと前記コンテンツメタデータ解析手段により解析されたメタデータとを比較するメタデータ比較手段と、前記メタデータ比較手段による比較結果に基づいて前記コンテンツから領域を特定する領域特定手段とを備える。
【選択図】図3
【解決手段】コンテンツの一部を画像として切り取るクリップ処理手段と、前記クリップ処理手段により切り取られた画像のメタデータを解析するクリップメタデータ解析手段と、前記コンテンツのメタデータを解析するコンテンツメタデータ解析手段と、前記クリップメタデータ解析手段により解析されたメタデータと前記コンテンツメタデータ解析手段により解析されたメタデータとを比較するメタデータ比較手段と、前記メタデータ比較手段による比較結果に基づいて前記コンテンツから領域を特定する領域特定手段とを備える。
【選択図】図3
Description
本発明はコンテンツ推奨装置、コンテンツ推奨方法及びプログラムに関し、例えば、コンテンツの一部を選択するために用いて好適な技術に関する。
Webページを印刷する場合に、単純に印刷処理を行うとユーザにとって不要な部分が含まれる可能性がある。このように、ユーザにとって必要な部分はWebページの全てではなく、一部である可能性がある。そこで、ユーザの所望の部分を画像として切り出し、当該画像のみを印刷することによりユーザにとって必要な部分の情報のみを印刷可能にするアプリケーションが知られている。
しかしながら、必要な部分を設定するためにユーザによるクリップ作業は煩雑な操作を必要とする。そこで、ユーザ操作の煩雑さを解消するものとして、ユーザの操作履歴に基づき所望する情報を推奨する技術が知られている(例えば、特許文献1参照)。
しかしながら特許文献1に記載の方法はテレビ番組を推奨する方法に関するものであって、Webページにおいてクリップを推奨することはできない。
本発明は前述の問題点に鑑み、ユーザが所望するクリップを簡単に推奨できるようにすることを目的としている。
本発明のコンテンツ推奨装置は、コンテンツの一部を画像として切り取るクリップ処理手段と、前記クリップ処理手段により切り取られた画像のメタデータを解析するクリップメタデータ解析手段と、前記コンテンツのメタデータを解析するコンテンツメタデータ解析手段と、前記クリップメタデータ解析手段により解析されたメタデータと前記コンテンツメタデータ解析手段により解析されたメタデータとを比較するメタデータ比較手段と、前記メタデータ比較手段による比較結果に基づいて前記コンテンツから領域を特定する領域特定手段とを備えることを特徴とする。
本発明によれば、ユーザの所望するクリップを推奨することができる。
(第1の実施形態)
まず、本実施形態の概要について図1を用いて説明する。図1は、本実施形態のコンテンツ推奨処理を実現するアプリケーションの一例を示す図であり、Webブラウザのプラグインとして実現されている。
まず、本実施形態の概要について図1を用いて説明する。図1は、本実施形態のコンテンツ推奨処理を実現するアプリケーションの一例を示す図であり、Webブラウザのプラグインとして実現されている。
図1(a)は、Webブラウザ上でプラグインが動作している画面の一例を示す図であり、ブラウザメニュー101、プラグインメニュー102、クリップ表示エリア103、Webページ表示エリア104、推奨クリップ表示エリア105から構成される。ブラウザメニュー101は、Webブラウザのメニューを提示している。ユーザは、ブラウザメニュー101に表示されるメニューに対して指示を行うことによりWebブラウズに必要な各種処理を実現する。例えば、「戻る」、「保存」等の処理を行うことができる。
プラグインメニュー102は、プラグイン機能を利用するための各種メニューの提示部である。当該メニューは、クリップボタン106と編集ボタン107とから構成される。ユーザによりクリップボタン106が指示されると、図1(b)に示すWebページ表示エリアに表示されているWebページのクリップ処理を行うクリップ画面に移行する。また、編集ボタン107が指示された場合は、図1(c)に示すクリップ表示エリアに表示されるクリップ群のレイアウト編集画面に移行する。
クリップ表示エリア103は、ユーザによりクリップされたデータ群の表示領域である。Webページ表示エリア104は、Webページを表示するエリアである。推奨クリップ表示エリア105は、ユーザの操作履歴に基づいてシステムが提示する推奨クリップを表示する領域である。ユーザは、当該領域のクリップを選択することにより所望のクリップデータを取得することができる。選択されたクリップデータは画像化されてクリップ表示エリア103に表示される。また、推奨クリップ表示エリア105には、クリップとともに推奨クリップに含まれるメタデータ及びクリップ元のURLが表示されている。当該メタデータ及びURLを表示することにより、推奨クリップの補助的な情報としてユーザによるクリップ内容理解の手助けとすることができる。
図1(b)は、ユーザによるクリップ作業を行うクリップ画面の一例を示す図である。クリップ画面にはWebページとクリップ選択矩形108が表示される。クリップ選択矩形108は、予め定められた位置と大きさ(表示形態、表示対象)で表示される。ユーザは、このクリップ選択矩形108の位置及び大きさをマウス等のデバイスにより変更することによりクリップ領域を決定する。クリップ領域を決定した後、クリップ確定ボタン109を指示することにより、図1(a)に示した通常のWebブラウザの画面に戻るとともにクリップ領域が画像化されてクリップ表示エリア103に表示される。
図1(c)は、クリップ群のレイアウト編集画面の一例を示す図である。レイアウト編集画面は、編集領域110、及びクリップ表示エリア111から構成される。編集領域110は、クリップ表示エリア111に表示されるクリップ画像を編集する領域であり、既存のDTPアプリケーションと同様の操作によりクリップ画像の配置やサイズを編集することができる。クリップ表示エリア111に表示されているクリップ群は、図1(a)に示すクリップ表示エリア103に表示されていたものと同様である。ユーザは、クリップ表示エリア111に提示されているクリップ画像をドラッグ&ドロップ等の操作により編集領域に移動させ、編集に使用するクリップ画像を選択することができる。
図2は、本実施形態におけるコンテンツ推奨装置のハードウェア構成の一例を示すブロック図である。
図2において、202はCPU(Central Processing Unit)であり、各種処理のための演算や論理判断などを行い、バス201に接続された各種要素を制御する。本実施形態におけるコンテンツ推奨装置は、プログラムメモリとデータメモリを含むメモリが搭載されている。プログラムメモリには、フローチャートにより後述する各種処理手順を含むCPUによる制御のためのプログラムを格納する。このメモリはROM(Read−Only Memory)203であってもよいし、外部記憶装置などからプログラムがロードされるRAM(Random Access Memory)204であってもよい。あるいは、これらの組合せで実現しても構わない。
図2において、202はCPU(Central Processing Unit)であり、各種処理のための演算や論理判断などを行い、バス201に接続された各種要素を制御する。本実施形態におけるコンテンツ推奨装置は、プログラムメモリとデータメモリを含むメモリが搭載されている。プログラムメモリには、フローチャートにより後述する各種処理手順を含むCPUによる制御のためのプログラムを格納する。このメモリはROM(Read−Only Memory)203であってもよいし、外部記憶装置などからプログラムがロードされるRAM(Random Access Memory)204であってもよい。あるいは、これらの組合せで実現しても構わない。
205は、本実施形態に係るデータやプログラムを記憶しておくためのハードディスクなどの記憶装置である。また、本実施形態では、コンテンツを保持しておくためにも利用される。なお、コンテンツを保持しておく装置としては、外部接続やネットワークに接続されたコンテンツ保持装置を用いてもよい。また、記憶装置205と同様の役割を果たすものとして、外部記憶装置206を用いてもよい。ここで、外部記憶装置206は、例えば、メディア(記録媒体)と、当該メディアへのアクセスを実現するための外部記憶ドライブとで実現することができる。このようなメディアとしては、例えば、フレキシブルディスク(FD)、CD−ROM、DVD、USBメモリ、MO、フラッシュメモリ等である。
207は、ユーザからの指示を入力するための入力装置である。ユーザは入力装置207を介して、当該コンテンツ推奨装置に指示を行う。入力装置207は、例えば、キーボードやポインティングデバイスにより実現することができる。208は処理結果等を表示出力する表示手段(表示対象)としての出力装置である。出力装置208は、例えば、出力のための回路を含むCRT(Cathode−Ray Tube)や液晶表示器などのディスプレイ装置により実現することができる。本実施形態では、画像を出力装置(表示装置)208に表示する。209はインタフェース(以下、I/Fという)であり、このI/F209を介して外部装置とのデータのやり取りを行う。
図3は、本実施形態を構成するコンテンツ推奨装置の機能構成例を示すブロック図である。
図3において、301は入力装置であり、ユーザの指示を受け付ける。302は検索部であり、検索機能を備えており、ユーザによる指示に基づきWebページの検索を行う。また、ユーザの操作履歴に基づいて検索処理を行う。
図3において、301は入力装置であり、ユーザの指示を受け付ける。302は検索部であり、検索機能を備えており、ユーザによる指示に基づきWebページの検索を行う。また、ユーザの操作履歴に基づいて検索処理を行う。
303はクリップ処理部であり、ユーザによる指示に基づきWebページの所定の範囲から画像データを生成するとともに、後述するクリップ推奨部305により推奨されたWebページの一部を画像データ化する。304はメタデータ解析部であり、クリップメタデータ解析手段及びコンテンツメタデータ解析手段として機能し、Webページのメタデータ解析を行う。
305はクリップ推奨部であり、メタデータ比較手段及び領域特定手段として機能する。クリップ推奨部305は、ユーザの操作履歴とメタデータ解析部304によるメタデータの解析結果とに基づいてユーザに推奨するクリップデータの領域を検出する。当該検出された領域はクリップ処理部303により画像データ化されて、推奨クリップとしてユーザに提示される。検索部302〜クリップ推奨部305における処理は、図2のCPU202によって制御されている。当該処理の詳細は後述する。
306は、図2の記憶装置205に該当し、ユーザの操作履歴を格納するユーザ情報DB(データベース)である。検索部302、メタデータ解析部304、及びクリップ推奨部305にてユーザの操作履歴を用いる際に参照される。307は出力装置であり、ユーザ操作を支援する各種ユーザインターフェースや処理結果等を表示出力する。
図4は、本実施形態におけるコンテンツ推奨処理の手順の一例を示すフローチャートである。ここで、各ステップの説明に入る前に、当該処理の概要について説明する。
コンテンツ推奨処理では、ユーザによる検索処理及びクリップ処理の操作履歴を保持しておき、当該操作履歴に基づいて推奨クリップを決定する。すなわち、処理の第一段階として、ユーザ処理の操作履歴をDBへ保持する(後述するステップS4000及びS4010に相当)。そして、第二段階として、当該操作履歴に基づいてクリップ推奨処理を行う(後述するステップS4020〜S4050に相当)。
また、操作履歴として保持される具体的データは、検索処理ではユーザにより入力された検索クエリであり、クリップ処理では、クリップ画像に含まれるメタデータである。コンテンツ推奨処理では、まず、ユーザにより入力された検索クエリと関連するクエリを用いた検索処理を行う。当該検索結果内で前記クリップ画像に含まれるメタデータと合致するメタデータを持つWebページを検索し、ユーザが所望するであろうWebページを特定する。続いて、特定されたWebページ内で前記クリップ画像に含まれるメタデータと合致するメタデータを持つWebページ内の部分領域を見つけることにより、推奨クリップ領域を特定する。以降、各処理の詳細を説明する。
まず、ステップS4000は、ユーザの操作に応じて行うWebページ検索処理であり、図3における検索部302により処理される。ユーザにより検索クエリとしてキーワードが入力されることによりWebページを検索する。ユーザにより入力された検索クエリは、ユーザの操作履歴としてユーザ情報DB306に格納される。検索処理は、既存の検索技術を用いる。ここで、検索処理はキーワード入力をクエリとすることとしたが、他の検索技術を用いてもよい。自然文をクエリとして入力する概念検索技術や画像をクエリとして入力する類似画像検索技術等を用いることも可能である。
次のステップS4010は、ユーザの操作に応じて行われるクリップ処理であり、図3におけるクリップ処理部303により処理される。前述したように、ユーザは検索処理によって見つけたWebページから所望の領域を選択する。そして、当該選択領域をクリップ画像として生成してクリップ表示エリアに表示する。クリップ処理では、ユーザにより選択されたWebページ内の領域に対するメタデータが解析され、ユーザ情報DB306に格納される。この解析は、ユーザによるクリップ領域と対応するHTMLデータを特定し、当該HTMLに対するメタデータ解析を行うことにより実現する。HTMLデータの特定処理は、既存のWebブラウザ技術を用いることにより、HTMLと当該HTMLが描画された結果との対応を判断することによって特定が可能になる。メタデータの解析処理については後に詳細を説明する。
次のステップS4020では、関連情報検索を行い、図3における検索部302により処理される。関連情報検索処理は、ユーザ情報DB306を参照し、ユーザにより入力された検索クエリを取得する。取得した検索クエリとの関連語を取得することにより、ユーザによる検索処理と関連する関連語をクエリとした検索処理を行う。関連後の取得処理は、既存の関連キーワード取得技術を用いる。例えば、類義語辞書を用いることにより検索クエリの類義語を取得し、当該類義語を関連キーワードとすることができる。また、検索処理に入力される様々なユーザの検索クエリを解析して検索クエリ間の共起関係を求める。そして、共起関係の認められた検索クエリを入力検索クエリとともに検索される関連キーワードとすることができる。
次のステップS4030は、クリップ推奨処理であり、図3におけるクリップ推奨部305により処理される。クリップ推奨処理では、ユーザ情報DB306に格納されているユーザの操作履歴に基づいて、ステップS4020での検索結果内に推奨すべき領域があるか判定する。具体的には、操作履歴に含まれるメタデータと検索結果に含まれるメタデータとの比較により推奨すべき領域があるか判定する。そして、判定の結果に基づき、推奨すべき領域を特定し、当該領域を画像データとして生成する。クリップ推奨処理の詳細は後述する。
次のステップS4040では、ステップS4030において生成されたクリップ画像をユーザに提示する。そして、ステップS4050では、ユーザ操作を判定する。この判定の結果、ステップS4040において提示されたクリップ画像をユーザが選択せず、異なる検索処理を行う場合は、ステップS4000へ移行し、新たな検索指示を行う。一方、ステップS4050の判定の結果、ステップS4040で提示されたクリップ画像を選択した場合は、ス当該クリップ画像のメタデータを解析し、解析結果をユーザ情報DBに格納した後、ステップS4020に移行する。また、ステップS4050の判定の結果、ユーザにより検索処理もしくは推奨クリップ選択が行われない場合は、処理を完了する。
図5は、本実施形態において、メタデータ解析部304により行われるメタデータ解析処理の手順の一例を示すフローチャートである。
まず、ステップS5000は、HTML取得処理である。メタデータ解析対象となるWebページからHTMLを取得する。
まず、ステップS5000は、HTML取得処理である。メタデータ解析対象となるWebページからHTMLを取得する。
次に、ステップS5010では、ステップS5000で取得したHTMLが示すコンテンツを解析する。コンテンツ解析処理は、HTMLに含まれるタグを用いて行う。この解析の結果、HTML内に画像データを示すタグが存在しない場合、コンテンツはテキストであると判断し、ステップS5020へ移行する。また、HTML内に画像データを示すタグが含まれ、テキストを示すタグが存在しない場合は、コンテンツは画像であると判断し、ステップS5040へ移行する。さらに、HTML内にテキスト及び画像を示すタグが共に存在する場合は、コンテンツはテキストと画像の混在であると判断し、ステップS5070へ移行する。
ステップS5020では、HTML内のメタデータを示すメタタグに基づきメタデータを抽出する。メタタグは予め規定されており、当該タグ内に記載されるデータをメタデータとして抽出する。例えば、メタタグとして、metaタグ、titleタグを規定しておき、当該タグに含まれるデータをメタデータとすることができる。
次のステップS5030では、HTML内のテキストデータに対してキーワードを抽出することによりメタデータを取得する。具体的には、キーワードとして抽出されたデータをメタデータとする。キーワード抽出処理は、既存のキーワード抽出技術を用いることができる。
一方、ステップS5040では、HTML内のメタデータを示すメタタグに基づきメタデータを抽出する。当該処理はステップS5020において説明した処理と同じである。次のステップS5050では、画像データに付与されるメタデータを取得する。この処理は、画像フォーマットに付与されているExif等のメタデータ(日時、場所等)を取得することで実現される。
そして、ステップS5060では、画像データに対する画像認識・解析処理によりキーワードを抽出し、当該キーワードをメタデータとして取得する。画像認識・解析処理は既存の画像認識・解析処理を用いることができる。例えば、既存のオブジェクト認識技術により認識されたオブジェクトをキーワードとして抽出することができる。また、既存のシーン解析技術により解析されたシーンをキーワードとすることも可能である。
一方、ステップS5070では、HTML内のメタデータを示すメタタグに基づきメタデータを抽出する。当該処理はステップS5020及びS5040の処理と同様のものである。次のステップS5080は、HTML内のテキストデータに対するキーワード抽出処理であり、ステップS5030において説明した処理と同様のものである。次のステップS5090は、画像データに付与されるメタデータを取得する処理であり、ステップS5050における処理と同じである。次のステップS5100は、画像データに対する画像認識・解析処理によるキーワード抽出結果をメタデータとするものであり、ステップS5060で説明した処理と同じものである。
そして、ステップS5110では、抽出されたメタデータを1つのセットとして構成し、当該メタデータセットをユーザ情報DB306に格納する。
図6は、本実施形態において、ステップS4030においてクリップ推奨部305により行われるクリップ推奨処理の手順の一例を示すフローチャートである。
まず、ステップS6000は、関連検索結果取得処理である。関連検索結果取得処理では、ユーザによる検索クエリと類義語辞書とを用いて得られた当該クエリの関連語を用いて検索処理を行った結果に対し、メタデータ解析を行う対象を決定する。メタデータ解析対象の決定には、予め規定しておいた解析対象スコア値に基づいて行う。具体的には、解析対象とする検索結果のスコアを定めておき、当該スコア以上の検索結果に対してメタデータ解析の対象とすることとする。
まず、ステップS6000は、関連検索結果取得処理である。関連検索結果取得処理では、ユーザによる検索クエリと類義語辞書とを用いて得られた当該クエリの関連語を用いて検索処理を行った結果に対し、メタデータ解析を行う対象を決定する。メタデータ解析対象の決定には、予め規定しておいた解析対象スコア値に基づいて行う。具体的には、解析対象とする検索結果のスコアを定めておき、当該スコア以上の検索結果に対してメタデータ解析の対象とすることとする。
例えば、検索結果に対するスコア算出が可能な検索処理システムにおいてスコアが100〜0であり、解析対象スコア値が80の場合を考える。この場合、検索結果のうち80以上のスコアとなったもののみをメタデータの解析処理対象として決定する。ここで、メタデータの解析対象はスコア値を閾値とした場合を説明したが、他の方法でもよい。例えば、検索結果数を予め決めておき、当該結果数に達した際に関連検索処理を終了し、関連検索処理結果すべてをメタデータ解析対象とすることもできる。
次のステップS6010では、ユーザ情報DB306からメタデータを取得する。具体的には、ユーザ情報DB306に登録されている全メタデータセットを取得する。次のステップS6020では、ステップS6000もしくは後述するステップS6060で決定したメタデータ解析対象のWebページに対してメタデータ解析を行う。メタデータ解析処理は、図5を用いて説明を行った処理のうち、ステップS5000〜ステップS5100と同様のものであり、解析結果は一時記憶として保持される。
次のステップS6030は、メタデータマッチング処理である。メタデータのマッチング処理では、ステップS6010で解析されたメタデータセットとステップS6020で取得したメタデータセットとが合致するか否かを判定する。メタデータセットの合致処理は、メタデータセットに含まれるメタデータをキーワードとして、キーワードが完全一致したか否かを判断することによって合致判定を行う。メタデータセットの全キーワードが完全一致した場合、すなわち比較結果が合致した場合は、メタデータセットが合致したと判定する。ここで、キーワードの合致判定処理を完全一致と説明したが、他の方法でも問題ない。例えば、類義語辞書等を用いて関連すると判定されたキーワードも合致したとみなしてもよい。また、メタデータセット内の全キーワードが一致した場合、メタデータセットが合致したと判定していたが、異なる処理を用いることもできる。例えば、メタデータセット内の所定の割合のキーワードが合致した場合、メタデータセットが合致したと判定してもよい。
次のステップS6040では、領域タグを特定する。領域タグは予め規定されており、HTMLにおいてデータのかたまりを示すものである。例えば、段落を示すpタグやブロックを示すdivタグを領域タグとして用いることができる。
以下、領域タグの具体的内容を説明する。領域タグ特定処理では、まずステップS6030において合致したと判断されたメタデータセット内の各キーワードが含まれるHTMLタグを特定する。そして、当該タグが領域タグであるか否かを判定する。判定の結果、領域タグであった場合は、クリップ対象タグとして一時記憶に保持しておく。一方、領域タグではないと判定された場合は、キーワードが含まれていたHTMLタグを基点とし、HTML等の構造化言語の上位階層に領域タグがないか探索する。探索の結果、領域タグが存在する場合には、当該領域タグをクリップ対象タグとして一時記憶に保持する。一方、領域タグが見つからない場合は、HTMLのルート、すなわちWebページ全体をクリップ対象として一時記憶に保持する。
次のステップS6050では、一時記憶に保持されているクリップ対象タグ以下にリンクデータが存在するか否かを判定する。この判定の結果、リンクデータが存在する場合は、ステップS6060へ移行する。一方、リンクデータが存在しない場合、ステップS6070へ移行する。
ステップS6060では、一時記憶に保持されているクリップ対象タグ以下に存在するリンク先のHTMLを取得する。取得したHTMLをメタデータ解析対象として決定し、ステップS6020へ移行する。当該処理を行うことにより、リンク先のWebページからも推奨すべきクリップ領域がある場合も処理することが可能になる。Webページでは、リンクによる情報探索を前提として、複数のページにより単一の情報が表現されている場合もあるが、本実施形態による手法によればこのような場合にも対応することができる。
一方、ステップS6070では、一時記憶に保持されていたクリップ対象タグを画像データとして生成する。クリップ画像生成処理では、Webページを画像として生成した後、各クリップ対象タグの示す領域を含む外接矩形を切り出すことにより実現する。リンクにより複数ページに分割されていた場合は、各Webページから生成された画像に対しクリップ対象タグの示す領域を切り出した後、切り出した画像同士を結合して1つの画像を形成する。結合処理は、リンク元のページから切り出された画像の下側にリンク先から切り出された画像を配置することにより行う。画像間の大きさが異なる場合は、画像の左端を合わせて配置した後、外接矩形領域となる画像を構成しなおす。
以下、ステップS6070の具体例として、図7のHTMLを用いて説明する。ユーザ情報DB306に格納されているメタデータセットが図8に示すものの場合、合致するメタデータを含むタグは、図7のタグ701、702である。タグ701は領域タグではないので、上位階層を探索し、領域タグ703が見つかる。一方、タグ702は領域タグであるため探索処理は行わない。このようにここで見つかった領域タグ703がクリップ対象のタグとなる。すなわち、領域タグ703、及びタグ702がクリップ対象のタグとなる。
図9(a)は、図7のHTMLを描画した結果を示す図であり、画像として生成した結果を示している。クリップ対象タグである領域タグ703、及びタグ702と対応する領域が、それぞれ領域901、902である。図9(b)は、図9(a)から推奨クリップとして切り出された画像例を示す図であり、領域901、902を含む外接矩形として切り出されている。
本実施形態では、複数のクリップ対象領域が1つのWebページ内に存在した場合、クリップ対象領域を含む外接矩形としたが、異なる方法でもよい。例えば、クリップ対象領域となるタグ以下のHTMLを抽出し、HTMLルートと当該HTMLからのみで構成される新たなHTMLを構成してもよい。図9(c)は、図7及び図8に示すデータを用いた場合の推奨クリップの例を示す図である。クリップ対象領域の外接矩形ではないため、クリップ対象領域とは関連のないデータは一切画像に含まれていない。
(第2の実施形態)
第1の実施形態では、HTMLによりWebページが構成されている場合について説明したが、クリップ対象となるデータはHTMLでなくてもよく、データと表示が対応づけられている構造をもつ構造化言語により表現される形式に適用することができる。例えば、HTMLの代わりに独自に定義したXMLデータを用いてもよい。ワープロソフト等で作成可能な文書のデータ形式をXMLにより表記し、当該文書が蓄積されたシステムにおいても本発明は適用可能である。
第1の実施形態では、HTMLによりWebページが構成されている場合について説明したが、クリップ対象となるデータはHTMLでなくてもよく、データと表示が対応づけられている構造をもつ構造化言語により表現される形式に適用することができる。例えば、HTMLの代わりに独自に定義したXMLデータを用いてもよい。ワープロソフト等で作成可能な文書のデータ形式をXMLにより表記し、当該文書が蓄積されたシステムにおいても本発明は適用可能である。
具体的には、ワープロソフトで作成された文書を不図示のデータベースに蓄積しておき、当該文書群の検索・クリップ・クリップ推奨機能を提供することができる。そして、図3に示した各機能ブロックの処理対象が当該文書群となることにより実現することができる。
本実施形態では、HTMLではなく独自のXMLで表現されたコンテンツ群に対する適用例を説明したが、コンテンツ群は単独のフォーマットで表現されている必要はない。例えば、HTMLで表現されたコンテンツと独自のXMLで表現されたコンテンツが混在している場合も対応することができる。当該処理は、HTML、及び独自のXMLに対するメタタグ及び領域タグを定義しておくことにより実現可能である。双方の形式に対するメタタグが定義されていることにより全てのコンテンツからメタデータの抽出を行うことが可能になる(図5におけるステップS5020、S5040、S5070に相当)。また、領域タグが定義されていることにより推奨すべきクリップ領域を特定することが可能になる(図6におけるステップS6040に相当)。
(第3の実施形態)
第2の実施形態では、予め構造化言語によりコンテンツが作成されている例を説明したが、画像等の構造化言語により表現されていないコンテンツに対しても適用可能である。具体的には、画像等の構造化言語により表現されていないコンテンツから構造化言語を作成することにより本発明が適用可能である。例えば、スキャンされた文書画像に対して文書画像解析処理を行い、解析結果を用いて論理情報を抽出し、当該情報を構造化言語として表現することができる。文書画像に対する解析処理および論理情報処理は、既存技術を用いる。
第2の実施形態では、予め構造化言語によりコンテンツが作成されている例を説明したが、画像等の構造化言語により表現されていないコンテンツに対しても適用可能である。具体的には、画像等の構造化言語により表現されていないコンテンツから構造化言語を作成することにより本発明が適用可能である。例えば、スキャンされた文書画像に対して文書画像解析処理を行い、解析結果を用いて論理情報を抽出し、当該情報を構造化言語として表現することができる。文書画像に対する解析処理および論理情報処理は、既存技術を用いる。
以上、第1〜第3の実施形態に示したように、ユーザの操作履歴に基づいてクリップを推奨することにより、ユーザによる情報探索、クリップ作業の負荷を軽減することが可能になる。
(その他の実施形態)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
303 クリップ処理部
304 メタデータ解析部
305 クリップ推奨部
304 メタデータ解析部
305 クリップ推奨部
Claims (5)
- コンテンツの一部を画像として切り取るクリップ処理手段と、
前記クリップ処理手段により切り取られた画像のメタデータを解析するクリップメタデータ解析手段と、
前記コンテンツのメタデータを解析するコンテンツメタデータ解析手段と、
前記クリップメタデータ解析手段により解析されたメタデータと前記コンテンツメタデータ解析手段により解析されたメタデータとを比較するメタデータ比較手段と、
前記メタデータ比較手段による比較結果に基づいて前記コンテンツから領域を特定する領域特定手段とを備えることを特徴とするコンテンツ推奨装置。 - 前記コンテンツは、表示形態と表示対象とが構造化言語により表現されており、
前記領域特定手段は、前記構造化言語から表示領域を示すタグを特定することを特徴とする請求項1に記載のコンテンツ推奨装置。 - 前記領域特定手段は、特定されたタグが複数ある場合に、各タグを含む外接矩形を特定することを特徴とする請求項2に記載のコンテンツ推奨装置。
- コンテンツの一部を画像として切り取るクリップ処理工程と、
前記クリップ処理工程において切り取られた画像のメタデータを解析するクリップメタデータ解析工程と、
前記コンテンツのメタデータを解析するコンテンツメタデータ解析工程と、
前記クリップメタデータ解析工程において解析されたメタデータと前記コンテンツメタデータ解析工程において解析されたメタデータとを比較するメタデータ比較工程と、
前記メタデータ比較工程における比較結果に基づいてコンテンツから領域を特定する領域特定工程とを備えることを特徴とするコンテンツ推奨方法。 - 請求項4に記載のコンテンツ推奨方法の各工程をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011008668A JP2012150638A (ja) | 2011-01-19 | 2011-01-19 | コンテンツ推奨装置、コンテンツ推奨方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011008668A JP2012150638A (ja) | 2011-01-19 | 2011-01-19 | コンテンツ推奨装置、コンテンツ推奨方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012150638A true JP2012150638A (ja) | 2012-08-09 |
Family
ID=46792826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011008668A Pending JP2012150638A (ja) | 2011-01-19 | 2011-01-19 | コンテンツ推奨装置、コンテンツ推奨方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012150638A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018112806A (ja) * | 2017-01-10 | 2018-07-19 | 大日本印刷株式会社 | 画像関連付け装置、画像データベース、画像検索装置、画像検索システム及びプログラム |
JP2019204355A (ja) * | 2018-05-24 | 2019-11-28 | 大日本印刷株式会社 | リネーム処理装置、印画物販売システム、及びプログラム |
CN113473222A (zh) * | 2021-05-25 | 2021-10-01 | 北京达佳互联信息技术有限公司 | 剪辑推荐方法、装置、电子设备、存储介质及程序产品 |
JP2022545871A (ja) * | 2019-10-09 | 2022-11-01 | 広州視源電子科技股▲分▼有限公司 | 知能インタラクティブパネルの制御方法及びその装置 |
-
2011
- 2011-01-19 JP JP2011008668A patent/JP2012150638A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018112806A (ja) * | 2017-01-10 | 2018-07-19 | 大日本印刷株式会社 | 画像関連付け装置、画像データベース、画像検索装置、画像検索システム及びプログラム |
JP2019204355A (ja) * | 2018-05-24 | 2019-11-28 | 大日本印刷株式会社 | リネーム処理装置、印画物販売システム、及びプログラム |
JP7180117B2 (ja) | 2018-05-24 | 2022-11-30 | 大日本印刷株式会社 | 印画物販売システム |
JP2022545871A (ja) * | 2019-10-09 | 2022-11-01 | 広州視源電子科技股▲分▼有限公司 | 知能インタラクティブパネルの制御方法及びその装置 |
JP7345052B2 (ja) | 2019-10-09 | 2023-09-14 | 広州視源電子科技股▲分▼有限公司 | 知能インタラクティブパネルの制御方法及びその装置 |
CN113473222A (zh) * | 2021-05-25 | 2021-10-01 | 北京达佳互联信息技术有限公司 | 剪辑推荐方法、装置、电子设备、存储介质及程序产品 |
CN113473222B (zh) * | 2021-05-25 | 2023-10-10 | 北京达佳互联信息技术有限公司 | 剪辑推荐方法、装置、电子设备、存储介质及程序产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9436419B2 (en) | Selectively printing portions of a web page based on user selection | |
JP4381012B2 (ja) | 万物識別子を用いたデータ検索システムおよびデータ検索方法 | |
US20050193330A1 (en) | Methods and systems for eBook storage and presentation | |
US20090150353A1 (en) | Method and arrangement for handling of information search results | |
WO1998008168A1 (fr) | Dispositif pour generer un texte original et son support de memoire programme | |
JP2005050078A (ja) | 構造化文書処理装置、構造化文書処理方法、およびプログラム | |
JP2012150638A (ja) | コンテンツ推奨装置、コンテンツ推奨方法及びプログラム | |
JP2008040753A (ja) | 画像処理装置、方法、プログラムおよび記録媒体 | |
JP4546277B2 (ja) | 図面管理方法及び図面管理プログラム | |
JP2005182460A (ja) | 情報処理装置、注釈処理方法、情報処理プログラムおよび情報処理プログラムを格納した記録媒体 | |
EP1217536A2 (en) | Converting method for converting documents between different locales | |
JP2007279978A (ja) | 文書検索装置及び文書検索方法 | |
JP2007257369A (ja) | 情報検索装置 | |
JP2006228131A (ja) | 文書データ処理装置及び文書データ処理方法 | |
JP2004157668A (ja) | 検索システム、検索方法および検索プログラム | |
JP5040201B2 (ja) | 文書ファイル処理プログラム、方法、及び装置 | |
JP2004157965A (ja) | 検索支援装置、検索支援方法、プログラムおよび記録媒体 | |
US20030191770A1 (en) | System and method for formatting, proofreading and annotating information to be printed in directories | |
JP2005011301A (ja) | 文書処理装置及び文書処理プログラム | |
JP5707937B2 (ja) | 電子文書変換装置及び電子文書変換方法 | |
JP2008071311A (ja) | 画像検索装置、画像検索方法、画像検索プログラム、及び、情報記憶媒体 | |
JP2005115457A (ja) | 文書ファイル検索方法 | |
JP3710463B2 (ja) | 翻訳支援辞書装置 | |
JP2004151957A (ja) | 文献調査支援プログラム | |
JP5303967B2 (ja) | 組版装置、組版方法、及び組版処理プログラム |