JP2006318219A - 類似スライド検索プログラム及び検索方法 - Google Patents
類似スライド検索プログラム及び検索方法 Download PDFInfo
- Publication number
- JP2006318219A JP2006318219A JP2005140135A JP2005140135A JP2006318219A JP 2006318219 A JP2006318219 A JP 2006318219A JP 2005140135 A JP2005140135 A JP 2005140135A JP 2005140135 A JP2005140135 A JP 2005140135A JP 2006318219 A JP2006318219 A JP 2006318219A
- Authority
- JP
- Japan
- Prior art keywords
- area
- distance
- text
- layout
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
【課題】 テキストの内容や種類と、図表の内容に左右されないレイアウトだけでの類似検索を目的とする。
【解決手段】 背景領域とテキスト領域と図表領域から構成されるスライドから該背景領域と該テキスト領域と該図表領域を抽出する領域抽出部と、抽出された背景領域とテキスト領域と図表領域を異なる色で塗り潰した画像を生成する画像生成部と、生成された画像のうち前記背景領域が占める割合と前記テキスト領域が占める割合と前記図表領域が占める割合とから成るレイアウト特徴を計算する特徴計算部と、前記レイアウト特徴の類似度である距離を計算する距離計算部を有することで解決できる。
【選択図】 図1
【解決手段】 背景領域とテキスト領域と図表領域から構成されるスライドから該背景領域と該テキスト領域と該図表領域を抽出する領域抽出部と、抽出された背景領域とテキスト領域と図表領域を異なる色で塗り潰した画像を生成する画像生成部と、生成された画像のうち前記背景領域が占める割合と前記テキスト領域が占める割合と前記図表領域が占める割合とから成るレイアウト特徴を計算する特徴計算部と、前記レイアウト特徴の類似度である距離を計算する距離計算部を有することで解決できる。
【選択図】 図1
Description
類似するスライドを検索する分野に関する。
一般に類似検索を行うには、類似の基準となる特徴(属性)を規定し、二つの対象の類似度はその特徴の距離として計算される。特に、プレゼンテーションスライドを類似検索するための特徴としては、(1)そのスライドに記述されているテキストの内容を表すテキスト特徴、(2)スライド内に含まれる図の画像特徴、(3)スライド全体のレイアウト特徴が挙げられる。テキスト特徴としては、単語の頻度ベクトルなどがある。画像特徴としては、色ヒストグラム、Waveletなどがある。レイアウト特徴としては、色分布、エッジ分布などがある。
類似検索の手順としては、クエリ(質問)として同じメディア(画像を検索するには画像を入力とし、音楽を検索するには音楽を入力とするが、音楽を入力して画像を類似検索できない。メディアとはこれら検索の対象を言う)を入力する必要がある。しかし、スライドを検索するために検索したいスライドと類似したスライドが準備できることは希である。このような場合、まずはキーワード検索やカテゴリ検索によってメディアをいくつかユーザに提示し、ユーザがそれらの中から目的のものに似たものを選択すると、それに似たものが再度リストアップされ、これを繰り返すことにより検索を行う手法がある。また、キーワード検索やカテゴリ検索の結果を、指定した特徴によってカテゴライズし、ユーザが探しているものがどこにあるかを直感的に判断させる手法がある。
また、テキストの類似性による検索といった個々の特徴での検索の他に、複数の特徴を使って総合的に類似度を算出する必要もある。このような場合には特徴ごとに重要度が異なるため、あらかじめ重みを設定し、重み付け加算した距離を利用して類似度を算出している。
レイアウトを表現する特徴として、色分布を利用した場合には、図の色や文字の色によって同じレイアウトでも違う特徴となり類似度が高くならないという問題がある。エッジ分布を利用した場合でも、文字種(ひらがなと漢字)や図の内容によって、必ずしも厳密にレイアウトを表現した特徴とはならない。スライド同士をレイアウトのみで比較する場合には、より的確にレイアウトを表現した特徴が必要となる。
また、引用したい文書を探す場合などには、過去に自分で作成したスライドであったり、以前にアクセスして記憶しているスライドであったりする場合が多い。そのような場合には探す手掛かりとしてキーワードだけではなくおおざっぱなレイアウト(左がテキストで右に図があった、というような)を覚えていることが多い。しかし従来の検索手法では、それらの情報を検索に利用することができないという問題がある。
一方、参考にしたいスライドや引用したいスライドを検索する場合は、一般的な情報検索と違いクエリとの共通性が重要になる。内容の共通性よりも、同じ図を使って説明しているスライドや、レイアウトは同じで図やテキストの内容を修正したもの(修正前のバージョン)などを検索して参考にする場合が多い。そのため図とテキスト、レイアウトがほどほどに似ているスライドよりは、テキストとレイアウトは大きく異なっていても図がかなり似ているものなどがヒットした方が参考にしやすい。
ところが従来手法では、ある特徴がクエリとほぼ同じでも別の特徴が大きく異なった場合に、それぞれが打ち消しあってしまうために検索にヒットしないという問題があった。例えば、日本語で書いた資料をクエリとした場合、その資料を英訳したものは、図やレイアウトが同じでもヒットしない。
特開平10−254894公報
特開2003−281190公報
特開平8−69477公報
以上の点に鑑み本願発明は、テキストの内容や種類と、図表の内容に左右されないレイアウトだけでの類似検索を目的とする。
また、キーワードでなくレイアウトを指定した類似検索を目的とする。
さらに、日本語で書いた資料をクエリとして英訳した資料を検索するといった、参考資料や引用資料の検索を目的とする。
本願第1の発明は、背景領域とテキスト領域と図表領域から構成されるスライドから該背景領域と該テキスト領域と該図表領域を抽出する領域抽出部と、前記背景領域とテキスト領域と図表領域を異なる色で塗り潰した画像を生成する画像生成部と、前記画像のうち前記背景領域が占める割合と前記テキスト領域が占める割合と前記図表領域が占める割合とから成るレイアウト特徴を計算する特徴計算部と、前記レイアウト特徴の類似度である距離を計算する距離計算部を有することを特徴とする。
本願第2の発明は、背景領域上にテキスト領域かつ/または図表領域を指定して、検索のクエリとなるレイアウトを作成するクエリレイアウト作成部を更に有することを特徴とする。
本願第3の発明は、前記距離計算部が、前記レイアウト特徴の距離とテキスト特徴の距離と画像特徴の距離を比較して該距離の小さな順に重みをつけて距離を計算することを特徴とする。
本願第4の発明は、前記距離計算部が、レイアウト特徴の距離とテキスト特徴の距離と画像特徴の距離を計算し、該距離に対して所定の範囲毎に重みをつけて距離を計算することを特徴とする。
背景領域、テキスト領域、図表領域に色分けした画像を生成しその画像から特徴を計算することにより、テキストの内容・種類や図表の内容に左右されないレイアウトだけでの類似検索が可能となる。
また、上記レイアウト特徴を利用すると、背景領域、テキスト領域、図表領域を指定するインタフェースにより、キーワードだけでなくレイアウトを指定しての検索を実現できる。
さらに、複数の特徴の重み付けを、複数特徴のうちどれか一つがとてもよく似ている場合にはその特徴の重みを大きくするように動的に計算することにより、ある特徴がたいへん良く似ているものを検索できる。例えば日本語で書いた資料をクエリとして英訳した資料を検索するといった、参考資料・引用資料の検索に適した検索結果を得ることが可能となる。
図1は、本願発明の実施例の構成図である。
領域抽出部1は、スライドを解析してテキスト領域と図表領域と背景領域を抽出する処理部である。背景領域とは、スライドの中でテキスト領域と図表領域以外の領域を言う。
抽出に関する従来技術として、例えば「武部他、仮説検証に基づく再帰的テキストブロック抽出手法、電子情報通信学会総合大会 D-12-42,March,2004」、また、「島井他、ロバスト統計に基づいた適応的な背景推定法、電子情報通信学会論文誌 Vol.J86-D-II,No.6,pp.796-806」などを使う。また、入力がプレゼンテーション作成ソフトウェアのデータファイルである場合には(例えば、Microsoft(登録商標)社のPowerPoint(登録商標))、そのデータファイル形式を解析して、抽出する方法もある。本実施例では後者について以下説明する。
抽出に関する従来技術として、例えば「武部他、仮説検証に基づく再帰的テキストブロック抽出手法、電子情報通信学会総合大会 D-12-42,March,2004」、また、「島井他、ロバスト統計に基づいた適応的な背景推定法、電子情報通信学会論文誌 Vol.J86-D-II,No.6,pp.796-806」などを使う。また、入力がプレゼンテーション作成ソフトウェアのデータファイルである場合には(例えば、Microsoft(登録商標)社のPowerPoint(登録商標))、そのデータファイル形式を解析して、抽出する方法もある。本実施例では後者について以下説明する。
画像生成部2は、抽出された背景領域を背景指定色で、テキスト領域をテキスト指定色で、図表領域を図表指定色で塗りつぶしたスライドから画像を生成する処理部である。背景指定色とテキスト指定色と図表指定色は、それぞれ予め決めておいた異なった色である。
特徴計算部3は、生成された画像のレイアウト特徴と、後述するテキスト特徴や画像特徴を計算する処理部である。
距離計算部4は、クエリスライドと検索対象スライドのレイアウト特徴の類似度である距離と、テキスト特徴の類似度である距離、画像特徴の類似度である距離を計算する処理部である。クエリスライドとは、ユーザが検索のクエリ(質問)となるレイアウトを持ったスライドである。
結果出力部5は、計算された距離を元に、距離の小さい順にスライドを出力する処理部である。
クエリレイアウト作成部6は、グラフィカルユーザインタフェースを通じて、テキスト領域および/または図表領域を指定して、ユーザが検索のクエリとなるレイアウトを持ったクエリスライドを作成する処理部である。
特徴格納部7は、計算したレイアウト特徴、テキスト特徴、画像特徴を格納するデータベースである。
実施例1として、レイアウト特徴の計算方法と距離計算について述べる(図2)。ここで、レイアウト特徴とは、スライドに占める背景領域とテキスト領域と図表領域の各割合から成るスライドのレイアウトの特徴を表すものである。
まず、領域抽出部1は、プレゼンテーション作成ソフトウェアが用意している関数を利用して、スライドに対して背景を背景指定色で塗りつぶす(S1)。背景指定色は予め決めておいた色である。スライドの背景には、スライドデザインテンプレートとして模様や画像が描かれている場合が多いため、これらの影響を排除するために背景色で塗りつぶす。あるいは、スライドの最背面にスライドと同じ大きさの矩形を作成し、背景指定色で塗りつぶしてもよい。
そして、領域抽出部1は、スライドに貼り付けられているテキスト枠や図形などのオブジェクトに対して、テキストであるか図であるかを判断する処理を行う(S2)。以下このS2の詳細について説明する(図3)。
まず、領域抽出部1は、プレゼンテーション作成ソフトウェアが用意している関数を利用して、スライドに貼り付けられているテキスト枠や図形を持つオブジェクトをスライドから取得する(S21)。
そして、領域抽出部1は、オブジェクトが取得できたかどうかを判断する(S22)。処理すべきオブジェクトがない場合、即ちすべてのオブジェクトに対する処理が終わった場合には、この処理を終了する。
そして、領域抽出部1は、取得したオブジェクトがグループ化されたものかどうかを判断する(S23)。グループ化されたオブジェクトである場合には、そのグループ内の各オブジェクトに対してテキストであるか図であるかを判断する処理(S2)を再帰的に呼び出す(S24)。
そして、グループ化されたオブジェクトでない場合には、領域抽出部1は、オブジェクトがテキストを持つかどうかを判別する(S25)。オブジェクトがテキストを持たない場合には、画像生成部2は、そのオブジェクトを図表指定色で塗りつぶす(S26)。オブジェクトがテキストを持つ場合には、画像生成部2は、オブジェクトのサイズをテキストに合わせるよう調整し(S27)、そのオブジェクトの背景とテキストをテキスト指定色で塗りつぶす(S28)。
そして、次のオブジェクトの処理に移行する(S21)。
これらの処理により、スライド(図4のXとY)を、背景領域とテキスト領域と図表領域毎に色分けすることができる(図4のVとW)。このように色分けすることによって、一般的な画像処理を利用してスライドの文字の色や図の内容に影響されないレイアウト特徴を計算することが可能となる。
スライドを背景領域とテキスト領域と図表領域に色分けしたため、色特徴を利用することが可能である。ここでは、レイアウトを表すのに適した、色レイアウト特徴を計算する(S3)。色レイアウト特徴の計算処理のフローチャートを図5に示す。
まず、特徴計算部3は、画像を部分領域に分割する(S31)。分割の仕方は任意だが、縦横等分割する他、中央を細かく分割するなどの方法もある。分割領域ごとの背景とテキストと図表の割合を計算することによって、例えば2×2に分割した場合、左上はほとんどがテキストで右下はほとんどが図というような特徴を表すことができる。
そして、特徴計算部3は、分割した領域ごとに色レイアウト特徴を計算するために、分割した領域が色レイアウト特徴を既に計算済みか判断する(S32)。
そして、まだ計算していない分割した領域があれば、特徴計算部3は、その領域に含まれる背景指定色の画素数とテキスト指定色の画素数と図表指定色の画素数をカウントする(S33)。
そして、特徴計算部3は、大きさの正規化のため、各画素数を割合に変換し(S34)、S32から繰り返す。
一方、すべての領域について画素割合を計算したら、特徴計算部3は、それらを統合してレイアウト特徴とする(S35)。レイアウト特徴の例を図6に示す。
そして、特徴計算部3は、このようにして計算したレイアウト特徴と、元のスライドと、分割した領域ごとに色分けした画像を、データベースである特徴格納部7に格納する(S36)。このとき、スライドや画像やレイアウト特徴のファイルパス、あるいはURLをデータベースに格納し、データそのものは外部のファイルシステムに保存することも可能である。
次に、ユーザが類似検索したいクエリスライドを指定すると、距離計算部4は、指定されたクエリスライドが持つレイアウト特徴について、特徴格納部7に格納されている各スライドのレイアウト特徴との距離について計算する(S4)。クエリスライドのレイアウト特徴とデータベースに格納されている各スライドのレイアウト特徴との距離の計算は、レイアウト特徴をベクトルとみなしてユークリッド距離を計算するのが一般的であるが、その他の尺度を利用することも可能である。具体的な計算については、実施例3から5で説明する。
そして、結果出力部5が、計算したレイアウト特徴の距離の短い順にソートし、短いものから順に出力する(S5)。
実施例2では、スライドを検索する際にレイアウトをクエリとして入力する方法について述べる。
図7はクエリスライドとしてレイアウトを入力する画面例である。ユーザはこの画面上で検索したいスライドのレイアウトを指定する。
レイアウト入力領域61は、あらかじめ背景指定色で塗りつぶされている。まず、ユーザは、領域選択部62においてテキスト、図表、または背景を選択する。ユーザが、レイアウト入力領域61内でマウス(マウスポインタ63)をドラッグして矩形領域を指定すると、クエリレイアウト作成部6は、選択された領域指定色(即ちテキスト指定色、図表指定色、背景指定色)でその矩形領域を塗りつぶす。
クエリレイアウト作成部6は、レイアウト入力領域61の画像から、実施例1で説明したようにレイアウト特徴を計算し、クエリとする。
実施例3では、複数の特徴を統合した類似検索手法について説明する。ここでは特徴として、レイアウトの類似度を表すレイアウト特徴と、テキストの内容の類似度を表すテキスト特徴と、図の色の類似度を表す画像特徴の三つの特徴を利用する。また、説明を簡易にするため、各特徴は三次元のベクトルで表すものとする。
図8にクエリスライドAと二つの検索対象スライドBとCを示す。検索対象スライドBとCのレイアウトと図は同じであり、クエリスライドAと検索対象スライドBのテキストは似ているが、クエリスライドAと検索対象スライドCのテキストは似ていない。つまり人間の目には、クエリスライドAは検索対象スライドBの方に類似している。
レイアウト特徴は、背景領域の割合とテキスト領域の割合と図表領域の割合で表す。テキスト特徴は、ひらがな及びカタカナの割合と、漢字の割合と、アルファベット及び数字の割合で表す。画像特徴は、図の色のR成分とG成分とB成分の割合で表す。
特徴計算部3が、図8の各スライドについて、各レイアウト特徴とテキスト特徴と画像特徴を計算すると、
クエリスライドA :{0.3, 0.5, 0.2} {0.5, 0.2, 0.3} {0.3, 0.1, 0.6}
検索対象スライドB:{0.5, 0.2, 0.3} {0.6, 0.2, 0.2} {0.2, 0.6, 0.2}
検索対象スライドC:{0.5, 0.2, 0.3} {0.3, 0.3, 0.4} {0.2, 0.6, 0.2}
であるとする。仮に左から順番にレイアウト特徴(更に背景領域、テキスト領域、図表領域の割合)、テキスト特徴(更にひらがな及びカタカナ、漢字、アルファベット及び数字の割合)、画像特徴(更にR成分、G成分、B成分の割合)であるとする。なお、各特徴の座標は正規化され、テキスト特徴と画像特徴の抽出は既存技術を利用する。
クエリスライドA :{0.3, 0.5, 0.2} {0.5, 0.2, 0.3} {0.3, 0.1, 0.6}
検索対象スライドB:{0.5, 0.2, 0.3} {0.6, 0.2, 0.2} {0.2, 0.6, 0.2}
検索対象スライドC:{0.5, 0.2, 0.3} {0.3, 0.3, 0.4} {0.2, 0.6, 0.2}
であるとする。仮に左から順番にレイアウト特徴(更に背景領域、テキスト領域、図表領域の割合)、テキスト特徴(更にひらがな及びカタカナ、漢字、アルファベット及び数字の割合)、画像特徴(更にR成分、G成分、B成分の割合)であるとする。なお、各特徴の座標は正規化され、テキスト特徴と画像特徴の抽出は既存技術を利用する。
そして、距離計算部4は、クエリスライドAに対する検索対象スライドBとCの距離(類似度)を計算する。距離は、二つのベクトル{x1, y1, z1} {x2, y2, z2}のユークリッド距離であり、
√{(x1-x2)^2+(y1-y2)^2+(z1-z2)^2}
で計算する。そうすると、例えばAの{0.3, 0.5, 0.2}とBの{0.5, 0.2, 0.3}のレイアウト特徴の距離は、
(0.3-0.5)^2 = 0.04
(0.5-0.2)^2 = 0.09
(0.2-0.3)^2 = 0.01
√(0.04+0.09+0.01) = √0.14 ≒ 0.37
となる。
√{(x1-x2)^2+(y1-y2)^2+(z1-z2)^2}
で計算する。そうすると、例えばAの{0.3, 0.5, 0.2}とBの{0.5, 0.2, 0.3}のレイアウト特徴の距離は、
(0.3-0.5)^2 = 0.04
(0.5-0.2)^2 = 0.09
(0.2-0.3)^2 = 0.01
√(0.04+0.09+0.01) = √0.14 ≒ 0.37
となる。
従来は特徴ごとに重み付けされており、各特徴の距離の重み付け和を総合的な距離とした。例えば、レイアウト特徴とテキスト特徴と画像特徴の重みを、1:2:2とすると、
クエリスライドAに対する検索対象スライドBとCの総合距離の差は、
(A)-(B) = 0.37*1 + 0.14*2 + 0.65*2 = 1.95
(A)-(C) = 0.37*1 + 0.24*2 + 0.65*2 = 2.15
となる。なお、上式の例えば(A)−(B)は、クエリスライドAと検索対象スライドBの総合距離の差を表す。
クエリスライドAに対する検索対象スライドBとCの総合距離の差は、
(A)-(B) = 0.37*1 + 0.14*2 + 0.65*2 = 1.95
(A)-(C) = 0.37*1 + 0.24*2 + 0.65*2 = 2.15
となる。なお、上式の例えば(A)−(B)は、クエリスライドAと検索対象スライドBの総合距離の差を表す。
しかし、本実施例では、距離計算部4は、重みを距離計算結果から動的に割り当てる。重みの割当て方はいろいろあるが、ここでは、距離の小さな順に重みを5:3:2に設定することとする。
そうすると、総合距離は以下のようになる。
(A)-(B) = 0.37*3 + 0.14*5 + 0.65*2 = 3.11
(A)-(C) = 0.37*3 + 0.24*5 + 0.65*2 = 3.61
従来の手法による結果と比べると、両者の距離の差が本手法によるとより広がっていることがわかり、両者の差がはっきりと距離に現れるという結果になる。
そうすると、総合距離は以下のようになる。
(A)-(B) = 0.37*3 + 0.14*5 + 0.65*2 = 3.11
(A)-(C) = 0.37*3 + 0.24*5 + 0.65*2 = 3.61
従来の手法による結果と比べると、両者の距離の差が本手法によるとより広がっていることがわかり、両者の差がはっきりと距離に現れるという結果になる。
実施例4では、図9に示したクエリスライドAで、二つの検索対象スライドDとCを検索する方法について説明する。検索対象スライドDは、クエリスライドAの図を置き換えたもので、テキストはほんの一部の修正に留まっている。検索対象スライドCは、クエリスライドAとは関係のない別のスライドであるが、関連する分野であるため同じ単語が多く使われ、レイアウトは検索対象スライドDと同じになっている。つまり人間の目には、クエリスライドAは検索対象スライドDの方に類似している。
特徴計算部3が、それぞれのレイアウト特徴、テキスト特徴、画像特徴を計算すると、
クエリスライドA :{0.3, 0.5, 0.2} {0.5, 0.2, 0.3} {0.3, 0.1, 0.6}
検索対象スライドD:{0.5, 0.2, 0.3} {0.6, 0.2, 0.2} {0.2, 0.6, 0.2}
検索対象スライドC:{0.5, 0.2, 0.3} {0.3, 0.3, 0.4} {0.2, 0.6, 0.2}
であるとする。距離計算部4が、従来の重み1:2:2で計算すると、
(A)-(D) = 0.37*1 + 0.14*2 + 0.75*2 = 2.15
(A)-(C) = 0.37*1 + 0.24*2 + 0.65*2 = 2.15
となり、総合距離は等しくなる。ところが、実際には検索対象スライドDはクエリスライドAの図を置き換えてレイアウトを多少修正しただけのものであるため、人間の感じる類似性ではCよりDが近い。これはテキスト特徴の類似性が画像特徴の違いによって打ち消されてしまうのが原因である。
クエリスライドA :{0.3, 0.5, 0.2} {0.5, 0.2, 0.3} {0.3, 0.1, 0.6}
検索対象スライドD:{0.5, 0.2, 0.3} {0.6, 0.2, 0.2} {0.2, 0.6, 0.2}
検索対象スライドC:{0.5, 0.2, 0.3} {0.3, 0.3, 0.4} {0.2, 0.6, 0.2}
であるとする。距離計算部4が、従来の重み1:2:2で計算すると、
(A)-(D) = 0.37*1 + 0.14*2 + 0.75*2 = 2.15
(A)-(C) = 0.37*1 + 0.24*2 + 0.65*2 = 2.15
となり、総合距離は等しくなる。ところが、実際には検索対象スライドDはクエリスライドAの図を置き換えてレイアウトを多少修正しただけのものであるため、人間の感じる類似性ではCよりDが近い。これはテキスト特徴の類似性が画像特徴の違いによって打ち消されてしまうのが原因である。
そこで、本実施例では動的な重み付け方法として、特徴ごとに計算した距離dが、
d≦0.2 の場合 d*1
0.2<d の場合 d*5
として計算する。この閾値はあらかじめ決定しておく。また、特徴ごとに違う値でも良い。
総合距離を計算すると、
(A)-(D) = 0.37*5 + 0.14*1 + 0.75*5 = 3.31
(A)-(C) = 0.37*5 + 0.24*5 + 0.65*5 = 3.61
となり、人間の感性と同じくDの方が似ているという判断ができる。
d≦0.2 の場合 d*1
0.2<d の場合 d*5
として計算する。この閾値はあらかじめ決定しておく。また、特徴ごとに違う値でも良い。
総合距離を計算すると、
(A)-(D) = 0.37*5 + 0.14*1 + 0.75*5 = 3.31
(A)-(C) = 0.37*5 + 0.24*5 + 0.65*5 = 3.61
となり、人間の感性と同じくDの方が似ているという判断ができる。
実施例5では、図10に示したクエリスライドAと、このクエリスライドAのテキストを全面的に変更した検索対象スライドEとの類似検索の例について説明する。これは文章が日本文と英文で書かれておりテキストに全く共通性のないものを(日本文と英文とは文字が異なるのでテキストは一致しない)検索するといった場合を想定している。翻訳時にテキスト領域の大きさが多少変更され、それに応じて図の大きさも微妙に修正されたと考える。このような場合、特徴計算部3が、各特徴を計算すると、
クエリスライドA :{0.3, 0.5, 0.2} {0.5, 0.2, 0.3} {0.3, 0.1, 0.6}
検索対象スライドE:{0.2, 0.6, 0.2} {0.0, 0.0, 1.0} {0.2, 0.1, 0.7}
であるとする。これらの距離を従来手法で計算すると、
(A)-(E) = 0.14*1 + 0.88*2 + 0.14*1 = 2.18
となり、実施例3および4の例よりも距離が長くなる。
クエリスライドA :{0.3, 0.5, 0.2} {0.5, 0.2, 0.3} {0.3, 0.1, 0.6}
検索対象スライドE:{0.2, 0.6, 0.2} {0.0, 0.0, 1.0} {0.2, 0.1, 0.7}
であるとする。これらの距離を従来手法で計算すると、
(A)-(E) = 0.14*1 + 0.88*2 + 0.14*1 = 2.18
となり、実施例3および4の例よりも距離が長くなる。
そこで、本実施例の動的な重み付け方法として、距離の対数をとることとする。底を10とし、正数にするために元の距離にあらかじめ1を加える。比較のため、実施例3〜4のスライドについても本方式で距離を計算する。
(A)-(B) = log10(0.37+1) + log10(0.14+1) + log10(0.65+1) = 0.41
(A)-(C) = log10(0.37+1) + log10(0.24+1) + log10(0.65+1) = 0.45
(A)-(D) = log10(0.37+1) + log10(0.14+1) + log10(0.75+1) = 0.44
(A)-(E) = log10(0.14+1) + log10(0.88+1) + log10(0.14+1) = 0.39
このように、Eのスライドの距離が最も短くなり、人間の感覚に合った類似度計算を可能としている。その結果、日本語文章のスライドに対して、文章の内容が同じである英文のスライドを探すことが出来る。
(A)-(B) = log10(0.37+1) + log10(0.14+1) + log10(0.65+1) = 0.41
(A)-(C) = log10(0.37+1) + log10(0.24+1) + log10(0.65+1) = 0.45
(A)-(D) = log10(0.37+1) + log10(0.14+1) + log10(0.75+1) = 0.44
(A)-(E) = log10(0.14+1) + log10(0.88+1) + log10(0.14+1) = 0.39
このように、Eのスライドの距離が最も短くなり、人間の感覚に合った類似度計算を可能としている。その結果、日本語文章のスライドに対して、文章の内容が同じである英文のスライドを探すことが出来る。
(付記1)コンピュータを、
背景領域とテキスト領域と図表領域から構成されるスライドから、該背景領域と該テキスト領域と該図表領域を抽出する領域抽出部、
前記背景領域とテキスト領域と図表領域を異なる色で塗り潰した画像を生成する画像生成部、
前記画像のうち、前記背景領域が占める割合と前記テキスト領域が占める割合と前記図表領域が占める割合とから成るレイアウト特徴を計算する特徴計算部、
前記レイアウト特徴の類似度である距離を計算する距離計算部、
として機能させるための類似スライド検索プログラム。(1)
(付記2)コンピュータを、
背景領域上にテキスト領域かつ/または図表領域を指定して、検索のクエリとなるレイアウトを作成するクエリレイアウト作成部として更に機能させる付記1記載の類似スライド検索プログラム。(2)
(付記3)前記領域抽出部を、前記スライドを複数の領域に分割した領域毎に、前記背景領域と前記テキスト領域と前記図表領域を抽出するように更に機能させる付記1記載の類似スライド検索プログラム。
(付記4)前記特徴計算部を、前記テキスト領域を解析して得られるテキスト特徴を計算するように更に機能させ、
前記距離計算部を、前記テキスト特徴から距離を計算するように更に機能させる付記1、2または3記載の類似スライド検索プログラム。
(付記5)前記テキスト特徴は、ひらがな及びカタカナの割合と、漢字の割合と、アルファベット及び数字の割合から成る付記4記載の類似スライド検索プログラム。
(付記6)前記特徴計算部を、前記図表領域を解析して得られる画像特徴を計算するように更に機能させ、
前記距離計算部を、前記画像特徴から距離を計算するように更に機能させる付記4または5記載の類似スライド検索プログラム。
(付記7)前記画像特徴は、色のR成分とG成分とB成分の割合から成る付記6記載の類似スライド検索プログラム。
(付記8)前記距離計算部を、前記レイアウト特徴の距離と前記テキスト特徴の距離と前記画像特徴の距離に重みをつけて距離を計算するように機能させる付記6または7記載の類似スライド検索プログラム。
(付記9)前記距離計算部を、前記レイアウト特徴の距離と、テキスト特徴の距離と、画像特徴の距離を比較して、該距離の小さな順に重みをつけて距離を計算するように機能させる付記8記載の類似スライド検索プログラム。(3)
(付記10)前記距離計算部を、前記レイアウト特徴の距離とテキスト特徴の距離と画像特徴の距離を計算し、該距離に対して所定の範囲毎に重みをつけて距離を計算するように機能させる付記8または9記載の類似スライド検索プログラム。(4)
(付記11)前記距離計算部を、レイアウト特徴の距離とテキスト特徴の距離と画像特徴の距離の対数をとって距離を計算するように機能させる付記8、9または10記載の類似スライド検索プログラム。
(付記12)背景領域とテキスト領域と図表領域から構成されるスライドから、該背景領域と該テキスト領域と該図表領域を抽出するステップと、
前記背景領域とテキスト領域と図表領域を異なる色で塗り潰した画像を生成するステップと、
前記画像のうち、前記背景領域が占める割合と前記テキスト領域が占める割合と前記図表領域が占める割合とから成るレイアウト特徴を計算するステップと、
前記レイアウト特徴の類似度である距離を計算するステップと、
を有する類似スライド検索方法。(5)
背景領域とテキスト領域と図表領域から構成されるスライドから、該背景領域と該テキスト領域と該図表領域を抽出する領域抽出部、
前記背景領域とテキスト領域と図表領域を異なる色で塗り潰した画像を生成する画像生成部、
前記画像のうち、前記背景領域が占める割合と前記テキスト領域が占める割合と前記図表領域が占める割合とから成るレイアウト特徴を計算する特徴計算部、
前記レイアウト特徴の類似度である距離を計算する距離計算部、
として機能させるための類似スライド検索プログラム。(1)
(付記2)コンピュータを、
背景領域上にテキスト領域かつ/または図表領域を指定して、検索のクエリとなるレイアウトを作成するクエリレイアウト作成部として更に機能させる付記1記載の類似スライド検索プログラム。(2)
(付記3)前記領域抽出部を、前記スライドを複数の領域に分割した領域毎に、前記背景領域と前記テキスト領域と前記図表領域を抽出するように更に機能させる付記1記載の類似スライド検索プログラム。
(付記4)前記特徴計算部を、前記テキスト領域を解析して得られるテキスト特徴を計算するように更に機能させ、
前記距離計算部を、前記テキスト特徴から距離を計算するように更に機能させる付記1、2または3記載の類似スライド検索プログラム。
(付記5)前記テキスト特徴は、ひらがな及びカタカナの割合と、漢字の割合と、アルファベット及び数字の割合から成る付記4記載の類似スライド検索プログラム。
(付記6)前記特徴計算部を、前記図表領域を解析して得られる画像特徴を計算するように更に機能させ、
前記距離計算部を、前記画像特徴から距離を計算するように更に機能させる付記4または5記載の類似スライド検索プログラム。
(付記7)前記画像特徴は、色のR成分とG成分とB成分の割合から成る付記6記載の類似スライド検索プログラム。
(付記8)前記距離計算部を、前記レイアウト特徴の距離と前記テキスト特徴の距離と前記画像特徴の距離に重みをつけて距離を計算するように機能させる付記6または7記載の類似スライド検索プログラム。
(付記9)前記距離計算部を、前記レイアウト特徴の距離と、テキスト特徴の距離と、画像特徴の距離を比較して、該距離の小さな順に重みをつけて距離を計算するように機能させる付記8記載の類似スライド検索プログラム。(3)
(付記10)前記距離計算部を、前記レイアウト特徴の距離とテキスト特徴の距離と画像特徴の距離を計算し、該距離に対して所定の範囲毎に重みをつけて距離を計算するように機能させる付記8または9記載の類似スライド検索プログラム。(4)
(付記11)前記距離計算部を、レイアウト特徴の距離とテキスト特徴の距離と画像特徴の距離の対数をとって距離を計算するように機能させる付記8、9または10記載の類似スライド検索プログラム。
(付記12)背景領域とテキスト領域と図表領域から構成されるスライドから、該背景領域と該テキスト領域と該図表領域を抽出するステップと、
前記背景領域とテキスト領域と図表領域を異なる色で塗り潰した画像を生成するステップと、
前記画像のうち、前記背景領域が占める割合と前記テキスト領域が占める割合と前記図表領域が占める割合とから成るレイアウト特徴を計算するステップと、
前記レイアウト特徴の類似度である距離を計算するステップと、
を有する類似スライド検索方法。(5)
1 領域抽出部
2 画像生成部
3 特徴計算部
4 距離計算部
5 結果出力部
6 クエリレイアウト作成部
7 特徴格納部
61 レイアウト入力領域
62 領域選択部
63 マウスポインタ
2 画像生成部
3 特徴計算部
4 距離計算部
5 結果出力部
6 クエリレイアウト作成部
7 特徴格納部
61 レイアウト入力領域
62 領域選択部
63 マウスポインタ
Claims (5)
- コンピュータを、
背景領域とテキスト領域と図表領域から構成されるスライドから、該背景領域と該テキスト領域と該図表領域を抽出する領域抽出部、
前記背景領域とテキスト領域と図表領域を異なる色で塗り潰した画像を生成する画像生成部、
前記画像のうち、前記背景領域が占める割合と前記テキスト領域が占める割合と前記図表領域が占める割合とから成るレイアウト特徴を計算する特徴計算部、
前記レイアウト特徴の類似度である距離を計算する距離計算部、
として機能させるための類似スライド検索プログラム。 - コンピュータを、
背景領域上にテキスト領域かつ/または図表領域を指定して、検索のクエリとなるレイアウトを作成するクエリレイアウト作成部として更に機能させる請求項1記載の類似スライド検索プログラム。 - 前記距離計算部を、前記レイアウト特徴の距離と、テキスト特徴の距離と、画像特徴の距離を比較して、該距離の小さな順に重みをつけて距離を計算するように機能させる請求項1または2記載の類似スライド検索プログラム。
- 前記距離計算部を、前記レイアウト特徴の距離とテキスト特徴の距離と画像特徴の距離を計算し、該距離に対して所定の範囲毎に重みをつけて距離を計算するように機能させる請求項1または2記載の類似スライド検索プログラム。
- 背景領域とテキスト領域と図表領域から構成されるスライドから、該背景領域と該テキスト領域と該図表領域を抽出するステップと、
前記背景領域とテキスト領域と図表領域を異なる色で塗り潰した画像を生成するステップと、
前記画像のうち、前記背景領域が占める割合と前記テキスト領域が占める割合と前記図表領域が占める割合とから成るレイアウト特徴を計算するステップと、
前記レイアウト特徴の類似度である距離を計算するステップと、
を有する類似スライド検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005140135A JP2006318219A (ja) | 2005-05-12 | 2005-05-12 | 類似スライド検索プログラム及び検索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005140135A JP2006318219A (ja) | 2005-05-12 | 2005-05-12 | 類似スライド検索プログラム及び検索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006318219A true JP2006318219A (ja) | 2006-11-24 |
Family
ID=37538843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005140135A Pending JP2006318219A (ja) | 2005-05-12 | 2005-05-12 | 類似スライド検索プログラム及び検索方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006318219A (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008146491A (ja) * | 2006-12-12 | 2008-06-26 | Yahoo Japan Corp | 情報提供装置、情報提供方法、及びコンピュータプログラム |
JP2008146492A (ja) * | 2006-12-12 | 2008-06-26 | Yahoo Japan Corp | 情報提供装置、情報提供方法、及びコンピュータプログラム |
WO2009048149A1 (ja) * | 2007-10-11 | 2009-04-16 | Nec Corporation | 電子文書の同等判定システムおよび同等判定方法 |
JP2010140209A (ja) * | 2008-12-11 | 2010-06-24 | Nec Corp | 検索システム、検索方法、およびプログラム |
JP4979842B1 (ja) * | 2011-06-30 | 2012-07-18 | パナソニック株式会社 | 類似症例検索装置および類似症例検索方法 |
JP2020052961A (ja) * | 2018-09-28 | 2020-04-02 | キヤノン株式会社 | コンテンツ提供システム、コンテンツ提供方法、情報処理装置、及びプログラム |
JP2021012452A (ja) * | 2019-07-04 | 2021-02-04 | エヌ・ティ・ティ・コムウェア株式会社 | 素材検索システム、素材検索方法、素材検索装置、およびプログラム |
JP2021012453A (ja) * | 2019-07-04 | 2021-02-04 | エヌ・ティ・ティ・コムウェア株式会社 | 検索クエリ生成装置、検索クエリ生成方法、プログラム、素材検索システム、および素材検索方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002183166A (ja) * | 2000-12-19 | 2002-06-28 | Nec Corp | ドキュメントファイリングシステムおよび方法 |
JP2004348706A (ja) * | 2003-04-30 | 2004-12-09 | Canon Inc | 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム |
JP2005092707A (ja) * | 2003-09-19 | 2005-04-07 | Seiko Epson Corp | 類似度算出システムおよび類似度算出プログラム、並びに類似度算出方法 |
-
2005
- 2005-05-12 JP JP2005140135A patent/JP2006318219A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002183166A (ja) * | 2000-12-19 | 2002-06-28 | Nec Corp | ドキュメントファイリングシステムおよび方法 |
JP2004348706A (ja) * | 2003-04-30 | 2004-12-09 | Canon Inc | 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム |
JP2005092707A (ja) * | 2003-09-19 | 2005-04-07 | Seiko Epson Corp | 類似度算出システムおよび類似度算出プログラム、並びに類似度算出方法 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008146492A (ja) * | 2006-12-12 | 2008-06-26 | Yahoo Japan Corp | 情報提供装置、情報提供方法、及びコンピュータプログラム |
JP2008146491A (ja) * | 2006-12-12 | 2008-06-26 | Yahoo Japan Corp | 情報提供装置、情報提供方法、及びコンピュータプログラム |
US8977949B2 (en) | 2007-10-11 | 2015-03-10 | Nec Corporation | Electronic document equivalence determination system and equivalence determination method |
WO2009048149A1 (ja) * | 2007-10-11 | 2009-04-16 | Nec Corporation | 電子文書の同等判定システムおよび同等判定方法 |
JP2010140209A (ja) * | 2008-12-11 | 2010-06-24 | Nec Corp | 検索システム、検索方法、およびプログラム |
US8953857B2 (en) | 2011-06-30 | 2015-02-10 | Panasonic Corporation | Similar case searching apparatus and similar case searching method |
JP4979842B1 (ja) * | 2011-06-30 | 2012-07-18 | パナソニック株式会社 | 類似症例検索装置および類似症例検索方法 |
JP2020052961A (ja) * | 2018-09-28 | 2020-04-02 | キヤノン株式会社 | コンテンツ提供システム、コンテンツ提供方法、情報処理装置、及びプログラム |
JP7134814B2 (ja) | 2018-09-28 | 2022-09-12 | キヤノン株式会社 | システム、ページデータ出力方法、及びプログラム |
JP2021012452A (ja) * | 2019-07-04 | 2021-02-04 | エヌ・ティ・ティ・コムウェア株式会社 | 素材検索システム、素材検索方法、素材検索装置、およびプログラム |
JP2021012453A (ja) * | 2019-07-04 | 2021-02-04 | エヌ・ティ・ティ・コムウェア株式会社 | 検索クエリ生成装置、検索クエリ生成方法、プログラム、素材検索システム、および素材検索方法 |
JP7304221B2 (ja) | 2019-07-04 | 2023-07-06 | エヌ・ティ・ティ・コムウェア株式会社 | 検索クエリ生成装置、検索クエリ生成方法、プログラム、素材検索システム、および素材検索方法 |
JP7304220B2 (ja) | 2019-07-04 | 2023-07-06 | エヌ・ティ・ティ・コムウェア株式会社 | 素材検索システム、素材検索方法、素材検索装置、およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7170082B2 (ja) | 情報を生成するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム | |
TWI475406B (zh) | 取決於上下文之輸入方法 | |
US9262386B2 (en) | Data editing for improving readability of a display | |
US7979268B2 (en) | String matching method and system and computer-readable recording medium storing the string matching method | |
JP2006318219A (ja) | 類似スライド検索プログラム及び検索方法 | |
CN111428457B (zh) | 数据表的自动格式化 | |
US20060204096A1 (en) | Apparatus, method, and computer program for analyzing document layout | |
KR101326354B1 (ko) | 문자 변환 처리 장치, 기록 매체 및 방법 | |
KR20060042296A (ko) | 사전 업데이트 방법 및 그 장치 | |
JP2010009251A (ja) | 文書データの検索を支援する装置及び方法 | |
US20150199567A1 (en) | Document classification assisting apparatus, method and program | |
CN111309200B (zh) | 一种扩展阅读内容的确定方法、装置、设备及存储介质 | |
KR20200059993A (ko) | 웹툰 제작을 위한 콘티를 생성하는 장치 및 방법 | |
US11423206B2 (en) | Text style and emphasis suggestions | |
CN111639228B (zh) | 视频检索方法、装置、设备及存储介质 | |
JP6389296B1 (ja) | 映像データ処理装置、映像データ処理方法、及びコンピュータプログラム | |
US20100287187A1 (en) | Method for query based on layout information | |
US20180151178A1 (en) | Interactive question-answering apparatus and method thereof | |
US20170132484A1 (en) | Two Step Mathematical Expression Search | |
JP6736224B2 (ja) | 文章解析装置及び文章解析プログラム | |
JP5446877B2 (ja) | 目次構造特定装置 | |
JP6441142B2 (ja) | 検索装置、方法及びプログラム | |
KR20100064297A (ko) | 문서 간 유사도 산출 시스템 및 방법 | |
US10049107B2 (en) | Non-transitory computer readable medium and information processing apparatus and method | |
JP4972271B2 (ja) | 検索結果提示装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100826 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100831 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110104 |