JP2006099761A - マルチメディアのコンテンツ検索方法 - Google Patents

マルチメディアのコンテンツ検索方法 Download PDF

Info

Publication number
JP2006099761A
JP2006099761A JP2005257538A JP2005257538A JP2006099761A JP 2006099761 A JP2006099761 A JP 2006099761A JP 2005257538 A JP2005257538 A JP 2005257538A JP 2005257538 A JP2005257538 A JP 2005257538A JP 2006099761 A JP2006099761 A JP 2006099761A
Authority
JP
Japan
Prior art keywords
segment
event
weight value
representation
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005257538A
Other languages
English (en)
Inventor
Jin Soon Lee
ジン・ソウ・イ
Jung Min Song
ジュン・ミン・ソン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2006099761A publication Critical patent/JP2006099761A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】各マルチメディアアイテムに対する加重値を効果的に表現して、マルチメディアの検索及びブラウジング性能を向上させる加重値表現技法及び加重値表現技法を利用したマルチメディア検索方法を提供する。
【解決手段】マルチメディアのコンテンツ情報を示す各記述情報が、加重値の値を定義する基準を意味する加重値タイプ102と、該加重値タイプによって定義される基準による加重値103と、前記加重値タイプによって対象に付与された加重値が如何に信頼的であるかを意味する信頼度104と、を包含してマルチメディアデータを構成する。
【選択図】 図1A

Description

本発明は、加重値表現構造(Weight Description Scheme、Weight DS)を使用したマルチメディア検索に係るもので、詳しくは、各マルチメディアアイテムに対する加重値を効果的に表現して、マルチメディアの検索及びブラウジング性能を向上させることができる、加重値表現構造を利用したマルチメディアのコンテンツ検索方法に関するものである。
一般に、コンテンツベースでイメージ検索を行うために、カラーヒストグラム及び部分領域カラーのような多様な特徴ディスクリプタが使用されているが、各イメージ毎にそれらイメージを区分するための主要特徴ディスクリプタが異なるため、該当イメージに適合した特徴ディスクリプタに加重値を設定する技術が研究されつつある。
従来のコンテンツベースのイメージ検索を行うためのシステムにおいて、各イメージの特徴に適した加重値を適用する技術の1例として、使用者が検索を行うとき、特徴ディスクリプタの加重値を自ら決めるように加重値を入力できるウインドウを使用者インタフェースとして用意しておき、そのインタフェースを利用して使用者が特徴ディスクリプタの加重値を入力する方法がある。
併し、上述した方法は、一般の使用者がイメージに適した特徴ディスクリプタの加重値を設定することが容易でないという不都合な点があった。
また、従来のコンテンツベースイメージ検索を行うための特徴ディスクリプタの加重値を表現する技術の他の例として、使用者フィードバックを使用した特徴ディスクリプタの加重値設定方法が使用されている。詳しくは、使用者がある状態で先ず検索を行った後、検索の結果リストから使用者が検索しようとしたイメージと類似したイメージであったか、又はそうでないイメージであったかを表示して、検索システムにフィードバックすることによって、そのフィードバックを使用してシステムが自動的に加重値を設定及び更新するようになっている。この方法は使用者のフィードバックを使用してシステムが自動的に特徴ディスクリプタの加重値を設定し得るというメリットがある。
以上のような従来の技術は、イメージなどの特定タイプのマルチメディア技術に適用された加重値表現構造の例を示している。
最近では、より一層複合的なマルチメディアに対するコンテンツベース検索及びブラウジングを要求しており、これらの要求に応じるために、綜合的なマルチメディア検索及びブラウジングを行うための加重値表現構造が必要とされている。
本発明は、このような従来技術の限界点を克服したもので、綜合的なマルチメディア構造及びそのマルチメディア構造に適合した効率的な加重値表現構造(Weight DS)を提示して、効果的なマルチメディア検索及びブラウジングを行い得る加重値表現構造及び該加重値表現構造を利用したマルチメディア検索方法を提供することを目的とする。
このような目的を達成するため、本発明に係る加重値表現構造及びこれを利用したマルチメディア検索方法においては、マルチメディアのコンテンツ情報を示す各表現構造が効果的に加重値を表現するように、加重値タイプ、加重値及び信頼度からなる加重値表現構造を備えることによって、効果的なマルチメディア検索及びブラウジングが可能なマルチメディアデータ表現構造を提供する。
そして、本発明に係る加重値表現構造及びこれを利用したマルチメディア検索方法においては、マルチメディアのコンテンツ表現構造がセグメント表現構造及びセグメント関係グラフ表現構造により構成され、前記コンテンツ表現構造は、1つ以上の加重値表現構造を追加的に含んで、各セグメント間の加重値又は各セグメント関係間の加重値を記述することによって、効果的なマルチメディア検索及びブラウジングが可能なマルチメディアデータ表現構造を提供する。
且つ、本発明に係る加重値表現構造及びこれを利用したマルチメディア検索方法においては、マルチメディアのコンテンツ表現構造が1つ以上のセグメント関係表現構造及び1つ以上のセグメントノード表現構造により構成されるセグメント関係グラフ表現構造を有し、前記各セグメント関係表現構造は、1つ以上の自己自身又はセグメントノード表現を含み、前記各セグメントノード表現構造は、1つ以上のセグメント、自己自身又はセグメント関係表現構造を含み、前記セグメント関係表現構造はさらに1つ以上の加重値表現構造を含むように、セグメント関係に関する加重値情報またはセグメントノードに関する加重値情報を表現することによって、及びセグメントノード表現構造が1つ以上の加重値表現構造を追加的に含むように各セグメント関係間の加重値又は各セグメントノード間の加重値を表現することによって、効果的なマルチメディア検索及びブラウジングが可能なマルチメディアデータ表現構造を提供する。
又、本発明は、マルチメディアのコンテンツ表現構造が複数のイベント情報及び複数のオブジェクト情報並びにそれら間の関係グラフ表現構造からなり、1つ以上の加重値表現構造を追加的に含むコンテンツ表現構造を含むように、各オブジェクト間の加重値、各イベント間の加重値、又は、各イベントとオブジェクト関係グラフ間の加重値を記述することによって、効果的なマルチメディア検索及びブラウジングが可能なマルチメディアデータ表現構造を提供する。
更に、本発明は、マルチメディアのイベントとオブジェクトの関係グラフ表現構造が1つ以上の加重値表現構造を追加的に含むように、各イベントとオブジェクト関係間の加重値、又は、各イベントとオブジェクトノード間の加重値を表現することによって、及びイベント又はオブジェクトノード表現構造が1つ以上の加重値表現構造を追加的に含むように、各イベント又はオブジェクト間の加重値を表現することによって、効果的なマルチメディア検索及びブラウジングが可能なマルチメディアデータ表現構造を提供する。
そして、本発明は、マルチメディア表現構造及び加重値表現構造並びにセグメント関係グラフ表現構造を使用して、マルチメディア要約ディスプレーを実現することができるマルチメディアディスプレー方法を提供する。
且つ、本発明は、マルチメディア構造及びコンテンツ情報と、加重値表現構造及びイベント/オブジェクト関係グラフ表現構造を使用して、動画像を人物関係中心に検索してディスプレーすることができるマルチメディアディスプレー方法を提供する。
本発明によれば、マルチメディアのコンテンツベース検索及びブラウジングを行うための構造に、各コンテンツ表現構造に対する効果的な加重値を記述することによって、一層高性能の検索及びブラウジングが可能になるという効果がある。
且つ、複雑なマルチメディアのコンテンツ表現構造に多様に対応し得る加重値表現構造を提示して、加重値を利用したマルチメディア検索及びブラウジングを行うためのデータ標準を期待し得るという効果がある。
以下、本発明の実施の形態を図面を用いて説明する。
図1は、本発明で共通に使用される加重値表現構造を示した図で、(A)は加重値表現構造(DS)、(B)は前記(A)をXML形態に、それぞれ示した図である。
本発明に係るマルチメディアの加重値表現構造101は、図1に示したように、マルチメディアのコンテンツ情報を示す各表現構造(DS)が加重値を効果的に表現し得るように、加重値タイプ102、加重値103及び信頼度104により構成されることを特徴とする。
加重値タイプ102は、加重値の値を決める基準を意味する。その基準によっては同一対象であっても複数の加重値を有することができる。
例えば、イメージ検索に使用される各特徴ディスクリプタ間の加重値を記述するとき、同一対象であっても、使用者フィードバックによる学習によって生成された加重値と、イメージ生成者が直接指定した加重値との両加重値を同時に記述することができる。
このとき、両加重値がどのように生成されたものであるかの区分は、加重値タイプ102を使用して行うことができる。
例えば、使用者フィードバックによる学習によって生成された加重値の場合の加重値タイプを“relevance feedback”と、イメージ生成者が直接指定した加重値の場合の加重値タイプは“manual”と指定することができる。
信頼度104は、加重値タイプ102によって対象に付与された加重値が如何に信頼できる値かであることを示す。
例えば、加重値タイプが“relevance feedback”である場合は、そのfeedbackが如何に多くなされたかによって信頼度を与えることが可能で、加重値タイプが“manual”である場合は、加重値を与えた人が該当の対象に対して専門家であるか初心者であるかによってそれぞれ高値または低値の信頼度を与えることができる。
また、加重値103は、加重値の対象105及び加重値の値106により構成される。
例えば、図2に示したセグメント表現構造における各セグメントに対する加重値は、図3に示したように、各セグメントを参照する加重値対象と加重値の値のつながりとして表現される。
すなわち、図2の各セグメント201〜207の構造に対し、図3(A)(B)のように、各セグメントseg0、seg10、seg11、seg100、seg110、seg111に対して、各セグメントを参照する加重値対象と加重値の値の連続により加重値が表現される。ここで、図3(A)は、階層的構造に含まれた全セグメントの加重値を表現した場合、図3(B)は、階層的構造に含まれたセグメントの加重値を各レベルによって分けたセグメントグループ単位で表現した場合をそれぞれ示したものである。
このように、図2に示したセグメント表現構造において、各セグメントに対する加重値が、図3に示したように各セグメントを参照する加重値対象及び加重値の値の連続により表現される1例として、セグメント0(201)の場合は、そのセグメントを参照する加重値対象(WeightValueDS Reference='seg0')、及び加重値の値(value=0.6)により表現されている。その他のセグメントに対しても加重値対象及び加重値の値により表現される。
併し、複数の加重値対象の順序が予め定義される場合は、加重値対象の情報を含まず、加重値の値のみにより構成されたn次元のベクトルにより加重値を表現することが可能で、このときは、予め定義された順序に従って各加重値の値を加重値対象にマッピングすることができるため、加重値対象を省略することができる。
一方、加重値対象の順序が予め定義されてない場合は、加重値対象と加重値の値により構成された対の集合により表現することもできる。
図4は、加重値表現構造を含むマルチメディアの構文表現構造(Syntactic DS)を示した図で、(A)は表現構造(DS)を示した図、(B)は前記(A)をXML形態に示した図である。
すなわち、本発明に係るマルチメディア加重値表現構造は、マルチメディアのコンテンツベース検索及びブラウジングを行うために、マルチメディアの構造と関連したマルチメディアのコンテンツ表現構造である構文表現構造を含む。この構文表現構造が、各セグメントの表現構造を示すセグメント表現構造及び各セグメント間の関係を定義するセグメント関係グラフ表現構造を含むとき、前記構文表現構造は、1つ以上の加重値表現構造を追加的に含んで、各セグメント間の加重値または各セグメント関係間の加重値を記述する。
構文表現構造401は、加重値表現構造402、セグメント表現構造403及びセグメント関係グラフ表現構造404により構成される。
加重値表現構造402は、各セグメント、または、各セグメント関係グラフ間の加重値を表現する。
セグメント表現構造403は、図2に示したような階層的構造により構成することが可能で、このとき、セグメント表現構造は、図3(A)に示したように階層的構造に含まれた全セグメントに対する加重値を表現することも可能で、または、図3(B)に示したように階層的構造に含まれたレベル別セグメントグループ単位で加重値を表現することもできる。
すなわち、セグメント表現構造が、子セグメント表現構造を持った階層的なセグメント表現構造を記述するとき、表現構造に含まれたある加重値表現構造が、階層的セグメント表現構造により表現された全セグメントに対する加重値を表現するか、または複数の加重値表現構造をそれぞれ階層的セグメント表現構造内に含むセグメントの子セグメント単位で加重値を表現することができる。
本発明の実施形態では、階層構造内に3個のセグメントグループが存在するため、3つの加重値表現構造として表現してある。
このようにして、加重値を付与する対象に対する情報を使用して多様な形態の加重値を表現することができる。
そして、図5は、加重値表現構造を含むセグメント関係グラフ表現構造を示したもので、図5(A)は、加重値表現構造を含むセグメント関係グラフの表現構造(DS)を示した図、図5(B)は、前記(A)をXML形態に示した図である。
すなわち、本発明に係るマルチメディア表現構造は、図5に示したように、セグメント関係に関する加重値情報又はセグメントノードに関する加重値情報を表現することによってセグメント間の関係を表現している。そこでは、マルチメディアコンテンツ表現構造は、1つ以上のセグメント関係表現構造及び1つ以上のセグメントノード表現構造により構成されるセグメント関係グラフ表現構造を備え、各セグメント関係表現構造は、1つ以上の自己自身またはセグメントノードをそれぞれ含み、また、各セグメントノード表現構造は、1つ以上のセグメント、自己自身又はセグメント関係表現構造を含む。セグメント関係表現構造は、1つ以上の加重値表現構造を追加的に含む。また、マルチメディア表現構造は、さらに、1つ以上の加重値表現構造を追加的に含むようにセグメントに関する加重値を表現することによってもセグメント間の関係を表現している。
ここで、セグメント関係グラフ表現構造501は、1つ以上のセグメント関係表現構造502、加重値表現構造503及び1つ以上のセグメントノード表現構造504により構成されている。各セグメント関係表現構造502は、1つ以上の自己自身またはセグメントノードを含むことが可能である。また、各セグメントノード表現構造504は、1つ以上のセグメント、自己自身又はセグメント関係表現構造を含むことが可能で、その他に参照領域505、該当領域506、セグメント507、参照セグメント508及び加重値表現構造509情報を有する。このような構造を使用して階層的なセグメント関係グラフを生成することができる。
なお、前記セグメント関係グラフ表現構造に含まれた加重値表現構造503は、各セグメント関係間の加重値、または、各セグメントノード間の加重値を表現し、セグメントノード表現構造504に含まれた加重値表現構造509は、関係グラフに含まれる各セグメント間の加重値を表現する。
図6は、加重値表現構造を含むマルチメディアの内容を表現するセマンティック表現構造(Semantic DS)を示した図で、図6(A)は、その表現構造を示した図、図6(B)は、前記(A)をXML形態に示した図である。
すなわち、本発明に係るマルチメディア加重値表現構造においては、図6に示したように、マルチメディアのコンテンツベース検索及びブラウジングを行うために、マルチメディアのセマンティック表現構造がマルチメディアのコンテンツと関連されたセマンティック表現構造601を含む。このセマンティック表現構造601は、イベントを記述する複数のイベント情報と、オブジェクトを記述する複数のオブジェクト情報と、それら間の関係を記述する1つ以上のイベント/オブジェクト関係グラフ表現構造とにより構成され、セマンティック情報は、さらに1つ以上の加重値表現構造を追加的に含んで、各オブジェクト間の加重値、各イベント間の加重値、または各イベント/オブジェクト関係グラフ間の加重値を表現する。
すなわち、セマンティック表現構造601は、加重値表現構造602、複数のオブジェクト表現構造603、イベント表現構造604及びイベント/オブジェクト関係グラフ表現構造605により構成される。
加重値表現構造602は、各イベント間の加重値、各オブジェクト間の加重値、または、各セグメント関係グラフ間の加重値を表現する。
オブジェクト表現構造603、イベント表現構造604及びイベント/オブジェクト関係グラフ表現構造605は、セグメント表現構造及びセグメント関係グラフ表現構造と同様に階層的に表現することができるが、このときも、加重値対象情報を使用して各階層構造の一部または全体単位で加重値を表現することができる。
すなわち、図6のマルチメディア加重値表現構造においては、オブジェクト(またはイベント)表現構造が子オブジェクト(またはイベント)表現構造を包含して階層的なオブジェクト(またはイベント)表現構造を表現するとき、セマンティック情報に含まれた1つの加重値表現構造が階層的オブジェクト(またはイベント)構造で表現された全オブジェクト(またはイベント)に対する加重値を表現するか、複数の加重値表現構造がそれぞれ階層的オブジェクト(またはイベント)構造内に含まれた1つのオブジェクト(またはイベント)の子オブジェクト(またはイベント)単位で加重値を表現することができる。
図7は、加重値表現構造を含むイベント/オブジェクト関係グラフ表現構造を示した図で、図7(A)は、表現構造(DS)を示した図、図7(B)は、前記(A)をXML形態で示した図である。
すなわち、本発明に係るマルチメディア加重値表現構造においては、図7に示したように、各オブジェクトとイベント間の関係に関する加重値情報を表現するために、イベント/オブジェクト関係グラフ表現構造は、1つ以上のイベント/オブジェクト関係表現構造及び1つ以上のイベント/オブジェクトノード表現構造により構成され、各イベント/オブジェクト関係表現構造は、1つ以上の自己自身またはイベント/オブジェクトノードを含み、各イベント/オブジェクトノード表現構造は、1つ以上のオブジェクト、イベント、自己自身、またはイベント/オブジェクト関係表現構造で構成され、イベント/オブジェクト関係表現構造は、さらに、1つ以上の加重値表現構造を追加的に含み、各イベント/オブジェクト関係間の加重値、または各イベント/オブジェクトノード間の加重値を表現し、イベント/オブジェクトノード表現構造は、1つ以上の加重値表現構造を追加的に包含して、各イベントまたは各オブジェクト間の加重値を表現する。
図7の基本構造は、図5のセグメント関係グラフ表現構造と類似する。
ここで、イベント/オブジェクト関係グラフ表現構造701は、1つ以上のイベント/オブジェクト関係表現構造702、加重値表現構造703及び1つ以上のイベント/オブジェクトノード表現構造704により構成される。各イベント/オブジェクト関係表現構造702は、1つ以上の自己自身またはイベント/オブジェクトノードを含むことが可能である。各イベント/オブジェクトノード表現構造704は、1つ以上のオブジェクト、イベント、自己自身、またはイベント/オブジェクト関係表現構造を含むことが可能で、その他に参照オブジェクト表現構造705、オブジェクト表現構造706、イベント表現構造707、参照イベント表現構造708及び加重値表現構造709が含まれる。
ここで、イベント/オブジェクト関係グラフ表現構造701に含まれた加重値表現構造703は、各イベント/オブジェクト関係間の加重値又は各イベント/オブジェクトノード間の加重値を表現し、イベント/オブジェクトノード表現構造704に含まれた加重値表現構造709は、各イベント間の加重値または各オブジェクト間の加重値を表現する。
一方、上述したように、加重値表現構造を含むマルチメディアのコンテンツ表現構造において、含まれた加重値が階層的構造の特定部分を対象にして加重値を表現するか、または、オブジェクト及びイベントなどの各アイテム中1種類に対する加重値を表現するとき、どの部分に対する加重値であるかの区分、または、どのアイテムに対する加重値であるかの区分は、加重値表現構造に含まれた加重値の加重値対象を利用して行うことができる。
以下、上述した本発明に係るマルチメディアデータ構造として、加重値表現構造を含むマルチメディアのブラウジング及び検索方法、並びにマルチメディアディスプレー方法に対して説明する。
先ず、加重値表現構造を含むマルチメディア表現構造及びセグメント関係グラフ表現構造を使用した場合における、使用者依存的なキーフレームベース内容要約応用プログラム(Key-frame based summarization application)としてキーフレーム変換グラフ形態のブラウジングについて説明する。
本発明に係るマルチメディア加重値表現構造を含むマルチメディア要約ディスプレー方法においては、加重値表現構造、マルチメディア表現構造及びセグメント関係グラフ表現構造を使用してキーフレーム変換グラフをディスプレーするとき、使用者が所望する数だけのキーフレームを表現構造内の加重値表現構造で表現された各セグメント間の加重値順序に抽出する段階と、セグメント関係グラフ表現構造により抽出された各キーフレームを含む関係のみを抽出し、それらを利用してキーフレーム変換グラフを生成する段階と、を順次行う。
さらに、本発明に係るマルチメディア加重値表現構造を含むマルチメディア要約ディスプレー方法においては、加重値表現構造、マルチメディア表現構造及びセグメント関係グラフ表現構造を使用してキーフレーム変換グラフをディスプレーするとき、セグメント関係グラフ内の加重値表現構造で表現された各セグメント関係の加重値の高い順番にセグメント関係を抽出する。このとき、使用者所望のキーフレームの数に達するまで抽出する段階と、それら抽出されたセグメント関係グラフを利用して、キーフレーム変換グラフを生成する段階と、を順次行う。
以下、図8に基づいて、前記マルチメディア要約ディスプレー方法を詳しく説明する。
セグメントとは、時間軸を基準にした動画像の一定部分を意味する。動画像は連続したフレームにより構成され、例えば、1秒に30フレームにより構成されると仮定すると、2秒のセグメントは連続した60フレームにより構成される。従って、もし、セグメントの時間間隔が0であると、それは1つのフレームを意味し、結局、セグメント表現構造は1つのフレームを表現する。
このような性質を利用してマルチメディアのコンテンツ表現構造内のセグメント表現構造を使用して階層的キーフレーム構造を表現することが可能で、セグメント関係グラフ表現構造を使用してキーフレームの関係グラフを表現することができる。特に、関係が該当動画像においてキーフレームの時間的な順序関係を意味する場合、時間的な変換関係グラフを表現することができる。
すなわち、このようなマルチメディアコンテンツ表現構造内のセグメント表現構造及びセグメント関係グラフ表現構造を使用して、図8(A)(B)に示したようなキーフレーム変換グラフ形態のブラウジングが可能になる。
このとき、キーフレーム変換グラフが複雑であると、使用者が内容を理解するための障害となり得るため、使用者はキーフレーム変換グラフのノード数を調節することができる。
すなわち、使用者は同じ構造を使用して、図8(A)に示したような5個のキーフレームframe0〜frame4を利用した変換グラフ、または、図8(B)に示したような10個のキーフレームframe0、frame0.1、frame1、frame1.1、frame2、frame2.1、frame3、frame3.1、frame3.2、frame4を利用した変換グラフを要求することができる。
また、このような要求が発生すると、表現構造内に含まれた加重値表現構造を使用して、加重値が高い順に使用者所望のフレーム数だけのキーフレームを利用してキーフレーム変換グラフを生成することができる。
同様に、使用者がおおまかなキーフレーム数を明示した場合、セグメント関係グラフ表現構造内に含まれた加重値表現構造を使用して、加重値が高い順に使用者所望のキーフレームに最も近いフレーム数を満足する関係のみを抽出し、それを利用してキーフレーム変換グラフを生成することができるが、このときは、単なるキーフレームの加重値ではなく、キーフレームの変換に対する加重値順であるため、全体的な内容の流れをより反映したキーフレーム変換グラフを提供することができるというメリットはあるが、使用者所望のキーフレーム数を正確に反映することができないという短所がある。
また、加重値表現構造を含むマルチメディアのセマンティック表現構造及びイベント/オブジェクト関係グラフ表現構造を利用した人物関係中心の動画像ブラウザーについて説明する。
本発明に係る動画像人物関係中心ディスプレー方法においては、上述した加重値表現構造、イベント/オブジェクト関係グラフ表現構造等のマルチメディアコンテンツ表現構造を使用して動画像を人物関係中心に検索してディスプレーするとき、マルチメディアコンテンツ表現構造内に含まれた加重値表現構造が表現する各オブジェクト間の加重値順に人物を羅列し、イベント/オブジェクト関係グラフ表現構造内に含まれた加重値表現構造が表現する各オブジェクト間の関係間の加重値順に二人の人物間の関係変換を羅列し、その選択された両人物間の関係を満足するイベント区間のキーフレームを羅列する。そのとき、その順番は、コンテンツ構造内に含まれた加重値表現構造が表現する各セグメント間の加重値順に決定される。
以下、図9に基づいて人物関係中心ディスプレー方法について説明する。
一般に、動画像のコンテンツは主要登場人物の関係中心に進行するため、各登場人物間の関係中心に動画像を検索及びブラウジングする方法が使用される。マルチメディアのコンテンツ構造にはオブジェクト(登場人物)及びイベント/オブジェクト関係グラフ表現構造が包含されているため、それらを使用するとこのような応用が可能になる。
このようなブラウザーの基本的な使用者インタフェースにおいては、図9に示したように、登場人物画面901は動画像に登場する人物を羅列し、人物関係画面902は前記登場人物画面901にて選択された登場人物と関係がある人物が羅列され、同時に選択された二人の人物については関係の変化が表現される。
また、主要場面画面903は、各登場人物と特定関係を満足するイベント区間を代表する各キーフレームが羅列される。
このとき、登場人物画面901に羅列される各登場人物の順序は、コンテンツ表現構造内に含まれた加重値表現構造を使用して決定することができる。すなわち、各オブジェクトの加重値が包含されているため、それを使用すると、各登場人物を主要人物順に羅列することができる。
更に、人物関係画面902で表現される各登場人物間の関係のディスプレー順序も、イベント/オブジェクト関係グラフ表現構造内に含まれた加重値表現構造を使用して決定することができる。
最後に、選択された関係を満足するキーフレーム順序は、上述したように各セグメント間の加重値を表現する表現構造内に含まれた加重値表現構造を使用して決定する。
本発明で共通的に使用される加重値表現構造を示した図である。 前記(A)をXML形態に示した図である。 セグメント表現構造を示した図である。 図2のセグメント表現構造において、各セグメントに対する加重値を表現した例示図である。 図2のセグメント表現構造において、各セグメントに対する加重値を表現した例示図である。 加重値表現構造を含むマルチメディアシンタックス表現構造を示した図で、(A)は表現構造を示した図、(B)は前記(A)をXML形態に示した図である。 加重値表現構造を含むセグメント関係グラフ表現構造の表現構造を示した図である。 前記(A)をXML形態に示した図である。 加重値表現構造を含むマルチメディアコンテンツ表現構造の表現構造を示した図(A)で(B)は前記(A)をXML形態に示した図である。 加重値表現構造を含むイベント/オブジェクト関係グラフ表現構造を示した表現構造を示した図である。 前記(A)をXML形態に示した図である。 (A)(B)、マルチメディア表現構造内のセグメント表現構造及びセグメント関係グラフ表現構造を使用したキーフレーム変換グラフ形態(Key−frame transition graph)のブラウジングを説明するための図である。 人物関係中心動画像ブラウザーの1例を示した図である。
符号の説明
101…加重値表現構造、102…加重値タイプ、103…加重値、104…信頼度、105…加重値の対象、106…加重値の値、201〜207…セグメント、401…表現構造、402…加重値表現構造、403:セグメント表現構造、404、501…セグメント関係グラフ表現構造、502…セグメント関係表現構造、503…加重値表現構造、504…セグメントノード表現構造、505…参照領域、506…該当領域、507…セグメント、508…参照セグメント、509…加重値表現構造、601…コンテンツ情報、602…加重値表現構造、603…オブジェクト表現構造、604…イベント表現構造、605,701…イベント/オブジェクト関係グラフ表現構造、702…イベント/オブジェクト関係表現構造、703…加重値表現構造、704…イベント/オブジェクトノード表現構造、705…参照オブジェクト表現構造、706…オブジェクト表現構造、707…イベント表現構造、708…参照イベント表現構造、709…加重値表現構造、901…登場人物画面、902…人物関係画面、903…主要場面画面。

Claims (6)

  1. マルチメディアのコンテンツの複数のセグメントに索引を付与することにより前記マルチメディアのコンテンツを検索する方法において、
    マルチメディアのコンテンツの複数のセグメントのそれぞれに、セグメント加重値を指定する過程と、
    前記マルチメディアのコンテンツの前記複数のセグメントの相互関係を表すセグメント関係の索引を生成する過程と、
    指定されたセグメント加重値とセグメント関係の索引に基づいて、前記マルチメディアの前記複数のセグメントの索引を生成する過程と
    を備えたことを特徴とするマルチメディアのコンテンツ検索方法。
  2. 前記セグメントが、子セグメントを包含した階層的なセグメント表現構造として表されるとき、
    前記セグメント表現構造に含まれたセグメント加重値の表現構造が、階層的セグメント表現構造で表された全セグメントに対する加重値を表すか、または、複数の加重値の表現構造が、それぞれ階層的セグメント表現構造内に含まれているセグメントの子セグメント単位で加重値を表すことを特徴とする請求項1記載のマルチメディアのコンテンツ検索方法。
  3. 各セグメント間の関係を表すために、セグメント関係の索引構造は、1つ以上のセグメント関係の索引構造及び/又は1つ以上のセグメントノード表現構造により構成され、各セグメント関係の索引構造は、1つ以上の自己自身またはセグメントノードを含み、各セグメントノード表現構造は、1つ以上のセグメント、自己自身又はセグメント関係の索引構造を含み、
    前記セグメント関係の索引構造は、1つ以上の加重値の表現構造を含んで、各セグメント関係間の加重値または各セグメントノード間の加重値を表し、
    さらに、前記セグメントノード表現構造は、1つ以上の加重値の表現構造を含んで、各セグメント間の加重値を表すことを特徴とする請求項1記載のマルチメディアのコンテンツ検索方法。
  4. マルチメディアのコンテンツの複数のセグメントに索引を付与することにより前記マルチメディアのコンテンツを検索する方法において、
    マルチメディアのコンテンツの複数のセグメントのそれぞれに、オブジェクト加重値を指定する過程と、
    前記マルチメディアのコンテンツの前記複数のセグメントのそれぞれに、イベント加重値を指定する過程と、
    前記マルチメディアのコンテンツの複数の項目に呈示されたイベントとオブジェクトとの相互関係を表すイベント/オブジェクト関係の索引を生成する過程と、
    指定された、オブジェクト加重値とイベント加重値とイベント/オブジェクト関係の索引に基づいて、前記マルチメディアの前記複数のセグメントの索引を生成する過程と
    を備えたことを特徴とするマルチメディアのコンテンツ検索方法。
  5. 前記オブジェクトまたはイベントが、子オブジェクト若しくは子イベントを包含した階層的なオブジェクト表現構造またはイベント表現構造を表すとき、
    前記コンテンツに含まれた各加重値の表現構造は、階層的オブジェクト表現構造またはイベント表現構造で表された全てのオブジェクトまたはイベントに対する加重値を表し、前記複数の加重値の表現構造は、それぞれ階層的オブジェクト表現構造内またはイベント表現構造内に含まれたオブジェクトの子オブジェクト単位又はイベントの子イベント単位で加重値を表すことを特徴とする請求項4記載のマルチメディアのコンテンツ検索方法。
  6. 各オブジェクトとイベント間の関係を表現するために、イベント/オブジェクト関係の索引構造は、1つ以上のイベント/オブジェクト関係の索引構造及び/又は1つ以上のイベント/オブジェクトノード表現構造により構成され、各イベント/オブジェクト関係の索引構造は、1つ以上の自己自身またはイベント/オブジェクトノードを含んで構成され、各イベント/オブジェクトノード表現構造は、1つ以上のオブジェクト、イベント、自己自身、またはイベント/オブジェクト関係の索引構造を含んで構成され、
    前記イベント/オブジェクト関係の索引構造は、1つ以上の加重値の表現構造を含んで、各イベント/オブジェクト関係間の加重値、または各イベント/オブジェクトノード間の加重値を表し、
    前記イベント/オブジェクトノード表現構造は、1つ以上の加重値の表現構造を含んで、各イベントまたは各オブジェクト間の加重値を表すことを特徴とする請求項4記載のマルチメディアのコンテンツ検索方法。
JP2005257538A 1999-10-19 2005-09-06 マルチメディアのコンテンツ検索方法 Pending JP2006099761A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990045202A KR100350788B1 (ko) 1999-10-19 1999-10-19 가중치 표현 데이타 구조를 포함하는 멀티미디어 내용 묘사정보와 이를 이용한 멀티미디어 디스플레이 방법

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2004111166A Division JP2004362548A (ja) 1999-10-19 2004-04-05 マルチメディアのコンテンツ検索方法

Publications (1)

Publication Number Publication Date
JP2006099761A true JP2006099761A (ja) 2006-04-13

Family

ID=36239439

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2000319344A Pending JP2001167130A (ja) 1999-10-19 2000-10-19 加重値表現構造を含むマルチメディアデータ構造及びマルチメディアディスプレー方法
JP2004111166A Pending JP2004362548A (ja) 1999-10-19 2004-04-05 マルチメディアのコンテンツ検索方法
JP2005257538A Pending JP2006099761A (ja) 1999-10-19 2005-09-06 マルチメディアのコンテンツ検索方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2000319344A Pending JP2001167130A (ja) 1999-10-19 2000-10-19 加重値表現構造を含むマルチメディアデータ構造及びマルチメディアディスプレー方法
JP2004111166A Pending JP2004362548A (ja) 1999-10-19 2004-04-05 マルチメディアのコンテンツ検索方法

Country Status (5)

Country Link
EP (1) EP1094408A3 (ja)
JP (3) JP2001167130A (ja)
KR (1) KR100350788B1 (ja)
CN (1) CN1287311C (ja)
CA (1) CA2323347C (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100493674B1 (ko) * 2001-12-29 2005-06-03 엘지전자 주식회사 멀티미디어 데이터 검색 및 브라우징 시스템
EP1403778A1 (en) * 2002-09-27 2004-03-31 Sony International (Europe) GmbH Adaptive multimedia integration language (AMIL) for adaptive multimedia applications and presentations
US7124149B2 (en) * 2002-12-13 2006-10-17 International Business Machines Corporation Method and apparatus for content representation and retrieval in concept model space
WO2005017769A1 (en) * 2003-08-19 2005-02-24 Rapid Intelligence Pty Ltd Content system
JP2007174477A (ja) * 2005-12-26 2007-07-05 Asv:Kk 映像再生システムにおけるオブジェクト関連自動表示方式ならびに該表示方式に用いられるプレイヤ装置およびサーバ装置
CN104156423B (zh) * 2014-08-06 2017-09-29 山东财经大学 基于整数规划的多尺度视频关键帧提取方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09265478A (ja) * 1996-03-29 1997-10-07 Nec Corp 情報フィルタリング方式
JPH10240765A (ja) * 1997-03-03 1998-09-11 Nippon Telegr & Teleph Corp <Ntt> 類似オブジェクト検索方法および装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3230858B2 (ja) * 1992-11-26 2001-11-19 松下電器産業株式会社 動画像の優先度自動選択方法および動画像ダイジェスト自動表示装置
JPH06309377A (ja) * 1993-04-23 1994-11-04 Nec Corp 画像検索方法とその装置
JPH09101970A (ja) * 1995-10-06 1997-04-15 Omron Corp 画像検索方法および画像検索装置
JPH09214935A (ja) * 1996-02-02 1997-08-15 Mitsubishi Electric Corp 映像情報提供システム
JPH1040257A (ja) * 1996-07-24 1998-02-13 Hitachi Ltd 文字配列比較方法、およびそれを用いたアセンブル方法
US5930783A (en) * 1997-02-21 1999-07-27 Nec Usa, Inc. Semantic and cognition based image retrieval
KR19990069959A (ko) * 1998-02-16 1999-09-06 전주범 화상데이터의검색방법
KR100312064B1 (ko) * 1998-12-14 2001-12-28 구자홍 특징소가중치의자동판단에의한이미지검색방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09265478A (ja) * 1996-03-29 1997-10-07 Nec Corp 情報フィルタリング方式
JPH10240765A (ja) * 1997-03-03 1998-09-11 Nippon Telegr & Teleph Corp <Ntt> 類似オブジェクト検索方法および装置

Also Published As

Publication number Publication date
EP1094408A3 (en) 2006-02-01
CA2323347C (en) 2006-04-04
JP2001167130A (ja) 2001-06-22
EP1094408A2 (en) 2001-04-25
CN1305167A (zh) 2001-07-25
CA2323347A1 (en) 2001-04-19
JP2004362548A (ja) 2004-12-24
KR100350788B1 (ko) 2002-08-28
KR20010037596A (ko) 2001-05-15
CN1287311C (zh) 2006-11-29

Similar Documents

Publication Publication Date Title
US10096145B2 (en) Method and system for assembling animated media based on keyword and string input
Gloor Elements of hypermedia design: techniques for navigation & visualization in cyberspace
US20050229118A1 (en) Systems and methods for browsing multimedia content on small mobile devices
Davis Knowledge representation for video
JP2005122689A (ja) 情報検索方法
JP2016502194A (ja) ビデオ検索方法及び装置
US6789088B1 (en) Multimedia description scheme having weight information and method for displaying multimedia
JPS61220027A (ja) 文書ファイリングシステム及び情報記憶検索システム
JP2001157165A (ja) マルチメディアストリームのセグメント間の意味的連結情報の構成方法並びにこれを用いたビデオブラウジング方法
Chen et al. Semantic models for multimedia database searching and browsing
JP2006099761A (ja) マルチメディアのコンテンツ検索方法
Hirata et al. Object-based navigation: An intuitive navigation style for content-oriented integration environment
Abdulmunem et al. Semantic based video retrieval system: survey
JP2002506255A (ja) 画像およびビデオ検証用セマンティックビジュアルテンプレート発生方法およびシステム
Daras et al. Introducing a unified framework for content object description
Lyu et al. A multilingual, multimodal digital video library system
JP2006139382A (ja) 情報処理装置及びその制御方法、プログラム
CN117648504A (zh) 媒体资源序列的生成方法、装置、计算机设备和存储介质
Yang et al. Content-based retrieval of Flash™ movies: research issues, generic framework, and future directions
Yang et al. Search for flash movies on the web
JP2005236546A (ja) 部分コンテンツ作成方法及び装置及びプログラム
Liu et al. Semantic extraction and semantics-based annotation and retrieval for video databases
KR100493635B1 (ko) 멀티미디어 데이터 검색 및 브라우징 시스템
Marques et al. Issues in Designing Contemporary Video Database Systems.
US11687581B2 (en) Information extraction, enrichment, and caching framework for augmented reality applications

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071019

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100615

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100831

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101130