JP5072880B2 - メタデータ抽出サーバ、メタデータ抽出方法およびプログラム - Google Patents

メタデータ抽出サーバ、メタデータ抽出方法およびプログラム Download PDF

Info

Publication number
JP5072880B2
JP5072880B2 JP2009039529A JP2009039529A JP5072880B2 JP 5072880 B2 JP5072880 B2 JP 5072880B2 JP 2009039529 A JP2009039529 A JP 2009039529A JP 2009039529 A JP2009039529 A JP 2009039529A JP 5072880 B2 JP5072880 B2 JP 5072880B2
Authority
JP
Japan
Prior art keywords
metadata
unit
feature amount
correlation coefficient
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009039529A
Other languages
English (en)
Other versions
JP2010198111A (ja
Inventor
悟 近藤
猛志 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009039529A priority Critical patent/JP5072880B2/ja
Publication of JP2010198111A publication Critical patent/JP2010198111A/ja
Application granted granted Critical
Publication of JP5072880B2 publication Critical patent/JP5072880B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、主に、映像や音楽などで構成されるメディアコンテンツの内容を認識し、多様な情報を含むメディアデータから、メディアデータ同士を関連付けるメタデータを抽出するメタデータ抽出サーバ、メタデータ抽出方法およびプログラムに関する。
Web上におけるメディアデータへの情報付与技術としては、Web上の動画閲覧サーバを介して複数のユーザから動画に付与された様々なアノテーションに対し、該ユーザらから良否の判定を統計的に収集しこれに構文的な整合性及び映像特徴量を加味することで、適切なアノテーションを選別して表示する技術が知られている(例えば、非特許文献1参照)。
また、ネットワーク上のメディアデータから情報を抽出する技術としては、ネットワーク上の特殊ブリッジを操作し、所望の処理をグラフ状に組み合わせることで、ネットワーク上に散在する処理サーバに、任意のストリームを迂回経由させて、様々な処理を適用することが可能な複数のストリームを処理する技術が知られている(例えば、非特許文献2参照)。
山本大介、長尾確"閲覧者によるオンラインビデオコンテンツへのアノテーションとその応用",人工知能学会論文誌2005 Satoshi Kondoh, Takaaki Moriya, Hiroyuki Ohnishi, and Miki Hirano, "A method of bridging and processing media stream on network", IEEE Globecom 2008 CS01M1-5.
しかし、非特許文献1に記載の統計的アノテーション方法では、同閲覧システム内だけを対象とし、かつ信頼性の高いアノテーションを選別することが主目的であり、動画認識部分は確定していないため、そのままでは他の何らかのシステムに対し認識機能を提供することはできなかった。
また、非特許文献2に記載の技術では、実際のメディア認識サーバは様々な用途に特化しており、用途が不明なメディアストリームだけが転送されて来ることを想定する場合にはメディアデータの内容に応じて認識器を振り分ける必要があるが、事前に内容(コンテクスト)が把握できないため、適切な認識器を選択することができないという問題があった。
本発明は、このような事情を考慮してなされたものであり、その目的は、Web上に存在する情報から適切な認識器を自動的に生成、及び更新することができ、また、メディアストリーム自体から適切な認識器を選択することができるメタデータ抽出サーバ、メタデータ抽出方法およびプログラムを提供することにある。
上記問題を解決するために、本発明は、メディアデータに基づき、メディアデータの内容(コンテクスト)を認識するためメタデータを抽出するメタデータ抽出サーバにおいて、ネットワーク上のサイトからコンテンツを収集する教師情報収集部と、前記教師情報収集部により収集されたコンテンツの内容を表す特徴量行列を算出する特徴量算出部と、前記特徴量算出部により算出された特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出部により算出された特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する特徴量保存部と、前記教師情報収集部により収集されたコンテンツに対して形態素解析を行い、形態素解析された語の発生頻度を表すメタデータ行列を生成するメタデータ整理部と、前記特徴量保存部により決定された部分空間毎に、前記特徴量行列の集合と前記メタデータ整理部により生成されたメタデータ行列の集合との相関係数を算出する相関係数算出部と、前記部分空間毎に前記相関係数算出部により算出された相関係数を記憶する相関係数記憶部とを有することを特徴とするメタデータ抽出サーバである。
また、本発明は、ネットワーク上で送受信されるメディアストリームを取得するメディアストリーム取得部を更に有し、前記特徴量算出部は、前記メディアストリーム取得部により取得されたメディアストリームの内容を表す特徴量行列を算出し、前記特徴量保存部は、前記教師情報収集部により収集されたコンテンツの内容を表す特徴量行列に加えて、前記メディアストリーム取得部により取得されたメディアストリームの内容を表す特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出部により算出された、前記メディアストリームの内容を表す特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する、ことを特徴とするメタデータ抽出サーバである。
また、本発明は、前記特徴量保存部により決定された部分空間に基づいて、前記メディアストリームの内容を表す特徴量行列が含まれる部分空間を特定し、前記相関係数算出部により算出された、前記特定された部分空間に対応する相関係数を適用して前記特徴量ベクトルのメタデータベクトルを算出し、該メタデータベクトルから適切な語として判定される集合を1つのメタデータとして選別する相関適用部と、前記相関適用部により選別された前記メタデータを、該メタデータ自体を送信するか、前記メディアストリームに埋め込んで送信するかを判定する送信設定部と、前記送信判定部により前記メタデータ自体を送信すると判定された場合に、前記メタデータを指定宛先のメタデータ受信端末に送信するメタデータ送出部と、前記送信判定部により前記メタデータを前記メディアストリームに埋め込んで送信すると判定された場合に、前記メディアストリームに前記メタデータを埋め込むメタデータ埋め込み部と、前記メタデータ埋め込み部により前記メタデータが埋め込まれたメディアストリームを指定宛先のメディアストリーム受信端末に送信するメディアストリーム送出部とを有することを特徴とするメタデータ抽出サーバである。
また、本発明は、前記送信設定部は、前記指定宛先として、前記メディアストリームの送信元、または前記送信元とは別の送信先のいずれかを選択的に決定する、ことを特徴とするメタデータ抽出サーバである。
また、本発明は、メディアデータに基づき、メディアデータの内容(コンテクスト)を認識するためメタデータを抽出するメタデータ抽出サーバにおけるメタデータ抽出方法において、教師情報収集部が、ネットワーク上のサイトからコンテンツを収集する教師情報収集ステップと、特徴量算出部が、前記教師情報収集ステップで収集されたコンテンツの内容を表す特徴量行列を算出する特徴量算出ステップと、特徴量保存部が、前記特徴量算出ステップで算出された特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出ステップで算出された特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する特徴量保存ステップと、メタデータ整理部が、前記教師情報収集ステップで収集されたコンテンツに対して形態素解析を行い、形態素解析された語の発生頻度を表すメタデータ行列を生成するメタデータ整理ステップと、相関係数算出部が、前記特徴量保存ステップで決定された部分空間毎に、前記特徴量行列の集合と前記メタデータ整理ステップで生成されたメタデータ行列の集合との相関係数を算出する相関係数算出ステップと、相関係数記憶部が、前記部分空間毎に前記相関係数算出ステップで算出された相関係数を記憶する相関係数記憶ステップと、を含むことを特徴とするメタデータ抽出方法である。
また、本発明は、メディアデータに基づき、メディアデータの内容(コンテクスト)を認識するためメタデータを抽出するメタデータ抽出サーバとして動作するコンピュータを、ネットワーク上のサイトからコンテンツを収集する教師情報収集手段と、前記教師情報収集手段により収集されたコンテンツの内容を表す特徴量行列を算出する特徴量算出手段と、前記特徴量算出手段により算出された特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出手段により算出された特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する特徴量保存手段と、前記教師情報収集手段により収集されたコンテンツに対して形態素解析を行い、形態素解析された語の発生頻度を表すメタデータ行列を生成するメタデータ整理手段と、前記特徴量保存手段により決定された部分空間毎に、前記特徴量行列の集合と前記メタデータ整理手段により生成されたメタデータ行列の集合との相関係数を算出する相関係数算出手段と、前記部分空間毎に前記相関係数算出手段により算出された相関係数を記憶する相関係数記憶手段として動作させるためのプログラムである。
この発明によれば、メタデータ抽出サーバは、ネットワーク上のサイトからコンテンツを収集する教師情報収集部と、前記教師情報収集部により収集されたコンテンツの内容を表す特徴量行列を算出する特徴量算出部と、前記特徴量算出部により算出された特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出部により算出された特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する特徴量保存部と、前記教師情報収集部により収集されたコンテンツに対して形態素解析を行い、形態素解析された語の発生頻度を表すメタデータ行列を生成するメタデータ整理部と、前記特徴量保存部により決定された部分空間毎に、前記特徴量行列の集合と前記メタデータ整理部により生成されたメタデータ行列の集合との相関係数を算出する相関係数算出部と、前記部分空間毎に前記相関係数算出部により算出された相関係数を記憶する相関係数記憶部とを有する。この構成により、Web上に存在する情報から適切な認識器を自動的に生成、および更新することができる。
また、この発明によれば、ネットワーク上で送受信されるメディアストリームを取得するメディアストリーム取得部を更に有し、前記特徴量算出部は、前記メディアストリーム取得部により取得されたメディアストリームの内容を表す特徴量行列を算出し、前記特徴量保存部は、前記教師情報収集部により収集されたコンテンツの内容を表す特徴量行列に加えて、前記メディアストリーム取得部により取得されたメディアストリームの内容を表す特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出部により算出された、前記メディアストリームの内容を表す特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する。この構成により、メディアストリーム自体から適切な認識器を選択することができる。
本発明の一実施形態におけるWeb連携メタデータ抽出システム全体の構成を示すブロック図である。 本実施形態におけるメタデータ抽出サーバの構成を示すブロック図である。 本実施形態のメタデータ抽出サーバによる、メディアストリームからメタデータを抽出する手順を示したシーケンス図である。 本実施形態においてメタデータ変換子と相関係数とを取得する手順を示したシーケンス図である。 本発明のメタデータ抽出サーバを検索サービスに応用した場合の構成および動作を示した概念図である。 本発明のメタデータ抽出サーバを、ブリッジと連携させてメタデータ抽出ブリッジとして構成した場合の構成および動作を示した概念図である。 本発明のメタデータ抽出サーバを、ネットワークによるストリームバックアップサービスに用いた場合の構成および動作を示した概念図である。
(第1の実施形態)
以下、本発明の一実施形態について、図面を参照して説明する。図1は、本実施形態によるWeb連携メタデータ抽出システム全体の構成を示すブロック図である。図において、Web連携メタデータ抽出サーバ101(以降、メタデータ抽出サーバと記す)は、通信可能なネットワーク100を介して、ユーザ端末101−1,101−2と接続している。メタデータ抽出サーバ1−1は、ユーザが用いるユーザ端末102−1から送信されるメディアストリームを受信する。メタデータ抽出サーバ101は、受信したメディアストリーム103から、内容を記述する情報を抽出し、別のデータストリーム104を生成し、それを予め別途指定された宛先であるユーザ端末102−2に対して送信する。
次に、図2を参照して、メタデータ抽出サーバ101の構成について説明する。図2は、本実施形態におけるメタデータ抽出サーバ101の構成を示すブロック図である。メタデータ抽出サーバ101は、メディアストリーム取得部208と、特徴量算出部204と、特徴量DB201と、メタデータDB202と、メタデータ整理部203と、相関係数DB205と、相関係数算出部214と、相関係数適用部207と、送信設定部230と、メタデータ送出部231と、メタデータ埋め込み部232と、メディアストリーム送出部233と、教師情報収集部234とを備えている。
メディアストリーム取得部208は、ネットワーク100上のメディアストリーム送信端末210から送信されたメディアストリームを取得し、特徴量算出部204と、メタデータ埋め込み部232とに入力する。特徴量算出部204は、入力されたメディアストリームから特徴量ベクトルを算出し、算出した特徴量ベクトルを、相関係数適用部207に入力する。特徴量DB201は、算出された特徴量ベクトルを、一定の時間間隔で蓄積する。
教師情報収集部234は、Webサイト240(動画投稿サイト240−1、プログサイト240−2)にアクセスし、任意のコンテンツを取得し、メディアデータとして特徴量算出部204に入力する。また、教師情報収集部234は、メディアデータをメタデータ整理部203に入力する。メタデータ整理部203は、入力されたメディアデータを形態素解析する。相関係数算出部214は、特徴量の平均化に用いる時間幅Δtで、メタデータ整理部203が形態素解析した語の発生頻度を表すメタデータベクトルを作成する。メタデータDB202は、相関係数算出部214が作成したメタデータベクトルを記憶する。
また、相関係数算出部214は、特徴量DB201が記憶する特徴量ベクトルを、時間幅△tで平均化して平均化特徴量ベクトルを算出するとともに、特徴量の変化から、シーンの区切れ目も検出し、上記特徴量ベクトルをメディアデータのフレーム分算出し、ここで得られた特徴量ベクトルを、相関係数DB205に入力する。相関係数DB205は、部分空間IDと対応するメタデータ変換子R、および相関係数Wを記憶する。
相関係数適用部207は、相関係数DB205から、部分空間IDと対応するメタデータ変換子R、および相関係数Wとを読み出し、特徴量ベクトルがどの部分空間に入るかを特定する。また、相関係数適用部207は、特徴量ベクトルがどの部分空間に入るかを特定した後、その部分空間に対応する相関係数Wを、この特徴量ベクトルに適用してメタデータベクトルを算出する。また、相関係数適用部207は、算出したメタデータベクトルから適切な語として判定される集合を選別して、1つのメタデータとし、送信設定部230に入力する。
メディアストリームにメタデータを埋め込んで出力する場合、送信設定部230は、メタデータをメディアストリーム埋め込み部232に入力する。メディアストリーム埋め込み部232は、メディアストリーム取得部208から入力されたメディアストリームに、送信設定部230から入力されたメタデータを埋め込み、メディアストリーム送出部233に入力する。メディアストリーム送出部233は、メタデータが埋め込まれたメディアストリームを、指定宛先のメディアストリーム受信端末250に送信する。
一方、メタデータを単独で出力する場合には、送信設定部230は、メタデータをメタデータ送出部231に入力する。メタデータ送出部231は、送信設定部230から入力されたメタデータに、パケットヘッダを付加して、指定宛先のメタデータ受信端末251に送信する。
このように、送信設定部230は、メタデータをメディアストリームに埋め込んで送信するか、メタデータを単体で出力するかを設定することができる。また、送信先を指定することができる。例えば、メディアストリームを送信したユーザ端末に、メタデータを埋め込んだメディアストリームまたはメタデータを送信するか、別のユーザ端末に、メタデータを埋め込んだメディアストリームまたはメタデータを送信するかを指定することができる。
なお、メタデータは、例えば、MPEG−7などで規定されているXML(eXtensible Markup Language)形式のデータである。
メディアストリーム受信端末250は、メタデータが埋め込まれたメディアストリームを受信することができる端末である。メタデータ受信端末251は、メタデータを受信することができる端末である。
Webサイト240は、例えば、動画投稿サイト240−1や、ブログサイト240−2である。動画投稿サイト240−1は、動画コンテンツを提供するサイトである。ブログサイト240−2は、テキストコンテンツを提供するサイトである。
次に、本実施形態のメタデータ抽出サーバの動作について図3を参照して説明する。図3は、本実施形態のメタデータ抽出サーバ101による、メディアストリームからメタデータを抽出する際の手順を示したシーケンス図である。
メディアストリーム取得部208は、まず、送信設定部230に送信設定を行った後(ステップS1)、メディアストリーム送信端末210から送信されたメディアストリームを受信し、特徴量算出部204に入力する(ステップS2)。特徴量算出部204は、入力されたメディアストリームをメタデータ埋め込み部232に入力する(ステップS3)。また、特徴量算出部204は、入力されたメディアストリームから特徴量ベクトルを算出し、算出した特徴量ベクトルを、相関係数適用部207に入力する(ステップS4)。
ここで、上記メディアストリームとは、RTP(Real-time Transport Protocol)、RTSP(Real Time Streaming Protocol)、RTMP(Real Time Message Protocol)などのメディア対応プロトコルで通信されるデータのことを指すものとする。また、算出される特徴量ベクトルは、事前にメタデータ抽出サーバ101内で決められたものを利用するものとする。この際、特徴量DB201は、算出された特徴量ベクトルを、一定の時間間隔で蓄積する(ステップS5)。
相関係数適用部207は、相関係数DB205から、部分空間IDと対応するメタデータ変換子R、および相関係数Wを取得する(ステップS6、S7)。また、相関係数適用部207は、特徴量算出部204が算出した特徴量ベクトルがどの部分空間に入るかを特定する。相関係数DB205が記憶しているメタデータ変換子Rと相関係数Wについては後述する。
続いて、相関係数適用部207は、特徴量算出部204が算出した特徴量ベクトルがどの部分空間に入るかを特定した後、特定した部分空間に対応する相関係数Wを、この特徴量ベクトルに適用してメタデータベクトルを算出する。続いて、相関係数適用部207は、算出したメタデータベクトルから適切な語として判定される集合を選別して、1つのメタデータを生成し、生成したメタデータを送信設定部230に入力する(ステップS8)。相関係数適用部207が生成するメタデータは、先述したとおりMPEG−7などで規定されているXML形式のデータである。
送信設定部230は、パケットヘッダを作成して、メタデータ自体を送信するか、元のメディアストリームに埋め込んで送信するかを判定する。送信設定部230は、先述したとおり、出力結果の形態と、送信先の形態とをそれぞれ2通りの形態から選択する。例えば、出力結果の形態は、メタデータをメディアストリームに埋め込んで出力する形態、または、メタデータを単独で出力する形態の2通りの形態から1つの形態を選択する。また、送信先の形態は、メディアストリームを送信したユーザ端末に、メタデータを埋め込んだメディアストリームまたはメタデータを送信する形態、または、メディアストリームを送信したユーザ端末とは別のユーザ端末に、メタデータを埋め込んだメディアストリームまたはメタデータを送信する形態の2通りの形態から1つの形態を選択する。
送信設定部230が、メタデータをメディアストリームに埋め込んで出力する形態を選択した場合、送信設定部230は、メタデータをメディアストリーム埋め込み部232に入力する(ステップS9)。メディアストリーム埋め込み部232は、ステップS3でメディアストリーム取得部208から入力されたメディアストリームに、ステップS9で送信選択部230から入力されたメタデータを埋め込み、メディアストリーム送出部233に入力する(ステップS10)。
続いて、メディアストリーム送出部233は、送信設定部230が選択した送信先(メディアストリーム受信端末250)に送信する(ステップS11)。なお、メディアストリーム埋め込み部232は、メディアストリームのRTPの動的ペイロードタイプに利用されていない番号を設定し、対応するペイロードにメタデータを挿入する。
一方、送信設定部230が、メタデータを単独で出力する形態を選択した場合、送信設定部230は、メタデータをメタデータ送出部231に入力する(ステップS12)。メタデータ送出部231は、入力されたメタデータにパケットヘッダを付し、送信設定部230が設定した送信先(メタデータ受信端末251)に送信する(ステップS13)。
次に、先述した、相関係数DB205が記憶しているメタデータ変換子Rと相関係数Wとの取得方法について図4を参照して説明する。図4は、メタデータ変換子Rと相関係数Wとの取得手順を示したシーケンス図である。
教師情報収集部234は、Webサイト240にアクセスし、任意のコンテンツを取得する(ステップS21)。教師情報取得部234は、取得したコンテンツをメディアデータとして特徴量算出部204に入力する(ステップS22)。特徴量算出部204は、入力されたメディアデータから特徴量ベクトルを算出し、算出した特徴量ベクトルを特徴量DB201に入力する(ステップS23)。特徴量ベクトルは、入力されたメディアデータの特徴量を、ある時間Δtで平均化し、(1)式を用いて算出される。ここで、kは、量子化番号であり、mは、特徴量次元数である。
Figure 0005072880
なお、特徴量算出部204は、入力されたメディアデータの特徴量の変化に基づいて、メディアデータのシーンの区切れ目を検出する。また、特徴量算出部204は、特徴量ベクトルをメディアデータのフレーム毎に算出し、算出した特徴量ベクトルを特徴量DB201に入力する。
特徴量DB201は、入力された特徴量ベクトルが、過去のクラスタに分類可能な特徴量を持つ場合には、入力された特徴量ベクトルを記憶する。また、特徴量DB201は、入力された特徴量ベクトルが、過去のクラスタに分類可能な特徴量を持っていない場合には、入力された特徴量ベクトルを破棄する。また、特徴量DB201は、入力された特徴量ベクトルを保存したか破棄したかを示す情報を、教師情報収集部234に入力する(ステップS24)。
また、特徴量DB201は、一定の時間間隔で、自身が記憶している特徴量ベクトルのクラスタリングを行う。特徴量DB201は、クラスタリングをX−means法などの教師なし学習による分類法によって行う。また、特徴量DB201は、クラスタリングによって得た部分空間をkd木などの木構造により整理し、各部分空間には部分空間IDを振る。また、特徴量DB201は、クラスタリングによって得た部分空間の特徴量ベクトルの集合を[v,・・・,vn−1]とし、この特徴量ベクトルの集合に対して主成分分析などを行って次元数を削減し、[v’,・・・,v’n−1]を作成する。
教師情報収集部234は、特徴量DB201が特徴量ベクトルを保存したか破棄したかを示す情報に基づいて、特徴量DB201が特徴量ベクトルを保存した場合のみ、メディアデータのテキストデータをメタデータ整理部203に入力する(ステップS25)。メタデータ整理部203は、テキストデータの形態素解析を行い、形態素解析された語から、特徴量ベクトルの平均化に用いる時間幅Δt内での語の発生頻度を表すメタデータベクトルyiを(2)式に従って算出する。また、メタデータ整理部203は、算出したメタデータベクトルをメタデータDB202に入力する(ステップS26)。
Figure 0005072880
ここで、iは、語の種類数である。語の発生頻度の値は、発生時間における回数を1倍として、そこからガウス分布に広がるものとする。また、分布は、前述のシーンの区切れ目で、それ以上は拡散しないものとする。
また、メタデータDB202は、メタデータベクトルの集合を[y,・・・,yn−1]とし、このメタデータベクトルの集合における主成分分析を行って次元数を削減し、[y’,・・・,y’n−1]を作成する。
相関係数算出部214は、特徴量DB201とメタデータDB202とから、部分空間IDと、特徴量ベクトルの集合と、メタデータベクトルの集合とを読み出す(ステップS27〜ステップS30)。また、相関係数算出部214は、特徴量ベクトルの集合と、メタデータベクトルの集合とから、変換行列R(メタデータ変換子R)を算出する。また、相関係数算出部214は、平均特徴量ベクトルv’を入力、メタデータベクトルy’を出力としたモデルで、(3)式を用いてロジスティック回帰分析などの教師あり学習を行う。但し、ロジスティック回帰の場合は、f(x)=a/(1−exp(−x))とし、aは、メタデータベクトルの要素の最大値とする。
Figure 0005072880
相関係数算出部214は、回帰係数の行列を相関係数Wとして算出する。続いて、相関係数算出部214は、メタデータ変換子Rと、相関係数Wと、部分空間IDとを相関係数DB205に入力する。
相関係数DB205は、入力されたメタデータ変換子Rと、相関係数Wと、部分空間IDとを関連付けて記憶する。
(第2の実施形態)
次に、本発明の第2の実施形態について説明する。第2の実施形態は、第1の実施形態で説明したメタデータ抽出サーバ101を、検索サービスに応用した例である。図5は、メタデータ抽出サーバ101を検索サービスに応用した際の構成および動作を示した概念図である。
ユーザは、様々な場所においてユーザ端末102−3を用いて撮影した映像ストリームを、メタデータ抽出サーバ101に送信する(ステップS41)。メタデータ抽出サーバ101は、受信した映像ストリームからリアルタイムにメタデータを抽出し、抽出したメタデータを受信した映像ストリームに埋め込んだデータをデータストリームとして、ユーザ端末102−3に送信する(ステップS42)。さらに、メタデータ抽出サーバ101は、抽出したメタデータを検索DB260に送信する。検索DBは、送信されたメタデータに基づいて情報を検索し、検索結果をメタデータ抽出サーバに送信する。メタデータ抽出サーバ101は、受信した検索結果を、ユーザ端末102−3に送信する(ステップS43)。
これにより、ユーザは、携帯電話などのカメラを備えたユーザ端末102−3で周囲を撮影するだけで、撮影した映像に関係するWeb上のキーワードを取得し、検索することができる。これにより、検索入力数が削減できるだけでなく、明確な検索キーワードが思いつかない場合でも、検索キーワードをユーザに推薦することが可能となる。
(第3の実施形態)
次に、本発明の第3の実施形態について説明する。図6は、本発明のメタデータ抽出サーバを、ブリッジと連携させてメタデータ抽出ブリッジとして構成した場合の構成および動作を示した概念図である。なお、第3の実施形態におけるメタデータ抽出サーバ101は、第1の実施形態で説明したメタデータ抽出サーバ101と同じ構成である。
ここでは、メタデータ抽出サーバ101のストリーム返信先を、ストリーム送信元アドレスに設定しておき、返信ストリームは、メタデータ埋め込みメディアストリームに設定する。また、ブリッジとして、コントロールブリッジ(Control bridge:非特許文献1を参照)を用いるものとし、ネットワーク100上にこのコントロールブリッジ270を1つまたは多数配備するものとする。なお、図示する例では、コントロールブリッジを1つのみ配備した例を示している。
また、街頭などに設置されたライブカメラ280による映像や、ユーザ端末102−4に備えられたテレビ電話機能などからの映像は、ネットワーク100を介して、終端のユーザ端末102−5に送信されているものとする。
コントロールブリッジ270は、フォーワーディング(Fowarding)機能を利用して、特定のメディアストリームを捕捉し、メディアストリームを構成するパケットヘッダを書き換えて、メタデータ抽出サーバ101に該メディアストリームを転送する(ステップS51)。この場合、特定のメディアストリームとしては、街頭などに設置されたライブカメラ280や、ユーザ端末102−4に備えられたテレビ電話機能などからの映像を想定している。つまり、終端のユーザ端末102−5は、上記ライブカメラ280の映像の閲覧や、ユーザ端末102−4と通信(テレビ電話による通話)を行っている。
次に、メディアストリームを受信したメタデータ抽出サーバ101は、メディアストリームにメタデータを埋め込み(ステップS52)、該メタデータ埋め込みメディアストリームをコントロールブリッジ270に返信する(ステップS53)。最後に、コントロールブリッジ270は、返信されたストリームのパケットヘッダを元のものに戻し、再度、ネットワーク100上に流す(ステップS54)。これにより、終端のユーザ端末102−5では、複雑な処理を行わなくても、ネットワーク100で通信をしている間に、メディアストリームに自動的にメタデータが付与されるので、処理性能が低い携帯端末などから発信されたストリームであっても、メディアストリームに適合するキーワードを提供することができる。
また、メタデータ抽出サーバ101から、監視者のユーザ端末102−6に予めメタデータのペイロードタイプを通知しておくことで(ステップS55)、ユーザ端末102−6から、監視キーワードをプロキシ/PBX290に送信し(ステップS56)、メタデータ埋め込みメディアストリームから該当する検知情報を取得することで(ステップS57)、ネットワーク100上でストリームを監視することが可能となる。
(第4の実施形態)
次に、本発明の第4の実施形態について説明する。図7は、本発明のメタデータ抽出サーバ101を、ネットワークによるストリームバックアップサービスに用いた場合の構成および動作を示した概念図である。なお、第4の実施形態におけるメタデータ抽出サーバ101は、第1の実施形態において説明したメタデータ抽出サーバと同じ構成を有している。
まず、ネットワーク100上に前述したコントロールブリッジ270を配備する。このコントロールブリッジ270は、ミラーリング(Mirroring)機能を用いて、ライブカメラ280や、ユーザ端末102−4に備えられたテレビ電話機能からのメディアストリームを捕捉し、複製してメタデータ抽出サーバ101と、メディアDB300とに送信する(ステップS61、S62)。その後、メタデータ抽出サーバ101は、抽出したメタデータをメディアDB300に送信する(ステップS63)。メディアDB300は、対応するメディアデータと対にして蓄積する。
メディアDB300は、一定時間で、このメディアデータとメタデータとを廃棄するものとする。また、メディアDB300は、キーワードでメタデータを検索できるようになっており、対応するメディアの時間範囲が分かるものとする。これにより、ユーザ端末102−7は、メディアDB300に対して検索キーワードを送信することで(ステップS64)、記録容量が小さい端末同士の通信の記録や、端末で記録し忘れた過去のメディアストリームの検索が可能となり(ステップS65)、利便性を向上させることが可能となる。
上述した実施形態よれば、部分空間毎に認識器を作成して認識することにより、より精度を向上させることが可能となる。また、部分空間に区切ることにより、特徴量の本質的次元が小さくなるだけでなく、収集されるコメントの種類も自ずと限定されるため、出力されるメタデータの種類も限定され、相関係数の次元数も小さくなり、メディアストリームからのメタデータ抽出時にかかる計算量も削減することができる。また、メディアストリームに何らかの情報を付随させる必要が無くなるため、ネットワーク側の機器で認識するような別の付随情報を期待できない場合であっても可能となる。
なお、上述のメタデータ抽出サーバ101の動作の過程は、コンピュータに実行させるためのプログラムや、このプログラムとしてコンピュータ読み取り可能な記録媒体として利用可能であり、コンピュータシステムが読み出して実行することによって、上記処理が行われる。なお、ここでいう「コンピュータシステム」とは、CPU及び各種メモリやOS、周辺機器等のハードウェアを含むものである。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に記憶したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。
さらに、前述した機能をコンピュータシステムに既に記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
100・・・ネットワーク、101・・・メタデータ抽出サーバ、102−1〜102−7・・・ユーザ端末、201・・・特徴量DB、202・・・メタデータDB、203・・・メタデータ整理部、204・・・特徴量算出部、205・・・相関係数DB、207・・・相関係数適用部、208・・・メディアストリーム取得部、210・・・メディアストリーム送信端末、214・・・相関係数算出部、230・・・送信設定部、231・・・メタデータ送出部、232・・・メタデータ埋め込み部、233・・・メディアストリーム送出部、234・・・教師情報収集部、240・・・Webサーバ、240−1・・・動画投稿サイト、240−2・・・ブログサイト、250・・・メディアストリーム受信端末、251・・・メタデータ受信端末、260・・・検索DB、270・・・コントロールブリッジ、280・・・ライブカメラ、290・・・プロシキ/PBX、300・・・メディアDB

Claims (6)

  1. メディアデータに基づき、メディアデータの内容を認識するためメタデータを抽出するメタデータ抽出サーバにおいて、
    ネットワーク上のサイトからコンテンツを収集する教師情報収集部と、
    前記教師情報収集部により収集されたコンテンツの内容を表す特徴量行列を算出する特徴量算出部と、
    前記特徴量算出部により算出された特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出部により算出された特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する特徴量保存部と、
    前記教師情報収集部により収集されたコンテンツに対して形態素解析を行い、形態素解析された語の発生頻度を表すメタデータ行列を生成するメタデータ整理部と、
    前記特徴量保存部により決定された部分空間毎に、前記特徴量行列の集合と前記メタデータ整理部により生成されたメタデータ行列の集合との相関係数を算出する相関係数算出部と、
    前記部分空間毎に前記相関係数算出部により算出された相関係数を記憶する相関係数記憶部と
    を有することを特徴とするメタデータ抽出サーバ。
  2. ネットワーク上で送受信されるメディアストリームを取得するメディアストリーム取得部を更に有し、
    前記特徴量算出部は、
    前記メディアストリーム取得部により取得されたメディアストリームの内容を表す特徴量行列を算出し、
    前記特徴量保存部は、
    前記教師情報収集部により収集されたコンテンツの内容を表す特徴量行列に加えて、前記メディアストリーム取得部により取得されたメディアストリームの内容を表す特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出部により算出された、前記メディアストリームの内容を表す特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する、
    ことを特徴とする請求項1記載のメタデータ抽出サーバ。
  3. 前記特徴量保存部により決定された部分空間に基づいて、前記メディアストリームの内容を表す特徴量行列が含まれる部分空間を特定し、前記相関係数算出部により算出された、前記特定された部分空間に対応する相関係数を適用して前記特徴量ベクトルのメタデータベクトルを算出し、該メタデータベクトルから適切な語として判定される集合を1つのメタデータとして選別する相関適用部と、
    前記相関適用部により選別された前記メタデータを、該メタデータ自体を送信するか、前記メディアストリームに埋め込んで送信するかを判定する送信設定部と、
    前記送信判定部により前記メタデータ自体を送信すると判定された場合に、前記メタデータを指定宛先のメタデータ受信端末に送信するメタデータ送出部と、
    前記送信判定部により前記メタデータを前記メディアストリームに埋め込んで送信すると判定された場合に、前記メディアストリームに前記メタデータを埋め込むメタデータ埋め込み部と、
    前記メタデータ埋め込み部により前記メタデータが埋め込まれたメディアストリームを指定宛先のメディアストリーム受信端末に送信するメディアストリーム送出部と
    を有することを特徴とする請求項2記載のメタデータ抽出サーバ。
  4. 前記送信設定部は、
    前記指定宛先として、前記メディアストリームの送信元、または前記送信元とは別の送信先のいずれかを選択的に決定する、
    ことを特徴とする請求項3記載のメタデータ抽出サーバ。
  5. メディアデータに基づき、メディアデータの内容を認識するためメタデータを抽出するメタデータ抽出サーバにおけるメタデータ抽出方法において、
    教師情報収集部が、ネットワーク上のサイトからコンテンツを収集する教師情報収集ステップと、
    特徴量算出部が、前記教師情報収集ステップで収集されたコンテンツの内容を表す特徴量行列を算出する特徴量算出ステップと、
    特徴量保存部が、前記特徴量算出ステップで算出された特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出ステップで算出された特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する特徴量保存ステップと、
    メタデータ整理部が、前記教師情報収集ステップで収集されたコンテンツに対して形態素解析を行い、形態素解析された語の発生頻度を表すメタデータ行列を生成するメタデータ整理ステップと、
    相関係数算出部が、前記特徴量保存ステップで決定された部分空間毎に、前記特徴量行列の集合と前記メタデータ整理ステップで生成されたメタデータ行列の集合との相関係数を算出する相関係数算出ステップと、
    相関係数記憶部が、前記部分空間毎に前記相関係数算出ステップで算出された相関係数を記憶する相関係数記憶ステップと、
    を含むことを特徴とするメタデータ抽出方法。
  6. メディアデータに基づき、メディアデータの内容を認識するためメタデータを抽出するメタデータ抽出サーバとして動作するコンピュータを、
    ネットワーク上のサイトからコンテンツを収集する教師情報収集手段と、
    前記教師情報収集手段により収集されたコンテンツの内容を表す特徴量行列を算出する特徴量算出手段と、
    前記特徴量算出手段により算出された特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出手段により算出された特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する特徴量保存手段と、
    前記教師情報収集手段により収集されたコンテンツに対して形態素解析を行い、形態素解析された語の発生頻度を表すメタデータ行列を生成するメタデータ整理手段と、
    前記特徴量保存手段により決定された部分空間毎に、前記特徴量行列の集合と前記メタデータ整理手段により生成されたメタデータ行列の集合との相関係数を算出する相関係数算出手段と、
    前記部分空間毎に前記相関係数算出手段により算出された相関係数を記憶する相関係数記憶手段
    として動作させるためのプログラム。
JP2009039529A 2009-02-23 2009-02-23 メタデータ抽出サーバ、メタデータ抽出方法およびプログラム Expired - Fee Related JP5072880B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009039529A JP5072880B2 (ja) 2009-02-23 2009-02-23 メタデータ抽出サーバ、メタデータ抽出方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009039529A JP5072880B2 (ja) 2009-02-23 2009-02-23 メタデータ抽出サーバ、メタデータ抽出方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2010198111A JP2010198111A (ja) 2010-09-09
JP5072880B2 true JP5072880B2 (ja) 2012-11-14

Family

ID=42822809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009039529A Expired - Fee Related JP5072880B2 (ja) 2009-02-23 2009-02-23 メタデータ抽出サーバ、メタデータ抽出方法およびプログラム

Country Status (1)

Country Link
JP (1) JP5072880B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3779698A1 (en) 2013-05-16 2021-02-17 Convida Wireless, LLC Data annotation as a service for iot systems
CN105045914B (zh) * 2015-08-18 2018-10-09 瑞达昇科技(大连)有限公司 信息归纳分析方法及装置
WO2018207734A1 (ja) * 2017-05-11 2018-11-15 学校法人国際大学 情報処理装置、相関モデルのデータ構造、プログラム、情報処理方法および相関モデルのデータ構造の製造方法
KR102502498B1 (ko) * 2020-11-25 2023-02-23 주식회사 와이즈넛 데이터 메타 정보 기반 능동적 데이터 수집 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3848749B2 (ja) * 1997-08-13 2006-11-22 松下電器産業株式会社 画像検索装置
JP2008217701A (ja) * 2007-03-07 2008-09-18 Sharp Corp メタデータ付与装置,メタデータ付与方法,メタデータ付与プログラム,及びメタデータ付与プログラムを記録した記録媒体

Also Published As

Publication number Publication date
JP2010198111A (ja) 2010-09-09

Similar Documents

Publication Publication Date Title
US20180007121A1 (en) Performance-based content delivery
US10027739B1 (en) Performance-based content delivery
CN101409706B (zh) 一种边缘网络中的数据分发方法、数据分发系统及相关设备
US20130080868A1 (en) System and method thereof for dynamically associating a link to an information resource with a multimedia content displayed in a web-page
US10380267B2 (en) System and method for tagging multimedia content elements
CN110719332B (zh) 数据传输方法、装置、系统、计算机设备和存储介质
US20160210367A1 (en) Transition event detection
CN110659560A (zh) 一种关联对象的识别方法及系统
CN112559813B (zh) 基于指令关联推送的物联网网关数据处理方法及装置
US10902049B2 (en) System and method for assigning multimedia content elements to users
JP5072880B2 (ja) メタデータ抽出サーバ、メタデータ抽出方法およびプログラム
US20180159902A1 (en) Access to data on a remote device
CN106789413B (zh) 一种检测代理上网的方法和装置
US11743150B2 (en) Automated root cause analysis of underperforming video streams by using language transformers on support ticket systems
CN112699273A (zh) 基于多模态分析预测潜在突发事件数据结构
CN105447148B (zh) 一种Cookie标识关联方法及装置
CN111259839A (zh) 目标对象行为监测方法、装置、设备、系统及存储介质
CN113473166A (zh) 一种数据存储系统及方法
CN110245314A (zh) 一种网页指纹生成方法
CN108287859B (zh) 一种多媒体信息检索方法及装置
EP3789890A1 (en) Fully qualified domain name (fqdn) determination
US10164819B2 (en) Correlating web traffic events to a web page session
CN114598622B (zh) 数据监控方法及装置、存储介质、计算机设备
CN112866745B (zh) 流媒体视频数据处理方法、装置、计算机设备和存储介质
CN106130764B (zh) 一种监控视频直播间数据服务是否可用的方法及系统

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100526

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120802

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120814

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120821

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150831

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees