JP2010198111A - Metadata extraction server, metadata extraction method and program - Google Patents
Metadata extraction server, metadata extraction method and program Download PDFInfo
- Publication number
- JP2010198111A JP2010198111A JP2009039529A JP2009039529A JP2010198111A JP 2010198111 A JP2010198111 A JP 2010198111A JP 2009039529 A JP2009039529 A JP 2009039529A JP 2009039529 A JP2009039529 A JP 2009039529A JP 2010198111 A JP2010198111 A JP 2010198111A
- Authority
- JP
- Japan
- Prior art keywords
- metadata
- unit
- feature amount
- correlation coefficient
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、主に、映像や音楽などで構成されるメディアコンテンツの内容を認識し、多様な情報を含むメディアデータから、メディアデータ同士を関連付けるメタデータを抽出するメタデータ抽出サーバ、メタデータ抽出方法およびプログラムに関する。 The present invention mainly recognizes the contents of media content composed of video, music, etc., and extracts metadata for associating media data with each other from media data including various information, and metadata extraction It relates to a method and a program.
Web上におけるメディアデータへの情報付与技術としては、Web上の動画閲覧サーバを介して複数のユーザから動画に付与された様々なアノテーションに対し、該ユーザらから良否の判定を統計的に収集しこれに構文的な整合性及び映像特徴量を加味することで、適切なアノテーションを選別して表示する技術が知られている(例えば、非特許文献1参照)。 As a technology for adding information to media data on the Web, it is possible to statistically collect pass / fail judgments from various users for various annotations given to videos from a plurality of users via a video browsing server on the Web. A technique for selecting and displaying an appropriate annotation by adding syntactic consistency and video feature amount to this is known (for example, see Non-Patent Document 1).
また、ネットワーク上のメディアデータから情報を抽出する技術としては、ネットワーク上の特殊ブリッジを操作し、所望の処理をグラフ状に組み合わせることで、ネットワーク上に散在する処理サーバに、任意のストリームを迂回経由させて、様々な処理を適用することが可能な複数のストリームを処理する技術が知られている(例えば、非特許文献2参照)。 In addition, as a technique for extracting information from media data on the network, a special bridge on the network is operated and desired processing is combined in a graph to bypass any stream to processing servers scattered on the network. A technique for processing a plurality of streams to which various processes can be applied via a route is known (for example, see Non-Patent Document 2).
しかし、非特許文献1に記載の統計的アノテーション方法では、同閲覧システム内だけを対象とし、かつ信頼性の高いアノテーションを選別することが主目的であり、動画認識部分は確定していないため、そのままでは他の何らかのシステムに対し認識機能を提供することはできなかった。 However, in the statistical annotation method described in Non-Patent Document 1, the main purpose is to select highly reliable annotations that are only targeted within the browsing system, and the video recognition portion has not been determined. As it is, the recognition function could not be provided to some other system.
また、非特許文献2に記載の技術では、実際のメディア認識サーバは様々な用途に特化しており、用途が不明なメディアストリームだけが転送されて来ることを想定する場合にはメディアデータの内容に応じて認識器を振り分ける必要があるが、事前に内容(コンテクスト)が把握できないため、適切な認識器を選択することができないという問題があった。 In the technique described in Non-Patent Document 2, the actual media recognition server is specialized for various uses. When it is assumed that only media streams whose use is unknown are transferred, the contents of the media data However, there is a problem that an appropriate recognizer cannot be selected because the contents (context) cannot be grasped in advance.
本発明は、このような事情を考慮してなされたものであり、その目的は、Web上に存在する情報から適切な認識器を自動的に生成、及び更新することができ、また、メディアストリーム自体から適切な認識器を選択することができるメタデータ抽出サーバ、メタデータ抽出方法およびプログラムを提供することにある。 The present invention has been made in view of such circumstances, and an object of the present invention is to automatically generate and update an appropriate recognizer from information existing on the Web. An object is to provide a metadata extraction server, a metadata extraction method, and a program capable of selecting an appropriate recognizer from itself.
上記問題を解決するために、本発明は、メディアデータに基づき、メディアデータの内容(コンテクスト)を認識するためメタデータを抽出するメタデータ抽出サーバにおいて、ネットワーク上のサイトからコンテンツを収集する教師情報収集部と、前記教師情報収集部により収集されたコンテンツの内容を表す特徴量行列を算出する特徴量算出部と、前記特徴量算出部により算出された特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出部により算出された特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する特徴量保存部と、前記教師情報収集部により収集されたコンテンツに対して形態素解析を行い、形態素解析された語の発生頻度を表すメタデータ行列を生成するメタデータ整理部と、前記特徴量保存部により決定された部分空間毎に、前記特徴量行列の集合と前記メタデータ整理部により生成されたメタデータ行列の集合との相関係数を算出する相関係数算出部と、前記部分空間毎に前記相関係数算出部により算出された相関係数を記憶する相関係数記憶部とを有することを特徴とするメタデータ抽出サーバである。 In order to solve the above problem, the present invention provides teacher information for collecting content from a site on a network in a metadata extraction server that extracts metadata to recognize the content (context) of media data based on media data. A collection unit; a feature amount calculation unit that calculates a feature amount matrix representing the content of the content collected by the teacher information collection unit; and a feature amount matrix calculated by the feature amount calculation unit is stored at regular time intervals. In this case, clustering is performed on a set of feature amount matrices calculated by the feature amount calculation unit, and a feature amount storage unit that determines a partial space for each set of feature amount matrices, and content collected by the teacher information collection unit A metadata organizing unit that performs a morphological analysis on the image and generates a metadata matrix that represents the frequency of occurrence of the morphologically analyzed word; A correlation coefficient calculating unit that calculates a correlation coefficient between the set of feature matrixes and the set of metadata matrices generated by the metadata organizing unit for each partial space determined by the collection amount storing unit; A metadata extraction server comprising a correlation coefficient storage unit that stores a correlation coefficient calculated by the correlation coefficient calculation unit for each partial space.
また、本発明は、ネットワーク上で送受信されるメディアストリームを取得するメディアストリーム取得部を更に有し、前記特徴量算出部は、前記メディアストリーム取得部により取得されたメディアストリームの内容を表す特徴量行列を算出し、前記特徴量保存部は、前記教師情報収集部により収集されたコンテンツの内容を表す特徴量行列に加えて、前記メディアストリーム取得部により取得されたメディアストリームの内容を表す特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出部により算出された、前記メディアストリームの内容を表す特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する、ことを特徴とするメタデータ抽出サーバである。 The present invention further includes a media stream acquisition unit that acquires a media stream transmitted and received on a network, and the feature amount calculation unit represents a feature amount that represents the content of the media stream acquired by the media stream acquisition unit. The feature amount storage unit calculates a matrix, and in addition to the feature amount matrix representing the content content collected by the teacher information collection unit, the feature amount representing the content of the media stream acquired by the media stream acquisition unit When storing a matrix at regular time intervals, clustering is performed on a set of feature matrices representing the contents of the media stream calculated by the feature calculator, and a subspace is determined for each set of feature matrices. This is a metadata extraction server characterized by that.
また、本発明は、前記特徴量保存部により決定された部分空間に基づいて、前記メディアストリームの内容を表す特徴量行列が含まれる部分空間を特定し、前記相関係数算出部により算出された、前記特定された部分空間に対応する相関係数を適用して前記特徴量ベクトルのメタデータベクトルを算出し、該メタデータベクトルから適切な語として判定される集合を1つのメタデータとして選別する相関適用部と、前記相関適用部により選別された前記メタデータを、該メタデータ自体を送信するか、前記メディアストリームに埋め込んで送信するかを判定する送信設定部と、前記送信判定部により前記メタデータ自体を送信すると判定された場合に、前記メタデータを指定宛先のメタデータ受信端末に送信するメタデータ送出部と、前記送信判定部により前記メタデータを前記メディアストリームに埋め込んで送信すると判定された場合に、前記メディアストリームに前記メタデータを埋め込むメタデータ埋め込み部と、前記メタデータ埋め込み部により前記メタデータが埋め込まれたメディアストリームを指定宛先のメディアストリーム受信端末に送信するメディアストリーム送出部とを有することを特徴とするメタデータ抽出サーバである。 Further, the present invention specifies a subspace including a feature amount matrix representing the content of the media stream based on the subspace determined by the feature amount storage unit, and is calculated by the correlation coefficient calculation unit Applying a correlation coefficient corresponding to the specified subspace to calculate a metadata vector of the feature vector, and selecting a set determined as an appropriate word from the metadata vector as one metadata A correlation setting unit; a transmission setting unit that determines whether the metadata selected by the correlation applying unit is transmitted as the metadata itself or embedded in the media stream; and When it is determined that the metadata itself is to be transmitted, a metadata transmission unit that transmits the metadata to a metadata receiving terminal that is a specified destination; A metadata embedding unit that embeds the metadata in the media stream, and a medium in which the metadata is embedded by the metadata embedding unit when it is determined by the determination unit to embed the metadata in the media stream for transmission; A metadata extraction server comprising: a media stream sending unit that sends a stream to a media stream receiving terminal that is a designated destination.
また、本発明は、前記送信設定部は、前記指定宛先として、前記メディアストリームの送信元、または前記送信元とは別の送信先のいずれかを選択的に決定する、ことを特徴とするメタデータ抽出サーバである。 The transmission setting unit may selectively determine, as the designated destination, either a transmission source of the media stream or a transmission destination different from the transmission source. It is a data extraction server.
また、本発明は、メディアデータに基づき、メディアデータの内容(コンテクスト)を認識するためメタデータを抽出するメタデータ抽出サーバにおけるメタデータ抽出方法において、教師情報収集部が、ネットワーク上のサイトからコンテンツを収集する教師情報収集ステップと、特徴量算出部が、前記教師情報収集ステップで収集されたコンテンツの内容を表す特徴量行列を算出する特徴量算出ステップと、特徴量保存部が、前記特徴量算出ステップで算出された特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出ステップで算出された特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する特徴量保存ステップと、メタデータ整理部が、前記教師情報収集ステップで収集されたコンテンツに対して形態素解析を行い、形態素解析された語の発生頻度を表すメタデータ行列を生成するメタデータ整理ステップと、相関係数算出部が、前記特徴量保存ステップで決定された部分空間毎に、前記特徴量行列の集合と前記メタデータ整理ステップで生成されたメタデータ行列の集合との相関係数を算出する相関係数算出ステップと、相関係数記憶部が、前記部分空間毎に前記相関係数算出ステップで算出された相関係数を記憶する相関係数記憶ステップと、を含むことを特徴とするメタデータ抽出方法である。 Further, the present invention provides a metadata extraction method in a metadata extraction server that extracts metadata for recognizing the content (context) of media data based on the media data. A teacher information collection step for collecting the feature amount, a feature amount calculation unit for calculating a feature amount matrix representing the contents of the content collected in the teacher information collection step, and a feature amount storage unit for the feature amount When storing the feature quantity matrix calculated in the calculation step at regular time intervals, clustering is performed on the feature quantity matrix set calculated in the feature quantity calculation step, and a subspace is determined for each feature quantity matrix set. A feature amount storing step and a metadata organizing unit for the content collected in the teacher information collecting step. A metadata organizing step that performs morphological analysis and generates a metadata matrix that represents the frequency of occurrence of words subjected to morphological analysis, and a correlation coefficient calculation unit, for each subspace determined in the feature amount storing step, A correlation coefficient calculating step for calculating a correlation coefficient between the set of quantity matrices and the set of metadata matrices generated in the metadata organizing step; and a correlation coefficient storage unit for each of the subspaces, the correlation coefficient And a correlation coefficient storage step for storing the correlation coefficient calculated in the calculation step.
また、本発明は、メディアデータに基づき、メディアデータの内容(コンテクスト)を認識するためメタデータを抽出するメタデータ抽出サーバとして動作するコンピュータを、ネットワーク上のサイトからコンテンツを収集する教師情報収集手段と、前記教師情報収集手段により収集されたコンテンツの内容を表す特徴量行列を算出する特徴量算出手段と、前記特徴量算出手段により算出された特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出手段により算出された特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する特徴量保存手段と、前記教師情報収集手段により収集されたコンテンツに対して形態素解析を行い、形態素解析された語の発生頻度を表すメタデータ行列を生成するメタデータ整理手段と、前記特徴量保存手段により決定された部分空間毎に、前記特徴量行列の集合と前記メタデータ整理手段により生成されたメタデータ行列の集合との相関係数を算出する相関係数算出手段と、前記部分空間毎に前記相関係数算出手段により算出された相関係数を記憶する相関係数記憶手段として動作させるためのプログラムである。 Further, the present invention provides a teacher information collecting means for collecting content from a site on a network using a computer operating as a metadata extraction server for extracting metadata for recognizing the content (context) of the media data based on the media data. And a feature amount calculating means for calculating a feature amount matrix representing the contents collected by the teacher information collecting means, and a feature amount matrix calculated by the feature amount calculating means when storing the feature amount matrix at a constant time interval. Clustering with a set of feature quantity matrices calculated by the feature quantity calculation means, and a feature quantity storage means for determining a subspace for each set of feature quantity matrices; and for contents collected by the teacher information collection means To generate a metadata matrix that represents the frequency of occurrence of words that have undergone morphological analysis And a correlation coefficient for calculating a correlation coefficient between the feature matrix set and the metadata matrix set generated by the metadata organizing unit for each partial space determined by the processing unit and the feature storage unit A program for operating as a calculation means and a correlation coefficient storage means for storing the correlation coefficient calculated by the correlation coefficient calculation means for each partial space.
この発明によれば、メタデータ抽出サーバは、ネットワーク上のサイトからコンテンツを収集する教師情報収集部と、前記教師情報収集部により収集されたコンテンツの内容を表す特徴量行列を算出する特徴量算出部と、前記特徴量算出部により算出された特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出部により算出された特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する特徴量保存部と、前記教師情報収集部により収集されたコンテンツに対して形態素解析を行い、形態素解析された語の発生頻度を表すメタデータ行列を生成するメタデータ整理部と、前記特徴量保存部により決定された部分空間毎に、前記特徴量行列の集合と前記メタデータ整理部により生成されたメタデータ行列の集合との相関係数を算出する相関係数算出部と、前記部分空間毎に前記相関係数算出部により算出された相関係数を記憶する相関係数記憶部とを有する。この構成により、Web上に存在する情報から適切な認識器を自動的に生成、および更新することができる。 According to the present invention, the metadata extraction server includes a teacher information collection unit that collects content from a site on the network, and a feature amount calculation that calculates a feature amount matrix representing the content of the content collected by the teacher information collection unit. And the feature amount matrix calculated by the feature amount calculation unit when the feature amount matrix calculated by the feature amount calculation unit is stored at a predetermined time interval, and the feature amount matrix set is clustered. A metadata storage unit that performs a morpheme analysis on the content collected by the feature information storage unit and the teacher information collection unit that determines a partial space for each time, and generates a metadata matrix that represents the frequency of occurrence of words subjected to the morpheme analysis And a set of feature matrixes and a metadata matrix generated by the metadata organizing unit for each partial space determined by the feature storage unit It has a correlation coefficient calculation unit for calculating a correlation coefficient between case and a correlation coefficient storage unit for storing a correlation coefficient calculated by the correlation coefficient calculation unit for each of the subspace. With this configuration, an appropriate recognizer can be automatically generated and updated from information existing on the Web.
また、この発明によれば、ネットワーク上で送受信されるメディアストリームを取得するメディアストリーム取得部を更に有し、前記特徴量算出部は、前記メディアストリーム取得部により取得されたメディアストリームの内容を表す特徴量行列を算出し、前記特徴量保存部は、前記教師情報収集部により収集されたコンテンツの内容を表す特徴量行列に加えて、前記メディアストリーム取得部により取得されたメディアストリームの内容を表す特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出部により算出された、前記メディアストリームの内容を表す特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する。この構成により、メディアストリーム自体から適切な認識器を選択することができる。 In addition, according to the present invention, the image processing apparatus further includes a media stream acquisition unit that acquires a media stream transmitted and received on the network, and the feature amount calculation unit represents the content of the media stream acquired by the media stream acquisition unit. A feature amount matrix is calculated, and the feature amount storage unit represents the content of the media stream acquired by the media stream acquisition unit in addition to the feature amount matrix that represents the content of the content collected by the teacher information collection unit. When the feature amount matrix is stored at regular time intervals, clustering is performed on a set of feature amount matrices representing the contents of the media stream calculated by the feature amount calculation unit, and a subspace is set for each set of feature amount matrices. To decide. With this configuration, an appropriate recognizer can be selected from the media stream itself.
(第1の実施形態)
以下、本発明の一実施形態について、図面を参照して説明する。図1は、本実施形態によるWeb連携メタデータ抽出システム全体の構成を示すブロック図である。図において、Web連携メタデータ抽出サーバ101(以降、メタデータ抽出サーバと記す)は、通信可能なネットワーク100を介して、ユーザ端末101−1,101−2と接続している。メタデータ抽出サーバ1−1は、ユーザが用いるユーザ端末102−1から送信されるメディアストリームを受信する。メタデータ抽出サーバ101は、受信したメディアストリーム103から、内容を記述する情報を抽出し、別のデータストリーム104を生成し、それを予め別途指定された宛先であるユーザ端末102−2に対して送信する。
(First embodiment)
Hereinafter, an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing the configuration of the entire Web collaboration metadata extraction system according to this embodiment. In the figure, a Web cooperation metadata extraction server 101 (hereinafter referred to as a metadata extraction server) is connected to user terminals 101-1 and 101-2 via a
次に、図2を参照して、メタデータ抽出サーバ101の構成について説明する。図2は、本実施形態におけるメタデータ抽出サーバ101の構成を示すブロック図である。メタデータ抽出サーバ101は、メディアストリーム取得部208と、特徴量算出部204と、特徴量DB201と、メタデータDB202と、メタデータ整理部203と、相関係数DB205と、相関係数算出部214と、相関係数適用部207と、送信設定部230と、メタデータ送出部231と、メタデータ埋め込み部232と、メディアストリーム送出部233と、教師情報収集部234とを備えている。
Next, the configuration of the
メディアストリーム取得部208は、ネットワーク100上のメディアストリーム送信端末210から送信されたメディアストリームを取得し、特徴量算出部204と、メタデータ埋め込み部232とに入力する。特徴量算出部204は、入力されたメディアストリームから特徴量ベクトルを算出し、算出した特徴量ベクトルを、相関係数適用部207に入力する。特徴量DB201は、算出された特徴量ベクトルを、一定の時間間隔で蓄積する。
The media
教師情報収集部234は、Webサイト240(動画投稿サイト240−1、プログサイト240−2)にアクセスし、任意のコンテンツを取得し、メディアデータとして特徴量算出部204に入力する。また、教師情報収集部234は、メディアデータをメタデータ整理部203に入力する。メタデータ整理部203は、入力されたメディアデータを形態素解析する。相関係数算出部214は、特徴量の平均化に用いる時間幅Δtで、メタデータ整理部203が形態素解析した語の発生頻度を表すメタデータベクトルを作成する。メタデータDB202は、相関係数算出部214が作成したメタデータベクトルを記憶する。
The teacher
また、相関係数算出部214は、特徴量DB201が記憶する特徴量ベクトルを、時間幅△tで平均化して平均化特徴量ベクトルを算出するとともに、特徴量の変化から、シーンの区切れ目も検出し、上記特徴量ベクトルをメディアデータのフレーム分算出し、ここで得られた特徴量ベクトルを、相関係数DB205に入力する。相関係数DB205は、部分空間IDと対応するメタデータ変換子R、および相関係数Wを記憶する。
In addition, the correlation
相関係数適用部207は、相関係数DB205から、部分空間IDと対応するメタデータ変換子R、および相関係数Wとを読み出し、特徴量ベクトルがどの部分空間に入るかを特定する。また、相関係数適用部207は、特徴量ベクトルがどの部分空間に入るかを特定した後、その部分空間に対応する相関係数Wを、この特徴量ベクトルに適用してメタデータベクトルを算出する。また、相関係数適用部207は、算出したメタデータベクトルから適切な語として判定される集合を選別して、1つのメタデータとし、送信設定部230に入力する。
The correlation
メディアストリームにメタデータを埋め込んで出力する場合、送信設定部230は、メタデータをメディアストリーム埋め込み部232に入力する。メディアストリーム埋め込み部232は、メディアストリーム取得部208から入力されたメディアストリームに、送信設定部230から入力されたメタデータを埋め込み、メディアストリーム送出部233に入力する。メディアストリーム送出部233は、メタデータが埋め込まれたメディアストリームを、指定宛先のメディアストリーム受信端末250に送信する。
When the metadata is embedded in the media stream for output, the
一方、メタデータを単独で出力する場合には、送信設定部230は、メタデータをメタデータ送出部231に入力する。メタデータ送出部231は、送信設定部230から入力されたメタデータに、パケットヘッダを付加して、指定宛先のメタデータ受信端末251に送信する。
On the other hand, when outputting metadata alone, the
このように、送信設定部230は、メタデータをメディアストリームに埋め込んで送信するか、メタデータを単体で出力するかを設定することができる。また、送信先を指定することができる。例えば、メディアストリームを送信したユーザ端末に、メタデータを埋め込んだメディアストリームまたはメタデータを送信するか、別のユーザ端末に、メタデータを埋め込んだメディアストリームまたはメタデータを送信するかを指定することができる。
As described above, the
なお、メタデータは、例えば、MPEG−7などで規定されているXML(eXtensible Markup Language)形式のデータである。 The metadata is, for example, data in XML (eXtensible Markup Language) format defined by MPEG-7 or the like.
メディアストリーム受信端末250は、メタデータが埋め込まれたメディアストリームを受信することができる端末である。メタデータ受信端末251は、メタデータを受信することができる端末である。
The media
Webサイト240は、例えば、動画投稿サイト240−1や、ブログサイト240−2である。動画投稿サイト240−1は、動画コンテンツを提供するサイトである。ブログサイト240−2は、テキストコンテンツを提供するサイトである。
The
次に、本実施形態のメタデータ抽出サーバの動作について図3を参照して説明する。図3は、本実施形態のメタデータ抽出サーバ101による、メディアストリームからメタデータを抽出する際の手順を示したシーケンス図である。
Next, the operation of the metadata extraction server of this embodiment will be described with reference to FIG. FIG. 3 is a sequence diagram showing a procedure for extracting metadata from a media stream by the
メディアストリーム取得部208は、まず、送信設定部230に送信設定を行った後(ステップS1)、メディアストリーム送信端末210から送信されたメディアストリームを受信し、特徴量算出部204に入力する(ステップS2)。特徴量算出部204は、入力されたメディアストリームをメタデータ埋め込み部232に入力する(ステップS3)。また、特徴量算出部204は、入力されたメディアストリームから特徴量ベクトルを算出し、算出した特徴量ベクトルを、相関係数適用部207に入力する(ステップS4)。
The media
ここで、上記メディアストリームとは、RTP(Real-time Transport Protocol)、RTSP(Real Time Streaming Protocol)、RTMP(Real Time Message Protocol)などのメディア対応プロトコルで通信されるデータのことを指すものとする。また、算出される特徴量ベクトルは、事前にメタデータ抽出サーバ101内で決められたものを利用するものとする。この際、特徴量DB201は、算出された特徴量ベクトルを、一定の時間間隔で蓄積する(ステップS5)。
Here, the media stream refers to data communicated by a media compatible protocol such as RTP (Real-time Transport Protocol), RTSP (Real Time Streaming Protocol), RTMP (Real Time Message Protocol). . In addition, it is assumed that a feature amount vector calculated is determined in advance in the
相関係数適用部207は、相関係数DB205から、部分空間IDと対応するメタデータ変換子R、および相関係数Wを取得する(ステップS6、S7)。また、相関係数適用部207は、特徴量算出部204が算出した特徴量ベクトルがどの部分空間に入るかを特定する。相関係数DB205が記憶しているメタデータ変換子Rと相関係数Wについては後述する。
The correlation
続いて、相関係数適用部207は、特徴量算出部204が算出した特徴量ベクトルがどの部分空間に入るかを特定した後、特定した部分空間に対応する相関係数Wを、この特徴量ベクトルに適用してメタデータベクトルを算出する。続いて、相関係数適用部207は、算出したメタデータベクトルから適切な語として判定される集合を選別して、1つのメタデータを生成し、生成したメタデータを送信設定部230に入力する(ステップS8)。相関係数適用部207が生成するメタデータは、先述したとおりMPEG−7などで規定されているXML形式のデータである。
Subsequently, after the correlation
送信設定部230は、パケットヘッダを作成して、メタデータ自体を送信するか、元のメディアストリームに埋め込んで送信するかを判定する。送信設定部230は、先述したとおり、出力結果の形態と、送信先の形態とをそれぞれ2通りの形態から選択する。例えば、出力結果の形態は、メタデータをメディアストリームに埋め込んで出力する形態、または、メタデータを単独で出力する形態の2通りの形態から1つの形態を選択する。また、送信先の形態は、メディアストリームを送信したユーザ端末に、メタデータを埋め込んだメディアストリームまたはメタデータを送信する形態、または、メディアストリームを送信したユーザ端末とは別のユーザ端末に、メタデータを埋め込んだメディアストリームまたはメタデータを送信する形態の2通りの形態から1つの形態を選択する。
The
送信設定部230が、メタデータをメディアストリームに埋め込んで出力する形態を選択した場合、送信設定部230は、メタデータをメディアストリーム埋め込み部232に入力する(ステップS9)。メディアストリーム埋め込み部232は、ステップS3でメディアストリーム取得部208から入力されたメディアストリームに、ステップS9で送信選択部230から入力されたメタデータを埋め込み、メディアストリーム送出部233に入力する(ステップS10)。
When the
続いて、メディアストリーム送出部233は、送信設定部230が選択した送信先(メディアストリーム受信端末250)に送信する(ステップS11)。なお、メディアストリーム埋め込み部232は、メディアストリームのRTPの動的ペイロードタイプに利用されていない番号を設定し、対応するペイロードにメタデータを挿入する。
Subsequently, the media
一方、送信設定部230が、メタデータを単独で出力する形態を選択した場合、送信設定部230は、メタデータをメタデータ送出部231に入力する(ステップS12)。メタデータ送出部231は、入力されたメタデータにパケットヘッダを付し、送信設定部230が設定した送信先(メタデータ受信端末251)に送信する(ステップS13)。
On the other hand, when the
次に、先述した、相関係数DB205が記憶しているメタデータ変換子Rと相関係数Wとの取得方法について図4を参照して説明する。図4は、メタデータ変換子Rと相関係数Wとの取得手順を示したシーケンス図である。
Next, a method for obtaining the metadata converter R and the correlation coefficient W stored in the
教師情報収集部234は、Webサイト240にアクセスし、任意のコンテンツを取得する(ステップS21)。教師情報取得部234は、取得したコンテンツをメディアデータとして特徴量算出部204に入力する(ステップS22)。特徴量算出部204は、入力されたメディアデータから特徴量ベクトルを算出し、算出した特徴量ベクトルを特徴量DB201に入力する(ステップS23)。特徴量ベクトルは、入力されたメディアデータの特徴量を、ある時間Δtで平均化し、(1)式を用いて算出される。ここで、kは、量子化番号であり、mは、特徴量次元数である。
The teacher
なお、特徴量算出部204は、入力されたメディアデータの特徴量の変化に基づいて、メディアデータのシーンの区切れ目を検出する。また、特徴量算出部204は、特徴量ベクトルをメディアデータのフレーム毎に算出し、算出した特徴量ベクトルを特徴量DB201に入力する。
Note that the feature
特徴量DB201は、入力された特徴量ベクトルが、過去のクラスタに分類可能な特徴量を持つ場合には、入力された特徴量ベクトルを記憶する。また、特徴量DB201は、入力された特徴量ベクトルが、過去のクラスタに分類可能な特徴量を持っていない場合には、入力された特徴量ベクトルを破棄する。また、特徴量DB201は、入力された特徴量ベクトルを保存したか破棄したかを示す情報を、教師情報収集部234に入力する(ステップS24)。
The
また、特徴量DB201は、一定の時間間隔で、自身が記憶している特徴量ベクトルのクラスタリングを行う。特徴量DB201は、クラスタリングをX−means法などの教師なし学習による分類法によって行う。また、特徴量DB201は、クラスタリングによって得た部分空間をkd木などの木構造により整理し、各部分空間には部分空間IDを振る。また、特徴量DB201は、クラスタリングによって得た部分空間の特徴量ベクトルの集合を[v0,・・・,vn−1]とし、この特徴量ベクトルの集合に対して主成分分析などを行って次元数を削減し、[v’0,・・・,v’n−1]を作成する。
Further, the
教師情報収集部234は、特徴量DB201が特徴量ベクトルを保存したか破棄したかを示す情報に基づいて、特徴量DB201が特徴量ベクトルを保存した場合のみ、メディアデータのテキストデータをメタデータ整理部203に入力する(ステップS25)。メタデータ整理部203は、テキストデータの形態素解析を行い、形態素解析された語から、特徴量ベクトルの平均化に用いる時間幅Δt内での語の発生頻度を表すメタデータベクトルyiを(2)式に従って算出する。また、メタデータ整理部203は、算出したメタデータベクトルをメタデータDB202に入力する(ステップS26)。
The teacher
ここで、iは、語の種類数である。語の発生頻度の値は、発生時間における回数を1倍として、そこからガウス分布に広がるものとする。また、分布は、前述のシーンの区切れ目で、それ以上は拡散しないものとする。 Here, i is the number of types of words. The value of the word occurrence frequency is assumed to be a Gaussian distribution with the number of occurrence times being multiplied by 1. In addition, the distribution is assumed to be the above-mentioned scene break and no further diffusion.
また、メタデータDB202は、メタデータベクトルの集合を[y0,・・・,yn−1]とし、このメタデータベクトルの集合における主成分分析を行って次元数を削減し、[y’0,・・・,y’n−1]を作成する。
Further, the
相関係数算出部214は、特徴量DB201とメタデータDB202とから、部分空間IDと、特徴量ベクトルの集合と、メタデータベクトルの集合とを読み出す(ステップS27〜ステップS30)。また、相関係数算出部214は、特徴量ベクトルの集合と、メタデータベクトルの集合とから、変換行列R(メタデータ変換子R)を算出する。また、相関係数算出部214は、平均特徴量ベクトルv’を入力、メタデータベクトルy’を出力としたモデルで、(3)式を用いてロジスティック回帰分析などの教師あり学習を行う。但し、ロジスティック回帰の場合は、f(x)=a/(1−exp(−x))とし、aは、メタデータベクトルの要素の最大値とする。
The correlation
相関係数算出部214は、回帰係数の行列を相関係数Wとして算出する。続いて、相関係数算出部214は、メタデータ変換子Rと、相関係数Wと、部分空間IDとを相関係数DB205に入力する。
The correlation
相関係数DB205は、入力されたメタデータ変換子Rと、相関係数Wと、部分空間IDとを関連付けて記憶する。
The
(第2の実施形態)
次に、本発明の第2の実施形態について説明する。第2の実施形態は、第1の実施形態で説明したメタデータ抽出サーバ101を、検索サービスに応用した例である。図5は、メタデータ抽出サーバ101を検索サービスに応用した際の構成および動作を示した概念図である。
(Second Embodiment)
Next, a second embodiment of the present invention will be described. The second embodiment is an example in which the
ユーザは、様々な場所においてユーザ端末102−3を用いて撮影した映像ストリームを、メタデータ抽出サーバ101に送信する(ステップS41)。メタデータ抽出サーバ101は、受信した映像ストリームからリアルタイムにメタデータを抽出し、抽出したメタデータを受信した映像ストリームに埋め込んだデータをデータストリームとして、ユーザ端末102−3に送信する(ステップS42)。さらに、メタデータ抽出サーバ101は、抽出したメタデータを検索DB260に送信する。検索DBは、送信されたメタデータに基づいて情報を検索し、検索結果をメタデータ抽出サーバに送信する。メタデータ抽出サーバ101は、受信した検索結果を、ユーザ端末102−3に送信する(ステップS43)。
The user transmits a video stream shot using the user terminal 102-3 in various places to the metadata extraction server 101 (step S41). The
これにより、ユーザは、携帯電話などのカメラを備えたユーザ端末102−3で周囲を撮影するだけで、撮影した映像に関係するWeb上のキーワードを取得し、検索することができる。これにより、検索入力数が削減できるだけでなく、明確な検索キーワードが思いつかない場合でも、検索キーワードをユーザに推薦することが可能となる。 Thus, the user can acquire and search keywords on the Web related to the captured video simply by capturing the surroundings with the user terminal 102-3 equipped with a camera such as a mobile phone. This not only reduces the number of search inputs, but also makes it possible to recommend search keywords to the user even when a clear search keyword cannot be conceived.
(第3の実施形態)
次に、本発明の第3の実施形態について説明する。図6は、本発明のメタデータ抽出サーバを、ブリッジと連携させてメタデータ抽出ブリッジとして構成した場合の構成および動作を示した概念図である。なお、第3の実施形態におけるメタデータ抽出サーバ101は、第1の実施形態で説明したメタデータ抽出サーバ101と同じ構成である。
(Third embodiment)
Next, a third embodiment of the present invention will be described. FIG. 6 is a conceptual diagram showing the configuration and operation when the metadata extraction server of the present invention is configured as a metadata extraction bridge in cooperation with a bridge. Note that the
ここでは、メタデータ抽出サーバ101のストリーム返信先を、ストリーム送信元アドレスに設定しておき、返信ストリームは、メタデータ埋め込みメディアストリームに設定する。また、ブリッジとして、コントロールブリッジ(Control bridge:非特許文献1を参照)を用いるものとし、ネットワーク100上にこのコントロールブリッジ270を1つまたは多数配備するものとする。なお、図示する例では、コントロールブリッジを1つのみ配備した例を示している。
Here, the stream reply destination of the
また、街頭などに設置されたライブカメラ280による映像や、ユーザ端末102−4に備えられたテレビ電話機能などからの映像は、ネットワーク100を介して、終端のユーザ端末102−5に送信されているものとする。
Also, the video from the
コントロールブリッジ270は、フォーワーディング(Fowarding)機能を利用して、特定のメディアストリームを捕捉し、メディアストリームを構成するパケットヘッダを書き換えて、メタデータ抽出サーバ101に該メディアストリームを転送する(ステップS51)。この場合、特定のメディアストリームとしては、街頭などに設置されたライブカメラ280や、ユーザ端末102−4に備えられたテレビ電話機能などからの映像を想定している。つまり、終端のユーザ端末102−5は、上記ライブカメラ280の映像の閲覧や、ユーザ端末102−4と通信(テレビ電話による通話)を行っている。
The
次に、メディアストリームを受信したメタデータ抽出サーバ101は、メディアストリームにメタデータを埋め込み(ステップS52)、該メタデータ埋め込みメディアストリームをコントロールブリッジ270に返信する(ステップS53)。最後に、コントロールブリッジ270は、返信されたストリームのパケットヘッダを元のものに戻し、再度、ネットワーク100上に流す(ステップS54)。これにより、終端のユーザ端末102−5では、複雑な処理を行わなくても、ネットワーク100で通信をしている間に、メディアストリームに自動的にメタデータが付与されるので、処理性能が低い携帯端末などから発信されたストリームであっても、メディアストリームに適合するキーワードを提供することができる。
Next, the
また、メタデータ抽出サーバ101から、監視者のユーザ端末102−6に予めメタデータのペイロードタイプを通知しておくことで(ステップS55)、ユーザ端末102−6から、監視キーワードをプロキシ/PBX290に送信し(ステップS56)、メタデータ埋め込みメディアストリームから該当する検知情報を取得することで(ステップS57)、ネットワーク100上でストリームを監視することが可能となる。
Also, by notifying the user terminal 102-6 of the supervisor in advance of the metadata payload type from the metadata extraction server 101 (step S55), the monitoring keyword is sent from the user terminal 102-6 to the proxy /
(第4の実施形態)
次に、本発明の第4の実施形態について説明する。図7は、本発明のメタデータ抽出サーバ101を、ネットワークによるストリームバックアップサービスに用いた場合の構成および動作を示した概念図である。なお、第4の実施形態におけるメタデータ抽出サーバ101は、第1の実施形態において説明したメタデータ抽出サーバと同じ構成を有している。
(Fourth embodiment)
Next, a fourth embodiment of the present invention will be described. FIG. 7 is a conceptual diagram showing the configuration and operation when the
まず、ネットワーク100上に前述したコントロールブリッジ270を配備する。このコントロールブリッジ270は、ミラーリング(Mirroring)機能を用いて、ライブカメラ280や、ユーザ端末102−4に備えられたテレビ電話機能からのメディアストリームを捕捉し、複製してメタデータ抽出サーバ101と、メディアDB300とに送信する(ステップS61、S62)。その後、メタデータ抽出サーバ101は、抽出したメタデータをメディアDB300に送信する(ステップS63)。メディアDB300は、対応するメディアデータと対にして蓄積する。
First, the
メディアDB300は、一定時間で、このメディアデータとメタデータとを廃棄するものとする。また、メディアDB300は、キーワードでメタデータを検索できるようになっており、対応するメディアの時間範囲が分かるものとする。これにより、ユーザ端末102−7は、メディアDB300に対して検索キーワードを送信することで(ステップS64)、記録容量が小さい端末同士の通信の記録や、端末で記録し忘れた過去のメディアストリームの検索が可能となり(ステップS65)、利便性を向上させることが可能となる。
It is assumed that the
上述した実施形態よれば、部分空間毎に認識器を作成して認識することにより、より精度を向上させることが可能となる。また、部分空間に区切ることにより、特徴量の本質的次元が小さくなるだけでなく、収集されるコメントの種類も自ずと限定されるため、出力されるメタデータの種類も限定され、相関係数の次元数も小さくなり、メディアストリームからのメタデータ抽出時にかかる計算量も削減することができる。また、メディアストリームに何らかの情報を付随させる必要が無くなるため、ネットワーク側の機器で認識するような別の付随情報を期待できない場合であっても可能となる。 According to the above-described embodiment, it is possible to improve accuracy by creating and recognizing a recognizer for each partial space. Moreover, by dividing into subspaces, not only the essential dimension of the feature quantity is reduced, but also the types of collected comments are naturally limited, so the types of output metadata are also limited, and the correlation coefficient The number of dimensions is also reduced, and the amount of calculation required when extracting metadata from the media stream can be reduced. In addition, since it is not necessary to attach any information to the media stream, it is possible even when other accompanying information that can be recognized by a device on the network side cannot be expected.
なお、上述のメタデータ抽出サーバ101の動作の過程は、コンピュータに実行させるためのプログラムや、このプログラムとしてコンピュータ読み取り可能な記録媒体として利用可能であり、コンピュータシステムが読み出して実行することによって、上記処理が行われる。なお、ここでいう「コンピュータシステム」とは、CPU及び各種メモリやOS、周辺機器等のハードウェアを含むものである。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
The above-described process of operation of the
Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used.
The “computer-readable recording medium” means a flexible disk, a magneto-optical disk, a ROM, a writable nonvolatile memory such as a flash memory, a portable medium such as a CD-ROM, a hard disk built in a computer system, etc. This is a storage device.
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に記憶したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。
さらに、前述した機能をコンピュータシステムに既に記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
Further, the “computer-readable recording medium” means a volatile memory (for example, DRAM (Dynamic DRAM) in a computer system that becomes a server or a client when a program is transmitted through a network such as the Internet or a communication line such as a telephone line. Random Access Memory)), etc., which hold programs for a certain period of time.
The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line.
The program may be for realizing a part of the functions described above.
Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, and what is called a difference file (difference program) may be sufficient.
100・・・ネットワーク、101・・・メタデータ抽出サーバ、102−1〜102−7・・・ユーザ端末、201・・・特徴量DB、202・・・メタデータDB、203・・・メタデータ整理部、204・・・特徴量算出部、205・・・相関係数DB、207・・・相関係数適用部、208・・・メディアストリーム取得部、210・・・メディアストリーム送信端末、214・・・相関係数算出部、230・・・送信設定部、231・・・メタデータ送出部、232・・・メタデータ埋め込み部、233・・・メディアストリーム送出部、234・・・教師情報収集部、240・・・Webサーバ、240−1・・・動画投稿サイト、240−2・・・ブログサイト、250・・・メディアストリーム受信端末、251・・・メタデータ受信端末、260・・・検索DB、270・・・コントロールブリッジ、280・・・ライブカメラ、290・・・プロシキ/PBX、300・・・メディアDB
DESCRIPTION OF
Claims (6)
ネットワーク上のサイトからコンテンツを収集する教師情報収集部と、
前記教師情報収集部により収集されたコンテンツの内容を表す特徴量行列を算出する特徴量算出部と、
前記特徴量算出部により算出された特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出部により算出された特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する特徴量保存部と、
前記教師情報収集部により収集されたコンテンツに対して形態素解析を行い、形態素解析された語の発生頻度を表すメタデータ行列を生成するメタデータ整理部と、
前記特徴量保存部により決定された部分空間毎に、前記特徴量行列の集合と前記メタデータ整理部により生成されたメタデータ行列の集合との相関係数を算出する相関係数算出部と、
前記部分空間毎に前記相関係数算出部により算出された相関係数を記憶する相関係数記憶部と
を有することを特徴とするメタデータ抽出サーバ。 In a metadata extraction server that extracts metadata to recognize the content of media data based on media data,
A teacher information collection unit that collects content from sites on the network;
A feature amount calculation unit that calculates a feature amount matrix representing the contents of the content collected by the teacher information collection unit;
When storing the feature amount matrix calculated by the feature amount calculation unit at a constant time interval, clustering is performed on the set of feature amount matrices calculated by the feature amount calculation unit, and a part of each feature amount matrix set is stored. A feature storage unit for determining a space;
A metadata organizing unit that performs morphological analysis on the content collected by the teacher information collecting unit and generates a metadata matrix that represents the frequency of occurrence of words subjected to morphological analysis;
A correlation coefficient calculating unit that calculates a correlation coefficient between the set of feature matrixes and the set of metadata matrices generated by the metadata organizing unit for each partial space determined by the feature storage unit;
A metadata extraction server, comprising: a correlation coefficient storage unit that stores the correlation coefficient calculated by the correlation coefficient calculation unit for each partial space.
前記特徴量算出部は、
前記メディアストリーム取得部により取得されたメディアストリームの内容を表す特徴量行列を算出し、
前記特徴量保存部は、
前記教師情報収集部により収集されたコンテンツの内容を表す特徴量行列に加えて、前記メディアストリーム取得部により取得されたメディアストリームの内容を表す特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出部により算出された、前記メディアストリームの内容を表す特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する、
ことを特徴とする請求項1記載のメタデータ抽出サーバ。 A media stream acquisition unit that acquires media streams transmitted and received on the network;
The feature amount calculation unit includes:
Calculating a feature amount matrix representing the contents of the media stream acquired by the media stream acquisition unit;
The feature amount storage unit includes:
In addition to the feature amount matrix that represents the content of the content collected by the teacher information collection unit, when storing the feature amount matrix that represents the content of the media stream acquired by the media stream acquisition unit at a predetermined time interval, Clustering with a set of feature amount matrices representing the content of the media stream calculated by the feature amount calculation unit, and determining a subspace for each set of feature amount matrices;
The metadata extraction server according to claim 1, wherein:
前記相関適用部により選別された前記メタデータを、該メタデータ自体を送信するか、前記メディアストリームに埋め込んで送信するかを判定する送信設定部と、
前記送信判定部により前記メタデータ自体を送信すると判定された場合に、前記メタデータを指定宛先のメタデータ受信端末に送信するメタデータ送出部と、
前記送信判定部により前記メタデータを前記メディアストリームに埋め込んで送信すると判定された場合に、前記メディアストリームに前記メタデータを埋め込むメタデータ埋め込み部と、
前記メタデータ埋め込み部により前記メタデータが埋め込まれたメディアストリームを指定宛先のメディアストリーム受信端末に送信するメディアストリーム送出部と
を有することを特徴とする請求項2記載のメタデータ抽出サーバ。 Based on the partial space determined by the feature quantity storage unit, a partial space including a feature quantity matrix representing the content of the media stream is specified, and the specified part calculated by the correlation coefficient calculation unit A correlation application unit that calculates a metadata vector of the feature vector by applying a correlation coefficient corresponding to a space, and selects a set determined as an appropriate word from the metadata vector as one metadata;
A transmission setting unit that determines whether the metadata selected by the correlation application unit is transmitted as the metadata itself or embedded in the media stream;
A metadata sending unit that sends the metadata to a specified destination metadata receiving terminal when the transmission judging unit decides to send the metadata itself;
A metadata embedding unit that embeds the metadata in the media stream when the transmission determination unit determines to embed and transmit the metadata in the media stream;
The metadata extraction server according to claim 2, further comprising: a media stream sending unit that sends the media stream in which the metadata is embedded by the metadata embedding unit to a media stream receiving terminal that is a designated destination.
前記指定宛先として、前記メディアストリームの送信元、または前記送信元とは別の送信先のいずれかを選択的に決定する、
ことを特徴とする請求項3記載のメタデータ抽出サーバ。 The transmission setting unit
As the designated destination, either the transmission source of the media stream or a transmission destination different from the transmission source is selectively determined.
The metadata extraction server according to claim 3.
教師情報収集部が、ネットワーク上のサイトからコンテンツを収集する教師情報収集ステップと、
特徴量算出部が、前記教師情報収集ステップで収集されたコンテンツの内容を表す特徴量行列を算出する特徴量算出ステップと、
特徴量保存部が、前記特徴量算出ステップで算出された特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出ステップで算出された特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する特徴量保存ステップと、
メタデータ整理部が、前記教師情報収集ステップで収集されたコンテンツに対して形態素解析を行い、形態素解析された語の発生頻度を表すメタデータ行列を生成するメタデータ整理ステップと、
相関係数算出部が、前記特徴量保存ステップで決定された部分空間毎に、前記特徴量行列の集合と前記メタデータ整理ステップで生成されたメタデータ行列の集合との相関係数を算出する相関係数算出ステップと、
相関係数記憶部が、前記部分空間毎に前記相関係数算出ステップで算出された相関係数を記憶する相関係数記憶ステップと、
を含むことを特徴とするメタデータ抽出方法。 In a metadata extraction method in a metadata extraction server that extracts metadata to recognize the content of media data based on media data,
A teacher information collection unit for collecting content from a site on the network;
A feature amount calculating unit that calculates a feature amount matrix representing the content of the content collected in the teacher information collecting step;
When the feature amount storage unit stores the feature amount matrix calculated in the feature amount calculation step at a constant time interval, the feature amount storage unit performs clustering on the set of feature amount matrices calculated in the feature amount calculation step, and the feature amount A feature storage step for determining a subspace for each set of matrices;
A metadata organizing step for performing a morphological analysis on the content collected in the teacher information collecting step, and generating a metadata matrix representing a frequency of occurrence of words subjected to the morphological analysis;
A correlation coefficient calculation unit calculates a correlation coefficient between the set of feature amount matrices and the set of metadata matrices generated in the metadata organization step for each partial space determined in the feature amount storage step. A correlation coefficient calculating step;
A correlation coefficient storage unit that stores the correlation coefficient calculated in the correlation coefficient calculation step for each partial space;
A metadata extraction method comprising:
ネットワーク上のサイトからコンテンツを収集する教師情報収集手段と、
前記教師情報収集手段により収集されたコンテンツの内容を表す特徴量行列を算出する特徴量算出手段と、
前記特徴量算出手段により算出された特徴量行列を一定の時間間隔で保存する際に、前記特徴量算出手段により算出された特徴量行列の集合でクラスタリングし、前記特徴量行列の集合毎に部分空間を決定する特徴量保存手段と、
前記教師情報収集手段により収集されたコンテンツに対して形態素解析を行い、形態素解析された語の発生頻度を表すメタデータ行列を生成するメタデータ整理手段と、
前記特徴量保存手段により決定された部分空間毎に、前記特徴量行列の集合と前記メタデータ整理手段により生成されたメタデータ行列の集合との相関係数を算出する相関係数算出手段と、
前記部分空間毎に前記相関係数算出手段により算出された相関係数を記憶する相関係数記憶手段
として動作させるためのプログラム。 A computer that operates as a metadata extraction server that extracts metadata for recognizing the contents of media data based on the media data.
Teacher information collection means to collect content from sites on the network;
A feature quantity calculating means for calculating a feature quantity matrix representing the contents of the content collected by the teacher information collecting means;
When storing the feature quantity matrix calculated by the feature quantity calculation means at a fixed time interval, clustering is performed on the set of feature quantity matrices calculated by the feature quantity calculation means, and a part is set for each set of feature quantity matrices. Feature quantity storage means for determining space;
Metadata organizing means for performing morphological analysis on the content collected by the teacher information collecting means, and generating a metadata matrix representing the frequency of occurrence of words subjected to morphological analysis;
Correlation coefficient calculating means for calculating a correlation coefficient between the set of feature quantity matrices and the set of metadata matrices generated by the metadata organizing means for each subspace determined by the feature quantity storage means;
The program for making it operate | move as a correlation coefficient memory | storage means to memorize | store the correlation coefficient calculated by the said correlation coefficient calculation means for every said partial space.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009039529A JP5072880B2 (en) | 2009-02-23 | 2009-02-23 | Metadata extraction server, metadata extraction method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009039529A JP5072880B2 (en) | 2009-02-23 | 2009-02-23 | Metadata extraction server, metadata extraction method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010198111A true JP2010198111A (en) | 2010-09-09 |
JP5072880B2 JP5072880B2 (en) | 2012-11-14 |
Family
ID=42822809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009039529A Expired - Fee Related JP5072880B2 (en) | 2009-02-23 | 2009-02-23 | Metadata extraction server, metadata extraction method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5072880B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105045914A (en) * | 2015-08-18 | 2015-11-11 | 瑞达昇科技(大连)有限公司 | Information induction analysis method and device |
JP2016522491A (en) * | 2013-05-16 | 2016-07-28 | コンヴィーダ ワイヤレス, エルエルシー | Data annotation as a service for IOT systems |
WO2018207734A1 (en) * | 2017-05-11 | 2018-11-15 | 学校法人国際大学 | Information processing device, correlation model data structure, program, information processing method, and method for creation of correlation model data structure |
WO2022114399A1 (en) * | 2020-11-25 | 2022-06-02 | 주식회사 와이즈넛 | Meta data-based active data collection method |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1166283A (en) * | 1997-08-13 | 1999-03-09 | Matsushita Electric Ind Co Ltd | Correlation extracting method for image feature quantity and image retrieval device |
JP2008217701A (en) * | 2007-03-07 | 2008-09-18 | Sharp Corp | Metadata providing device, metadata providing method, metadata providing program, and recording medium recording metadata providing program |
-
2009
- 2009-02-23 JP JP2009039529A patent/JP5072880B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1166283A (en) * | 1997-08-13 | 1999-03-09 | Matsushita Electric Ind Co Ltd | Correlation extracting method for image feature quantity and image retrieval device |
JP2008217701A (en) * | 2007-03-07 | 2008-09-18 | Sharp Corp | Metadata providing device, metadata providing method, metadata providing program, and recording medium recording metadata providing program |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016522491A (en) * | 2013-05-16 | 2016-07-28 | コンヴィーダ ワイヤレス, エルエルシー | Data annotation as a service for IOT systems |
KR101812398B1 (en) * | 2013-05-16 | 2017-12-26 | 콘비다 와이어리스, 엘엘씨 | Data annotation as a service for iot systems |
JP2018010699A (en) * | 2013-05-16 | 2018-01-18 | コンヴィーダ ワイヤレス, エルエルシー | Data annotation as a service for iot systems |
US11172008B2 (en) | 2013-05-16 | 2021-11-09 | Convida Wireless, Llc | Data annotation as a service for IoT systems |
CN105045914A (en) * | 2015-08-18 | 2015-11-11 | 瑞达昇科技(大连)有限公司 | Information induction analysis method and device |
CN105045914B (en) * | 2015-08-18 | 2018-10-09 | 瑞达昇科技(大连)有限公司 | Information reductive analysis method and device |
WO2018207734A1 (en) * | 2017-05-11 | 2018-11-15 | 学校法人国際大学 | Information processing device, correlation model data structure, program, information processing method, and method for creation of correlation model data structure |
JPWO2018207734A1 (en) * | 2017-05-11 | 2020-03-19 | 学校法人国際大学 | Information processing apparatus, data structure of correlation model, program, information processing method, and method of manufacturing data structure of correlation model |
WO2022114399A1 (en) * | 2020-11-25 | 2022-06-02 | 주식회사 와이즈넛 | Meta data-based active data collection method |
Also Published As
Publication number | Publication date |
---|---|
JP5072880B2 (en) | 2012-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180007121A1 (en) | Performance-based content delivery | |
US10027739B1 (en) | Performance-based content delivery | |
US20140043480A1 (en) | Video monitoring system and method | |
US10380267B2 (en) | System and method for tagging multimedia content elements | |
CN110719332B (en) | Data transmission method, device, system, computer equipment and storage medium | |
US9342396B2 (en) | Self-stabilizing network nodes in mobile discovery system | |
US20160210367A1 (en) | Transition event detection | |
CN110659560A (en) | Method and system for identifying associated object | |
CN112559813B (en) | Internet of things gateway data processing method and device based on instruction association pushing | |
US10902049B2 (en) | System and method for assigning multimedia content elements to users | |
JP5072880B2 (en) | Metadata extraction server, metadata extraction method and program | |
CN106789413B (en) | Method and device for detecting proxy internet surfing | |
US20180159902A1 (en) | Access to data on a remote device | |
CN105447148B (en) | A kind of Cookie mark correlating method and device | |
CN113473166A (en) | Data storage system and method | |
CN107070851A (en) | The system and method that the generation of connection fingerprint and stepping-stone based on network flow are reviewed | |
CN108287859B (en) | Multimedia information retrieval method and device | |
US10164819B2 (en) | Correlating web traffic events to a web page session | |
CN114598622B (en) | Data monitoring method and device, storage medium and computer equipment | |
CN106130764B (en) | A kind of whether available method and system of monitor video direct broadcasting room data service | |
CN112866745B (en) | Streaming video data processing method, device, computer equipment and storage medium | |
CN114443904A (en) | Video query method, video query device, computer equipment and computer readable storage medium | |
US20200311172A1 (en) | System and method thereof for dynamically associating a link to an information resource with a multimedia content displayed in a web-page | |
US20170300498A1 (en) | System and methods thereof for adding multimedia content elements to channels based on context | |
CN116915767B (en) | Document transmission method and device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100526 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120802 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120814 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120821 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150831 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |