JP2008204007A - Image dictionary generation method, device and program - Google Patents
Image dictionary generation method, device and program Download PDFInfo
- Publication number
- JP2008204007A JP2008204007A JP2007036995A JP2007036995A JP2008204007A JP 2008204007 A JP2008204007 A JP 2008204007A JP 2007036995 A JP2007036995 A JP 2007036995A JP 2007036995 A JP2007036995 A JP 2007036995A JP 2008204007 A JP2008204007 A JP 2008204007A
- Authority
- JP
- Japan
- Prior art keywords
- video
- content
- text information
- topic
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、画像辞書生成方法及び装置及びプログラムに係り、特に、テキスト情報と画像情報が含まれたWeb情報を用いて画像辞書を作成するための画像辞書生成方法及び装置及びプログラムに関する。 The present invention relates to an image dictionary generation method, apparatus, and program, and more particularly, to an image dictionary generation method, apparatus, and program for creating an image dictionary using Web information including text information and image information.
従来の画像辞書生成方法として次のような方法がある。 There are the following methods as a conventional image dictionary generation method.
まず、映像に関して付与すべき意味ラベルを選択する。次に、その意味ラベルを表現した画像を学習データとして収集する。最後に、意味ラベルに対応付けるビジュアルパターンを学習データから求める。以上の処理により、映像に関する意味ラベルと対応付けたビジュアルパターンで構成した画像辞書を生成することができる(例えば、非特許文献1参照)。 First, a semantic label to be given for a video is selected. Next, images representing the meaning labels are collected as learning data. Finally, the visual pattern associated with the semantic label is obtained from the learning data. Through the above processing, an image dictionary composed of visual patterns associated with semantic labels related to video can be generated (for example, see Non-Patent Document 1).
また、学習データを効率的に収集する方法として、予め用意しておく意味ラベルを表すワードを用いてWebサイトから画像を収集する方法もある(例えば、非特許文献2参照)。
しかしながら、上記の非特許文献1に示すような画像辞書生成方法は、映像に関する画像辞書の精度が学習データに依存するので、実際の映像に良く反映できる学習データを選別するためには膨大な時間と手間を要するという問題がある。
However, since the image dictionary generation method as shown in
また、上記の非特許文献2に示すような学習データを収集する方法は、Web情報の特性により、収集されたWeb画像には多種多様な画像が含まれているので、ノイズを含む学習データを用いることになり、生成した画像辞書の精度が低くなるという問題がある。
In addition, the method of collecting learning data as shown in Non-Patent
さらに、両者の従来の方法とも、映像にどのような意味ラベルを付与するかを事前に選択する必要があるが、映像のコンテンツを反映した適切な意味ラベルを選択するためには、時間と手間を要するという問題がある。 Furthermore, in both conventional methods, it is necessary to select in advance what kind of semantic label is to be given to the video, but in order to select an appropriate semantic label that reflects the video content, time and effort are required. There is a problem that requires.
本発明は、上記の点に鑑みなされたもので、事前に付与すべき意味ラベルを選択することなく、コンテンツに応じて適切な意味ラベルを抽出し、精度よく画像辞書を生成することが可能な画像辞書生成方法及び装置及びプログラムを提供することを目的とする。 The present invention has been made in view of the above points, and can extract an appropriate semantic label according to content and generate an image dictionary with high accuracy without selecting a semantic label to be given in advance. An object is to provide an image dictionary generation method, apparatus, and program.
近年、情報と通信放送連携に伴い、Web情報とTV映像が深く関連しているので、意味ラベルを付与したい映像と関連した画像を収集するには、前述の非特許文献2のようなWeb情報を活用することが有効である。本発明は、画像辞書の精度が低いという従来技術の問題を解決するために、コンテンツに応じて適切な意味ラベルを自動抽出する手段を設けることで、精度を向上させる。具体的には以下のような手段を用いる。
In recent years, Web information and TV video have been closely related to information and communication / broadcasting cooperation. Therefore, in order to collect images related to video for which a semantic label is to be added, Web information such as that described in Non-Patent
図1は、本発明の原理を説明するための図である。 FIG. 1 is a diagram for explaining the principle of the present invention.
本発明(請求項1)は、映像に対して意味的なレベルを付与するための、意味ラベルとビジュアルパターンとの関連を定義した画像辞書を生成する画像辞書生成方法であって、
映像コンテンツ関連情報取得手段が、映像コンテンツの内容を説明したテキスト情報であるコンテンツ関連情報をウェブサイトから取得する映像コンテンツ関連情報取得ステップ(ステップ1)と、
テキスト情報収集手段が、コンテンツ関連情報から抽出したワードとコンテンツ作成日付またはコンテンツ公開日付に基づいてウェブサイトからコンテンツに関するテキスト情報を収集し、記憶手段に格納するテキスト情報収集ステップ(ステップ2)と、
話題抽出手段が、記憶手段に格納されているテキスト情報から話題を表す複数のワードをワードセットとして抽出する話題抽出ステップ(ステップ3)と、
画像収集・ビジュアルパターン生成手段が、ワードセットに関するウェブ画像を収集し(ステップ4)、収集したウェブ画像を学習データとして話題と関連するビジュアルパターンを生成し(ステップ5)、該ワードセットと該ビジュアルパターンを画像辞書として画像辞書記憶手段に格納する(ステップ6)画像収集・ビジュアルパターン生成ステップと、を行う。
The present invention (Claim 1) is an image dictionary generation method for generating an image dictionary that defines a relationship between a semantic label and a visual pattern for giving a semantic level to a video,
A video content related information acquisition unit (step 1) in which the video content related information acquisition means acquires content related information, which is text information describing the content of the video content, from the website;
A text information collecting step (step 2) in which the text information collecting means collects text information related to the content from the website based on the word extracted from the content related information and the content creation date or the content release date, and stores it in the storage means;
A topic extraction step (step 3) in which the topic extraction unit extracts a plurality of words representing the topic from the text information stored in the storage unit as a word set;
The image collection / visual pattern generation means collects a web image related to a word set (step 4), generates a visual pattern related to a topic using the collected web image as learning data (step 5), and the word set and the visual A pattern is stored in the image dictionary storage means as an image dictionary (step 6). An image collection / visual pattern generation step is performed.
本発明(請求項2)は、話題抽出ステップ(ステップ3)において、
コンテンツ関連情報から抽出した映像ジャンルに応じて、抽出すべき話題の種別を定義した映像属性テーブルを記憶手段に格納しておき、該属性テーブルの各属性n(n=1,2,…,N)に対して、テキスト情報収集ステップにより記憶手段に格納されているテキスト情報を読み出して分類し、
分類された同一グループのテキスト情報から、属性nに関する話題を表すワードセットを抽出する。
According to the present invention (Claim 2), in the topic extraction step (Step 3),
In accordance with the video genre extracted from the content-related information, a video attribute table defining the type of topic to be extracted is stored in the storage means, and each attribute n (n = 1, 2,..., N) of the attribute table is stored. ), The text information stored in the storage means is read and classified by the text information collecting step,
A word set representing a topic related to the attribute n is extracted from the classified text information of the same group.
図2は、本発明の原理構成図である。 FIG. 2 is a principle configuration diagram of the present invention.
本発明(請求項3)は、映像に対して意味的なレベルを付与するための、意味ラベルとビジュアルパターンとの関連を定義した画像辞書を生成する画像辞書生成装置であって、
映像コンテンツの内容を説明したテキスト情報であるコンテンツ関連情報をウェブサイトから取得する映像コンテンツ関連情報取得手段100と、
コンテンツ関連情報から抽出したワードとコンテンツ作成日付またはコンテンツ公開日付に基づいてウェブサイト3からコンテンツに関するテキスト情報を収集し、記憶手段に格納するテキスト情報収集手段101と、
記憶手段に格納されているテキスト情報から話題を表す複数のワードをワードセットとして抽出する話題抽出手段104と、
ワードセットに関するウェブ画像を収集し、収集したウェブ画像を学習データとして話題と関連するビジュアルパターンを生成し、該ワードセットと該ビジュアルパターンを画像辞書として画像辞書記憶手段2に格納する画像収集・ビジュアルパターン生成手段105と、を有する。
The present invention (Claim 3) is an image dictionary generation device for generating an image dictionary defining a relationship between a semantic label and a visual pattern for giving a semantic level to a video,
Video content related information acquisition means 100 for acquiring content related information, which is text information describing the content of video content, from a website;
Text information collecting means 101 for collecting text information related to the content from the website 3 based on the word extracted from the content related information and the content creation date or the content release date, and storing it in the storage means;
Topic extraction means 104 for extracting a plurality of words representing a topic from the text information stored in the storage means as a word set;
Collecting web images related to a word set, generating a visual pattern associated with a topic using the collected web image as learning data, and storing the word set and the visual pattern as an image dictionary in the image dictionary storage means 2 Pattern generation means 105.
本発明(請求項4)は、コンテンツ関連情報から抽出した映像ジャンルに応じて、抽出すべき話題の種別を定義した映像属性テーブルを格納した映像属性記憶手段を更に有し、
話題抽出手段104は、
映像属性記憶手段の属性テーブルの各属性n(n=1,2,…,N)に対して、テキスト情報収集手段101により記憶手段に格納されているテキスト情報を読み出して分類する手段と、
分類された同一グループのテキスト情報から、属性nに関する話題を表すワードセットを抽出する手段と、を含む。
The present invention (Claim 4) further includes video attribute storage means storing a video attribute table that defines the type of topic to be extracted according to the video genre extracted from the content related information,
The topic extraction means 104
Means for reading and classifying the text information stored in the storage means by the text information collection means 101 for each attribute n (n = 1, 2,..., N) in the attribute table of the video attribute storage means;
Means for extracting a word set representing a topic related to the attribute n from the classified text information of the same group.
本発明(請求項5)は、コンピュータに、請求項3または4記載の機能を実現させるプログラムである。 The present invention (Claim 5) is a program for causing a computer to realize the function according to Claim 3 or 4.
上記のように本発明によれば、映像に関連するWeb情報(コンテンツ関連情報)を収集して、それらを分類することで話題を抽出することにより、事前に付与すべき意味ラベルを選択することなく、コンテンツに応じて適切な意味ラベルを自動抽出するので、手間と時間をかけることなく、精度よく画像辞書を生成することができる。 As described above, according to the present invention, it is possible to select a semantic label to be given in advance by collecting Web information (content related information) related to video and classifying them to extract topics. In addition, since an appropriate semantic label is automatically extracted according to content, an image dictionary can be generated with high accuracy without taking time and effort.
以下、図面と共に本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図3は、本発明の一実施の形態におけるシステム構成を示す。 FIG. 3 shows a system configuration in an embodiment of the present invention.
同図に示すシステムは、画像辞書生成装置1、画像辞書データベース2、インターネットに接続されるWebサイト3から構成される。
The system shown in FIG. 1 includes an image
画像辞書生成装置1は、ウェブサイト3から映像に関するウェブ情報を取得し、取得したウェブ情報を用いて、映像に関する画像辞書を生成する。
The image
画像辞書データベース2は、画像辞書生成装置1で生成された画像辞書を受け取って格納する。
The
ウェブサイト3は、インターネット上で公開されている数多くのウェブサイトである。公開されている情報は、周辺テキストが付与されたウェブ画像とウェブテキスト情報から構成されている。ウェブサイト3は、画像辞書生成装置1の要求に応じて周辺テキストが付与されたウェブ画像とウェブテキスト情報を当該画像辞書生成装置1に出力する。
The website 3 is a large number of websites published on the Internet. The published information is composed of a web image to which peripheral text is added and web text information. The website 3 outputs to the image
以下に、上記の画像辞書生成装置1について詳細に説明する。
Hereinafter, the image
図4は、本発明の一実施の形態における画像辞書生成装置の構成を示す。 FIG. 4 shows the configuration of the image dictionary generation apparatus according to an embodiment of the present invention.
同図に示す画像辞書生成装置1は、映像コンテンツ関連情報取得部100、テキスト情報収集部101、テキスト情報分類部102、映像属性テーブル管理部103、映像話題抽出部104、ウェブ画像収集とビジュアルパターン生成部105から構成される。
The image
上記の各構成における処理についてTV番組映像を例として説明する。 The processing in each of the above configurations will be described using a TV program video as an example.
映像コンテンツ関連情報取得部100は、ある番組映像を説明したテキスト情報をウェブサイト3から取得し、メモリ等の記憶手段(図示せず)に格納する。例えば、テレビ映像のEPG情報をTV番組放送局のホームページから取得すればよい。EPG情報の例を図5に示す。同図に示すEPG情報は、放送日時、タイトル、ジャンル、概要、出演者等からなり、映像コンテンツ関連情報取得部100は、当該EPG情報から映像のタイトルと放送日時を抽出してテキスト情報収集部101に出力し、EPG情報の映像ジャンル情報を抽出して属性テキスト情報分類部102に出力する。
The video content related
テキスト情報収集部101は、映像コンテンツ関連情報取得部100から映像のタイトルと放送日時を受け取ると、映像のタイトルを検索条件として、放送日時前後の限定期間のウェブテキスト情報をウェブサイト3から収集し、メモリ等の記憶手段(図示せず)に格納する。収集したウェブテキスト情報をテキスト情報分類部102へ出力する。例えば、映像放送日時前の1週間と後の3週間にかけた1ヶ月の最近ウェブテキスト情報を収集してもよい。
Upon receiving the video title and the broadcast date / time from the video content related
テキスト情報分類部102は、映像コンテンツ関連情報取得部100から映像ジャンル情報を受け取ると、映像属性テーブル管理部103へ出力する。また、映像属性テーブル管理部103から受け取った映像属性テーブルの情報に従って、テキスト情報収集部101から受け取ったウェブテキスト情報を分類し、メモリ等の記憶手段(図示せず)に格納する。分類したテキスト情報を映像話題抽出部104へ出力する。
Upon receiving the video genre information from the video content related
映像属性テーブル管理部103は、映像ジャンルに応じて抽出すべき話題の種別を定義した映像属性テーブルを記憶手段に保持・管理する。映像属性テーブル管理部103は、図6に示すような映像属性テーブルを有する。映像属性テーブルは、映像ジャンルと当該映像ジャンルに関する複数の属性を保持する。映像属性テーブル管理部103は、テキスト情報分類部102から映像ジャンル情報を受け取って映像に対応付ける映像属性テーブルの情報をテキスト情報分類部102へ出力する。
The video attribute
映像話題抽出部104は、テキスト情報分類部102においてメモリに格納されたテキスト情報を読み出して、統計手法によりテキスト情報のワード頻度分布から上位ワードを話題として抽出する。抽出された話題に関するワードをウェブ画像収集とビジュアルパターン生成部104へ出力する。
The video
ウェブ画像収集とビジュアルパターン生成部105は、映像話題抽出部104から受け取った話題に関するワードを検索条件として、関連ウェブ画像をウェブサイト3から収集する。収集されたウェブ画像を学習手法で話題に関するビジュアルパターンを生成する。話題に関するワードとビジュアルパターンで構成した画像辞書を画像データベース2に格納する。
The web image collection and visual
以上の構成により、テキストと画像を含むウェブ情報を用いて、映像を対象とした画像辞書の生成を行う。 With the above configuration, an image dictionary for video is generated using web information including text and images.
次に、上記の画像辞書生成装置1における基本動作を説明する。
Next, a basic operation in the image
図7は、本発明の一実施の形態における画像辞書生成装置の基本動作のフローチャートである。 FIG. 7 is a flowchart of the basic operation of the image dictionary generation apparatus according to an embodiment of the present invention.
ステップ201) 映像コンテンツ関連情報取得部100において、ある映像コンピュータ関連情報をウェブサイト3から取得し、記憶手段(図示せず)に格納する。例えば、図5に示すような映像のEPG情報をTV番組放送局のホームページから取得すればよい。
Step 201) In the video content related
ステップ202) テキスト情報収集部101において、映像コンテンツ関連情報EPGにあったタイトルを検索条件として、ウェブサイト3から放送日時前後の限定期間のウェブテキスト情報を収集する。例えば、映像放送日時前の1週間と、放送日時後の3週間の1ヶ月分の最近のウェブテキスト情報を収集し、メモリ(図示せず)に格納する。
Step 202) The text
ステップ203) テキスト情報分類部102は、ステップ201において映像コンテンツ関連情報取得部100がEPG情報から抽出した映像ジャンルに従って、映像属性テーブル管理部103から対応する映像属性テーブルを読み出す。映像ジャンルが「ドラマ」である場合は、図6の例では、映像属性テーブル管理部103のドラマ映像に対する属性テーブル(人物、場所、事件、感情、社交活動)を読み出す。
Step 203) The text
ステップ204) テキスト情報分類部102は、映像属性テーブルにあった属性nに対応したワードを追加した検索条件で、ステップ202において収集され、メモリ(図示せず)に格納されたウェブテキスト情報に対し、再検索を行って、当該属性nに関するテキスト情報を収集し、メモリ(図示せず)に格納する。属性nに関するテキスト情報を収集するのは、ウェブテキストと属性nに対応したワードとのテキスト照合を行い、類似度の高い順にWebテキストを属性nに関するテキスト情報として収集すればよい。ここで、映像属性テーブルにN個属性があれば、ステップ202で収集されたウェブテキストは、N個の属性毎のテキストグループに分類され、メモリ(図示セず)に格納する。
Step 204) The text
ステップ205) 映像話題抽出部104は、メモリ(図示せず)のテキスト情報分類部102で分類されたテキストグループについて、n=1として、最初のテキストグループを読み出して、以下の処理を行う。
Step 205) The video
ステップ206) 映像話題抽出部104は、属性nに関するテキストグループから話題を抽出する。処理内容を図8のフローチャートに沿って説明する。
Step 206) The video
ステップ301) 映像話題抽出部104は、ステップ204においてメモリ(図示せず)に格納された属性Nに関するウェブテキスト情報を読み込む。
Step 301) The video
ステップ302) 読み込まれたウェブテキスト情報における、"を"、"は"、"が"などのStopping wordを削除する。 Step 302) In the read web text information, Stopping words such as “to”, “to” and “to” are deleted.
ステップ303) ステップ302で処理されたテキスト情報を用いて、類似したワードを統合する。ドラマ映像に関する属性n「人物」の例として、テキスト情報に表したワードは、"AAAさん"、"Tさん"、"娘"、"友達"、"Cさん"の場合で、予め記憶手段(図示せず)に格納されているドラマ映像の人物関係情報を参照して、類似したワードを統合してワードセットを生成し、メモリ(図示せず)に格納する。図9は、予め記憶手段(図示せず)に格納されているドラマ映像の人物関係情報の例である。当該ドラマの人物関係情報は、予めTV放送局のホームページから読み込んで記憶手段に格納しておけばよい。図9に従って生成されたワードセットは、{AAAさん、娘}、{友達、Tさん}、{Cさん}になる。
Step 303) Using the text information processed in
ステップ304) ステップ303で処理された各ワードセットをメモリ(図示せず)から読み出して、個々のワードセットの頻度を算出する。 Step 304) Each word set processed in step 303 is read from a memory (not shown), and the frequency of each word set is calculated.
ステップ305) ステップ304で算出されたワードセットの頻度のうち、頻度の高い上位M個のワードセットを属性nに関する話題として抽出し、メモリ(図示せず)に格納する。 Step 305) Of the word set frequencies calculated in Step 304, the top M word sets with the highest frequency are extracted as topics related to the attribute n and stored in a memory (not shown).
ステップ207) ウェブ画像収集・ビジュアルパターン生成部105は、m=1として、ステップ206において、メモリ(図示せず)に格納された最初の話題について処理する。
Step 207) The web image collection / visual
ステップ208) ウェブ画像収集・ビジュアルパターン生成部105は、メモリ(図示せず)から読み出したワードセットを検索条件としてウェブサイト3からウェブ画像収集を行う。収集した画像から当該ワードセットに関するビジュアルモジュールを抽出し、ワードセットとビジュアルモジュールを組にしてメモリ(図示せず)に格納する。ここで、共通ビジュアルモジュールを抽出する一例として、非特許文献2の方法を用いて、ワードを収集条件として、ウェブサイトから取得した画像から適切な認識関数を求めることにより、ワードセットに対応したビジュアルモジュールを生成すればよい。
Step 208) The web image collection / visual
ステップ209) 全てのワードセットにおいて、上記のステップ208の処理を行ったかを判定し、行っていなければm=m+1とし、ステップ208に戻る。そうでなければ、ステップ210へ移行する。
Step 209) In all word sets, it is determined whether or not the processing in the
ステップ210) 全ての属性に関するテキスト情報において、上記のステップ206〜209の処理を行ったかを判定し、行っていなければn=n+1として、ステップ206に戻る。そうでなければステップ211へ移行する。 Step 210) It is determined whether or not the processing of Steps 206 to 209 has been performed on the text information regarding all the attributes. If not, n = n + 1 is set and the processing returns to Step 206. Otherwise, the process proceeds to step 211.
ステップ211) 映像に対して上記のステップ208で生成し、メモリ(図示せず)に格納されているワードセットと当該ワードセットに対応したビジュアルパターンの組を読み出して画像辞書として画像辞書データベース2に格納する。
Step 211) A set of a word set and a visual pattern corresponding to the word set generated in
なお、上記の実施の形態における画像辞書生成装置の動作をプログラムとして構築し、画像辞書生成装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。 Note that the operation of the image dictionary generation apparatus in the above embodiment can be constructed as a program, installed in a computer used as the image dictionary generation apparatus, executed, or distributed via a network.
また、構築されたプログラムをコンピュータが読み取り可能な記録媒体に格納し、コンピュータにインストールする、または、配布することが可能である。 Further, the constructed program can be stored in a computer-readable recording medium and installed or distributed in the computer.
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。 The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.
本発明は、画像DBシステムや映像DBシステムを含む画像処理に利用可能である。 The present invention can be used for image processing including an image DB system and a video DB system.
1 画像辞書生成装置
2 画像辞書データベース
3 ウェブサイト
100 映像コンテンツ関連情報取得手段、映像コンテンツ関連情報取得部
101 テキスト情報収集手段、テキスト情報収集部
102 テキスト情報分類部
103 映像属性テーブル管理部
104 話題抽出手段、映像話題抽出部
105 画像収集・ビジュアルパターン生成手段、画像収集・ビジュアルパターン生成部
DESCRIPTION OF
Claims (5)
映像コンテンツ関連情報取得手段が、映像コンテンツの内容を説明したテキスト情報であるコンテンツ関連情報をウェブサイトから取得する映像コンテンツ関連情報取得ステップと、
テキスト情報収集手段が、前記コンテンツ関連情報から抽出したワードとコンテンツ作成日付またはコンテンツ公開日付に基づいてウェブサイトからコンテンツに関するテキスト情報を収集し、記憶手段に格納するテキスト情報収集ステップと、
話題抽出手段が、前記記憶手段に格納されている前記テキスト情報から話題を表す複数のワードをワードセットとして抽出する話題抽出ステップと、
画像収集・ビジュアルパターン生成手段が、前記ワードセットに関するウェブ画像を収集し、収集したウェブ画像を学習データとして前記話題と関連するビジュアルパターンを生成し、該ワードセットと該ビジュアルパターンを画像辞書として画像辞書記憶手段に格納する画像収集・ビジュアルパターン生成ステップと、
を行うことを特徴とする画像辞書生成方法。 An image dictionary generation method for generating an image dictionary that defines a relationship between a semantic label and a visual pattern for giving a semantic level to a video,
A video content related information acquisition unit, wherein the video content related information acquisition means acquires content related information, which is text information describing the content of the video content, from a website;
A text information collecting step for collecting text information about the content from the website based on the word extracted from the content related information and the content creation date or the content release date, and storing the text information in the storage unit;
A topic extraction step for extracting a plurality of words representing a topic as a word set from the text information stored in the storage means;
Image collection / visual pattern generation means collects web images related to the word set, generates a visual pattern related to the topic using the collected web images as learning data, and uses the word set and the visual pattern as an image dictionary. Image collection / visual pattern generation step stored in dictionary storage means;
The image dictionary generation method characterized by performing.
コンテンツ関連情報から抽出した映像ジャンルに応じて、抽出すべき話題の種別を定義した映像属性テーブルを記憶手段に格納しておき、該属性テーブルの各属性n(n=1,2,…,N)に対して、前記テキスト情報収集ステップにより前記記憶手段に格納されている前記テキスト情報を読み出して分類し、
分類された同一グループのテキスト情報から、属性nに関する話題を表すワードセットを抽出する
請求項1記載の画像辞書生成方法。 In the topic extraction step,
In accordance with the video genre extracted from the content-related information, a video attribute table defining the type of topic to be extracted is stored in the storage means, and each attribute n (n = 1, 2,..., N) of the attribute table is stored. ), The text information stored in the storage means by the text information collection step is read and classified,
The image dictionary generation method according to claim 1, wherein a word set representing a topic related to the attribute n is extracted from the classified text information of the same group.
映像コンテンツの内容を説明したテキスト情報であるコンテンツ関連情報をウェブサイトから取得する映像コンテンツ関連情報取得手段と、
前記コンテンツ関連情報から抽出したワードとコンテンツ作成日付またはコンテンツ公開日付に基づいてウェブサイトからコンテンツに関するテキスト情報を収集し、記憶手段に格納するテキスト情報収集手段と、
前記記憶手段に格納されている前記テキスト情報から話題を表す複数のワードをワードセットとして抽出する話題抽出手段と、
前記ワードセットに関するウェブ画像を収集し、収集したウェブ画像を学習データとして前記話題と関連するビジュアルパターンを生成し、該ワードセットと該ビジュアルパターンを画像辞書として画像辞書記憶手段に格納する画像収集・ビジュアルパターン生成手段と、
を有することを特徴とする画像辞書生成装置。 An image dictionary generation device that generates an image dictionary that defines a relationship between a semantic label and a visual pattern for giving a semantic level to a video,
Video content related information acquisition means for acquiring content related information, which is text information describing the content of the video content, from a website;
Text information collecting means for collecting text information about the content from the website based on the word extracted from the content related information and the content creation date or the content release date, and storing the text information in a storage means;
Topic extraction means for extracting a plurality of words representing a topic from the text information stored in the storage means as a word set;
Collecting a web image related to the word set, generating a visual pattern related to the topic using the collected web image as learning data, and storing the word set and the visual pattern as an image dictionary in an image dictionary storage unit Visual pattern generation means;
An image dictionary generation device characterized by comprising:
前記話題抽出手段は、
前記映像属性記憶手段の前記属性テーブルの各属性n(n=1,2,…,N)に対して、前記テキスト情報収集手段により前記記憶手段に格納されている前記テキスト情報を読み出して分類する手段と、
分類された同一グループのテキスト情報から、属性nに関する話題を表すワードセットを抽出する手段と、
を含む請求項3記載の画像辞書生成装置。 According to the video genre extracted from the content-related information, the video attribute storage means further stores a video attribute table that defines the type of topic to be extracted,
The topic extraction means includes
For each attribute n (n = 1, 2,..., N) in the attribute table of the video attribute storage means, the text information stored in the storage means is read and classified by the text information collection means. Means,
Means for extracting a word set representing a topic related to the attribute n from the classified text information of the same group;
The image dictionary generation device according to claim 3, comprising:
請求項3または4記載の機能を実現させることを特徴とするプログラム。 On the computer,
A program for realizing the function according to claim 3 or 4.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007036995A JP4755122B2 (en) | 2007-02-16 | 2007-02-16 | Image dictionary generation method, apparatus, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007036995A JP4755122B2 (en) | 2007-02-16 | 2007-02-16 | Image dictionary generation method, apparatus, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008204007A true JP2008204007A (en) | 2008-09-04 |
JP4755122B2 JP4755122B2 (en) | 2011-08-24 |
Family
ID=39781479
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007036995A Expired - Fee Related JP4755122B2 (en) | 2007-02-16 | 2007-02-16 | Image dictionary generation method, apparatus, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4755122B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8559724B2 (en) | 2009-03-27 | 2013-10-15 | Samsung Electronics Co., Ltd. | Apparatus and method for generating additional information about moving picture content |
CN112149653A (en) * | 2020-09-16 | 2020-12-29 | 北京达佳互联信息技术有限公司 | Information processing method, information processing device, electronic equipment and storage medium |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109918662B (en) * | 2019-03-04 | 2021-03-16 | 腾讯科技(深圳)有限公司 | Electronic resource label determination method, device and readable medium |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006059024A (en) * | 2004-08-18 | 2006-03-02 | Nippon Telegr & Teleph Corp <Ntt> | Word/phrase extraction method, device and program |
JP2006127325A (en) * | 2004-10-29 | 2006-05-18 | Ntt Docomo Inc | Content discovery apparatus, and content discovery method |
-
2007
- 2007-02-16 JP JP2007036995A patent/JP4755122B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006059024A (en) * | 2004-08-18 | 2006-03-02 | Nippon Telegr & Teleph Corp <Ntt> | Word/phrase extraction method, device and program |
JP2006127325A (en) * | 2004-10-29 | 2006-05-18 | Ntt Docomo Inc | Content discovery apparatus, and content discovery method |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8559724B2 (en) | 2009-03-27 | 2013-10-15 | Samsung Electronics Co., Ltd. | Apparatus and method for generating additional information about moving picture content |
CN112149653A (en) * | 2020-09-16 | 2020-12-29 | 北京达佳互联信息技术有限公司 | Information processing method, information processing device, electronic equipment and storage medium |
CN112149653B (en) * | 2020-09-16 | 2024-03-29 | 北京达佳互联信息技术有限公司 | Information processing method, information processing device, electronic equipment and storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP4755122B2 (en) | 2011-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10277946B2 (en) | Methods and systems for aggregation and organization of multimedia data acquired from a plurality of sources | |
CN108509465B (en) | Video data recommendation method and device and server | |
Wang et al. | Event driven web video summarization by tag localization and key-shot identification | |
CN106921891B (en) | Method and device for displaying video characteristic information | |
CN103052953B (en) | Messaging device, information processing method | |
WO2017096877A1 (en) | Recommendation method and device | |
CN112163122A (en) | Method and device for determining label of target video, computing equipment and storage medium | |
CN103069414A (en) | Information processing device, information processing method, and program | |
JP2013541793A (en) | Multi-mode search query input method | |
CN111008321A (en) | Recommendation method and device based on logistic regression, computing equipment and readable storage medium | |
CN109408672B (en) | Article generation method, article generation device, server and storage medium | |
CN110287375B (en) | Method and device for determining video tag and server | |
CN102193946A (en) | Method and system for adding tags into media file | |
CN103207917A (en) | Method for marking multimedia content and method and system for generating recommended content | |
JP2008283412A (en) | Comment collecting and analyzing device, and program thereof | |
CN103942328A (en) | Video retrieval method and video device | |
Liu et al. | Event analysis in social multimedia: a survey | |
Hong et al. | Exploring large scale data for multimedia QA: an initial study | |
KR102281266B1 (en) | System and Method for Extracting Keyword and Ranking in Video Subtitle | |
EP2943898A1 (en) | Method for identifying objects in an audiovisual document and corresponding device | |
CN115909390B (en) | Method, device, computer equipment and storage medium for identifying low-custom content | |
JP4755122B2 (en) | Image dictionary generation method, apparatus, and program | |
Raimond et al. | Using the past to explain the present: interlinking current affairs with archives via the semantic web | |
CN106776654B (en) | Data searching method and device | |
CN116628232A (en) | Label determining method, device, equipment, storage medium and product |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110125 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110524 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110526 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140603 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |