JP2008268985A - タグを付与する方法 - Google Patents

タグを付与する方法 Download PDF

Info

Publication number
JP2008268985A
JP2008268985A JP2007106740A JP2007106740A JP2008268985A JP 2008268985 A JP2008268985 A JP 2008268985A JP 2007106740 A JP2007106740 A JP 2007106740A JP 2007106740 A JP2007106740 A JP 2007106740A JP 2008268985 A JP2008268985 A JP 2008268985A
Authority
JP
Japan
Prior art keywords
tag
keyword
moving image
image data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007106740A
Other languages
English (en)
Other versions
JP5226241B2 (ja
Inventor
Takeshi Hagiwara
健 萩原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2007106740A priority Critical patent/JP5226241B2/ja
Publication of JP2008268985A publication Critical patent/JP2008268985A/ja
Application granted granted Critical
Publication of JP5226241B2 publication Critical patent/JP5226241B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】動画像データを他の複数の動画像データの中で特徴付けるためのタグを自動的に付与し、検索エンジンにより当該動画像データ、あるいは当該動画像データを含むWebページを効果的に抽出可能とする方法を提供すること。
【解決手段】タグ決定サーバ10は、動画像データに含まれる音声をテキストデータに変換し、テキストデータからキーワードを抽出し、所定の検索システムにおけるキーワードの重要度を算出し、算出した重要度が所定の条件を満たす場合に、キーワードを、動画像データのタグとして付与する。
【選択図】図2

Description

本発明は、動画像データにタグを付与する方法、サーバ、およびプログラムに関する。
従来、インターネット上のコンテンツには、当該コンテンツの検索を容易にするため、タグと呼ばれるキーワードを関連付けることが多い。管理サーバにより自動的に付与され、ユーザの目に触れることのないインデックスとは異なり、タグは、ユーザ自身がコンテンツを特徴付けるキーワードを登録する。このことにより、ユーザは、コンテンツの内容を把握され易くできる。更には、検索時に参照されることにより、効果的なコンテンツの提供が期待できる。
ここで、インターネット上のコンテンツには、様々な種類のデータが含まれ、近年では、動画像データを管理するWebサイト等も存在する。このような状況において、動画像データに対する検索インデックスを作成する技術が提供されてきている。例えば、特許文献1には、映像(動画像データ)の音声からキーワードを抽出し、映像に対するインデックスを自動的に付与する装置が開示されている。
特開2002−171481号公報
上述の技術によれば、動画像データに含まれる音声に基づいて、当該動画像データ内のシーンを検索するためのインデックスを作成するが、これは、単に動画像データに含まれるキーワードを抽出したに過ぎないため、当該動画像を特徴付けているとは限らない。そのため、他の動画像も含めた複数の動画像データの中から目的のものを選択する検索には適さない。
そこで本発明は、ある動画像データを他の複数の動画像データの中で特徴付けるためのタグを自動的に付与し、検索エンジンにより当該動画像データ、あるいは当該動画像データを含むWebページを効果的に抽出可能とする方法を提供することを目的とする。
上記目的のため、具体的には、以下のようなものを提供する。
(1) 動画像データにタグを付与する方法であって、
前記動画像データに含まれる音声をテキストデータに変換するステップと、
前記テキストデータからキーワードを抽出するステップと、
所定の検索システムにおける前記キーワードの重要度を算出するステップと、
算出した前記重要度が所定の条件を満たす場合に、前記キーワードを、前記動画像データのタグとして付与するステップと、を含む方法。
このような構成によれば、当該方法を実行するサーバは、動画像データに含まれる音声をテキストデータに変換し、テキストデータからキーワードを抽出し、所定の検索システムにおけるキーワードの重要度を算出し、算出した重要度が所定の条件を満たす場合に、キーワードを、動画像データのタグとして付与する。
このことにより、当該サーバは、動画像データの音声に含まれるキーワードのうち、検索システムにおける重要度が所定の条件を満たすもの、すなわち、当該動画像データを特徴付けるキーワードをタグとして付与できる。その結果、検索システムから得られる他のコンテンツをも考慮した情報に基づく効果的なタグを自動的に付与することができる。
(2) 前記重要度は、前記所定の検索システムにおける、前記キーワードによる検索結果の件数に基づくことを特徴とする(1)に記載の方法。
このような構成によれば、当該方法を実行するサーバは、検索システムにおける重要度として、キーワードによる検索結果の件数(ヒット数)を用いるので、より多くのWebページに登場するキーワードが動画像データに対するタグとして選択される。
このことにより、ユーザにとって馴染みの深いキーワードがタグ付けされることとなるため、当該動画像データ、あるいは当該動画像データを含むWebページが効果的に検索される可能性がある。
(3) 前記重要度は、前記所定の検索システムにおける、前記キーワードによる検索が実行された回数に基づくことを特徴とする(1)に記載の方法。
このような構成によれば、当該方法を実行するサーバは、検索システムにおける重要度として、キーワードによる検索が実行された回数(検索キーワードランキング)を用いるので、より多くユーザから検索が試みられたキーワードが動画像データのタグとして選択される。
このことにより、ユーザが頻繁に入力するキーワードが優先的にタグ付けされるため、当該動画像データ、あるいは当該動画像データを含むWebページが効果的に検索される可能性がある。
(4) 前記重要度は、前記キーワードの出現頻度に関する指標のTF(Term Frequency)とIDF(Inverse Document Frequency)の積であるTF・IDFに、更に基づくことを特徴とする(2)または(3)に記載の方法。
このような構成によれば、当該方法を実行するサーバは、検索システムにおける重要度として、ヒット数や検索キーワードランキングに加えて、TF・IDFというキーワードの出現頻度に基づく指標を用いる。
このことにより、例えば、ヒット数や検索キーワードランキングが所定の条件を満たさない場合であっても、TF・IDFにより動画像を特徴付けるキーワードであると判別されれば、当該キーワードをタグとして選択することができる。
その結果、単一の指標に基づくことにより重要なキーワードを見逃す可能性を低減でき、動画像を特徴付けるタグとして抽出することができる。
(5) 前記キーワードは、複数の単語の組み合わせであることを特徴とする(1)から(4)のいずれかに記載の方法。
このような構成によれば、当該方法を実行するサーバは、複数の単語の組み合わせについて重要度を判別してタグ付けを行う。このことにより、付与したタグが、1つの単語の場合に比べて、より内容を的確に表すことが可能となるため、検索システムにおけるヒット数や検索キーワードランキング等に基づいて選択することにより、より効果的なタグを付与できる可能性がある。
(6) 前記キーワードが、予め記憶したカテゴリデータと所定以上の類似度を有する場合に、当該カテゴリデータを、前記動画像データのタグとして付与するステップを更に含む(1)から(5)のいずれかに記載の方法。
このような構成によれば、当該方法を実行するサーバは、予め用意されたカテゴリデータとの類似度判定により、当該カテゴリデータをタグとして付与できるの。このことにより、例えば、カテゴリデータを動画像データの音声の中に含む場合に、当該動画像データを自動的にカテゴリ分類することができる。
(7) 前記キーワードに関して、所定の規則に基づいて分野を決定するステップと、
決定した前記分野を示すデータを、前記動画像データのタグとして付与するステップと、を更に含む(1)から(6)のいずれかに記載の方法。
このような構成によれば、当該方法を実行するサーバは、キーワードに関して、所定の規則に基づいて分野を決定し、決定した分野を示すデータを、動画像データのタグとして付与する。
このことにより、当該サーバは、所定の規則(分野推定技術)に基づいて、予め用意されたオントロジ(分類に使用する辞書データ等)により、動画像データを分類できる。その結果、動画像データの音声情報に基づいて、自動的に分野推定し、対応するタグを付与することができる。
(8) 動画像データにタグを付与するサーバであって、
前記動画像データに含まれる音声をテキストデータに変換する手段と、
前記テキストデータからキーワードを抽出する手段と、
所定の検索システムにおける前記キーワードの重要度を算出する手段と、
算出した前記重要度が所定の条件を満たす場合に、前記キーワードを、前記動画像データのタグとして付与する手段と、を備えるサーバ。
このような構成によれば、当該サーバを運用することにより、(1)と同様の効果が期待できる。
(9) 動画像データにタグを付与させるプログラムであって、
前記動画像データに含まれる音声をテキストデータに変換するステップと、
前記テキストデータからキーワードを抽出するステップと、
所定の検索システムにおける前記キーワードの重要度を算出するステップと、
算出した前記重要度が所定の条件を満たす場合に、前記キーワードを、前記動画像データのタグとして付与するステップと、をサーバに実行させるプログラム。
このような構成によれば、当該プログラムを当該サーバ上で実行することにより、(1)と同様の効果が期待できる。
本発明によれば、ある動画像データを他の複数の動画像データの中で特徴付けるためのタグを自動的に付与し、検索エンジンにより当該動画像データ、あるいは当該動画像データを含むWebページを効果的に抽出することができる。
本発明に係る好適な実施形態の一例について、図面に基づいて以下に説明する。
[システムの全体構成]
図1は、本発明の好適な実施形態の一例に係るコンテンツ管理システムの全体構成を表す概念図である。
タグ決定サーバ10、検索サーバ20、コンテンツサーバ30、および端末装置40は通信回線を介して接続されている。コンテンツサーバ30において、端末装置40のユーザにより送信(投稿)されたコンテンツを管理し、コンテンツDBに記憶している。
ここで、ユーザから投稿されるコンテンツには動画像データが含まれている。コンテンツサーバ30は、この動画像データをタグ決定サーバ10に送信することにより、動画像データに対するタグの決定を要求する。
タグ決定サーバ10は、タグを決定する際に参照する情報を取得するため、検索サーバ20に対して検索情報を要求する。検索サーバ20は、タグ決定サーバ10から受信したキーワードにより検索実行、あるいは予め収集したデータを抽出し、タグ決定サーバ10に提供する。これにより、タグ決定サーバ10は、後述する処理により動画像データに対するタグを決定し、コンテンツサーバ30に送信する。
このように決定したタグは、動画像データと関連付けてコンテンツDBに記憶することにより、ユーザからの要求に応じて表示させることができる。また、動画像データ、あるいは動画像データを含んだコンテンツの検索に際して、このタグが参照されるため、動画像データの内容に基づいた検索処理が可能となる。
なお、本実施形態におけるコンテンツ管理システムは、複数のサーバにより実現しているが、構成はこれには限られず、タグ決定サーバ10に検索サーバ20やコンテンツサーバ30の機能を併せ持つこととしてもよい。また、タグ決定サーバ10を各機能に応じて複数のサーバに分割してもよい。
[機能構成]
図2は、本発明の好適な実施形態の一例に係るタグ決定サーバ10の各機能を示すブロック図である。
タグ決定サーバ10は、音声認識部110、形態素解析部120、タグ候補抽出部130、検索情報収集部140、およびタグ決定部150を備え、動画像データの入力に応じて、タグデータを出力する。
音声認識部110は、受信した動画像データに含まれる音声データを抽出し、既存の音声認識技術を用いてテキストデータに変換する。このことにより、動画像データが含んでいる情報が文字情報として抽出されることとなる。
形態素解析部120は、音声認識部110にて生成されたテキストデータについて、形態素解析し、単語に分割する。ここで、形態素解析の方法には既存の技術を用いることができる。
タグ候補抽出部130は、形態素解析部120により分割された単語のうち、動画像データのタグとして付与可能なもの(キーワード)を抽出する。具体的には、名詞や動詞に品詞を限定する等、予め抽出規則を決めておくことが望ましい。
検索情報収集部140は、タグ候補抽出部130にて抽出されたタグ候補の中から、実際に付与するタグを決定するための参照情報として、検索サーバ20に問い合わせを行い、検索情報を収集する(詳細は後述する)。
タグ決定部150は、検索情報収集部140にて取得した検索情報を参照し、検索キーワードとして価値の高いものをタグ候補の中から抽出し、動画像データに対するタグとして決定する。このように、検索サーバ20からの情報収集により、Webの中における価値判断が可能となるため、動画像データのみから得られる情報でタグ付けする場合に比べて、より効果的な検索キーワードをタグ付けすることができる。
このようにして決定されたタグは、コンテンツサーバ30において動画像データと関連付けて記憶される。具体的には、例えば、図4に示すタグデータテーブルのように、動画像データ毎に複数のタグデータを記憶することが望ましい。なお、タグデータは、動画像に対して付与するとしたが、当該動画像を含むWebページに対して付与することとしてもよい。
[処理フロー]
図3は、本発明の好適な実施形態の一例に係るタグ決定サーバ10における、タグ決定処理の流れを示す図である。
ステップS101では、タグ決定サーバ10は、コンテンツサーバ30より、タグ付け対象である動画像データを受け付け、音声認識部110に引き渡す。
ステップS102では、音声認識部110は、ステップS101にて受け付けた動画像データから音声データを抽出する。動画像データには音声情報が含まれていることが多く、これを抽出することにより、当該動画像データの内容を示す情報を取得できる。
ステップS103では、音声認識部110は、ステップS102にて抽出した音声データをテキストデータへ変換する。具体的には、既存の技術を用いて実現でき、文字情報(テキストデータ)にすることで後続の言語処理が可能となる。
ステップS104では、形態素解析部120は、ステップS103にて生成されたテキストデータを形態素解析し、複数の単語に分解する。このことにより、動画像データの内容を示すデータとして、複数の単語が得られる。
ステップS105では、タグ候補抽出部130は、ステップS104にて取得した複数の単語のうち、タグの候補となるもの(キーワード)を抽出する。具体的には、例えば、名詞や動詞等の限られた品詞を抽出することにより、タグ候補を絞り込むことができる。
また、キーワードは複数の単語の組み合わせとしてもよく、例えば、名詞および動詞の組み合わせ等を抽出することによれば、内容をより特定できるため、タグとして適している可能性がある。その場合には、例えば、係り受け解析の技術を用いる等、単語間の関係を考慮した抽出を行うことが望ましい。
ステップS106では、検索情報収集部140は、ステップS105にて抽出したタグ候補キーワードに基づいて、検索サーバ20から検索情報を収集する。具体的には、例えば、検索サーバ20は、タグ決定サーバ10から受信したキーワードに基づいて、Webの検索を実行する。その結果、例えば図5に示す検索件数テーブルを得る。
検索件数テーブルには、キーワードに基づく検索結果の件数(ヒット件数)を格納している。ここで、例えば、「XXレストラン」であれば、検索結果として「1234件」がヒットしたことを示している。
また、検索サーバ20は、例えば図6に示すキーワード別入力回数テーブルのように、統計情報として、キーワードの入力頻度を管理することもでき、このテーブルのデータをタグ決定サーバ10に提供してもよい。
キーワード別入力回数テーブルには、検索サーバ20において実行された検索について、キーワード毎の入力回数を年月と共に記憶している。これにより、検索サーバ20は、所定の期間内におけるキーワードの入力頻度の順位を求めることができるので、この順位をタグ決定サーバ10に提供することとしてよい。
また、検索サーバ20は、所定の周期、タイミングにおいて、この順位を求めて記憶しておいてもよい。例えば、図7のキーワード・ランキングテーブルにおいては、年月毎にキーワードの入力回数の順位(ランキング)を記憶している。
なお、入力頻度の順位付けは、タグ決定サーバ10が行ってもよく、その場合、検索情報収集部140は、キーワード別入力回数テーブルのデータを受け取り、順位を算出する。
ステップS107では、タグ決定部150は、ステップS106にて取得した検索情報に基づいて、キーワードの重要度を判別する。具体的には、例えば、検索件数テーブル(図5)におけるヒット件数が1000件以上であるもの、キーワード別入力回数テーブル(図6)における前月の入力回数が10000回以上であるもの、キーワード・ランキングテーブル(図7)における前月のランキングが10000位以内のもの等、予め判別条件を設定しておく。
このような判別条件により、例えば、図5の検索件数テーブルを利用する場合においては、「XXレストラン」が「1234件」で1000件以上のヒット件数であるため、タグとして選択される。
また、図6のキーワード別入力回数テーブルを利用する場合においては、「XXレストラン」が「2007年4月」の入力回数「12345回」で10000回以上であるため、タグとして選択される。集計期間はこのように1ヶ月単位でもよいし、過去6ヶ月間等、予め設定した期間の合計値としてよい。
また、図7のキーワード・ランキングテーブルを利用する場合においては、「XXレストラン」が「4567位」、「ZZZホテル」が「8888位」で10000位以内であるため、タグとして選択されることとなる。
ここで、ヒット数やランキングが、これらの条件を満たさない場合には、例えばTF・IDFによるキーワードの重要度判定を行ってもよい。その場合、キーワードのTF・IDF値が予め記憶した閾値以上であれば、当該キーワードが動画像データを特徴付けており、重要度が高いものと判断できる。
なお、文書(当該動画像データ)中の出現頻度に関するTF値は、都度算出することとしてよいが、多数の文書集合の中での出現頻度に関するIDF値は、予め計算し、検索サーバ20に保持しておくことができる。
ステップS108では、キーワードの重要度が所定以上であると判別されたため、タグ決定部150は、当該キーワードをタグとして動画像データに付与する。具体的には、当該キーワードをコンテンツサーバ30に送信することにより、タグデータテーブル(図4)に記憶される。
ステップS109では、キーワードの重要度が所定以上でないため、タグ決定部150は、当該キーワードはタグとして相応しくないと判断し、別のタグを付与するための処理として、カテゴリの決定を行う。
具体的には、例えば、図8に示すように、予め記憶したカテゴリデータとの類似度判定(マッチング)により、キーワードと一致あるいは類似するカテゴリを決定する。また、カテゴリの決定は、このような類似度判定には限られない。例えば図9に示すように、所定のオントロジ(辞書データ等)を参照する分野推定技術を用いることにより、分野データを決定することができる。
ステップS110では、タグ決定部150は、ステップS109にて決定したカテゴリデータまたは分野データを、タグとして動画像データに付与する。具体的には、ステップS108と同様に、カテゴリデータまたは分野データをコンテンツサーバ30に送信することにより、タグデータテーブル(図4)に記憶される。
なお、カテゴリや分野の決定を、ステップS107におけるキーワードの重要度判定に応じて行っているが、ステップS109〜S110は、重要度判定によらず常に行うこととしてもよい。その場合には、動画像データから抽出したキーワードと、カテゴリや分野を示すデータとが共にタグとして付与されることとなる。
[サーバのハードウェア構成]
図10は、図1で説明したタグ決定サーバ10のハードウェア構成の一例を示す図である。タグ決定サーバ10は、制御部101を構成するCPU(Central Processing Unit)1010(マルチプロセッサ構成ではCPU1012等複数のCPUが追加されてもよい)、バスライン1005、通信I/F1040、メインメモリ1050、BIOS(Basic Input Output System)1060、USBポート1090、I/Oコントローラ1070、ならびにキーボードおよびマウス1100等の入力手段や表示装置1022を備える。
I/Oコントローラ1070には、テープドライブ1072、ハードディスク1074、光ディスクドライブ1076、半導体メモリ1078、等の記憶手段を接続することができる。
BIOS1060は、タグ決定サーバ10の起動時にCPU1010が実行するブートプログラムや、タグ決定サーバ10のハードウェアに依存するプログラム等を格納する。
記憶部107を構成するハードディスク1074は、タグ決定サーバ10がサーバとして機能するための各種プログラムおよび本発明の機能を実行するプログラムを記憶しており、更に必要に応じて各種データベースを構成可能である。
光ディスクドライブ1076としては、例えば、DVD−ROMドライブ、CD−ROMドライブ、DVD−RAMドライブ、CD−RAMドライブを使用することができる。この場合は各ドライブに対応した光ディスク1077を使用する。光ディスク1077から光ディスクドライブ1076によりプログラムまたはデータを読み取り、I/Oコントローラ1070を介してメインメモリ1050またはハードディスク1074に提供することもできる。
タグ決定サーバ10に提供されるプログラムは、ハードディスク1074、光ディスク1077、またはメモリーカード等の記録媒体に格納されて提供される。このプログラムは、I/Oコントローラ1070を介して、記録媒体から読み出され、または通信I/F1040を介してダウンロードされることによって、タグ決定サーバ10にインストールされ実行されてもよい。
前述のプログラムは、内部または外部の記憶媒体に格納されてもよい。ここで、記憶部107を構成する記憶媒体としては、ハードディスク1074、光ディスク1077、またはメモリーカードの他に、MD等の光磁気記録媒体、テープ媒体を用いることができる。また、専用通信回線やインターネットに接続されたサーバシステムに設けたハードディスク1074または光ディスクライブラリ等の記憶装置を記録媒体として使用し、通信回線を介してプログラムをタグ決定サーバ10に提供してもよい。
ここで、表示装置1022は、ユーザにデータの入力を受け付ける画面を表示したり、タグ決定サーバ10による演算処理結果の画面を表示したりするものであり、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。
ここで、入力手段は、ユーザによる入力の受け付けを行うものであり、キーボードおよびマウス1100等により構成してよい。
また、通信I/F1040は、タグ決定サーバ10を専用ネットワークまたは公共ネットワークを介して端末と接続できるようにするためのネットワーク・アダプタである。通信I/F1040は、モデム、ケーブル・モデムおよびイーサネット(登録商標)・アダプタを含んでよい。
以上の例は、タグ決定サーバ10について主に説明したが、コンピュータに、プログラムをインストールして、そのコンピュータをサーバ装置として動作させることにより上記で説明した機能を実現することもできる。したがって、本発明において一実施形態として説明したサーバにより実現される機能は、上述の方法を当該コンピュータにより実行することにより、あるいは、上述のプログラムを当該コンピュータに導入して実行することによっても実現可能である。
また、検索サーバ20およびコンテンツサーバ30についても、タグ決定サーバ10と同様な構成を持つ。
[端末のハードウェア構成]
端末装置40も、上述のタグ決定サーバ10と同様な構成を持つ。また、上述の例ではいわゆるコンピュータで実現した例について説明したが、更に、本発明の原理が適用可能である限り、携帯電話、PDA(Personal Data Assistant)、ゲーム機等の様々な端末で実現してよい。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
本発明の好適な実施形態の一例に係るコンテンツ管理システムの全体構成を表す概念図である。 本発明の好適な実施形態の一例に係るタグ決定サーバ10の各機能を示すブロック図である。 本発明の好適な実施形態の一例に係るタグ決定サーバ10における、タグ決定処理の流れを示す図である。 本発明の好適な実施形態の一例に係るタグデータテーブルを示す図である。 本発明の好適な実施形態の一例に係る検索件数テーブルを示す図である。 本発明の好適な実施形態の一例に係るキーワード別入力回数テーブルを示す図である。 本発明の好適な実施形態の一例に係るキーワード・ランキングテーブルを示す図である。 本発明の好適な実施形態の一例に係る類似度判定の概要を示す図である。 本発明の好適な実施形態の一例に係る分野推定の概要を示す図である。 本発明の好適な実施形態の一例に係るタグ決定サーバ10のハードウェア構成の一例を示す図である。
符号の説明
10 タグ決定サーバ
20 検索サーバ
30 コンテンツサーバ
40 端末装置
110 音声認識部
120 形態素解析部
130 タグ候補抽出部
140 検索情報収集部
150 タグ決定部

Claims (9)

  1. 動画像データにタグを付与する方法であって、
    前記動画像データに含まれる音声をテキストデータに変換するステップと、
    前記テキストデータからキーワードを抽出するステップと、
    所定の検索システムにおける前記キーワードの重要度を算出するステップと、
    算出した前記重要度が所定の条件を満たす場合に、前記キーワードを、前記動画像データのタグとして付与するステップと、を含む方法。
  2. 前記重要度は、前記所定の検索システムにおける、前記キーワードによる検索結果の件数に基づくことを特徴とする請求項1に記載の方法。
  3. 前記重要度は、前記所定の検索システムにおける、前記キーワードによる検索が実行された回数に基づくことを特徴とする請求項1に記載の方法。
  4. 前記重要度は、前記キーワードの出現頻度に関する指標のTFとIDFの積であるTF・IDFに、更に基づくことを特徴とする請求項2または請求項3に記載の方法。
  5. 前記キーワードは、複数の単語の組み合わせであることを特徴とする請求項1から請求項4のいずれかに記載の方法。
  6. 前記キーワードが、予め記憶したカテゴリデータと所定以上の類似度を有する場合に、当該カテゴリデータを、前記動画像データのタグとして付与するステップを更に含む請求項1から請求項5のいずれかに記載の方法。
  7. 前記キーワードに関して、所定の規則に基づいて分野を決定するステップと、
    決定した前記分野を示すデータを、前記動画像データのタグとして付与するステップと、を更に含む請求項1から請求項6のいずれかに記載の方法。
  8. 動画像データにタグを付与するサーバであって、
    前記動画像データに含まれる音声をテキストデータに変換する手段と、
    前記テキストデータからキーワードを抽出する手段と、
    所定の検索システムにおける前記キーワードの重要度を算出する手段と、
    算出した前記重要度が所定の条件を満たす場合に、前記キーワードを、前記動画像データのタグとして付与する手段と、を備えるサーバ。
  9. 動画像データにタグを付与させるプログラムであって、
    前記動画像データに含まれる音声をテキストデータに変換するステップと、
    前記テキストデータからキーワードを抽出するステップと、
    所定の検索システムにおける前記キーワードの重要度を算出するステップと、
    算出した前記重要度が所定の条件を満たす場合に、前記キーワードを、前記動画像データのタグとして付与するステップと、をサーバに実行させるプログラム。
JP2007106740A 2007-04-16 2007-04-16 タグを付与する方法 Active JP5226241B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007106740A JP5226241B2 (ja) 2007-04-16 2007-04-16 タグを付与する方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007106740A JP5226241B2 (ja) 2007-04-16 2007-04-16 タグを付与する方法

Publications (2)

Publication Number Publication Date
JP2008268985A true JP2008268985A (ja) 2008-11-06
JP5226241B2 JP5226241B2 (ja) 2013-07-03

Family

ID=40048448

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007106740A Active JP5226241B2 (ja) 2007-04-16 2007-04-16 タグを付与する方法

Country Status (1)

Country Link
JP (1) JP5226241B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113558A (ja) * 2008-11-07 2010-05-20 Hitachi Ltd 単語抽出装置、単語抽出方法及び受信装置
JP2015162244A (ja) * 2014-02-27 2015-09-07 富士ゼロックス株式会社 発話ワードをランク付けする方法、プログラム及び計算処理システム
US10817742B2 (en) 2017-10-18 2020-10-27 Mercari, Inc. Product information generation system, product information generation program, and product information generation method
JP2021190079A (ja) * 2020-06-03 2021-12-13 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド ビデオタグの生成方法、装置、電子機器及び記憶媒体
JP2022140731A (ja) * 2021-03-05 2022-09-27 凸版印刷株式会社 電子チラシ管理装置、電子チラシ管理方法
WO2022210460A1 (ja) * 2021-03-31 2022-10-06 富士フイルム株式会社 デジタルデータへのタグ付け装置、タグ付け方法、プログラムおよび記録媒体

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104281252B (zh) * 2013-07-12 2017-12-26 联想(北京)有限公司 一种信息处理方法及电子设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0721202A (ja) * 1993-06-18 1995-01-24 Sharp Corp 非コード化情報のデータベース化方式
JPH09204437A (ja) * 1996-01-26 1997-08-05 Fuji Xerox Co Ltd 文書検索装置
JP2000067085A (ja) * 1999-07-23 2000-03-03 Sharp Corp 非コ―ド化情報のデ―タベ―ス化方式
JP2001167124A (ja) * 1999-12-13 2001-06-22 Sharp Corp 文書分類装置及び文書分類プログラムを記録した記録媒体
JP2002171481A (ja) * 2000-12-04 2002-06-14 Ricoh Co Ltd 映像処理装置
JP2004206476A (ja) * 2002-12-25 2004-07-22 Internatl Business Mach Corp <Ibm> データベースシステム、端末装置、検索データベースサーバ、検索キー入力支援方法及びプログラム
JP2005050221A (ja) * 2003-07-30 2005-02-24 Nec Corp 電話および電子メールの送受信におけるサーチ検索システム
JP2005149014A (ja) * 2003-11-13 2005-06-09 Nippon Telegr & Teleph Corp <Ntt> 文書関連語彙獲得方法及び装置及びプログラム
JP2005292871A (ja) * 2004-03-31 2005-10-20 Nomura Research Institute Ltd 技術文献の市場性分析システム及び市場性分析プログラム
JP2005301856A (ja) * 2004-04-15 2005-10-27 Hitachi Ltd 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0721202A (ja) * 1993-06-18 1995-01-24 Sharp Corp 非コード化情報のデータベース化方式
JPH09204437A (ja) * 1996-01-26 1997-08-05 Fuji Xerox Co Ltd 文書検索装置
JP2000067085A (ja) * 1999-07-23 2000-03-03 Sharp Corp 非コ―ド化情報のデ―タベ―ス化方式
JP2001167124A (ja) * 1999-12-13 2001-06-22 Sharp Corp 文書分類装置及び文書分類プログラムを記録した記録媒体
JP2002171481A (ja) * 2000-12-04 2002-06-14 Ricoh Co Ltd 映像処理装置
JP2004206476A (ja) * 2002-12-25 2004-07-22 Internatl Business Mach Corp <Ibm> データベースシステム、端末装置、検索データベースサーバ、検索キー入力支援方法及びプログラム
JP2005050221A (ja) * 2003-07-30 2005-02-24 Nec Corp 電話および電子メールの送受信におけるサーチ検索システム
JP2005149014A (ja) * 2003-11-13 2005-06-09 Nippon Telegr & Teleph Corp <Ntt> 文書関連語彙獲得方法及び装置及びプログラム
JP2005292871A (ja) * 2004-03-31 2005-10-20 Nomura Research Institute Ltd 技術文献の市場性分析システム及び市場性分析プログラム
JP2005301856A (ja) * 2004-04-15 2005-10-27 Hitachi Ltd 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113558A (ja) * 2008-11-07 2010-05-20 Hitachi Ltd 単語抽出装置、単語抽出方法及び受信装置
JP2015162244A (ja) * 2014-02-27 2015-09-07 富士ゼロックス株式会社 発話ワードをランク付けする方法、プログラム及び計算処理システム
US10817742B2 (en) 2017-10-18 2020-10-27 Mercari, Inc. Product information generation system, product information generation program, and product information generation method
JP2021190079A (ja) * 2020-06-03 2021-12-13 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド ビデオタグの生成方法、装置、電子機器及び記憶媒体
JP7080300B2 (ja) 2020-06-03 2022-06-03 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド ビデオタグの生成方法、装置、電子機器及び記憶媒体
US11508153B2 (en) 2020-06-03 2022-11-22 Beijing Baidu Netcom Science And Technology Co., Ltd. Method for generating tag of video, electronic device, and storage medium
JP2022140731A (ja) * 2021-03-05 2022-09-27 凸版印刷株式会社 電子チラシ管理装置、電子チラシ管理方法
JP2023036804A (ja) * 2021-03-05 2023-03-14 凸版印刷株式会社 電子チラシ管理装置、電子チラシ管理方法
JP7255736B2 (ja) 2021-03-05 2023-04-11 凸版印刷株式会社 電子チラシ管理装置、電子チラシ管理方法
JP7327628B2 (ja) 2021-03-05 2023-08-16 凸版印刷株式会社 電子チラシ管理装置、電子チラシ管理方法
WO2022210460A1 (ja) * 2021-03-31 2022-10-06 富士フイルム株式会社 デジタルデータへのタグ付け装置、タグ付け方法、プログラムおよび記録媒体

Also Published As

Publication number Publication date
JP5226241B2 (ja) 2013-07-03

Similar Documents

Publication Publication Date Title
JP5727512B2 (ja) 検索提案のクラスタ化及び提示
US9864741B2 (en) Automated collective term and phrase index
US8065145B2 (en) Keyword outputting apparatus and method
JP6095621B2 (ja) 回答候補間の関係を識別および表示する機構、方法、コンピュータ・プログラム、ならびに装置
JP4962986B2 (ja) コンテンツデータをカテゴリに分類する方法、サーバ、およびプログラム
US20080086465A1 (en) Establishing document relevance by semantic network density
KR20160149978A (ko) 검색 엔진 및 그의 구현 방법
JP5226241B2 (ja) タグを付与する方法
US20080021891A1 (en) Searching a document using relevance feedback
CN109558513B (zh) 一种内容推荐方法、装置、终端及存储介质
CN109033385B (zh) 图片检索方法、装置、服务器及存储介质
JP7451747B2 (ja) コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体
US10152478B2 (en) Apparatus, system and method for string disambiguation and entity ranking
Pervin et al. Fast, scalable, and context-sensitive detection of trending topics in microblog post streams
WO2015188719A1 (zh) 结构化数据与图片的关联方法与关联装置
CN113032673B (zh) 资源的获取方法、装置、计算机设备及存储介质
CN107861948B (zh) 一种标签提取方法、装置、设备和介质
KR101651780B1 (ko) 빅 데이터 처리 기술을 이용한 연관 단어 추출 방법 및 그 시스템
JP7395377B2 (ja) コンテンツ検索方法、装置、機器、および記憶媒体
JP7389330B2 (ja) 情報処理プログラム、情報処理方法および情報処理装置
JP4819628B2 (ja) ドキュメントデータを検索する方法、サーバ、およびプログラム
JP2006227823A (ja) 情報処理装置及びその制御方法
WO2010132062A1 (en) System and methods for sentiment analysis
JP2003173352A (ja) 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体
JP2006178599A (ja) 文書検索装置および方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110523

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111012

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20111020

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20111111

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120312

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20120910

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130314

R150 Certificate of patent or registration of utility model

Ref document number: 5226241

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160322

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250