JP2011043908A - 番組検索装置および番組検索プログラム - Google Patents
番組検索装置および番組検索プログラム Download PDFInfo
- Publication number
- JP2011043908A JP2011043908A JP2009190237A JP2009190237A JP2011043908A JP 2011043908 A JP2011043908 A JP 2011043908A JP 2009190237 A JP2009190237 A JP 2009190237A JP 2009190237 A JP2009190237 A JP 2009190237A JP 2011043908 A JP2011043908 A JP 2011043908A
- Authority
- JP
- Japan
- Prior art keywords
- program
- expression
- information
- appearance frequency
- specific expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
【解決手段】出現頻度情報と固有表現情報を記憶する番組情報記憶部と、番組情報を取得する番組情報取得部と、指定された指定番組に関して番組情報取得部が取得した番組情報における表現の出現頻度をカウントする出現頻度カウント部と、前記出現頻度と番組情報記憶部から読み出した特定の検索対象番組に関する出現頻度情報とに基づき、指定番組と検索対象番組との間での表現の共起の度合いを計算するとともに、固有表現重み値によって重み付ける処理をすることによって関連度を算出する類似度計算部と、類似度計算部が算出した関連度に基づいて選択された検索対象番組を出力する検索結果提示部を、番組検索装置が備えるようにする。
【選択図】図1
Description
また、協調フィルタリングなど、履歴に基づいて番組を検索する方法では、指定された番組に関連している内容を有する番組が選択されるとは限らない。
ここで、表現とは、番組情報のテキストに含まれる単語、あるいは単語の連鎖などである。複合語などの表現の出現頻度を統計的に扱うために、例えば、n個の単語の連鎖を表わすnグラム(n−gram,エヌグラム)を用いることは好適である。このとき、ストップワード(助詞等)を含むnグラムを除外したnグラムのみを用いても良い。
上記した共起の度合いを表わす尺度は、単に指定番組と特定の検索対象番組とにおける表現の出現頻度のみによって定まるものではなく、検索対象となるデータベース全体の番組における当該表現の出現頻度によっても変わる。つまり、ありふれた表現であるか番組特有の表現であるかに応じて、共起の度合いを表わす尺度の値は変わる。
なお、検索結果提示部は、1つの検索対象番組のみを選択して出力しても良く、複数の検索対象番組を選択して出力しても良い。通常は、計算された関連度が高いものを選択する。
指定番組および検索対象番組は、それぞれ、放送される番組や、通信回線等を介して配信される番組等の動画像コンテンツである。なお、指定番組あるいは検索対象番組は、番組全体を単位として扱っても良く、また、いわゆる番組を複数の項目(項目とは、番組内の意味的なまとまりの単位であり、例えば、ニュース番組における個々のニュース項目はここで言う項目である。)に分けて、個々の項目を単位として、出現頻度をカウントしたり、関連度の計算の対象としたり、選択して提示する対象とするようにしても良い。
決定された関係ラベルを出力することにより、検索結果として選択された番組がなぜ選択されたかを説明付けることが可能となる。また、決定された関係ラベルごとに分類する形式で、複数の検索結果の番組を提示するようにできる。
固有表現重み値は、個々の固有表現ごとに決定しても良い。また例えば、固有表現の種別を決定し、この種別に応じて固有表現重み値を決定しても良い。また、固有表現の種別を、固有表現情報の一部として記憶するようにしても良い。
図1は、本実施形態による番組検索装置の機能構成を示すブロック図である。同図において、符号1は番組検索装置である。図示するように、番組検索装置1は、番組情報取得部10と、出現頻度カウント部11と、番組情報記憶部12と、類似度計算部15と、検索結果提示部18と、固有表現特定部21と、関係ラベル決定部22とを含んで構成される。また、番組検索装置1は、外部記憶装置91やサーバコンピュータ92と接続されており、通信により、これらの外部の装置からデータを取得することが出来るように構成されている。
図4は、ウェブページデータ取得部102が取得するウェブページデータに基づいてマークアップされた番組情報のウェブページの画面表示例を示す概略図である。図示するように、このウェブページデータは、番組内容に関するテキストのデータを含んでいる。
図5は、放送番組の画面内に表示されているクローズドキャプションデータの例を示す概略図である。図示するように、クローズドキャプションデータは、番組内での発話内容のテキストデータである。
このように、クローズドキャプションデータが番組IDのデータを有していることにより、クローズドキャプションデータ取得部103は、特定の番組のデータのみを容易に取得することができる。また、クローズドキャプションデータが項目IDのデータを有していることにより、クローズドキャプションデータ取得部103は、番組内の特定の項目のデータのみを容易に取得することができる。
なお、クローズドキャプションデータ取得部103が、項目IDを含まない形式のクローズドキャプションデータを外部から取得し、分析結果に基づいて項目IDを付加するようにしても良く、また、クローズドキャプションデータ取得部103が、項目IDを含んだ形式のクローズドキャプションデータを外部から取得するようにしても良い。前者の場合には、クローズドキャプションデータ取得部103は、画像処理技術を用いて番組の映像に含まれるアナウンサーを識別したり、音声認識により所定の長さを有する無声区間を認識したり、クローズドキャプションに含まれるテキストや番組の音声を認識した結果を基にトピックを認識したりする方法で、番組を複数の項目に分割し、そして個々の項目に対してユニークな項目IDを付与する。
同図に示すように、出現頻度情報121は表形式のデータとして構成され、番組ID、項目ID、連鎖数(n)、nグラム、頻度の各項目を含んでいる。番組IDおよび項目IDは、既に説明した通りである。連鎖数は、1つのnグラムに含まれる単語数である。nグラムは、連鎖数の分の単語のつながりを表記した文字列データである。例えば、連鎖数が3である3−グラムを、「経済−産業−省」といったように「−」によって単語をつないで表記している。頻度は、当該番組内(あるいは当該番組における当該項目内)における当該nグラムの出現回数を表わす数値である。
まずステップS101において、番組情報取得部10が、外部記憶装置91やサーバコンピュータ92などから番組情報を取得する。このとき、番組情報取得部10は、前述の電子番組ガイドデータやウェブページデータやクローズドキャプションデータを適宜選択して取得する。また、番組情報取得部10は、ある1つの番組に対して複数種類の番組情報(例えば、電子番組ガイドデータとウェブページデータ)を取得する場合もある。
具体的には、出現頻度カウント部11は、まず番組情報取得部10が取得した番組情報を読み込み、既存技術を用いて番組情報のテキストの形態素解析処理を行い、これらのテキストを形態素の列に分解する。そして、この形態素列から、予め定められた所定の連鎖数のnグラムを抽出する。例えば、連鎖数として、n=1,2,3を用いる場合、テキスト中の「・・・経済産業省・・・」という部分からは、「経済」、「産業」、「省」というそれぞれの1−グラムと、「経済−産業」、「産業−省」というそれぞれの2−グラムと、「経済−産業−省」という3−グラムが抽出される。そして、出現頻度カウント部11は、番組ごと(但し、番組内の項目ごとの場合もあり。以下で「番組ごと」と述べる処理についても同様に項目ごとの処理とすることができる。)の各々のnグラムの出現頻度をカウントする。出現頻度カウント部11は、その結果を番組情報記憶部12の出現頻度情報121に書き込む。これにより、あるnグラムTnについて、そのTnが含まれる番組数(番組内の項目ごとの処理の場合には「項目数」。以下では統一的に「番組数」と呼ぶ。なお、項目ごとの処理をする番組とそうでない番組が混在している場合も同様)mと、番組中に含まれるTnの数tfが得られる。
なお、この処理において、出現頻度カウント部11は、予め定められたストップワード(助詞等)を含まないnグラムを抽出する。これにより、番組内容の特徴をより良く表わす出現頻度情報が得られる。
また、文献(関根聡,「関根の拡張固有表現階層」定義 Version 7.0.0,2007年3月8日,URL:http://nlp.cs.nyu.edu/ene/version7_0_0.html)は、拡張固有表現として、概念的に階層化された200種類の固有表現タグを定義している。その最も上の階層で定義されている固有表現の種類は、名前その他、人名、神名、組織名、地名、施設名、製品名、イベント名、自然物名、病気名、色名である。
なお、固有表現の種類の定義を適宜選択して用いるようにすれば良いが、一実施例としては、上記の拡張固有表現に定義されている200種類の中から、PERSON(人名)、TITLE(称号名)、ORGANIZATION(組織名)、LIVING_THING(生物名)、GPE(Geological Political Entity、政治的地名(国名、都道府県名、州名、郡名、市区町村名など))、FACILITY(施設名)を用いる。
SVM(Support Vector Machine、サポートベクターマシン)やCRF(Conditional Random Fields、条件付確率場)などといった既存の機械学習技術を用いて抽出する方法や、辞書やルールなど事前に与えられた情報に基づいて抽出する方法、あるいはそれらを組み合わせた方法がある。
機械学習技術を用いて固有表現を抽出する方法の概略は次の通りである。即ち、まず、番組情報のテキストの形態素解析を行う。そして、その結果得られる各形態素の素性を抽出する。ここで、素性とは、形態素の読み(辞書データから得られる)や、概念(概念辞書データから得られる)や、品詞などであり、これらの素性を組み合わせて、個々の形態素に対して数十次元の素性ベクトルを作る。一実施例としては、57次元の素性ベクトルを用いた。これにより、テキストから固有表現を抽出するという問題は、ある形態素に対応する素性ベクトルが特定のラベルを有するか否か(拡張固有表現の一種に該当するか否か)を識別する問題に還元される。そこで、学習用データに対して、人がラベル付けを行う。これを教師データとして、SVMやCRFによって学習を行う。この学習を行っておくことによって、与えられる任意の形態素に対応する素性ベクトルが特定のラベルを有するか否かを識別できるようになる。つまり、機械学習の結果を用いることにより、任意の入力テキストに含まれる形態素に、固有表現のラベル付けを行なうことができる。即ち、取得した番組情報から固有表現の抽出を行い、同時に抽出された固有表現の種類を特定することができる。
具体的には、固有表現特定部21は、固有表現の種類(タグ)ごとに予め定められた重みを付与するようにする。このとき、例えば人名を重視する場合には、タグ「PERSON」に対する重みの値を相対的に大きく設定する。また、固有表現の種類ごとにではなく、個々の固有表現ごとに重みの値を決定するようにしても良い。
また、重みの値の決定方法としては、予め人手で番組間の類似性の評価を行い、その結果(番組Aと番組Bがどの程度類似しているかを表わす指標)を学習のための教師データとする。この教師データには、人手若しくは機械学習により固有表現のタグを付与しておく。そして、各固有表現の重みの初期値を適宜設定し、その重みを用いて類似度計算部15の処理(後述する)によって番組間の類似度を計算する。その計算結果を、上記の教師データと比較して、評価関数により評価する。そして、評価関数の値が良くなる方向に、最急勾配法などを用いて、重みを変化させていく。その結果得られた最適な各固有表現の重みを採用する。
まずステップS201において、番組指定手段(不図示)が検索の基となる番組Qを指定する。本実施形態による番組検索装置1が、放送信号を受信してその映像を画面に表示する機能(テレビ受信機機能)を兼ね備えている場合には、この番組指定手段は、例えば現在表示中の番組を番組Qとして指定する。また、番組検索装置1の外部からの信号や、操作者による操作に基づいて、番組指定手段が検索の基となる番組Qを指定するようにしても良い。
次にステップS203において、出現頻度カウント部11が、上で取得した番組Qについての番組情報に基づき、そのデータに含まれるnグラムを抽出するとともに、それらのnグラムの出現頻度をカウントする。出現頻度カウント部11による具体的な動作は、前図のステップS102についての説明で述べた通りである。
また、weneは前述した通り拡張固有表現に対応する重みであり。この重みweneを用いて関連度を計算することにより、単に出現頻度の統計的特徴だけによらず、語の意味にも基づいた関連度を算出することができる。
また、wngは、nグラムの連鎖数に対応する重みであり、具体的には例えば、
wng=1/n
あるいは、
wng=1/(2n)
などといったように、nが大きくなるほど重みwngが小さくなるようにする。この重みwngを用いることにより、番組情報に含まれる複合語に対して過剰に高い関連度が算出されることを防ぐことができる。例えば、番組Qと番組Dの両方の番組情報に「経済産業省」という単語が含まれていた場合に、3−グラムの「経済−産業−省」だけでなく、2−グラムの「経済−産業」、「産業−省」や、1−グラムの「経済」、「産業」,「省」なども両番組情報間で共起する。このような場合にも、式(1)において重みwngの要素が作用することによって、これらのnグラムが関連度に対して過剰に作用することを防ぐ。
また、Kは、下の式(3)によって表わされる。
また、式(2)および式(3)における、bや、k1や、k3は、適宜設定されるパラメータである。これらのパラメータの一例としては、
b=0.75,
k1=1.2,
k3=7
といった値を用いる。
またこのとき、上で決定されたラベルが固有表現に該当する場合には、番組情報記憶部12の固有表現情報122から読み出された情報に基づいて、関係ラベル決定部22が、そのラベルに対応する固有表現種別を併せて決定するようにしても良い。
また、このとき、検索結果提示部18は、画面中央に表示された番組Qの動画コンテンツを再生表示しながら、その周辺に、上述した関連番組のサムネール画像を表示し、操作者がそれらのサムネール画像のいずれかをクリックする操作をした場合には、今度はその選択された関連番組を指定番組Qとして、画面中央に表示再生するように切り替える。
(a)検索結果提示部18は、指定された番組Qを表示し、また、上位所定個の番組の関連度の合計が高いラベルと、そのラベルに対応する固有表現種別と、そのラベルに属する番組のうち関連度が上位の番組を表示する。
また、この方法だけでなく、検索結果提示部18が下の(b)〜(f)などのいずれかの方法で検索結果を画面に表示するようにしても良い。
(b)検索結果提示部18は、上記(a)と同様の表示をするが、但し、固有表現種別の表示を行なわない。
(c)検索結果提示部18は、上記(a)または(b)のいずれかの表示に加えて、ラベルに含まれる番組の関連度の合計値としては上位のラベルに含まれないが、各番組単独での番組Qとの関連度が高いような番組がある場合には、そのような単数又は複数の番組を併せて表示する。また、それらの番組は共通のラベルを持たないため、ラベルの代わりに「その他」などといった文言を併せて表示するようにしても良い。
(d)検索結果提示部18は、ラベルを考慮せず、単純に番組データベース中の全番組から関連度S(D,Q)が上位の所定個の番組を選んで表示する。この場合には、番組検索装置1が関係ラベル決定部22を含まない構成でも良い。
(e)検索結果提示部18は、番組をラベルごとに分類して並べることはないが、番組データベース中の全番組から関連度S(D,Q)が上位の所定個の番組を選んでスコアで順序付けて表示し、各番組に対応するラベルの文字列を表示する。
(f)検索結果提示部18は、上記(e)の表示に加えて、ラベルに対応する固有表現種別がある場合には、それを併せて表示する。
また、検索結果提示部18は、上記の(a)〜(f)のさらなるバリエーションによる表示を行っても良い。
また、上述した実施形態における番組検索装置の機能を放送受信機に組み込むことによって実現しても良い。
視聴者が視聴中の番組に関連する番組をどの程度良い精度で検索できるかを調べるため、上記実施形態の試作システムを用いた関連番組検索の評価実験を行なった。実験では、種類に重複のない15番組を検索元とし、検索結果の上位10番組を評価した。番組間の関連性を4段階(4:関連ある,3:少し関連ある,2:あまり関連ない,1:関連ない)で、関係の種類を示す関係ラベルを3段階(3:適切,2:ほぼ適切,1:不適切)で、それぞれ主観評価した。ベースラインとして、形態素のtf−idf値を素性としたCosine類似度を用いた。ラベルには、tf−idf値が最も高い形態素を付与した。
10 番組情報取得部
11 出現頻度カウント部
12 番組情報記憶部
15 類似度計算部
18 検索結果提示部
21 固有表現特定部
22 関係ラベル決定部
Claims (5)
- 番組の内容を表わすテキストを含む番組情報における前記番組ごとの表現の出現頻度を表わす出現頻度情報と、前記番組情報に含まれる固有表現と前記固有表現に対応する固有表現重み値とを関連付けて記憶する固有表現情報と、を記憶する番組情報記憶部と、
前記番組情報を取得する番組情報取得部と、
指定された指定番組に関して前記番組情報取得部が取得した前記番組情報における表現の出現頻度をカウントする出現頻度カウント部と、
前記指定番組に関する前記番組情報について前記出現頻度カウント部がカウントして得られた表現ごとの前記出現頻度と、前記番組情報記憶部から読み出した特定の検索対象番組に関する前記出現頻度情報と、前記番組情報記憶部から読み出した前記固有表現情報とに基づき、前記指定番組と前記検索対象番組との間での前記表現の共起の度合いを計算するとともに、当該表現が前記固有表現情報に含まれる固有表現である場合には前記共起の度合いを前記固有表現重み値によって重み付ける処理をすることによって、前記指定番組と前記検索対象番組との間の関連度を算出する類似度計算部と、
前記類似度計算部が算出した前記関連度に基づいて選択された前記検索対象番組を出力する検索結果提示部と、
を備えることを特徴とする番組検索装置。 - 前記表現はnグラムであり、
前記番組情報記憶部が記憶する前記出現頻度情報は、番組ごとのnグラムの出現頻度を表わすものであり、且つ前記出現頻度情報は、番組ごとの所定の複数の連鎖数の前記nグラムごとの出現頻度を含むものであり、
前記出現頻度カウント部は、前記指定番組に関する前記番組情報における前記所定の複数の連鎖数の前記nグラムごとの出現頻度をカウントするものであり、
前記類似度計算部は、前記指定番組と前記検索対象番組との間での前記所定の複数の連鎖数のnグラムの共起の度合いを計算するものであり、特定の連鎖数のnグラムの共起の度合いを、当該連鎖数に応じたnグラム重み値によって重み付ける処理をさらに行うことによって前記関連度を算出する、
ことを特徴とする請求項1に記載の番組検索装置。 - 前記指定番組と前記検索対象番組との間での表現の共起の度合いに対して、当該表現が前記固有表現情報に含まれる固有表現である場合には前記共起の度合いを前記固有表現重み値によって重み付ける処理を行った結果に基づき、前記指定番組と前記検索対象番組との間の関係を表わす前記表現を関係ラベルとして決定する関係ラベル決定部を更に備え、
前記検索結果提示部は、対応する前記関係ラベルと関連付けて選択された前記検索対象番組を出力する、
ことを特徴とする請求項1又は請求項2に記載の番組検索装置。 - 検索対象とするための番組に関して前記番組情報取得部が取得した前記番組情報から固有表現を抽出する処理を行なうとともに、抽出された前記固有表現に対応する前記固有表現重み値を決定し、前記固有表現情報を作成して前記番組情報記憶部に書き込む固有表現特定部、を更に備え、
前記出現頻度カウント部は、検索対象とするための番組に関しても前記番組情報取得部が取得した前記番組情報における表現の出現頻度をカウントし、前記出現頻度情報を作成して前記番組情報記憶部に書き込む、
ことを特徴とする請求項1から3までのいずれか一項に記載の番組検索装置。 - コンピュータを、
番組の内容を表わすテキストを含む番組情報における前記番組ごとの表現の出現頻度を表わす出現頻度情報と、前記番組情報に含まれる固有表現と前記固有表現に対応する固有表現重み値とを関連付けて記憶する固有表現情報と、を記憶する番組情報記憶部と、
前記番組情報を取得する番組情報取得部と、
指定された指定番組に関して前記番組情報取得部が取得した前記番組情報における表現の出現頻度をカウントする出現頻度カウント部と、
前記指定番組に関する前記番組情報について前記出現頻度カウント部がカウントして得られた表現ごとの前記出現頻度と、前記番組情報記憶部から読み出した特定の検索対象番組に関する前記出現頻度情報と、前記番組情報記憶部から読み出した前記固有表現情報とに基づき、前記指定番組と前記検索対象番組との間での前記表現の共起の度合いを計算するとともに、当該表現が前記固有表現情報に含まれる固有表現である場合には前記共起の度合いを前記固有表現重み値によって重み付ける処理をすることによって、前記指定番組と前記検索対象番組との間の関連度を算出する類似度計算部と、
前記類似度計算部が算出した前記関連度に基づいて選択された前記検索対象番組を出力する検索結果提示部と、
を備える番組検索装置として機能させる番組検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009190237A JP5478146B2 (ja) | 2009-08-19 | 2009-08-19 | 番組検索装置および番組検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009190237A JP5478146B2 (ja) | 2009-08-19 | 2009-08-19 | 番組検索装置および番組検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011043908A true JP2011043908A (ja) | 2011-03-03 |
JP5478146B2 JP5478146B2 (ja) | 2014-04-23 |
Family
ID=43831307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009190237A Active JP5478146B2 (ja) | 2009-08-19 | 2009-08-19 | 番組検索装置および番組検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5478146B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013239132A (ja) * | 2012-05-17 | 2013-11-28 | Nippon Hoso Kyokai <Nhk> | 類似度算出装置、類似番組検索装置、およびそのプログラム |
JP2018170036A (ja) * | 2012-09-07 | 2018-11-01 | クロール・インフォメーション・アシュアランス,エルエルシー | ファイル共有ネットワークにおけるスニペット照合 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004252892A (ja) * | 2003-02-21 | 2004-09-09 | Ntt Data Technology Corp | 類似文書検索方法及びシステム |
JP2006235875A (ja) * | 2005-02-23 | 2006-09-07 | Nippon Telegr & Teleph Corp <Ntt> | 情報ナビゲーション方法及び装置及びプログラム |
JP2009033234A (ja) * | 2007-07-24 | 2009-02-12 | Sony Corp | 番組情報処理装置及び番組情報処理方法 |
JP2009523270A (ja) * | 2005-12-09 | 2009-06-18 | フラウンホファー‐ゲゼルシャフト・ツア・フェルダルング ・デア・アンゲバンテン・フォルシュング・エー・ファウ. | データ列の自動比較に用いられる方法およびその装置 |
-
2009
- 2009-08-19 JP JP2009190237A patent/JP5478146B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004252892A (ja) * | 2003-02-21 | 2004-09-09 | Ntt Data Technology Corp | 類似文書検索方法及びシステム |
JP2006235875A (ja) * | 2005-02-23 | 2006-09-07 | Nippon Telegr & Teleph Corp <Ntt> | 情報ナビゲーション方法及び装置及びプログラム |
JP2009523270A (ja) * | 2005-12-09 | 2009-06-18 | フラウンホファー‐ゲゼルシャフト・ツア・フェルダルング ・デア・アンゲバンテン・フォルシュング・エー・ファウ. | データ列の自動比較に用いられる方法およびその装置 |
JP2009033234A (ja) * | 2007-07-24 | 2009-02-12 | Sony Corp | 番組情報処理装置及び番組情報処理方法 |
Non-Patent Citations (2)
Title |
---|
CSNG200202468002; 賀沢 秀人 他: '固有表現に着目した双方向イベントトラッキングとその文書要約への応用' 情報処理学会研究報告 第2001巻 第54号, 20010601, pp.9-15, 社団法人情報処理学会 * |
JPN6013019899; 賀沢 秀人 他: '固有表現に着目した双方向イベントトラッキングとその文書要約への応用' 情報処理学会研究報告 第2001巻 第54号, 20010601, pp.9-15, 社団法人情報処理学会 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013239132A (ja) * | 2012-05-17 | 2013-11-28 | Nippon Hoso Kyokai <Nhk> | 類似度算出装置、類似番組検索装置、およびそのプログラム |
JP2018170036A (ja) * | 2012-09-07 | 2018-11-01 | クロール・インフォメーション・アシュアランス,エルエルシー | ファイル共有ネットワークにおけるスニペット照合 |
Also Published As
Publication number | Publication date |
---|---|
JP5478146B2 (ja) | 2014-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9195741B2 (en) | Triggering music answer boxes relevant to user search queries | |
US9256679B2 (en) | Information search method and system, information provision method and system based on user's intention | |
US8306962B1 (en) | Generating targeted paid search campaigns | |
US8229949B2 (en) | Apparatus, method and program product for presenting next search keyword | |
US8352321B2 (en) | In-text embedded advertising | |
US20170213469A1 (en) | Digital media content extraction and natural language processing system | |
JP4365074B2 (ja) | ユーザ定義可能なパーソナリティを備えた文書拡充システム | |
US7624093B2 (en) | Method and system for automatic summarization and digest of celebrity news | |
US20090030899A1 (en) | Processing a content item with regard to an event and a location | |
JP2011529600A (ja) | 意味ベクトルおよびキーワード解析を使用することによるデータセットを関係付けるための方法および装置 | |
WO2006019101A1 (ja) | コンテンツ関連情報取得装置、およびプログラム | |
JP6429382B2 (ja) | コンテンツ推薦装置、及びプログラム | |
JP2009043156A (ja) | 番組検索装置および番組検索方法 | |
Chiny et al. | Netflix recommendation system based on TF-IDF and cosine similarity algorithms | |
JP2008287517A (ja) | 強調表示装置及びプログラム | |
JP2011107826A (ja) | 行動情報抽出システム及び抽出方法 | |
Strzelecki et al. | Direct answers in Google search results | |
Broughton | A faceted classification as the basis of a faceted terminology: conversion of a classified structure to thesaurus format in the Bliss Bibliographic Classification | |
JP4883644B2 (ja) | リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法 | |
CN108140034B (zh) | 使用主题模型基于接收的词项选择内容项目 | |
JP5478146B2 (ja) | 番組検索装置および番組検索プログラム | |
KR20120071194A (ko) | 사용자 리뷰를 이용한 컨텐츠 추천 장치 및 그 방법 | |
US20230090601A1 (en) | System and method for polarity analysis | |
JP5415369B2 (ja) | 番組検索装置および番組検索プログラム | |
Welch | Addressing the challenges of underspecification in web search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130507 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130704 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140210 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5478146 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |