JP4848397B2 - 関連クエリ導出装置、関連クエリ導出方法及びプログラム - Google Patents

関連クエリ導出装置、関連クエリ導出方法及びプログラム Download PDF

Info

Publication number
JP4848397B2
JP4848397B2 JP2008163265A JP2008163265A JP4848397B2 JP 4848397 B2 JP4848397 B2 JP 4848397B2 JP 2008163265 A JP2008163265 A JP 2008163265A JP 2008163265 A JP2008163265 A JP 2008163265A JP 4848397 B2 JP4848397 B2 JP 4848397B2
Authority
JP
Japan
Prior art keywords
information
query
content
attribute information
title
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008163265A
Other languages
English (en)
Other versions
JP2010003219A (ja
Inventor
康敏 七里
麻紀 富田
英之 前川
貴仁 ▲高▼林
明子 荻野
信 中野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2008163265A priority Critical patent/JP4848397B2/ja
Publication of JP2010003219A publication Critical patent/JP2010003219A/ja
Application granted granted Critical
Publication of JP4848397B2 publication Critical patent/JP4848397B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、ユーザにより入力されたクエリに基づいて、ユーザが所望する情報を提供する関連クエリ導出装置関連クエリ導出方法及びプログラムに関する。
近年においては、インターネット上に無数のウェブページが存在しており、目的とするウェブページを検索することは容易ではない。そのため、目的とするウェブページの検索を補助するために検索エンジンが提供されている。
ユーザは、このような検索エンジンを利用して、様々なキーワードを組み合わせて入力し、目的とするウェブページを検索している。
例えば、ユーザは、以前に視聴したテレビ番組の中(特に、ある特定のコーナー)で紹介された情報について、より詳細に知りたいとき等に検索エンジンを利用して所望する情報の検索を行う(例えば、引用文献1を参照。)。
特開2003−219374号公報
ここで、ユーザが適式なキーワード(例えば、正確なお店の名称等)を入力することができる場合には、検索エンジンを利用することによって目的とする情報を簡易に取得することができるが、このような適式なキーワードを入力することができない場合には、目的とする情報にたどり着くまでに、検索エンジンに入力するキーワードの組み合わせを工夫したり、複数のウェブページを経由する等の多大な労力を払う必要があり、また時間もかかってしまう。また、ユーザが所望するウェブページが存在するのにもかかわらず、このような検索のための労力や時間が原因となって、所望するウェブページへのアクセスをユーザが諦めてしまうこともある。
また、以前に目にしたコンテンツ(例えば、小説等)における特定のシーンを覚えているがコンテンツのタイトルが思い出せない場合や、コンテンツのタイトルは覚えているが、その内容(例えば、名言等)を思い出せない場合には、詳しい人に直接尋ねるか、又は検索エンジンを利用して、複数回に及ぶサーチを実行する必要がある。
本発明は、予め生成されている情報テーブルを参照して、任意のクエリに基づいて、コンテンツに係るキャラクタ、タイトル又は属性情報を導出することができる関連クエリ導出装置関連クエリ導出方法及びプログラムを提供することを目的とする。
(1)コンテンツに係る文章情報から、当該コンテンツに登場するキャラクタ名及び当該コンテンツのタイトル並びに当該コンテンツの属性情報を抽出する抽出手段と、
前記抽出手段により抽出したキャラクタ名及びタイトル並びに属性情報を、当該コンテンツを識別するコンテンツ識別情報に関連付けて記憶する記憶手段と、
文字列をクエリとして検索リクエストを受け付けた場合、当該クエリに前記記憶手段により記憶されたキャラクタ名、タイトル又は属性情報が含まれているか否かを判断する判断手段と、
前記判断手段により、当該クエリにキャラクタ名又はタイトルが含まれているが属性情報の少なくとも一部が含まれていないと判断されたときには、前記記憶手段において当該キャラクタ名又はタイトルに関連付けられている属性情報を、新たなクエリとして導出し
該クエリに属性情報の少なくとも一部が含まれているがキャラクタ名又はタイトルが含まれていないと判断されたときには、前記記憶手段において当該属性情報に関連付けられているキャラクタ名又はタイトルを、新たなクエリとして導出し、
又は当該クエリに属性情報の一部が含まれているが他の属性情報が含まれていないと判断されたときには、当該他の属性情報を、新たなクエリとして導出する導出手段と、を備える関連クエリ導出装置。
(1)に係る発明によれば、クエリにコンテンツのキャラクタ名とタイトルを明示的又は暗示的に示す語句が含まれている場合には、その属性情報を導出し、クエリにコンテンツの属性情報を明示的又は暗示的に示す語句が含まれている場合には、そのキャラクタ名とタイトルを導出し、クエリにコンテンツの属性情報の一部を明示的又は暗示的に示す語句が含まれている場合には、その他の属性情報を導出する。
このようにして、(1)に係る発明によれば、コンテンツに関する任意のクエリに基づいて、当該コンテンツに係るキャラクタ名、タイトル又は属性情報の不足を補って新たなクエリとして導出することができる。その結果、ユーザは、コンテンツに関する未知の情報や忘れてしまった情報等を容易に取得できる。更に、これらの情報(新たなクエリ)に基づいて検索を実行することにより、コンテンツに関する有用な情報を簡易に収集することができる。
(2)前記コンテンツに含まれている音声情報を抽出する音声情報抽出手段と、
前記音声情報抽出手段により抽出された前記音声情報を文章情報に変換する変換手段と、を更に備え、
前記抽出手段は、前記変換手段により変換された前記文章情報から前記キャラクタ名、前記タイトル又は前記属性情報を抽出することを特徴とする(1)記載の関連クエリ導出装置。
(2)に係る発明によれば、コンテンツに含まれている音声情報を文章情報に変換し、変換された文章情報からキャラクタ名、タイトル又は属性情報を抽出する。
このようにして、(2)に係る発明によれば、音声情報からキャラクタ名、タイトル又は属性情報を抽出することができるので、予め文章情報を用意することなく、音声として放送されたコンテンツに関する情報を蓄積することができる。
(3)前記コンテンツの中から、前記音声情報抽出手段により抽出するための時間範囲を特定する特定手段を更に備える(2)記載の関連クエリ導出装置。
(3)に係る発明によれば、コンテンツに含まれる音声のうち、特定の時間範囲を抽出するので、不必要な情報が蓄積されることを抑制し、有用な情報に絞り込める可能性がある。
(4)前記特定手段は、前記コンテンツの中における第1のフレーズに対応する箇所から、第2のフレーズに対応する箇所までを、前記音声情報抽出手段により抽出するための時間範囲として特定することを特徴とする(3)記載の関連クエリ導出装置。
(4)に係る発明によれば、時間的に連続するコンテンツの音声情報の中における第1のフレーズから第2のフレーズの間を時間範囲として特定する。
このようにして、(4)に係る発明によれば、例えば、以前に視聴したコンテンツ(テレビ等)のうち、所定のフレーズにより特定される特定の場面における情報について、ユーザにより適式なキーワードによる検索が行われなかった場合でも簡易に提供することが可能となる。
(5)前記特定手段は、前記コンテンツと共に取得される特定情報に基づいて、前記音声情報抽出手段により抽出するための時間範囲を特定することを特徴とする(3)又は(4)記載の関連クエリ導出装置。
(5)に係る発明によれば、コンテンツの時間的に連続する音声のうち、特定情報(例えば、CMの挿入を示す情報)に基づいて、時間範囲を特定する。
このようにして、(5)に係る発明によれば、例えば、以前に視聴したコンテンツ(テレビ等)において、CM等の無関係な部分を排除して属性情報等を取得することができる。したがって、ユーザの所望するコンテンツに関連する情報のみを簡易に提供することが可能となる。
(6)前記検索リクエストとして受け付けたクエリを、前記導出手段により導出された前記新たなクエリに差し替えて検索を実行する検索手段を更に備える(1)から(5)のいずれかに記載の関連クエリ導出装置。
(6)に係る発明によれば、ユーザにより適式なキーワードによる検索が行われなかった場合でも、一定条件下、コンテンツに関する適式なキーワードに差し替えて検索を実行するため、ユーザが所望する情報を簡易に提供することができる。
(7)コンテンツに係る文章情報から、当該コンテンツに登場するキャラクタ名及び当該コンテンツのタイトル並びに当該コンテンツの属性情報を抽出する抽出ステップと、
前記抽出ステップにより抽出したキャラクタ名及びタイトル並びに属性情報を、当該コンテンツを識別するコンテンツ識別情報に関連付けて記憶する記憶ステップと、
文字列をクエリとして検索リクエストを受け付けた場合、当該クエリに前記記憶ステップにより記憶されたキャラクタ名、タイトル又は属性情報が含まれているか否かを判断する判断ステップと、
前記判断ステップにより、当該クエリにキャラクタ名又はタイトルが含まれているが属性情報の少なくとも一部が含まれていないと判断されたときには、前記記憶ステップにおいて当該キャラクタ名又はタイトルに関連付けられている属性情報を、新たなクエリとして導出し
該クエリに属性情報の少なくとも一部が含まれているがキャラクタ名又はタイトルが含まれていないと判断されたときには、前記記憶ステップにおいて当該属性情報に関連付けられているキャラクタ名又はタイトルを、新たなクエリとして導出し、
又は当該クエリに属性情報の一部が含まれているが他の属性情報が含まれていないと判断されたときには、当該他の属性情報を、新たなクエリとして導出する導出ステップと、を含むことを特徴とする関連クエリ導出方法。
(7)に係る発明によれば、当該方法を実行することにより、(1)と同様の効果が期待できる。
(8)()記載の方法をコンピュータに実行させることを特徴とするプログラム。
このような構成によれば、当該プログラムをコンピュータに実行させることにより、(1)と同様の効果が期待できる。
本発明によれば、任意のクエリに基づいて、コンテンツに係るキャラクタ名、タイトル又は属性情報を導出することができる。
以下、本発明の実施形態について図を参照しながら説明する。
[システム構成]
図1には、本実施形態に係るサーバ10と、放送局30と、ユーザ端末40とから構成される情報処理システム1を示す。なお、図1においては、情報処理システム1は、サーバ10と、放送局30と、ユーザ端末40とがそれぞれ1つずつで示されているが、これに限られず、それぞれ複数台で構成されていてもよい。
サーバ10は、図2に示すように、制御部300を構成するCPU(Central Processing Unit)310(マルチプロセッサ構成ではCPU320等複数のCPUが追加されてもよい)、バスライン200、通信I/F(I/F:インタフェース)330、メインメモリ340、BIOS(Basic Input Output System)350、I/Oコントローラ360、ハードディスク370、光ディスクドライブ380及び半導体メモリ390を備える。なお、ハードディスク370、光ディスクドライブ380及び半導体メモリ390はまとめて記憶装置410と呼ばれる。
制御部300は、サーバ10を統括的に制御する部分であり、ハードディスク370に記憶された各種プログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、本発明に係る各種機能を実現している。
通信I/F330は、サーバ10が、ネットワークを介してユーザ端末40等の他の装置と情報を送受信する場合のネットワーク・アダプタである。
BIOS350は、サーバ10の起動時にCPU310が実行するブートプログラムや、サーバ10のハードウェアに依存するプログラム等を記録する。
I/Oコントローラ360には、ハードディスク370、光ディスクドライブ380及び半導体メモリ390等の記憶装置410を接続することができる。
ハードディスク370は、本ハードウェアをサーバ10として機能させるための各種プログラム、本発明の機能を実行するプログラム及び後述するテーブル等を記憶する。なお、サーバ10は、外部に別途設けたハードディスク(図示せず)を外部記憶装置として利用することもできる。
光ディスクドライブ380としては、例えば、DVD−ROMドライブ、CD−ROMドライブ、DVD−RAMドライブ及びCD−RAMドライブを使用することができる。この場合は各ドライブに対応した光ディスク400を使用する。光ディスク400から光ディスクドライブ380によりプログラム又はデータを読み取り、I/Oコントローラ360を介してメインメモリ340又はハードディスク370に提供することもできる。
なお、本発明でいうコンピュータとは、記憶装置、制御部等を備えた情報処理装置をいい、サーバ10は、記憶装置410、制御部300等を備えた情報処理装置により構成され、この情報処理装置は、本発明のコンピュータの概念に含まれる。
また、本発明に係るサーバ10は、上述のような構成を有することにより、放送局30により放送された番組(コンテンツ)の中において発せられた音声情報(例えば、会話等)から、頻出するフレーズや、音量の大きな部分の語句等、特徴的な語句を抽出する。そして、サーバ10は、ユーザ端末40から番組に関する検索リクエストが送信されてきたときに、先に抽出した語句を新たな検索式(クエリ)として提供し、更に、この新たなクエリに従って、関連するウェブページを検索する機能を有する。
[機能構成]
ここで、当該機能を発揮するための構成について、図3に示す機能ブロック図を用いて説明する。サーバ10は、特定部11(特定手段)と、音声情報抽出部12(音声情報抽出手段)と、変換部13(変換手段)と、特徴語抽出部14(抽出手段)と、記憶部15(記憶手段)と、判断部16(判断手段)と、導出部17(導出手段)と、検索部18(検索手段)と、コンテンツログ情報テーブルDB20と、を備える。
特定部11は、時間的に連続するコンテンツの音声情報(例えば、テレビ放送を受信して得られる音声情報)に基づいて、抽出するための時間範囲を特定する。ここで、特定部11による時間範囲の特定方法について以下に例示する。
特定部11は、音声を認識する機能により構成されており、例えば、時間的に連続する音声情報の中における第1のフレーズに対応する箇所から、第2のフレーズに対応する箇所までを、音声情報抽出部12により抽出するための時間範囲として特定する。具体的には、特定部11は、音声情報の中における第1のフレーズ(テレビ放送を例にとると、出演者による「次のコーナーは・・・」等の特定のコーナー(特集)を開始する旨の宣言)に対応する箇所から、第2のフレーズ(テレビ放送を例にとると、出演者による「以上・・・コーナーでした。」等の特定のコーナーの終了の宣言)に対応する箇所までを、音声を認識する機能により特定する。
また、特定部11は、例えば、時間的に連続する音声情報と共に取得されるコンテンツ中の時間位置に関する特定情報(例えば、テレビ放送波に含まれているCMの挿入を示す信号)に基づいて、音声情報抽出部12により抽出するための時間範囲を特定する。具体的には、特定部11は、あるCMが終了して番組に移行するときから、当該番組が終了してCMに移行するときまでを、CMの挿入を示す信号に基づいて特定する。
なお、テレビ放送の番組としては、ドラマや、映画や、バラエティや、ドキュメント等複数のものが考えられる。
音声情報抽出部12は、特定部11により特定された時間範囲における音声情報を抽出する。
変換部13は、音声を認識し、当該認識に基づいて文字情報(テキスト)に変換する機能(音声認識エンジン)により構成されている。なお、変換部13は、いわゆる音響モデルや言語モデル等を利用して音声認識を行う。
なお、音声を文字情報に変換する際には、音量や、声質等に基づくキャラクタを識別する情報や、音楽(BGM等)の有無等を、変換された文字情報と関連付けて抽出することが好ましい。これらは、コンテンツの特徴部分や、複数の属性情報の関連性(例えば、同一キャラクタの発言)等を判断する材料となる。
ここで、上述の特定部11は、放送局30から受信する音声情報や特定情報に基づいて時間範囲を特定することとしたが、これには限られず、変換部13により変換された文字情報に基づいて範囲を特定してもよい。すなわち、文字情報を解析することにより、例えば、所定のフレーズを目印にして、特定の範囲の文字情報を抽出することができる。
特徴語抽出部14は、変換部13により変換された文字情報に基づいて当該コンテンツの特徴語を抽出する。ここで、特徴語抽出部14は、例えば、tf−idf(Term Frequency − Inverse Document Frequency、出現頻度に基づいて文章中の特徴的な語句を抽出するためのアルゴリズム)を利用して文字情報から複数の語句(例えば、頻出する施設名や、フレーズ等)を抽出する。
また、例えば、音量の大きなフレーズや、BGMの始まる前後のフレーズ等、出現頻度に関わらず特徴的な語句を抽出してもよい。
特徴語抽出部14は、このようにして抽出した語句を、文章の係り受け解析や、変換部13により識別されたキャラクタ識別情報等に基づいて、キャラクタに対して関連付けを行う。
記憶部15は、特徴語抽出部14により抽出した特徴語を、コンテンツを識別するコンテンツ識別情報(コンテンツID)に関連付けて、属性情報として、コンテンツログ情報テーブルDB20に記憶する。
具体的には、コンテンツログ情報テーブルDB20に、図4に示すようなコンテンツ情報テーブルが格納される。コンテンツ情報テーブルでは、コンテンツごとにコンテンツIDが付されており、コンテンツのタイトル及び登場するキャラクタ名並びに各種属性情報が関連付けて記憶される。
ここで、特徴語抽出部14によりキャラクタと関連付けられた属性情報については、それぞれキャラクタ名ごとのレコードとして記憶され、キャラクタと関連付けられなかった属性情報は、更に別のレコードとして記憶される。なお、コンテンツ情報テーブルの形態はこれには限られず、例えば、適宜複数のテーブルに分割されてもよい。
また、コンテンツ情報テーブルに記憶される情報は、特徴語抽出部14により抽出された語句には限られない。サーバ10は、放送される音声情報とは別に、番組表や解説文、あるいはブログ等のウェブページ等、様々な文章情報を受け付けることとしてよい。この場合、サーバ10は、受け付けた文章情報に基づいて、特徴語抽出部14によりコンテンツ情報テーブルを生成する。その後、音声情報や、更に別の文章情報を受信することにより、コンテンツ情報テーブルのデータを追加、更新する。
判断部16は、ユーザ端末40から、任意の文字列をクエリとして検索リクエストを受け付けた場合、コンテンツ情報テーブル(図4)を参照し、このクエリにタイトル又はキャラクタ名が含まれているか否か、更に、このクエリに属性情報が含まれているか否かを判断する。この判断の基準は、正確に語句が一致する場合の他、所定以上の類似度である場合、類義語を定義した辞書に基づいて類似と判断される場合等も、含むこととする。
導出部17は、判断部16により、検索リクエストのクエリにキャラクタ名又はタイトルが含まれているが属性情報の少なくとも一部が含まれていないと判断されたときには、このキャラクタ名又はタイトルに関連付けられている属性情報を、新たなクエリとして導出する。
また、導出部17は、検索リクエストのクエリに属性情報の少なくとも一部が含まれているがキャラクタ名又はタイトルが含まれていないと判断されたときには、この属性情報に関連付けられているキャラクタ名又はタイトルを、新たなクエリとして導出する。
更に、導出部17は、検索リクエストのクエリに属性情報の一部が含まれているが他の属性情報が含まれていないと判断されたときには、検索リクエストのクエリに含まれない他の属性情報を、新たなクエリとして導出する。
このようにして、導出部17は、ユーザ端末40から受信したクエリに対して、関連する新たなクエリを導出する。その結果、タイトルやキャラクタ名からコンテンツの内容に関する詳細キーワードや、コンテンツの内容からタイトルやキャラクタ名をユーザ端末40に対して送信することができる。
検索部18は、導出部17により導出された新たなクエリに基づいて、検索を実行する。すなわち、ユーザ端末40から受信したクエリを、関連する新たなクエリに差し替えてウェブページを検索する。なお、この検索は、送信した新たなクエリが選択されることにより、ユーザ端末40から明示的な要求指示を受け付けたことに応じて実行されることとしてよい。
このような構成によれば、本実施形態は、例えば、ユーザが以前に目にしたコンテンツ(例えば、小説や映画等)における、特定のシーンに基づいて検索リクエストを受け付けた場合に、タイトルやキャラクタ名を新たなクエリとして情報提供し、更にこのタイトルやキャラクタ名から、詳細情報を検索することができる。また、コンテンツのタイトルに基づいて検索リクエストを受け付けた場合には、このコンテンツに関する属性情報(例えば、名言、地名、商品等)を提供し、更にこの属性情報から、詳細情報を検索することができる。このように、サーバ10が関連情報を提供することにより、ユーザは、所望の情報に簡易にアクセスすることができる。
[処理手順]
ここで、本発明を適用した場合において実現され得る具体的な処理手順について、図5に示すフローチャートを参照して説明する。なお、以下に示す処理手順は、一例であってこれ以外にも実現され得る処理手順は無数に存在する。
なお、本発明に係るサーバ10は、予め、単一の又は複数の放送局において放送された番組(ジャンルを問わず全ての番組を対象にしてもよいし、特定のジャンル(映画等)の番組のみを対象にしてもよい。)の音声情報(例えば、会話による話し言葉)と、その他に受け付けた文章情報とに基づいて作成された文字情報を分析し、この分析結果に基づいてコンテンツに関する特徴語を、コンテンツのタイトル及びキャラクタ名に関連付けて、コンテンツログ情報テーブルDB20に格納されているコンテンツ情報テーブルに登録しておく(図4を参照。)。
ユーザが、過去に視聴した番組に関して、詳細な情報、あるいは忘れてしまった情報を取得したいと考えた場合、あいまいな記憶に基づいて、ウェブページの検索を試みる。
ステップS1において、サーバ10は、ユーザ端末40から、ネットワークを介して検索キーワードを受信する。ここで、ユーザ端末40を利用するユーザは、検索キーワードをサーバ10に送信する際に、例えば、映画のタイトルを覚えていない場合、特定のシーンや映画の種類等に関する情報から検索キーワードを指定する。具体的には、例えば、図6に示すように、検索フィールドXに「アニメ 学園祭の前日 夢 亀」を入力して、検索を試みる。
ステップS2において、サーバ10は、ステップS1にて受信した検索キーワードが、コンテンツ情報テーブル(図4)に記憶された、いずれかのコンテンツに関するデータ内に存在するか否かを判定する。この判定がYESの場合はステップS3に移り、判定がNOの場合はステップS4に移る。なお、ステップS1において、検索キーワード「アニメ 学園祭の前日 夢 亀」を受け付けた場合は、コンテンツ情報テーブル(図4)との一致度に基づいて、コンテンツID「0001」が特定されてステップS3に移る。
ステップS3において、サーバ10は、ステップS2にて特定されたコンテンツに関する情報を、コンテンツ情報テーブル(図4)から抽出し、新たなキーワードとしてユーザ端末40に送信する。具体的には、ステップS2において、検索キーワードがコンテンツの属性情報であると判断された場合には、タイトルとキャラクタ名や、その他の属性情報が抽出される。また、検索キーワードがタイトルやキャラクタ名であると判断された場合には、コンテンツの属性情報、特にキャラクタに関する属性情報が抽出される。
これにより、ユーザ端末40では、ユーザにより入力された検索キーワードとは別に、新たなキーワードがリストZとして表示される。ユーザは、このリストZからいずれかを選択することにより、検索キーワードを差し替える。そして、ユーザが検索ボタンYを押下することにより、ユーザ端末40はサーバ10に対して検索リクエストを送信する。
ステップS4において、サーバ10は、ユーザ端末40から、検索キーワードの指定と共に検索要求(検索リクエストがあったか否かを判定する。この判定がYESの場合はステップS5に移り、判定がNOの場合は処理を終了する。
ステップS5において、サーバ10は、ユーザ端末40から検索リクエストを受信したので、指定されたキーワード(ステップS1にて受信した検索キーワード、もしくは、ステップS3にて送信した関連キーワード)に基づいて、ウェブページの検索を実行する。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
例えば、本実施形態では、サーバ10により抽出されたキーワードを、検索実行の前に、クエリ候補としてユーザ端末40にてリスト表示したが、これには限られない。例えば、サーバ10は、ユーザ端末40にて検索ボタンYが押下され検索が実行されたことに応じて、クエリ候補としての新たなキーワードを送信して表示させてもよい。
また、サーバ10は、初期に入力された検索キーワードによる検索リクエストを受信したことに応じて、抽出した新たなキーワードに基づく検索結果(ウェブページへのリンク等)を、ユーザ端末40に送信し表示させてもよい。
また、図6における検索フィールドXは、タイトル、キャラクタ名及び属性情報それぞれに専用の複数フィールドに分割してもよい。これにより、サーバ10は、コンテンツ情報テーブル(図4)とのマッチング精度を向上できる可能性がある。
また、本実施形態では、コンテンツとして、放送局30から放送される番組について説明したが、これには限られない。例えば、音声情報を含まない小説や漫画等であってもよく、予め、これらのコンテンツに関する文章情報を受け付けることにより、上述と同様の効果が期待できる。
なお、本実施形態においては、サーバ10は、ハードディスク370及び光ディスクドライブ380を有する構成として説明したが、これに限られず、これらの駆動系を有さない構成、いわゆるゼロスピンドルによる構成であってもよい。このような構成の場合には、ハードディスク370に記憶される内容は、大容量の半導体メモリ390に記憶される。
本発明の実施形態に係るサーバと、放送局と、ユーザ端末とから構成される情報処理システムを示す図である。 本発明の実施形態に係るサーバの構成を示すブロック図である。 本発明の実施形態に係るサーバの機能的な構成を示す機能ブロック図である。 本発明の実施形態に係るコンテンツ情報テーブルの構成を示す図である。 本発明の実施形態に係るサーバによる処理手順を示すフローチャートである。 本発明の実施形態に係るユーザ端末における検索の手順についての説明に供する図である。
符号の説明
1 情報処理システム
10 サーバ
11 特定部(特定手段)
12 音声情報抽出部(音声情報抽出手段)
13 変換部(変換手段)
14 特徴語抽出部(特徴語抽出手段)
15 記憶部(記憶手段)
16 判断部(判断手段)
17 導出部(導出手段)
18 検索部(検索手段)
20 コンテンツログ情報テーブルDB(記憶手段)
30 放送局
40 ユーザ端末

Claims (8)

  1. コンテンツに係る文章情報から、当該コンテンツに登場するキャラクタ名及び当該コンテンツのタイトル並びに当該コンテンツの属性情報を抽出する抽出手段と、
    前記抽出手段により抽出したキャラクタ名及びタイトル並びに属性情報を、当該コンテンツを識別するコンテンツ識別情報に関連付けて記憶する記憶手段と、
    文字列をクエリとして検索リクエストを受け付けた場合、当該クエリに前記記憶手段により記憶されたキャラクタ名、タイトル又は属性情報が含まれているか否かを判断する判断手段と、
    前記判断手段により、当該クエリにキャラクタ名又はタイトルが含まれているが属性情報の少なくとも一部が含まれていないと判断されたときには、前記記憶手段において当該キャラクタ名又はタイトルに関連付けられている属性情報を、新たなクエリとして導出し
    該クエリに属性情報の少なくとも一部が含まれているがキャラクタ名又はタイトルが含まれていないと判断されたときには、前記記憶手段において当該属性情報に関連付けられているキャラクタ名又はタイトルを、新たなクエリとして導出し、
    又は当該クエリに属性情報の一部が含まれているが他の属性情報が含まれていないと判断されたときには、当該他の属性情報を、新たなクエリとして導出する導出手段と、を備える関連クエリ導出装置。
  2. 前記コンテンツに含まれている音声情報を抽出する音声情報抽出手段と、
    前記音声情報抽出手段により抽出された前記音声情報を文章情報に変換する変換手段と、を更に備え、
    前記抽出手段は、前記変換手段により変換された前記文章情報から前記キャラクタ名、前記タイトル又は前記属性情報を抽出することを特徴とする請求項1記載の関連クエリ導出装置。
  3. 前記コンテンツの中から、前記音声情報抽出手段により抽出するための時間範囲を特定する特定手段を更に備える請求項2記載の関連クエリ導出装置。
  4. 前記特定手段は、前記コンテンツの中における第1のフレーズに対応する箇所から、第2のフレーズに対応する箇所までを、前記音声情報抽出手段により抽出するための時間範囲として特定することを特徴とする請求項3記載の関連クエリ導出装置。
  5. 前記特定手段は、前記コンテンツと共に取得される特定情報に基づいて、前記音声情報抽出手段により抽出するための時間範囲を特定することを特徴とする請求項3又は請求項4記載の関連クエリ導出装置。
  6. 前記検索リクエストとして受け付けたクエリを、前記導出手段により導出された前記新たなクエリに差し替えて検索を実行する検索手段を更に備える請求項1から請求項5のいずれかに記載の関連クエリ導出装置。
  7. コンテンツに係る文章情報から、当該コンテンツに登場するキャラクタ名及び当該コンテンツのタイトル並びに当該コンテンツの属性情報を抽出する抽出ステップと、
    前記抽出ステップにより抽出したキャラクタ名及びタイトル並びに属性情報を、当該コンテンツを識別するコンテンツ識別情報に関連付けて記憶する記憶ステップと、
    文字列をクエリとして検索リクエストを受け付けた場合、当該クエリに前記記憶ステップにより記憶されたキャラクタ名、タイトル又は属性情報が含まれているか否かを判断する判断ステップと、
    前記判断ステップにより、当該クエリにキャラクタ名又はタイトルが含まれているが属性情報の少なくとも一部が含まれていないと判断されたときには、前記記憶ステップにおいて当該キャラクタ名又はタイトルに関連付けられている属性情報を、新たなクエリとして導出し
    該クエリに属性情報の少なくとも一部が含まれているがキャラクタ名又はタイトルが含まれていないと判断されたときには、前記記憶ステップにおいて当該属性情報に関連付けられているキャラクタ名又はタイトルを、新たなクエリとして導出し、
    又は当該クエリに属性情報の一部が含まれているが他の属性情報が含まれていないと判断されたときには、当該他の属性情報を、新たなクエリとして導出する導出ステップと、を含むことを特徴とする関連クエリ導出方法。
  8. 請求項7記載の方法をコンピュータに実行させることを特徴とするプログラム。
JP2008163265A 2008-06-23 2008-06-23 関連クエリ導出装置、関連クエリ導出方法及びプログラム Expired - Fee Related JP4848397B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008163265A JP4848397B2 (ja) 2008-06-23 2008-06-23 関連クエリ導出装置、関連クエリ導出方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008163265A JP4848397B2 (ja) 2008-06-23 2008-06-23 関連クエリ導出装置、関連クエリ導出方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2010003219A JP2010003219A (ja) 2010-01-07
JP4848397B2 true JP4848397B2 (ja) 2011-12-28

Family

ID=41584867

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008163265A Expired - Fee Related JP4848397B2 (ja) 2008-06-23 2008-06-23 関連クエリ導出装置、関連クエリ導出方法及びプログラム

Country Status (1)

Country Link
JP (1) JP4848397B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5593546B2 (ja) * 2010-01-09 2014-09-24 株式会社アニメイト 仮想ショッピングモールシステム及び関連付装置並びにプログラム
JP2013058110A (ja) * 2011-09-08 2013-03-28 Toshiba Corp 情報処理装置、情報処理方法及びプログラム
WO2013037079A1 (en) * 2011-09-12 2013-03-21 Intel Corporation Using multimedia search to identify what viewers are watching on television.
JP6114249B2 (ja) * 2014-11-20 2017-04-12 ヤマハ株式会社 情報送信装置および情報送信方法
JP6569629B2 (ja) * 2016-09-12 2019-09-04 ヤマハ株式会社 情報送信装置、情報送信方法およびプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4006455B2 (ja) * 2005-08-19 2007-11-14 株式会社データクラフト 検索装置及び検索プログラム
WO2007060968A1 (ja) * 2005-11-24 2007-05-31 Pioneer Corporation 放送受信装置、情報記録再生装置および情報抽出方法

Also Published As

Publication number Publication date
JP2010003219A (ja) 2010-01-07

Similar Documents

Publication Publication Date Title
US11978439B2 (en) Generating topic-specific language models
US11636146B2 (en) Content analysis to enhance voice search
KR101554293B1 (ko) 교차 언어 정보 검색
US8126897B2 (en) Unified inverted index for video passage retrieval
US20100169095A1 (en) Data processing apparatus, data processing method, and program
CN1965319A (zh) 信息检索装置、输入辅助装置、方法及程序
US8825661B2 (en) Systems and methods for two stream indexing of audio content
US20130166303A1 (en) Accessing media data using metadata repository
US20160071511A1 (en) Method and apparatus of smart text reader for converting web page through text-to-speech
KR20160007040A (ko) 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템
JP4848397B2 (ja) 関連クエリ導出装置、関連クエリ導出方法及びプログラム
CN114514528A (zh) 数据处理方法、装置、电子设备和存储介质
JP4909946B2 (ja) クエリ置換検索サーバ、検索方法及びプログラム
TWI270792B (en) Speech-based information retrieval
TWI550420B (zh) 資訊取得系統與方法、以及儲存裝置
CN116521626A (zh) 一种基于内容检索的个人知识管理方法及系统
US11640426B1 (en) Background audio identification for query disambiguation
WO2020187301A1 (zh) 节目名检索辅助装置以及节目名检索辅助方法
JP2007293602A (ja) 映像検索システム、映像検索方法およびプログラム
CN106021249A (zh) 一种基于内容的语音文件检索方法和系统
CN113593543B (zh) 智能音箱语音服务系统、方法、装置及设备
CN113361272B (zh) 一种媒资标题的概念词提取方法及装置
JP2019061297A (ja) 情報処理装置、プログラム及び検索方法
Goto et al. A TV agent system that integrates knowledge and answers users' questions
JP2022139053A5 (ja)

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110908

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110920

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111017

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141021

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4848397

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees
S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350