JP2010055409A - キーワード抽出装置、キーワード抽出方法及びプログラム - Google Patents

キーワード抽出装置、キーワード抽出方法及びプログラム Download PDF

Info

Publication number
JP2010055409A
JP2010055409A JP2008220268A JP2008220268A JP2010055409A JP 2010055409 A JP2010055409 A JP 2010055409A JP 2008220268 A JP2008220268 A JP 2008220268A JP 2008220268 A JP2008220268 A JP 2008220268A JP 2010055409 A JP2010055409 A JP 2010055409A
Authority
JP
Japan
Prior art keywords
keyword
data
video data
input
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008220268A
Other languages
English (en)
Inventor
Fumiko Hasegawa
史子 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Embedded Products Ltd
Original Assignee
NEC Embedded Products Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Embedded Products Ltd filed Critical NEC Embedded Products Ltd
Priority to JP2008220268A priority Critical patent/JP2010055409A/ja
Publication of JP2010055409A publication Critical patent/JP2010055409A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】ユーザの嗜好や興味に合致するキーワードを精度高く抽出することができるキーワード抽出装置、キーワード抽出方法及びプログラムを提供する。
【解決手段】映像データを入力するとともに、入力した映像データを視聴中の視聴者の反応を検出し、検出のタイミングで映像データにマーキングを行い、マーキングを行った部分近傍の映像データに対して文字認識及び音声認識の少なくとも一つを行ってキーワードを抽出し、抽出したキーワードを示すキーワードデータを出力する。
【選択図】図2

Description

本発明は、映像データからキーワードを抽出するキーワード抽出装置、キーワード抽出方法及びプログラムに関する。
本発明に関連する技術例として、映像データに含まれる字幕データの中からキーワードを抽出し、そのキーワードに基づいて、ユーザの嗜好や興味に合致するシーンを推定するものがある(例えば、特許文献1参照)。なお、映像データの例としては、コンテンツデータ(テレビ番組等のコンテンツを構成するデータ)等が挙げられる。
特開2006−129122号公報
上記特許文献1の発明では、ユーザが過去に視聴したコンテンツデータの字幕データの中から、出現頻度が多い語彙をキーワードとして抽出している。しかしながら、ユーザが過去に視聴したコンテンツや出現頻度が多い語彙が、必ずしもユーザの嗜好や興味に合致するものであるとは限らない。よって、特許文献1の発明で抽出されるキーワードは、ユーザの嗜好や興味に合致するものではない可能性がある。
本発明は、上記事情に鑑みてなされたものであり、ユーザの嗜好や興味に合致するキーワードを精度高く抽出することができるキーワード抽出装置、キーワード抽出方法及びプログラムを提供することを目的とする。
かかる目的を達成するために、本発明のキーワード抽出装置は、第1の態様として、入力された映像データを視聴中の視聴者の反応を検出し、検出のタイミングで映像データにマーキングを行い、マーキングを行った部分近傍の映像データからキーワードを抽出して出力することを特徴とする。
本発明のキーワード抽出装置は、第2の態様として、映像データを入力する入力手段と、入力手段により入力された映像データを視聴中の視聴者の反応を検出する反応検出手段と、反応検出手段による検出が行われたタイミングで、映像データ中にマーキングを行うマーキング手段と、マーキング手段によりマーキングされた部分近傍の映像データに対して文字認識及び音声認識の少なくとも一つを行い、キーワードを抽出する抽出手段と、抽出手段により抽出されたキーワードを示すキーワードデータを出力する出力手段と、を有することを特徴とする。
本発明のキーワード抽出方法は、第1の態様として、入力された映像データを視聴中の視聴者の反応を検出し、検出のタイミングで映像データにマーキングを行い、マーキングを行った部分近傍の映像データからキーワードを抽出して出力することを特徴とする。
本発明のキーワード抽出方法は、第2の態様として、映像データを入力する入力ステップと、入力ステップにより入力された映像データを視聴中の視聴者の反応を検出する反応検出ステップと、反応検出ステップによる検出が行われたタイミングで、映像データ中にマーキングを行うマーキングステップと、マーキングステップによりマーキングされた部分近傍の映像データに対して文字認識及び音声認識の少なくとも一つを行い、キーワードを抽出する抽出ステップと、抽出ステップにより抽出されたキーワードを示すキーワードデータを出力する出力ステップと、を有することを特徴とする。
本発明のプログラムは、本発明のキーワード抽出方法をコンピュータに実行させることを特徴とする。
本発明によれば、ユーザの嗜好や興味に合致するキーワードを精度高く抽出することが可能となる。
以下、本発明の実施形態について添付図面を参照しながら詳細に説明する。
本発明の一実施形態であるキーワード抽出装置、キーワード抽出方法及びプログラムは、入力された映像データを視聴中の視聴者の反応を検出し、検出したタイミングで映像データにマーキングを行い、マーキングを行った部分近傍の映像データからキーワードを抽出して出力することを特徴とする。なお、本実施形態では、映像データの一例としてコンテンツデータについて説明するが、コンテンツデータに限定されるものではない。
図1は、本実施形態のキーワード抽出装置のハードウェア構成を示す図である。図1に示すように、本実施形態のキーワード抽出装置は、コントローラ110、ユーザインターフェース120、通信インターフェース130、HDD(Hard Disk Drive)140、バスライン150を有する。
コントローラ110は、キーワード抽出装置の全体の処理を制御する。コントローラ110はその内部構成として、CPU(Central Processing Unit)111、CPU111を制御するプログラム等の固定的なデータ(情報)を予め格納したROM(Read Only Memory)112、各種データを一時的に記憶するエリアを形成するRAM(Random Access Memory)113を有する。
ユーザインターフェース120は、コントローラ110から送られた情報(データ)の表示を行うとともに、ユーザにより入力された情報をコントローラ110に伝える。つまり、ユーザに対する情報の出力や提供を行ったり、ユーザからの指示や情報の入力を行ったりする。なお、ユーザインターフェース120としては、例えば、ディスプレイ(LCTやCRT等)、ポインティングデバイス(マウス、タッチペン等)や、キーボードによって構成可能である。また、他の構成として、タッチパネル、カメラ、音声インターフェース(マイク・スピーカ)等を利用したり、あるいは、リモコンによる近距離通信(ユーザからの指示受信)を利用したりすることもできる。
通信インターフェース130は、コントローラ110によって制御され、キーワード抽出装置外部との通信を行う。なお、通信インターフェース130は、イーサネット(登録商標)インターフェース、IEEE1284インターフェース、または、その他のインターフェース(アンテナも含む)で構成可能である。
HDD140は、各種データの書き込み及び読み出しを行う。
バスライン150は、コントローラ110、ユーザインターフェース120、通信インターフェース130、HDD140を互いに電気的に接続している。なお、バスライン150には、アドレスバスやデータバス等を利用することができる。
次に、本実施形態のキーワード抽出装置が有する機能を、図2を用いて説明する。図2は、本実施形態のキーワード抽出装置の機能ブロック図である。図2に示すように、本実施形態のキーワード抽出装置は、入力手段210、反応検出手段220、マーキング手段230、抽出手段240、出力手段250、記憶手段260、コンテンツ記録制御手段270、検索手段280を備える。
入力手段210は、コンテンツデータを入力する。コンテンツデータは、音声データと画像データ(テロップデータや字幕データを含む)とから構成され、コンテンツ(例えば、テレビ番組)の元となるデータである。入力手段210に入力されるコンテンツデータは、リアルタイム放送のデータでも、記録済みのデータ(他装置などで録画された録画データ)のどちらでもよい。このようにコンテンツデータ入力手段として機能する場合、入力手段210は、図1に示す通信インターフェース130により実現される。
入力手段210は、上述したようにコンテンツデータ入力手段として機能するほかに、キーワード抽出装置を操作するユーザからの指示を受け付けるユーザ指示入力手段として機能する。ユーザからの指示の例としては、コンテンツデータの入力指示やキーワードデータの出力指示のほか、入力または出力の条件の設定指示などを挙げることができる。また、ユーザ指示入力手段としては、ユーザに選択肢を提示し、指示入力を促す構成を採用してもよい。このようにユーザ指示入力手段として機能する場合、入力手段210は、図1に示すユーザインターフェース120により実現される。
反応検出手段220は、入力手段210により入力されたコンテンツデータを視聴中の視聴者の反応を検出する。視聴者の反応とは、視聴中のコンテンツデータに対する反応であり、例えば、視聴者が発する声や物音(例えば、笑い声や手を打ち鳴らす音)のほか、心理状態や身体状態の変化(例えば、顔の表情や脈拍の変化)などが挙げられる。反応検出手段220は、図1に示すユーザインターフェース120により実現される。例えば、声や物音を検出する場合はマイクにより実現し、顔の表情の変化を検出する場合はカメラにより実現する。
マーキング手段230は、反応検出手段220による反応検出が行われたタイミングで、コンテンツデータ中にマーキングを行う。また、マーキング手段230は、反応検出の度にマーキングを行う。マーキングの例としては、反応検出時に入力されたコンテンツデータに対してフラグを付加することや、コンテンツデータ入力開始のときから時間を計測しておき、反応検出時の時間を記録したりすることが挙げられる。あるいは、特開2007−306279号公報に開示されているコンテンツマーキング方法を採用してもよい。マーキング手段230は、図1に示すコントローラ110により実現される。
抽出手段240は、マーキング手段230によりマーキングされた部分近傍のコンテンツデータに対して文字認識及び音声認識の少なくとも一つを行い、認識した語彙(語句)をキーワードとして抽出する。キーワードの例としては、番組名、出演者名、制作者名などが挙げられる。また、上記特許文献1のように、頻度の多い語彙をキーワードとしてもよい。なお、文字認識及び音声認識については公知の技術を適用できるので、ここでの説明は省略する。また、キーワード抽出についても公知の方法を適用できる。例えば、上記特許文献1に開示されている抽出方法を適用してもよい。抽出手段240は、図1に示すコントローラ110により実現される。
出力手段250は、抽出手段240により抽出されたキーワードを示すキーワードデータを出力する。出力されたキーワードデータは、画面表示されてユーザに通知されたり、電子番組表から関連番組を検索するために用いられたりする。出力手段250は、図1に示す通信インターフェース130により実現される。
記憶手段260は、各種情報を記憶する。各種情報の例としては、入力手段210により入力されたコンテンツデータの全部または一部、マーキング手段230によりマーキングが行われたコンテンツデータの全部または一部、抽出手段240により抽出されたキーワードを示すキーワードデータなどが挙げられる。なお、記憶手段260は、コントローラ110内のRAM113や、HDD180により実現される。
コンテンツ記録制御手段270は、入力手段210により入力されたコンテンツデータの記録(録画)の開始及び終了を制御する。コンテンツ記録制御手段270の制御により記録が行われたコンテンツデータは、記憶手段260に格納される。また、コンテンツ記録制御手段270は、後述するコンテンツ識別データが示すコンテンツに該当するコンテンツデータが入力手段210により入力された場合に、自動的にそのコンテンツデータを記録する。なお、タイムシフトのときの記録制御については後述する。コンテンツ記録制御手段270は、図1に示すコントローラ110により実現される。
検索手段280は、入力手段210により入力された電子番組表の中から、抽出手段240により抽出されたキーワードを示すキーワードデータに関連するコンテンツを検索する。なお、電子番組表とは、放送チャンネルと時間帯毎に、放送予定のコンテンツ(番組)が一覧となっているデータである。この電子番組表には、一覧となっているコンテンツ毎に、例えば、コンテンツ名(番組名)、ジャンル、放送チャンネル、放送時間、出演者名、制作者名、放送内容の概要などの「コンテンツに係るデータ」が含まれている。まず、検索手段280は、電子番組表において、キーワードデータと一致する「コンテンツに係るデータ」を含むコンテンツを検索(特定)する。そして、検索手段280は、検索したコンテンツを識別可能なコンテンツ識別データを出力する。このコンテンツ識別データは、検索されたコンテンツの「コンテンツに係るデータ」の一部又は全部でもよいが、コンテンツ名(番組名)などのコンテンツ自体を識別できるデータが好ましい。このコンテンツ識別データは、出力手段250により出力されたり、または、記憶手段260に記憶されたりする。検索手段280は、図1に示すコントローラ110により実現される。
次に、以上のように構成された本実施形態のキーワード抽出装置の使用例について説明する。図3は、本実施形態のキーワード抽出装置を単体の装置として使用する場合の例を示す図であり、図4は、本実施形態のキーワード抽出装置を他装置に組み込んで使用する場合の例を示す図である。以下、これら各図について順次説明する。
図3(a)は、キーワード抽出装置と、レコーダ(録画装置)と、テレビ(表示装置)とがそれぞれ接続された場合の構成である。例えば、レコーダは、コンテンツデータ(リアルタイム放送データまたは録画データ)が入力されると、そのコンテンツデータを記録しながら、キーワード抽出装置とテレビに対して同時に出力する。テレビは、コンテンツデータを入力し、コンテンツを画面表示する。キーワード抽出装置は、コンテンツデータを入力し、テレビを視聴している視聴者からの反応を検出した場合に、上述したマーキング、キーワード抽出、キーワードデータ出力を行う。図3(a)では、例として、キーワードデータがテレビに出力されて画面表示される場合を示している。テレビにおけるキーワードデータの画面表示は、ユーザの指示によって行われ、コンテンツの視聴中または視聴後のどちらでもよい。なお、キーワードデータの出力先は、図示したテレビ以外に、レコーダでも、図示していないその他の装置でもよい。
図3(b)は、キーワード抽出装置と、テレビとが接続された場合の構成である。例えば、テレビは、コンテンツデータをリアルタイムに受信すると、コンテンツを画面表示するとともに、キーワード抽出装置へそのコンテンツデータを出力する。キーワード抽出装置は、コンテンツデータを入力し、テレビを視聴している視聴者からの反応を検出した場合に、上述したマーキング、キーワード抽出、キーワードデータ出力を行う。図3(b)では、例として、キーワードデータがテレビに出力されて画面表示される場合を示している。テレビにおけるキーワードデータの画面表示は、ユーザの指示によって行われ、コンテンツの視聴中または視聴後のどちらでもよい。なお、キーワードデータの出力先は、図示したテレビ以外に、図示していないその他の装置でもよい。
図4(a)は、レコーダと、テレビとが接続され、レコーダにキーワード抽出装置(の各手段・各機能)が内蔵された場合の構成である。例えば、レコーダは、コンテンツデータ(リアルタイム放送データまたは録画データ)が入力されると、そのコンテンツデータを記録しながら、テレビに対して出力する。テレビは、コンテンツデータを入力し、コンテンツを画面表示する。レコーダは、テレビを視聴している視聴者からの反応を検出した場合に、上述したマーキング、キーワード抽出、キーワードデータ出力を行う。図4(a)では、例として、キーワードデータがテレビに出力されて画面表示される場合を示している。テレビにおけるキーワードデータの画面表示は、ユーザの指示によって行われ、コンテンツの視聴中または視聴後のどちらでもよい。なお、キーワードデータの出力先は、図示したテレビ以外に、図示していないその他の装置でもよい。
図4(b)は、テレビにキーワード抽出装置(の各手段・各機能)が内蔵された場合の構成である。例えば、テレビは、コンテンツデータをリアルタイムに受信すると、コンテンツを画面表示する。そして、テレビは、テレビを視聴している視聴者からの反応を検出した場合に、上述したマーキング、キーワード抽出、キーワードデータ出力を行う。図4(b)では、例として、キーワードデータがテレビに出力されて画面表示される。テレビにおけるキーワードデータの画面表示は、ユーザの指示によって行われ、コンテンツの視聴中または視聴後のどちらでもよい。なお、キーワードデータの出力先は、図示したテレビ以外に、図示していないその他の装置でもよい。また、図4(b)に示すテレビは、PC(Personal Computer)であってもよい。
なお、図3に示すキーワード抽出装置、並びに、図4に示すキーワード抽出装置を内蔵したレコーダ及びテレビ・PCでは、これら各装置本体に反応検出手段(例えば、マイク)を備え、視聴者の反応(例えば、笑い声)を検出する例を示している。ここで、各装置が、例えば近距離通信を可能とするリモコンを備える場合は、リモコンにマイクを備えるようにし、かつ、各装置本体にリモコンからの信号を受信する手段を備えるようにしてもよい。リモコンは、内蔵のマイクで視聴者の笑い声を検出すると、検出を示す信号を装置本体に送信する。装置本体は、リモコンからの検出を示す信号を受信することで、視聴者の反応を検出することができる。視聴者はリモコンを自分の近くに置いておくことが一般的であるので、リモコンと視聴者の距離は近くなる。よって、リモコン内蔵のマイクは、視聴者の笑い声を収集しやすくなる。このように短距離通信を利用すれば、より精度の高い反応検出が可能となる。
次に、本実施形態のキーワード抽出装置における処理動作(本発明の一実施形態であるキーワード抽出方法)の流れについて説明する。図5は、本実施形態のキーワード抽出装置における処理動作の流れを示すフローチャートである。図6(a)は、本実施形態のキーワード抽出装置に入力されるコンテンツデータを模式的に示す図である。
入力手段210が視聴者により視聴されるコンテンツデータの入力を開始すると(ステップS1/NO)、反応検出手段220は反応検出を開始する(ステップS2/NO)。この反応検出は、コンテンツデータの入力が終了するまで行われる。なお、ここでは例として、検出する視聴者の反応を笑い声とする。
ここで、例えば、コンテンツデータの入力開始から10分経過後に、反応検出手段220が視聴者の笑い声を検出したとする(ステップS2/YES)。マーキング手段230は、反応検出手段220による検出のタイミングで、コンテンツデータ中にマーキングを行う(ステップS3)。このときのマーキングを模式的に示したのが、図6(a)に示す反応検出ポイントaである。図6(a)において、反応検出ポイントaは、入力開始ポイントから10分経過後である。
抽出手段240は、図6(a)に示す反応検出ポイントaの前後の所定範囲(抽出範囲)に対して、文字認識及び音声認識を行い、キーワード抽出を行う(ステップS4)。抽出範囲は、例として、反応検出ポイントaの1分前から反応検出ポイントaの1分後までの間のコンテンツデータとする。なお、この抽出範囲は、予め設定されているものであり、変更も可能とする。抽出手段240は、抽出範囲のコンテンツデータ(音声データ及び画像データ)に含まれる語彙(語句)を、キーワードとして抽出する。
出力手段250は、抽出手段240により抽出されたキーワードを示すキーワードデータを外部へ出力する(ステップS5)。または、記憶手段260が、キーワードデータを格納してもよい。あるいは、記憶手段260によるキーワードデータ格納と、出力手段250によるキーワードデータ出力とを両方行うようにしてもよい。なお、記憶手段260に格納されたキーワードデータは、ユーザの指示を受け付けた場合に読み出されて、出力手段250により出力される。出力されたキーワードデータは、画面表示によりユーザに通知されたり、関連する番組の検索に用いられたりする。
なお、反応検出ポイントaを基準とした抽出範囲に対して一連の処理(キーワード抽出、キーワードデータ出力)が行われている間も、続いて入力されるコンテンツデータに対して、反応検出が行われている。
ここで、例えば、コンテンツデータの入力開始から30分経過後に、反応検出手段220が視聴者の笑い声を検出したとすると(ステップS2/YES)、マーキング手段230は、反応検出手段220による検出のタイミングで、コンテンツデータ中にマーキングを行う(ステップS3)。このときのマーキングを模式的に示したのが、図6(a)に示す反応検出ポイントbである。図6(a)において、反応検出ポイントbは、入力開始ポイントから30分経過後である。ステップS4以降の処理は、上記同様であるので説明を省略する。
コンテンツデータの入力が終了すると(ステップS1/YES)、図5(a)に示す一連の処理を終了する。
上述した図5(a)に示す処理動作において、マーキングしたコンテンツデータを記憶手段260に格納するようにしてもよい。この場合の処理動作を図5(b)に示す。図5(b)に示す処理動作は、図5(a)に示す処理動作と基本的に同じであるが、ステップS3のマーキングの後にステップS3’がある点が異なる。なお、図5(b)において、ステップS3’以外の各ステップは、図5(a)と同様であるので、ここでの説明は省略する。図5(b)において、マーキング手段230が、反応検出手段220による検出のタイミングでコンテンツデータ中にマーキングを行った後(ステップS3)、記憶手段260は、マーキングが行われたコンテンツデータを格納する(ステップS3’)。格納後、例えば、所定時間が経過したとき(コンテンツデータの入力が終了したとき)、あるいは、ユーザからの指示を受けたときに、抽出手段240は、記憶手段260に格納された、マーキング済みのコンテンツデータを読み出し、そのコンテンツデータ内の抽出範囲に対してキーワード抽出を行う(ステップS4)。そして、出力手段250によるキーワードデータ出力、及び、記憶手段260によるキーワードデータ格納の少なくとも一方が行われる(ステップS5)。
以上のように、図5(b)に示す処理動作では、マーキング済みのコンテンツデータを記憶手段260に格納することにより、キーワード抽出及びキーワードデータ出力を任意のときに行うことができる。
以上説明したように、本発明の実施形態によれば、入力されたコンテンツデータを視聴中の視聴者の反応を検出し、検出したタイミングでコンテンツデータにマーキングを行い、マーキングを行った部分近傍のコンテンツデータからキーワードを抽出して出力することを特徴とする。よって、視聴者が反応した部分のコンテンツデータからキーワードを抽出するので、抽出されたキーワードは、ユーザの嗜好や興味に合致する可能性が高くなる。
最後に、上記実施形態においてタイムシフトを採用した場合について、図6(b)及び(c)を参照しながら以下に説明する。図6(b)及び(c)は、本実施形態のキーワード抽出装置に入力されるコンテンツデータを模式的に示す図である。
まず、図6(b)に示す第1例について説明する。入力手段210に入力されるコンテンツデータは、例として、リアルタイム放送のデータとする。そして、視聴者は、入力手段210に入力されるコンテンツデータの視聴を開始したときに、録画の指示を出していないとする。入力手段210がコンテンツデータの入力を開始すると、反応検出手段220は反応検出(例えば、笑い声)を開始する。例えば、コンテンツデータの入力開始から15分経過後に、反応検出手段220が最初の反応検出として視聴者の笑い声を検出したとすると、マーキング手段230は、反応検出手段220による検出のタイミングで、コンテンツデータ中に最初のマーキングを行う。このときのマーキングを模式的に示したのが、図6(b)に示す反応検出ポイントcである。図6(b)において、反応検出ポイントcは、入力開始ポイントから15分経過後である。ここまでは、図5で説明した処理の流れと同様である。
マーキング手段230による最初のマーキングが行われると、コンテンツ記録制御手段270は、図6(b)に示すように、例えば反応検出ポイントcから所定時間分遡った時点(抽出範囲の始点)からコンテンツデータの録画を開始する。そして、コンテンツ記録制御手段270は、コンテンツデータの入力が終了と同時に録画を終了する。なお、録画されたコンテンツデータは、記憶手段260に格納される。コンテンツ記録制御手段270の録画開始ポイントは、予め設定されるものとし、反応検出ポイントの近傍であればよい。また、コンテンツ記録制御手段270の録画終了ポイントも、予め設定されるものとし、コンテンツデータの入力終了時点か、それより前であればよい。
以上のように、第1例では、入力されるコンテンツデータの録画がキーワード抽出装置で行われていない場合でも、最初の反応検出が行われたときに、反応検出タイミング近傍の時点から、所定の時点まで録画するようにする。よって、視聴者により録画指示がされなかった場合でも、視聴者の反応をトリガとしてコンテンツデータを録画することができる。
次に、図6(c)に示す第2例について説明する。入力手段210によるコンテンツデータ入力が開始され、反応検出手段220による最初の反応検出が行われ、マーキング手段230による最初のマーキングが行われる。ここで、コンテンツ記録制御手段270は、図6(c)に示すように、例えば反応検出ポイントcから所定時間分遡った時点(抽出範囲の始点)からコンテンツデータの録画を開始する。ここまでは、上記第1例の流れと同様である。
ここで、録画開始ポイントは、反応検出ポイントcから所定時間分遡った時点(抽出範囲の始点)であるので、上記第1例と同様であるが、第2例では、録画終了ポイントを、反応検出ポイントcから所定時間分経過した時点(抽出範囲の終点)とする。よって、コンテンツ記録制御手段270は、抽出範囲に相当するコンテンツデータを記録する。なお、録画されたコンテンツデータは、記憶手段260に格納される。
コンテンツ記録制御手段270は、最初の反応検出ポイントcを基準とした抽出範囲のコンテンツデータを記録した後で、15分経過後に、反応検出手段220による再度の反応検出が行われたとする。マーキング手段230は、反応検出のタイミングでコンテンツデータ中に再度のマーキングを行うが、このときのマーキングを模式的に示したのが、図6(c)に示す反応検出ポイントdである。図6(c)において、反応検出ポイントdは、入力開始ポイントから30分経過後である。
コンテンツ記録制御手段270は、最初の反応検出のときと同様に、反応検出ポイントdから所定時間分遡った時点(抽出範囲の始点)から、反応検出ポイントcから所定時間分経過した時点(抽出範囲の終点)までコンテンツデータを録画し、記憶手段260に格納する。
以上のように、第2例では、反応検出が行われる度に、反応検出が行われたタイミング近傍の所定範囲のコンテンツデータを録画する。よって、視聴者の反応があった部分のコンテンツデータのみを記録することができる。
上述した第1例及び第2例におけるコンテンツ記録制御手段270の録画は、タイムシフト中であるので、視聴者の指示によらずに自動的に実行される。よって、記憶手段260に格納されたコンテンツデータは、抽出手段240によるキーワード抽出が行われた後、自動的に削除されるようにしてもよい。また、記憶手段260に格納されたコンテンツデータは、視聴者に提示される場合、視聴者の指示により正規に録画されたコンテンツデータと区別して提示(例えば、画面表示)されるようにしてもよい。このとき、記憶手段260に格納されたコンテンツデータの一覧を画面表示し、視聴者に削除するデータを選択させるようにしてもよい。
以上、本発明の実施形態について説明したが、上記実施形態に限定されるものではなく、その要旨を逸脱しない範囲において種々の変形が可能である。
例えば、上述した各実施形態における動作(フローチャートに示す動作)は、ハードウェア、または、ソフトウェア、あるいは、両者の複合構成によって実行することも可能である。
ソフトウェアによる処理を実行する場合には、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれているコンピュータ内のメモリにインストールして実行させてもよい。あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させてもよい。
例えば、プログラムは、記録媒体としてのハードディスクやROM(Read Only Memory)に予め記録しておくことが可能である。あるいは、プログラムは、CD−ROM(Compact Disc Read Only Memory),MO(Magneto optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体に、一時的、あるいは、永続的に格納(記録)しておくことが可能である。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウエアとして提供することが可能である。
なお、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールする他、ダウンロードサイトから、コンピュータに無線転送してもよい。または、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送してもよい。コンピュータでは、転送されてきたプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることが可能である。
また、上記実施形態で説明した処理動作に従って時系列的に実行されるのみならず、処理を実行する装置の処理能力、あるいは、必要に応じて並列的にあるいは個別に実行するように構築することも可能である。
本発明は、入力したコンテンツデータを解析してキーワードを抽出する装置・機器、システム、方法、プログラム等に適用できる。
本発明の一実施形態であるキーワード抽出装置のハードウェア構成を示す図である。 本発明の一実施形態であるキーワード抽出装置の機能ブロック図である。 本発明の一実施形態であるキーワード抽出装置を単体の装置として使用する場合の各構成例を示す図である。 本発明の一実施形態であるキーワード抽出装置を他装置に組み込んで使用する場合の各構成例を示す図である。 本発明の一実施形態であるキーワード抽出装置の処理動作の各例を示すフローチャートである。 本発明の一実施形態であるキーワード抽出装置に入力されるコンテンツデータの各例を模式的に示す図である。
符号の説明
110 コントローラ
111 CPU
112 ROM
113 RAM
120 ユーザインターフェース
130 通信インターフェース
140 HDD
150 バスライン
210 入力手段
220 反応検出手段
230 マーキング手段
240 抽出手段
250 出力手段
260 記憶手段
270 コンテンツ記録制御手段
280 検索手段

Claims (15)

  1. 入力された映像データを視聴中の視聴者の反応を検出し、前記検出のタイミングで前記映像データにマーキングを行い、前記マーキングを行った部分近傍の映像データからキーワードを抽出して出力することを特徴とするキーワード抽出装置。
  2. 映像データを入力する入力手段と、
    前記入力手段により入力された映像データを視聴中の視聴者の反応を検出する反応検出手段と、
    前記反応検出手段による検出が行われたタイミングで、前記映像データ中にマーキングを行うマーキング手段と、
    前記マーキング手段によりマーキングされた部分近傍の映像データに対して文字認識及び音声認識の少なくとも一つを行い、キーワードを抽出する抽出手段と、
    前記抽出手段により抽出されたキーワードを示すキーワードデータを出力する出力手段と、
    を有することを特徴とするキーワード抽出装置。
  3. 前記入力手段により入力された映像データの記録を制御する記録制御手段をさらに有することを特徴とする請求項2記載のキーワード抽出装置。
  4. 前記記録制御手段は、
    前記入力手段により入力された映像データが記録済みではない場合、前記反応検出手段による最初の検出が行われたタイミング近傍の時点から前記映像データの記録を開始し、所定範囲まで記録することを特徴とする請求項3記載のキーワード抽出装置。
  5. 前記記録制御手段は、
    前記最初の検出により前記映像データの記録を所定範囲まで行った後で前記反応検出手段による再度の検出が行われた場合、前記再度の検出が行われたタイミング近傍の時点から前記映像データの記録を開始し、所定範囲まで記録することを特徴とする請求項4記載のキーワード抽出装置。
  6. 前記映像データ及び前記キーワードデータのうち少なくとも一方を記憶する記憶手段をさらに有することを特徴とする請求項2から5のいずれか1項に記載のキーワード抽出装置。
  7. 前記入力手段により入力された電子番組表の中から、前記キーワードデータに関連するコンテンツを検索する検索手段をさらに有し、
    前記検索手段により検索されたコンテンツを識別可能なコンテンツ識別データは、前記出力手段により出力される、または、前記記憶手段に記憶されることを特徴とする請求項2から6のいずれか1項に記載のキーワード抽出装置。
  8. 前記記録制御手段は、
    前記検索データに基づいて、前記入力手段により入力された映像データを記録することを特徴とする請求項7記載のキーワード抽出装置。
  9. 入力された映像データを視聴中の視聴者の反応を検出し、前記検出のタイミングで前記映像データにマーキングを行い、前記マーキングを行った部分近傍の映像データからキーワードを抽出して出力することを特徴とするキーワード抽出方法。
  10. 映像データを入力する入力ステップと、
    前記入力ステップにより入力された映像データを視聴中の視聴者の反応を検出する反応検出ステップと、
    前記反応検出ステップによる検出が行われたタイミングで、前記映像データ中にマーキングを行うマーキングステップと、
    前記マーキングステップによりマーキングされた部分近傍の映像データに対して文字認識及び音声認識の少なくとも一つを行い、キーワードを抽出する抽出ステップと、
    前記抽出ステップにより抽出されたキーワードを示すキーワードデータを出力する出力ステップと、
    を有することを特徴とするキーワード抽出方法。
  11. 前記映像データを記録する第1のコンテンツ記録ステップをさらに有することを特徴とする請求項10記載のキーワード抽出方法。
  12. 前記キーワードデータを記憶するキーワード記憶ステップをさらに有することを特徴とする請求項10または11記載のキーワード抽出方法。
  13. 入力された電子番組表の中から、前記キーワードデータに関連するコンテンツを検索し、検索したコンテンツに係る検索データを出力または記憶する検索ステップをさらに有することを特徴とする請求項10から12のいずれか1項に記載のキーワード抽出方法。
  14. 前記検索データに基づいて、入力された映像データを記録する第2のコンテンツ記録ステップをさらに有することを特徴とする請求項13記載のキーワード抽出方法。
  15. 請求項9から14のいずれか1項に記載のキーワード抽出方法をコンピュータに実行させることを特徴とするプログラム。
JP2008220268A 2008-08-28 2008-08-28 キーワード抽出装置、キーワード抽出方法及びプログラム Pending JP2010055409A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008220268A JP2010055409A (ja) 2008-08-28 2008-08-28 キーワード抽出装置、キーワード抽出方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008220268A JP2010055409A (ja) 2008-08-28 2008-08-28 キーワード抽出装置、キーワード抽出方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2010055409A true JP2010055409A (ja) 2010-03-11

Family

ID=42071248

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008220268A Pending JP2010055409A (ja) 2008-08-28 2008-08-28 キーワード抽出装置、キーワード抽出方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2010055409A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011239158A (ja) * 2010-05-10 2011-11-24 Nippon Hoso Kyokai <Nhk> ユーザ反応推定装置、ユーザ反応推定方法およびユーザ反応推定プログラム
JP2011239247A (ja) * 2010-05-12 2011-11-24 Nippon Hoso Kyokai <Nhk> デジタル放送受信装置および関連情報提示プログラム
JP2012238232A (ja) * 2011-05-12 2012-12-06 Nippon Hoso Kyokai <Nhk> 興味区間検出装置、視聴者興味情報提示装置、および興味区間検出プログラム
CN103455506A (zh) * 2012-05-31 2013-12-18 日立(中国)研究开发有限公司 关键词提取装置、关键词管理装置、以及关键词提供系统
KR101352938B1 (ko) * 2012-05-21 2014-01-23 (주)케이디엠티 방송신호 수신 장치
JP2015125632A (ja) * 2013-12-26 2015-07-06 日本放送協会 注目キーワード情報抽出装置およびそのプログラム
JP2015215794A (ja) * 2014-05-12 2015-12-03 日本放送協会 興味キーワード抽出装置及び興味キーワード抽出プログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08180506A (ja) * 1994-12-22 1996-07-12 Toshiba Corp 記録再生装置
JP2002142160A (ja) * 2000-11-02 2002-05-17 Nec Corp 番組推薦装置、番組推薦方法およびそのプログラムを記録した記録媒体
JP2003257158A (ja) * 2001-12-25 2003-09-12 Canon Inc 記録再生装置および記録再生方法
JP2006229453A (ja) * 2005-02-16 2006-08-31 National Institute Of Information & Communication Technology 番組提示システム
JP2006259897A (ja) * 2005-03-15 2006-09-28 Sharp Corp 嗜好度算出装置、コンテンツ推薦装置、コンテンツ記録出力装置、嗜好度算出サーバ、嗜好度算出方法、嗜好度算出プログラム及びこれを記録したコンピュータ読み取り可能な記録媒体
JP2007328675A (ja) * 2006-06-09 2007-12-20 Sony Corp 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2008167018A (ja) * 2006-12-27 2008-07-17 Toshiba Corp 録画再生装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08180506A (ja) * 1994-12-22 1996-07-12 Toshiba Corp 記録再生装置
JP2002142160A (ja) * 2000-11-02 2002-05-17 Nec Corp 番組推薦装置、番組推薦方法およびそのプログラムを記録した記録媒体
JP2003257158A (ja) * 2001-12-25 2003-09-12 Canon Inc 記録再生装置および記録再生方法
JP2006229453A (ja) * 2005-02-16 2006-08-31 National Institute Of Information & Communication Technology 番組提示システム
JP2006259897A (ja) * 2005-03-15 2006-09-28 Sharp Corp 嗜好度算出装置、コンテンツ推薦装置、コンテンツ記録出力装置、嗜好度算出サーバ、嗜好度算出方法、嗜好度算出プログラム及びこれを記録したコンピュータ読み取り可能な記録媒体
JP2007328675A (ja) * 2006-06-09 2007-12-20 Sony Corp 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2008167018A (ja) * 2006-12-27 2008-07-17 Toshiba Corp 録画再生装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011239158A (ja) * 2010-05-10 2011-11-24 Nippon Hoso Kyokai <Nhk> ユーザ反応推定装置、ユーザ反応推定方法およびユーザ反応推定プログラム
JP2011239247A (ja) * 2010-05-12 2011-11-24 Nippon Hoso Kyokai <Nhk> デジタル放送受信装置および関連情報提示プログラム
JP2012238232A (ja) * 2011-05-12 2012-12-06 Nippon Hoso Kyokai <Nhk> 興味区間検出装置、視聴者興味情報提示装置、および興味区間検出プログラム
KR101352938B1 (ko) * 2012-05-21 2014-01-23 (주)케이디엠티 방송신호 수신 장치
CN103455506A (zh) * 2012-05-31 2013-12-18 日立(中国)研究开发有限公司 关键词提取装置、关键词管理装置、以及关键词提供系统
JP2015125632A (ja) * 2013-12-26 2015-07-06 日本放送協会 注目キーワード情報抽出装置およびそのプログラム
JP2015215794A (ja) * 2014-05-12 2015-12-03 日本放送協会 興味キーワード抽出装置及び興味キーワード抽出プログラム

Similar Documents

Publication Publication Date Title
JP5178109B2 (ja) 検索装置、方法及びプログラム
US9798934B2 (en) Method and apparatus for providing combined-summary in imaging apparatus
JP6044553B2 (ja) 情報処理装置、情報処理方法、及びプログラム
US9547716B2 (en) Displaying additional data about outputted media data by a display device for a speech search command
JP4175390B2 (ja) 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
KR101298823B1 (ko) 구두 피드백을 프로세싱하고 디지탈 비디오 레코더(dvr) 기록 패턴을 업데이트하기 위한 설비
US9183832B2 (en) Display apparatus and method for executing link and method for recognizing voice thereof
JP2010055409A (ja) キーワード抽出装置、キーワード抽出方法及びプログラム
JP4388128B1 (ja) 情報提供サーバ、情報提供方法及び情報提供システム
US20140304606A1 (en) Information processing apparatus, information processing method and computer program
JP2007519987A (ja) 内部及び外部オーディオビジュアルデータの統合解析システム及び方法
WO2016197708A1 (zh) 一种录音方法及终端
JP2007088803A (ja) 情報処理装置
KR20150068003A (ko) 대화형 시스템, 이의 제어 방법, 대화형 서버 및 이의 제어 방법
JP2006279898A (ja) 情報処理装置及びその方法
KR20060089922A (ko) 음성 인식을 이용한 데이터 추출 장치 및 방법
CN113992972A (zh) 一种字幕显示方法、装置、电子设备和可读存储介质
JP2008252322A (ja) 要約提示装置及び要約提示方法
JP5330005B2 (ja) デジタルフォトフレーム、情報処理システム及び制御方法
JPH08249343A (ja) 音声情報取得装置及び音声情報取得方法
JP4367713B2 (ja) 放送受信方法、放送受信システム、第1装置、第2装置、音声認識方法、音声認識装置、プログラム及び記録媒体
JP2014207619A (ja) 録画再生装置、及び録画再生装置の制御方法
JP2007078985A (ja) データ検索装置及びその制御方法
KR20100056839A (ko) 비디오 데이터의 텍스트 인식을 통한 프레임 검색 장치 및 방법
US11038980B2 (en) Information processing apparatus, information processing method, and program

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20110511

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110715

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20110920

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130319

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130520

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130702