JP2006019778A - マルチメディアデータ再生装置およびマルチメディアデータ再生方法 - Google Patents

マルチメディアデータ再生装置およびマルチメディアデータ再生方法 Download PDF

Info

Publication number
JP2006019778A
JP2006019778A JP2004192393A JP2004192393A JP2006019778A JP 2006019778 A JP2006019778 A JP 2006019778A JP 2004192393 A JP2004192393 A JP 2004192393A JP 2004192393 A JP2004192393 A JP 2004192393A JP 2006019778 A JP2006019778 A JP 2006019778A
Authority
JP
Japan
Prior art keywords
multimedia data
answer
question
reproduction
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004192393A
Other languages
English (en)
Other versions
JP4251634B2 (ja
Inventor
Hiroko Hayama
寛子 羽山
Masaru Suzuki
優 鈴木
Miyoshi Fukui
美佳 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2004192393A priority Critical patent/JP4251634B2/ja
Priority to US11/165,285 priority patent/US20060004871A1/en
Publication of JP2006019778A publication Critical patent/JP2006019778A/ja
Application granted granted Critical
Publication of JP4251634B2 publication Critical patent/JP4251634B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • G06F16/745Browsing; Visualisation therefor the internal structure of a single video sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data

Abstract

【課題】 ユーザの質問から、ユーザが要求していると考えられる箇所を特定して再生する。
【解決手段】 再生制御部207はマルチメディアデータの再生制御を行う。要求受理部201はユーザからの質問を受理する。再生位置記憶手段202はユーザから質問を受理した時点の、前記再生制御手段207によって再生させているマルチメディアデータの再生位置を記憶する。解析手段203は前記要求受理手段201で受理した質問を解析する。検索手段204は解析結果を用いて前記質問に対する回答を前記マルチメディアデータの解析情報から検索する。再生制御部207はこの検索された前記回答を出力する。位置比較手段205は前記回答に対応する前記マルチメディアデータ中の回答出現位置と、前記再生位置記憶手段202に記憶された前記再生位置とを比較する。再生位置変更部206は、比較結果に応じて、前記マルチメディアデータの再生位置を変更させる。
【選択図】 図2

Description

この発明は、映像、音声などのマルチメディアデータを再生するマルチメディアデータ再生装置に関する。
近年、ネットワークの高速化にともない、ネットワーク上で映像や音楽など、比較的大容量のマルチメディアコンテンツが扱われることが増えてきている。音楽データや、ニュース映像などの配信だけでなく、e−learningでも、映像を利用したコンテンツを利用するようになってきている。また、放送分野でも、地上波デジタル放送の開始など、コンテンツのデジタル化が進んでいる。
こうしたデジタル化されたマルチメディアコンテンツでは、コンテンツ全体、あるいは一部に、さまざまな情報を付加することができる。例えば、ドラマや映画などのコンテンツ全体に対して、タイトルや出演者名を付加したり、シーンの切れ目などに、時間情報やシーンのタイトルなどを付加したりできる。これらコンテンツの付加情報は、一般にメタ情報と呼ばれている。例えば、DVDを媒体とした映画コンテンツは、通常、チャプターと呼ばれる単位で仮想的に区切られており、チャプターの一覧から一つのチャプターを選択することで、所望のチャプターの先頭から再生が容易に行えるようになっている。コンテンツに付加したメタ情報は、コンテンツの検索などにも利用できる。
例えば、特許文献1の「ストリーム処理システムおよびストリーム処理プログラム」では、ストリームの一部である部分ストリームにメタ情報(テキストデータ)を付加しておき、ユーザの与えたキーワードを利用してメタ情報の検索を行う。この検索結果により、ユーザが所望する部分ストリームを特定し、この部分ストリームの再生を行うものである。
一方、テキストからの情報抽出技術を使えば、単なる文書検索と異なり、検索した文書の中から、質問に対する回答としてふさわしい部分を抽出する技術が知られている(例えば、特許文献2「質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体」を参照)。例えば、「富士山の高さは?」という質問に対し、「富士山の高さ」に含まれる単語を含む文書を検索するだけでなく、この検索された文書中の「3776m」という部分を抽出して質問に対する回答とする。
このような情報抽出技術を利用すれば、大量の文書の中から、知りたい問題に対する回答と思われる部分のみを答えてくれるため、文書検索の時のように、検索結果の文書を表示して、自ら質問に対する回答に相当する部分を探す手間を省くことができる。この技術では、例えば、料理のレシピをみながら調理をしているときに、砂糖の分量を確認したくなった場合は、「砂糖は何グラムだっけ」というように質問すれば、既に読んだレシピ部分から砂糖の分量の部分を抽出して回答することも可能である。
しかし、従来、チャプターなどの予め決められた単位の途中から再生したい場合、チャプター間の所望の位置を特定する有効な手段がなかった。このようにチャプター間の所望の位置から再生したい場合には、再生したい任意の位置に最も近いチャプターへジャンプし、このジャンプした位置から所望の位置に到達するまで早送りや巻き戻しを手動で行う必要があった。例えば、ビデオデータを用いてe−learning形式の学習を行う場合、以前に学習した他のトピックの一部分や、現在再生中の内容の少し前の部分を確認したくなることが起こりうる。このようなとき、予め用意されているトピックのみでは、学習者がもう一度見たい部分をすぐに再生することは困難である。見たい部分を含むトピックの先頭から再生を始め、該当部分に到達するまで目視で確認しながら早送り等をするか、目的の場所まで巻き戻し等の操作を行う必要がある。また、このような状況は映像コンテンツに限らず、会議の音声議事録データのような場合でも生じ得る。会議内容の録音データを再生している途中で、少し前の発言内容を確認したいような場合、当該発言部分に到達するまで、録音データの巻き戻しあるいは早送りの操作を繰り返さなければならない。
この問題を解決するために、例えば、特許文献3「ストリーム処理システムおよびストリーム処理プログラム」では、キーワードを含む部分ストリームの検索および再生を行うことを可能としている。
特開2003−259316公報 特開2002−132812公報 特開2003−259316公報
しかし、特許文献3においては、検索時にストリームの現在の再生位置情報を考慮して、「現在見ている部分の少し前の」ストリームを優先するようなことはできなかった。
また、学習者は確認したい部分を検索により特定するときに情報抽出技術を利用すれば、確認したい回答そのものを得ることができる。
しかし、従来の情報抽出技術はテキスト文書を対象としており、映像などのマルチメディアデータについては考慮されていなかった。
この発明は、このような問題を考慮したものであり、マルチメディアデータの検索結果と、該マルチメディアデータの現在の再生位置とを利用して、ユーザの質問から、ユーザが要求していると考えられる箇所(例えば、もう一度確認したい箇所)を特定し、マルチメディア中の当該特定した箇所へジャンプして再生を行うことができるマルチメディアデータ再生装置を提供することを目的とする。
上記の目的を達成するために、この発明においては、複数メディアからなるマルチメディアデータの再生制御を行う再生制御手段と、ユーザからの質問を受理する質問受理手段と、この質問受理手段がユーザから質問を受理した時点の、前記再生制御手段によって再生させている前記マルチメディアデータの再生位置を記憶する再生位置記憶手段と、前記質問受理手段で受理した質問を解析する解析手段と、この解析手段の解析結果を用いて、前記質問に対する回答を前記マルチメディアデータの解析情報から検索する検索手段と、この検索手段により検索された前記回答をユーザに提示するために出力する手段と、前記検索手段により検索された前記回答に対応する前記マルチメディアデータ中の回答出現位置と、前記再生位置記憶手段により記憶された前記再生位置とを比較する位置比較手段と、この位置比較手段による比較結果に応じて、前記再生制御手段に前記マルチメディアデータの再生位置を変更させる再生位置変更手段とを備えたことを特徴とするマルチメディアデータ再生装置を提供する。
また、上記の目的を達成するために、この発明においては、再生制御手段により複数メディアからなるマルチメディアデータの再生制御を行う再生制御ステップと、ユーザからの質問を受理する質問受理ステップと、この質問受理ステップがユーザから質問を受理した時点の、前記再生制御手段によって再生させている前記マルチメディアデータの再生位置を記憶する再生位置記憶ステップと、前記質問受理手段で受理した質問を解析する解析ステップと、この解析ステップの解析結果を用いて、前記質問に対する回答を前記マルチメディアデータの解析情報から検索する検索ステップと、この検索ステップにより検索された前記回答をユーザに提示するために出力するステップと、前記検索ステップにより検索された前記回答に対応する前記マルチメディアデータ中の回答出現位置と、前記再生位置記憶ステップにより記憶された前記再生位置とを比較する位置比較ステップと、この位置比較ステップによる比較結果に応じて、前記再生制御手段に前記マルチメディアデータの再生位置を変更させる再生位置変更ステップとを備えたことを特徴とするマルチメディアデータ再生方法を提供する。
以上説明したようにこの発明によれば、マルチメディアデータ再生中に、ユーザの要求に対応すると思われる箇所を検索により特定し、この特定した箇所へジャンプして再生することができる。これにより、ユーザはマルチメディアデータから再生したいと思っている箇所を探す手間を省くことができ利便性が向上する。
以下、この発明の実施形態を図面を用いて詳細に説明する。
(第1の実施形態)
以下、図面を参照しながら、本発明の第1の実施形態について説明する。
図1は、この発明の利用形態の一例を示した図である。この実施形態は、本発明のマルチメディアデータ再生装置をe−learningによる教育システムに適用した例である。
この明細書中、マルチメディアデータとは、映像、音声、テキストなどの電子的なデータ、あるいはこれら電子的なデータを再生するための情報を記述したメタデータを表す。
図1において、マルチメディアデータ再生装置は、サーバ102にアクセスするためのクライアント端末101,e−learningシステムのサーバ102から構成されている。
なお、図1の教材閲覧プログラム105およびe−learningサーバプログラム107は、コンピュータにより実行される。なお、プログラムを実行するためのプロセッサ,ROM,RAM等のコンピュータの構成については本発明の要旨でないので図からは省略しているが、汎用のコンピュータを用いれば良い。これらクライアント端末101,サーバ102は、図示しないプロセッサやメモリ等を備えたコンピュータによって構成されている。クライアント端末101とサーバ102は、例えばインターネット網103を介して接続されている。
ユーザ100は、クライアント端末101を利用してe−learningシステムのサーバ102にアクセスし、e−learningによる教育カリキュラムを開始する。このときサーバ102からは、ビデオデータ104を含む教材が、クライアント端末101に配信される。ユーザ100は、クライアント端末101の教材閲覧プログラム105を利用して、サーバ102から配信される教材の閲覧を行う。なお、本明細書では単にビデオデータと記載するが、動画のみのビデオデータではなく、動画と共に音声信号が含まれている音声付のビデオデータであっても良い。この実施形態では、音声付のビデオデータを例として説明する。
ここで、ユーザ100がビデオデータ104による解説、例えば、「○○はYY年にXXしました。」と言っている部分を聞き逃したとする。このときユーザ100は、教材閲覧プログラム105に対して、「○○がXXしたのはいつだった?」というように、聞き逃した部分を確認するための質問を行う。この質問の入力手段は、クライアント端末101に設けられているキーボード等の入力手段からのテキスト入力でもよいし、マイクと音声認識機能による入力でもよい。
ユーザにより入力された質問文はクライアント端末101からサーバ102へ送信され、サーバ102上のe−learningサーバプログラム107で処理が行われる。すなわち、ユーザ100が閲覧中のビデオデータ104に対応する解析情報106の中から、質問に対する回答に相当する部分(例えば、この例の場合は、「YY年」)が抽出される。さらに、解析情報106内の情報を利用して、抽出された回答がビデオデータ104中のどの部分に相当するかが検索される。e−learningサーバプログラム107は、クライアント端末101内の教材閲覧プログラム105に対し、質問に対する回答およびこの回答に対応する位置からのビデオデータ104を配信する。
クライアント端末101では、教材閲覧プログラム107がサーバ102からの回答およびこの回答に対応する位置からのビデオデータ104を表示する。
なお、ユーザ100が質問をした時点のビデオデータ104の再生位置をクライアント端末またはサーバ102内のメモリ等に記憶させておき、ユーザが確認したかった部分の再生終了後に、前記記憶させていた教材の位置から再びビデオデータ104を含む教材をビデオデータ104が配信するようにしてもよい。こうすればユーザ100は、質問を行う直前に視聴していた教材の視聴中断位置から再び教材を視聴再開することができる。
なお、本発明のマルチメディアデータ再生方法は、e−learningシステムに限らず、マルチメディアデータの操作を含むほかのアプリケーションにも適用可能である。また、利用形態は本実施形態に示したものに限定されず、例えば、全ての機能をユーザ側の端末に搭載した形態としても構わない。
図2は、この発明のマルチメディアデータ再生装置の構成を説明するための機能ブロック図である。
なお、プログラムを実行するためのプロセッサ,ROM,RAM等の本発明が実施されるコンピュータの構成については本発明の要旨でないので図からは省略しているが、汎用のコンピュータを用いれば良い。
なお、この実施形態では、図1のサーバ102からビデオデータ104,ビデオデータ104に対応するメタ情報108,解析情報106をクライアント端末側にダウンロードしてあり、かつクライアント側で検索等のすべての処理を行う場合について示している。例えば、図2の記憶装置110は図1の記憶装置110に対応しており、図2のマルチメディアデータ検索閲覧プログラム200は図1のe−learningサーバプログラム107および教材閲覧プログラム105に対応している。
図2において、マルチメディアデータ検索閲覧プログラム200は、要求受理部201,再生位置記憶部202,要求解析部203,検索部204,再生位置比較部205,再生位置変更部206および再生制御部207より構成されている。
再生制御部207は、ユーザの指示に従い、(1)記憶装置110に格納されているビデオデータ104およびこのビデオデータ104に対応するメタ情報108の読み込み、(2)ビデオデータ104および対応するメタ情報108の再生表示、(3)再生時の一時停止等の制御、(4)回答の提示などの処理を行う。
要求受理部201は、ユーザの再生中のビデオデータ104に関する質問形式の要求である質問文テキストを受理し、これを要求解析部203へ渡す。
再生位置記憶部202は、要求受理部201でユーザの要求である質問文テキストを受理した時点での、ビデオデータ104の再生位置を記憶する。
要求解析部203は、要求受理部201で受理したユーザの要求である質問文テキストを解析し、記憶装置110に格納されている解析ルール251に格納されているルールに従って、質問文の要求している情報のタイプを推定する。例えば、質問文テキストが「○○がXXしたのはいつだった?」という質問文の場合には、「いつだった?」という表現から求められている情報は、日付あるいは時間の情報であると推定する。
次に、検索部204は、要求解析部203により推定されたタイプ、例えば、要求されているのは日付あるいは時間の情報であるということを示すタイプに従い、解析情報106から日付、あるいは時間に関する記述で、かつ、質問文の他のキーワード(「○○」あるいは「XXした」)に関連すると推定されるものを回答候補として抽出する。この回答候補は複数抽出されてもよい。また、各回答候補には、ユーザの要求に対する回答としての確信度を示す情報が付加されていてもよい。
なお、解析情報106は、例えば、ビデオデータ104の発話部分を抽出したテキストデータを解析したものである。テキストデータから抽出した回答となる可能性のある単語と当該単語の情報タイプ、当該単語が発話されているビデオデータ104中の再生位置とが対応付けられている。
再生位置比較部205は、検索部204により抽出された各々の回答候補について、ビデオデータ104内での出現位置と、再生位置記憶部202で記憶した再生位置とを比較する。なお、各回答候補と、ビデオデータ104中の該回答候補の出現位置との対応は、解析情報106に記録されているものが用いられる。解析情報106には、ビデオデータ104の内容を解析した情報が記述されている。
再生位置変更部206は、検索部204での検索結果である回答候補から一つを選択する。例えば、要求受理部201で要求を受理した時点でのビデオデータ104の再生位置よりも前の部分で、かつ該再生位置に最も近い位置に対応している回答候補を選択する。そしてこの選択した一つの回答と、該回答の含まれるビデオデータ104中の位置情報は、再生制御部207に渡される。
再生制御部207は、再生位置変更部206から渡された位置情報に応じた位置からビデオデータ104を再生すると共に、質問に対する回答の提示を行う。
次に、図2の要求解析部203および再生位置比較部205の構成について、図3の機能ブロックを用いてより詳細に説明する。
図3は、要求解析部203および再生位置比較部205の構成について、より詳細な構成例を示した機能ブロック図である。
図3において、要求解析部203は、要求タイプ推定部203aおよび情報タイプ推定部203bより構成されている。また、再生位置比較部205は、再生位置比較部205aおよび優先順位計算部205bより構成されている。また、解析ルール251は、要求タイプ解析ルール251aおよび情報タイプ解析ルール251bより構成されている。
要求タイプ推定部203aは、要求受理部201で受理された質問文を形態素解析し、「いつですか」,「だれですか」などの、質問の意図を表すパターンから、質問文の要求タイプを推定する。要求タイプの推定には、記憶装置110に格納されている、要求タイプ解析ルール251aを利用する。
要求タイプ解析ルール251aには、前述した「いつですか」,「どこですか」などの質問意図を表す特徴的な言い回しパターンと、これらが予め定義した要求タイプのうちのどれに当てはまるかを記述したものである。要求タイプとして、例えば「どれくらい」,「なに」,「いつ」等が定義される。要求タイプ解析ルール251aのパターンにマッチするものがない場合は、要求タイプは割当てられなくてもよい。
応答タイプ推定部203bは、要求タイプ推定部203aで推定された要求タイプを基に、当該質問が回答としてどんな情報を求めているかを、記憶装置110に格納されている情報タイプ解析ルール251bを利用して推定する。情報タイプとは、解析対象となっている質問文が、回答として求めていると思われる情報が何かを表すためのもので、例えば、「長さ」,「重さ」,「人」,「国」,「年」などが予め定義されている。また、いくつかの類似した情報タイプは、同じカテゴリに分類されている。例えば、「年」,「日」,「時間間隔」などは、「時間」のカテゴリに分類できる。
情報タイプ解析ルール251bには、要求タイプと(情報タイプの)カテゴリの対応ルールと、各カテゴリ別の、質問文中の典型的な言い回しパターンと情報タイプの対応ルールとが含まれている。一つの要求タイプに複数のカテゴリが対応していてもよい。
応答タイプ推定部203bでは、まず要求タイプとカテゴリの対応ルールを利用して、要求タイプ推定部203aで推定された要求タイプのとりうるカテゴリを特定する。
次に、特定された一つまたは複数のカテゴリのルールを利用して、質問文中の言い回しパターンから、情報タイプの推定を行う。ここで得られる情報タイプは複数であってもよい。
検索部204では、応答タイプ推定部203bで推定された情報タイプに適合するものが回答候補となるように検索を行う。
次に、再生位置比較部205aは、検索部204で得られた各回答候補に対応するビデオデータ104の再生位置と、再生位置記憶部202で記憶した再生位置との近さの比較を行う。
記憶装置110に格納されている解析情報106には、ビデオデータ104の内容を解析した情報が記述されている。解析情報106には、ビデオデータ104の内容を解析した情報が記述されている。
先にも説明したが、解析情報106は、例えば、ビデオデータ104の発話部分を抽出したテキストデータを解析したものである。テキストデータから抽出した回答となる可能性のある単語と当該単語の情報タイプ、当該単語が発話されているビデオデータ104中の再生位置とが対応付けられている。
検索部204は、解析情報106と、要求解析部203により推定された情報タイプとを利用して、例えば、推定された情報タイプと合致し、かつ質問文中のキーワードと関連の高い回答候補を解析情報106より抽出する。各回答候補には、対応するビデオデータ104中の位置情報が付加されている。
従って、再生位置比較部205aは、再生位置記憶部202で記憶した再生位置と、各回答候補のビデオデータ104中の再生位置とを比較して、各々の近さの度合いを計算することができる。例えば、再生位置記憶部202で記憶した再生位置と、回答候補のビデオデータ104中の再生位置との差の絶対値の逆数をこの回答候補のスコアとする。この例の場合は、要求受理時のビデオデータ104の再生位置に近い回答候補ほどスコアが高くなることになる。
次に、優先順位計算部205bは、検索部204で得られた回答候補の優先順位の計算を行う。この実施形態では、先に再生位置比較部205aで計算したスコアをそのまま優先順位とする。なお、優先順位の計算手段は、この実施形態の他にも種々考えられる。例えば、各回答候補には、解析情報106に記述されている情報のほかに、検索部204で計算された、回答としての確信度をあらわすスコアが付加されていてもよい。この場合、優先順位計算部205bでは、該スコアの値に、再生位置比較部205aで計算したスコアの値を加味して補正したものを優先順位とすることもできる。
再生位置変更部206は、検索部204で検索した回答候補の中から、優先順位計算部205bで計算した優先順位の最も高いものを回答として選択する。再生位置変更部206で選択された回答と、これに対応するビデオデータ104の位置が再生制御部207に渡され、回答に対応するビデオデータ104の位置から、ビデオデータの再生が開始される。なお、再生位置変更部206での回答の選択方法は、この実施形態で示した方法に限らない。例えば、優先順位計算部205bで優先順位を計算した後、回答候補の全部、または優先順位の上位のものから順に予め決められた数までの回答候補を選択し、再生制御部207へ情報を渡すことも可能である。この場合、再生制御部207では優先順位の最も高い回答に対応する位置からビデオデータ104の再生を行うが、後に図9で示すように、ユーザの次候補表示の指示に従い、他の回答に対応するビデオデータ104の位置への切り替えるようにしてもよい。
次に、図4乃至図6を用いて各種データの例について詳細に説明する。
図4は、ビデオデータ104の発話内容の例を示した図である。
図5は、図4のビデオデータ104の発話部分をテキスト化した発話テキストデータを示した図である。
図6は、図5の発話テキストデータの解析した解析情報の一例を示した図である。
図4のビデオデータ104は、オーブンレンジを使ってスパゲティを茹でる方法について解説している。ビデオデータ104には、解説者が実際にオーブンレンジを使って、スパゲティを茹でる手順を実演している様子が記録されている。符号401〜404は、ビデオデータ104の中で解説者が発話している内容の一部を示している。
図5において発話テキストデータ501は、単に図4のビデオデータ104中の発話部分をテキスト化したものであり、この図5では発話テキストデータ501の一部を抜き出したものである。この発話テキストデータ501は、検索時に、回答候補と質問文中のキーワードの関連度を調べる際に利用される。
図6の解析情報601は図2の解析情報106に相当する。解析情報601は、発話テキストデータ501を形態素解析し、図9の意味解析ルール251cを利用して、発話テキストデータ501に含まれる単語のうち、回答となる可能性のある(意味のある)単語とその情報タイプを抽出したものである。例えば、図5のテキストの中央付近「スパゲティ100gを耐熱容器に加えます。」から、図6の一番上の要素、「100g」が「重さ」という情報タイプ付きで抽出される。発話テキストデータ501中での出現位置情報も抽出されるので(符号607部分)、図6中での単語の出現順序と図5中の単語の出現順序は同じである必要はない。
意味解析ルール251cには、予め定義された情報タイプおよび情報タイプに属する単語の対応を記述した辞書データと、「数詞+g(単位)」であれば「重さ」を表す、というような解析ルールとが含まれる。
図6に示した例では、情報タイプとして、食品を表す「FOOD_DISH」(符号602)、重さを表す「WEIGHT」(符号603)、および製品の一部品を表す「PRODUCT_PART」(符号604)のタグが記述してある。それぞれのタグで囲まれた部分が、その情報タイプに属する回答候補となりうる単語群である。
例えば、符号605の「100g」という単語は、<WEIGHT>と</WEIGHT>というタグに囲まれている。これは、この単語が「重さ」を表す情報タイプに属することを意味している。
また、符号605の「100g」の後のコロン(:)マークより後ろの記述は、「100g」という単語の解析情報を表したものである。
符号606の「8」という数値は、「100g」という単語のバイト数を示している。
また、符号607の「86,100,PT19S」という記述は、「100g」という単語の出現位置,この単語が「重さ」という情報タイプを持つことの確信度、およびこの単語がビデオデータ104中で出現する位置を表している。
符号607中の「86」は、図5の発話テキストデータ501中の、「100g」という単語が出現する位置を示している(例えば、発話テキストデータ501の頭から86バイト目の位置等)。
符号607中の「100」という記述は、「100g」という単語が「重さ」という情報タイプを持つことの確信度を示している(例えば、100%等)。
符号607中の「PT19S」は、図4のビデオデータ104中で「100g」という単語が出現する位置(時間)を示している(例えば、ビデオデータ104の頭から19秒)。
次に、図7を用いてマルチメディアデータの表示例について説明する。
図7は、マルチメディアデータ検索閲覧プログラム200によるマルチメディアデータの表示例を示した図である。なお、この実施形態では、マルチメディアデータとしてビデオデータ104を表示する場合の例を示している。
図7のマルチメディアデータ検索閲覧インタフェース700は、ユーザ要求入力部701,ビデオデータ表示部702,メタ情報表示部703,ビデオデータ制御部704,回答表示部708およびボタン709より構成される。なお、この実施形態において、ビデオデータ104の再生等の指定については図示しない別のユーザインタフェース部分で行われ、ビデオデータ104の再生は、画面表示とともに自動的に開始されるものとする。
ユーザ要求入力部701は、ユーザの要求を入力する部分であり、この部分にはユーザによってキーボード等を用いて直接テキスト入力される。あるいは、マルチメディアデータ検索閲覧プログラム200が音声認識機能をサポートしている場合、音声認識結果を表示するようになっていてもよい。このユーザ要求入力部701は、図2では要求受理部201に相当する。ユーザ要求入力部701の入力内容をユーザが確定すると、このユーザ要求入力部701に入力されたテキストデータは要求受理部201に渡され、処理が開始される。
ビデオデータ表示部702には、ユーザにより指定されたり、マルチメディアデータ再生装置によって検索されたビデオデータ104が再生される。
メタ情報表示部703には、ビデオデータ表示部702で再生されているビデオデータ104に対応するメタ情報を表示する。
図4のビデオデータ104の発話部分符号401〜404のテキストおよび各発話の時間情報が、ビデオデータ104に対応するメタ情報として与えられていた場合、ビデオデータ104の再生時間T1−T2間は、メタ情報表示部703には「スパゲティのゆで方」(図4の符号401)が表示され、T2−T3間は「水500cc、塩小さじ1/2杯を耐熱容器に入れます」(図4の符号402)が表示される。以降、メタ情報内の時間情報に従い、メタ情報表示部703のテキストが切り替わる。
ビデオデータ制御部704には、ビデオデータ104に関する操作を行うためのボタン類が表示されている。
ボタン706は、ビデオデータ表示部702のビデオデータ104の再生開始および一時停止の機能が割当てられている。
ボタン705は、ビデオデータ表示部702で再生されているビデオデータ104を、次のメタ情報の開始時間までジャンプさせる機能が割当てられている。例えば、図4のビデオデータ104の、T2−T3間を再生中にボタン705が押されると、直後のメタ情報の区間であるT3−T4間の先頭である再生時間T3の位置から再生を始める。
これに対し、ボタン707には、ビデオデータ表示部702で再生されているビデオデータ104を、直前のメタ情報の開始時間までジャンプさせる機能が割当てられている。例えば、図4のビデオデータ104の、T2−T3間を再生中にボタン705を押すと、直前のメタ情報の区間であるT1−T2間の先頭である再生時間T1の位置から再生を始める。
ユーザ要求入力部701にユーザが質問を入力した場合は、この質問が要求受理部201で受理された結果表示されるビデオデータは、上記メタ情報内の時間情報に関わらず、回答に対応している位置から再生が開始される。
ボタン709には、ユーザ要求入力部701に入力されたデータが要求受理部201で受理された時点のビデオデータ104の再生位置へ戻る機能が割当てられている。ユーザがこのボタン709を押すと、ユーザ要求入力部701に入力されたデータが要求受理部201で受理された時点のビデオデータ104の再生位置が再生位置記憶部202から読み出され、質問をする前のビデオデータ104の再生位置に戻ってビデオデータ104の視聴を続けることができる。
以上説明したようにこの発明によれば、マルチメディアデータ再生中に、ユーザの要求に対応すると思われる箇所を検索により特定し、この特定した箇所へジャンプして再生することができる。これにより、ユーザはマルチメディアデータから再生したいと思っている箇所を探す手間を省くことができ利便性が向上する。
(マルチメディアデータの表示例の変形例)
図8は、マルチメディアデータ検索閲覧プログラム200によるマルチメディアデータの他の表示例を示した図である。なお、この実施形態では、マルチメディアデータとして音声付のビデオデータを表示する場合の例を示している。
図8のマルチメディアデータ検索閲覧インタフェース700は、図7と比較して、新たに検索結果表示制御部801が設けられている。この検索結果表示制御部801は、ユーザ要求入力部701で確定された要求に対する回答の表示に関する操作を行うためのボタン802およびボタン803から構成されている。
ボタン802は、回答が複数ある場合に、次候補の回答を表示する機能が割当てられている。
ユーザ要求入力部701に入力されたテキストデータが要求受理部201に渡されると、要求解析部203,検索部204の処理を経て、一つまたは複数の回答候補が得られる。
再生位置変更部206は、検索部204で得られた複数の回答候補についての情報を渡す。すなわち、(1)各回答候補、(2)再生位置変更部205において回答候補毎に計算された優先順位、(3)回答候補毎に対応するビデオデータ104の位置情報の対応表を、再生制御部207へ渡す。
再生制御部207は、再生位置変更部206からの対応表から上記3つの情報を得て、まずは最適解と考えられる前記優先順位の高いものを選択する。そして再生制御部207は、この選択した回答および当該回答に対応するビデオデータ104の位置情報から、マルチメディアデータ検索閲覧インタフェース700への表示を行う。
例えば、再生制御部207は、回答として例えば最適解である「500cc」を回答表示部708に表示し、ビデオデータ表示部702で、ビデオデータ104を回答と対応する位置から再生させる。そして再生制御部207は、他の回答候補が存在しているのであれば検索結果表示制御部801にボタン802およびボタン803を表示する。また、回答表示部708には、次の候補として1件のみ存在している場合には、回答表示部708の下側に全2件中の1件目の候補(最適解)であることを示す「(候補:1/2)」を表示する。これにより、ユーザは全部で何件の候補が存在しており、何番目の回答候補であるのかを知ることができる。このようにすればボタン802を押す度に、現在表示中の回答の次に優先順位の高い、別の回答を表示することが可能となる。また、ボタン803を押す度に、現在表示中の回答よりも優先順位が1つ高い、回答を表示することが可能となる。
ユーザ要求入力部701へ入力した要求に対する回答が得られた(所望のビデオデータが閲覧できた)のち、ボタン709を押すと、ユーザが要求を行った時点で閲覧していたビデオデータ位置へ戻ることができる。
このようにすれば、更に、複数の回答候補についてユーザが回答を得ることができる。
(第2の実施形態)
以下、図面を参照しながら、この発明の第2の実施形態について説明する。第2の実施形態では、マルチメディア再生時に解析情報106を生成することが特徴となっている。この発明の第2の実施形態は、第1の実施形態を変形したものである。このため第1の実施形態で説明したのと同じものについては同一番号を付し説明は省略する。
この第2の実施形態では、図1のサーバ102からビデオデータ104,ビデオデータ104に対応するメタ情報108,解析情報106をクライアント端末側にダウンロードしてあり、かつクライアント側で検索等のすべての処理を行う場合について示している。
図9のマルチメディアデータ検索閲覧プログラム200は、要求受理部201,再生位置記憶部202,要求解析部203,検索部204,再生位置比較部205,再生位置変更部206,再生制御部207およびデータ解析部901より構成されている。このように図9は、図2と比較してデータ解析部901と、意味解析ルール251cが追加されている点が異なっている。このマルチメディアデータ検索閲覧プログラム200は、コンピュータにより実行される。なお、プログラムを実行するためのプロセッサ,ROM,RAM等の本発明が実施されるコンピュータの構成については本発明の要旨でないので図からは省略しているが、汎用のコンピュータを用いれば良い。
この第2の実施形態では、検索部204で必要となる予め作成されたマルチメディアデータ104の解析情報106を、サーバ102側からダウンロードするのではなく、マルチメディア再生時に生成する。この例ではデータ解析部901が、ビデオデータ104の再生時に意味解析ルール251cを用いて解析情報106を生成する。
図9において、再生制御部207は、ユーザの入力する指示に従い、記憶装置110に格納されている音声付のビデオデータ104および当該ビデオデータ104に対応するメタ情報108の読み込み、音声付のビデオデータ104およびこのビデオデータに対応するメタ情報108の再生表示、一時停止等の制御などを行う。
データ解析部901は、再生制御部207の制御によって音声付のビデオデータ104の再生が開始されると、この再生中の音声付のビデオデータ104を解析して解析情報106を生成し、解析情報106として記憶装置110内に格納する。このビデオデータ104の解析は、具体的には次のように行われる。
(1)再生中の音声付のビデオデータ104に含まれる発話部分を音声認識し、図5に示すような発話テキストデータ501を生成する。ただし、図5の例に加え、ここでは各発話テキストに、ビデオデータ104の中でその発話が行われる位置情報(例えば、再生時間情報)が対応付けられている。
(2)記憶装置110に格納されている意味解析ルール251cを用いて、上記発話テキストデータ501を解析し、図6の符号601に示すような解析した情報を生成し、解析情報106へ追加していく。
このようにして解析情報106が生成される。なお、この例では音声信号から発話テキストデータ501を生成したが、この発明はこれに限定されず、字幕データから作成してもよい。字幕データとしては、字幕が映像として送信されてきた映像から抽出してもよいが、ビデオデータの関連情報としてテキストコードが含まれている場合には、このテキストコードを用いた方が、映像から抽出するよりも、より正しいテキストコードを得ることができる。
データ解析部901は、ビデオデータ104に対応する解析情報106を参照して、既に解析が終わった部分の再生が行われている場合にはビデオデータ104の解析は行わず、まだ解析が終わっていない部分の再生が行われている場合はビデオデータ104の解析を行う。
ユーザがビデオデータ104に関して検索を行う場合には、通常、ユーザが興味を持っている情報カテゴリに関するものが多いものと予測される。このため記憶装置110にユーザプロファイルを格納しておき、ビデオデータ104の解析時にこれを利用することも可能である。ユーザプロファイル情報としては、例えば、ユーザがどのような情報カテゴリに興味があるかを記述しておく。この場合、ユーザプロファイルに記述のある情報カテゴリに属するルールのみを意味解析ルール251cとしてダウンロードすればよい。このようにするとデータ解析時に適用するルール数を絞ることができ、データ解析に要する負荷を軽くすることができ、効率的なデータ解析を行うことができる。
また、記憶装置110にユーザのプロファイルに代えて、ユーザの操作履歴情報を保持しておき、ビデオデータ104の解析時に、操作履歴情報に応じてデータ解析時に適用するルール数を絞るようにしてもよい。
要求解析部203は、要求受理部201で受理したユーザの要求である質問文テキストを解析し、記憶装置110に格納されている解析ルール251内の要求タイプ解析ルール251aおよび情報タイプ解析ルール251bに格納されているルールに従って、質問文の要求している情報のタイプを推定する。例えば、質問文テキストが「○○がXXしたのはいつだった?」という質問文の場合には、「いつだった?」という表現から求められている情報は、日付あるいは時間の情報であると推定する。
検索部204は、要求解析部203により推定された情報タイプである、例えば、要求されているのは日付あるいは時間の情報であると推定された情報タイプに応じて、解析情報106から日付あるいは時間に関する記述で、かつ、質問文の他のキーワード(「○○」あるいは「XXした」)に関連すると推定されるものを回答候補として抽出する。
以上説明した通り、この発明の第2の実施形態では第1の実施形態と同様の効果を得ることができる。更に、予め解析情報が用意されていないマルチメディアデータに対しても本発明によるマルチメディア再生方法を利用することができるという効果を得ることができる。
図10は、この発明のマルチメディアデータ再生装置をコンピュータで実現したときのハードウェアの一例を示す図である。
このコンピュータは、プログラムを実行する中央演算装置1001と、プログラムやプログラムが処理中のデータを格納するメモリ1002と、プログラム、検索対象のデータ及びOS(Operating System)を格納しておく磁気ディスクドライブ1003と、光ディスクにプログラムやデータを読み書きする光ディスクドライブ1004とを備える。
さらに、ディスプレイ等に画面を表示させるためのインタフェースである画像出力部1005と、キーボード・マウス・タッチパネル等からの入力を受ける入力受付部1006と、外部装置との出入力インタフェース(例えばUSB(Universal Serial Bus)、音声出力端子等)である出入力部1007とを備える。また、LCD、CRT、プロジェクタ等の表示装置1008と、キーボードやマウス等の入力装置1009と、メモリカードリーダ,スピーカーの外部装置1010とを備える。外部装置1010は、機器ではなくネットワークであっても良い。
中央演算装置1001は、磁気ディスクドライブ1003からプログラムを読み出してメモリ1002に記憶させた後にプログラムを実行することにより図1に示す各機能を実現する。プログラム実行中に、磁気ディスクドライブ1003から検索対象データの一部或いは全部を読み出してメモリ1002に記憶させておいても良い。
基本的な動作は、入力装置1009を介して利用者からの検索要求を受け、検索要求に応じて磁気ディスクドライブ1003やメモリ1002に記憶させた検索対象データを検索する。そして、表示装置1008に検索結果を表示させる。
検索結果は表示装置1008に表示させるだけでなく、例えば外部装置1010としてスピーカーを接続しておいて音声で利用者に提示しても良い。あるいは、外部装置1010としてプリンタを接続しておいて、印刷物として提示しても良い。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
この発明のマルチメディアデータ再生装置の利用形態の一例を示した図。 この発明のマルチメディアデータ再生装置の構成を説明するための機能ブロック図。 この発明のマルチメディアデータ再生装置の構成を説明するための機能ブロック図。 ビデオデータ104の発話内容の例を示した図。 図4のビデオデータ104の発話部分をテキスト化した発話テキストデータを示した図。 図5の発話テキストデータの解析した解析情報の一例を示した図。 マルチメディアデータ検索閲覧プログラム200によるマルチメディアデータの表示例を示した図。 マルチメディアデータ検索閲覧プログラム200によるマルチメディアデータの表示例を示した図。 この発明のマルチメディアデータ再生装置の構成を説明するための機能ブロック図。 マルチメディアデータ再生装置をコンピュータで実現したときのハードウェアの一例を示す図。
符号の説明
101…クライアント端末、102…サーバ、104…ビデオデータ、106…解析情報、108…メタ情報、200…マルチメディアデータ検索閲覧プログラム、201…要求受理部、202…再生位置記憶部、203…要求解析部、203a…要求タイプ推定部、203b…情報タイプ推定部、204…検索部、205…再生位置比較部、205a…再生位置比較部、205b…優先順位計算部、206…再生位置変更部、207…再生制御部、251…解析ルール、251a…要求タイプ解析ルール、251b…情報タイプ解析ルール、251c…意味解析ルール、501…発話テキストデータ、601…解析した情報、700…マルチメディアデータ検索閲覧インタフェース、701…ユーザ要求入力部、702…ビデオデータ表示部、703…メタ情報表示部、704…ビデオデータ制御部、708…回答表示部、709…ボタン、801…検索結果表示制御部、802…ボタン、803…ボタン、901…データ解析部、1001…中央演算装置、1002…メモリ、1003…磁気ディスクドライブ、1004…光ディスクドライブ、1005…画像出力部、1006…入力受付部、1007…出入力部、1008…表示装置、1009…入力装置、1010…外部装置。

Claims (10)

  1. 複数メディアからなるマルチメディアデータの再生制御を行う再生制御手段と、
    ユーザからの質問を受理する質問受理手段と、
    この質問受理手段がユーザから質問を受理した時点の、前記再生制御手段によって再生させている前記マルチメディアデータの再生位置を記憶する再生位置記憶手段と、
    前記質問受理手段で受理した質問を解析する解析手段と、
    この解析手段の解析結果を用いて、前記質問に対する回答を前記マルチメディアデータの解析情報から検索する検索手段と、
    この検索手段により検索された前記回答をユーザに提示するために出力する手段と、
    前記検索手段により検索された前記回答に対応する前記マルチメディアデータ中の回答出現位置と、前記再生位置記憶手段により記憶された前記再生位置とを比較する位置比較手段と、
    この位置比較手段による比較結果に応じて、前記再生制御手段に前記マルチメディアデータの再生位置を変更させる再生位置変更手段とを備えたことを特徴とするマルチメディアデータ再生装置。
  2. 更に、再生された前記マルチメディアデータおよび前記回答を表示する表示手段とを備えたことを特徴とする請求項1または2記載のマルチメディアデータ再生装置。
  3. 更に、前記マルチメディアデータを解析して、前記解析情報を生成する解析情報生成手段とを備えたことを特徴とする請求項1記載のマルチメディアデータ再生装置。
  4. 前記解析情報は、
    前記マルチメディアデータ中の各発話に含まれるキーワードに対して付与され、予め定義された意味属性と、該キーワードが該意味属性を持つことの確信度を表すスコアと、該キーワードの前記マルチメディアデータ中の出現位置を特定するための時間情報とを含むことを特徴とする請求項3に記載のマルチメディアデータ再生装置。
  5. 前記解析手段は、
    前記質問が求める回答の型を推定する推定手段を有し、
    前記検索手段は、
    前記推定手段により推定された回答の型の回答を検索することを特徴とする請求項1乃至4のいずれか1項に記載のマルチメディアデータ再生装置。
  6. 前記位置比較手段は、
    前記再生位置記憶手段により記憶された再生位置に近い位置に対応する回答ほど、回答としての優先順位を高くすることを特徴とする請求項1乃至5のいずれか1項に記載のマルチメディアデータ再生装置。
  7. 前記位置比較手段は、
    前記検索手段により検索された回答の確信度も算出し、この確信度も利用して回答の優先順位を計算することを特徴とする請求項1乃至6のいずれか1項に記載のマルチメディアデータ再生装置。
  8. 前記位置比較手段は、
    前記回答となる回答候補が複数ある場合、前記再生位置記憶手段により記憶された再生位置よりも過去であると共に一番近い位置の回答候補を当該質問の回答とすることを特徴とする請求項1乃至7のいずれか1項に記載のマルチメディアデータ再生装置。
  9. 前記解析手段は、
    予め定義されたユーザプロファイル情報またはユーザの操作履歴情報に基づき、データ解析時に適用するルール数を絞ることを特徴とする請求項1乃至8のいずれか1項に記載のマルチメディアデータ再生装置。
  10. 再生制御手段により複数メディアからなるマルチメディアデータの再生制御を行う再生制御ステップと、
    ユーザからの質問を受理する質問受理ステップと、
    この質問受理ステップがユーザから質問を受理した時点の、前記再生制御手段によって再生させている前記マルチメディアデータの再生位置を記憶する再生位置記憶ステップと、
    前記質問受理手段で受理した質問を解析する解析ステップと、
    この解析ステップの解析結果を用いて、前記質問に対する回答を前記マルチメディアデータの解析情報から検索する検索ステップと、
    この検索ステップにより検索された前記回答をユーザに提示するために出力するステップと、
    前記検索ステップにより検索された前記回答に対応する前記マルチメディアデータ中の回答出現位置と、前記再生位置記憶ステップにより記憶された前記再生位置とを比較する位置比較ステップと、
    この位置比較ステップによる比較結果に応じて、前記再生制御手段に前記マルチメディアデータの再生位置を変更させる再生位置変更ステップとを備えたことを特徴とするマルチメディアデータ再生方法。
JP2004192393A 2004-06-30 2004-06-30 マルチメディアデータ再生装置およびマルチメディアデータ再生方法 Expired - Fee Related JP4251634B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004192393A JP4251634B2 (ja) 2004-06-30 2004-06-30 マルチメディアデータ再生装置およびマルチメディアデータ再生方法
US11/165,285 US20060004871A1 (en) 2004-06-30 2005-06-24 Multimedia data reproducing apparatus and multimedia data reproducing method and computer-readable medium therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004192393A JP4251634B2 (ja) 2004-06-30 2004-06-30 マルチメディアデータ再生装置およびマルチメディアデータ再生方法

Publications (2)

Publication Number Publication Date
JP2006019778A true JP2006019778A (ja) 2006-01-19
JP4251634B2 JP4251634B2 (ja) 2009-04-08

Family

ID=35515321

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004192393A Expired - Fee Related JP4251634B2 (ja) 2004-06-30 2004-06-30 マルチメディアデータ再生装置およびマルチメディアデータ再生方法

Country Status (2)

Country Link
US (1) US20060004871A1 (ja)
JP (1) JP4251634B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110103232A (ko) * 2010-03-12 2011-09-20 엘지전자 주식회사 영상 표시 방법 및 그 장치
WO2020004186A1 (ja) * 2018-06-25 2020-01-02 日本電信電話株式会社 情報検索装置、方法、及びプログラム
JP2021521525A (ja) * 2018-05-07 2021-08-26 グーグル エルエルシーGoogle LLC ネットワークにおけるデジタルコンテンツの音声ベースの検索

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070276852A1 (en) * 2006-05-25 2007-11-29 Microsoft Corporation Downloading portions of media files
US8907866B2 (en) * 2006-09-13 2014-12-09 Nikon Corporation Head mount display
US10248931B2 (en) * 2008-06-23 2019-04-02 At&T Intellectual Property I, L.P. Collaborative annotation of multimedia content
JP4735726B2 (ja) * 2009-02-18 2011-07-27 ソニー株式会社 情報処理装置および方法、並びにプログラム
EP2665262A4 (en) * 2011-01-12 2014-08-20 Sharp Kk PLAYING DEVICE, METHOD FOR CONTROLLING THE PLAYING DEVICE, MANUFACTURING DEVICE, METHOD FOR CONTROLLING THE PRODUCTION DEVICE, RECORDING MEDIUM, DATA STRUCTURE, CONTROL PROGRAM AND RECORDING MEDIUM WITH THE PROGRAM SAVED THEREFROM
US9805125B2 (en) 2014-06-20 2017-10-31 Google Inc. Displaying a summary of media content items
US9838759B2 (en) 2014-06-20 2017-12-05 Google Inc. Displaying information related to content playing on a device
US10206014B2 (en) 2014-06-20 2019-02-12 Google Llc Clarifying audible verbal information in video content
US9946769B2 (en) 2014-06-20 2018-04-17 Google Llc Displaying information related to spoken dialogue in content playing on a device
CN104994416A (zh) * 2015-07-10 2015-10-21 苏州朗捷通智能科技有限公司 一种多媒体智能控制系统
US10349141B2 (en) 2015-11-19 2019-07-09 Google Llc Reminders of media content referenced in other media content
US10034053B1 (en) 2016-01-25 2018-07-24 Google Llc Polls for media program moments
CN111240635A (zh) * 2020-01-08 2020-06-05 北京松果电子有限公司 信息处理方法、装置、终端、服务器及存储介质
WO2021183148A2 (en) 2020-03-13 2021-09-16 Google Llc Media content casting in network-connected television devices

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11146325A (ja) * 1997-11-10 1999-05-28 Hitachi Ltd 映像検索方法および装置並びに映像情報作成方法およびその処理プログラムを格納した記憶媒体
US6636238B1 (en) * 1999-04-20 2003-10-21 International Business Machines Corporation System and method for linking an audio stream with accompanying text material
US6785671B1 (en) * 1999-12-08 2004-08-31 Amazon.Com, Inc. System and method for locating web-based product offerings
US7624337B2 (en) * 2000-07-24 2009-11-24 Vmark, Inc. System and method for indexing, searching, identifying, and editing portions of electronic multimedia files
EP1402408A1 (en) * 2001-07-04 2004-03-31 Cogisum Intermedia AG Category based, extensible and interactive system for document retrieval
JP3904869B2 (ja) * 2001-09-26 2007-04-11 株式会社東芝 学習支援装置および学習支援方法
JP2003259316A (ja) * 2002-02-28 2003-09-12 Toshiba Corp ストリーム処理システムおよびストリーム処理プログラム
US20050071328A1 (en) * 2003-09-30 2005-03-31 Lawrence Stephen R. Personalization of web search

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110103232A (ko) * 2010-03-12 2011-09-20 엘지전자 주식회사 영상 표시 방법 및 그 장치
KR101677622B1 (ko) * 2010-03-12 2016-11-18 엘지전자 주식회사 영상 표시 방법 및 그 장치
JP2021521525A (ja) * 2018-05-07 2021-08-26 グーグル エルエルシーGoogle LLC ネットワークにおけるデジタルコンテンツの音声ベースの検索
JP2022070886A (ja) * 2018-05-07 2022-05-13 グーグル エルエルシー ネットワークにおけるデジタルコンテンツの音声ベースの検索
JP7311653B2 (ja) 2018-05-07 2023-07-19 グーグル エルエルシー ネットワークにおけるデジタルコンテンツの音声ベースの検索
US11776536B2 (en) 2018-05-07 2023-10-03 Google Llc Multi-modal interface in a voice-activated network
WO2020004186A1 (ja) * 2018-06-25 2020-01-02 日本電信電話株式会社 情報検索装置、方法、及びプログラム

Also Published As

Publication number Publication date
US20060004871A1 (en) 2006-01-05
JP4251634B2 (ja) 2009-04-08

Similar Documents

Publication Publication Date Title
AU2018260958B2 (en) Intelligent automated assistant in a media environment
US20060004871A1 (en) Multimedia data reproducing apparatus and multimedia data reproducing method and computer-readable medium therefor
US8168876B2 (en) Method of displaying music information in multimedia playback and related electronic device
JP4816207B2 (ja) 情報処理システムおよび方法
US20070223871A1 (en) Method of Generating a Content Item Having a Specific Emotional Influence on a User
EP3323058A1 (en) Intelligent automated assistant for media search and playback
JP4388128B1 (ja) 情報提供サーバ、情報提供方法及び情報提供システム
JP5135024B2 (ja) コンテンツのシーン出現を通知する装置、方法およびプログラム
KR20090004990A (ko) 인터넷 검색 기반 텔레비전을 위한 방법, 매체 및 시스템
US9558784B1 (en) Intelligent video navigation techniques
US20230280966A1 (en) Audio segment recommendation
US8781301B2 (en) Information processing apparatus, scene search method, and program
US20080005100A1 (en) Multimedia system and multimedia search engine relating thereto
JP2007511858A (ja) 拡張検索機能を提供するメタ情報及びサブタイトル情報が記録された記録媒体及びその再生装置
JP4865469B2 (ja) コンテンツ制作サーバ、コンテンツ提示装置、コンテンツ制作プログラム、及びコンテンツ提示プログラム
US9094650B2 (en) Chapter creating device, chapter creating method, and computer program product therefor
KR100879667B1 (ko) 멀티미디어 처리 장치의 어학 학습 방법
JP2009118024A (ja) 放送受信端末
JP2013198110A (ja) コンテンツ再生装置、コンテンツ再生方法及びコンテンツ再生プログラム
KR20120050153A (ko) 멀티미디어 플레이어 제공 장치 및 방법
JP5608785B2 (ja) 放送受信端末
KR20120050185A (ko) 멀티미디어 플레이어 제공 장치 및 방법
JP2016015621A (ja) コンテンツ再生装置、コンテンツ再生のためのプログラム、コンテンツ再生方法、およびコンテンツ再生システム
KR20100126901A (ko) 자막 단어 검색 장치 및 방법

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081014

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090116

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090119

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120130

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees