JP4353084B2 - 映像再生方法及び装置及びプログラム - Google Patents

映像再生方法及び装置及びプログラム Download PDF

Info

Publication number
JP4353084B2
JP4353084B2 JP2004347281A JP2004347281A JP4353084B2 JP 4353084 B2 JP4353084 B2 JP 4353084B2 JP 2004347281 A JP2004347281 A JP 2004347281A JP 2004347281 A JP2004347281 A JP 2004347281A JP 4353084 B2 JP4353084 B2 JP 4353084B2
Authority
JP
Japan
Prior art keywords
audio
video
user
sound
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004347281A
Other languages
English (en)
Other versions
JP2006157692A (ja
Inventor
誠 武藤
聡 嶌田
和 宮川
宏志 小西
俊和 狩塚
正志 森本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004347281A priority Critical patent/JP4353084B2/ja
Publication of JP2006157692A publication Critical patent/JP2006157692A/ja
Application granted granted Critical
Publication of JP4353084B2 publication Critical patent/JP4353084B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、映像再生方法及び装置及びプログラムに係り、特に、映像視聴者の音声を映像と共に再生する映像再生方法及び装置及びプログラムに関する。
今日、映像と共に付加的な情報提示としてテキストや静止画を映像に動機させて提示することで、ユーザへより多様な情報の提示を行うことが行われている。
このようなシステムにおいて、テキストや静止画を提示する場合、複数の情報が同時に提示された場合においても、利用者は必要な情報を取捨選択して読んだり、見たりすることができる。しかしながら、付加情報として複数の音声を同時に提示しようとした場合、音声を同時再生すると音声の重複によってユーザは内容が理解できないため、それを回避するためにシステム側で音声の再生を制御する必要があり、そのためのいくつかの方法が提案されている。
従来の第1の方法として、特定の話者からの発声要求によって他の発声者の音声をカットして、当該発声者の発声を優先的に再生するという方法がある(例えば、特許文献1参照)。
また、従来の第2の方法として、ユーザの発声履歴に基づいて、各ユーザのゲインを制御して、会話の中心となる相手の聞き分けを容易にする方法がある(例えば、特許文献2参照)。
特開平4−191350号公報 特開2000−49948号公報
しかしながら、上記従来の第1の方法には、特定話者の発声に重複して他の話者の発声があった場合に、該特定話者の発声開始時点、終了時点において、他の話者の発声が途切れて、または、途中から再生されるという問題がある。例えば、ある話者が話している途中で、当該特定話者が話し始めると、もともと話していた話者の発声が途中で途切れて、内容の理解に支障をきたす場合がある。
また、上記従来の第2の方法には、会話の中心でない人の聞き分けをも容易にする目的では利用できないという問題がある。例えば、ユーザが会話の中心でない人の音声を聞きたい場合もあるが、そのような用途には利用できない。
本発明は、上記の点に鑑みなされたもので、ユーザの音声コメントを、重なることなく聞くことが可能な映像再生方法及び装置及びプログラムを提供することを目的とする。
図1は、本発明の原理説明図である。
本発明(請求項1)は、同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生方法において、
映像を読み込んで再生を開始する再生開始ステップ(ステップ1)と、
ユーザ毎に設けられている、映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する音声区間情報ファイルを参照し、該開始時刻、該終了時刻が設定されているか否かに基づいて、該ユーザ毎に設けられている視聴者音声ファイルに音声が格納されているかを判定する音声存在判定ステップ(ステップ2)と、
視聴者音声ファイルに音声が格納されている場合に、該音声が非言語か否かを判定し、非言語の場合には該音声を再生する非言語判定ステップ(ステップ3)と、
非言語判定ステップ(ステップ3)において、非言語ではないと判定された場合には、音声区間情報ファイルに格納されている音声区間に対応するユーザの音声について、ユーザ毎に予め決められている評価値が格納されているユーザ評価情報ファイルをユーザIDに基づいて参照し、最も高い評価値を有するユーザの音声を再生する音声再生ステップ(ステップ4)と、
音声再生ステップ(ステップ4)で音声再生された次の音声区間に対して、音声存在判定ステップ(ステップ2)、非言語判定ステップ(ステップ3)、音声再生ステップ(ステップ4)を映像ファイルの映像が終了するまで繰り返す繰り返しステップ(ステップ5)と、を行う。
本発明は、同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生方法において、
映像を読み込んで再生を開始する再生開始ステップと、
ユーザ毎に設けられている、映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する音声区間情報ファイルを参照し、該開始時刻、該終了時刻が設定されているか否かに基づいて、該ユーザ毎に設けられている視聴者音声ファイルに音声が格納されているかを判定する音声存在判定ステップと、
視聴者音声ファイルに音声が格納されている場合に、該音声が非言語か否かを判定し、非言語の場合には該音声を再生する非言語判定ステップと、
非言語判定ステップにおいて、非言語ではないと判定された場合には、音声区間情報ファイルに格納されている音声区間に対応するユーザの音声について、ユーザ毎に予め決められている評価値が格納されているユーザ評価情報ファイルをユーザIDに基づいて参照し、評価値に基づいて再生する音量を決定し、音声を再生する音声再生ステップと、
音声再生ステップで音声再生された次の音声区間に対して、音声存在判定ステップ、非言語判定ステップ、音声再生ステップを映像ファイルの映像が終了するまで繰り返す繰り返しステップと、を行う。
本発明(請求項3)は、同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生方法において、
映像を読み込んで再生を開始する再生開始ステップと、
ユーザ毎に設けられている、映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する音声区間情報ファイルを参照し、該開始時刻、該終了時刻が設定されているか否かに基づいて、該ユーザ毎に設けられている視聴者音声ファイルに音声が格納されているかを判定する音声存在判定ステップと、
視聴者音声ファイルに音声が格納されている場合に、該音声が非言語か否かを判定し、非言語以外で発声が重複しないユーザのグループを全ての音声区間情報ファイルを検索することにより取得する第1のユーザグループ検索ステップと、
第1のユーザグループ検索ステップにより取得したユーザのグループに基づいて、視聴者音声ファイルから該グループに属する全てのユーザの音声を読み出して音声を再生する第1の音声再生ステップと、
第1のユーザグループ検索ステップにおいて選択されなかったユーザの中で、発声が重複しないユーザのグループを、該ユーザの音声区間情報ファイルを検索することにより検索する第2のユーザグループ検索ステップと、
第2のユーザグループ検索ステップで検索されたグループの全ユーザの音声を視聴者音声ファイルから読み出して、映像と共に遡って再生する第2の音声再生ステップと、
全てのユーザの音声の再生が終了するまで、第2のユーザグループ検索ステップ及び第2の音声再生ステップを繰り返す繰り返しステップと、を行う。
本発明(請求項4)は、同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生方法において、
映像を読み込んで再生を開始する再生開始ステップと、
ユーザ毎に設けられている視聴者音声ファイルのうち、未再生のユーザの音声について、ユーザ毎に予め決められている評価値が格納されているユーザ評価情報ファイルを参照して、評価値が最大のユーザの音声を該ユーザの視聴者音声ファイルから読み出して再生する第1の音声再生ステップと、
前回再生されたユーザの次の発声までの時間間隔に収まる他のユーザの音声を、ユーザ毎に設けられている映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する全ての音声区間情報ファイルを検索することにより取得する発声候補検索ステップと、
発声候補検索ステップで取得したユーザの音声のうち、前回再生されたユーザの次に評価値が高いユーザの音声を該ユーザの視聴者音声ファイルから読み出して再生する第2の音声再生ステップと、
全てのユーザの音声を再生するまで、発声候補検索ステップ及び第2の音声再生ステップを繰り返す繰り返しステップと、を行う。
本発明(請求項5)は、請求項1の音声再生ステップにおいて、
音声区間内に最も高い評価値を有するユーザの音声を視聴者音声ファイルから読み出して再生する際に、
所定の時間マージンTの音声区間の再生の重複を許容する。
本発明(請求項6)は、同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生方法において、
映像を読み込んで再生を開始する再生開始ステップと、
ユーザ毎に設けられている、映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する音声区間情報ファイルを参照し、該開始時刻、該終了時刻が設定されているか否かに基づいて、該ユーザ毎に設けられている視聴者音声ファイルに音声が格納されているかを判定する音声存在判定ステップと、
視聴者音声ファイルに音声が格納されている場合に、非言語の場合には該音声を再生する非言語判定ステップと、
非言語判定ステップにおいて、非言語ではないと判定された第1の音声について、該第1の音声の開始時刻と該第1の音声の次に発声された他のユーザの第2の音声の開始時刻との差が該第1の音声の区間長よりも短い場合には、該第1の音声を短縮して再生する音声再生ステップと、
音声区間情報ファイルに格納されている音声区間の全てに対して、音声存在判定ステップ、非言語判定ステップ、音声再生ステップを繰り返す繰り返しステップと、を行う。
図2は、本発明の原理構成図である。
本発明(請求項7)は、同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生装置であって、
映像を格納した映像ファイル101と、
ユーザ毎に設けられている、映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する複数の音声区間情報ファイル210と、
ユーザ毎に設けられている該ユーザの音声が格納されている複数の視聴者音声ファイル10と、
ユーザ毎に予め決められている評価値が格納されているユーザ評価情報ファイル108と、
映像・音声を再生する再生手段110と、
音声の再生を制御するための再生制御手段120と、を有し、
再生手段110は、
映像ファイル101から映像を読み込んで再生を開始する映像再生開始手段と、
再生制御手段120からの指示に基づいて、音声を映像に同期させて再生させる手段と、を有し、
再生制御手段120は、
音声区間情報ファイル20を参照し、該開始時刻、該終了時刻が設定されているか否かに基づいて、視聴者音声ファイル10に音声が格納されているかを判定する音声存在判定手段と、
視聴者音声ファイル10に音声が格納されている場合に、該音声が非言語か否かを判定する非言語判定手段と、
非言語判定手段において、非言語ではないと判定された場合には、音声区間情報ファイル20に格納されている音声区間に対応するユーザの音声について、ユーザ評価情報ファイル108をユーザIDに基づいて参照し、最も高い評価値を有するユーザの音声を再生手段に再生させ、非言語判定手段において非言語と判定された場合には該非言語の音声を再生手段に再生させる音声再生制御手段と、
再生手段110で音声再生された次の音声区間に対して、音声存在判定手段、非言語判定手段、音声再生制御手段を映像ファイルの映像が終了するまで繰り返す繰り返し手段と、
を有する。
本発明(請求項8)は、同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生であって、
映像を格納した映像ファイルと、
ユーザ毎に設けられている、映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する複数の音声区間情報ファイルと、
ユーザ毎に設けられている該ユーザの音声が格納されている複数の視聴者音声ファイルと、
ユーザ毎に予め決められている評価値が格納されているユーザ評価情報ファイルと、
映像・音声を再生する再生手段と、
音声の再生を制御するための再生制御手段と、を有し、
再生手段は、
映像ファイルから映像を読み込んで再生を開始する映像再生開始手段と、
再生制御手段からの指示に基づいて、音声を映像に同期させて再生させる手段と、を有し、
再生制御手段は、
音声区間情報ファイルを参照し、該開始時刻、該終了時刻が設定されているか否かに基づいて、視聴者音声ファイルに音声が格納されているかを判定する音声存在判定手段と、
視聴者音声ファイルに音声が格納されている場合に、該音声が非言語か否かを判定する非言語判定手段と、
非言語判定手段において、非言語ではないと判定された場合には、音声区間情報ファイルに格納されている音声区間に対応するユーザの音声について、ユーザ評価情報ファイルを該ユーザのユーザIDに基づいて参照し、評価値に基づいて再生手段に再生させる音量を決定し、該音量でユーザごとの音声を再生手段に再生させ、該非言語判定手段において、非言語と判定された場合には、非言語の音声を該再生手段に再生させる音声再生制御手段と、
音声再生された次の音声区間に対して、音声存在判定手段、非言語判定手段、音声再生制御手段を映像ファイルの映像が終了するまで繰り返す繰り返し手段と、
を有する。
本発明(請求項9)は、同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生装置であって、
映像を格納した映像ファイルと、
ユーザ毎に設けられている、映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する複数の音声区間情報ファイルと、
ユーザ毎に設けられている該ユーザの音声が格納されている複数の視聴者音声ファイルと、
映像・音声を再生する再生手段と、
音声の再生を制御するための再生制御手段と、を有し、
再生手段は、
映像ファイルから映像を読み込んで再生を開始する映像再生開始手段と、
再生制御手段からの指示に基づいて、音声を映像に同期させて再生させる手段と、を有し、
再生制御手段は、
音声区間情報ファイルを参照し、該開始時刻、該終了時刻が設定されているか否かに基づいて、視聴者音声ファイルに音声が格納されているかを判定する音声存在判定手段と、
視聴者音声ファイルに音声が格納されている場合に、該音声が非言語か否かを判定する非言語判定手段と、
非言語以外で発声が重複しないユーザのグループを全ての音声区間情報ファイルを検索することにより取得する第1のユーザグループ検索手段と、
第1のユーザグループ検索手段により取得したユーザのグループに基づいて、視聴者音声ファイルから該グループに属する全てのユーザの音声を読み出して、再生手段に音声を再生させる第1の音声再生制御手段と、
第1のユーザグループ検索手段において選択されなかったユーザの中で、発声が重複しないユーザのグループを、音声区間情報ファイルを検索することにより検索する第2のユーザグループ検索手段と、
第2のユーザグループ検索手段で検索されたグループに属する全てのユーザの音声を視聴者音声ファイルから読み出して、再生手段に映像と共に遡って再生させる第2の音声再生制御手段と、
全てのユーザの音声の再生が終了するまで、第2のユーザグループ検索手段及び第2の音声再生制御手段を繰り返す繰り返し手段と、を有する。
本発明(請求項10)は、同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生装置であって、
映像を格納した映像ファイルと、
ユーザ毎に設けられている、映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する複数の音声区間情報ファイルと、
ユーザ毎に設けられている該ユーザの音声が格納されている複数の視聴者音声ファイルと、
ユーザ毎に予め決められている評価値が格納されているユーザ評価情報ファイルと、
映像・音声を再生する再生手段と、
音声の再生を制御するための音声再生制御手段と、を有し、
再生手段は、
映像ファイルから映像を読み込んで再生を開始する映像再生開始手段と、
再生制御手段からの指示に基づいて、音声を映像に同期させて再生させる手段と、を有し、
音声再生制御手段は、
視聴者音声ファイルのうち、未再生のユーザの音声について、ユーザ評価情報ファイルを参照して、評価値が最大のユーザの音声を視聴者音声ファイルから読み出して再生手段に再生させる第1の音声再生制御手段と、
前回再生されたユーザの次の発声までの時間間隔に収まる他のユーザの音声を、全ての音声区間情報ファイルを検索することにより取得する発声候補検索手段と、
発声候補検索手段で取得したユーザの音声のうち、ユーザ評価情報ファイルを参照して、前回再生されたユーザの次に評価値が高いユーザの音声を、該ユーザの視聴者音声ファイルから読み出して再生手段に再生させる第2の音声再生制御手段と、
全てのユーザの音声を再生するまで、発声候補検索手段及び第2の音声再生制御手段を繰り返す繰り返し手段と、を有する。
本発明(請求項11)は、請求項7の音声再生制御手段において、
音声区間内に最も高い評価値を有するユーザの音声を視聴者音声ファイルから読み出して、再生手段に再生させる際に、
所定の時間マージンTの音声区間の再生の重複を許容する手段を含む。
本発明(請求項12)は、同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生装置であって、
映像を格納した映像ファイルと、
ユーザ毎に設けられている、映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する複数の音声区間情報ファイルと、
ユーザ毎に設けられている該ユーザの音声が格納されている複数の視聴者音声ファイルと、
映像・音声を再生する再生手段と、
音声の再生を制御するための音声再生制御手段と、を有し、
再生手段は、
映像ファイルから映像を読み込んで再生を開始する映像再生開始手段と、
再生制御手段からの指示に基づいて、音声を映像に同期させて再生させる手段と、を有し、
音声再生制御手段は、
音声区間情報ファイルを参照し、該開始時刻、該終了時刻が設定されているか否かに基づいて、視聴者音声ファイルに音声が格納されているかを判定する音声存在判定手段と、
視聴者音声ファイルに音声が格納されている場合に、該音声が非言語か否かを判定する非言語判定手段と、
非言語判定手段において、非言語であると判定された音声を再生手段に再生させ、非言語ではないと判定された第1の音声について、該第1の音声の開始時刻と該第1の音声の次に発声された他のユーザの第2の音声の開始時刻との差が該第1の音声の区間長よりも短い場合には、該第1の音声を短縮して該再生手段に再生させる音声再生制御手段と、
音声区間情報ファイルに格納されている音声区間の全てに対して、音声存在判定手段、非言語判定手段、音声再生制御手段を繰り返す繰り返し手段と、を有する。
本発明(請求項13)は、同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生プログラムであって、
請求項1乃至6のいずれかに記載の映像再生方法を実現するための処理をコンピュータに実行させるプログラムである。

上述のように本発明によれば、映像視聴者の音声を映像と共に再生する場合において、複数のユーザの音声を聞き取りに妨げなく聞くことが可能となる。
以下、図面と共に本発明の実施の形態を説明する。
図3は、本発明の一実施の形態におけるシステム構成を示す。同図に示すシステムは、記憶媒体に格納された複数のファイルと、映像再生装置として利用される計算機100及び、計算機100の処理結果を出力するスピーカを含むモニタ200から構成される。
ファイルは、映像ファイル101、視聴者音声ファイルA102、音声区間ファイルA103、視聴者音声ファイルB104、音声区間ファイルB105、視聴者音声ファイルC106、音声区間ファイルC107、ユーザ評価情報ファイル108がある。なお、同図では、視聴者音声ファイルと音声区間ファイルのグループの数を3つとしたが、この数は1以上であれば任意でよい。例えば、映像視聴中の2人の音声を聞く場合は、視聴者音声ファイルC106、音声区間ファイル107は不要であり、N人の視聴者に対してN個の視聴者音声ファイルと、音声区間ファイルを用意すれば本発明は実現可能である。
映像ファイル101は、ユーザが視聴するファイルである。
視聴者音声ファイルA102は、ある視聴者Aが映像ファイル101を見ながら発声した音声をマイク等(図示せず)によって録音して得られた音声ファイルである。ここで、映像ファイル101中の時間と、視聴者音声ファイルA102中の時間は同期が取れているとする。すなわち、映像ファイル101中のある時刻に発せられた音声は、視聴者音声ファイルA102中の当該時刻に対応付けられて記録される。
音声区間ファイルA103は、視聴者音声ファイルA102中で、音声が発声された区間群の開始時刻、終了時刻を有するファイルである。当該音声区間ファイルの例を図4に示す。当該音声区間ファイルは、音声IDに対応付けられた発声の開始時刻/終了時刻が格納される。また、音声区間ファイルA103を無しとして、計算機100によって音声区間ファイルA103に相当する情報を生成するとしてもよい。
視聴者音声ファイルB104は、視聴者音声ファイルA102の音声を発したユーザとは別のユーザが映像ファイル101を視聴しながら発した音声のファイルである。ここで、視聴者音声ファイルA102と同様に映像ファイル101との同期がとられているとする。
音声区間ファイルB105は、視聴者音声ファイルB104の中で、音声が発声された区間群の開始時刻/終了時刻を有するファイルである。
視聴者音声ファイルC106は、視聴者音声ファイルA102の音声を発したユーザ、視聴者音声ファイルB104の音声を発したユーザとは別のユーザが映像ファイル101を視聴しながら発した音声のファイルである。ここで、視聴者音声ファイルA102と同様に映像ファイル101との同期がとられている。
音声区間ファイルC107は、視聴者音声ファイルC106の中で、音声が発声された区間群の開始時刻/終了時刻を有するファイルである。
なお、上記の視聴者音声ファイル102,104,106の構成は、映像ID、音声を入力したシーンID、音声ID、音声を有し、映像ファイル101とはシーンIDにより同期を取るものとする。
ユーザ評価情報ファイル108は、視聴者音声ファイルA102を発声したユーザ(ユーザA)、視聴者音声ファイルB104を発声したユーザ(ユーザB)、視聴者音声ファイルC104を発声したユーザ(ユーザC)の発声の重要度に関する情報を有する。例えば、図5のように、各ユーザに対して、その発声の重要度を0から100までの数値で指定する。なお、ユーザ評価情報ファイル108は、例えば、予め投票等を行い、その投票数等によりユーザ毎に評価を行い、評価値を付与して格納することにより生成されているものとする。
計算機100は、映像ファイル101、視聴者音声ファイルA102、音声区間ファイルC106、音声区間ファイルC107、ユーザ評価情報ファイル108の入力と、モニタ200への映像、音声の送出と、各種処理を行う。
モニタ200は、計算機100から送られる映像を表示し、ユーザに提示する。
図3に示すシステムでは、予め複数のユーザが同一の映像を視聴しながら発声した音声を、任意のユーザに対して当該映像と当該音声とを提示する。例えば、ユーザが発声する音声としては「凄い」、「うまそうだ」、「ヤッホー」などが考えられる。
[第1の実施の形態]
本実施の形態では、蓄積されている音声が非言語・言語であるかを判定し、さらに、言語である場合に、予め定められている評価値に基づいて、再生する音声を決定するものである。
図6は、本発明の第1の実施の形態における映像再生装置の構成を示す。
同図に示す映像再生装置は、上記で説明した映像ファイル101、視聴者音声ファイルA102、音声区間ファイルA103、視聴者音声ファイルB104、音声区間ファイルB105、視聴者音声ファイルC106、音声区間ファイルC107,ユーザ評価情報ファイル108及びモニタ200が映像再生装置として利用される計算機100に接続されている構成である。
映像再生装置100は、再生部110、音声再生制御部120から構成される。
なお、モニタ200には、スピーカが内蔵されている構成とし、再生部110から音声が出力されるものとする。
以下、映像再生装置100の動作を説明する。
図7は、本発明の第1の実施の形態における動作のフローチャートである。
ステップ101) 再生部110は、映像ファイル101を読み込み、再生を開始して、モニタ200への映像、音声の送出を開始する。
ステップ102) 音声再生制御部120は、現時点において、視聴者音声ファイルA102、視聴者音声ファイルB104、視聴者音声ファイルC106のいずれかに音声が存在するかどうかを、音声区間ファイルA103、音声区間ファイルB105、音声区間ファイルC107を参照して判定する。判定方法としては、各音声区間ファイルの開始時刻及び終了時刻の欄がNULL以外であれば、音声が存在すると判定する。音声が存在する場合には、ステップ103に移行し、存在しない場合は当該ステップを繰り返す。
ステップ103) ステップ102で音声が存在すると判定された場合には、音声が存在した視聴者音声ファイルについて、音声が非言語音声か否かを判定する。ここで、非言語音声とは「えー」「あー」等の音声を指す。音声信号に対して、非言語音声か否かの判定を行う処理としては、例えば、「金澤博史,クリスマエダ、竹林洋一、“計算機と対話のための非言語音声の認識と合成”電子情報通信学会論文誌、D-II, Vol.J77-D-II No.8, pp.1512-1421, 1994」等を用いることができる。また、一括してセンタに非言語/言語の判定を依頼する方法も考えられる。
ここでは、映像再生処理中に判定を行う例を挙げたがが、映像再生処理前に各音声ファイル(102,104,106)に対して非言語音声かどうかの判定を行い、音声区間ファイル(103,105,107)に付加情報として記録しておき、本ステップででは、当該音声区間ファイル中の当該付加情報を参照することによって、非言語音声かどうかの判定を行ってもよい。非言語である場合は、ステップ105に移行する。非言語でない場合にはステップ104に移行する。これは、非言語の音声に関しては、言語の音声と重なった場合に、該言語の理解を妨げる影響が小さいことを考慮して、図8のa,b,cのように非言語音声は全て再生するためである。例えば、「ありがとう」という音声と「おじゃまします」という音声が同時に再生されると、それぞれの音声が聞き取りにくいが、「あー」という非言語音声と、「おじゃまします」という音声が同時に再生されたとしても、「おじゃまします」の音声の聞き取りはあまり妨げられない。
なお、非音声を判定する処理をセンタ側で行うことも可能である。この場合には、視聴者音声ファイル、映像ファイルを当該装置内に持つ必要はない。
ステップ104) 音声再生制御部120は、ステップ102で認められた音声に対して、当該音声の発声区間を音声区間ファイル103、105,107を参照して同定し、当該区間内に当該ユーザよりも評価の高いユーザの音声があるかどうかを、ユーザ評価情報ファイル108と音声区間ファイル103,105,107を参照して判定する。音声がある場合はステップ102に移行し、音声がない場合にはステップ105に移行する。例えば、図8において、ユーザAの音声dに対して、当該音声の区間内には、ユーザAよりも評価の高いユーザの音声は存在しないので、ステップ105に移行して、当該音声が再生される。一方、図8において、ユーザBの音声eに対して、当該音声の区間内にはユーザBよりも評価の高いユーザAの音声が存在するので、ステップ102に移行し、当該音声については再生しない。
これは、評価の高いユーザの音声は、評価のユーザの音声と比べて、聞く必要性が高いことを考慮して、評価の高いユーザの音声と、評価の低いユーザの音声とが重なった場合は、評価の高いユーザの音声のみを再生することによって、音声の重なりによる音声聞き取りの妨げの影響をなくすものである。例えば、図8のユーザAの発声とユーザBの発声が重なっている部分(d,e)において、ユーザAの発声dは再生されるが、ユーザBの発声eは再生されない。
ステップ105) 再生部110は、ステップ102で存在すると判定された音声を再生する。
このように、映像とユーザの音声を同期して再生することにより、映像の各シーンにおいて、他のユーザの発声を聞きながら映像を楽しむことができる。
ステップ106) 映像の末尾まで再生されたかどうかを判定し、映像の末尾である場合は、ステップ107に移行する。映像の末尾でない場合はステップ102に移行する。
ステップ107) 再生部110は、映像と音声の再生を停止する。
このように、本実施の形態では、複数の音声の中で評価の高いユーザの音声を漏れなく聞くことができる。
[第2の実施の形態]
本実施の形態では、予め定められている評価値に基づいて、再生する音量を制御する例を説明する。
本実施の形態における映像再生装置100の構成は、前述の第1の実施の形態における図6の構成と同様であるが、音声再生制御部120と再生部110の動作が異なる。
本実施の形態では、前述の第1の実施の形態のように、発声区間内に自分よりも高い評価の人の発声区間があるか否かを判定するのではなく、ユーザ評価情報ファイル108に予め定められているユーザの評価値の大小に応じて、再生する音量を制御するものである。
図9は、本発明の第2の実施の形態における動作のフローチャートである。同図では、前述の第1の実施の形態における図7と同様の動作については、図7と同一のステップ番号を付し、その説明を省略する。
ステップ204) 音声再生制御部120は、ステップ102で存在すると判定された音声に対して、ユーザ評価情報ファイル108を参照して、評価の大小に応じて再生時の音量を決定する。例えば、図10の例では、ユーザA、ユーザB、ユーザCの順に大きくする。図10では、音量の大きさを四角形の縦の辺の長さの長短で模式的に示している。
音量を決定する際は、例えば、次式で計算されるc値を原音声波形に乗算することにより決定される。ここで、εは、評価値であり、図5に示すように、0から100の値をとり、値が大きいほど評価が高い。
c=ε/100
これは、評価の高いユーザの音声は、評価の低いユーザの音声と比べて、聞く必要性が高いことを考慮して、評価の高いユーザの音声の音量を相対的に大きく再生することによって、音声の重なりによる音声聞き取りの妨げの影響を少なくするためである。例えば、図10のユーザAの発声fとユーザBの発声gが重なっている部分において、再生部110において、ユーザAの発声は、ユーザBの発声よりも大きな音量で再生されるので、ユーザAの発声の聞き取りがあまり妨げられない。
このように、本実施の形態では、複数の音声の中で評価の高いユーザの音声を大きな音で、評価の低いユーザの音声を小さな音で聞くことができる。
[第3の実施の形態]
本実施の形態では、音声区間が重複しないユーザ群毎に、映像を複数回再生するものである。
本実施の形態における映像再生装置100の構成は、前述の第1の実施の形態における図6の構成と同様であるが、音声再生制御部120と再生部110の動作が異なる。
図11は、本発明の第3の実施の形態における動作のフローチャートである。同図において、前述の第1の実施の形態の図7のフローチャートにおける動作と同一動作については、同一符号を付し、その説明を省略する。
ステップ502) 音声再生制御部120は、非言語以外で重複のない発声パターンを持つユーザのグループを、音声区間ファイル103,105,107を参照して検索する。これは、音声区間が重複しない複数のユーザの音声を同時に再生しても、音声の重なりが生じないので、ユーザの音声の聞き取りを妨げることを防ぐことができるからである。例えば、図12のhに示すユーザAとユーザCからなるグループの場合は、非言語以外での重複がなく、同時に再生しても聞き取りの妨げが生じない(ユーザAとユーザCの重複している部分は非言語の部分であるため妨げが生じない)。
ステップ503) 再生部110は、ステップ502で得られたユーザのグループのユーザ(ユーザA,ユーザC)の音声を再生する。
ステップ504) 音声再生制御部120は、ステップ502で得られたユーザのグループを除くユーザの非言語以外での重複のない発声パターンを持つユーザのグループをステップ502と同様に検索する。例えば、図12の場合は、残りのユーザであるユーザBが検索され、ユーザBのみが重複のない発声パターンを持つユーザのグループとして検索される。これは、ステップ503において、音声が再生されなかった(グループhにグループ化されなかった)ユーザの音声を聞くために行う。
ステップ505) 再生部110は、ステップ504で得られたユーザのグループに含まれるユーザの中で最初の音声の時点に遡って映像と当該ユーザの音声を再生する。
ステップ506) ステップ506において全てのユーザの音声を再生したかを判定する。全てのユーザの音声を再生した場合は、ステップ106に移行し、全てのユーザの音声を再生していない場合は、ステップ504に移行する。
これは、図12のように全ユーザの音声を発声区間の重複なく再生するために、映像を複数回時間的に遡って再生して、それに同期してユーザの音声を再生するためである。
このように、本実施の形態では、全てのユーザの全ての音声を音声の重複なしで漏れなく聞くことができる。
[第4の実施の形態]
本実施の形態では、評価が相対的に低いユーザの音声については、映像との同期をずらして、発声区間が重複しないように再生するものである。
本実施の形態における映像再生装置100の構成は、前述の第1の実施の形態における図6の構成と同様であるが、再生部110と音声再生制御部120の動作が異なる。
図13は、本発明の第4の実施の形態における動作のフローチャートである。同図において、前述の図9、図11と同一の動作については同一のステップ番号を付与し、その説明を省略する。
ステップ702) まだ、音声再生制御部120は、音声を再生していないユーザのうちで、評価が最大のユーザをユーザ評価情報ファイル108を参照して同定し、再生部110において当該ユーザの最初の音声を再生する。
なお、音声が再生されたか否かを判定する処理については、音声区間ファイルの音声区間毎にフラグを付与しておき、当該処理の前にフラグがオンかオフかを判定することで実現できる。また、これ以外の方法でも再生済みか否かを判定できる方法であればよい。
ステップ703) 音声再生制御部120は、ステップ702で音声を再生したユーザの次の発声までの時間間隔を音声区間ファイル103,105,107を参照して計算し、その時間間隔に収まる他のユーザ発声を検索し、再生部110において再生する。ここで、当該時間に収まる発声が複数存在した場合は、発声の開始時刻に対する再生が終わった時刻に最も近い発声を採用する。例えば、図14のように、ユーザAの最初の発声jの間隔Tに収まるユーザBの発声nを再生する。詳細な処理については、図15を用いて後述する。
これは、評価の高いユーザの音声は、評価の低いユーザの音声と比べて、映像と同期して再生する必要性が高いことを考慮して、評価の高いユーザの音声は、映像と同期して再生し、相対的に低い評価のユーザの音声は映像と同期をずらして再生することによって、音声の重なりによる音声聞き取りの妨げの映像を小さくして、かつ、全体の総再生時間を短縮するためである。
ステップ704) 再生部110は、ステップ702で再生した次のユーザの音声を再生する。
ステップ705) ステップ702で再生したユーザの音声を全て再生したかどうかを判定し、全て再生した場合はステップ506に移行し、全て再生していない場合はステップ703に移行する。
次に、上記のステップ703の処理について詳しく説明する。
図15は、本発明の第4の実施例の評価値が低いユーザの音声を再生する動作のフローチャートである。以下の説明では、図14の例を用いて説明する。
ステップ7031) ユーザAの次の発声kの開始時刻から今の発声jの終了時刻を引き、空き時間Tとする。
ステップ7032) 空き時間Tに収まる他のユーザの発声があるかを判定し、ない場合には、ステップ704の処理に移行し、ある場合には、ステップ7033に移行する。
ステップ7033) 今発声したユーザAの発声jの終了時刻に最も近い開始時刻を有する他のユーザ(ユーザB)の発声nをピックアップし、再生し、ステップ7031に移行する。
本実施の形態によれば、全てのユーザの全ての音声を、音声の重複なく漏れなく聞くことができ、かつ、第3の実施の形態に比べて短時間で全ての音声を聞くことができる。
[第5の実施の形態]
本実施の形態は、前述の第1の実施の形態における、発声区間内に自分よりも高い評価の人の発声区間があるかどうかの判定(ステップ104)において、一定時間tの重複を許容するものである。
本実施の形態における映像再生装置100の構成は、前述の第1の実施の形態における図6の構成と同様であるが、音声再生制御部120の動作が異なる。
図16は、本発明の第5の実施の形態における動作のフローチャートである。同図において、前述の第1の実施の形態における図9の動作と同一の動作については、同一のステップ番号を付し、その説明を省略する。
ステップ904) 音声再生制御部120は、マージンT秒を除く発声区間内に自分よりも高い評価の人の発声区間があるかをユーザ評価情報ファイル108を参照して判定する。当該発声区間がある場合にはステップ102に移行する。当該発声区間がない場合は、ステップ105に移行する。Tの値は、例えば、既定値として1秒とする。ここで、図17の場合、ユーザAの発声oの発声区間とユーザBの発声pの発声区間の重複時間qはマージンTよりも短いので、これらの発声は同時に再生する。
これは、ある発声の末尾と、それとは別の発声の先頭の重なりが短時間であれば、聞き取りの妨げにならないという人間の知覚特性を考慮したものである。
また、本実施の形態では、音声の再生を時間的に密にすることができるので、より多くの音声を再生することができる。
このように、本実施の形態によれば、複数の音声の中で評価の高いユーザの音声を漏れなく聞くことができ、第1の実施の形態に比べて多くの音声を聞くことができる。
[第6の実施の形態]
本実施の形態は、ユーザの発声区間が重複する場合に、音声を早送りして再生時間を短縮することによって、音声の重複による聞き取りの妨げをなくすものである。
本実施の形態における映像再生装置100の構成は、前述の第1の実施の形態における図6の構成の構成に含まれるユーザ評価情報ファイル108を使用しない以外は同様であるが、音声再生制御部120の動作が異なる。
図18は、本発明の第6の実施の形態における動作のフローチャートである。同図において、前述の第1の実施の形態における図7のフローチャートと同一の動作については、同一のステップ番号を付し、その説明を省略する。
ステップ1104) 再生制御部120は、ステップ102で音声が存在すると判定された音声の開始時刻と、全ユーザの発声の中で時間的に次の開始時刻との時間差を音声区間ファイル103,105,107を参照して計算する。求められた時間差がステップ102で認められた発声の区間長よりも短いかどうかを判定する。短い場合はステップ1105に移行し、短くない場合はステップ105に移行する。
ステップ1105) 再生部110は、ステップ102で存在すると判定された発声をステップ1104で計算した時間差に図19のように縮めて再生する。例えば、図10の例において、ユーザAの発声rの開始時刻との時間差uは、ユーザAの発声rの発声の区間長vよりも短いので、ユーザAの発声1201を当該時間差uに短縮して再生する。
時間を縮めて再生する方法としては、例えば、ソフトウェアサンプラが利用できる。
これは、図19のように発声区間が他のユーザの発声と重複する場合に、発声の時間を短縮して再生することにより発声の重複による聞き取りの妨げを防ぎ、映像を時間的に遡って再生することなく、全ユーザの音声を聞くものである。
このように、本実施の形態によれば映像を遡って再生することなく、全てのユーザの全ての音声を、音声の重複なく漏れなく聞くことができる。
上記の第1〜第6の実施の形態における、図7、図9、図11、図13、図15、図16、図18の動作をプログラムとして構築し、映像再生装置として利用されるコンピュータにインストールして実行する、または、ネットワークを介して流通させることが可能である。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
本発明は、映像視聴者の音声を映像と共に再生する技術に適用可能である。
本発明の原理説明図である。 本発明の原理構成図である。 本発明の一実施の形態におけるシステム構成図である。 本発明の一実施の形態における音声区間ファイルの例である。 本発明の一実施の形態におけるユーザ評価情報ファイルの例である。 本発明の第1の実施の形態における映像再生装置の構成図である。 本発明の第1の実施の形態における動作のフローチャートである。 本発明の第1の実施の形態におけるユーザの発声と発声に対する評価を示す図である。 本発明の第2の実施の形態における動作のフローチャートである。 本発明の第2の実施の形態におけるユーザの発声と評価値による再生音量の関係を示す図である。 本発明の第3の実施の形態における動作のフローチャートである。 本発明の第3の実施の形態におけるユーザの発声と再生順序の関係を示す図である。 本発明の第4の実施の形態における動作のフローチャートである。 本発明の第4の実施の形態における発声と再生の関係を示す図である。 本発明の第4の実施の形態における評価値が低いユーザの音声を再生する動作のフローチャートである。 本発明の第5の実施の形態における動作のフローチャートである。 本発明の第5の実施の形態における発声と再生の関係を示す図である。 本発明の第6の実施の形態における動作のフローチャートである。 本発明の第6の実施の形態における発声と再生の関係を示す図である。
符号の説明
10 視聴者音声ファイル
20 音声区間ファイル
100 計算機、映像再生装置
101 映像ファイル
102 視聴者音声ファイルA
103 音声区間情報ファイルA
104 視聴者音声ファイルB
105 音声区間情報ファイルB
106 視聴者音声ファイルC
107 音声区間情報ファイルC
108 ユーザ評価情報ファイル
110 再生手段、再生部
120 再生制御手段、再生制御部
200 モニタ

Claims (13)

  1. 同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生方法において、
    映像を読み込んで再生を開始する再生開始ステップと、
    前記ユーザ毎に設けられている、前記映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する音声区間情報ファイルを参照し、該開始時刻、該終了時刻が設定されているか否かに基づいて、該ユーザ毎に設けられている視聴者音声ファイルに音声が格納されているかを判定する音声存在判定ステップと、
    前記視聴者音声ファイルに音声が格納されている場合に、該音声が非言語か否かを判定し、非言語の場合には該音声を再生する非言語判定ステップと、
    前記非言語判定ステップにおいて、非言語ではないと判定された場合には、前記音声区間情報ファイルに格納されている音声区間に対応するユーザの音声について、ユーザ毎に予め決められている評価値が格納されているユーザ評価情報ファイルをユーザIDに基づいて参照し、最も高い評価値を有するユーザの音声を再生する音声再生ステップと、
    前記音声再生ステップで音声再生された次の音声区間に対して、前記音声存在判定ステップ、前記非言語判定ステップ、前記音声再生ステップを前記映像ファイルの映像が終了するまで繰り返す繰り返しステップと、
    を行うことを特徴とする映像再生方法。
  2. 同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生方法において、
    映像を読み込んで再生を開始する再生開始ステップと、
    前記ユーザ毎に設けられている、前記映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する音声区間情報ファイルを参照し、該開始時刻、該終了時刻が設定されているか否かに基づいて、該ユーザ毎に設けられている視聴者音声ファイルに音声が格納されているかを判定する音声存在判定ステップと、
    前記視聴者音声ファイルに音声が格納されている場合に、該音声が非言語か否かを判定し、非言語の場合には該音声を再生する非言語判定ステップと、
    前記非言語判定ステップにおいて、非言語ではないと判定された場合には、前記音声区間情報ファイルに格納されている音声区間に対応するユーザの音声について、ユーザ毎に予め決められている評価値が格納されているユーザ評価情報ファイルをユーザIDに基づいて参照し、評価値に基づいて再生する音量を決定し、該音声を再生する音声再生ステップと、
    前記音声再生ステップで音声再生された次の音声区間に対して、前記音声存在判定ステップ、前記非言語判定ステップ、前記音声再生ステップを前記映像ファイルの映像が終了するまで繰り返す繰り返しステップと、
    を行うことを特徴とする映像再生方法。
  3. 同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生方法において、
    映像を読み込んで再生を開始する再生開始ステップと、
    前記ユーザ毎に設けられている、前記映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する音声区間情報ファイルを参照し、該開始時刻、該終了時刻が設定されているか否かに基づいて、該ユーザ毎に設けられている視聴者音声ファイルに音声が格納されているかを判定する音声存在判定ステップと、
    前記視聴者音声ファイルに音声が格納されている場合に、該音声が非言語か否かを判定し、非言語以外で発声が重複しないユーザのグループを、全ての前記音声区間情報ファイルを検索することにより取得する第1のユーザグループ検索ステップと、
    前記第1のユーザグループ検索ステップにより取得した前記ユーザのグループに基づいて、前記視聴者音声ファイルから該グループに属する全てのユーザの音声を読み出して音声を再生する第1の音声再生ステップと、
    前記第1のユーザグループ検索ステップにおいて選択されなかったユーザの中で、発声が重複しないユーザのグループを、該ユーザの音声区間情報ファイルを検索することにより検索する第2のユーザグループ検索ステップと、
    前記第2のユーザグループ検索ステップで検索されたグループの全ユーザの音声を前記視聴者音声ファイルから読み出して、映像と共に遡って再生する第2の音声再生ステップと、
    全てのユーザの音声の再生が終了するまで、前記第2のユーザグループ検索ステップ及び前記第2の音声再生ステップを繰り返す繰り返しステップと、
    を行うことを特徴とする映像再生方法。
  4. 同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生方法において、
    映像を読み込んで再生を開始する再生開始ステップと、
    ユーザ毎に設けられている視聴者音声ファイルのうち、未再生のユーザの音声について、ユーザ毎に予め決められている評価値が格納されているユーザ評価情報ファイルを参照して、評価値が最大のユーザの音声を該ユーザの視聴者音声ファイルから読み出して再生する第1の音声再生ステップと、
    前回再生されたユーザの次の発声までの時間間隔に収まる他のユーザの音声を、ユーザ毎に設けられている前記映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する全ての音声区間情報ファイルを検索することにより取得する発声候補検索ステップと、
    前記発声候補検索ステップで取得したユーザの音声のうち、前回再生されたユーザの次に評価値が高いユーザの音声を該ユーザの視聴者音声ファイルから読み出して再生する第2の音声再生ステップと、
    全てのユーザの音声を再生するまで、前記発声候補検索ステップ及び前記第2の音声再生ステップを繰り返す繰り返しステップと、
    を行うことを特徴とする映像再生方法。
  5. 前記音声再生ステップにおいて、
    前記音声区間内に最も高い評価値を有するユーザの音声を前記視聴者音声ファイルから読み出して再生する際に、
    所定の時間マージンTの音声区間の再生の重複を許容する請求項1記載の映像再生方法。
  6. 同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生方法において、
    映像を読み込んで再生を開始する再生開始ステップと、
    前記ユーザ毎に設けられている、前記映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する音声区間情報ファイルを参照し、該開始時刻、該終了時刻が設定されているか否かに基づいて、該ユーザ毎に設けられている視聴者音声ファイルに音声が格納されているかを判定する音声存在判定ステップと、
    前記視聴者音声ファイルに音声が格納されている場合に、該音声が非言語か否かを判定し、非言語の場合には該音声を再生する非言語判定ステップと、
    前記非言語判定ステップにおいて、非言語ではないと判定された第1の音声について、該第1の音声の開始時刻と該第1の音声の次に発声された他のユーザの第2の音声の開始時刻との差が該第1の音声の区間長よりも短い場合には、該第1の音声を短縮して再生する音声再生ステップと、
    前記音声区間情報ファイルに格納されている音声区間の全てに対して、前記音声存在判定ステップ、前記非言語判定ステップ、前記音声再生ステップを繰り返す繰り返しステップと、
    を行うことを特徴とする映像再生方法。
  7. 同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生装置であって、
    映像を格納した映像ファイルと、
    前記ユーザ毎に設けられている、前記映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する複数の音声区間情報ファイルと、
    前記ユーザ毎に設けられている該ユーザの音声が格納されている複数の視聴者音声ファイルと、
    ユーザ毎に予め決められている評価値が格納されているユーザ評価情報ファイルと、
    映像・音声を再生する再生手段と、
    音声の再生を制御するための再生制御手段と、を有し、
    前記再生手段は、
    前記映像ファイルから映像を読み込んで再生を開始する映像再生開始手段と、
    前記再生制御手段からの指示に基づいて、音声を前記映像に同期させて再生させる手段と、を有し、
    前記再生制御手段は、
    前記音声区間情報ファイルを参照し、該開始時刻、該終了時刻が設定されているか否かに基づいて、前記視聴者音声ファイルに音声が格納されているかを判定する音声存在判定手段と、
    前記視聴者音声ファイルに音声が格納されている場合に、該音声が非言語か否かを判定する非言語判定手段と、
    前記非言語判定手段において、非言語ではないと判定された場合には、前記音声区間情報ファイルに格納されている音声区間に対応するユーザの音声について、前記ユーザ評価情報ファイルをユーザIDに基づいて参照し、最も高い評価値を有するユーザの音声を前記再生手段に再生させ、前記非言語判定手段において非言語と判定された場合には該非言語の音声を該再生手段に再生させる音声再生制御手段と、
    前記再生手段で音声再生された次の音声区間に対して、前記音声存在判定手段、前記非言語判定手段、前記音声再生制御手段を前記映像ファイルの映像が終了するまで繰り返す繰り返し手段と、
    を有することを特徴とする映像再生装置。
  8. 同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生であって、
    映像を格納した映像ファイルと、
    前記ユーザ毎に設けられている、前記映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する複数の音声区間情報ファイルと、
    前記ユーザ毎に設けられている該ユーザの音声が格納されている複数の視聴者音声ファイルと、
    ユーザ毎に予め決められている評価値が格納されているユーザ評価情報ファイルと、
    映像・音声を再生する再生手段と、
    音声の再生を制御するための再生制御手段と、を有し、
    前記再生手段は、
    前記映像ファイルから映像を読み込んで再生を開始する映像再生開始手段と、
    前記再生制御手段からの指示に基づいて、音声を前記映像に同期させて再生させる手段と、を有し、
    前記再生制御手段は、
    前記音声区間情報ファイルを参照し、該開始時刻、該終了時刻が設定されているか否かに基づいて、前記視聴者音声ファイルに音声が格納されているかを判定する音声存在判定手段と、
    前記視聴者音声ファイルに音声が格納されている場合に、該音声が非言語か否かを判定する非言語判定手段と、
    前記非言語判定手段において、非言語ではないと判定された場合には、前記音声区間情報ファイルに格納されている音声区間に対応するユーザの音声について、前記ユーザ評価情報ファイルを該ユーザのユーザIDに基づいて参照し、評価値に基づいて前記再生手段に再生させる音量を決定し、該音量でユーザ毎の音声を前記再生手段に再生させ、該非言語判定手段において、非言語と判定された場合には、非言語の音声を該再生手段に再生させる音声再生制御手段と、
    音声再生された次の音声区間に対して、前記音声存在判定手段、前記非言語判定手段、前記音声再生制御手段を前記映像ファイルの映像が終了するまで繰り返す繰り返し手段と、
    を有することを特徴とする映像再生装置。
  9. 同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生装置であって、
    映像を格納した映像ファイルと、
    前記ユーザ毎に設けられている、前記映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する複数の音声区間情報ファイルと、
    前記ユーザ毎に設けられている該ユーザの音声が格納されている複数の視聴者音声ファイルと、
    映像・音声を再生する再生手段と、
    音声の再生を制御するための再生制御手段と、を有し、
    前記再生手段は、
    前記映像ファイルから映像を読み込んで再生を開始する映像再生開始手段と、
    前記再生制御手段からの指示に基づいて、音声を前記映像に同期させて再生させる手段と、を有し、
    前記再生制御手段は、
    前記音声区間情報ファイルを参照し、該開始時刻、該終了時刻が設定されているか否かに基づいて、前記視聴者音声ファイルに音声が格納されているかを判定する音声存在判定手段と、
    前記視聴者音声ファイルに音声が格納されている場合に、該音声が非言語か否かを判定する非言語判定手段と、
    非言語以外で発声が重複しないユーザのグループを全ての前記音声区間情報ファイルを検索することにより取得する第1のユーザグループ検索手段と、
    前記第1のユーザグループ検索手段により取得した前記ユーザのグループに基づいて、前記視聴者音声ファイルから該グループに属する全てのユーザの音声を読み出して、前記再生手段に音声を再生させる第1の音声再生制御手段と、
    前記第1のユーザグループ検索手段において選択されなかったユーザの中で、発声が重複しないユーザのグループを、前記音声区間情報ファイルを検索することにより検索する第2のユーザグループ検索手段と、
    前記第2のユーザグループ検索手段で検索されたグループに属する全ユーザの音声を前記視聴者音声ファイルから読み出して、前記再生手段に映像と共に遡って再生させる第2の音声再生制御手段と、
    全てのユーザの音声の再生が終了するまで、前記第2のユーザグループ検索手段及び前記第2の音声再生制御手段を繰り返す繰り返し手段と、
    を有することを特徴とする映像再生装置。
  10. 同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生装置であって、
    映像を格納した映像ファイルと、
    前記ユーザ毎に設けられている、前記映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する複数の音声区間情報ファイルと、
    前記ユーザ毎に設けられている該ユーザの音声が格納されている複数の視聴者音声ファイルと、
    ユーザ毎に予め決められている評価値が格納されているユーザ評価情報ファイルと、
    映像・音声を再生する再生手段と、
    音声の再生を制御するための音声再生制御手段と、を有し、
    前記再生手段は、
    前記映像ファイルから映像を読み込んで再生を開始する映像再生開始手段と、
    前記再生制御手段からの指示に基づいて、音声を前記映像に同期させて再生させる手段と、を有し、
    前記音声再生制御手段は、
    前記視聴者音声ファイルのうち、未再生のユーザの音声について、前記ユーザ評価情報ファイルを参照して、評価値が最大のユーザの音声を前記視聴者音声ファイルから読み出して前記再生手段に再生させる第1の音声再生制御手段と、
    前回再生されたユーザの次の発声までの時間間隔に収まる他のユーザの音声を、全ての前記音声区間情報ファイルを検索することにより取得する発声候補検索手段と、
    発声候補検索手段で取得したユーザの音声のうち、前記ユーザ評価情報ファイルを参照して、前回再生されたユーザの次に評価値が高いユーザの音声を該ユーザの視聴者音声ファイルから読み出して再生手段に再生させる第2の音声再生制御手段と、
    全てのユーザの音声を再生するまで、前記発声候補検索手段及び前記第2の音声再生制御手段を繰り返す繰り返し手段と、
    を有することを特徴とする映像再生装置。
  11. 前記音声再生制御手段は、
    前記音声区間内に最も高い評価値を有するユーザの音声を前記視聴者音声ファイルから読み出して、前記再生手段に再生させる際に、
    所定の時間マージンTの音声区間の再生の重複を許容する手段を含む請求項7記載の映像再生装置。
  12. 同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生装置であって、
    映像を格納した映像ファイルと、
    前記ユーザ毎に設けられている、前記映像に対する発声の開始時刻、終了時刻からなる音声区間を格納する複数の音声区間情報ファイルと、
    前記ユーザ毎に設けられている該ユーザの音声が格納されている複数の視聴者音声ファイルと、
    映像・音声を再生する再生手段と、
    音声の再生を制御するための音声再生制御手段と、を有し、
    前記再生手段は、
    前記映像ファイルから映像を読み込んで再生を開始する映像再生開始手段と、
    前記再生制御手段からの指示に基づいて、音声を前記映像に同期させて再生させる手段と、を有し、
    前記音声再生制御手段は、
    前記音声区間情報ファイルを参照し、該開始時刻、該終了時刻が設定されているか否かに基づいて、前記視聴者音声ファイルに音声が格納されているかを判定する音声存在判定手段と、
    前記視聴者音声ファイルに音声が格納されている場合に、該音声が非言語か否かを判定する非言語判定手段と、
    前記非言語判定手段において、非言語であると判定された音声を前記再生手段に再生させ、非言語ではないと判定された第1の音声について、該第1の音声の開始時刻と該第1の音声の次に発声された他のユーザの第2の音声の開始時刻との差が該第1の音声の区間長よりも短い場合には、該第1の音声を短縮して該再生手段に再生させる音声再生制御手段と、
    前記音声区間情報ファイルに格納されている音声区間の全てに対して、前記音声存在判定手段、前記非言語判定手段、前記音声再生制御手段を繰り返す繰り返し手段と、
    を有することを特徴とする映像再生装置。
  13. 同一の映像を視聴中の複数のユーザの音声群を映像と共に再生する映像再生プログラムであって、
    前記請求項1乃至6のいずれかに記載の映像再生方法を実現するための処理をコンピュータに実行させることを特徴とする映像再生プログラム。
JP2004347281A 2004-11-30 2004-11-30 映像再生方法及び装置及びプログラム Expired - Fee Related JP4353084B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004347281A JP4353084B2 (ja) 2004-11-30 2004-11-30 映像再生方法及び装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004347281A JP4353084B2 (ja) 2004-11-30 2004-11-30 映像再生方法及び装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2006157692A JP2006157692A (ja) 2006-06-15
JP4353084B2 true JP4353084B2 (ja) 2009-10-28

Family

ID=36635398

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004347281A Expired - Fee Related JP4353084B2 (ja) 2004-11-30 2004-11-30 映像再生方法及び装置及びプログラム

Country Status (1)

Country Link
JP (1) JP4353084B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7559017B2 (en) 2006-12-22 2009-07-07 Google Inc. Annotation framework for video
US8112702B2 (en) * 2008-02-19 2012-02-07 Google Inc. Annotating video intervals
US8566353B2 (en) 2008-06-03 2013-10-22 Google Inc. Web-based system for collaborative generation of interactive videos
JP5381434B2 (ja) * 2009-07-13 2014-01-08 日本電気株式会社 コンテンツ処理装置

Also Published As

Publication number Publication date
JP2006157692A (ja) 2006-06-15

Similar Documents

Publication Publication Date Title
JP4558308B2 (ja) 音声認識システム、データ処理装置、そのデータ処理方法及びプログラム
JP6446993B2 (ja) 音声制御装置およびプログラム
JP4683116B2 (ja) 情報処理装置、情報処理方法、情報処理プログラムおよび撮像装置
WO2007132690A1 (ja) 音声データ要約再生装置、音声データ要約再生方法および音声データ要約再生用プログラム
JP2008096483A (ja) 音響出力制御装置、音響出力制御方法
WO2010024426A1 (ja) 録音装置
CN101909191B (zh) 视频处理设备和视频处理方法
JP2006279111A (ja) 情報処理装置、情報処理方法およびプログラム
JP4353084B2 (ja) 映像再生方法及び装置及びプログラム
JP2007058767A (ja) 発話記録作成システム
JP2009260718A (ja) 画像再生装置及び画像再生処理プログラム
JP7451999B2 (ja) 録画装置、動画システム、録画方法、及びプログラム
JP2009075280A (ja) コンテンツ再生装置
JP2005352330A (ja) 音声分割記録装置
JPH1125112A (ja) 対話音声処理方法及び装置、記録媒体
JP3927155B2 (ja) 対話記録装置および対話記録プログラム
JP2018159779A (ja) 音声再生態様決定装置、および音声再生態様決定プログラム
JP4086886B2 (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
JP4509188B2 (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
JP7452000B2 (ja) 録画装置、録画方法、及びプログラム
JP3970080B2 (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
JP2019213160A (ja) 動画編集装置、動画編集方法、及び動画編集プログラム
JP5242856B1 (ja) 音楽再生プログラム及び音楽再生システム
JP2006120018A (ja) 映像データ処理装置、映像データ処理方法、プログラム及び記録媒体
JP3698050B2 (ja) 音声応答方法および音声応答システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060414

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090707

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090720

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120807

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130807

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees