JP4546682B2 - 映像情報要約装置、映像情報要約方法および映像情報要約処理プログラム - Google Patents

映像情報要約装置、映像情報要約方法および映像情報要約処理プログラム Download PDF

Info

Publication number
JP4546682B2
JP4546682B2 JP2001304361A JP2001304361A JP4546682B2 JP 4546682 B2 JP4546682 B2 JP 4546682B2 JP 2001304361 A JP2001304361 A JP 2001304361A JP 2001304361 A JP2001304361 A JP 2001304361A JP 4546682 B2 JP4546682 B2 JP 4546682B2
Authority
JP
Japan
Prior art keywords
video information
time
information
audio
partial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001304361A
Other languages
English (en)
Other versions
JP2003087728A (ja
Inventor
毅 中村
道一 橋本
肇 宮里
敏雄 田畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Original Assignee
Pioneer Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Corp filed Critical Pioneer Corp
Priority to JP2001304361A priority Critical patent/JP4546682B2/ja
Priority to US10/179,889 priority patent/US20020197053A1/en
Priority to EP02254466A priority patent/EP1271359A3/en
Publication of JP2003087728A publication Critical patent/JP2003087728A/ja
Application granted granted Critical
Publication of JP4546682B2 publication Critical patent/JP4546682B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Television Signal Processing For Recording (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、音声が付帯された映像情報における要約再生装置の技術分野に属し、より詳細には、音声レベルに基づいて要約再生時に抽出すべき部分映像情報を決定する技術分野に属する。
【0002】
【従来の技術】
近年、テレビジョン放送による番組などの映像情報を録画・再生するVTR(Video Tape Recorder)などの記録装置が普及するにつれて、記録された映像情報を全て見ることなく当該映像情報を短時間に要約した映像情報(以下、要約情報という)を提供するダイジェスト再生(要約再生)が実用に供されるようになっている。
【0003】
このような要約再生を行う方法としては、主に映像情報そのものに着目して、例えば、場面が転換された部分(シーンチェンジ)を検出して要約再生を行う方法と、映像情報に付帯される音声情報に着目して要約再生を行う方法がある。音声情報に着目して要約再生を行う要約再生を行う方法の代表的なものに特開平10−32776号公報に記載されたものがある。
【0004】
同公報に記載の要約再生装置1は、図9に示すように、通信回線または電波などによって提供された音声情報が付帯されている映像情報(以下、音声映像情報という)の音声レベルを検出する音声レベル検出手段3と、その音声レベルと基準音声レベルとを比較する比較器4と、音声レベルが基準音声レベルより大きい継続時間を得る継続時間タイマ5と、継続時間タイマ5によって得られた継続時間からダイジェスト部分のアドレスを生成するダイジェストアドレス生成手段8と、そのアドレスを記録する記録再生手段9と、記録したアドレスを再生するダイジェストアドレス再生手段11と、そのアドレスに基づいてダイジェスト部分の音声映像情報を再生させる再生制御手段10とを備えている。
【0005】
この構成より、この要約再生装置1は、入力された音声映像情報が基準音声レベルより大きい部分で予め設定された時間継続した場合に、その基準音声レベルより大きい部分のアドレスを記録し、このアドレスに基づいて当該基準音声レベルより大きいレベルの部分を抽出して音声映像情報の要約再生を行うようになっている。
【0006】
【発明が解決しようとする課題】
しかしながら、上述のような要約再生方法にあっては、基準音声レベルより大きい部分のみ音声映像情報の特徴部分とし、当該映像情報の無音部分を特徴部分として用いていないため、適切な要約再生を行うことができないという問題を有していた。
【0007】
音声レベルが大きい音声部分(以下、騒音区間という)は、映像情報の盛り上がった部分を示し、映像情報の特徴部分を為す一方、音声の無い無音部分(以下、無音区間という)は、場面が転換された、または、内容が切り替わった部分を示し、無音区間も映像情報の重要な特徴部分を構成する。すなわち、映像情報において内容が切り替わったときに、この内容に続く部分は次の内容の冒頭部分になり、特に、当該内容の概略が示されることも多い。
【0008】
したがって、上述のような要約再生方法では、盛り上がった場面を抽出することはできるが、場面転換された部分、または、内容が切り替わった部分を抽出することができず、適切な要約再生を行うことができないという問題を有していた。
【0009】
また、上述のような要約再生方法にあっては、基準音声レベルより大きい音声レベルを有する音声映像情報を全て要約再生時に再生するようになっているので、ユーザが所望する再生時間に、または、予め設定された再生時間に要約することができないという問題を有していた。
【0010】
本発明は、上記の各問題点に鑑みて為されたもので、その課題は、騒音部分の他に無音部分も特徴量として抽出することによってより適切に操作者が映像情報を把握することのできるとともに、要約再生時間を調整することのできる要約情報を提供することにある。
【0011】
【課題を解決するための手段】
上記の課題を解決するために、請求項1に記載の発明は、音声情報が付帯されている映像情報から、前記音声情報に基づいて当該映像情報の一部である部分映像情報を1または複数個抽出し、当該抽出した部分映像情報に基づいて前記映像情報の時間長が短縮された要約情報を生成する映像情報要約装置において、前記音声情報における音声レベルに基づいて前記映像情報を複数の種類の音声区間に分類する分類手段と、前記要約情報の時間長である要約時間を決定する要約時間決定手段と、前記分類された複数の種類の音声区間の少なくとも何れか一種類の、前記映像情報中における時間軸上の位置若しくは時間的長さの少なくとも何れか一方に基づいて前記抽出されるべき前記部分映像情報を決定する決定手段と、前記決定された前記部分映像情報を前記映像情報から抽出して前記要約情報を生成する生成手段と、を備え、前記決定手段が、前記抽出されるべき部分映像情報の時間的長さを予め定められた時間的範囲内に設定し、また、前記抽出されるべき部分映像情報が決定されるときにその決定に際して基準となる音声区間の種類または時間的長さの少なくとも何れか一方に基づいて当該部分映像情報の重要度を設定し、前記生成手段が、前記重要度の順に総時間が前記要約時間になるように前記要約情報を生成する構成を有している
【0012】
この構成により、請求項1に記載の発明では、分類手段が音声情報における音声レベルに基づいて映像情報を複数の音声区間に分類するとともに、決定手段がこの分類された複数の音声区間の少なくとも何れか一種類の、映像情報中における時間軸上の位置若しくは時間的長さの少なくとも何れか一方に基づいて抽出する部分映像情報を決定し、生成手段がこの部分映像情報に基づいて映像情報の時間長を短縮して要約情報を生成する。
【0013】
通常、映像情報に付帯される音声情報は、番組の盛り上がった部分、場面が転換された部分、または、内容が切り替わった部分などの特徴部分を示すので、当該映像情報の時間長を短縮して要約を行う際には重要な役割を果たす。
【0014】
したがって、本発明では、音声レベルによって分類された複数の種類の音声区間に基づいて抽出すべき部分映像情報を決定することができるので、映像情報の盛り上がった部分および内容が切り替わった部分を部分映像情報として抽出することができ、ユーザが短時間で内容を的確に把握することができる要約情報を得ることができる。
また、請求項1に記載の発明では、決定手段が抽出する部分映像情報の設定される時間長を予め定められた時間的範囲内に設定する。
抽出される一つの部分映像情報の時間長が短すぎると、ユーザはその部分の映像情報を理解することができず、また、部分映像情報の時間長が長すぎると、無駄な情報が多くなるとともに、情報量が増大し映像情報を的確に要約することができない。このため、要約した映像情報によってユーザに映像情報全体の内容を適切に伝えるためには、部分映像情報の時間長を適切な長さに設定する必要がある。
したがって、本発明では、抽出された部分映像情報の内容を理解することのできる時間長を確保することができるとともに、部分映像情報の時間長が不用意に長くなることを防止することができるので、ユーザに当該映像情報を正確に伝えることのできる要約情報を得ることができる。
【0015】
また、請求項2に記載の発明は、請求項1に記載の映像情報要約装置において、前記決定手段が、前記分類された複数の音声区間の何れか一種類の、前記映像情報中における時間軸上の位置若しくは時間的長さの少なくとも何れか一方に基づいて前記部分映像情報の開始時刻または終了時刻の少なくとも何れか一方を決定する構成を有している。
【0016】
この構成により、請求項2に記載の発明では、決定手段が前記分類された複数の音声区間の何れか一種類の映像情報中における時間軸上の位置若しくは時間的長さの少なくとも何れか一方に基づいて部分映像情報の開始時刻または終了時刻の少なくとも何れかを決定する。
【0017】
したがって、音声レベルによって分類された複数の音声区間が映像情報の盛り上がった部分、場面が転換された部分または内容が切り替わった部分を示すことにより、この特徴部分を音声レベルによって分類された複数の音声区間に基づいて的確に部分映像情報として抽出することができるので、ユーザが短時間で内容を把握することができる適切な要約情報を得ることができる。
【0018】
また、請求項3に記載の発明は、請求項1または2に記載の映像情報要約装置において、前記分類手段が、前記音声レベルに基づいて前記映像情報を少なくとも音声の無い無音区間および予め設定された音声レベルを有する騒音区間に分類する構成を有している。
【0019】
この構成により、請求項3に記載の発明は、分類手段が、音声レベルに基づいて映像情報を少なくとも音声の無い無音区間および予め設定された音声レベルを有する騒音区間に分類する。
【0020】
通常、映像情報の時間長を短縮して要約を行う際に、無音区間および騒音区間は重要な役割を果たす。例えば、テレビ放送番組において、予め設定された音声レベル以上の騒音区間および予め設定された音声の無い無音区間は、それぞれ番組の盛り上がった部分、および、場面が転換されたまたは内容が切り替わった部分を示す。
【0021】
したがって、本発明では、無音区間および騒音区間に基づいて抽出すべき部分映像情報を決定することができ、映像情報の盛り上がった部分および内容が切り替わった部分を部分映像情報として抽出することができるので、ユーザが短時間で内容を的確に把握することができる要約された映像情報を得ることができる。
【0022】
また、請求項4に記載の発明は、請求項3に記載の映像情報要約装置において、前記決定手段が、予め設定された時間的長さを有する前記無音区間の終了する時間軸上の位置を前記部分映像情報の開始時刻に設定する構成を有している。
【0023】
この構成により、請求項4に記載の発明では、決定手段が、予め設定された時間的長さを有する無音区間が終了する時間軸上の位置をセグメントの開始時刻に設定する。
【0024】
音声情報が付帯された映像情報において音声が無い無音区間は、場面転換された部分、または、内容が切り替わった部分であり、無音区間に続く部分は次の内容の冒頭部分、特に当該内容の概略が示されることも多く、映像情報の特徴的な部分となる。
【0025】
したがって、本発明では、無音区間の終了位置を部分映像情報の開始時刻に設定することができるので、映像情報の特徴部分を為す部分映像情報を的確に抽出することができる。
【0026】
また、請求項5に記載の発明は、請求項4に記載の映像情報要約装置において、前記無音区間に基づいて前記部分映像情報の開始時刻が設定されたときに、当該無音区間の次に検出された他の無音区間の時間軸上の位置に基づいて当該部分映像情報の終了時刻を設定する構成を有している。
【0027】
この構成により、請求項5に記載の発明では、決定手段が、無音区間に基づいて部分映像情報の開始時刻が設定されたときに、当該無音区間の次に検出された他の無音区間の時間軸上の位置に基づいて当該部分映像情報の終了時刻を設定する。
【0028】
この時間軸上の開始時刻の次の無音区間は、例えば、ニュース番組であれば、ニュース内容の概略部分の直後に位置し、また、他の番組でも次の内容の概略が示された直後である。すなわち、この無音区間の時間軸上の位置は特徴部分の概略が示された後であり、内容的に切りの良い部分であるので、違和感のない適切なタイミングを示す。
【0029】
したがって、本発明では、部分映像情報の開始時刻の次の無音区間に基づいて終了時刻を設定することができるので、特徴部分の概略が示された、または、内容的に切りの良い部分など違和感のない適切なタイミングで部分映像情報を抽出することができ、ユーザに当該映像情報を正確に伝えることのできる要約情報を得ることができる。
【0030】
また、請求項6に記載の発明は、請求項3に記載の映像情報要約装置において、前記決定手段が、予め設定された時間的長さを有する前記騒音区間の開始する時間軸上の位置に基づいて前記部分映像情報の開始時刻を設定する構成を有している。
【0031】
この構成により、請求項5に記載の発明では、決定手段が、予め設定された時間的長さを有する騒音区間が開始する時間軸上の位置に基づいて部分映像情報の開始時刻を設定する。
【0032】
映像情報において騒音区間は映像情報における盛り上がった部分、すなわち、当該映像情報の特徴部分であり、特に、騒音区間の開始位置は内容を把握する上で重要な部分となる。
【0033】
したがって、本発明では、騒音区間の開始位置を部分映像情報の開始時刻に設定することができるので、映像情報の特徴部分を為す部分映像情報を的確に抽出することができる。
【0034】
また、請求項7に記載の発明は、請求項6に記載の映像情報要約装置において、前記決定手段が、前記騒音区間に基づいて前記部分映像情報の開始時刻が設定されたときに、当該騒音区間の時間的長さに基づいて当該部分映像情報の終了時刻を設定する構成を有している。
【0035】
この構成により、請求項7に記載の発明では、決定手段が、騒音区間に基づいて部分映像情報の開始時刻が設定されたときに、騒音区間の時間的長さに基づいて当該部分映像情報の終了時刻を設定する。
【0036】
したがって、映像情報における盛り上がった部分、すなわち、当該映像情報の特徴部分の終了位置を的確に部分映像情報に設定することができるので、違和感のない適切なタイミングで部分映像情報を抽出することができ、ユーザに当該映像情報を正確に伝えることのできる要約情報を得ることができる。
【0041】
また、請求項に記載の発明は、請求項1乃至の何れか一項に記載の映像情報要約装置において、前記生成手段が、前記設定された部分映像情報の重要度に基づいて前記部分映像情報を抽出して前記映像情報を要約する構成を有している。
【0042】
この構成により、請求項に記載の発明では、決定手段が前記抽出されるべき部分映像情報が決定されるときにその決定に際して基準となる音声区間の種類または時間的長さに基づいて当該部分映像情報の重要度を設定するとともに、生成手段が設定された部分映像情報の重要度に基づいて部分映像情報を抽出して前記映像情報を要約する。
【0043】
したがって、部分映像情報の重要度に基づいて映像情報を要約することができるので、ユーザが指定した、または、予め設定された時間長に映像情報を短縮して要約するときにそれぞれの時間長に対応させることのできる要約情報を得ることができる。
【0044】
また、請求項に記載の発明は、請求項に記載の映像情報要約装置において、前記決定手段が、前記騒音区間に基づいて設定する前記部分映像情報の重要度より前記無音区間に基づいて設定する前記部分映像情報の重要度を高くして設定する構成を有している。
【0045】
この構成により、請求項に記載の発明では、騒音区間に基づいて設定する部分映像情報の重要度より無音区間に基づいて設定する部分映像情報の重要度を高く設定する。
【0046】
騒音区間および無音区間とも映像情報の特徴的な部分であるが、騒音区間が映像情報の盛り上がりを示す一方、無音区間は映像情報における場面転換または内容の切り替わりを示すため、騒音区間より無音区間に基づいて抽出される部分映像情報の方が重要度が高い。
【0047】
したがって、本発明では、無音区間を騒音区間より重要度を高く設定することができるので、騒音区間との重要度のバランスを取ることができ、的確な要約情報を得ることができる。
【0048】
また、請求項10に記載の発明では、請求項またはに記載の映像情報要約装置において、前記決定された複数の前記部分映像情報が時間的に重なり合う場合に、前記決定手段が、当該重なり合う部分映像情報を結合するとともに、結合した当該部分映像情報の重要度を各結合された部分映像情報の重要度に基づいて設定する構成を有している。
【0049】
この構成により、請求項10に記載の発明は、決定された複数の部分映像情報が時間的に重なり合う場合に、決定手段が当該重なり合う部分映像情報を結合するとともに、結合した部分映像情報の重要度を各結合された各部分映像情報の重要度に基づいて設定する。
【0050】
部分映像情報が他の部分映像情報と時間的に重なる部分は複数の特徴部分から構成されることとなり、映像情報において重要な特徴部分であると判断することができる。
【0051】
したがって、本発明では、時間的に重なる映像情報を結合することによって映像情報の重要な部分を1つの部分映像情報として抽出することができるので、的確な要約情報を得ることができる。また、結合された各部分映像情報の重要度に基づいて当該部分映像情報の重要度が設定することができるので、ユーザが短時間で内容を把握することができる適切な要約映像情報を得ることができる。
【0052】
また、請求項11に記載の発明は、音声情報が付帯されている映像情報から、前記音声情報に基づいて当該映像情報の一部である部分映像情報を1または複数個抽出し、当該抽出した部分映像情報に基づいて前記映像情報の時間長が短縮された要約情報を生成する映像情報要約方法において、前記音声情報における音声レベルに基づいて前記映像情報を複数の種類の音声区間に分類する分類処理工程と、前記要約情報の時間長である要約時間を決定する要約時間決定処理工程と、前記分類された複数の種類の音声区間の少なくとも何れか一種類の、前記映像情報中における時間軸上の位置若しくは時間的長さの少なくとも何れか一方に基づいて前記抽出されるべき前記部分映像情報を決定する決定処理工程と、前記決定された前記部分映像情報を前記映像情報から抽出して前記要約情報を生成する生成処理工程と、を含み、前記決定処理工程においては、前記抽出されるべき部分映像情報の時間的長さを予め定められた時間的範囲内に設定し、また、前記抽出されるべき部分映像情報が決定されるときにその決定に際して基準となる音声区間の種類または時間的長さの少なくとも何れか一方に基づいて当該部分映像情報の重要度を設定し、前記生成処理工程においては、前記重要度の順に総時間が前記要約時間になるように前記要約情報を生成する構成を有している。
【0053】
この構成により、請求項11に記載の発明では、分類処理工程によって音声情報における音声レベルに基づいて映像情報が複数の種類の音声区間に分類されるとともに、決定処理工程によってこの分類された複数の種類の音声区間の少なくとも何れか一種類の、映像情報中における時間軸上の位置若しくは時間的長さの少なくとも何れか一方に基づいて抽出する部分映像情報が決定され、生成処理工程によってこの部分映像情報に基づいて映像情報の時間長が短縮され要約情報が生成される。
【0054】
通常、映像情報に付帯される音声情報は、番組の盛り上がった部分、場面が転換された部分、または、内容が切り替わった部分などの特徴部分を示すので、当該映像情報の時間長を短縮して要約を行う際には重要な役割を果たす。
【0055】
したがって、本発明では、音声レベルによって分類された複数の種類の音声区間に基づいて抽出すべき部分映像情報を決定することができるので、映像情報の盛り上がった部分および内容が切り替わった部分を部分映像情報として抽出することができ、ユーザが短時間で内容を的確に把握することができる要約情報を得ることができる。
また、請求項11に記載の発明では、決定処理工程において、抽出する部分映像情報の設定される時間長を予め定められた時間的範囲内に設定する。
抽出される一つの部分映像情報の時間長が短すぎると、ユーザはその部分の映像情報を理解することができず、また、部分映像情報の時間長が長すぎると、無駄な情報が多くなるとともに、情報量が増大し映像情報を的確に要約することができない。このため、要約した映像情報によってユーザに映像情報全体の内容を適切に伝えるためには、部分映像情報の時間長を適切な長さに設定する必要がある。
したがって、本発明では、抽出された部分映像情報の内容を理解することのできる時間長を確保することができるとともに、部分映像情報の時間長が不用意に長くなることを防止することができるので、ユーザに当該映像情報を正確に伝えることのできる要約情報を得ることができる。
【0056】
また、請求項12に記載の発明は、請求項11に記載の映像情報要約方法において、前記決定処理工程においては、前記分類された複数の種類の音声区間の何れか一種類の、前記映像情報中における時間軸上の位置若しくは時間的長さの少なくとも何れか一方に基づいて前記部分映像情報の開始時刻または終了時刻の少なくとも何れか一方が決定される構成を有している。
【0057】
この構成により、請求項12に記載の発明では、決定処理工程において前記分類された複数の種類の音声区間の何れか一種類の映像情報中における時間軸上の位置若しくは時間的長さの少なくとも何れか一方に基づいて部分映像情報の開始時刻または終了時刻の少なくとも何れかが決定される。
【0058】
したがって、音声レベルによって分類された複数の音声区間が映像情報の盛り上がった部分、場面が転換された部分または内容が切り替わった部分を示すことにより、この特徴部分を音声レベルによって分類された複数の音声区間に基づいて的確に部分映像情報として抽出することができるので、ユーザが短時間で内容を把握することができる適切な要約情報を得ることができる。
【0059】
また、請求項13に記載の発明は、請求項11または12に記載の映像情報要約方法において、前記分類処理工程においては、前記音声レベルに基づいて前記映像情報が少なくとも音声の無い無音区間および予め設定された音声レベルを有する騒音区間に分類される構成を有している。
【0060】
この構成により、請求項13に記載の発明は、分類処理工程によって音声レベルに基づいて映像情報が少なくとも音声の無い無音区間および予め設定された音声レベルを有する騒音区間に分類される。
【0061】
通常、映像情報の時間長を短縮して要約を行う際に、無音区間および騒音区間は重要な役割を果たす。例えば、テレビ放送番組において、予め設定された音声レベル以上の騒音区間および予め設定された音声の無い無音区間は、それぞれ番組の盛り上がった部分、および、場面が転換されたまたは内容が切り替わった部分を示す。
【0062】
したがって、本発明では、無音区間および騒音区間に基づいて抽出すべき部分映像情報を決定することができ、映像情報の盛り上がった部分および内容が切り替わった部分を部分映像情報として抽出することができるので、ユーザが短時間で内容を的確に把握することができる要約された映像情報を得ることができる。
【0063】
また、請求項14に記載の発明は、請求項11乃至13の何れか一項に記載の映像情報要約方法において、前記生成処理工程においては、前記設定された部分映像情報の重要度に基づいて前記部分映像情報が抽出されて前記映像情報が要約される構成を有している。
【0064】
この構成により、請求項14に記載の発明では、決定処理工程によって前記抽出されるべき部分映像情報が決定されるときにその決定に際して基準となる音声区間の種類または時間的長さに基づいて当該部分映像情報の重要度が設定されるとともに、生成処理工程によって設定された部分映像情報の重要度に基づいて部分映像情報が抽出されて前記映像情報が要約される。
【0065】
したがって、部分映像情報の重要度に基づいて映像情報を要約することができるので、ユーザが指定した、または、予め設定された時間長に映像情報を短縮して要約するときにそれぞれの時間長に対応させることのできる要約情報を得ることができる。
【0066】
また、請求項15に記載の発明は、コンピュータによって、音声情報が付帯されている映像情報から、前記音声情報に基づいて当該映像情報の一部である部分映像情報を1または複数個抽出し、当該抽出した部分映像情報に基づいて前記映像情報の時間長が短縮された要約情報を生成する映像情報要約プログラムであって、前記コンピュータを、前記音声情報における音声レベルに基づいて前記映像情報を複数の種類の音声区間に分類する分類手段、前記要約情報の時間長である要約時間を決定する要約時間決定手段、前記分類された複数の種類の音声区間の少なくとも何れか一種類の、前記映像情報中における時間軸上の位置若しくは時間的長さの少なくとも何れか一方に基づいて前記抽出されるべき前記部分映像情報を決定する決定手段、前記決定された前記部分映像情報を前記映像情報から抽出して前記要約情報を生成する生成手段、として機能させ、前記決定手段が、前記抽出されるべき部分映像情報の時間的長さを予め定められた時間的範囲内に設定し、また、前記抽出されるべき部分映像情報が決定されるときにその決定に際して基準となる音声区間の種類または時間的長さの少なくとも何れか一方に基づいて当該部分映像情報の重要度を設定し、前記生成手段が、前記重要度の順に総時間が前記要約時間になるように前記要約情報を生成する構成を有している。
【0067】
この構成により、請求項15に記載の発明では、コンピュータが、音声情報における音声レベルに基づいて映像情報を複数の種類の音声区間に分類するとともに、この分類された複数の種類の音声区間の少なくとも何れか一種類の、映像情報中における時間軸上の位置若しくは時間的長さの少なくとも何れか一方に基づいて抽出する部分映像情報を決定し、この部分映像情報に基づいて映像情報の時間長を短縮して要約情報を生成する。
【0068】
通常、映像情報に付帯される音声情報は、番組の盛り上がった部分、場面が転換された部分、または、内容が切り替わった部分などの特徴部分を示すので、当該映像情報の時間長を短縮して要約を行う際には重要な役割を果たす。
【0069】
したがって、本発明では、音声レベルによって分類された複数の種類の音声区間に基づいて抽出すべき部分映像情報を決定することができるので、映像情報の盛り上がった部分および内容が切り替わった部分を部分映像情報として抽出することができ、ユーザが短時間で内容を的確に把握することができる要約情報を得ることができる。
また、請求項15に記載の発明では、コンピュータが、抽出する部分映像情報の設定される時間長を予め定められた時間的範囲内に設定する。
抽出される一つの部分映像情報の時間長が短すぎると、ユーザはその部分の映像情報を理解することができず、また、部分映像情報の時間長が長すぎると、無駄な情報が多くなるとともに、情報量が増大し映像情報を的確に要約することができない。このため、要約した映像情報によってユーザに映像情報全体の内容を適切に伝えるためには、部分映像情報の時間長を適切な長さに設定する必要がある。
したがって、本発明では、抽出された部分映像情報の内容を理解することのできる時間長を確保することができるとともに、部分映像情報の時間長が不用意に長くなることを防止することができるので、ユーザに当該映像情報を正確に伝えることのできる要約情報を得ることができる。
【0070】
また、請求項16に記載の発明は、請求項15に記載の映像情報要約プログラムにおいて、前記コンピュータを、前記分類された複数の種類の音声区間の何れか一種類の、前記映像情報中における時間軸上の位置若しくは時間的長さの少なくとも何れか一方に基づいて前記部分映像情報の開始時刻または終了時刻の少なくとも何れか一方を決定する決定手段、として機能させる構成を有している。
【0071】
この構成により、請求項16に記載の発明では、コンピュータが、前記分類された複数の種類の音声区間の何れか一種類の映像情報中における時間軸上の位置若しくは時間的長さの少なくとも何れか一方に基づいて部分映像情報の開始時刻または終了時刻の少なくとも何れかを決定する。
【0072】
したがって、音声レベルによって分類された複数の音声区間が映像情報の盛り上がった部分、場面が転換された部分または内容が切り替わった部分を示すことにより、この特徴部分を音声レベルによって分類された複数の音声区間に基づいて的確に部分映像情報として抽出することができるので、ユーザが短時間で内容を把握することができる適切な要約情報を得ることができる。
【0073】
また、請求項17に記載の発明は、請求項15または16に記載の映像情報要約方法において、前記コンピュータを、前記音声レベルに基づいて前記映像情報を少なくとも音声の無い無音区間および予め設定された音声レベルを有する騒音区間に分類する分類手段、として機能させる構成を有している。
【0074】
この構成により、請求項17に記載の発明は、コンピュータが、音声レベルに基づいて映像情報を少なくとも音声の無い無音区間および予め設定された音声レベルを有する騒音区間に分類する。
【0075】
通常、映像情報の時間長を短縮して要約を行う際に、無音区間および騒音区間は重要な役割を果たす。例えば、テレビ放送番組において、予め設定された音声レベル以上の騒音区間および予め設定された音声の無い無音区間は、それぞれ番組の盛り上がった部分、および、場面が転換されたまたは内容が切り替わった部分を示す。
【0076】
したがって、本発明では、無音区間および騒音区間に基づいて抽出すべき部分映像情報を決定することができ、映像情報の盛り上がった部分および内容が切り替わった部分を部分映像情報として抽出することができるので、ユーザが短時間で内容を的確に把握することができる要約された映像情報を得ることができる。
【0077】
また、請求項18に記載の発明は、請求項15乃至17の何れか一項に記載の映像情報要約プログラムにおいて、前記コンピュータを、前記設定された部分映像情報の重要度に基づいて前記部分映像情報を抽出して前記映像情報を要約する生成手段、として機能させる構成を有している。
【0078】
この構成により、請求項18に記載の発明では、コンピュータが、前記抽出されるべき部分映像情報が決定されるときにその決定に際して基準となる音声区間の種類または時間的長さに基づいて当該部分映像情報の重要度を設定するとともに、設定された部分映像情報の重要度に基づいて部分映像情報を抽出して前記映像情報を要約する。
【0079】
したがって、部分映像情報の重要度に基づいて映像情報を要約することができるので、ユーザが指定した、または、予め設定された時間長に映像情報を短縮して要約するときにそれぞれの時間長に対応させることのできる要約情報を得ることができる。
【0080】
【発明の実施の形態】
次に、本発明に好適な実施の形態について、図面に基づいて説明する。
【0081】
本実施形態は、通信回線または電波などによって提供されるテレビジョン放送の番組などの音声映像情報を要約再生する要約再生装置に対して本発明を適用した場合の実施形態である。
【0082】
まず、図1〜図4を用いて本実施形態における要約再生装置の全体の構成および概要動作について説明する。
【0083】
なお、図1は本実施形態の要約再生装置の概要構成を示すブロック図であり、図2は本実施形態における無音区間および騒音区間の検出を説明するための図である。また、図3は騒音区間に基づいてセグメントの開始時刻および終了時刻を決定する原理を説明するための図であり、図4は無音区間に基づいてセグメントの開始時刻および終了時刻を決定する原理を説明するための図である。
【0084】
図1に示す本実施形態の要約再生装置100は、通信回線から送信された、または、図示しない受信部によって受信されたデジタル音声映像情報を入力するようになっており、この入力されたデジタル音声映像情報を復号化するとともに、復号化された音声映像情報から音声情報を分離し、要約再生に際して抽出すべき部分映像情報(以下、要約セグメントという)を決定するようになっている。
【0085】
この抽出すべき要約セグメントの決定処理は、まず、要約セグメントの候補(以下、要約セグメント候補という)をリストアップし(以下、リスト化という)、このリスト化された要約セグメント候補から抽出すべき要約セグメントを絞り込んで要約再生に使用する要約セグメントを決定するようになっている。
【0086】
この要約セグメントの決定処理では、要約セグメントの開始時刻および終了時刻などの時間情報と重要度を取得するようになっており、この決定された要約セグメントの時間情報と重要度に基づいて入力されたデジタル音声映像情報から要約セグメントを抽出し、当該抽出された要約セグメントを時間軸に基づいて連続的に再生(以下、要約再生という)するようになっている。
【0087】
なお、本実施形態では、入力されるデジタル音声映像情報は映像情報と付帯されている音声情報が多重化されているものとする。
【0088】
図1に示すように、本実施形態の要約再生装置100は、入力されたデジタル音声映像情報から音声情報を分離するデマルチプレクサ101と、デマルチプレクサ101によって分離されたデジタル信号である音声情報を復号して音声波形の情報(サンプル値(以下、音声波形情報という))を取得する復号部102と、音声波形情報における無音区間および騒音区間を検出する検出部103と、デジタル信号である音声映像情報を蓄積するとともに、当該音声映像情報において検出された無音区間および騒音区間の情報を蓄積する蓄積部104と、各部の操作を行うとともに、音声映像情報を要約する時間長を入力する操作部105と、蓄積された音声映像情報の要約再生を行う再生部106と、蓄積された音声映像情報における抽出すべき要約セグメントを決定して再生部106を制御する制御部106と、要約再生された映像信号を音声信号とともに表示・出力する表示部108とを備えている。
【0089】
なお、検出部103は本発明に係る分類手段を構成し、制御部106および再生部107は本発明に係る決定手段および生成手段を構成する。
【0090】
デマルチプレクサ101には、通信回線から送出された若しくは図示しない受信部によって受信されたデジタル音声映像情報、または、既に蓄積部104に蓄積されたデジタル音声映像情報が入力されるようになっており、デマルチプレクサ101は、この入力されたデジタル音声映像情報から音声情報を分離して復号部102に出力するようになっている。
【0091】
復号部102にはデマルチプレクサ101から出力されたデジタル音声情報が入力されるようになっており、この復号部102は、この入力されたデジタル音声情報を復号して当該音声情報における音声波形情報を取得するとともに、この取得した音声波形情報を検出部103に出力するようになっている。
【0092】
検出部103には復号部102によって得られた音声波形情報が入力されるようになっており、この検出部103は入力された音声波形情報から無音区間および騒音区間を検出するようになっている。
【0093】
本実施形態では、検出部103は、図2に示すように、予め設定された無音レベルの閾値(以下、無音レベル閾値(THS)という)および騒音レベルの閾値(以下、騒音レベル閾値(THn)という)に基づいて映像情報中における各無音区間および騒音区間の音声映像情報の時間軸上の開始位置(以下、単に開始位置という)および終了位置(以下、単に終了位置という)を検出するようになっており、この各無音区間および騒音区間毎に検出した開始位置および終了位置の時間情報を蓄積部104に出力するようになっている。なお、各無音区間および騒音区間の時間的長さを以下区間長という。
【0094】
具体的には、この検出部103は、入力された音声波形情報に基づいて単位時間平均音圧レベル(パワー)を算出し、この算出した値によって得られた音声情報が無音レベル閾値(THS)以下または騒音レベル閾値(THS)以上で、かつ、予め設定された時間的長さ(以下、最短無音区間長(DRSMin)および最短騒音区間長(DRNMin)という)以上の区間が検出された場合に、その区間を無音区間として、または、騒音区間として検出するようになっている。
【0095】
通常、ニュース番組ではアナウンサーが声を発したときの音声は、−50dB以上になるので、本実施形態では、無音レベル閾値(THS)を−50dBと設定し、最短無音区間長(DRSMin)を0.2秒に設定している。また、通常、スポーツ番組では観衆が盛り上がった際には背景雑音の音声レベルが−35dB程度になるので、本実施形態では、騒音レベル閾値(THn)を−35dBと設定し、最短騒音区間長(DRNMin)を1.0秒に設定している。
【0096】
蓄積部104には取得されたデジタル音声映像情報および検出部103によって検出された各無音区間および騒音区間の時間情報を蓄積するようになっている。また、この蓄積部104は制御部107の指示に基づいて再生部106への音声映像情報の出力および各区間の時間情報の制御部107への出力を行うようになっている。
【0097】
操作部105は、ユーザによって音声映像情報における蓄積制御指示、蓄積された音声映像情報の再生指示および要約再生を行う際の要約再生時間の入力などを行うことができるようになっており、この指示が制御部107に出力され、制御部107が各部を制御するようになっている。
【0098】
再生部106には蓄積部104から出力されたデジタル音声映像情報が入力されるようになっており、再生部106は入力された多重化されている音声映像情報を映像情報および音声情報に分離するとともに復号し、制御部107の指示に基づいて要約再生を行うようになっている。
【0099】
また、この再生部106はこの再生された音声信号および映像信号を表示部108に出力するようになっている。
【0100】
なお、本実施形態では再生部106によってデジタル音声映像情報を映像情報および音声情報に分離して復号するようになっているが、蓄積部104において蓄積するときに映像情報および音声情報に分離して行うようにしてもよい。
【0101】
制御部107は、操作部105によって入力された指示に基づいて蓄積部104における蓄積制御および蓄積部104に蓄積されている無音区間および騒音区間の時間情報に基づいて要約再生時に抽出すべき要約セグメントを決定し、この決定されたセグメントの情報(以下、セグメント情報という)に基づいて再生部106の再生制御を行うようになっている。
【0102】
なお、この抽出すべき要約セグメントの決定の処理(以下、要約セグメントの決定処理という)は後述する。
【0103】
表示部108には再生部106から出力された音声信号および映像信号が入力されるようになっており、この表示部108は、この入力された映像信号をモニター画面などに表示するとともに、音声信号をスピーカなどによって拡声するようになっている。
【0104】
次に、図3および図4を用いて制御部106における抽出すべき要約セグメントの決定処理について説明する。
【0105】
通常、録画された音声映像情報、または、通信回線などを介して提供される音声映像情報において、その音声映像情報の時間長を短縮して要約を行う際に、当該音声映像情報に付帯される音声情報は重要な役割を果たしている。
【0106】
例えば、テレビジョン放送番組において、騒音区間は番組の盛り上がった部分を、また、無音区間は場面が転換されたまたは内容が切り替わった部分を示す。
【0107】
具体的には、スポーツ観戦番組であれば、歓声などの背景雑音には観客の反応が現れるので、盛り上がった場面では、音声レベルが他の部分のレベルに比べて非常に高くなり、その部分は映像情報の特徴部分となる。
【0108】
また、ニュース番組であれば、ニュース内容が切り替わるときには、無音部分、いわゆる「間(ポーズ)」が取られるとともに、その「間」に続く部分には後に続く内容が示され、その部分は映像情報の特徴部分となる。特に、無音区間に続く部分は次の内容の冒頭部分を示すので、当該内容の概略が示されることも多い。
【0109】
また、上述のように、無音区間は無音区間に続く部分が重要になり、騒音区間は当該騒音区間が重要となるため、無音区間または騒音区間と音声映像情報の特徴部分との時間軸上の位置関係が異なるので、抽出すべき要約セグメントを決定する際に無音区間と騒音区間によって決定する処理が異なる。
【0110】
さらに、上述のように、無音区間後の部分は次の内容の冒頭、特に、概略を示すので、無音区間によって決定する要約セグメントの重要度は騒音区間によって決定される要約セグメントの重要度より高くする必要がある。
【0111】
このように、音声映像情報において、当該音声映像情報における無音区間および騒音区間を特徴付けることができるので、本実施形態では、以下に示す方法によって無音区間および騒音区間に基づいて要約セグメントの決定処理を行うようになっている。
【0112】
本実施形態における要約セグメントの決定処理では、無音区間および騒音区間に基づいて要約セグメントの開始時刻(STSSi)、終了時刻(SESSi)および重要度(IPSSi)を決定するようになっている。ただし、iはi番目の無音区間および騒音区間であり、jはj番目の要約セグメントであることを示す。
【0113】
なお、本実施形態における要約セグメントの決定処理では、まず、無音区間および騒音区間に基づいて要約セグメントの開始時間および重要度を決定して要約セグメント候補をリスト化し、その後、要約セグメント候補の絞り込みを行い、最短要約セグメント時間長、標準要約セグメント時間長および最長要約セグメント時間長を決定して絞り込まれた要約セグメントの終了時刻を決定するようになっている。
【0114】
また、本実施形態の要約セグメントの決定処理では、要約セグメント候補から要約セグメントの決定する際に基になった無音区間および騒音区間の区間長情報(DRSSj)を保持するようになっている。本実施形態では、要約セグメントが一度決定され、要約セグメント候補の絞り込み処理を行った後、終了時刻を決定するため、この区間長情報(DRSSj)は、後述する終了時刻を決定する際に、無音区間に基づいて決定された要約セグメントであるか、騒音区間によって決定された要約セグメントであるかを判断する必要があり、その判断にこの区間長情報(DRSSj)を用いるようになっている。
【0115】
具体的には、本実施形態では、騒音区間に基づいて設定された要約セグメントには、基準となった騒音区間の区間長を設定するようになっている(DRDNi=DRSSj)。また、無音区間に基づいて設定された要約セグメントには、DRSSj=0と設定するようになっている。
【0116】
したがって、要約セグメント決定処理の動作において、後述する終了時刻を決定する際に、このDRSSjが「0」であれば、無音区間に基づいて、「DRSSj≠0」であれば、騒音区間に基づいて設定された要約セグメントと判断できるようになっている。
【0117】
〔騒音区間における要約セグメントの設定〕
上述のように、騒音区間は番組の盛り上がった部分を示すので、騒音区間が重要である。そこで、本実施形態では、図3に示すように、検出部103によって検出された騒音区間の開始位置を要約セグメントの開始位置と設定するようになっている。
【0118】
なお、スポーツ観戦番組では、観客の歓声が集音され、この集音された音が背景雑音として当該音声映像情報に付帯されている音声情報に含まれている場合には、場面が盛り上がる少し前から再生する方が要約再生する際には有効性が高い。通常、スポーツ観戦において好プレーや得点シーンなど盛り上がる部分では観客が歓声を上げるまで、すなわち、騒音区間となるまでに時間差が生ずる。したがって、スポーツ観戦番組などの音声映像情報において騒音区間に基づいて要約セグメントの開始時刻を騒音区間の開始位置からΔtだけ前にずらすようにしてもよい。
【0119】
また、騒音区間における要約セグメントの終了時刻は、騒音区間の終了位置に基づいて決定されるようになっている。
【0120】
抽出される要約セグメントの内容を考慮すると、原則的には騒音区間の終了位置を要約セグメントの終了時刻に設定する必要がある。しかしながら、抽出すべき要約セグメントは、あまりにも要約セグメントの時間長が短いと当該場面を理解することが困難になる一方、不用意に長い時間長を有する場合には、無駄な情報が多くなるとともに、情報量が増大し映像情報を的確に要約することができない。
【0121】
このため、後述する最短要約セグメント時間長(DRMin)、標準要約セグメント時間長(DRTyp)および最長要約セグメント時間長(DRMax)を設定し、これらの時間長を用いて要約セグメントの終了時刻を設定するようになっている。
【0122】
例えば、図3に示すように、騒音区間(DNi(例えば、図3に示す騒音区間a))が最短要約セグメント時間長(DRMin)に満たない場合は、最短要約セグメント時間長(DRMin)が要約セグメントの時間長になり、要約セグメントの開始時刻にその最短要約セグメント時間長(DRMin)を加えた時刻を要約セグメントの終了時刻に設定するようになっている。
【0123】
また、騒音区間(DNi(例えば、図3に示す騒音区間b))が最短要約セグメント時間長(DRMin)以上、最長要約セグメント時間長(DRMax)以下である場合は、騒音区間長が要約セグメントの時間長となり、騒音区間が終了する位置を要約セグメントの終了時刻に設定するようになっている。
【0124】
さらに、騒音区間(DNi(例えば、図3に示す騒音区間c))が最長要約セグメント時間長(DRMax)を越える場合は、要約セグメントの開始時刻に標準要約セグメント時間長(DRTyp)を加えた時刻を要約セグメントの終了時刻と設定するようになっている。
【0125】
すなわち、i番目の騒音区間におけるj番目の要約セグメントにおいて、セグメント時間長(DRDNi=DRSSj)より、
0 < DRSSi < DRMin の場合、
SESSj = STSS + DRMin ・・・(式1)
DRMin ≦ DRSSi ≦ DRMax の場合、
SESSj = STSS + DRSSi ・・・(式2)
DRMax < DRSSi の場合、
SESSj = STSS + DRTyp ・・・(式3)
となる。ただし、上述のように要約セグメントの開始時刻をΔt早めたときは、他の要約セグメントの時間長との整合性により、各最短要約セグメント時間長(DRMin)、標準要約セグメント時間長(DRTyp)および最長要約セグメント時間長(DRMax)の時間長からΔt分減算した時間を各最短要約セグメント時間長(DRMin)、標準要約セグメント時間長(DRTyp)および最長要約セグメント時間長(DRMax)にするようになっている。
【0126】
なお、本実施形態において、各要約セグメントの終了時刻の設定は、後述する要約セグメント候補の絞り込み処理が行われ、当該絞り込まれた要約セグメントに対して設定されるようになっている。すなわち、騒音区間に基づいて要約セグメントの開始時刻を設定することによって当該要約セグメントを要約セグメント候補としてリストアップし、その後、後述する要約セグメント候補の絞り込み処理が行われ、さらに、最短要約セグメント時間長(DRMin)、標準要約セグメント時間長(DRTyp)および最長要約セグメント時間長(DRMax)が設定された後に当該要約セグメントの終了時刻を設定するようになっている。
【0127】
また、騒音区間における要約セグメントの重要度(IPSSj)は、騒音区間の区間長(DRDNi)を用いて設定するようになっている。これにより、騒音区間の区間長が長ければ長いほど重要度を高く設定することができるようになっている。
【0128】
〔無音区間における要約セグメントの設定〕
上述のように無音区間は、場面が転換されたまたは内容が切り替わった部分を示すので、無音区間が終了した後に続く部分が重要である。そこで、本実施形態では、図4に示すように、検出部103によって検出された無音区間の予め設定された区間長(以下、追加最短無音区間長(DRSAMin)という)以上、例えば、1.0秒以上を有する無音区間の終了位置を要約セグメントの開始時間(STSS)に設定するようになっている。
【0129】
なお、無音区間には重要でないものも存在するため、明らかに「間」が存在し、内容が切り替わったところを検出するため、要約セグメントの決定にあたっては、追加最短無音区間長(DRSAMin)を定め、この追加最短無音区間長(DRSAMin)以上の区間長を有している無音区間の終了位置を要約セグメントの開始位置に設定するようになっている。
【0130】
また、無音区間における要約セグメントの終了時刻は、要約セグメントの開始時刻の設定に用いられた無音区間の次の無音区間の開始位置に基づいて決定されるようになっている。
【0131】
この場合、要約セグメントの開始時刻の設定に用いられた無音区間の次の無音区間の区間長は、追加最短無音区間長(DRSAMin)以上の長さである必要はなく、検出部103によって検出された全ての無音区間を対象に無音区間を検索するようになっている。
【0132】
騒音区間の場合と同様に要約セグメントの終了時刻は、後述する最短要約セグメント時間長(DRMin)、標準要約セグメント時間長(DRTyp)および最長要約セグメント時間長(DRMax)を用いて設定するようになっている。
【0133】
例えば、図4に示すように、要約セグメントの開始時刻に設定された無音区間(DSi)の次に検出された無音区間(DSi+1(例えば、図4に示す無音区間a))の開始位置が最短要約セグメント時間長(DRMin)に満たない場合には、最短要約セグメント時間長(DRMin)が要約セグメントの時間長になり、要約セグメントの開始時刻にその最短要約セグメント時間長(DRMin)を加えた時刻を要約セグメントの終了時刻に設定するようになっている。
【0134】
また、無音区間(DSi)の次に検出された無音区間(DSi+1(例えば、図4に示す無音区間b))の開始位置が最短要約セグメント時間長(DRMin)を越えるとともに、最長要約セグメント時間長(DRMax)に満たない場合は、検出された無音区間(DSi+1)の開始位置を要約セグメントの終了時刻と設定するようになっている。
【0135】
さらに、無音区間(DSi)の次に検出された無音区間(DSi+1(例えば、図4に示す無音区間c))の開始位置が最長要約セグメント時間長(DRMax)を越える場合は、標準要約セグメント時間長(DRTyp)が要約セグメントの時間長になり、要約セグメントの開始時刻に標準要約セグメント時間長(DRTyp)を加えた時刻を要約セグメントの終了時刻と設定するようになっている。
【0136】
また、本実施形態では、最短要約セグメント時間長(DRMin)、標準要約セグメント時間長(DRTyp)および最長要約セグメント時間長(DRMax)を用いて要約セグメントの終了時刻を設定する際に、当該次の無音区間の検出において以下の順序によって行うようになっている。
【0137】
要約セグメントの開始時間の基準となった無音区間(DSi)の次にある無音区間(DSi+1)を検出する順序としては、まず、無音区間(DSi)の次に検出された無音区間(DSi+1)の開始位置が最短要約セグメント時間長(DRMin)以上、最長要約セグメント時間長(DRMax)以下に存在するか否かを検出し、この範囲内に無いときに、無音区間(DSi)の次に検出された無音区間(DSi+1)の開始位置が最短要約セグメント時間長(DRMin)までに無いか否かを検出するようになっている。さらに、これらの範囲に無かったときに、無音区間(DSi)の次に検出された無音区間(DSi+1)は最長要約セグメント時間長(DRMax)以上にあると判断するようになっている。
【0138】
すなわち、i番目の騒音区間におけるj番目の要約セグメントにおいて、区間[DRMin、DRMax]に無音区間(DSi+1)の開始位置(ST)が見つかった場合、
SESSj = ST ・・・(式4)
また、区間[DRMin、DRMax]に無音区間(DSi+1)の開始位置(ST)が見つからず、区間[0、DRMin]に見つかった場合、
SESSj = STSSi + DRMin ・・・(式5)
さらに、区間[0、DRmAX]に無音区間(DSi+1)の開始位置(ST)が見つから無かった場合、
SESSj = STSSi + DRTyp ・・・(式6)
となる。
【0139】
この無音区間(DSi+1)の検出の順序は、最短要約セグメント時間長(DRMin)以内に次の無音区間(DSi+1)が存在しても、無音区間(例えば、無音区間(DSi+n(n≧2)))の開始位置が最短要約セグメント時間長(DRMin)以上、最長要約セグメント時間長(DRMax)以下に存在した場合には、最短要約セグメント時間長(DRMin)以内に存在する次の無音区間(DSi+1)は、要約セグメントの開始時刻の基準となった無音区間(DSi)の次の無音区間として取り扱わず、無音区間(DSi+n(n≧2))を無音区間(DSi+1)として当該無音区間(DSi+1)に基づいて要約セグメントの終了時刻を決定するようになっている。
【0140】
なお、騒音区間における要約セグメントの終了時刻の設定と同様に、無音区間によって各要約セグメントの終了時刻の設定は、後述する要約セグメント候補の絞り込み処理が行われ、当該絞り込まれた要約セグメントに対して設定されるようになっている。
【0141】
また、無音区間における重要度は、騒音区間と同様に無音区間の区間長(IPSSj)に基づいて設定するが、上述のように無音区間の方が騒音区間に基づいて設定する重要度よりも重要であるので、例えば、以下のような(式7)によって算出するようになっている。
【0142】
IPSSj = f(DRDSi) ・・・(式7)
なお、f(・)は重み付け関数であり、本実施形態では、
f(x) = ax + b ・・・(式8)
を用いている。ここで、a、bは定数である。具体的な例を示すと、
f(x) = x + 100 ・・・(式9)
が考えられる。
【0143】
〔要約セグメント候補の絞り込み処理〕
上述のように無音区間および騒音区間に基づいて決定された要約セグメント全てについて後述する要約再生の処理を行ってもよいが、処理量の軽減および不必要な要約セグメントによる要約再生を防ぐ、すなわち、重要度の低い要約セグメントであっても、後述する結合処理によって重要度が高くなる可能性があり、不適切な要約セグメントよる要約再生を防ぐため、設定された要約セグメントを絞り込むようになっている。
【0144】
本実施形態では、以下の(式10)によってリスト化された要約セグメント候補から絞り込み処理を行うようになっている。
【0145】
この(式10)は、全ての要約セグメントの時間が限界最短時間(DRLMin)とした場合の絞り込む要約セグメントの数の定数倍(例えば、K1=2)と要約セグメント候補の数とを比較し、少ない方を要約セグメント数に設定するようになっている。
【0146】
例えば、リスト化された要約セグメント候補の数(NPoid)、要約時間S、とすると、新たに設定される要約セグメント候補の数(NPnew)は、
NPnew =Min(Int(k1×(S/DRLMin)),NPold)・・・(式10)
となる。
【0147】
なお、k1は定数であり、Min(a,b)はa,bのうち値の小さい方を選択することを示し、INT(・)は小数点以下の切り捨てを行うことを示す。また、NPnewは絞り込まれた数を示し、DRLMinは限界最短時間を示す。
【0148】
この限界最短時間(DRLMin)とは、人間が一つの要約セグメント内容を理解するのに必要最低限の時間であり、例えば、本実施形態では限界最短時間(DRLMin)は4秒としている。
【0149】
このように算出された要約セグメント候補の数が絞り込む要約セグメントの数の定数倍より多い場合は、すなわち、NPnew<NPoldの場合は、重要度順に要約セグメント候補をNPnew個選択し、それ以外は、要約セグメント候補から削除するようになっている。
【0150】
なお、本実施形態では、このように要約セグメント候補の絞り込みを行い、この絞り込まれた要約セグメント候補において、上述した設定方法によって各要約セグメントに終了時刻を設定するようになっている。
【0151】
〔最短/標準/最長要約セグメント時間長の設定〕
上述したように、抽出すべき要約セグメントは、なるべく長い時間長を有する方が当該場面を理解する上で必要である一方、不用意に長い時間長を有する場合には、無駄な情報が多くなるとともに、情報量が増大し映像情報を的確に要約することができないので、本実施形態では、後述する最短要約セグメント時間長(DRMin)、標準要約セグメント時間長(DRTyp)および最長要約セグメント時間長(DRMax)を設定するようになっている。
【0152】
例えば、本実施形態では、抽出すべき要約セグメントの各内容を各内容毎に的確に把握させるため、以下の式によって最短要約セグメント時間長(DRMin)、標準要約セグメント時間長(DRTyp)および最長要約セグメント時間長(DRMax)を設定するようになっている。
【0153】
最短要約セグメント時間長(DRMin)についてはユーザにおける要約セグメントの見やすさを考慮して、比較的要約セグメントの時間長を長くするために(式11)に示すようになっており、また、標準要約セグメント時間長(DRTyp)および最長要約セグメント時間長(DRMax)については、(式11)によって算出された最短要約セグメント時間長(DRMin)を定数倍することによって算出するようになっている。
【0154】
DRMin=Max(DRLMin,(K2×(S/NPnew)))・・・(式11)
DRTyp = DRMin × KT1 ・・・(式12)
DRMax = DRMin × KT2 ・・・(式13)
なお、KT1およびKT2とも比例定数であり、Max(a,b)はa,bのうち値の大きい方を選択することを示す。また、K2(≧1)は各要約セグメントの最短時間を決定する係数であり、この値が大きいほど最短時間が長くなるとともに、要約セグメントの数は減少するようになっている。例えば、本実施形態では、K2=1.2、KT1=2、KT2=3と設定するようになっている。
【0155】
〔要約セグメントの結合〕
本実施形態では、時間的に重なる複数の要約セグメントが有った場合にこれらの要約セグメントを一つの要約セグメントに結合するようになっており、この場合、結合することによって生成された要約セグメントの重要度は、各要約セグメントが有する重要度(IPSSj)の高い方を選択するようになっている(式14)。
【0156】
IPSSj = Max(IPSSj,IPSSj±n)・・・(式14)
また、例えば、2つの要約セグメントSSj,SSj+n(STSSj<STSS(j+n) SESSj≧STSS(j+n))とすると、
SESSj = SESSj+n ・・・(式15)
となる。
【0157】
このため、たとえ一の要約セグメントの重要度が低い場合であっても、重要度の高い要約セグメントと時間的に重なっている場合に、重要度の高い要約セグメントを補完できるようになっている。
【0158】
〔要約セグメントの決定〕
本実施形態では、最後に指定された要約時間を達成するために、重要度順に要約セグメント候補の選択を行うようになっている。
【0159】
また、選択された要約セグメント候補の総時間が指定された要約時間を超えるまで選択し、この選択されたセグメントを要約セグメントとするようになっている。
【0160】
ここで、重要度順に要約セグメントを決定する場合に、決定される要約セグメントは、異なるセグメント時間長を有するので、指定された要約時間を越えることがある。この要約時間が越えることが問題となるときは、例えば、オーバーした時間を決定された要約セグメント数で分配し、それぞれの要約セグメントの終了時刻から分配された時間長を削除する処理を行うようになっている。
【0161】
次に、図5〜図7を用いて要約再生動作における制御部107の要約セグメント決定処理ついて説明する。
【0162】
なお、図5は本実施形態における要約再生における要約セグメントの決定処理の動作を示すフローチャートであり、図6および図7は、それぞれ、要約セグメント決定処理において、騒音区間および無音区間に基づいて設定される要約セグメント候補の終了時刻を設定する動作を示すフローチャートである。
【0163】
また、本動作は、要約再生に必要な音声映像情報が既に蓄積部104に蓄積されているものとし、ユーザが要約再生を指示したときに本動作を行うようになっている。
【0164】
まず、図5に示すように、操作部105によってユーザから要約再生の指示が入力されると、制御部107は指示された音声映像情報における無音区間および騒音区間の検出処理が初めてであるか否かを判断し(ステップS11)、以前に無音区間および騒音区間を検出したことがあると判断したときは、そのデータを蓄積部104から読み込む(ステップS12)。
【0165】
また、指示された音声映像情報における無音区間および騒音区間の検出処理が初めてのときは、指示された音声映像情報の無音区間および騒音区間を検出部103によって検出させる(分類処理工程(ステップS13))
次いで、ユーザによって指定された、または、予め設定された要約時間を読み込むと(ステップS14)、上述のように、制御部107は、検出部103によって検出された、または、蓄積部104から読み込まれた無音区間および騒音区間に基づいて要約セグメント候補のリスト化を行う(決定処理工程(ステップS15))。
【0166】
具体的には、追加最短無音区間長(DRSAmin)を有する無音区間および騒音区間の開始位置および終了位置を検出して要約セグメントの開始時刻および重要度の設定を行う。
【0167】
次いで、制御部107は、ステップS15によって生成された要約セグメント候補リストから要約セグメント候補の絞り込み処理を行う(決定処理工程(ステップS16))。
【0168】
具体的には、リスト化された要約セグメント候補から、入力された要約時間および限界最短時間(DRLMin)に基づいて絞り込む要約セグメント数を算出するとともに、リスト化された要約セグメント候補から要約セグメントの重要度順に当該算出された要約セグメント数の要約セグメントを選択することによって要約セグメント候補を絞り込む。
【0169】
次いで、制御部107は、ステップS16によって絞り込まれた要約セグメント数および限界最短時間(DRLMin)に基づいて最短要約セグメント時間長(DRMin)を算出するとともに、この最短要約セグメント時間長(DRMin)に基づいて標準要約セグメント時間長(DRTyp)および最長要約セグメント時間長(DRMax)の設定を行う(ステップS17)。
【0170】
次いで、制御部107は、ステップS16によって絞り込まれた各要約セグメント候補がステップS15によって設定されたときの音声区間の種別を判別、すなわち、各要約セグメントが騒音区間に基づいて設定されたか、または、無音区間に基づいて設定されたのかを判別する(ステップS18)。
【0171】
具体的には、各要約セグメント候補における基になった無音区間および騒音区間の区間長の値(DRSSj=0か否か)によって判断を行う。
【0172】
次いで、音声区間の種別に基づいて各要約セグメント候補の終了時刻を設定する(決定処理工程(ステップS19、ステップS20))。騒音区間に基づいて設定されている要約セグメント候補の場合は騒音区間の終了位置によって終了時刻を設定し(ステップS19、)、また、無音区間に基づいて設定されている要約セグメント候補の場合は開始時刻の基準となった無音区間の次に検出された無音区間の開始位置によって終了時刻を設定する(ステップS20)。
【0173】
なお、各無音区間および騒音区間に基づいて設定される要約セグメント候補の終了時刻についての処理動作は後述する。
【0174】
最後に、制御部107は、上述したように時間的に重なる複数の要約セグメント候補を結合するとともに、ステップS14によって入力された要約時間に基づいて重要度順に総時間が要約時間になるように抽出すべき要約セグメント候補を選択し、要約セグメントを決定する(決定処理工程(ステップS21))。
【0175】
このように、要約再生時に要約セグメント候補が選択され、抽出すべき要約セグメントが決定されると、制御部107は、再生部106を制御して、要約再生を開始するとともに、この決定された要約セグメントに基づいて再生部106を制御して要約再生を行うようになっている。
【0176】
次に、図6を用いてステップS19における騒音区間に基づいて生成された要約セグメント候補の終了時刻の設定処理について説明する。
【0177】
まず、基になった騒音区間の区間長(DRSSi)が最長要約セグメント時間長(DRMax)までの範囲内に有るか否かを判別し(ステップS31)、騒音区間の区間長(DRSSi)が最長要約セグメント時間長(DRMax)を越えるときは当該騒音区間の開始位置(STSS)に標準要約セグメント時間長(DRTyp)を加算した値を終了時刻に設定する(ステップS32)。
【0178】
一方、騒音区間の区間長が最長要約セグメント時間長(DRMax)より短いときは、騒音区間の区間長が最短要約セグメント時間長(DRMin)より大きいか否かを判断し(ステップS33)、当該騒音区間の区間長(DRSSi)が最短要約セグメント時間長(DRMin)より大きいときは当該騒音区間の開始位置(STSS)に当該騒音区間の区間長(DRSSi)を加算した値を終了時刻に設定し(ステップS34)、騒音区間の区間長が最長要約セグメント時間長(DRMax)より小さいときは当該騒音区間の開始位置(STSS)に最短要約セグメント時間長(DRMin)を加算した値を終了時刻に設定する(ステップS35)。
【0179】
次に、図7を用いてステップS20における無音区間に基づいて生成された要約セグメント候補の終了時刻の設定処理について説明する。
【0180】
まず、当該無音区間の次の無音区間を検索する(ステップS41)。
【0181】
なお、上述のように、最短要約セグメント時間長(DRMin)以内に当該次の無音区間がある場合であっても、最短要約セグメント時間長(DRMin)以上、最長要約セグメント時間長(DRMax)以下にある無音区間が優先になるので、最短要約セグメント時間長(DRMin)以内に当該次の無音区間が存在した場合は最短要約セグメント時間長以上に存在する最初の無音区間を検索しておく。
【0182】
次いで、要約セグメントの開始時刻に設定された無音区間(DSi)の次に検出された無音区間(DSi+1)における開始位置までの時間長(ST)が、最短要約セグメント時間長(DRMin)以上、最長要約セグメント時間長(DRMax)以下であるか否かを判断し(ステップS42)、当該無音区間(DSi+1)における開始位置までの時間長(ST)が最短要約セグメント時間長(DRMin)以上、最長要約セグメント時間長(DRMax)以下であるときは、要約セグメントの開始時刻(STSSi)にこの開始位置における時間長STを加算した値を終了時刻に設定する(ステップS43)。
【0183】
次いで、当該無音区間(DSi+1)における開始位置までの時間長(ST)が最短要約セグメント時間長(DRMin)以上、最長要約セグメント時間長(DRMax)以下でない場合は、無音区間(DSi)の次に検出された無音区間(DSi+1)の開始位置までの時間長(ST)が最短要約セグメント時間長(DRMin)より大きいか否かを判断し(ステップS44)、開始位置までの時間長(ST)が最短要約セグメント時間長(DRMin)より小さい場合は、要約セグメントの開始時刻(STSSi)に最短要約セグメント時間長(DRMin)を加算した値を終了時刻に設定し(ステップS45)、開始位置までの時間長(ST)が最短要約セグメント時間長(DRMin)より大きい場合は、要約セグメントの開始時刻(STSSi)に標準要約セグメント時間長(DRTyp)を加算した値を終了時刻に設定する(ステップS46)。
【0184】
以上説明したように、本実施形態では、音声映像情報における音声レベルによって検出された無音区間および騒音区間に基づいて抽出すべき要約セグメントを決定することによって、音声映像情報の盛り上がった部分および内容が切り替わった部分に基づいて要約再生を行うことができ、要約セグメントの重要度を要約セグメントを決定する際に基準となる無音区間および騒音区間の区間長に基づいて決定することができるとともに、騒音区間または無音区間に基づいて決定される要約セグメントの重要度を決定することができるので、ユーザが短時間で内容を的確に把握することができる要約情報を得ることができる。
【0185】
また、無音区間の終了位置を要約セグメントの開始時刻に設定することができるとともに、要約セグメントの開始時刻の次に検出された無音区間に基づいて当該要約セグメントの終了時刻を設定することができるので、音声映像情報の特徴部分の概略が示された、または、内容的に切りの良い部分など違和感のない適切なタイミングで要約セグメントを抽出することができる。
【0186】
また、騒音区間の開始位置を部分映像情報の開始時刻に設定することができるとともに、騒音区間の時間的長さに基づいて当該部分映像情報の終了時刻を設定することができるので、音声映像情報における盛り上がった部分、すなわち、違和感のない適切なタイミングで要約セグメントを抽出することができる。
【0187】
また、要約セグメントの終了時刻を決定するときに、最短要約セグメント時間長、標準要約セグメント時間長および最長要約セグメント時間長に基づいて当該終了時刻を決定するので、抽出された要約セグメントの内容を理解することのできる時間長を確保することができるとともに、要約セグメントの時間長が不用意に長くなることを防止することができる。
【0188】
なお、本実施形態はデジタル信号によって構成された映像情報に基づいて要約再生を行うようになっているが、アナログ信号によって提供された音声映像情報にも適用することは可能になっている。
【0189】
また、本実施形態では、一つの騒音レベル閾値(THn)によって騒音区間を検出するようになっているが、この騒音レベル閾値(THn)を複数設けて検出するようにしてもよい。
【0190】
この場合、例えば、図8に示すように、騒音レベル閾値1(THn1)および騒音レベル閾値2(THn2)によって騒音区間1および騒音区間2を検出するように構成すると、一つの騒音区間によって要約セグメントを生成するときに比べ、さらに適切な要約再生を行うことができるようになっている。
【0191】
すなわち、騒音レベル閾値1(THn1)の音声レベルを音声映像情報において極めて盛り上がった部分を騒音区間として検出し、この騒音区間によって要約セグメントの重要度を、無音区間に基づいて決定された要約セグメントの重要度を設定するときに用いられた重み付け関数などによって騒音レベル閾値2(THn2)で決定される要約セグメントの重要度より高く設定する。
【0192】
この結果、音声映像情報における重要な部分を的確に要約セグメントに設定することができるとともに、騒音レベル閾値2(THn2)によって得られた騒音区間も要約セグメント候補として設定することができるので、一つの騒音区間によって要約セグメントを生成するときに比べ、要約セグメントの選択の幅が広がるとともに、適切な要約再生を行うことができる。
【0193】
また、上述した時間的に重なる要約セグメントの結合処理によって、極めて盛り上がった要約セグメントとその前後の要約セグメントが結合される可能性があり、これにより一つの重要度の高い要約セグメントが設定されることになるので、要約再生時に極めて盛り上がった部分を比較的長く再生することができ、適切な要約再生を行うことができる。
【0194】
また、本実施形態に従来のCM(Commercials)カット技術を用いてもよい。通常、CM部分の音声映像情報は騒音区間になる確率が高い。したがって、このCMカット技術を本実施形態に組み合わせ、要約再生を行う音声映像情報において騒音区間および無音区間を検出する前にCM部分をカットし、その後、騒音区間および無音区間を検出するように構成すれば、適切な騒音レベル閾値を設定することができるので、より適切な要約再生を行うことができるようになる。
【0195】
なお、このCMカット技術には、特開平9−219835号公報記載の映像要約方法または映像要約装置を用いる。この技術は、映像情報において内容が大きく変化する部分(カット)と無音区間を検出し、この検出したカットと無音区間を用いてCM部分を推定してCMカットを行うようになっている。
【0196】
また、本実施形態において、時間的に近接する要約セグメントを結合するようにしてもよい。MPEG(Moving Picture Experts group)などの動画シーケンスでは要約再生時に希望する時間軸上の位置へのシーク処理に時間がかかる場合があるため、要約再生時に要約セグメント間のシーク時に一時再生が停止するという問題が生じ、この問題は、要約再生を視聴しているユーザに不快感を与える。したがって、上述した抽出すべき要約セグメントの選択後に、さらに、時間的に近接する要約セグメントを一つに結合して要約再生時に必要となる要約セグメントの数を少なくし、要約再生のときのシーク回数を軽減し、見やすい要約再生を行うようにする。
【0197】
また、本実施形態では、要約再生処理動作を検出部103、再生部106および制御部107によって行うようになっているが、要約再生処理動作を行うプログラムをコンピュータによって読み出すことによって要約再生を実行するようにしてもよい。
【0198】
この場合、制御部107にこのプログラムを読み込み実行するコンピュータを備えるとともに、当該コンピュータに復号化された音声映像情報が入力され、この入力された音声映像情報から無音区間および騒音区間を検出するとともに、当該検出された無音区間および騒音区間に基づいて当該音声映像情報の要約セグメントを決定し、この決定した要約セグメントに基づいて入力された音声映像情報の要約再生を行うようにする。この結果、上述した要約再生装置と同様の効果を得ることができる。
【0199】
また、本実施形態では、要約再生装置100が、上述のように検出部103、再生部106および制御部107などによって構成されているが、制御部107にコンピュータおよびハードディスクなどの記録媒体を備え、検出部103、再生部106および制御部107など要約再生装置100の各部に対応する上記処理を行うプログラムを当該記録媒体に格納し、当該プログラムをコンピュータに読み取らせることによって、上述した検出部103、再生部106および制御部107など要約再生装置100の各部のそれぞれの動作を行うようにしてもよい。
この場合、上述した予約セグメントの決定処理および要約再生動作を行うときは、当該格納されたプログラムによりコンピュータを動作させることによって当該決定処理および要約再生動作を行うようにする。また、この場合、制御部107は、本発明に係る検出手段、生成手段および決定手段を構成する。
【0200】
【発明の効果】
以上説明したように、請求項1に記載の発明によれば、音声レベルによって分類された複数の音声区間に基づいて抽出すべき部分映像情報を決定することができるので、映像情報の盛り上がった部分および内容が切り替わった部分を部分映像情報として抽出することができ、ユーザが短時間で内容を的確に把握することができる要約情報を得ることができる。
【0201】
また、請求項2に記載の発明によれば、音声レベルによって分類された複数の音声区間が映像情報の盛り上がった部分、場面が転換された部分または内容が切り替わった部分を示すことにより、この特徴部分を音声レベルによって分類された複数の音声区間に基づいて的確に部分映像情報として抽出することができるので、ユーザが短時間で内容を把握することができる適切な要約情報を得ることができる。
【0202】
また、請求項3に記載の発明によれば、無音区間および騒音区間に基づいて抽出すべき部分映像情報を決定することができ、映像情報の盛り上がった部分および内容が切り替わった部分を部分映像情報として抽出することができるので、ユーザが短時間で内容を的確に把握することができる要約された映像情報を得ることができる。
【0203】
また、請求項4に記載の発明によれば、無音区間の終了位置を部分映像情報の開始時刻に設定することができるので、映像情報の特徴部分を為す部分映像情報を的確に抽出することができる。
【0204】
また、請求項5に記載の発明によれば、部分映像情報の開始時刻の次の無音区間に基づいて終了時刻を設定することができるので、特徴部分の概略が示された、または、内容的に切りの良い部分など違和感のない適切なタイミングで部分映像情報を抽出することができ、ユーザに当該映像情報を正確に伝えることのできる要約情報を得ることができる。
【0205】
また、請求項6に記載の発明によれば、騒音区間の開始位置を部分映像情報の開始時刻に設定することができるので、映像情報の特徴部分を為す部分映像情報を的確に抽出することができる。
【0206】
また、請求項7に記載の発明によれば、映像情報における盛り上がった部分、すなわち、当該映像情報の特徴部分の終了位置を的確に部分映像情報に設定することができるので、違和感のない適切なタイミングで部分映像情報を抽出することができ、ユーザに当該映像情報を正確に伝えることのできる要約情報を得ることができる。
【0207】
また、請求項8に記載の発明によれば、抽出された部分映像情報の内容を理解することのできる時間長を確保することができるとともに、部分映像情報の時間長が不用意に長くなることを防止することができるので、ユーザに当該映像情報を正確に伝えることのできる要約情報を得ることができる。
【0208】
また、請求項9に記載の発明によれば、部分映像情報の重要度に基づいて映像情報を要約することができるので、ユーザが指定した、または、予め設定された時間長に映像情報を短縮して要約するときにそれぞれの時間長に対応させることのできる要約情報を得ることができる。
【0209】
また、請求項10に記載の発明によれば、無音区間を騒音区間より重要度を高く設定することができるので、騒音区間との重要度のバランスを取ることができ、的確な要約情報を得ることができる。
【0210】
また、請求項11に記載の発明によれば、時間的に重なる映像情報を結合することによって映像情報の重要な部分を1つの部分映像情報として抽出することができるので、的確な要約情報を得ることができる。また、結合された各部分映像情報の重要度に基づいて当該部分映像情報の重要度が設定することができるので、ユーザが短時間で内容を把握することができる適切な要約映像情報を得ることができる。
【0211】
また、請求項12に記載の発明によれば、音声レベルによって分類された複数の音声区間に基づいて抽出すべき部分映像情報を決定することができるので、映像情報の盛り上がった部分および内容が切り替わった部分を部分映像情報として抽出することができ、ユーザが短時間で内容を的確に把握することができる要約情報を得ることができる。
【0212】
また、請求項13に記載の発明によれば、音声レベルによって分類された複数の音声区間が映像情報の盛り上がった部分、場面が転換された部分または内容が切り替わった部分を示すことにより、この特徴部分を音声レベルによって分類された複数の音声区間に基づいて的確に部分映像情報として抽出することができるので、ユーザが短時間で内容を把握することができる適切な要約情報を得ることができる。
【0213】
また、請求項14に記載の発明によれば、無音区間および騒音区間に基づいて抽出すべき部分映像情報を決定することができ、映像情報の盛り上がった部分および内容が切り替わった部分を部分映像情報として抽出することができるので、ユーザが短時間で内容を的確に把握することができる要約された映像情報を得ることができる。
【0214】
また、請求項15に記載の発明によれば、部分映像情報の重要度に基づいて映像情報を要約することができるので、ユーザが指定した、または、予め設定された時間長に映像情報を短縮して要約するときにそれぞれの時間長に対応させることのできる要約情報を得ることができる。
【0215】
また、請求項16に記載の発明によれば、音声レベルによって分類された複数の音声区間に基づいて抽出すべき部分映像情報を決定することができるので、映像情報の盛り上がった部分および内容が切り替わった部分を部分映像情報として抽出することができ、ユーザが短時間で内容を的確に把握することができる要約情報を得ることができる。
【0216】
また、請求項17に記載の発明によれば、音声レベルによって分類された複数の音声区間が映像情報の盛り上がった部分、場面が転換された部分または内容が切り替わった部分を示すことにより、この特徴部分を音声レベルによって分類された複数の音声区間に基づいて的確に部分映像情報として抽出することができるので、ユーザが短時間で内容を把握することができる適切な要約情報を得ることができる。
【0217】
また、請求項18に記載の発明によれば、無音区間および騒音区間に基づいて抽出すべき部分映像情報を決定することができ、映像情報の盛り上がった部分および内容が切り替わった部分を部分映像情報として抽出することができるので、ユーザが短時間で内容を的確に把握することができる要約された映像情報を得ることができる。
【0218】
また、請求項19に記載の発明によれば、部分映像情報の重要度に基づいて映像情報を要約することができるので、ユーザが指定した、または、予め設定された時間長に映像情報を短縮して要約するときにそれぞれの時間長に対応させることのできる要約情報を得ることができる。
【図面の簡単な説明】
【図1】本発明に係る一実施形態の要約再生装置の構成を示すブロック図である。
【図2】一実施形態における無音区間および騒音区間の検出原理を説明するための図である。
【図3】騒音区間に基づいてセグメントの開始時刻および終了時刻を決定する原理を説明するための図である。
【図4】無音区間に基づいてセグメントの開始時刻および終了時刻を決定する原理を説明するための図である。
【図5】一実施形態の要約再生における要約セグメントを決定する処理動作を示すフローチャートである。
【図6】一実施形態の要約再生動作における騒音区間に基づいて決定される要約セグメントの終了時刻を設定する動作を示すフローチャートである。
【図7】一実施形態の要約再生動作における無音区間に基づいて決定される要約セグメントの終了時刻を設定する動作を示すフローチャートである。
【図8】一実施形態において複数の騒音区間を検出する原理を説明する図である。
【図9】従来の要約再生装置の構成を示すブロック図である。
【符号の説明】
100 … 要約再生装置
101 … デマルチプレクサ
102 … 復号部
103 … 検出部(分類手段)
104 … 蓄積部
105 … 操作部
106 … 再生部(生成手段)
107 … 制御部(分類手段、決定手段、生成手段)

Claims (18)

  1. 音声情報が付帯されている映像情報から、前記音声情報に基づいて当該映像情報の一部である部分映像情報を1または複数個抽出し、当該抽出した部分映像情報に基づいて前記映像情報の時間長が短縮された要約情報を生成する映像情報要約装置において、
    前記音声情報における音声レベルに基づいて前記映像情報を複数の種類の音声区間に分類する分類手段と、
    前記要約情報の時間長である要約時間を決定する要約時間決定手段と、
    前記分類された複数の種類の音声区間の少なくとも何れか一種類の、前記映像情報中における時間軸上の位置若しくは時間的長さの少なくとも何れか一方に基づいて前記抽出されるべき前記部分映像情報を決定する決定手段と、
    前記決定された前記部分映像情報を前記映像情報から抽出して前記要約情報を生成する生成手段と、
    を備え
    前記決定手段が、前記抽出されるべき部分映像情報の時間的長さを予め定められた時間的範囲内に設定し、また、前記抽出されるべき部分映像情報が決定されるときにその決定に際して基準となる音声区間の種類または時間的長さの少なくとも何れか一方に基づいて当該部分映像情報の重要度を設定し、
    前記生成手段が、前記重要度の順に総時間が前記要約時間になるように前記要約情報を生成することを特徴とする映像情報要約装置。
  2. 請求項1に記載の映像情報要約装置において、
    前記決定手段が、前記分類された複数の種類の音声区間の何れか一種類の、前記映像情報中における時間軸上の位置若しくは時間的長さの少なくとも何れか一方に基づいて前記部分映像情報の開始時刻または終了時刻の少なくとも何れか一方を決定することを特徴とする映像情報要約装置。
  3. 請求項1または2に記載の映像情報要約装置において、
    前記分類手段が、前記音声レベルに基づいて前記映像情報を少なくとも音声の無い無音区間および予め設定された音声レベルを有する騒音区間に分類することを特徴とする映像情報要約装置。
  4. 請求項3に記載の映像情報要約装置において、
    前記決定手段が、予め設定された時間的長さを有する前記無音区間の終了する時間軸上の位置を前記部分映像情報の開始時刻に設定することを特徴とする映像情報要約装置。
  5. 請求項4に記載の映像情報要約装置において、
    前記決定手段が、前記無音区間に基づいて前記部分映像情報の開始時刻が設定されたときに、当該無音区間の次に検出された他の無音区間の時間軸上の位置に基づいて当該部分映像情報の終了時刻を設定することを特徴とする映像情報要約装置。
  6. 請求項3に記載の映像情報要約装置において、
    前記決定手段が、予め設定された時間的長さを有する前記騒音区間の開始する時間軸上の位置に基づいて前記部分映像情報の開始時刻を設定することを特徴とする映像情報要約装置。
  7. 請求項6に記載の映像情報要約装置において、
    前記決定手段が、前記騒音区間に基づいて前記部分映像情報の開始時刻が設定されたときに、当該騒音区間の時間的長さに基づいて当該部分映像情報の終了時刻を設定することを特徴とする映像情報要約装置。
  8. 請求項1乃至7の何れか一項に記載の映像情報要約装置において、
    前記生成手段が、前記設定された部分映像情報の重要度に基づいて前記部分映像情報を抽出して前記映像情報を要約することを特徴とする映像情報要約装置。
  9. 請求項8に記載の映像情報要約装置において、
    前記決定手段が、前記騒音区間に基づいて設定する前記部分映像情報の重要度より前記無音区間に基づいて設定する前記部分映像情報の重要度を高くして設定することを特徴とする映像情報要約装置。
  10. 請求項8または9に記載の映像情報要約装置において、
    前記決定された複数の前記部分映像情報が時間的に重なり合う場合に、前記決定手段が、当該重なり合う部分映像情報を結合するとともに、結合した当該部分映像情報の重要度を各結合された部分映像情報の重要度に基づいて設定することを特徴とする映像情報要約装置。
  11. 音声情報が付帯されている映像情報から、前記音声情報に基づいて当該映像情報の一部である部分映像情報を1または複数個抽出し、当該抽出した部分映像情報に基づいて前記映像情報の時間長が短縮された要約情報を生成する映像情報要約方法において、
    前記音声情報における音声レベルに基づいて前記映像情報を複数の種類の音声区間に分類する分類処理工程と、
    前記要約情報の時間長である要約時間を決定する要約時間決定処理工程と、
    前記分類された複数の種類の音声区間の少なくとも何れか一種類の、前記映像情報中における時間軸上の位置若しくは時間的長さの少なくとも何れか一方に基づいて前記抽出されるべき前記部分映像情報を決定する決定処理工程と、
    前記決定された前記部分映像情報を前記映像情報から抽出して前記要約情報を生成する生成処理工程と、
    を含み、
    前記決定処理工程においては、前記抽出されるべき部分映像情報の時間的長さを予め定められた時間的範囲内に設定し、また、前記抽出されるべき部分映像情報が決定されるときにその決定に際して基準となる音声区間の種類または時間的長さの少なくとも何れか一方に基づいて当該部分映像情報の重要度を設定し、
    前記生成処理工程においては、前記重要度の順に総時間が前記要約時間になるように前記要約情報を生成することを特徴とする映像情報要約方法。
  12. 請求項11に記載の映像情報要約方法において、
    前記決定処理工程においては、前記分類された複数の種類の音声区間の何れか一種類の、前記映像情報中における時間軸上の位置若しくは時間的長さの少なくとも何れか一方に基づいて前記部分映像情報の開始時刻または終了時刻の少なくとも何れか一方が決定されることを特徴とする映像情報要約方法。
  13. 請求項11または12に記載の映像情報要約方法において、
    前記分類処理工程においては、前記音声レベルに基づいて前記映像情報が少なくとも音声の無い無音区間および予め設定された音声レベルを有する騒音区間に分類されることを特徴とする映像情報要約方法。
  14. 請求項11乃至13の何れか一項に記載の映像情報要約方法において、
    前記生成処理工程においては、前記設定された部分映像情報の重要度に基づいて前記部分映像情報が抽出されて前記映像情報が要約されることを特徴とする映像情報要約方法。
  15. コンピュータによって、音声情報が付帯されている映像情報から、前記音声情報に基づいて当該映像情報の一部である部分映像情報を1または複数個抽出し、当該抽出した部分映像情報に基づいて前記映像情報の時間長が短縮された要約情報を生成する映像情報要約プログラムであって、
    前記コンピュータを、
    前記音声情報における音声レベルに基づいて前記映像情報を複数の種類の音声区間に分類する分類手段、
    前記要約情報の時間長である要約時間を決定する要約時間決定手段、
    前記分類された複数の種類の音声区間の少なくとも何れか一種類の、前記映像情報中における時間軸上の位置若しくは時間的長さの少なくとも何れか一方に基づいて前記抽出されるべき前記部分映像情報を決定する決定手段、
    前記決定された前記部分映像情報を前記映像情報から抽出して前記要約情報を生成する生成手段、
    として機能させ、
    前記決定手段が、前記抽出されるべき部分映像情報の時間的長さを予め定められた時間的範囲内に設定し、また、前記抽出されるべき部分映像情報が決定されるときにその決定に際して基準となる音声区間の種類または時間的長さの少なくとも何れか一方に基づいて当該部分映像情報の重要度を設定し、
    前記生成手段が、前記重要度の順に総時間が前記要約時間になるように前記要約情報を生成することを特徴とする映像情報要約プログラム。
  16. 請求項15に記載の映像情報要約プログラムにおいて、
    前記コンピュータを、
    前記分類された複数の種類の音声区間の何れか一種類の、前記映像情報中における時間軸上の位置若しくは時間的長さの少なくとも何れか一方に基づいて前記部分映像情報の開始時刻または終了時刻の少なくとも何れか一方を決定する決定手段、
    として機能させることを特徴とする映像情報要約プログラム。
  17. 請求項15または16に記載の映像情報要約方法において、
    前記コンピュータを、
    前記音声レベルに基づいて前記映像情報を少なくとも音声の無い無音区間および予め設定された音声レベルを有する騒音区間に分類する分類手段、
    として機能させることを特徴とする映像情報要約プログラム。
  18. 請求項15乃至17の何れか一項に記載の映像情報要約プログラムにおいて、
    前記コンピュータを、
    前記設定された部分映像情報の重要度に基づいて前記部分映像情報を抽出して前記映像情報を要約する生成手段、
    として機能させることを特徴とする映像情報要約プログラム。
JP2001304361A 2001-06-26 2001-09-28 映像情報要約装置、映像情報要約方法および映像情報要約処理プログラム Expired - Fee Related JP4546682B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2001304361A JP4546682B2 (ja) 2001-06-26 2001-09-28 映像情報要約装置、映像情報要約方法および映像情報要約処理プログラム
US10/179,889 US20020197053A1 (en) 2001-06-26 2002-06-26 Apparatus and method for summarizing video information, and processing program for summarizing video information
EP02254466A EP1271359A3 (en) 2001-06-26 2002-06-26 Apparatus and method for summarizing video information, and processing program for summarizing video information

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001193465 2001-06-26
JP2001-193465 2001-06-26
JP2001304361A JP4546682B2 (ja) 2001-06-26 2001-09-28 映像情報要約装置、映像情報要約方法および映像情報要約処理プログラム

Publications (2)

Publication Number Publication Date
JP2003087728A JP2003087728A (ja) 2003-03-20
JP4546682B2 true JP4546682B2 (ja) 2010-09-15

Family

ID=26617584

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001304361A Expired - Fee Related JP4546682B2 (ja) 2001-06-26 2001-09-28 映像情報要約装置、映像情報要約方法および映像情報要約処理プログラム

Country Status (3)

Country Link
US (1) US20020197053A1 (ja)
EP (1) EP1271359A3 (ja)
JP (1) JP4546682B2 (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2386739B (en) * 2002-03-19 2005-06-29 British Broadcasting Corp An improved method and system for accessing video data
KR100624848B1 (ko) * 2003-05-02 2006-09-18 엘지전자 주식회사 비디오 콘텐트 자동 리뷰 시스템
JP2005108193A (ja) 2003-09-09 2005-04-21 Canon Inc 動画システム、動画抽出装置及び動画抽出方法
JP4124110B2 (ja) * 2003-11-26 2008-07-23 ソニー株式会社 コンテンツ視聴支援装置及びコンテンツ視聴支援方法、並びにコンピュータ・プログラム
EP1538536A1 (en) 2003-12-05 2005-06-08 Sony International (Europe) GmbH Visualization and control techniques for multimedia digital content
TWI259719B (en) * 2004-01-14 2006-08-01 Mitsubishi Electric Corp Apparatus and method for reproducing summary
TW200537941A (en) * 2004-01-26 2005-11-16 Koninkl Philips Electronics Nv Replay of media stream from a prior change location
EP1578141A1 (en) * 2004-03-19 2005-09-21 Deutsche Thomson-Brandt Gmbh Method and apparatus for adapting the speed or pitch of replayed or received digital audio signals
WO2005125196A1 (ja) * 2004-06-22 2005-12-29 Pioneer Corporation 情報記録媒体、情報記録装置及び方法、情報再生装置及び方法、並びにコンピュータプログラム
JP4758161B2 (ja) * 2004-07-30 2011-08-24 パナソニック株式会社 ダイジェストの作成方法及び装置
KR101385087B1 (ko) * 2004-08-10 2014-04-14 소니 주식회사 정보 신호 처리 방법, 정보 신호 처리 장치 및 컴퓨터프로그램 기록 매체
US20070280633A1 (en) * 2004-09-21 2007-12-06 Takeshi Nakamura Video Display Apparatus, Video Display Method, and Video Display Program
JP2006217163A (ja) * 2005-02-02 2006-08-17 Hitachi Ltd 録画再生システム
EP1720166A1 (en) 2005-05-04 2006-11-08 Deutsche Thomson-Brandt Gmbh Method and apparatus for authoring a 24p audio/video data stream by supplementing it with additional 50i format data items
EP1890281A4 (en) * 2005-06-08 2009-12-09 Panasonic Corp DEVICE AND PROGRAM FOR REPRODUCING GRAPHICAL INTERFACE CONTENT
JP2007094234A (ja) 2005-09-30 2007-04-12 Sony Corp データ記録再生装置、データ記録再生方法及びそのプログラム
KR100650407B1 (ko) * 2005-11-15 2006-11-29 삼성전자주식회사 멀티 모달 기반의 고속 비디오 요약 생성 방법 및 그 장치
JP4550723B2 (ja) * 2005-11-18 2010-09-22 日本電信電話株式会社 データ編集装置とそのプログラム
WO2007073347A1 (en) * 2005-12-19 2007-06-28 Agency For Science, Technology And Research Annotation of video footage and personalised video generation
JP4346613B2 (ja) * 2006-01-11 2009-10-21 株式会社東芝 映像要約装置及び映像要約方法
JP4961760B2 (ja) * 2006-02-06 2012-06-27 パナソニック株式会社 コンテンツ出力装置、及びコンテンツ出力方法
JP4698453B2 (ja) * 2006-02-28 2011-06-08 三洋電機株式会社 コマーシャル検出装置、映像再生装置
KR101158435B1 (ko) * 2006-03-03 2012-06-22 엘지전자 주식회사 이동통신 단말기와 우선순위 정보 데이터를 이용한 방송시스템 및 이를 이용한 방송 방법
KR100793191B1 (ko) * 2006-06-13 2008-01-10 엘지전자 주식회사 디지털 영상 기기에서의 타이틀 프리뷰 제어방법
JP2008028985A (ja) * 2006-06-22 2008-02-07 Matsushita Electric Ind Co Ltd コンテンツ視聴支援回路およびコンテンツ視聴支援装置
WO2008056622A1 (en) * 2006-11-06 2008-05-15 Panasonic Corporation Receiver
KR20080105387A (ko) * 2007-05-30 2008-12-04 삼성전자주식회사 스포츠 동영상 요약 방법 및 장치
JP4591586B2 (ja) * 2008-09-22 2010-12-01 ソニー株式会社 表示制御装置、表示制御方法、およびプログラム
JP2010266880A (ja) * 2010-06-23 2010-11-25 Sony Corp 携帯端末装置、情報処理方法、及びプログラム
JP5726626B2 (ja) * 2011-05-13 2015-06-03 パイオニア株式会社 再生区間抽出方法、プログラムおよび記憶媒体、並びに再生区間抽出装置および輸送機器搭載装置
US10764532B2 (en) * 2012-10-30 2020-09-01 Viavi Solutions Inc. Method and system for locating ingress utilizing customer premises equipment
CN106331562B (zh) * 2015-06-16 2020-04-24 南宁富桂精密工业有限公司 云端服务器、控制设备及音频视频同步方法
KR20170098079A (ko) * 2016-02-19 2017-08-29 삼성전자주식회사 전자 장치 및 전자 장치에서의 비디오 녹화 방법
CN107613236B (zh) * 2017-09-28 2021-01-05 盐城市聚龙湖商务集聚区发展有限公司 一种音像录制方法及终端、存储介质
US11089356B2 (en) 2019-03-26 2021-08-10 Rovi Guides, Inc. Systems and methods for media content hand-off based on type of buffered data
US11490159B2 (en) 2020-11-30 2022-11-01 Rovi Guides, Inc. Methods and systems for viewing missed media content

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09214879A (ja) * 1996-02-07 1997-08-15 Toshiba Corp 動画像処理方法
JPH10172245A (ja) * 1996-12-13 1998-06-26 Sony Corp 情報記録装置および方法、並びに情報再生装置および方法
JPH10232884A (ja) * 1996-11-29 1998-09-02 Media Rinku Syst:Kk 映像ソフトウェア処理方法及び映像ソフトウェア処理装置
JP2000253351A (ja) * 1999-03-01 2000-09-14 Mitsubishi Electric Corp 動画要約装置および動画要約作成プログラムを記録したコンピュータ読み取り可能な記録媒体および動画再生装置および動画再生プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000299829A (ja) * 1999-04-13 2000-10-24 Canon Inc 画像処理装置及び方法
JP2000308008A (ja) * 1999-03-12 2000-11-02 Fuji Xerox Co Ltd ビデオのセグメント重要度を決定する方法及びフレーム・セットを限定領域にパックする方法
JP2001126050A (ja) * 1999-10-27 2001-05-11 Sharp Corp ニュース記事切り出し装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3028738B2 (ja) * 1994-11-10 2000-04-04 富士ゼロックス株式会社 文書共通論理情報編集装置
US6160950A (en) * 1996-07-18 2000-12-12 Matsushita Electric Industrial Co., Ltd. Method and apparatus for automatically generating a digest of a program
US6198906B1 (en) * 1996-10-07 2001-03-06 Sony Corporation Method and apparatus for performing broadcast operations
US6363380B1 (en) * 1998-01-13 2002-03-26 U.S. Philips Corporation Multimedia computer system with story segmentation capability and operating program therefor including finite automation video parser
US6819863B2 (en) * 1998-01-13 2004-11-16 Koninklijke Philips Electronics N.V. System and method for locating program boundaries and commercial boundaries using audio categories
DE19808300C2 (de) * 1998-02-27 2000-06-08 Bock Orthopaed Ind Rollstuhl

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09214879A (ja) * 1996-02-07 1997-08-15 Toshiba Corp 動画像処理方法
JPH10232884A (ja) * 1996-11-29 1998-09-02 Media Rinku Syst:Kk 映像ソフトウェア処理方法及び映像ソフトウェア処理装置
JPH10172245A (ja) * 1996-12-13 1998-06-26 Sony Corp 情報記録装置および方法、並びに情報再生装置および方法
JP2000253351A (ja) * 1999-03-01 2000-09-14 Mitsubishi Electric Corp 動画要約装置および動画要約作成プログラムを記録したコンピュータ読み取り可能な記録媒体および動画再生装置および動画再生プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000308008A (ja) * 1999-03-12 2000-11-02 Fuji Xerox Co Ltd ビデオのセグメント重要度を決定する方法及びフレーム・セットを限定領域にパックする方法
JP2000299829A (ja) * 1999-04-13 2000-10-24 Canon Inc 画像処理装置及び方法
JP2001126050A (ja) * 1999-10-27 2001-05-11 Sharp Corp ニュース記事切り出し装置

Also Published As

Publication number Publication date
EP1271359A3 (en) 2004-08-25
JP2003087728A (ja) 2003-03-20
EP1271359A2 (en) 2003-01-02
US20020197053A1 (en) 2002-12-26

Similar Documents

Publication Publication Date Title
JP4546682B2 (ja) 映像情報要約装置、映像情報要約方法および映像情報要約処理プログラム
JP4615166B2 (ja) 映像情報要約装置、映像情報要約方法及び映像情報要約プログラム
JP4081120B2 (ja) 記録装置、記録再生装置
JP4757876B2 (ja) ダイジェスト作成装置およびそのプログラム
US9226028B2 (en) Method and system for altering the presentation of broadcast content
JP4426743B2 (ja) 映像情報要約装置、映像情報要約方法および映像情報要約処理プログラム
EP1924092A1 (en) Content replay apparatus, content reproducing apparatus, content replay method, content reproducing method, program and recording medium
JPWO2005069172A1 (ja) 要約再生装置および要約再生方法
JP2007522722A (ja) 先行変更位置からのメディア・ストリームの再生
US20070071406A1 (en) Video recording and reproducing apparatus and video reproducing apparatus
JP2008306311A (ja) ダイジェスト生成装置、方法及びプログラム
JP2007060060A (ja) 再生システム、再生装置、再生方法、情報処理装置、情報処理方法、およびプログラム
JP2007306327A (ja) 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置
JPWO2005124782A1 (ja) Avコンテンツ処理装置、avコンテンツ処理方法、avコンテンツ処理プログラムおよびavコンテンツ処理装置に用いる集積回路
JP2007053510A (ja) 記録再生装置、再生装置、音量自動調整方法および音量自動調整プログラム
JP2006270233A (ja) 信号処理方法及び信号記録再生装置
JPWO2007039995A1 (ja) ダイジェスト作成装置およびそのプログラム
JP2007288300A (ja) 映像音声再生装置
JP4268925B2 (ja) 要約再生装置、要約再生方法、要約再生プログラムおよびそのプログラムが記録された情報記録媒体
JP5682167B2 (ja) 映像音声記録再生装置、および映像音声記録再生方法
US20060263062A1 (en) Method of and apparatus for setting video signal delimiter information using silent portions
JP4384564B2 (ja) 映像区間検出装置、映像制作装置、映像区間検出プログラム、及び映像制作プログラム
JPH11317058A (ja) 再生装置及び記録再生装置
JP2010141544A (ja) 記録再生装置、記録再生方法、およびプログラム
JP2007095135A (ja) 映像記録再生装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080227

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100629

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100702

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130709

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees