JP4459179B2 - 情報処理装置及びその方法 - Google Patents
情報処理装置及びその方法 Download PDFInfo
- Publication number
- JP4459179B2 JP4459179B2 JP2006058751A JP2006058751A JP4459179B2 JP 4459179 B2 JP4459179 B2 JP 4459179B2 JP 2006058751 A JP2006058751 A JP 2006058751A JP 2006058751 A JP2006058751 A JP 2006058751A JP 4459179 B2 JP4459179 B2 JP 4459179B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- key
- information
- unit
- marker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/632—Query formulation
- G06F16/634—Query by example, e.g. query by humming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7834—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
- G11B27/32—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
- G11B27/322—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier used signal is digitally coded
Description
本発明の第1の実施形態に係る映像音声処理装置について図1から図9に基づいて説明する。本実施形態に係る映像音声処理装置は、利用者が映像音声データを再生、編集、または、検索するときに、前記利用者が希望する動作で再生、編集、検索ができるように支援する支援データであるメタデータを生成する場合に、メタデータの元となる検索キーとキー関連データよりなるキーデータを生成する装置である。
図1は、本実施形態に係る映像音声処理装置の構成を示すものである。
図2は、前記処理結果として生成された検索キーとなる音声パターンデータA〜Dと共にキーデータ管理部10において管理される情報の例を示すものである。ここでは、キーの名称、タイトルの名称、属性、照合方法及びパラメータが管理されている。以下、これらのデータをキー関連データという。
検索キーA(音声パターンデータA)を生成するために、記録媒体90に記録されている映像音声データの中の一部分を指定したときに、どのように属性を付加させるかについて図4の模式図に基づいて説明する。なお、この属性は、キー関連データ取得部55から入力した情報である。この属性をどのように取得するかはキー関連データ取得部55の処理に基づいて後から詳しく説明する。
検索キーB(音声パターンデータB)を生成するために、記録媒体90に記録されている映像音声データの中の一部分を指定したときに、どのように上記属性を付加させるかについて図5の模式図に基づいて説明する。なお、この属性は、キー関連データ取得部55から入力した情報である。この属性をどのように取得するかはキー関連データ取得部55の処理に基づいて後から詳しく説明する。
検索キーC(音声パターンデータC)を生成するために、記録媒体90に記録されている映像音声データの中の一部分を指定したときに、どのように上記属性を付加させるかについて図6の模式図に基づいて説明する。なお、この属性は、キー関連データ取得部55から入力した情報である。この属性をどのように取得するかはキー関連データ取得部55の処理に基づいて後から詳しく説明する。
検索キーD(音声パターンデータD)を生成するために、記録媒体90に記録されている映像音声データの中の一部分を指定したときに、どのように上記属性を付加させるかについて図7の模式図に基づいて説明する。なお、この属性は、キー関連データ取得部55から入力した情報である。この属性をどのように取得するかはキー関連データ取得部55の処理に基づいて後から詳しく説明する。
次に、キー関連データ取得部55における処理の流れを、図8のフローチャートを使用して説明する。
次に、ステップS131におけるキーの属性設定処理の詳細について、図9のフローチャートを使用して説明する。
図8のステップS113において、始終端に一致するチャプタCcが取得されているとき、キー名称=ベース名(チャプタ名(Cc))、照合方法=完全一致、動作=チャプタ、チャプタ始端=検出区間始端、チャプタ終端=検出区間終端、チャプタ名=既定名前規則(キー名称)、の属性がそれぞれ設定される(ステップS201)。
ステップS113において、始終端に一致する区間マーカMcpが取得されているとき、キー名称=ベース名(マーカ名(Mcp))、照合方法=完全一致、動作=区間マーカ、マーカ始端=検出区間始端、マーカ終端=検出区間終端、マーカ名=既定名前規則(キー名称)、の属性がそれぞれ設定される(ステップS202)。
図8のステップS111において、始端に一致するチャプタ境界があるとき、照合方法=前方一致、動作=チャプタ、チャプタ分割点=検出区間始端、の属性がそれぞれ設定される(ステップS211)。
図8のステップS111において、始端に一致する点マーカMbmが取得されているとき、照合方法=前方一致、動作=点マーカ、マーカ点=検出区間始端、の属性がそれぞれ設定される(ステップS221)。
図8のステップS112において、終端に一致するチャプタ境界があるとき、照合方法=後方一致、動作=チャプタ、チャプタ分割点=検出区間終端、の属性がそれぞれ設定される(ステップS231)。
図8のステップS112において、終端に一致する点マーカMemが取得されているとき、照合方法=後方一致、動作=点マーカ、マーカ点=検出区間終端、の属性がそれぞれ設定される(ステップS241)。
図8のステップS112において、終端に一致する区間マーカMepが取得されているとき、照合方法=後方一致、動作=区間マーカ、マーカ区間=検出区間終端〜マーカ長(Mep)、の属性がそれぞれ設定される(ステップS243)。
本発明の第2の実施形態に係る音声処理装置について図10から図12に基づいて説明する。
図10は、本実施形態に係る音声処理装置の構成を示すものである。
図11は、前記処理結果として生成された検索キーとなる音声パターンデータと共に本実施形態のキーデータ管理部10において管理されるキー関連データの例を示すものである。
検索キーE(音声パターンデータE)を生成するために、記録媒体90に記録されている音声データの中の一部分を指定したときに、どのように上記属性を付加させるかについて説明する。なお、この属性は、キー関連データ取得部55から入力した情報である。
検索キーH(音声パターンデータH)を生成するために、記録媒体90に記録されている音声データの中の一部分を指定したときに、どのように上記属性を付加させるかについて説明する。なお、この属性は、キー関連データ取得部55から入力した情報である。
検索キーJ1(音声パターンデータJ1)と検索キーJ2(音声パターンデータJ2)を生成するために、記録媒体90に記録されている音声データの中の一部分を指定したときに、どのように上記属性を付加させるかについて説明する。なお、この属性は、キー関連データ取得部55から入力した情報である。
本発明の第3の実施形態に係る映像音声処理装置について図13から図17に基づいて説明する。
図13は、本実施形態に係る映像音声処理装置の構成を示すものである。
検索キーAに対しては、「前方一致」と「BGM」という情報に従って、人の声の周波数領域をマスクする等でBGMの音楽成分に着目して一致度合いを評価し、検索キーの先頭からパターンが一致するところまでを終端フリーで検出するアルゴリズムを使用する。
照合結果記録指示部35は、キー照合部30において検出されたキーデータをキーデータ管理部10より取得する。そして、このキーデータにおける検索キーの属性に応じて、再生、編集、検索が簡単にできるようにメタデータとして記録媒体90に記録する。記録媒体90において記録されるメタデータは、例えばDVD(Digital Versatile Disk)のVR(Video Recording)モードで規定される構造になっている。
キー照合部30において検索キーAが検出されたときに、照合結果記録指示部35が「BGM属性1」の規定の動作に従って記録指示動作を記録媒体90に対して行い、図14は、その記録媒体90に記録された情報を示す模式図である。
キー照合部30において検索キーBが検出されたときに、照合結果記録指示部35が「オープニング音楽属性1」の規定の動作に従って記録指示動作を記録媒体90に対して行い、図15は、その記録媒体90に記録された情報を示す模式図である。
キー照合部30において検索キーCが検出されたときに、照合結果記録指示部35が「コーナー音楽属性1」の規定の動作に従って記録指示動作を記録媒体90に対して行い、図16は、その記録媒体90に記録された情報を示す模式図である。
キー照合部30において検索キーDが検出されたときに、照合結果記録指示部35が「競技開始イベント属性1」の規定の動作に従って記録指示動作を記録媒体90に対して行い、図17は、その記録媒体90に記録された情報を示す模式図である。
本発明の第4の実施形態に係る音声処理装置について図18に基づいて説明する。
図18は、本実施形態に係る音声処理装置の構成を示すものである。
キー生成の結果、図11のような情報が管理されているものとして、キー検索の説明をする。
照合結果記録指示部35は、キー照合部30において検出されたキーデータをキーデータ管理部10より取得する。そして、このキーデータにおける検索キーの属性に応じて、再生、編集、検索が簡単にできるようにメタデータとして記録媒体90に記録する。
例えば、検索キーEが検出されたときに、「BGM属性2」の規定の動作に従って、「道路情報ラジオ」番組における「道路渋滞情報」の区間が、複数回検出されて、それぞれ放送された時刻に応じて「道路渋滞情報−9:55」「道路渋滞情報−10:28」「道路渋滞情報−10:56」等という名前のマーカが検出された区間についている。これにより、例えば、道路渋滞情報だけを最新の情報から順に抜き出して聞く等が可能となる。
検索キーHが検出されたときに、「競技注目イベント属性2」の規定の動作に従って、「高校対抗野球大会」番組における「金属バット音」が検出され、各々検出された箇所の8秒前にマーカがついているので、打撃のシーンのみを直前の投球動作から順次再生することが可能となる。
検索キーJ1とJ2が検出されたときに、「音楽開始属性2」と「音楽終了属性2」の規定の動作の組み合わせによって、「曲名“A”」の音楽の開始と終了の両方でチャプタ分割され、音楽の区間が「曲名“A”」のチャプタとなる。
本発明の第5の実施形態に係る映像音声処理装置について図19に基づいて説明する。
本発明の第6の実施形態に係る音声処理装置について図20に基づいて説明する。
本発明の第7の実施形態に係る映像音声処理装置について図23、図24に基づいて説明する。
図23は、本実施形態の映像音声処理装置の構成を示すブロック図である。
図24は、本実施形態の別の構成を示すブロック図である。
本発明の第8の実施形態に係る映像音声処理装置について図25、図26、図27に基づいて説明する。
図25は、本実施形態の映像音声処理装置の第1の構成を示すブロック図である。
図26は、本実施形態の第2の構成を示すブロック図である。
図27は、本実施形態のさらに別の第3の構成を示すブロック図である。
本発明の第9の実施形態に係る映像音声処理装置について図28、図29に基づいて説明する。
図28は、本実施形態の映像音声処理装置の構成を示すブロック図である。
図29は、本実施形態の映像音声処理装置の別の構成を示すブロック図である。
本発明の第10の実施形態に係る音声処理装置について図30、図31に基づいて説明する。
図30は、本実施形態に係る音声処理装置の構成を示すブロック図である。
図31は、本実施形態の別の構成を示すブロック図である。
本発明の第11の実施形態に係る音声処理装置について図32に基づいて説明する。
本発明の第12の実施形態に係る音声処理装置について図33に基づいて説明する。
本発明の第13の実施形態に係る映像音声処理装置について図34、図35、図36及び図37に基づいて説明する。
図34は、本実施形態に係る映像音声処理装置の構成を示すものである。
本構成におけるキー生成に係る構成要素は、第7の実施形態の図24と同様のものであるが、図23に示す構成であっても構わない。
(3−1)キー検索に係る構成要素の第1の構成
図35は、本実施形態におけるキー検索に係る構成要素の第1の構成を示すブロック図である。
図37は、本実施形態におけるキー検索に係る構成要素の第2の構成を示すブロック図である。
図38は、本実施形態におけるキー検索に係る構成要素の第3の構成を示すブロック図である。
図40は、本実施形態におけるキー検索に係る構成要素の第4の構成を示すブロック図である。
図42は、本実施形態におけるキー検索に係る構成要素の第5の構成を示すブロック図である。
本発明の第14の実施形態に係る映像音声処理装置について図43、図44及び図45に基づいて説明する。
図43は、本実施形態に係る映像音声処理装置の構成を示すものである。
本実施形態におけるキー生成に係る構成要素は、第7の実施形態の図24と同様のものを例示しているが、第13の実施形態の場合と同様に、第7乃至第9の実施形態に記載したいずれの構成であっても構わない。すなわち、第1支援データ入力部66に代えてまたは加えて第1支援データ生成部65を備えたり、記録媒体91Bに記録済みの映像音声データについて処理を行う第1映像取得部48に代えて、外部から取得した映像音声データについて記録媒体91Aに記録及び処理を行う第1映像取得部43を備えたりしてもよい。
図44は、本実施形態におけるキー検索に係る構成要素を示すブロック図である。
次に、本実施形態に係る映像音声処理装置における処理について、図46〜図50に基づいて説明する。
続いて、本実施形態に係る映像音声処理装置における処理の具体例について、図51に基づいて説明する。
本発明は上記各実施形態に限らず、その主旨を逸脱しない限り種々に変更することができる。
21 第2音声データ取得部
22 第2音声データ分離部
23 第1音声データ取得部
25 第1音声データ分離部
26 第2音声データ取得部
27 音声データ指定部
28 第1音声データ取得部
30 キー照合部
31 キー生成部
35 照合結果記録指示部
39 照合結果表示制御部
41 第2映像データ取得部
43 第1映像データ取得部
46 第2映像データ取得部
47 映像データ指定部
48 第1映像データ取得部
55 キー関連データ取得部
61 キー指定情報生成部
62 第2支援データ生成部
65 第1支援データ生成部
66 第1支援データ入力部
81 データ取得制御部
86 データ取得制御部
90 記録媒体
91 記録媒体(第1コンテンツ)
92 記録媒体(第2コンテンツ)
Claims (36)
- 利用者が映像音声データ、または、音声データのみからなる利用対象データを再生、編集、または、検索するときに、前記利用者が希望する動作で再生、編集、検索ができるように支援する支援データを生成する情報処理装置において、
前記支援データを生成するためのキー音声データを取得するキー音声データ取得部と、
前記キー音声データの全部または一部区間を指定するためのキー指定情報を入力するキー指定情報入力部と、
前記キー指定情報に基づいて、前記キー音声データの全部または一部区間を切り出して音声パターンデータを検索キーとして生成するキー生成部と、
前記キー指定情報によって指定されたキー音声データの区間に関連するキー関連データを取得するキー関連データ取得部と、
前記音声パターンデータと前記キー関連データとを含むキーデータの中の前記音声パターンデータと、前記利用対象データとを照合して支援データを生成して記録媒体に記録する支援データ生成部と、
を具備することを特徴とする情報処理装置。 - 前記支援データ生成部は、
前記利用対象データから音声データのみを利用対象音声データとして取得する音声データ取得部と、
前記音声パターンデータに前記キー関連データを付加してキーデータとして記録するキーデータ管理部と、
前記利用対象音声データと前記音声パターンデータとを比較し、前記利用対象データの中でどの位置、または、区間が前記音声パターンデータに該当するかを検出し、該当した前記利用対象音声データにおける前記位置、または、前記区間を表す照合結果情報を出力するキー照合部と、
前記出力された照合結果情報を前記支援データとして前記記録媒体に記録させる照合結果記録指示部と、
を具備することを特徴とする請求項1記載の情報処理装置。 - 前記利用対象データが映像音声データであり、
前記音声データ取得部は、前記利用対象データから音声データを分離して、この音声データを利用対象音声データとして取得する
ことを特徴とする請求項2記載の情報処理装置。 - 前記キーデータの中の前記キー関連データは、前記再生、編集、検索時の動作に関連する動作属性情報を含み、
前記照合結果記録指示部は、前記照合結果情報と前記動作属性情報に従って前記記録媒体に前記支援データを記録する
ことを特徴とする請求項2または3記載の情報処理装置。 - 前記キー指定情報を基準として、前記キー音声データにおけるマーカ位置または分割位置を検索するキーデータ検索部をさらに具備し、
前記キー関連データ取得部は、前記キーデータ検索部において検索されたマーカまたは分割の情報をキー関連データとして取得する
ことを特徴とする請求項4記載の情報処理装置。 - 前記キーデータ検索部は、前記キー指定情報において指定された範囲に一致するマーカ範囲または分割単位を検索し、マーカまたは分割の情報として取得する
ことを特徴とする請求項5記載の情報処理装置。 - 前記キーデータ検索部は、前記キー指定情報において指定された範囲の始端または終端のいずれか一方に一致するマーカ位置または分割位置を検索し、前記マーカ位置、前記マーカ位置を含むマーカ範囲、前記分割位置、前記分割位置を含む分割単位のいずれかをマーカまたは分割の情報として取得する
ことを特徴とする請求項5記載の情報処理装置。 - 前記キーデータ検索部は、前記キー指定情報において指定された範囲の始端または終端のいずれか一方に近接するマーカ位置または分割位置を検索し、前記マーカ位置、前記マーカ位置を含むマーカ範囲、前記分割位置、前記分割位置を含む分割単位のいずれかをマーカまたは分割の情報として取得する
ことを特徴とする請求項5記載の情報処理装置。 - 前記キー関連データ取得部は、前記キーデータ検索部において検索されたマーカまたは分割の位置情報と前記キー指定情報において指定された範囲との位置関係に基づいて、前記照合時の動作を指定する動作属性情報を生成する
ことを特徴とする請求項5から8のいずれか一項に記載の情報処理装置。 - 前記キー関連データ取得部は、前記キーデータ検索部において検索されたマーカの位置情報と前記キー指定情報において指定された範囲との位置関係に基づいて、前記照合結果情報において検出された区間を基準とした記録位置の決定方法を規定する動作属性情報を生成し、
前記照合結果記録指示部は、前記照合結果情報と前記動作属性情報に従って、前記利用対象データ中の位置を決定し、前記決定された位置に前記マーカを支援データとして記録する
ことを特徴とする請求項5から8のいずれか一項に記載の情報処理装置。 - 前記キー関連データ取得部は、前記キーデータ検索部において検索された分割の位置情報と前記キー指定情報において指定された範囲との位置関係に基づいて、前記照合結果情報において検出された区間を基準とした記録位置の決定方法を規定する動作属性情報を生成し、
前記照合結果記録指示部は、前記照合結果情報と前記動作属性情報に従って、前記利用対象データ中の位置を決定し、前記決定された位置で前記利用対象データを分割するという情報を支援データとして記録する
ことを特徴とする請求項5から8のいずれか一項に記載の情報処理装置。 - 前記キー関連データ取得部は、前記照合結果情報に関連するテキスト情報の生成方法を規定する動作属性情報を生成し、
前記照合結果記録指示部は、前記照合結果情報と前記動作属性情報に従って、前記照合結果情報に関連するテキスト情報を生成し、前記記録された各マーカまたは前記分割部分と関連付けて、前記生成されたテキスト情報を支援データとして記録する
ことを特徴とする請求項10または11記載の情報処理装置。 - 前記キーデータは、前記キーデータに関連するテキスト情報を含み、
前記照合結果記録指示部は、前記規定されたテキスト情報の生成方法に従って、前記キーデータに関連するテキスト情報に基づいて前記照合結果情報に関連するテキスト情報を生成する
ことを特徴とする請求項12記載の情報処理装置。 - 前記キー関連データ取得部は、前記キーデータ検索部において検索されたマーカまたは分割の情報に関連するテキスト情報を取得し、
前記照合結果記録指示部は、前記規定されたテキスト情報の生成方法に従って、前記マーカまたは分割の情報に関連するテキスト情報に基づいて前記照合結果情報に関連するテキスト情報を生成し、前記記録された各マーカまたは前記分割された各部分と関連付けて、前記生成されたテキスト情報を支援データとして記録する
ことを特徴とする請求項12記載の情報処理装置。 - 前記キーデータは、前記キーデータに関連するテキスト情報を含み、
前記照合結果記録指示部は、予め規定されたテキスト情報の生成方法に従って、前記キーデータに関連するテキスト情報に基づいて前記照合結果情報に関連するテキスト情報を生成し、
前記照合結果情報に関連するテキスト情報を支援データとして記録する
ことを特徴とする請求項2または3に記載の情報処理装置。 - 前記キー関連データ取得部は、前記キー指定情報に基づいて、前記キー音声データに関連するタイトル情報を取得し、
前記照合結果記録指示部は、前記照合結果情報に含まれる一連の利用対象データ全体に関連するタイトル情報を支援データとして記録する
ことを特徴とする請求項15記載の情報処理装置。 - 前記支援データが、メタデータである
ことを特徴とする請求項1から16のいずれか一項に記載の情報処理装置。 - 利用者が映像音声データ、または、音声データのみからなる利用対象データを再生、編集、または、検索するときに、前記利用者が希望する動作で再生、編集、検索ができるように支援する支援データを生成する情報処理方法において、
前記支援データを生成するためのキー音声データを取得し、
前記キー音声データの全部または一部区間を指定するためのキー指定情報を入力し、
前記キー指定情報に基づいて、前記キー音声データの全部または一部区間を切り出して音声パターンデータを検索キーとして生成し、
前記キー指定情報によって指定されたキー音声データの区間に関連するキー関連データを取得し、
前記音声パターンデータと前記キー関連データとを含むキーデータの中の前記音声パターンデータと、前記利用対象データとを照合して支援データを生成して記録媒体に記録する
ことを特徴とする情報処理方法。 - 利用者が映像音声データ、または、音声データのみからなる利用対象データを再生、編集、または、検索するときに、前記利用者が希望する動作で再生、編集、検索ができるように支援する支援データをコンピュータに生成を実現させるための情報処理プログラムにおいて、
前記コンピュータに、
前記支援データを生成するためのキー音声データを取得するキー音声データ取得機能と、
前記キー音声データの全部または一部区間を指定するためのキー指定情報を入力するキー指定情報入力機能と、
前記キー指定情報に基づいて、前記キー音声データの全部または一部区間を切り出して音声パターンデータを検索キーとして生成するキー生成機能と、
前記キー指定情報によって指定されたキー音声データの区間に関連するキー関連データを取得するキー関連データ取得機能と、
前記音声パターンデータと前記キー関連データとを含むキーデータの中の前記音声パターンデータと、前記利用対象データとを照合して支援データを生成して記録媒体に記録する支援データ生成機能と、
を実現させるための情報処理プログラム。 - 利用者が映像音声データ、または、音声データのみからなる利用対象データを再生、編集、または、検索するときに、前記利用者が希望する動作で再生、編集、検索ができるように支援する支援データを生成する情報処理装置において、
第1の利用対象データに関する第1の支援データを入力する第1支援データ入力部と、
前記第1の支援データに関連するキー音声データを取得するキー音声データ取得部と、
前記入力された第1の支援データに基づいて前記キー音声データの一部区間を選択するキー指定情報を生成するキー指定情報生成部と、
前記キー指定情報に基づいて、前記キー音声データの一部区間を切り出して音声パターンデータを検索キーとして生成するキー生成部と、
前記キー指定情報によって指定されたキー音声データの区間に関連するキー関連データを取得するキー関連データ取得部と、
前記音声パターンデータと前記キー関連データとを含むキーデータの中の前記音声パターンデータと、前記利用対象データとを照合して第2の支援データを生成して記録媒体に記録する第2支援データ生成部と、
を具備することを特徴とする情報処理装置。 - 利用者が映像音声データ、または、音声データのみからなる利用対象データを再生、編集、または、検索するときに、前記利用者が希望する動作で再生、編集、検索ができるように支援する支援データを生成する情報処理装置において、
第1の支援データを生成するためのキー音声データを取得するキー音声データ取得部と、
前記キー音声データの変化点を検出し、前記第1の支援データを生成する第1支援データ生成部と、
前記生成された第1の支援データに基づいて前記キー音声データの一部区間を選択するキー指定情報を生成するキー指定情報生成部と、
前記キー指定情報に基づいて、前記キー音声データの一部区間を切り出して音声パターンデータを検索キーとして生成するキー生成部と、
前記キー指定情報によって指定されたキー音声データの区間に関連するキー関連データを取得するキー関連データ取得部と、
前記音声パターンデータと前記キー関連データとを含むキーデータの中の前記音声パターンデータと、前記利用対象データとを照合して第2の支援データを生成して記録媒体に記録する第2支援データ生成部と、
を具備することを特徴とする情報処理装置。 - 前記第2支援データ生成部は、
前記利用対象データから音声データのみを利用対象音声データとして取得する音声データ取得部と、
前記音声パターンデータに前記キー関連データを付加してキーデータとして記録するキーデータ管理部と、
前記利用対象音声データと前記音声パターンデータとを比較し、前記利用対象データの中でどの位置、または、区間が前記音声パターンデータに該当するかを検出し、該当した前記利用対象音声データにおける前記位置、または、前記区間を表す照合結果情報を出力するキー照合部と、
前記出力された照合結果情報を前記第2の支援データとして前記記録媒体に記録させる照合結果記録指示部と、
を具備することを特徴とする請求項20または21記載の情報処理装置。 - 前記利用対象データが映像音声データであり、
前記音声データ取得部は、前記利用対象データから音声データを分離して、この音声データを利用対象音声データとして取得する
ことを特徴とする請求項22記載の情報処理装置。 - 前記キーデータの中の前記キー関連データは、前記再生、編集、検索時の動作に関連する動作属性情報を含み、
前記照合結果記録指示部は、前記照合結果情報と前記動作属性情報に従って前記記録媒体に前記支援データを記録する
ことを特徴とする請求項22または23記載の情報処理装置。 - 前記キー指定情報を基準として、前記キー音声データにおけるマーカ位置または分割位置を検索するキーデータ検索部をさらに具備し、
前記キー関連データ取得部は、前記キーデータ検索部において検索されたマーカまたは分割の情報をキー関連データとして取得する
ことを特徴とする請求項24記載の情報処理装置。 - 前記第1の支援データは、マーカまたは分割の情報であり、
前記キー関連データ取得部は、前記第1の支援データにおけるマーカまたは分割の情報をキー関連データとして取得する
ことを特徴とする請求項24記載の情報処理装置。 - 前記キー指定情報生成部は、前記第1の支援データにおけるマーカ範囲または分割単位に一致する範囲をキー指定情報として生成する
ことを特徴とする請求項26記載の情報処理装置。 - 前記キー指定情報生成部は、
前記第1の支援データにおけるマーカ位置、分割位置、マーカ範囲の始端、マーカ範囲の終端、分割単位の始端、分割単位の終端のいずれかを第1の端点とし、
予め指定された方法により、前記第1の端点の前後いずれか側の第2の端点を決定し、
前記第1の端点と前記第2の端点の間の範囲をキー指定情報として生成する
ことを特徴とする請求項26記載の情報処理装置。 - 前記キー指定情報生成部は、
予め指定された第1の方法により、前記第1の支援データにおけるマーカ位置、分割位置、マーカ範囲の始端、マーカ範囲の終端、分割単位の始端、分割単位の終端のいずれかに近接する第1の端点を決定し、
予め指定された第2の方法により、前記第1の端点の前後いずれか側の第2の端点を決定し、
前記第1の端点と前記第2の端点の間の範囲をキー指定情報として生成する
ことを特徴とする請求項26記載の情報処理装置。 - 前記キー関連データ取得部は、前記第1の支援データにおけるマーカまたは分割の位置情報と前記キー指定情報において指定された範囲との位置関係に基づいて、前記照合時の動作を指定する動作属性情報を生成する
ことを特徴とする請求項26から29のいずれか一項に記載の情報処理装置。 - 前記キー関連データ取得部は、前記第1の支援データにおけるマーカの位置情報と前記キー指定情報において指定された範囲との位置関係に基づいて、前記照合結果情報において検出された区間を基準とした記録位置の決定方法を規定する動作属性情報を生成し、
前記照合結果記録指示部は、前記照合結果情報と前記動作属性情報に従って、前記利用対象データ中の位置を決定し、前記決定された位置に前記マーカを第2支援データとして記録する
ことを特徴とする請求項26から29のいずれか一項に記載の情報処理装置。 - 前記キー関連データ取得部は、前記第1の支援データにおける分割の位置情報と前記キー指定情報において指定された範囲との位置関係に基づいて、前記照合結果情報において検出された区間を基準とした記録位置の決定方法を規定する動作属性情報を生成し、
前記照合結果記録指示部は、前記照合結果情報と前記動作属性情報に従って、前記利用対象データ中の位置を決定し、前記決定された位置で前記利用対象データを分割するという情報を第2支援データとして記録する
ことを特徴とする請求項26から29のいずれか一項に記載の情報処理装置。 - 前記キー関連データ取得部は、前記照合結果情報に関連するテキスト情報の生成方法を規定する動作属性情報を生成し、
前記照合結果記録指示部は、前記照合結果情報と前記動作属性情報に従って、前記照合結果情報に関連するテキスト情報を生成し、前記記録された各マーカまたは前記分割部分と関連付けて、前記生成されたテキスト情報を支援データとして記録する
ことを特徴とする請求項31または32記載の情報処理装置。 - 前記キー関連データ取得部は、前記第1の支援データにおけるマーカまたは分割の情報に関連するテキスト情報を取得し、
前記照合結果記録指示部は、前記規定されたテキスト情報の生成方法に従って、前記マーカまたは分割の情報に関連するテキスト情報に基づいて前記照合結果情報に関連するテキスト情報を生成し、前記記録された各マーカまたは前記分割された各部分と関連付けて、前記生成されたテキスト情報を第2支援データとして記録する
ことを特徴とする請求項33記載の情報処理装置。 - 前記キーデータは、前記キーデータに関連するテキスト情報を含み、
前記照合結果記録指示部は、予め規定されたテキスト情報の生成方法に従って、前記キーデータに関連するテキスト情報に基づいて前記照合結果に関連するテキスト情報を生成し、
前記照合結果情報に関連するテキスト情報を支援データとして記録する
ことを特徴とする請求項22または23記載の情報処理装置。 - 前記キー関連データ取得部は、前記キー指定情報に基づいて、前記キー音声データに関連するタイトル情報を取得し、
前記照合結果記録指示部は、前記照合結果情報に含まれる一連の利用対象データ全体に関連するタイトル情報を支援データとして記録する
ことを特徴とする請求項35記載の情報処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006058751A JP4459179B2 (ja) | 2005-03-30 | 2006-03-03 | 情報処理装置及びその方法 |
US11/391,389 US8019163B2 (en) | 2005-03-30 | 2006-03-29 | Information processing apparatus and method |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005100176 | 2005-03-30 | ||
JP2006058751A JP4459179B2 (ja) | 2005-03-30 | 2006-03-03 | 情報処理装置及びその方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006309923A JP2006309923A (ja) | 2006-11-09 |
JP4459179B2 true JP4459179B2 (ja) | 2010-04-28 |
Family
ID=37186718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006058751A Expired - Fee Related JP4459179B2 (ja) | 2005-03-30 | 2006-03-03 | 情報処理装置及びその方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8019163B2 (ja) |
JP (1) | JP4459179B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070223793A1 (en) * | 2006-01-19 | 2007-09-27 | Abraham Gutman | Systems and methods for providing diagnostic imaging studies to remote users |
JP4224095B2 (ja) * | 2006-09-28 | 2009-02-12 | 株式会社東芝 | 情報処理装置、情報処理プログラムおよび情報処理システム |
EP1975938A1 (en) * | 2007-03-31 | 2008-10-01 | Sony Deutschland Gmbh | Method for determining a point in time within an audio signal |
US20090049186A1 (en) * | 2007-08-16 | 2009-02-19 | Sony Corporation, A Japanese Corporation | Method to facilitate trick-modes for streaming video |
JP4934580B2 (ja) * | 2007-12-17 | 2012-05-16 | 株式会社日立製作所 | 映像音声記録装置および映像音声再生装置 |
JP5231130B2 (ja) * | 2008-08-13 | 2013-07-10 | 日本放送協会 | キーフレーズ抽出装置、シーン分割装置およびプログラム |
JP4924633B2 (ja) * | 2009-02-27 | 2012-04-25 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
JP5404726B2 (ja) * | 2011-09-26 | 2014-02-05 | 株式会社東芝 | 情報処理装置、情報処理方法およびプログラム |
US9940972B2 (en) * | 2013-08-15 | 2018-04-10 | Cellular South, Inc. | Video to data |
CN106357929A (zh) * | 2016-11-10 | 2017-01-25 | 努比亚技术有限公司 | 一种基于语音文件的预览方法和移动终端 |
US11238869B2 (en) * | 2019-10-04 | 2022-02-01 | Red Box Recorders Limited | System and method for reconstructing metadata from audio outputs |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08249343A (ja) | 1995-03-09 | 1996-09-27 | Toshiba Corp | 音声情報取得装置及び音声情報取得方法 |
US6472520B2 (en) * | 1997-03-21 | 2002-10-29 | The Trustees Of Columbia University In The City Of New York | Rat PEG-3 promoter |
WO1999046939A1 (en) * | 1998-03-13 | 1999-09-16 | Matsushita Electric Industrial Co., Ltd. | Data storage medium, and apparatus and method for reproducing the data from the same |
JP3065314B1 (ja) | 1998-06-01 | 2000-07-17 | 日本電信電話株式会社 | 高速信号探索方法、装置およびその記録媒体 |
IL133647A0 (en) * | 1999-06-08 | 2001-04-30 | Yissum Res Dev Co | Novel cd44 variant |
AU4264501A (en) * | 2000-04-05 | 2001-10-15 | Sony United Kingdom Limited | Audio/video reproducing apparatus and method |
US7280738B2 (en) * | 2001-04-09 | 2007-10-09 | International Business Machines Corporation | Method and system for specifying a selection of content segments stored in different formats |
JP2003036653A (ja) | 2002-04-26 | 2003-02-07 | Toshiba Corp | デジタル情報記録再生システムおよびデジタル情報記録媒体 |
JP4079429B2 (ja) * | 2003-06-11 | 2008-04-23 | ソニー株式会社 | 情報処理装置および方法、プログラム、並びに記録媒体 |
WO2005029492A1 (ja) * | 2003-09-18 | 2005-03-31 | Matsushita Electric Industrial Co., Ltd. | 記録再生装置および記録媒体 |
EP1542231A1 (en) * | 2003-12-08 | 2005-06-15 | Canon Kabushiki Kaisha | Recording apparatus and recording method capable of recording series of content data on different recording media |
-
2006
- 2006-03-03 JP JP2006058751A patent/JP4459179B2/ja not_active Expired - Fee Related
- 2006-03-29 US US11/391,389 patent/US8019163B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20060239130A1 (en) | 2006-10-26 |
JP2006309923A (ja) | 2006-11-09 |
US8019163B2 (en) | 2011-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4459179B2 (ja) | 情報処理装置及びその方法 | |
JP4621607B2 (ja) | 情報処理装置及びその方法 | |
JP4224095B2 (ja) | 情報処理装置、情報処理プログラムおよび情報処理システム | |
KR101001178B1 (ko) | 비디오 재생 디바이스, 이 비디오 재생 디바이스에 있는 장치, 뮤직 비디오 인덱싱 방법 및 컴퓨터-실행가능 명령을 저장한 컴퓨터-판독가능 저장 매체 | |
JP4000171B2 (ja) | 再生装置 | |
KR101606657B1 (ko) | 비디오 스트림들 및 다른 콘텐츠의 키워드-기반의 비선형 네비게이션을 위한 방법들 및 장치 | |
JP4692775B2 (ja) | 映像コンテンツ再生支援方法、映像コンテンツ再生支援システム、及び情報配信プログラム | |
US20110320471A1 (en) | Movie Recommendation System and Movie Recommendation Method | |
JPWO2005069172A1 (ja) | 要約再生装置および要約再生方法 | |
JPH11238071A (ja) | ダイジェスト作成装置及びダイジェスト作成方法 | |
JP2007503145A (ja) | 映像要約方法 | |
KR20070109921A (ko) | 콘텐츠 마킹 방법, 콘텐츠 재생 장치, 콘텐츠 재생 방법,및 기록 매체 | |
JP2006211311A (ja) | ダイジェスト映像生成装置 | |
JP2007281856A (ja) | 記録再生装置および記録再生方法 | |
JP2008005010A (ja) | 動画編集方法 | |
JP2007336283A (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
JP2006139408A (ja) | 特徴ベクトル生成装置、検索装置、特徴ベクトル生成方法、検索方法及びプログラム | |
JP2008193585A (ja) | 放送番組記録再生装置および放送番組記録再生方法 | |
JP2007294020A (ja) | 記録再生方法、記録再生装置、記録方法、記録装置、再生方法および再生装置 | |
JP2007288300A (ja) | 映像音声再生装置 | |
JP2007006095A (ja) | コンテンツ再生装置、コンテンツ再生方法、コンテンツ再生プログラムを格納した記録媒体およびコンテンツ再生装置に用いられる集積回路 | |
JPWO2007039995A1 (ja) | ダイジェスト作成装置およびそのプログラム | |
JP2007149235A (ja) | コンテンツ編集装置、プログラム、及び記録媒体 | |
JP4162459B2 (ja) | マルチメディア情報再生装置およびマルチメディア情報再生方法およびプログラム | |
JP3792951B2 (ja) | 放送データ録画装置、及び放送データ録画方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070925 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090818 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091016 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100112 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100209 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130219 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140219 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |