JPH09185879A - レコーディング・インデクシング方法 - Google Patents
レコーディング・インデクシング方法Info
- Publication number
- JPH09185879A JPH09185879A JP8339510A JP33951096A JPH09185879A JP H09185879 A JPH09185879 A JP H09185879A JP 8339510 A JP8339510 A JP 8339510A JP 33951096 A JP33951096 A JP 33951096A JP H09185879 A JPH09185879 A JP H09185879A
- Authority
- JP
- Japan
- Prior art keywords
- recording
- text
- keyword
- word
- window
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title description 28
- 230000005236 sound signal Effects 0.000 abstract 1
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
- G11B27/30—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
- G11B27/3027—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
- G11B27/3036—Time code signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/71—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7834—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7844—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/34—Indicating arrangements
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/912—Applications of a database
- Y10S707/917—Text
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Television Signal Processing For Recording (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
Abstract
(57)【要約】
【課題】ディジタル・オーディオ・レコーディングの内
容検索をする方法を提供する 【解決手段】レコーディングのオーディオ部分を筆写(t
ranscribe)して、テキスト・ファイル内のテキストを作
成し、筆写の後に、タイム・スタンプをテキスト内の各
単語に関連付け、単語とそれに関連するタイム・スタン
プを、平衡木に配置する。
容検索をする方法を提供する 【解決手段】レコーディングのオーディオ部分を筆写(t
ranscribe)して、テキスト・ファイル内のテキストを作
成し、筆写の後に、タイム・スタンプをテキスト内の各
単語に関連付け、単語とそれに関連するタイム・スタン
プを、平衡木に配置する。
Description
【0001】
【産業上の利用分野】本発明は、ディジタル・オーディ
オおよびオーディオ-ビデオ・レコーディング内での内
容検索の実行に関し、具体的には、ディジタル・オーデ
ィオおよびオーディオ-ビデオ・レコーディングのイン
デクシングでのキーワードの使用に関する。
オおよびオーディオ-ビデオ・レコーディング内での内
容検索の実行に関し、具体的には、ディジタル・オーデ
ィオおよびオーディオ-ビデオ・レコーディングのイン
デクシングでのキーワードの使用に関する。
【0002】
【従来の技術】記憶技術と圧縮技術の改良によって、マ
ルチメディアの革命がもたらされた。オーディオ・レコ
ーディングには、現在、ディジタル形式で記憶されるこ
とがしばしばである。さらに、現在では、1本の映画全
体を再生のためディジタル・オーディオ-ビデオ(ビデ
オ)・レコーディングに変換することも可能である。デ
ィジタル・ビデオを使用すると、ユーザは、既製品のソ
フトウェア製品を使用して、全画面フル・モーション・
ビデオ・レコーディングをアクセスし、編集することが
できる。
ルチメディアの革命がもたらされた。オーディオ・レコ
ーディングには、現在、ディジタル形式で記憶されるこ
とがしばしばである。さらに、現在では、1本の映画全
体を再生のためディジタル・オーディオ-ビデオ(ビデ
オ)・レコーディングに変換することも可能である。デ
ィジタル・ビデオを使用すると、ユーザは、既製品のソ
フトウェア製品を使用して、全画面フル・モーション・
ビデオ・レコーディングをアクセスし、編集することが
できる。
【0003】コンピュータのディジタル・オーディオお
よびオーディオ-ビデオ・レコーディングを操作する能
力を最大に活用するためには、内容検索を実行する方法
があることが望ましい。現在、内容検索を実行する能力
は、非常に制限されているか、存在しない。
よびオーディオ-ビデオ・レコーディングを操作する能
力を最大に活用するためには、内容検索を実行する方法
があることが望ましい。現在、内容検索を実行する能力
は、非常に制限されているか、存在しない。
【0004】当技術分野では、画像の内容検索を実行す
る制限された能力が存在する。たとえば、米国カリフォ
ルニア州サンノゼ、ハリーロード650(650 Harry Ro
ad,San Jose, California 95120)所在のIBM Corporati
on社によるQBIC Projectを参照されたい。しかし、この
ような内容に対する画像の検索は、視覚的な内容に制限
され、ディジタル・オーディオ・レコーディングに対す
る内容検索を実行する能力はない。
る制限された能力が存在する。たとえば、米国カリフォ
ルニア州サンノゼ、ハリーロード650(650 Harry Ro
ad,San Jose, California 95120)所在のIBM Corporati
on社によるQBIC Projectを参照されたい。しかし、この
ような内容に対する画像の検索は、視覚的な内容に制限
され、ディジタル・オーディオ・レコーディングに対す
る内容検索を実行する能力はない。
【0005】
【発明が解決しようとする課題】本発明の目的は上記問
題点を解決し、ディジタル・オーディオ・レコーディン
グの効率的な内容検索方法を提供することである。
題点を解決し、ディジタル・オーディオ・レコーディン
グの効率的な内容検索方法を提供することである。
【0006】
【課題を解決するための手段】本発明の好ましい実施例
によれば、レコーディングがキーワードによってインデ
クシングされる。インデクシングを実行するために、レ
コーディングのオーディオ部分を筆写(transcribe)し
て、テキスト・ファイル内のテキストを作成する。筆写
は、たとえば筆写者によるマニュアル操作や、音声認識
技術を使用して実行できる。各タイム・スタンプは、関
連付けられた単語が現れるレコーディング内の時刻を示
す。このタイム・スタンプは、たとえば音声認識技術を
使用して、テキスト・ファイルに追加することができ
る。
によれば、レコーディングがキーワードによってインデ
クシングされる。インデクシングを実行するために、レ
コーディングのオーディオ部分を筆写(transcribe)し
て、テキスト・ファイル内のテキストを作成する。筆写
は、たとえば筆写者によるマニュアル操作や、音声認識
技術を使用して実行できる。各タイム・スタンプは、関
連付けられた単語が現れるレコーディング内の時刻を示
す。このタイム・スタンプは、たとえば音声認識技術を
使用して、テキスト・ファイルに追加することができ
る。
【0007】その代わりに、コンピュータ・システムを
使用して操作員がタイム・スタンプをテキスト・ファイ
ルに追加することができる。たとえば、テキストを、コ
ンピュータ・ディスプレイの第1ウィンドウに表示す
る。レコーディングを、コンピュータ・ディスプレイの
第2ウィンドウに表示する。操作員が第1ウィンドウ内
のテキストの選択された単語を選択した時に、レコーデ
ィングの先頭から操作員による選択された単語の選択ま
での経過時間を示すタイム・スタンプを、テキスト・フ
ァイルに追加する。この形または他の何らかの方法によ
って操作員がテキストの単語の部分集合にタイム・スタ
ンプを割り当てた後に、補間を使用して、操作員によっ
てタイム・スタンプを割り当てられた単語の部分集合に
含まれないテキストの残りの単語に、タイム・スタンプ
を割り当てることができる。
使用して操作員がタイム・スタンプをテキスト・ファイ
ルに追加することができる。たとえば、テキストを、コ
ンピュータ・ディスプレイの第1ウィンドウに表示す
る。レコーディングを、コンピュータ・ディスプレイの
第2ウィンドウに表示する。操作員が第1ウィンドウ内
のテキストの選択された単語を選択した時に、レコーデ
ィングの先頭から操作員による選択された単語の選択ま
での経過時間を示すタイム・スタンプを、テキスト・フ
ァイルに追加する。この形または他の何らかの方法によ
って操作員がテキストの単語の部分集合にタイム・スタ
ンプを割り当てた後に、補間を使用して、操作員によっ
てタイム・スタンプを割り当てられた単語の部分集合に
含まれないテキストの残りの単語に、タイム・スタンプ
を割り当てることができる。
【0008】テキストの各単語にタイム・スタンプが割
り当てられた後に、検索プログラムによる効率的なアク
セスのために、単語とそれに関連するタイム・スタンプ
を、平衡木に配置することができる。平衡木の代わり
に、他の検索技法を使用することができる。たとえば、
2進木を使用することができる。
り当てられた後に、検索プログラムによる効率的なアク
セスのために、単語とそれに関連するタイム・スタンプ
を、平衡木に配置することができる。平衡木の代わり
に、他の検索技法を使用することができる。たとえば、
2進木を使用することができる。
【0009】本発明の好ましい実施例では、それぞれが
上で述べた関連テキスト・ファイルを作成されている複
数のレコーディングのキーワード検索も提供される。ユ
ーザによるキーワードの選択に応答して、各レコーディ
ングのテキスト・ファイル/平衡木を、キーワードの出
現に関して検索する。検索の最後に、キーワードの出現
を含むレコーディングのそれぞれがリストされる。ユー
ザが、第1のレコーディングとキーワードの特定の出現
を選択した時に、第1のレコーディングが、第1のレコ
ーディングのそのキーワードの特定の出現に関連する第
1のタイム・スタンプに対応する時刻の少し前から再生
される。
上で述べた関連テキスト・ファイルを作成されている複
数のレコーディングのキーワード検索も提供される。ユ
ーザによるキーワードの選択に応答して、各レコーディ
ングのテキスト・ファイル/平衡木を、キーワードの出
現に関して検索する。検索の最後に、キーワードの出現
を含むレコーディングのそれぞれがリストされる。ユー
ザが、第1のレコーディングとキーワードの特定の出現
を選択した時に、第1のレコーディングが、第1のレコ
ーディングのそのキーワードの特定の出現に関連する第
1のタイム・スタンプに対応する時刻の少し前から再生
される。
【0010】たとえば、キーワードを検索した後に、レ
コーディングは、次のようにリストされる。キーワード
の出現を含むレコーディングのリストが、コンピュータ
・ディスプレイの第1ウィンドウに表示される。第1ウ
ィンドウに表示されたレコーディングのリストから、レ
コーディングの1つが強調表示される。ユーザは、どの
レコーディングを強調表示するかを選択することができ
る。1実施例では、ユーザが特定のレコーディングを選
択すると、そのレコーディング内で時間的に最初に出現
するキーワードが再生される。キーストローク・コマン
ドを使用して、他の出現にジャンプすることができる。
代替実施例では、第1ウィンドウに表示されたレコーデ
ィングが強調表示される時に、強調表示されたレコーデ
ィングに含まれるキーワードの出現のそれぞれがリスト
される。これは、たとえばコンピュータ・ディスプレイ
の第2ウィンドウで行うことができる。
コーディングは、次のようにリストされる。キーワード
の出現を含むレコーディングのリストが、コンピュータ
・ディスプレイの第1ウィンドウに表示される。第1ウ
ィンドウに表示されたレコーディングのリストから、レ
コーディングの1つが強調表示される。ユーザは、どの
レコーディングを強調表示するかを選択することができ
る。1実施例では、ユーザが特定のレコーディングを選
択すると、そのレコーディング内で時間的に最初に出現
するキーワードが再生される。キーストローク・コマン
ドを使用して、他の出現にジャンプすることができる。
代替実施例では、第1ウィンドウに表示されたレコーデ
ィングが強調表示される時に、強調表示されたレコーデ
ィングに含まれるキーワードの出現のそれぞれがリスト
される。これは、たとえばコンピュータ・ディスプレイ
の第2ウィンドウで行うことができる。
【0011】本発明の好ましい実施例に対して、さまざ
まな変形を行うことができる。たとえば、単一のキーワ
ードに対する検索が可能になるだけでなく、ブール論理
によって連結された複数のキーワードに対する検索を実
行したり、概念に対する検索を実行することができる。
まな変形を行うことができる。たとえば、単一のキーワ
ードに対する検索が可能になるだけでなく、ブール論理
によって連結された複数のキーワードに対する検索を実
行したり、概念に対する検索を実行することができる。
【0012】本発明を用いると、レコーディングの効率
的な内容検索が可能になる。このような内容検索は、レ
コーディングをインデクシングするために現在使用可能
な他の方式に対する大きな改良である。
的な内容検索が可能になる。このような内容検索は、レ
コーディングをインデクシングするために現在使用可能
な他の方式に対する大きな改良である。
【0013】
【実施例】図1に、ディジタル・レコーディングのキー
ワード・インデクシングを可能にするために実行される
ステップを示す。レコーディング・ソース11をディジ
タル化し、圧縮して、ディジタル化されたレコーディン
グ・ファイル13を作る。レコーディング・ソース11
は、たとえば、オーディオ・レコーディングまたはオー
ディオ-ビデオ・レコーディングである。レコーディン
グ・ソース11がオーディオ-ビデオ・レコーディング
の時には、ディジタル化されたレコーディング・ファイ
ル13のデータは、たとえばMPEG−1フォーマット
で格納される。ディジタル化されたレコーディング・フ
ァイル13は、たとえば米国カリフォルニア州パロアル
ト、ヒルビュー・アベニュー3450(3450 Hillview
Ave.,Palo Alto, CA 94304)所在のOptiVision社から入
手できるOptiVideo MPEG 1 Encoderを使用して、アナロ
グのレコーディング・ソース11から作ることができ
る。
ワード・インデクシングを可能にするために実行される
ステップを示す。レコーディング・ソース11をディジ
タル化し、圧縮して、ディジタル化されたレコーディン
グ・ファイル13を作る。レコーディング・ソース11
は、たとえば、オーディオ・レコーディングまたはオー
ディオ-ビデオ・レコーディングである。レコーディン
グ・ソース11がオーディオ-ビデオ・レコーディング
の時には、ディジタル化されたレコーディング・ファイ
ル13のデータは、たとえばMPEG−1フォーマット
で格納される。ディジタル化されたレコーディング・フ
ァイル13は、たとえば米国カリフォルニア州パロアル
ト、ヒルビュー・アベニュー3450(3450 Hillview
Ave.,Palo Alto, CA 94304)所在のOptiVision社から入
手できるOptiVideo MPEG 1 Encoderを使用して、アナロ
グのレコーディング・ソース11から作ることができ
る。
【0014】さらに、レコーディング・ソース11のオ
ーディオ部分を筆写して、そのテキストを含むテキスト
・ファイル12を作る。筆写は、マニュアル操作で行う
ことができる。その代わりに、米国マサチューセッツ州
ニュートン、ネバダ・ストリート320(320 Nevada S
treet, Newton, MA 02160)所在のDragon Systems, In
c.社から入手できるDragonDictate for Windowsなどの
コンピュータ化された音声認識技術を使用して、レコー
ディング・ソース11またはディジタル化されたレコー
ディング・ファイル13から、レコーディング・ソース
11のオーディオ部分を直接に書写することができる。
その後、テキスト・ファイル12とディジタル化された
レコーディング・ファイル13を、コンピュータ・シス
テム14で使用できるようにする。
ーディオ部分を筆写して、そのテキストを含むテキスト
・ファイル12を作る。筆写は、マニュアル操作で行う
ことができる。その代わりに、米国マサチューセッツ州
ニュートン、ネバダ・ストリート320(320 Nevada S
treet, Newton, MA 02160)所在のDragon Systems, In
c.社から入手できるDragonDictate for Windowsなどの
コンピュータ化された音声認識技術を使用して、レコー
ディング・ソース11またはディジタル化されたレコー
ディング・ファイル13から、レコーディング・ソース
11のオーディオ部分を直接に書写することができる。
その後、テキスト・ファイル12とディジタル化された
レコーディング・ファイル13を、コンピュータ・シス
テム14で使用できるようにする。
【0015】図2は、ディジタル化されたレコーディン
グ・ファイル13のテキストにキーワード・インデック
スを付けるためのステップを示す流れ図である。ステッ
プ31で、ディジタル化されたレコーディング・ファイ
ル13のオーディオ部分であるテキストを作成する。こ
のテキストは、上で述べた筆写の結果である。
グ・ファイル13のテキストにキーワード・インデック
スを付けるためのステップを示す流れ図である。ステッ
プ31で、ディジタル化されたレコーディング・ファイ
ル13のオーディオ部分であるテキストを作成する。こ
のテキストは、上で述べた筆写の結果である。
【0016】図3は、筆写処理の結果を示す図である。
図3には、コンピュータ画面21内のウィンドウ23が
示されている。ウィンドウ23内には、ディジタル化さ
れたレコーディング・ファイル13のオーディオ部分を
筆写したテキストがある。
図3には、コンピュータ画面21内のウィンドウ23が
示されている。ウィンドウ23内には、ディジタル化さ
れたレコーディング・ファイル13のオーディオ部分を
筆写したテキストがある。
【0017】ステップ32(図2に図示)で、テキスト
内の単語に関連するタイム・スタンプが、筆写されたテ
キストに追加される。好ましい実施例では、タイム・ス
タンプは、ミリ秒単位であり、ディジタル化されたレコ
ーディング・ファイル13内のディジタル・レコーディ
ングの開始点に対する相対的な時間の経過を示す。
内の単語に関連するタイム・スタンプが、筆写されたテ
キストに追加される。好ましい実施例では、タイム・ス
タンプは、ミリ秒単位であり、ディジタル化されたレコ
ーディング・ファイル13内のディジタル・レコーディ
ングの開始点に対する相対的な時間の経過を示す。
【0018】タイム・スタンプの配置は、たとえば、コ
ンピュータ・システム14(図1に図示)上で、タイム
・スタンプを追加するために特に設計されたソフトウェ
アを使用して、操作員の助けを得て実行することができ
る。たとえば、レコーディングをコンピュータ・システ
ム14によって再生する。オーディオ-ビデオ・レコー
ディングの場合、図3に示されるように、コンピュータ
画面21内のウィンドウ22を追加し、ここでオーディ
オ-ビデオ・レコーディングを再生することができる。
コンピュータ・システム14の操作員は、カーソル24
を使用して、レコーディングがコンピュータ・システム
14によって再生される間に発声される単語を選択す
る。操作員がカーソル24を用いてウィンドウ23内の
テキストから単語を選択する時には必ず、コンピュータ
・システム14上で走行しているソフトウェアが、ディ
ジタル・レコーディングの開始点に対する相対的な時間
の経過を表す現在時間の持続時間を用いて、その単語に
タイム・スタンプを付ける。
ンピュータ・システム14(図1に図示)上で、タイム
・スタンプを追加するために特に設計されたソフトウェ
アを使用して、操作員の助けを得て実行することができ
る。たとえば、レコーディングをコンピュータ・システ
ム14によって再生する。オーディオ-ビデオ・レコー
ディングの場合、図3に示されるように、コンピュータ
画面21内のウィンドウ22を追加し、ここでオーディ
オ-ビデオ・レコーディングを再生することができる。
コンピュータ・システム14の操作員は、カーソル24
を使用して、レコーディングがコンピュータ・システム
14によって再生される間に発声される単語を選択す
る。操作員がカーソル24を用いてウィンドウ23内の
テキストから単語を選択する時には必ず、コンピュータ
・システム14上で走行しているソフトウェアが、ディ
ジタル・レコーディングの開始点に対する相対的な時間
の経過を表す現在時間の持続時間を用いて、その単語に
タイム・スタンプを付ける。
【0019】図4に、この処理をさらに示す。図4で
は、タイム・スタンプTS1、TS2およびTS3が、
上で述べたように操作員によってウィンドウ23のテキ
ストに追加されている。代替例として、図2のステップ
32を自動化し、その結果、音声認識技術を使用して、
ウィンドウ23のテキスト内でのタイム・スタンプの配
置のトリガをかけることができる。
は、タイム・スタンプTS1、TS2およびTS3が、
上で述べたように操作員によってウィンドウ23のテキ
ストに追加されている。代替例として、図2のステップ
32を自動化し、その結果、音声認識技術を使用して、
ウィンドウ23のテキスト内でのタイム・スタンプの配
置のトリガをかけることができる。
【0020】ウィンドウ23のテキストにタイム・スタ
ンプが追加された後に、図2のステップ33で、ウィン
ドウ23のテキストのすべての単語にタイム・スタンプ
を割り当てる。ステップ32でタイム・スタンプを割り
当てられなかった単語については、補間を使用して適当
なタイム・スタンプを決定する。
ンプが追加された後に、図2のステップ33で、ウィン
ドウ23のテキストのすべての単語にタイム・スタンプ
を割り当てる。ステップ32でタイム・スタンプを割り
当てられなかった単語については、補間を使用して適当
なタイム・スタンプを決定する。
【0021】たとえば、下の表1には、ステップ32を
完了した後の、ウィンドウ23のテキストの一部が示さ
れている。
完了した後の、ウィンドウ23のテキストの一部が示さ
れている。
【0022】
【表1】
【0023】表1に示された例では、単語"Once"が、デ
ィジタル・レコーディングのオーディオ・トラックの先
頭から11ミリ秒で発声されている。単語"time"は、デ
ィジタル・レコーディングのオーディオ・トラックの先
頭から20ミリ秒で発声されている。単語"boy"は、デ
ィジタル・レコーディングのオーディオ・トラックの先
頭から28ミリ秒で発声されている。単語"went"は、デ
ィジタル・レコーディングのオーディオ・トラックの先
頭から35ミリ秒で発声されている。単語"forest"は、
ディジタル・レコーディングのオーディオ・トラックの
先頭から44ミリ秒で発声されている。
ィジタル・レコーディングのオーディオ・トラックの先
頭から11ミリ秒で発声されている。単語"time"は、デ
ィジタル・レコーディングのオーディオ・トラックの先
頭から20ミリ秒で発声されている。単語"boy"は、デ
ィジタル・レコーディングのオーディオ・トラックの先
頭から28ミリ秒で発声されている。単語"went"は、デ
ィジタル・レコーディングのオーディオ・トラックの先
頭から35ミリ秒で発声されている。単語"forest"は、
ディジタル・レコーディングのオーディオ・トラックの
先頭から44ミリ秒で発声されている。
【0024】残りの単語にタイム・スタンプを割り当て
るために、補間を使用する。たとえば、単語"Once"と単
語"time"の間で9ミリ秒が経過している。その"Once"
と"time"の間には、2つの単語"upon"および"a"があ
る。補間の結果として、単語"upon"には14ミリ秒、単
語"a"には17ミリ秒のタイム・スタンプが割り当てら
れる。これを行った結果、単語"Once"と単語"upon"の出
現の間には3ミリ秒が割り振られ、単語"upon"と単語"
a"の出現の間には3ミリ秒が割り振られ、単語"a"と単
語"time"の出現の間には3ミリ秒が割り振られることに
なる。
るために、補間を使用する。たとえば、単語"Once"と単
語"time"の間で9ミリ秒が経過している。その"Once"
と"time"の間には、2つの単語"upon"および"a"があ
る。補間の結果として、単語"upon"には14ミリ秒、単
語"a"には17ミリ秒のタイム・スタンプが割り当てら
れる。これを行った結果、単語"Once"と単語"upon"の出
現の間には3ミリ秒が割り振られ、単語"upon"と単語"
a"の出現の間には3ミリ秒が割り振られ、単語"a"と単
語"time"の出現の間には3ミリ秒が割り振られることに
なる。
【0025】単語とタイム・スタンプは、出力ファイル
に置かれる。たとえば、この出力ファイルは、1単語に
ついて1行を有し、単語のタイム・スタンプと単語がタ
ブ文字で区切られるものとすることができる。下の表2
に、上の表1に示した例のテキスト・ファイルのファイ
ルの形式を示す。
に置かれる。たとえば、この出力ファイルは、1単語に
ついて1行を有し、単語のタイム・スタンプと単語がタ
ブ文字で区切られるものとすることができる。下の表2
に、上の表1に示した例のテキスト・ファイルのファイ
ルの形式を示す。
【0026】
【表2】
【0027】代替例として、ステップ32で、たとえば
音声認識技術を使用して、すべての単語にタイム・スタ
ンプを割り当て、その結果、補間が不要になるようにす
ることができる。音声認識技術を使用すると、単語の筆
写とタイム・スタンプ付けを同時に行うことができる。
その代わりに、音声認識技術を別のパスで使用して、テ
キストの筆写にタイム・スタンプを追加することができ
る。テキスト内の単語にタイム・スタンプを追加するた
めに別のパスで使用される時には、音声認識ソフトウェ
アは、上で述べた補間によって、認識されなかった単語
のタイム・スタンプを追加する。
音声認識技術を使用して、すべての単語にタイム・スタ
ンプを割り当て、その結果、補間が不要になるようにす
ることができる。音声認識技術を使用すると、単語の筆
写とタイム・スタンプ付けを同時に行うことができる。
その代わりに、音声認識技術を別のパスで使用して、テ
キストの筆写にタイム・スタンプを追加することができ
る。テキスト内の単語にタイム・スタンプを追加するた
めに別のパスで使用される時には、音声認識ソフトウェ
アは、上で述べた補間によって、認識されなかった単語
のタイム・スタンプを追加する。
【0028】図2のステップ34で、出力ファイル内の
単語の高速アクセスを可能にする平衡木を作成する。平
衡木は、たとえば、当技術分野で既知のアルゴリズムを
使用して作成される。たとえば、セジウィック(Robert
Sedgewick)著、「Algorithms in C++」(Addison-Wes
ley Publishing Company, 1992)、第215ページから
第229ページを参照されたい。代替例として、2進木
または他の検索アルゴリズムを使用することができる。
他の実施例では、ステップ33で作成される出力ファイ
ルに対して、検索を直接に実行することができる。
単語の高速アクセスを可能にする平衡木を作成する。平
衡木は、たとえば、当技術分野で既知のアルゴリズムを
使用して作成される。たとえば、セジウィック(Robert
Sedgewick)著、「Algorithms in C++」(Addison-Wes
ley Publishing Company, 1992)、第215ページから
第229ページを参照されたい。代替例として、2進木
または他の検索アルゴリズムを使用することができる。
他の実施例では、ステップ33で作成される出力ファイ
ルに対して、検索を直接に実行することができる。
【0029】ステップ34で作成された平衡木は、ディ
ジタル・レコーディングのキーワード・インデックスと
して働く。この平衡木は、ある単語が映画中で発話され
る位置を突き止めるためにアクセスされる。
ジタル・レコーディングのキーワード・インデックスと
して働く。この平衡木は、ある単語が映画中で発話され
る位置を突き止めるためにアクセスされる。
【0030】たとえば、図5は、上で説明したように作
成されたキーワード・インデックスを使用するコンピュ
ータ画面51上のインターフェースを示す図である。ボ
ックス56内に、ユーザが、ブール変数によって連結さ
れた1つまたは複数のキーワードをタイプする。ウィン
ドウ52内に、そのキーワードが出現するレコーディン
グがリストされる。出現するキーワードの「ヒット」数
が、レコーディングのとなりにリストされる。好ましい
実施例では、レコーディングが、キーワード出現回数に
よって降順にリストされる。ユーザは、カーソル54、
カーソル・キーまたは他の方法を使用してレコーディン
グを選択する。あるレコーディングが、たとえば「O
K」ボタン58を使用して、ユーザによって選択される
時、選択されたレコーディング(ウィンドウ52にリス
トされる)のうちで、選択されたキーワードが最初に現
れる部分が再生される。オーディオ-ビデオ・レコーデ
ィングの場合、視覚部分は、表示ウィンドウ55に表示
される。レコーディングのこの部分は、構成可能な持続
時間(たとえば2秒)にわたって、たとえばキーワード
の出現の1秒前から、再生される。キーボード・コマン
ドを使用して、ユーザは、レコーディングの表示、早送
り、逆送り、キーワードの次の出現へのスキップ、キー
ワードの前の出現へのバック、再生の継続などを行うこ
とができる。このインターフェースには、「キャンセ
ル」ボタン59も含まれる。
成されたキーワード・インデックスを使用するコンピュ
ータ画面51上のインターフェースを示す図である。ボ
ックス56内に、ユーザが、ブール変数によって連結さ
れた1つまたは複数のキーワードをタイプする。ウィン
ドウ52内に、そのキーワードが出現するレコーディン
グがリストされる。出現するキーワードの「ヒット」数
が、レコーディングのとなりにリストされる。好ましい
実施例では、レコーディングが、キーワード出現回数に
よって降順にリストされる。ユーザは、カーソル54、
カーソル・キーまたは他の方法を使用してレコーディン
グを選択する。あるレコーディングが、たとえば「O
K」ボタン58を使用して、ユーザによって選択される
時、選択されたレコーディング(ウィンドウ52にリス
トされる)のうちで、選択されたキーワードが最初に現
れる部分が再生される。オーディオ-ビデオ・レコーデ
ィングの場合、視覚部分は、表示ウィンドウ55に表示
される。レコーディングのこの部分は、構成可能な持続
時間(たとえば2秒)にわたって、たとえばキーワード
の出現の1秒前から、再生される。キーボード・コマン
ドを使用して、ユーザは、レコーディングの表示、早送
り、逆送り、キーワードの次の出現へのスキップ、キー
ワードの前の出現へのバック、再生の継続などを行うこ
とができる。このインターフェースには、「キャンセ
ル」ボタン59も含まれる。
【0031】図5のインターフェースを拡張して、追加
機能を含めることができる。たとえば、図6は、上で説
明したように作成されたキーワード・インデックスを使
用するコンピュータ画面41上のインターフェースを示
す図である。ボックス46内に、ユーザが、ブール変数
によって連結された1つまたは複数のキーワードをタイ
プする。ウィンドウ42内に、そのキーワードが現れる
レコーディングがリストされる。あるレコーディングで
のキーワードの出現回数が、レコーディングのとなりに
リストされる。好ましい実施例では、レコーディング
は、キーワード出現回数によって降順にリストされる。
ユーザは、カーソル44、カーソル・キーまたは他の方
法を使用してレコーディングを選択する。レコーディン
グが選択された時、ウィンドウ43内に、キーワードの
出現のすべてのリストがリストされる。1実施例では、
テキストの断片が、タイム・スタンプと共に出現ごとに
表示される。その代わりに、キーワードとタイム・スタ
ンプだけ、または、タイム・スタンプだけが、出現ごと
に表示される。
機能を含めることができる。たとえば、図6は、上で説
明したように作成されたキーワード・インデックスを使
用するコンピュータ画面41上のインターフェースを示
す図である。ボックス46内に、ユーザが、ブール変数
によって連結された1つまたは複数のキーワードをタイ
プする。ウィンドウ42内に、そのキーワードが現れる
レコーディングがリストされる。あるレコーディングで
のキーワードの出現回数が、レコーディングのとなりに
リストされる。好ましい実施例では、レコーディング
は、キーワード出現回数によって降順にリストされる。
ユーザは、カーソル44、カーソル・キーまたは他の方
法を使用してレコーディングを選択する。レコーディン
グが選択された時、ウィンドウ43内に、キーワードの
出現のすべてのリストがリストされる。1実施例では、
テキストの断片が、タイム・スタンプと共に出現ごとに
表示される。その代わりに、キーワードとタイム・スタ
ンプだけ、または、タイム・スタンプだけが、出現ごと
に表示される。
【0032】ユーザが「OK」ボタン48ボタンを選択
すると、選択されたレコーディング(ウィンドウ42
内)のうち、選択されたキーワード(ウィンドウ43
内)が現れる部分が、ディジタル化されたレコーディン
グの表示ウィンドウ45内で再生される。レコーディン
グのこの部分は、構成可能な持続時間(たとえば2秒)
にわたって、たとえばキーワードの出現の1秒前から、
表示される。コントロール・パネル50を使用して、ユ
ーザは、レコーディングの表示、早送り、逆送り、キー
ワードの次の出現へのスキップ、キーワードの前の出現
へのバック、再生の継続などを行うことができる。この
インターフェースには、「キャンセル」ボタン49も含
まれる。
すると、選択されたレコーディング(ウィンドウ42
内)のうち、選択されたキーワード(ウィンドウ43
内)が現れる部分が、ディジタル化されたレコーディン
グの表示ウィンドウ45内で再生される。レコーディン
グのこの部分は、構成可能な持続時間(たとえば2秒)
にわたって、たとえばキーワードの出現の1秒前から、
表示される。コントロール・パネル50を使用して、ユ
ーザは、レコーディングの表示、早送り、逆送り、キー
ワードの次の出現へのスキップ、キーワードの前の出現
へのバック、再生の継続などを行うことができる。この
インターフェースには、「キャンセル」ボタン49も含
まれる。
【0033】ブール変数によって連結された1つまたは
複数のキーワードの検索のほかに、ステップ34(図2
に図示)で形成された平衡木は、たとえば米国オハイオ
州クリーブランド、エッジウォーター・ドライブ111
15(11115 Edgewater Drive, Cleveland, Ohio 4410
2)所在のThunderstone Software-EPI, Inc.社から入手
できるMetamorphを使用するなど、概念に基づく検索技
法を使用して検索することもできる。
複数のキーワードの検索のほかに、ステップ34(図2
に図示)で形成された平衡木は、たとえば米国オハイオ
州クリーブランド、エッジウォーター・ドライブ111
15(11115 Edgewater Drive, Cleveland, Ohio 4410
2)所在のThunderstone Software-EPI, Inc.社から入手
できるMetamorphを使用するなど、概念に基づく検索技
法を使用して検索することもできる。
【0034】前述の議論は、本発明の例の方法および実
施例を開示し、説明するものにすぎない。当業者に理解
されるとおり、本発明は、その趣旨または本質的な特性
から逸脱することなく、他の具体的な形式で実施するこ
とができる。したがって、本発明の開示は、説明を目的
とするものであり、請求の範囲に示された本発明の範囲
を制限するものではない。
施例を開示し、説明するものにすぎない。当業者に理解
されるとおり、本発明は、その趣旨または本質的な特性
から逸脱することなく、他の具体的な形式で実施するこ
とができる。したがって、本発明の開示は、説明を目的
とするものであり、請求の範囲に示された本発明の範囲
を制限するものではない。
【0035】以上、本発明の実施例について詳述した
が、以下、本発明の各実施態様の例を示す。
が、以下、本発明の各実施態様の例を示す。
【0036】(実施態様1) (a)レコーディングのオーディオ部分を筆写し、テキ
スト・ファイル内のテキストを作るステップと、(b)
テキスト内の単語の集合のそれぞれについて、単語の集
合に含まれる各単語が出現するレコーディング内の時刻
を示すタイム・スタンプを提供するステップとを有す
る、レコーディングにインデックスを付ける方法。
スト・ファイル内のテキストを作るステップと、(b)
テキスト内の単語の集合のそれぞれについて、単語の集
合に含まれる各単語が出現するレコーディング内の時刻
を示すタイム・スタンプを提供するステップとを有す
る、レコーディングにインデックスを付ける方法。
【0037】(実施態様2)前記ステップ(a)で、単
語の集合に、テキスト内のすべての単語が含まれること
を特徴とする、実施態様1に記載の方法。
語の集合に、テキスト内のすべての単語が含まれること
を特徴とする、実施態様1に記載の方法。
【0038】(実施態様3)前記ステップ(a)が、筆
写者によってマニュアル操作で達成されることを特徴と
する、実施態様1に記載の方法。
写者によってマニュアル操作で達成されることを特徴と
する、実施態様1に記載の方法。
【0039】(実施態様4)前記ステップ(a)が、音
声認識技術を使用して達成されることを特徴とする、実
施態様1に記載の方法。
声認識技術を使用して達成されることを特徴とする、実
施態様1に記載の方法。
【0040】(実施態様5)前記ステップ(a)および
(b)が、同時に実行されることを特徴とする、実施態
様4に記載の方法。
(b)が、同時に実行されることを特徴とする、実施態
様4に記載の方法。
【0041】(実施態様6)前記ステップ(a)が、
(b.1)テキストの単語の集合の部分集合のそれぞれ
について、単語の集合の部分集合内の各単語が出現する
レコーディング内の時刻を表すタイム・スタンプを提供
するサブステップと、(b.2)単語の集合の部分集合
に含まれない、単語の集合の残りについて、単語の集合
の残りの各単語が出現するレコーディング内の時刻を表
すタイム・スタンプを補間を使用して提供するサブステ
ップとを有することを特徴とする、実施態様1に記載の
方法。
(b.1)テキストの単語の集合の部分集合のそれぞれ
について、単語の集合の部分集合内の各単語が出現する
レコーディング内の時刻を表すタイム・スタンプを提供
するサブステップと、(b.2)単語の集合の部分集合
に含まれない、単語の集合の残りについて、単語の集合
の残りの各単語が出現するレコーディング内の時刻を表
すタイム・スタンプを補間を使用して提供するサブステ
ップとを有することを特徴とする、実施態様1に記載の
方法。
【0042】(実施態様7)レコーディングがオーディ
オ-ビデオ・レコーディングであり、前記サブステップ
(b.1)が、(b.1.1)コンピュータ・ディスプ
レイの第1ウィンドウにテキストを表示するサブステッ
プと、(b.1.2)コンピュータ・ディスプレイの第
2ウィンドウでレコーディングのビデオ部分を再生する
サブステップと、(b.1.3)操作員が第1ウィンド
ウ内のテキストの選択された単語を選択する時に、レコ
ーディングの先頭から選択された単語の操作員による選
択までの経過時間を示すタイム・スタンプをテキスト・
ファイルに追加するサブステップとを有することを特徴
とする、実施態様6に記載の方法。
オ-ビデオ・レコーディングであり、前記サブステップ
(b.1)が、(b.1.1)コンピュータ・ディスプ
レイの第1ウィンドウにテキストを表示するサブステッ
プと、(b.1.2)コンピュータ・ディスプレイの第
2ウィンドウでレコーディングのビデオ部分を再生する
サブステップと、(b.1.3)操作員が第1ウィンド
ウ内のテキストの選択された単語を選択する時に、レコ
ーディングの先頭から選択された単語の操作員による選
択までの経過時間を示すタイム・スタンプをテキスト・
ファイルに追加するサブステップとを有することを特徴
とする、実施態様6に記載の方法。
【0043】(実施態様8) (c)単語の集合に含まれる各単語の出現に基づいて、
単語の集合と関連タイム・スタンプとを平衡木に配置す
るステップを有する、実施態様1に記載の方法。
単語の集合と関連タイム・スタンプとを平衡木に配置す
るステップを有する、実施態様1に記載の方法。
【0044】(実施態様9) (c)ユーザによるキーワードの選択に応答して、キー
ワードのすべての出現について単語の集合を検索するス
テップを有する、実施態様1に記載の方法。
ワードのすべての出現について単語の集合を検索するス
テップを有する、実施態様1に記載の方法。
【0045】(実施態様10)さらに(d)前記ステッ
プ(c)で見つかったキーワードの出現のすべてをリス
トするステップと、(e)前記ステップ(d)でリスト
されたキーワードの出現のユーザによる選択に応答し
て、キーワードの選択された出現に関連するタイム・ス
タンプに対応する時刻の少し前からレコーディングを再
生するステップとを有する、実施態様9に記載の方法。
プ(c)で見つかったキーワードの出現のすべてをリス
トするステップと、(e)前記ステップ(d)でリスト
されたキーワードの出現のユーザによる選択に応答し
て、キーワードの選択された出現に関連するタイム・ス
タンプに対応する時刻の少し前からレコーディングを再
生するステップとを有する、実施態様9に記載の方法。
【0046】(実施態様11)前記レコーディングがオ
ーディオ・レコーディングであることを特徴とする、実
施態様9に記載の方法。
ーディオ・レコーディングであることを特徴とする、実
施態様9に記載の方法。
【0047】(実施態様12)前記レコーディングがオ
ーディオ-ビデオ・レコーディングであることを特徴と
する、実施態様9に記載の方法。
ーディオ-ビデオ・レコーディングであることを特徴と
する、実施態様9に記載の方法。
【0048】(実施態様13) (a)複数のレコーディングのそれぞれについて、複数
のテキスト・ファイルからの1テキスト・ファイルが、
レコーディングのオーディオ部分のテキストを含み、各
テキスト・ファイルの各単語が単語の出現の関連レコー
ディング内での近似位置を示すタイム・スタンプと関連
付けられるように、テキスト・ファイルがレコーディン
グと関連付けられることを特徴とし、ユーザによるキー
ワードの選択に応答して、キーワードの出現について複
数のテキスト・ファイルを検索するステップと、(b)
キーワードの出現を含むレコーディングをリストするス
テップと、(c)ユーザによる第1レコーディングおよ
びキーワードの特定の出現の選択の際に、第1レコーデ
ィング内のキーワードの特定の出現に関連する第1タイ
ム・スタンプに対応する時刻の少し前から第1レコーデ
ィングを再生するステップとを有する、複数のレコーデ
ィング内の選択部分をアクセスする方法。
のテキスト・ファイルからの1テキスト・ファイルが、
レコーディングのオーディオ部分のテキストを含み、各
テキスト・ファイルの各単語が単語の出現の関連レコー
ディング内での近似位置を示すタイム・スタンプと関連
付けられるように、テキスト・ファイルがレコーディン
グと関連付けられることを特徴とし、ユーザによるキー
ワードの選択に応答して、キーワードの出現について複
数のテキスト・ファイルを検索するステップと、(b)
キーワードの出現を含むレコーディングをリストするス
テップと、(c)ユーザによる第1レコーディングおよ
びキーワードの特定の出現の選択の際に、第1レコーデ
ィング内のキーワードの特定の出現に関連する第1タイ
ム・スタンプに対応する時刻の少し前から第1レコーデ
ィングを再生するステップとを有する、複数のレコーデ
ィング内の選択部分をアクセスする方法。
【0049】(実施態様14)前記ステップ(c)で、
ユーザが第1レコーディングを選択する際に、第1レコ
ーディング内のキーワードの時間的に最初の出現が、キ
ーワードの特定の出現として自動的に選択されることを
特徴とする、実施態様13に記載の方法。
ユーザが第1レコーディングを選択する際に、第1レコ
ーディング内のキーワードの時間的に最初の出現が、キ
ーワードの特定の出現として自動的に選択されることを
特徴とする、実施態様13に記載の方法。
【0050】(実施態様15)前記ステップ(b)が、
(b.1)第1ウィンドウ内に、キーワードの出現を含
むレコーディングをリストするサブステップと、(b.
2)第1ウィンドウ内にリストされたレコーディングか
らレコーディングのうちの1つを強調表示するサブステ
ップと、(b.3)サブステップ(b.2)で強調表示
されたレコーディング内のキーワードの出現のそれぞれ
をリストするサブステップとを有することを特徴とす
る、実施態様13に記載の方法。
(b.1)第1ウィンドウ内に、キーワードの出現を含
むレコーディングをリストするサブステップと、(b.
2)第1ウィンドウ内にリストされたレコーディングか
らレコーディングのうちの1つを強調表示するサブステ
ップと、(b.3)サブステップ(b.2)で強調表示
されたレコーディング内のキーワードの出現のそれぞれ
をリストするサブステップとを有することを特徴とす
る、実施態様13に記載の方法。
【0051】(実施態様16)前記各レコーディングの
オーディオ部分のテキストの単語と関連タイム・スタン
プとが、テキストの各単語の出現に基づいて平衡木に配
置されることを特徴とする、実施態様13に記載の方
法。
オーディオ部分のテキストの単語と関連タイム・スタン
プとが、テキストの各単語の出現に基づいて平衡木に配
置されることを特徴とする、実施態様13に記載の方
法。
【0052】(実施態様17)複数のテキスト・ファイ
ルからの各テキスト・ファイルが、複数のレコーディン
グからの関連レコーディングのオーディオ部分のテキス
トを含む、複数のテキスト・ファイルと、ユーザによる
キーワードの選択に応答して、キーワードの出現につい
てテキスト・ファイルを検索するための、テキスト・フ
ァイルに結合された検索手段と、第1レコーディング内
でのユーザによるキーワードの特定の出現の選択に応答
して、第1レコーディング内のキーワードの特定の出現
に対応する時刻の少し前から第1レコーディングを再生
するための、レコーディング再生手段とを有する、複数
のレコーディング内の選択部分をアクセスするためのシ
ステム。
ルからの各テキスト・ファイルが、複数のレコーディン
グからの関連レコーディングのオーディオ部分のテキス
トを含む、複数のテキスト・ファイルと、ユーザによる
キーワードの選択に応答して、キーワードの出現につい
てテキスト・ファイルを検索するための、テキスト・フ
ァイルに結合された検索手段と、第1レコーディング内
でのユーザによるキーワードの特定の出現の選択に応答
して、第1レコーディング内のキーワードの特定の出現
に対応する時刻の少し前から第1レコーディングを再生
するための、レコーディング再生手段とを有する、複数
のレコーディング内の選択部分をアクセスするためのシ
ステム。
【0053】(実施態様18)前記各テキスト・ファイ
ル内の各単語が、単語の出現の関連レコーディング内の
近似位置を示すタイム・スタンプと関連付けられること
を特徴とする、実施態様17に記載のシステム。
ル内の各単語が、単語の出現の関連レコーディング内の
近似位置を示すタイム・スタンプと関連付けられること
を特徴とする、実施態様17に記載のシステム。
【0054】(実施態様19)前記テキスト・ファイル
内のテキストが、平衡木に格納されることを特徴とす
る、実施態様17に記載のシステム。
内のテキストが、平衡木に格納されることを特徴とす
る、実施態様17に記載のシステム。
【0055】(実施態様20)前記検索手段が、ユーザ
から特定のキーワードの指定を受け入れる第1キーワー
ド表示と、特定のキーワードの出現を含むレコーディン
グのリストを表示する第1ウィンドウとを有することを
特徴とする、実施態様17に記載のシステム。
から特定のキーワードの指定を受け入れる第1キーワー
ド表示と、特定のキーワードの出現を含むレコーディン
グのリストを表示する第1ウィンドウとを有することを
特徴とする、実施態様17に記載のシステム。
【0056】(実施態様21)前記検索手段がさらに、
第1ウィンドウ内で強調表示されたレコーディング内の
キーワードの出現を表示する第2ウィンドウを有するこ
とを特徴とする、実施態様20に記載のシステム。
第1ウィンドウ内で強調表示されたレコーディング内の
キーワードの出現を表示する第2ウィンドウを有するこ
とを特徴とする、実施態様20に記載のシステム。
【0057】(実施態様22)前記検索手段が、ブール
論理によって連結された複数のキーワードに対する検索
の能力を有することを特徴とする、実施態様17に記載
のシステム。
論理によって連結された複数のキーワードに対する検索
の能力を有することを特徴とする、実施態様17に記載
のシステム。
【0058】(実施態様23)前記検索手段が、キーワ
ードに対する概念に基づく検索を実行する能力を有する
ことを特徴とする、実施態様17に記載のシステム。
ードに対する概念に基づく検索を実行する能力を有する
ことを特徴とする、実施態様17に記載のシステム。
【0059】
【発明の効果】以上のように、本発明を用いると、ディ
ジタル・オーディオ・レコーディングの効率的な内容検
索が可能になる。
ジタル・オーディオ・レコーディングの効率的な内容検
索が可能になる。
【図1】 本発明の好ましい実施例による、ディジタル
・レコーディングのキーワード・インデクシングを可能
にするために行われるステップを示す図である。
・レコーディングのキーワード・インデクシングを可能
にするために行われるステップを示す図である。
【図2】 本発明の好ましい実施例による、ディジタル
・レコーディングのテキストにキーワード・インデック
スを付けるステップを示す流れ図である。
・レコーディングのテキストにキーワード・インデック
スを付けるステップを示す流れ図である。
【図3】 本発明の好ましい実施例による、ディジタル
・レコーディングのキーワード・インデクシングのため
に使用されるデータ・ベースの準備を示す、コンピュー
タ・ディスプレイを示す図である。
・レコーディングのキーワード・インデクシングのため
に使用されるデータ・ベースの準備を示す、コンピュー
タ・ディスプレイを示す図である。
【図4】 本発明の好ましい実施例による、ディジタル
・レコーディングのキーワード・インデクシングのため
に使用されるデータ・ベースの準備を示す、コンピュー
タ・ディスプレイを示す図である。
・レコーディングのキーワード・インデクシングのため
に使用されるデータ・ベースの準備を示す、コンピュー
タ・ディスプレイを示す図である。
【図5】 本発明の好ましい実施例による、ビデオ・ラ
イブラリのキーワード・インデックス検索に使用される
コンピュータ・ディスプレイを示す図である。
イブラリのキーワード・インデックス検索に使用される
コンピュータ・ディスプレイを示す図である。
【図6】 本発明の代替実施例による、ビデオ・ライブ
ラリのキーワード・インデックス検索に使用されるコン
ピュータ・ディスプレイを示す図である。
ラリのキーワード・インデックス検索に使用されるコン
ピュータ・ディスプレイを示す図である。
11:レコーディング・ソース 12:テキスト・ファイル 13:ディジタル化されたレコーディング・ファイル 14:コンピュータ・システム 21:コンピュータ画面 22:ウィンドウ 23:ウィンドウ 24:カーソル 41:コンピュータ画面 42:ウィンドウ 43:ウィンドウ 44:カーソル 45:表示ウィンドウ 46:ボックス 47:「検索」ボタン 48:「OK」ボタン 49:「キャンセル」ボタン 50:コントロール・パネル 51:コンピュータ画面 52:ウィンドウ 54:カーソル 55:表示ウィンドウ 56:ボックス 57:「検索」ボタン 58:「OK」ボタン 59:「キャンセル」ボタン
Claims (1)
- 【請求項1】(a)レコーディングのオーディオ部分を
筆写し、テキスト・ファイル内のテキストを作るステッ
プと、 (b)テキスト内の単語の集合のそれぞれについて、単
語の集合に含まれる各単語が出現するレコーディング内
の時刻を示すタイム・スタンプを提供するステップとを
有する、レコーディングにインデックスを付ける方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/576,106 US5794249A (en) | 1995-12-21 | 1995-12-21 | Audio/video retrieval system that uses keyword indexing of digital recordings to display a list of the recorded text files, keywords and time stamps associated with the system |
US576,106 | 1995-12-21 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH09185879A true JPH09185879A (ja) | 1997-07-15 |
Family
ID=24303014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8339510A Pending JPH09185879A (ja) | 1995-12-21 | 1996-12-19 | レコーディング・インデクシング方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US5794249A (ja) |
EP (1) | EP0780777A1 (ja) |
JP (1) | JPH09185879A (ja) |
Families Citing this family (121)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6850252B1 (en) | 1999-10-05 | 2005-02-01 | Steven M. Hoffberg | Intelligent electronic appliance system and method |
US10361802B1 (en) | 1999-02-01 | 2019-07-23 | Blanding Hovenweep, Llc | Adaptive pattern recognition based control system and method |
US6418424B1 (en) | 1991-12-23 | 2002-07-09 | Steven M. Hoffberg | Ergonomic man-machine interface incorporating adaptive pattern recognition based control system |
US6400996B1 (en) | 1999-02-01 | 2002-06-04 | Steven M. Hoffberg | Adaptive pattern recognition based control system and method |
US8352400B2 (en) | 1991-12-23 | 2013-01-08 | Hoffberg Steven M | Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore |
DE69725666T2 (de) * | 1996-03-04 | 2004-07-29 | Koninklijke Philips Electronics N.V. | Dem benutzer zugeneigtes multimediapräsentationssystem für mehrere präsentationsartikel, welche jeder als ein agent wirken |
US6961700B2 (en) * | 1996-09-24 | 2005-11-01 | Allvoice Computing Plc | Method and apparatus for processing the output of a speech recognition engine |
US6148304A (en) * | 1997-03-19 | 2000-11-14 | Microsoft Corporation | Navigating multimedia content using a graphical user interface with multiple display regions |
KR100217179B1 (ko) * | 1997-03-25 | 1999-09-01 | 윤종용 | 디지털비디오디스크 재생장치에서의 메뉴재생방법 |
US6243725B1 (en) * | 1997-05-21 | 2001-06-05 | Premier International, Ltd. | List building system |
US6025838A (en) * | 1997-07-11 | 2000-02-15 | International Business Machines Corporation | Interactive display interface for media presentation with direct access to media sequences |
WO1999005681A1 (de) * | 1997-07-23 | 1999-02-04 | Siemens Aktiengesellschaft | Verfahren zum abspeichern von suchmerkmalen einer bildsequenz und zugriff auf eine bildfolge in der bildsequenz |
WO1999005611A1 (de) * | 1997-07-23 | 1999-02-04 | Siemens Aktiengesellschaft | Verfahren zum abspeichern von suchmerkmalen einer bildsequenz |
US6360234B2 (en) * | 1997-08-14 | 2002-03-19 | Virage, Inc. | Video cataloger system with synchronized encoders |
US6567980B1 (en) | 1997-08-14 | 2003-05-20 | Virage, Inc. | Video cataloger system with hyperlinked output |
US7295752B1 (en) | 1997-08-14 | 2007-11-13 | Virage, Inc. | Video cataloger system with audio track extraction |
US6463444B1 (en) | 1997-08-14 | 2002-10-08 | Virage, Inc. | Video cataloger system with extensibility |
EP0899737A3 (en) * | 1997-08-18 | 1999-08-25 | Tektronix, Inc. | Script recognition using speech recognition |
US6665835B1 (en) * | 1997-12-23 | 2003-12-16 | Verizon Laboratories, Inc. | Real time media journaler with a timing event coordinator |
US6092038A (en) * | 1998-02-05 | 2000-07-18 | International Business Machines Corporation | System and method for providing lossless compression of n-gram language models in a real-time decoder |
US6118450A (en) * | 1998-04-03 | 2000-09-12 | Sony Corporation | Graphic user interface that is usable as a PC interface and an A/V interface |
JPH11297040A (ja) * | 1998-04-07 | 1999-10-29 | Sony Corp | 再生信号処理装置 |
US6833865B1 (en) * | 1998-09-01 | 2004-12-21 | Virage, Inc. | Embedded metadata engines in digital capture devices |
US6415326B1 (en) | 1998-09-15 | 2002-07-02 | Microsoft Corporation | Timeline correlation between multiple timeline-altered media streams |
US6622171B2 (en) | 1998-09-15 | 2003-09-16 | Microsoft Corporation | Multimedia timeline modification in networked client/server systems |
US6360237B1 (en) * | 1998-10-05 | 2002-03-19 | Lernout & Hauspie Speech Products N.V. | Method and system for performing text edits during audio recording playback |
US6445834B1 (en) | 1998-10-19 | 2002-09-03 | Sony Corporation | Modular image query system |
US6256409B1 (en) | 1998-10-19 | 2001-07-03 | Sony Corporation | Method for determining a correlation between images using multi-element image descriptors |
US6236406B1 (en) | 1998-10-21 | 2001-05-22 | Sony Corporation | Three-dimensional color space display |
US6631368B1 (en) | 1998-11-13 | 2003-10-07 | Nortel Networks Limited | Methods and apparatus for operating on non-text messages |
US6249765B1 (en) * | 1998-12-22 | 2001-06-19 | Xerox Corporation | System and method for extracting data from audio messages |
US6185527B1 (en) | 1999-01-19 | 2001-02-06 | International Business Machines Corporation | System and method for automatic audio content analysis for word spotting, indexing, classification and retrieval |
US6802041B1 (en) | 1999-01-20 | 2004-10-05 | Perfectnotes Corporation | Multimedia word processor |
US7966078B2 (en) | 1999-02-01 | 2011-06-21 | Steven Hoffberg | Network media appliance system and method |
US6272461B1 (en) | 1999-03-22 | 2001-08-07 | Siemens Information And Communication Networks, Inc. | Method and apparatus for an enhanced presentation aid |
US6502075B1 (en) * | 1999-03-26 | 2002-12-31 | Koninklijke Philips Electronics, N.V. | Auto attendant having natural names database library |
US6535848B1 (en) * | 1999-06-08 | 2003-03-18 | International Business Machines Corporation | Method and apparatus for transcribing multiple files into a single document |
US7313808B1 (en) | 1999-07-08 | 2007-12-25 | Microsoft Corporation | Browsing continuous multimedia content |
US7293280B1 (en) | 1999-07-08 | 2007-11-06 | Microsoft Corporation | Skimming continuous multimedia content |
US7110945B2 (en) | 1999-07-16 | 2006-09-19 | Dreamations Llc | Interactive book |
US6405167B1 (en) * | 1999-07-16 | 2002-06-11 | Mary Ann Cogliano | Interactive book |
US7050110B1 (en) * | 1999-10-29 | 2006-05-23 | Intel Corporation | Method and system for generating annotations video |
US7177795B1 (en) | 1999-11-10 | 2007-02-13 | International Business Machines Corporation | Methods and apparatus for semantic unit based automatic indexing and searching in data archive systems |
US6754619B1 (en) | 1999-11-15 | 2004-06-22 | Sony Corporation | Digital recording and playback system with voice recognition capability for concurrent text generation |
US7453991B1 (en) | 1999-12-08 | 2008-11-18 | At&T Corp. | Method and apparatus for voice mail notes |
EP1109390A3 (en) * | 1999-12-08 | 2003-07-09 | AT&T Corp. | System and method for browsing and searching through voicemail using automatic speech recognition |
US7310629B1 (en) | 1999-12-15 | 2007-12-18 | Napster, Inc. | Method and apparatus for controlling file sharing of multimedia files over a fluid, de-centralized network |
US6742023B1 (en) | 2000-04-28 | 2004-05-25 | Roxio, Inc. | Use-sensitive distribution of data files between users |
US6366907B1 (en) | 1999-12-15 | 2002-04-02 | Napster, Inc. | Real-time search engine |
US6928655B1 (en) * | 1999-12-16 | 2005-08-09 | Microsoft Corporation | Live presentation searching |
US7149359B1 (en) | 1999-12-16 | 2006-12-12 | Microsoft Corporation | Searching and recording media streams |
US6868440B1 (en) | 2000-02-04 | 2005-03-15 | Microsoft Corporation | Multi-level skimming of multimedia content using playlists |
US6985966B1 (en) | 2000-03-29 | 2006-01-10 | Microsoft Corporation | Resynchronizing globally unsynchronized multimedia streams |
US7237254B1 (en) | 2000-03-29 | 2007-06-26 | Microsoft Corporation | Seamless switching between different playback speeds of time-scale modified data streams |
US7222163B1 (en) * | 2000-04-07 | 2007-05-22 | Virage, Inc. | System and method for hosting of video content over a network |
US7260564B1 (en) | 2000-04-07 | 2007-08-21 | Virage, Inc. | Network video guide and spidering |
US7962948B1 (en) | 2000-04-07 | 2011-06-14 | Virage, Inc. | Video-enabled community building |
US8171509B1 (en) | 2000-04-07 | 2012-05-01 | Virage, Inc. | System and method for applying a database to video multimedia |
US7302490B1 (en) | 2000-05-03 | 2007-11-27 | Microsoft Corporation | Media file format to support switching between multiple timeline-altered media streams |
US7089301B1 (en) | 2000-08-11 | 2006-08-08 | Napster, Inc. | System and method for searching peer-to-peer computer networks by selecting a computer based on at least a number of files shared by the computer |
WO2002019147A1 (en) * | 2000-08-28 | 2002-03-07 | Emotion, Inc. | Method and apparatus for digital media management, retrieval, and collaboration |
US6839059B1 (en) | 2000-08-31 | 2005-01-04 | Interactive Video Technologies, Inc. | System and method for manipulation and interaction of time-based mixed media formats |
US20020026521A1 (en) * | 2000-08-31 | 2002-02-28 | Sharfman Joshua Dov Joseph | System and method for managing and distributing associated assets in various formats |
US6922702B1 (en) | 2000-08-31 | 2005-07-26 | Interactive Video Technologies, Inc. | System and method for assembling discrete data files into an executable file and for processing the executable file |
US6774908B2 (en) | 2000-10-03 | 2004-08-10 | Creative Frontier Inc. | System and method for tracking an object in a video and linking information thereto |
US6973256B1 (en) | 2000-10-30 | 2005-12-06 | Koninklijke Philips Electronics N.V. | System and method for detecting highlights in a video program using audio properties |
JP2002157112A (ja) * | 2000-11-20 | 2002-05-31 | Teac Corp | 音声情報変換装置 |
US20020091840A1 (en) * | 2000-11-28 | 2002-07-11 | Gregory Pulier | Real-time optimization of streaming media from a plurality of media sources |
US7210157B2 (en) | 2000-12-18 | 2007-04-24 | Koninklijke Philips Electronics N.V. | Apparatus and method of program classification using observed cues in the transcript information |
US6798912B2 (en) | 2000-12-18 | 2004-09-28 | Koninklijke Philips Electronics N.V. | Apparatus and method of program classification based on syntax of transcript information |
US7225126B2 (en) | 2001-06-12 | 2007-05-29 | At&T Corp. | System and method for processing speech files |
US20040205116A1 (en) * | 2001-08-09 | 2004-10-14 | Greg Pulier | Computer-based multimedia creation, management, and deployment platform |
US7089575B2 (en) | 2001-09-04 | 2006-08-08 | Koninklijke Philips Electronics N.V. | Method of using transcript information to identify and learn commercial portions of a program |
US20030098869A1 (en) * | 2001-11-09 | 2003-05-29 | Arnold Glenn Christopher | Real time interactive video system |
US7725467B2 (en) * | 2002-03-29 | 2010-05-25 | Sony Corporation | Information search system, information processing apparatus and method, and information search apparatus and method |
DE10337825A1 (de) * | 2002-11-15 | 2004-06-03 | Siemens Ag | Verfahren zur Erzeugung eines Bitstroms aus einem Indizierungsbaum |
US20080082581A1 (en) * | 2002-12-31 | 2008-04-03 | Momindum | Process and system for the production of a multimedia edition on the basis of oral presentations |
FR2849564B1 (fr) * | 2002-12-31 | 2005-04-15 | Droit In Situ | Procede et systeme pour produire une edition multimedia sur la base de prestations orales |
US7516070B2 (en) * | 2003-02-19 | 2009-04-07 | Custom Speech Usa, Inc. | Method for simultaneously creating audio-aligned final and verbatim text with the assistance of a speech recognition program as may be useful in form completion using a verbal entry method |
US20050013589A1 (en) * | 2003-07-14 | 2005-01-20 | Microsoft Corporation | Adding recording functionality to a media player |
JP2006099740A (ja) * | 2004-09-02 | 2006-04-13 | Olympus Corp | 情報提供装置、端末装置、情報提供システム及び情報提供方法 |
WO2006057896A2 (en) * | 2004-11-22 | 2006-06-01 | Bravobrava, L.L.C. | System and method for assisting language learning |
US8272874B2 (en) * | 2004-11-22 | 2012-09-25 | Bravobrava L.L.C. | System and method for assisting language learning |
US8033831B2 (en) * | 2004-11-22 | 2011-10-11 | Bravobrava L.L.C. | System and method for programmatically evaluating and aiding a person learning a new language |
US8221126B2 (en) * | 2004-11-22 | 2012-07-17 | Bravobrava L.L.C. | System and method for performing programmatic language learning tests and evaluations |
US7912827B2 (en) * | 2004-12-02 | 2011-03-22 | At&T Intellectual Property Ii, L.P. | System and method for searching text-based media content |
US7617188B2 (en) * | 2005-03-24 | 2009-11-10 | The Mitre Corporation | System and method for audio hot spotting |
US7840589B1 (en) * | 2005-05-09 | 2010-11-23 | Surfwax, Inc. | Systems and methods for using lexically-related query elements within a dynamic object for semantic search refinement and navigation |
US8156114B2 (en) | 2005-08-26 | 2012-04-10 | At&T Intellectual Property Ii, L.P. | System and method for searching and analyzing media content |
US20070061728A1 (en) * | 2005-09-07 | 2007-03-15 | Leonard Sitomer | Time approximation for text location in video editing method and apparatus |
US20090048860A1 (en) * | 2006-05-08 | 2009-02-19 | Corbis Corporation | Providing a rating for digital media based on reviews and customer behavior |
US20070271202A1 (en) * | 2006-05-08 | 2007-11-22 | Corbis Corporation | Determining content pricing for categories of use based on extrinsic and intrinsic factors |
US7620551B2 (en) * | 2006-07-20 | 2009-11-17 | Mspot, Inc. | Method and apparatus for providing search capability and targeted advertising for audio, image, and video content over the internet |
US8341152B1 (en) | 2006-09-12 | 2012-12-25 | Creatier Interactive Llc | System and method for enabling objects within video to be searched on the internet or intranet |
US7933765B2 (en) * | 2007-01-25 | 2011-04-26 | Corbis Corporation | Cross-lingual information retrieval |
AU2008260048B2 (en) * | 2007-05-30 | 2012-09-13 | Creatier Interactive, Llc | Method and system for enabling advertising and transaction within user generated video content |
US8073828B2 (en) | 2007-06-14 | 2011-12-06 | Curbis Corporation | Licensed rights clearance and tracking for digital assets |
US8781996B2 (en) | 2007-07-12 | 2014-07-15 | At&T Intellectual Property Ii, L.P. | Systems, methods and computer program products for searching within movies (SWiM) |
US9405823B2 (en) * | 2007-07-23 | 2016-08-02 | Nuance Communications, Inc. | Spoken document retrieval using multiple speech transcription indices |
US8831946B2 (en) * | 2007-07-23 | 2014-09-09 | Nuance Communications, Inc. | Method and system of indexing speech data |
US8219494B1 (en) | 2007-08-16 | 2012-07-10 | Corbis Corporation | End-to-end licensing of digital media assets |
US8341195B1 (en) | 2007-10-04 | 2012-12-25 | Corbis Corporation | Platform for managing media assets for multi-model licensing over multi-level pricing and asset grouping |
JP2009163643A (ja) * | 2008-01-09 | 2009-07-23 | Sony Corp | 映像検索装置、編集装置、映像検索方法およびプログラム |
US9817829B2 (en) | 2008-10-28 | 2017-11-14 | Adobe Systems Incorporated | Systems and methods for prioritizing textual metadata |
US8972269B2 (en) | 2008-12-01 | 2015-03-03 | Adobe Systems Incorporated | Methods and systems for interfaces allowing limited edits to transcripts |
US9071949B2 (en) | 2009-04-28 | 2015-06-30 | At&T Mobility Ii Llc | Data extraction from a call |
US9489577B2 (en) * | 2009-07-27 | 2016-11-08 | Cxense Asa | Visual similarity for video content |
JP5257330B2 (ja) * | 2009-11-06 | 2013-08-07 | 株式会社リコー | 発言記録装置、発言記録方法、プログラム及び記録媒体 |
CA2795812A1 (en) * | 2010-04-07 | 2011-10-13 | Max Value Solutions INTL, LLC | Method and system for name pronunciation guide services |
US20140229393A1 (en) * | 2013-02-11 | 2014-08-14 | James E. Malackowski | Ip content discovery platform |
US9478146B2 (en) * | 2013-03-04 | 2016-10-25 | Xerox Corporation | Method and system for capturing reading assessment data |
KR102108893B1 (ko) | 2013-07-11 | 2020-05-11 | 엘지전자 주식회사 | 이동 단말기 |
CN104301771A (zh) | 2013-07-15 | 2015-01-21 | 中兴通讯股份有限公司 | 视频文件播放进度的调整方法及装置 |
US20150142444A1 (en) * | 2013-11-15 | 2015-05-21 | International Business Machines Corporation | Audio rendering order for text sources |
US10095689B2 (en) * | 2014-12-29 | 2018-10-09 | International Business Machines Corporation | Automated ontology building |
JP6165913B1 (ja) * | 2016-03-24 | 2017-07-19 | 株式会社東芝 | 情報処理装置、情報処理方法およびプログラム |
CN106128460A (zh) * | 2016-08-04 | 2016-11-16 | 周奇 | 一种录音标记方法及装置 |
US10546011B1 (en) * | 2016-09-23 | 2020-01-28 | Amazon Technologies, Inc. | Time code to byte indexer for partial object retrieval |
US10845956B2 (en) | 2017-05-31 | 2020-11-24 | Snap Inc. | Methods and systems for voice driven dynamic menus |
CN109246472A (zh) * | 2018-08-01 | 2019-01-18 | 平安科技(深圳)有限公司 | 视频播放方法、装置、终端设备及存储介质 |
US11328031B2 (en) * | 2020-07-11 | 2022-05-10 | International Business Machines Corporation | Automatically generated timestamps based on comment |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01253027A (ja) * | 1988-04-01 | 1989-10-09 | Nippon Telegr & Teleph Corp <Ntt> | データベースアドレス算出装置 |
US5136655A (en) * | 1990-03-26 | 1992-08-04 | Hewlett-Pacard Company | Method and apparatus for indexing and retrieving audio-video data |
US5172281A (en) * | 1990-12-17 | 1992-12-15 | Ardis Patrick M | Video transcript retriever |
GB9100732D0 (en) * | 1991-01-14 | 1991-02-27 | Xerox Corp | A data access system |
EP0507743A3 (en) * | 1991-04-04 | 1993-01-13 | Stenograph Corporation | Information storage and retrieval systems |
DE69232407T2 (de) * | 1991-11-18 | 2002-09-12 | Toshiba Kawasaki Kk | Sprach-Dialog-System zur Erleichterung von Rechner-Mensch-Wechselwirkung |
JPH0756652B2 (ja) * | 1992-03-24 | 1995-06-14 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 動画像のフレーム列の検索 |
JP2892901B2 (ja) * | 1992-04-27 | 1999-05-17 | インターナショナル・ビジネス・マシーンズ・コーポレイション | プレゼンテーションの獲得、管理およびプレイバック用自動化システム及び方法 |
US5404316A (en) * | 1992-08-03 | 1995-04-04 | Spectra Group Ltd., Inc. | Desktop digital video processing system |
JP2986345B2 (ja) * | 1993-10-18 | 1999-12-06 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 音声記録指標化装置及び方法 |
US5606643A (en) * | 1994-04-12 | 1997-02-25 | Xerox Corporation | Real-time audio recording system for automatic speaker indexing |
US5835667A (en) * | 1994-10-14 | 1998-11-10 | Carnegie Mellon University | Method and apparatus for creating a searchable digital video library and a system and method of using such a library |
EP1253027A1 (en) * | 2001-04-27 | 2002-10-30 | V. Orlandi S.p.A. | A device for opening trailer couplings |
-
1995
- 1995-12-21 US US08/576,106 patent/US5794249A/en not_active Expired - Fee Related
-
1996
- 1996-12-12 EP EP96309056A patent/EP0780777A1/en not_active Withdrawn
- 1996-12-19 JP JP8339510A patent/JPH09185879A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US5794249A (en) | 1998-08-11 |
EP0780777A1 (en) | 1997-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH09185879A (ja) | レコーディング・インデクシング方法 | |
Arons | Hyperspeech: Navigating in speech-only hypermedia | |
US7725829B1 (en) | Media authoring and presentation | |
US7159174B2 (en) | Data preparation for media browsing | |
Rohlfing et al. | Comparison of multimodal annotation tools-workshop report | |
KR20090004990A (ko) | 인터넷 검색 기반 텔레비전을 위한 방법, 매체 및 시스템 | |
US20220093132A1 (en) | Method for acquiring video and electronic device | |
JPH10507554A (ja) | 探索できるディジタルビデオライブラリを作成する方法および装置ならびにそのようなライブラリを利用するシステムおよび方法 | |
KR20040004354A (ko) | 멀티미디어 프리젠테이션들의 자동 콘텐트 분석 및리프리젠테이션 | |
KR20080043358A (ko) | 재생 디바이스의 동작을 제어하는 방법 및 시스템 | |
JP2005266198A (ja) | 音響情報再生装置および音楽データのキーワード作成方法 | |
US20100017381A1 (en) | Triggering of database search in direct and relational modes | |
US20020143549A1 (en) | Method and apparatus for displaying and manipulating account information using the human voice | |
CN1193343C (zh) | 使终端用户能够控制处理内容信息的方法和装置 | |
JP3437617B2 (ja) | 時系列データ記録再生装置 | |
JP3279684B2 (ja) | 音声インタフェース・ビルダ・システム | |
JP2003084783A (ja) | 音楽データ再生装置、音楽データ再生方法、音楽データ再生プログラム、並びに音楽データ再生プログラムを記録した記録媒体 | |
JP3896760B2 (ja) | 対話記録編集装置、方法及び記憶媒体 | |
JPH03291752A (ja) | データ検索装置 | |
Arons | Authoring and transcription tools for speech-based hypermedia systems | |
JP2006189799A (ja) | 選択可能な音声パターンの音声入力方法及び装置 | |
JP4080965B2 (ja) | 情報提示装置及び情報提示方法 | |
JPH05265695A (ja) | ユーザインタフェース手段を有する装置 | |
JP2006195900A (ja) | マルチメディアコンテンツ生成装置及び方法 | |
JP2001094912A (ja) | 録画再生処理方法、装置及び録画再生処理システム |