JPH09185879A - レコーディング・インデクシング方法 - Google Patents

レコーディング・インデクシング方法

Info

Publication number
JPH09185879A
JPH09185879A JP8339510A JP33951096A JPH09185879A JP H09185879 A JPH09185879 A JP H09185879A JP 8339510 A JP8339510 A JP 8339510A JP 33951096 A JP33951096 A JP 33951096A JP H09185879 A JPH09185879 A JP H09185879A
Authority
JP
Japan
Prior art keywords
recording
text
keyword
word
window
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8339510A
Other languages
English (en)
Inventor
Garry S Orsolini
ギャリー・エス・オーソリーニ
Richard D Bowers
リチャード・ディー・ボワーズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HP Inc
Original Assignee
Hewlett Packard Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Co filed Critical Hewlett Packard Co
Publication of JPH09185879A publication Critical patent/JPH09185879A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
    • G11B27/3036Time code signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/917Text
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Television Signal Processing For Recording (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Abstract

(57)【要約】 【課題】ディジタル・オーディオ・レコーディングの内
容検索をする方法を提供する 【解決手段】レコーディングのオーディオ部分を筆写(t
ranscribe)して、テキスト・ファイル内のテキストを作
成し、筆写の後に、タイム・スタンプをテキスト内の各
単語に関連付け、単語とそれに関連するタイム・スタン
プを、平衡木に配置する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディジタル・オーディ
オおよびオーディオ-ビデオ・レコーディング内での内
容検索の実行に関し、具体的には、ディジタル・オーデ
ィオおよびオーディオ-ビデオ・レコーディングのイン
デクシングでのキーワードの使用に関する。
【0002】
【従来の技術】記憶技術と圧縮技術の改良によって、マ
ルチメディアの革命がもたらされた。オーディオ・レコ
ーディングには、現在、ディジタル形式で記憶されるこ
とがしばしばである。さらに、現在では、1本の映画全
体を再生のためディジタル・オーディオ-ビデオ(ビデ
オ)・レコーディングに変換することも可能である。デ
ィジタル・ビデオを使用すると、ユーザは、既製品のソ
フトウェア製品を使用して、全画面フル・モーション・
ビデオ・レコーディングをアクセスし、編集することが
できる。
【0003】コンピュータのディジタル・オーディオお
よびオーディオ-ビデオ・レコーディングを操作する能
力を最大に活用するためには、内容検索を実行する方法
があることが望ましい。現在、内容検索を実行する能力
は、非常に制限されているか、存在しない。
【0004】当技術分野では、画像の内容検索を実行す
る制限された能力が存在する。たとえば、米国カリフォ
ルニア州サンノゼ、ハリーロード650(650 Harry Ro
ad,San Jose, California 95120)所在のIBM Corporati
on社によるQBIC Projectを参照されたい。しかし、この
ような内容に対する画像の検索は、視覚的な内容に制限
され、ディジタル・オーディオ・レコーディングに対す
る内容検索を実行する能力はない。
【0005】
【発明が解決しようとする課題】本発明の目的は上記問
題点を解決し、ディジタル・オーディオ・レコーディン
グの効率的な内容検索方法を提供することである。
【0006】
【課題を解決するための手段】本発明の好ましい実施例
によれば、レコーディングがキーワードによってインデ
クシングされる。インデクシングを実行するために、レ
コーディングのオーディオ部分を筆写(transcribe)し
て、テキスト・ファイル内のテキストを作成する。筆写
は、たとえば筆写者によるマニュアル操作や、音声認識
技術を使用して実行できる。各タイム・スタンプは、関
連付けられた単語が現れるレコーディング内の時刻を示
す。このタイム・スタンプは、たとえば音声認識技術を
使用して、テキスト・ファイルに追加することができ
る。
【0007】その代わりに、コンピュータ・システムを
使用して操作員がタイム・スタンプをテキスト・ファイ
ルに追加することができる。たとえば、テキストを、コ
ンピュータ・ディスプレイの第1ウィンドウに表示す
る。レコーディングを、コンピュータ・ディスプレイの
第2ウィンドウに表示する。操作員が第1ウィンドウ内
のテキストの選択された単語を選択した時に、レコーデ
ィングの先頭から操作員による選択された単語の選択ま
での経過時間を示すタイム・スタンプを、テキスト・フ
ァイルに追加する。この形または他の何らかの方法によ
って操作員がテキストの単語の部分集合にタイム・スタ
ンプを割り当てた後に、補間を使用して、操作員によっ
てタイム・スタンプを割り当てられた単語の部分集合に
含まれないテキストの残りの単語に、タイム・スタンプ
を割り当てることができる。
【0008】テキストの各単語にタイム・スタンプが割
り当てられた後に、検索プログラムによる効率的なアク
セスのために、単語とそれに関連するタイム・スタンプ
を、平衡木に配置することができる。平衡木の代わり
に、他の検索技法を使用することができる。たとえば、
2進木を使用することができる。
【0009】本発明の好ましい実施例では、それぞれが
上で述べた関連テキスト・ファイルを作成されている複
数のレコーディングのキーワード検索も提供される。ユ
ーザによるキーワードの選択に応答して、各レコーディ
ングのテキスト・ファイル/平衡木を、キーワードの出
現に関して検索する。検索の最後に、キーワードの出現
を含むレコーディングのそれぞれがリストされる。ユー
ザが、第1のレコーディングとキーワードの特定の出現
を選択した時に、第1のレコーディングが、第1のレコ
ーディングのそのキーワードの特定の出現に関連する第
1のタイム・スタンプに対応する時刻の少し前から再生
される。
【0010】たとえば、キーワードを検索した後に、レ
コーディングは、次のようにリストされる。キーワード
の出現を含むレコーディングのリストが、コンピュータ
・ディスプレイの第1ウィンドウに表示される。第1ウ
ィンドウに表示されたレコーディングのリストから、レ
コーディングの1つが強調表示される。ユーザは、どの
レコーディングを強調表示するかを選択することができ
る。1実施例では、ユーザが特定のレコーディングを選
択すると、そのレコーディング内で時間的に最初に出現
するキーワードが再生される。キーストローク・コマン
ドを使用して、他の出現にジャンプすることができる。
代替実施例では、第1ウィンドウに表示されたレコーデ
ィングが強調表示される時に、強調表示されたレコーデ
ィングに含まれるキーワードの出現のそれぞれがリスト
される。これは、たとえばコンピュータ・ディスプレイ
の第2ウィンドウで行うことができる。
【0011】本発明の好ましい実施例に対して、さまざ
まな変形を行うことができる。たとえば、単一のキーワ
ードに対する検索が可能になるだけでなく、ブール論理
によって連結された複数のキーワードに対する検索を実
行したり、概念に対する検索を実行することができる。
【0012】本発明を用いると、レコーディングの効率
的な内容検索が可能になる。このような内容検索は、レ
コーディングをインデクシングするために現在使用可能
な他の方式に対する大きな改良である。
【0013】
【実施例】図1に、ディジタル・レコーディングのキー
ワード・インデクシングを可能にするために実行される
ステップを示す。レコーディング・ソース11をディジ
タル化し、圧縮して、ディジタル化されたレコーディン
グ・ファイル13を作る。レコーディング・ソース11
は、たとえば、オーディオ・レコーディングまたはオー
ディオ-ビデオ・レコーディングである。レコーディン
グ・ソース11がオーディオ-ビデオ・レコーディング
の時には、ディジタル化されたレコーディング・ファイ
ル13のデータは、たとえばMPEG−1フォーマット
で格納される。ディジタル化されたレコーディング・フ
ァイル13は、たとえば米国カリフォルニア州パロアル
ト、ヒルビュー・アベニュー3450(3450 Hillview
Ave.,Palo Alto, CA 94304)所在のOptiVision社から入
手できるOptiVideo MPEG 1 Encoderを使用して、アナロ
グのレコーディング・ソース11から作ることができ
る。
【0014】さらに、レコーディング・ソース11のオ
ーディオ部分を筆写して、そのテキストを含むテキスト
・ファイル12を作る。筆写は、マニュアル操作で行う
ことができる。その代わりに、米国マサチューセッツ州
ニュートン、ネバダ・ストリート320(320 Nevada S
treet, Newton, MA 02160)所在のDragon Systems, In
c.社から入手できるDragonDictate for Windowsなどの
コンピュータ化された音声認識技術を使用して、レコー
ディング・ソース11またはディジタル化されたレコー
ディング・ファイル13から、レコーディング・ソース
11のオーディオ部分を直接に書写することができる。
その後、テキスト・ファイル12とディジタル化された
レコーディング・ファイル13を、コンピュータ・シス
テム14で使用できるようにする。
【0015】図2は、ディジタル化されたレコーディン
グ・ファイル13のテキストにキーワード・インデック
スを付けるためのステップを示す流れ図である。ステッ
プ31で、ディジタル化されたレコーディング・ファイ
ル13のオーディオ部分であるテキストを作成する。こ
のテキストは、上で述べた筆写の結果である。
【0016】図3は、筆写処理の結果を示す図である。
図3には、コンピュータ画面21内のウィンドウ23が
示されている。ウィンドウ23内には、ディジタル化さ
れたレコーディング・ファイル13のオーディオ部分を
筆写したテキストがある。
【0017】ステップ32(図2に図示)で、テキスト
内の単語に関連するタイム・スタンプが、筆写されたテ
キストに追加される。好ましい実施例では、タイム・ス
タンプは、ミリ秒単位であり、ディジタル化されたレコ
ーディング・ファイル13内のディジタル・レコーディ
ングの開始点に対する相対的な時間の経過を示す。
【0018】タイム・スタンプの配置は、たとえば、コ
ンピュータ・システム14(図1に図示)上で、タイム
・スタンプを追加するために特に設計されたソフトウェ
アを使用して、操作員の助けを得て実行することができ
る。たとえば、レコーディングをコンピュータ・システ
ム14によって再生する。オーディオ-ビデオ・レコー
ディングの場合、図3に示されるように、コンピュータ
画面21内のウィンドウ22を追加し、ここでオーディ
オ-ビデオ・レコーディングを再生することができる。
コンピュータ・システム14の操作員は、カーソル24
を使用して、レコーディングがコンピュータ・システム
14によって再生される間に発声される単語を選択す
る。操作員がカーソル24を用いてウィンドウ23内の
テキストから単語を選択する時には必ず、コンピュータ
・システム14上で走行しているソフトウェアが、ディ
ジタル・レコーディングの開始点に対する相対的な時間
の経過を表す現在時間の持続時間を用いて、その単語に
タイム・スタンプを付ける。
【0019】図4に、この処理をさらに示す。図4で
は、タイム・スタンプTS1、TS2およびTS3が、
上で述べたように操作員によってウィンドウ23のテキ
ストに追加されている。代替例として、図2のステップ
32を自動化し、その結果、音声認識技術を使用して、
ウィンドウ23のテキスト内でのタイム・スタンプの配
置のトリガをかけることができる。
【0020】ウィンドウ23のテキストにタイム・スタ
ンプが追加された後に、図2のステップ33で、ウィン
ドウ23のテキストのすべての単語にタイム・スタンプ
を割り当てる。ステップ32でタイム・スタンプを割り
当てられなかった単語については、補間を使用して適当
なタイム・スタンプを決定する。
【0021】たとえば、下の表1には、ステップ32を
完了した後の、ウィンドウ23のテキストの一部が示さ
れている。
【0022】
【表1】
【0023】表1に示された例では、単語"Once"が、デ
ィジタル・レコーディングのオーディオ・トラックの先
頭から11ミリ秒で発声されている。単語"time"は、デ
ィジタル・レコーディングのオーディオ・トラックの先
頭から20ミリ秒で発声されている。単語"boy"は、デ
ィジタル・レコーディングのオーディオ・トラックの先
頭から28ミリ秒で発声されている。単語"went"は、デ
ィジタル・レコーディングのオーディオ・トラックの先
頭から35ミリ秒で発声されている。単語"forest"は、
ディジタル・レコーディングのオーディオ・トラックの
先頭から44ミリ秒で発声されている。
【0024】残りの単語にタイム・スタンプを割り当て
るために、補間を使用する。たとえば、単語"Once"と単
語"time"の間で9ミリ秒が経過している。その"Once"
と"time"の間には、2つの単語"upon"および"a"があ
る。補間の結果として、単語"upon"には14ミリ秒、単
語"a"には17ミリ秒のタイム・スタンプが割り当てら
れる。これを行った結果、単語"Once"と単語"upon"の出
現の間には3ミリ秒が割り振られ、単語"upon"と単語"
a"の出現の間には3ミリ秒が割り振られ、単語"a"と単
語"time"の出現の間には3ミリ秒が割り振られることに
なる。
【0025】単語とタイム・スタンプは、出力ファイル
に置かれる。たとえば、この出力ファイルは、1単語に
ついて1行を有し、単語のタイム・スタンプと単語がタ
ブ文字で区切られるものとすることができる。下の表2
に、上の表1に示した例のテキスト・ファイルのファイ
ルの形式を示す。
【0026】
【表2】
【0027】代替例として、ステップ32で、たとえば
音声認識技術を使用して、すべての単語にタイム・スタ
ンプを割り当て、その結果、補間が不要になるようにす
ることができる。音声認識技術を使用すると、単語の筆
写とタイム・スタンプ付けを同時に行うことができる。
その代わりに、音声認識技術を別のパスで使用して、テ
キストの筆写にタイム・スタンプを追加することができ
る。テキスト内の単語にタイム・スタンプを追加するた
めに別のパスで使用される時には、音声認識ソフトウェ
アは、上で述べた補間によって、認識されなかった単語
のタイム・スタンプを追加する。
【0028】図2のステップ34で、出力ファイル内の
単語の高速アクセスを可能にする平衡木を作成する。平
衡木は、たとえば、当技術分野で既知のアルゴリズムを
使用して作成される。たとえば、セジウィック(Robert
Sedgewick)著、「Algorithms in C++」(Addison-Wes
ley Publishing Company, 1992)、第215ページから
第229ページを参照されたい。代替例として、2進木
または他の検索アルゴリズムを使用することができる。
他の実施例では、ステップ33で作成される出力ファイ
ルに対して、検索を直接に実行することができる。
【0029】ステップ34で作成された平衡木は、ディ
ジタル・レコーディングのキーワード・インデックスと
して働く。この平衡木は、ある単語が映画中で発話され
る位置を突き止めるためにアクセスされる。
【0030】たとえば、図5は、上で説明したように作
成されたキーワード・インデックスを使用するコンピュ
ータ画面51上のインターフェースを示す図である。ボ
ックス56内に、ユーザが、ブール変数によって連結さ
れた1つまたは複数のキーワードをタイプする。ウィン
ドウ52内に、そのキーワードが出現するレコーディン
グがリストされる。出現するキーワードの「ヒット」数
が、レコーディングのとなりにリストされる。好ましい
実施例では、レコーディングが、キーワード出現回数に
よって降順にリストされる。ユーザは、カーソル54、
カーソル・キーまたは他の方法を使用してレコーディン
グを選択する。あるレコーディングが、たとえば「O
K」ボタン58を使用して、ユーザによって選択される
時、選択されたレコーディング(ウィンドウ52にリス
トされる)のうちで、選択されたキーワードが最初に現
れる部分が再生される。オーディオ-ビデオ・レコーデ
ィングの場合、視覚部分は、表示ウィンドウ55に表示
される。レコーディングのこの部分は、構成可能な持続
時間(たとえば2秒)にわたって、たとえばキーワード
の出現の1秒前から、再生される。キーボード・コマン
ドを使用して、ユーザは、レコーディングの表示、早送
り、逆送り、キーワードの次の出現へのスキップ、キー
ワードの前の出現へのバック、再生の継続などを行うこ
とができる。このインターフェースには、「キャンセ
ル」ボタン59も含まれる。
【0031】図5のインターフェースを拡張して、追加
機能を含めることができる。たとえば、図6は、上で説
明したように作成されたキーワード・インデックスを使
用するコンピュータ画面41上のインターフェースを示
す図である。ボックス46内に、ユーザが、ブール変数
によって連結された1つまたは複数のキーワードをタイ
プする。ウィンドウ42内に、そのキーワードが現れる
レコーディングがリストされる。あるレコーディングで
のキーワードの出現回数が、レコーディングのとなりに
リストされる。好ましい実施例では、レコーディング
は、キーワード出現回数によって降順にリストされる。
ユーザは、カーソル44、カーソル・キーまたは他の方
法を使用してレコーディングを選択する。レコーディン
グが選択された時、ウィンドウ43内に、キーワードの
出現のすべてのリストがリストされる。1実施例では、
テキストの断片が、タイム・スタンプと共に出現ごとに
表示される。その代わりに、キーワードとタイム・スタ
ンプだけ、または、タイム・スタンプだけが、出現ごと
に表示される。
【0032】ユーザが「OK」ボタン48ボタンを選択
すると、選択されたレコーディング(ウィンドウ42
内)のうち、選択されたキーワード(ウィンドウ43
内)が現れる部分が、ディジタル化されたレコーディン
グの表示ウィンドウ45内で再生される。レコーディン
グのこの部分は、構成可能な持続時間(たとえば2秒)
にわたって、たとえばキーワードの出現の1秒前から、
表示される。コントロール・パネル50を使用して、ユ
ーザは、レコーディングの表示、早送り、逆送り、キー
ワードの次の出現へのスキップ、キーワードの前の出現
へのバック、再生の継続などを行うことができる。この
インターフェースには、「キャンセル」ボタン49も含
まれる。
【0033】ブール変数によって連結された1つまたは
複数のキーワードの検索のほかに、ステップ34(図2
に図示)で形成された平衡木は、たとえば米国オハイオ
州クリーブランド、エッジウォーター・ドライブ111
15(11115 Edgewater Drive, Cleveland, Ohio 4410
2)所在のThunderstone Software-EPI, Inc.社から入手
できるMetamorphを使用するなど、概念に基づく検索技
法を使用して検索することもできる。
【0034】前述の議論は、本発明の例の方法および実
施例を開示し、説明するものにすぎない。当業者に理解
されるとおり、本発明は、その趣旨または本質的な特性
から逸脱することなく、他の具体的な形式で実施するこ
とができる。したがって、本発明の開示は、説明を目的
とするものであり、請求の範囲に示された本発明の範囲
を制限するものではない。
【0035】以上、本発明の実施例について詳述した
が、以下、本発明の各実施態様の例を示す。
【0036】(実施態様1) (a)レコーディングのオーディオ部分を筆写し、テキ
スト・ファイル内のテキストを作るステップと、(b)
テキスト内の単語の集合のそれぞれについて、単語の集
合に含まれる各単語が出現するレコーディング内の時刻
を示すタイム・スタンプを提供するステップとを有す
る、レコーディングにインデックスを付ける方法。
【0037】(実施態様2)前記ステップ(a)で、単
語の集合に、テキスト内のすべての単語が含まれること
を特徴とする、実施態様1に記載の方法。
【0038】(実施態様3)前記ステップ(a)が、筆
写者によってマニュアル操作で達成されることを特徴と
する、実施態様1に記載の方法。
【0039】(実施態様4)前記ステップ(a)が、音
声認識技術を使用して達成されることを特徴とする、実
施態様1に記載の方法。
【0040】(実施態様5)前記ステップ(a)および
(b)が、同時に実行されることを特徴とする、実施態
様4に記載の方法。
【0041】(実施態様6)前記ステップ(a)が、
(b.1)テキストの単語の集合の部分集合のそれぞれ
について、単語の集合の部分集合内の各単語が出現する
レコーディング内の時刻を表すタイム・スタンプを提供
するサブステップと、(b.2)単語の集合の部分集合
に含まれない、単語の集合の残りについて、単語の集合
の残りの各単語が出現するレコーディング内の時刻を表
すタイム・スタンプを補間を使用して提供するサブステ
ップとを有することを特徴とする、実施態様1に記載の
方法。
【0042】(実施態様7)レコーディングがオーディ
オ-ビデオ・レコーディングであり、前記サブステップ
(b.1)が、(b.1.1)コンピュータ・ディスプ
レイの第1ウィンドウにテキストを表示するサブステッ
プと、(b.1.2)コンピュータ・ディスプレイの第
2ウィンドウでレコーディングのビデオ部分を再生する
サブステップと、(b.1.3)操作員が第1ウィンド
ウ内のテキストの選択された単語を選択する時に、レコ
ーディングの先頭から選択された単語の操作員による選
択までの経過時間を示すタイム・スタンプをテキスト・
ファイルに追加するサブステップとを有することを特徴
とする、実施態様6に記載の方法。
【0043】(実施態様8) (c)単語の集合に含まれる各単語の出現に基づいて、
単語の集合と関連タイム・スタンプとを平衡木に配置す
るステップを有する、実施態様1に記載の方法。
【0044】(実施態様9) (c)ユーザによるキーワードの選択に応答して、キー
ワードのすべての出現について単語の集合を検索するス
テップを有する、実施態様1に記載の方法。
【0045】(実施態様10)さらに(d)前記ステッ
プ(c)で見つかったキーワードの出現のすべてをリス
トするステップと、(e)前記ステップ(d)でリスト
されたキーワードの出現のユーザによる選択に応答し
て、キーワードの選択された出現に関連するタイム・ス
タンプに対応する時刻の少し前からレコーディングを再
生するステップとを有する、実施態様9に記載の方法。
【0046】(実施態様11)前記レコーディングがオ
ーディオ・レコーディングであることを特徴とする、実
施態様9に記載の方法。
【0047】(実施態様12)前記レコーディングがオ
ーディオ-ビデオ・レコーディングであることを特徴と
する、実施態様9に記載の方法。
【0048】(実施態様13) (a)複数のレコーディングのそれぞれについて、複数
のテキスト・ファイルからの1テキスト・ファイルが、
レコーディングのオーディオ部分のテキストを含み、各
テキスト・ファイルの各単語が単語の出現の関連レコー
ディング内での近似位置を示すタイム・スタンプと関連
付けられるように、テキスト・ファイルがレコーディン
グと関連付けられることを特徴とし、ユーザによるキー
ワードの選択に応答して、キーワードの出現について複
数のテキスト・ファイルを検索するステップと、(b)
キーワードの出現を含むレコーディングをリストするス
テップと、(c)ユーザによる第1レコーディングおよ
びキーワードの特定の出現の選択の際に、第1レコーデ
ィング内のキーワードの特定の出現に関連する第1タイ
ム・スタンプに対応する時刻の少し前から第1レコーデ
ィングを再生するステップとを有する、複数のレコーデ
ィング内の選択部分をアクセスする方法。
【0049】(実施態様14)前記ステップ(c)で、
ユーザが第1レコーディングを選択する際に、第1レコ
ーディング内のキーワードの時間的に最初の出現が、キ
ーワードの特定の出現として自動的に選択されることを
特徴とする、実施態様13に記載の方法。
【0050】(実施態様15)前記ステップ(b)が、
(b.1)第1ウィンドウ内に、キーワードの出現を含
むレコーディングをリストするサブステップと、(b.
2)第1ウィンドウ内にリストされたレコーディングか
らレコーディングのうちの1つを強調表示するサブステ
ップと、(b.3)サブステップ(b.2)で強調表示
されたレコーディング内のキーワードの出現のそれぞれ
をリストするサブステップとを有することを特徴とす
る、実施態様13に記載の方法。
【0051】(実施態様16)前記各レコーディングの
オーディオ部分のテキストの単語と関連タイム・スタン
プとが、テキストの各単語の出現に基づいて平衡木に配
置されることを特徴とする、実施態様13に記載の方
法。
【0052】(実施態様17)複数のテキスト・ファイ
ルからの各テキスト・ファイルが、複数のレコーディン
グからの関連レコーディングのオーディオ部分のテキス
トを含む、複数のテキスト・ファイルと、ユーザによる
キーワードの選択に応答して、キーワードの出現につい
てテキスト・ファイルを検索するための、テキスト・フ
ァイルに結合された検索手段と、第1レコーディング内
でのユーザによるキーワードの特定の出現の選択に応答
して、第1レコーディング内のキーワードの特定の出現
に対応する時刻の少し前から第1レコーディングを再生
するための、レコーディング再生手段とを有する、複数
のレコーディング内の選択部分をアクセスするためのシ
ステム。
【0053】(実施態様18)前記各テキスト・ファイ
ル内の各単語が、単語の出現の関連レコーディング内の
近似位置を示すタイム・スタンプと関連付けられること
を特徴とする、実施態様17に記載のシステム。
【0054】(実施態様19)前記テキスト・ファイル
内のテキストが、平衡木に格納されることを特徴とす
る、実施態様17に記載のシステム。
【0055】(実施態様20)前記検索手段が、ユーザ
から特定のキーワードの指定を受け入れる第1キーワー
ド表示と、特定のキーワードの出現を含むレコーディン
グのリストを表示する第1ウィンドウとを有することを
特徴とする、実施態様17に記載のシステム。
【0056】(実施態様21)前記検索手段がさらに、
第1ウィンドウ内で強調表示されたレコーディング内の
キーワードの出現を表示する第2ウィンドウを有するこ
とを特徴とする、実施態様20に記載のシステム。
【0057】(実施態様22)前記検索手段が、ブール
論理によって連結された複数のキーワードに対する検索
の能力を有することを特徴とする、実施態様17に記載
のシステム。
【0058】(実施態様23)前記検索手段が、キーワ
ードに対する概念に基づく検索を実行する能力を有する
ことを特徴とする、実施態様17に記載のシステム。
【0059】
【発明の効果】以上のように、本発明を用いると、ディ
ジタル・オーディオ・レコーディングの効率的な内容検
索が可能になる。
【図面の簡単な説明】
【図1】 本発明の好ましい実施例による、ディジタル
・レコーディングのキーワード・インデクシングを可能
にするために行われるステップを示す図である。
【図2】 本発明の好ましい実施例による、ディジタル
・レコーディングのテキストにキーワード・インデック
スを付けるステップを示す流れ図である。
【図3】 本発明の好ましい実施例による、ディジタル
・レコーディングのキーワード・インデクシングのため
に使用されるデータ・ベースの準備を示す、コンピュー
タ・ディスプレイを示す図である。
【図4】 本発明の好ましい実施例による、ディジタル
・レコーディングのキーワード・インデクシングのため
に使用されるデータ・ベースの準備を示す、コンピュー
タ・ディスプレイを示す図である。
【図5】 本発明の好ましい実施例による、ビデオ・ラ
イブラリのキーワード・インデックス検索に使用される
コンピュータ・ディスプレイを示す図である。
【図6】 本発明の代替実施例による、ビデオ・ライブ
ラリのキーワード・インデックス検索に使用されるコン
ピュータ・ディスプレイを示す図である。
【符号の説明】
11:レコーディング・ソース 12:テキスト・ファイル 13:ディジタル化されたレコーディング・ファイル 14:コンピュータ・システム 21:コンピュータ画面 22:ウィンドウ 23:ウィンドウ 24:カーソル 41:コンピュータ画面 42:ウィンドウ 43:ウィンドウ 44:カーソル 45:表示ウィンドウ 46:ボックス 47:「検索」ボタン 48:「OK」ボタン 49:「キャンセル」ボタン 50:コントロール・パネル 51:コンピュータ画面 52:ウィンドウ 54:カーソル 55:表示ウィンドウ 56:ボックス 57:「検索」ボタン 58:「OK」ボタン 59:「キャンセル」ボタン

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】(a)レコーディングのオーディオ部分を
    筆写し、テキスト・ファイル内のテキストを作るステッ
    プと、 (b)テキスト内の単語の集合のそれぞれについて、単
    語の集合に含まれる各単語が出現するレコーディング内
    の時刻を示すタイム・スタンプを提供するステップとを
    有する、レコーディングにインデックスを付ける方法。
JP8339510A 1995-12-21 1996-12-19 レコーディング・インデクシング方法 Pending JPH09185879A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/576,106 US5794249A (en) 1995-12-21 1995-12-21 Audio/video retrieval system that uses keyword indexing of digital recordings to display a list of the recorded text files, keywords and time stamps associated with the system
US576,106 1995-12-21

Publications (1)

Publication Number Publication Date
JPH09185879A true JPH09185879A (ja) 1997-07-15

Family

ID=24303014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8339510A Pending JPH09185879A (ja) 1995-12-21 1996-12-19 レコーディング・インデクシング方法

Country Status (3)

Country Link
US (1) US5794249A (ja)
EP (1) EP0780777A1 (ja)
JP (1) JPH09185879A (ja)

Families Citing this family (121)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6850252B1 (en) 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US6418424B1 (en) 1991-12-23 2002-07-09 Steven M. Hoffberg Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US6400996B1 (en) 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
DE69725666T2 (de) * 1996-03-04 2004-07-29 Koninklijke Philips Electronics N.V. Dem benutzer zugeneigtes multimediapräsentationssystem für mehrere präsentationsartikel, welche jeder als ein agent wirken
US6961700B2 (en) * 1996-09-24 2005-11-01 Allvoice Computing Plc Method and apparatus for processing the output of a speech recognition engine
US6148304A (en) * 1997-03-19 2000-11-14 Microsoft Corporation Navigating multimedia content using a graphical user interface with multiple display regions
KR100217179B1 (ko) * 1997-03-25 1999-09-01 윤종용 디지털비디오디스크 재생장치에서의 메뉴재생방법
US6243725B1 (en) * 1997-05-21 2001-06-05 Premier International, Ltd. List building system
US6025838A (en) * 1997-07-11 2000-02-15 International Business Machines Corporation Interactive display interface for media presentation with direct access to media sequences
WO1999005681A1 (de) * 1997-07-23 1999-02-04 Siemens Aktiengesellschaft Verfahren zum abspeichern von suchmerkmalen einer bildsequenz und zugriff auf eine bildfolge in der bildsequenz
WO1999005611A1 (de) * 1997-07-23 1999-02-04 Siemens Aktiengesellschaft Verfahren zum abspeichern von suchmerkmalen einer bildsequenz
US6360234B2 (en) * 1997-08-14 2002-03-19 Virage, Inc. Video cataloger system with synchronized encoders
US6567980B1 (en) 1997-08-14 2003-05-20 Virage, Inc. Video cataloger system with hyperlinked output
US7295752B1 (en) 1997-08-14 2007-11-13 Virage, Inc. Video cataloger system with audio track extraction
US6463444B1 (en) 1997-08-14 2002-10-08 Virage, Inc. Video cataloger system with extensibility
EP0899737A3 (en) * 1997-08-18 1999-08-25 Tektronix, Inc. Script recognition using speech recognition
US6665835B1 (en) * 1997-12-23 2003-12-16 Verizon Laboratories, Inc. Real time media journaler with a timing event coordinator
US6092038A (en) * 1998-02-05 2000-07-18 International Business Machines Corporation System and method for providing lossless compression of n-gram language models in a real-time decoder
US6118450A (en) * 1998-04-03 2000-09-12 Sony Corporation Graphic user interface that is usable as a PC interface and an A/V interface
JPH11297040A (ja) * 1998-04-07 1999-10-29 Sony Corp 再生信号処理装置
US6833865B1 (en) * 1998-09-01 2004-12-21 Virage, Inc. Embedded metadata engines in digital capture devices
US6415326B1 (en) 1998-09-15 2002-07-02 Microsoft Corporation Timeline correlation between multiple timeline-altered media streams
US6622171B2 (en) 1998-09-15 2003-09-16 Microsoft Corporation Multimedia timeline modification in networked client/server systems
US6360237B1 (en) * 1998-10-05 2002-03-19 Lernout & Hauspie Speech Products N.V. Method and system for performing text edits during audio recording playback
US6445834B1 (en) 1998-10-19 2002-09-03 Sony Corporation Modular image query system
US6256409B1 (en) 1998-10-19 2001-07-03 Sony Corporation Method for determining a correlation between images using multi-element image descriptors
US6236406B1 (en) 1998-10-21 2001-05-22 Sony Corporation Three-dimensional color space display
US6631368B1 (en) 1998-11-13 2003-10-07 Nortel Networks Limited Methods and apparatus for operating on non-text messages
US6249765B1 (en) * 1998-12-22 2001-06-19 Xerox Corporation System and method for extracting data from audio messages
US6185527B1 (en) 1999-01-19 2001-02-06 International Business Machines Corporation System and method for automatic audio content analysis for word spotting, indexing, classification and retrieval
US6802041B1 (en) 1999-01-20 2004-10-05 Perfectnotes Corporation Multimedia word processor
US7966078B2 (en) 1999-02-01 2011-06-21 Steven Hoffberg Network media appliance system and method
US6272461B1 (en) 1999-03-22 2001-08-07 Siemens Information And Communication Networks, Inc. Method and apparatus for an enhanced presentation aid
US6502075B1 (en) * 1999-03-26 2002-12-31 Koninklijke Philips Electronics, N.V. Auto attendant having natural names database library
US6535848B1 (en) * 1999-06-08 2003-03-18 International Business Machines Corporation Method and apparatus for transcribing multiple files into a single document
US7313808B1 (en) 1999-07-08 2007-12-25 Microsoft Corporation Browsing continuous multimedia content
US7293280B1 (en) 1999-07-08 2007-11-06 Microsoft Corporation Skimming continuous multimedia content
US7110945B2 (en) 1999-07-16 2006-09-19 Dreamations Llc Interactive book
US6405167B1 (en) * 1999-07-16 2002-06-11 Mary Ann Cogliano Interactive book
US7050110B1 (en) * 1999-10-29 2006-05-23 Intel Corporation Method and system for generating annotations video
US7177795B1 (en) 1999-11-10 2007-02-13 International Business Machines Corporation Methods and apparatus for semantic unit based automatic indexing and searching in data archive systems
US6754619B1 (en) 1999-11-15 2004-06-22 Sony Corporation Digital recording and playback system with voice recognition capability for concurrent text generation
US7453991B1 (en) 1999-12-08 2008-11-18 At&T Corp. Method and apparatus for voice mail notes
EP1109390A3 (en) * 1999-12-08 2003-07-09 AT&T Corp. System and method for browsing and searching through voicemail using automatic speech recognition
US7310629B1 (en) 1999-12-15 2007-12-18 Napster, Inc. Method and apparatus for controlling file sharing of multimedia files over a fluid, de-centralized network
US6742023B1 (en) 2000-04-28 2004-05-25 Roxio, Inc. Use-sensitive distribution of data files between users
US6366907B1 (en) 1999-12-15 2002-04-02 Napster, Inc. Real-time search engine
US6928655B1 (en) * 1999-12-16 2005-08-09 Microsoft Corporation Live presentation searching
US7149359B1 (en) 1999-12-16 2006-12-12 Microsoft Corporation Searching and recording media streams
US6868440B1 (en) 2000-02-04 2005-03-15 Microsoft Corporation Multi-level skimming of multimedia content using playlists
US6985966B1 (en) 2000-03-29 2006-01-10 Microsoft Corporation Resynchronizing globally unsynchronized multimedia streams
US7237254B1 (en) 2000-03-29 2007-06-26 Microsoft Corporation Seamless switching between different playback speeds of time-scale modified data streams
US7222163B1 (en) * 2000-04-07 2007-05-22 Virage, Inc. System and method for hosting of video content over a network
US7260564B1 (en) 2000-04-07 2007-08-21 Virage, Inc. Network video guide and spidering
US7962948B1 (en) 2000-04-07 2011-06-14 Virage, Inc. Video-enabled community building
US8171509B1 (en) 2000-04-07 2012-05-01 Virage, Inc. System and method for applying a database to video multimedia
US7302490B1 (en) 2000-05-03 2007-11-27 Microsoft Corporation Media file format to support switching between multiple timeline-altered media streams
US7089301B1 (en) 2000-08-11 2006-08-08 Napster, Inc. System and method for searching peer-to-peer computer networks by selecting a computer based on at least a number of files shared by the computer
WO2002019147A1 (en) * 2000-08-28 2002-03-07 Emotion, Inc. Method and apparatus for digital media management, retrieval, and collaboration
US6839059B1 (en) 2000-08-31 2005-01-04 Interactive Video Technologies, Inc. System and method for manipulation and interaction of time-based mixed media formats
US20020026521A1 (en) * 2000-08-31 2002-02-28 Sharfman Joshua Dov Joseph System and method for managing and distributing associated assets in various formats
US6922702B1 (en) 2000-08-31 2005-07-26 Interactive Video Technologies, Inc. System and method for assembling discrete data files into an executable file and for processing the executable file
US6774908B2 (en) 2000-10-03 2004-08-10 Creative Frontier Inc. System and method for tracking an object in a video and linking information thereto
US6973256B1 (en) 2000-10-30 2005-12-06 Koninklijke Philips Electronics N.V. System and method for detecting highlights in a video program using audio properties
JP2002157112A (ja) * 2000-11-20 2002-05-31 Teac Corp 音声情報変換装置
US20020091840A1 (en) * 2000-11-28 2002-07-11 Gregory Pulier Real-time optimization of streaming media from a plurality of media sources
US7210157B2 (en) 2000-12-18 2007-04-24 Koninklijke Philips Electronics N.V. Apparatus and method of program classification using observed cues in the transcript information
US6798912B2 (en) 2000-12-18 2004-09-28 Koninklijke Philips Electronics N.V. Apparatus and method of program classification based on syntax of transcript information
US7225126B2 (en) 2001-06-12 2007-05-29 At&T Corp. System and method for processing speech files
US20040205116A1 (en) * 2001-08-09 2004-10-14 Greg Pulier Computer-based multimedia creation, management, and deployment platform
US7089575B2 (en) 2001-09-04 2006-08-08 Koninklijke Philips Electronics N.V. Method of using transcript information to identify and learn commercial portions of a program
US20030098869A1 (en) * 2001-11-09 2003-05-29 Arnold Glenn Christopher Real time interactive video system
US7725467B2 (en) * 2002-03-29 2010-05-25 Sony Corporation Information search system, information processing apparatus and method, and information search apparatus and method
DE10337825A1 (de) * 2002-11-15 2004-06-03 Siemens Ag Verfahren zur Erzeugung eines Bitstroms aus einem Indizierungsbaum
US20080082581A1 (en) * 2002-12-31 2008-04-03 Momindum Process and system for the production of a multimedia edition on the basis of oral presentations
FR2849564B1 (fr) * 2002-12-31 2005-04-15 Droit In Situ Procede et systeme pour produire une edition multimedia sur la base de prestations orales
US7516070B2 (en) * 2003-02-19 2009-04-07 Custom Speech Usa, Inc. Method for simultaneously creating audio-aligned final and verbatim text with the assistance of a speech recognition program as may be useful in form completion using a verbal entry method
US20050013589A1 (en) * 2003-07-14 2005-01-20 Microsoft Corporation Adding recording functionality to a media player
JP2006099740A (ja) * 2004-09-02 2006-04-13 Olympus Corp 情報提供装置、端末装置、情報提供システム及び情報提供方法
WO2006057896A2 (en) * 2004-11-22 2006-06-01 Bravobrava, L.L.C. System and method for assisting language learning
US8272874B2 (en) * 2004-11-22 2012-09-25 Bravobrava L.L.C. System and method for assisting language learning
US8033831B2 (en) * 2004-11-22 2011-10-11 Bravobrava L.L.C. System and method for programmatically evaluating and aiding a person learning a new language
US8221126B2 (en) * 2004-11-22 2012-07-17 Bravobrava L.L.C. System and method for performing programmatic language learning tests and evaluations
US7912827B2 (en) * 2004-12-02 2011-03-22 At&T Intellectual Property Ii, L.P. System and method for searching text-based media content
US7617188B2 (en) * 2005-03-24 2009-11-10 The Mitre Corporation System and method for audio hot spotting
US7840589B1 (en) * 2005-05-09 2010-11-23 Surfwax, Inc. Systems and methods for using lexically-related query elements within a dynamic object for semantic search refinement and navigation
US8156114B2 (en) 2005-08-26 2012-04-10 At&T Intellectual Property Ii, L.P. System and method for searching and analyzing media content
US20070061728A1 (en) * 2005-09-07 2007-03-15 Leonard Sitomer Time approximation for text location in video editing method and apparatus
US20090048860A1 (en) * 2006-05-08 2009-02-19 Corbis Corporation Providing a rating for digital media based on reviews and customer behavior
US20070271202A1 (en) * 2006-05-08 2007-11-22 Corbis Corporation Determining content pricing for categories of use based on extrinsic and intrinsic factors
US7620551B2 (en) * 2006-07-20 2009-11-17 Mspot, Inc. Method and apparatus for providing search capability and targeted advertising for audio, image, and video content over the internet
US8341152B1 (en) 2006-09-12 2012-12-25 Creatier Interactive Llc System and method for enabling objects within video to be searched on the internet or intranet
US7933765B2 (en) * 2007-01-25 2011-04-26 Corbis Corporation Cross-lingual information retrieval
AU2008260048B2 (en) * 2007-05-30 2012-09-13 Creatier Interactive, Llc Method and system for enabling advertising and transaction within user generated video content
US8073828B2 (en) 2007-06-14 2011-12-06 Curbis Corporation Licensed rights clearance and tracking for digital assets
US8781996B2 (en) 2007-07-12 2014-07-15 At&T Intellectual Property Ii, L.P. Systems, methods and computer program products for searching within movies (SWiM)
US9405823B2 (en) * 2007-07-23 2016-08-02 Nuance Communications, Inc. Spoken document retrieval using multiple speech transcription indices
US8831946B2 (en) * 2007-07-23 2014-09-09 Nuance Communications, Inc. Method and system of indexing speech data
US8219494B1 (en) 2007-08-16 2012-07-10 Corbis Corporation End-to-end licensing of digital media assets
US8341195B1 (en) 2007-10-04 2012-12-25 Corbis Corporation Platform for managing media assets for multi-model licensing over multi-level pricing and asset grouping
JP2009163643A (ja) * 2008-01-09 2009-07-23 Sony Corp 映像検索装置、編集装置、映像検索方法およびプログラム
US9817829B2 (en) 2008-10-28 2017-11-14 Adobe Systems Incorporated Systems and methods for prioritizing textual metadata
US8972269B2 (en) 2008-12-01 2015-03-03 Adobe Systems Incorporated Methods and systems for interfaces allowing limited edits to transcripts
US9071949B2 (en) 2009-04-28 2015-06-30 At&T Mobility Ii Llc Data extraction from a call
US9489577B2 (en) * 2009-07-27 2016-11-08 Cxense Asa Visual similarity for video content
JP5257330B2 (ja) * 2009-11-06 2013-08-07 株式会社リコー 発言記録装置、発言記録方法、プログラム及び記録媒体
CA2795812A1 (en) * 2010-04-07 2011-10-13 Max Value Solutions INTL, LLC Method and system for name pronunciation guide services
US20140229393A1 (en) * 2013-02-11 2014-08-14 James E. Malackowski Ip content discovery platform
US9478146B2 (en) * 2013-03-04 2016-10-25 Xerox Corporation Method and system for capturing reading assessment data
KR102108893B1 (ko) 2013-07-11 2020-05-11 엘지전자 주식회사 이동 단말기
CN104301771A (zh) 2013-07-15 2015-01-21 中兴通讯股份有限公司 视频文件播放进度的调整方法及装置
US20150142444A1 (en) * 2013-11-15 2015-05-21 International Business Machines Corporation Audio rendering order for text sources
US10095689B2 (en) * 2014-12-29 2018-10-09 International Business Machines Corporation Automated ontology building
JP6165913B1 (ja) * 2016-03-24 2017-07-19 株式会社東芝 情報処理装置、情報処理方法およびプログラム
CN106128460A (zh) * 2016-08-04 2016-11-16 周奇 一种录音标记方法及装置
US10546011B1 (en) * 2016-09-23 2020-01-28 Amazon Technologies, Inc. Time code to byte indexer for partial object retrieval
US10845956B2 (en) 2017-05-31 2020-11-24 Snap Inc. Methods and systems for voice driven dynamic menus
CN109246472A (zh) * 2018-08-01 2019-01-18 平安科技(深圳)有限公司 视频播放方法、装置、终端设备及存储介质
US11328031B2 (en) * 2020-07-11 2022-05-10 International Business Machines Corporation Automatically generated timestamps based on comment

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01253027A (ja) * 1988-04-01 1989-10-09 Nippon Telegr & Teleph Corp <Ntt> データベースアドレス算出装置
US5136655A (en) * 1990-03-26 1992-08-04 Hewlett-Pacard Company Method and apparatus for indexing and retrieving audio-video data
US5172281A (en) * 1990-12-17 1992-12-15 Ardis Patrick M Video transcript retriever
GB9100732D0 (en) * 1991-01-14 1991-02-27 Xerox Corp A data access system
EP0507743A3 (en) * 1991-04-04 1993-01-13 Stenograph Corporation Information storage and retrieval systems
DE69232407T2 (de) * 1991-11-18 2002-09-12 Toshiba Kawasaki Kk Sprach-Dialog-System zur Erleichterung von Rechner-Mensch-Wechselwirkung
JPH0756652B2 (ja) * 1992-03-24 1995-06-14 インターナショナル・ビジネス・マシーンズ・コーポレイション 動画像のフレーム列の検索
JP2892901B2 (ja) * 1992-04-27 1999-05-17 インターナショナル・ビジネス・マシーンズ・コーポレイション プレゼンテーションの獲得、管理およびプレイバック用自動化システム及び方法
US5404316A (en) * 1992-08-03 1995-04-04 Spectra Group Ltd., Inc. Desktop digital video processing system
JP2986345B2 (ja) * 1993-10-18 1999-12-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声記録指標化装置及び方法
US5606643A (en) * 1994-04-12 1997-02-25 Xerox Corporation Real-time audio recording system for automatic speaker indexing
US5835667A (en) * 1994-10-14 1998-11-10 Carnegie Mellon University Method and apparatus for creating a searchable digital video library and a system and method of using such a library
EP1253027A1 (en) * 2001-04-27 2002-10-30 V. Orlandi S.p.A. A device for opening trailer couplings

Also Published As

Publication number Publication date
US5794249A (en) 1998-08-11
EP0780777A1 (en) 1997-06-25

Similar Documents

Publication Publication Date Title
JPH09185879A (ja) レコーディング・インデクシング方法
Arons Hyperspeech: Navigating in speech-only hypermedia
US7725829B1 (en) Media authoring and presentation
US7159174B2 (en) Data preparation for media browsing
Rohlfing et al. Comparison of multimodal annotation tools-workshop report
KR20090004990A (ko) 인터넷 검색 기반 텔레비전을 위한 방법, 매체 및 시스템
US20220093132A1 (en) Method for acquiring video and electronic device
JPH10507554A (ja) 探索できるディジタルビデオライブラリを作成する方法および装置ならびにそのようなライブラリを利用するシステムおよび方法
KR20040004354A (ko) 멀티미디어 프리젠테이션들의 자동 콘텐트 분석 및리프리젠테이션
KR20080043358A (ko) 재생 디바이스의 동작을 제어하는 방법 및 시스템
JP2005266198A (ja) 音響情報再生装置および音楽データのキーワード作成方法
US20100017381A1 (en) Triggering of database search in direct and relational modes
US20020143549A1 (en) Method and apparatus for displaying and manipulating account information using the human voice
CN1193343C (zh) 使终端用户能够控制处理内容信息的方法和装置
JP3437617B2 (ja) 時系列データ記録再生装置
JP3279684B2 (ja) 音声インタフェース・ビルダ・システム
JP2003084783A (ja) 音楽データ再生装置、音楽データ再生方法、音楽データ再生プログラム、並びに音楽データ再生プログラムを記録した記録媒体
JP3896760B2 (ja) 対話記録編集装置、方法及び記憶媒体
JPH03291752A (ja) データ検索装置
Arons Authoring and transcription tools for speech-based hypermedia systems
JP2006189799A (ja) 選択可能な音声パターンの音声入力方法及び装置
JP4080965B2 (ja) 情報提示装置及び情報提示方法
JPH05265695A (ja) ユーザインタフェース手段を有する装置
JP2006195900A (ja) マルチメディアコンテンツ生成装置及び方法
JP2001094912A (ja) 録画再生処理方法、装置及び録画再生処理システム