JPH08227426A - データ検索装置 - Google Patents

データ検索装置

Info

Publication number
JPH08227426A
JPH08227426A JP7031977A JP3197795A JPH08227426A JP H08227426 A JPH08227426 A JP H08227426A JP 7031977 A JP7031977 A JP 7031977A JP 3197795 A JP3197795 A JP 3197795A JP H08227426 A JPH08227426 A JP H08227426A
Authority
JP
Japan
Prior art keywords
data
search
character
occurrence frequency
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7031977A
Other languages
English (en)
Other versions
JP3545824B2 (ja
Inventor
Yoshifusa Togawa
好房 外川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP03197795A priority Critical patent/JP3545824B2/ja
Priority to US08/604,605 priority patent/US5857200A/en
Publication of JPH08227426A publication Critical patent/JPH08227426A/ja
Application granted granted Critical
Publication of JP3545824B2 publication Critical patent/JP3545824B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/913Multimedia
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/917Text
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

(57)【要約】 【目的】データ検索装置に関し,動画/音声/静止画デ
ータ等を含むデータを任意の文字列で,かつ高速に検索
できるようにすることを目的とする。 【構成】検索対象データ27の動画/音声/静止画データ
にタイトルやコメント等の文字列を付加し,発生頻度記
憶部21には検索対象データ27に含まれる各文字(または
各単語)の発生頻度と先頭出現場所情報を記憶してお
く。また,次出現場所記憶部24には同一文字(同一単
語)が次に現れる検索対象データ27の位置を記憶してお
く。検索文字列が与えられたならば,発生頻度記憶部21
および次出現場所記憶部24を参照し,最も発生頻度が小
さい文字(単語)に着目して検索を行い,検索結果をメ
ディア種別に応じて検索結果出力部14により出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は,文字テキストデータ,
動画データ,音声データまたは静止画データを含むマル
チメディアデータを,ユーザが入力した文字列から効率
よく検索することを可能にしたデータ検索装置に関す
る。
【0002】近年,CD−ROM,光磁気ディスクなど
の大きな記憶容量を持つ記憶媒体の実用化に伴い,これ
らの記憶媒体に,文字テキストデータだけではなく,ア
ニメーションやビデオ等の動画データ,各種音声や音楽
等の音声データ,イメージデータやイラスト等の静止画
データを格納したデータベースを容易に構成できるよう
になってきた。これまでに,文字テキストデータに対す
る検索方式は各種のものが考えられているが,マルチメ
ディアデータに対しても簡易かつ迅速に検索することが
できる手段が必要とされる。
【0003】
【従来の技術】文字テキストデータの検索方式として
は,ユーザが入力した文字列と一致する文字列を本文デ
ータの全文について直接検索する方式と,本文データ中
の重要な単語を予めキーワードとして抽出したインデッ
クスを設け,ユーザが入力した文字列と一致するキーワ
ードをインデックスから検索して,そのキーワードから
本文データを検索をする方式とがある。本文データの全
文を直接検索する方式を全文検索方式といい,特定のキ
ーワードによるインデックスを用いた検索方式をキーワ
ード検索方式という。
【0004】全文検索方式は,ユーザが自由な検索文字
列を選択できるという利点があるが,入力された文字列
と一致する文字列を1文字単位で順に本文データと比較
して検索を行う必要があるので,検索に時間がかかると
いう欠点がある。一方,キーワード検索方式は,全文検
索方式に比べて検索速度は速くなるが,検索する単語が
限定され,ユーザが自由に検索文字列を入力して検索す
ることができないという欠点がある。
【0005】これらの問題を解決する方式として,特開
平3−260869号公報に示されているようなデータ
ベース検索方式が提案されている。この方式は,ユーザ
が自由に検索すべき文字列を入力して検索を行うことが
でき,かつ高速な検索を可能にするため,検索対象デー
タ内における文字の発生頻度と該文字の先頭出現場所ア
ドレスとを記憶する発生頻度テーブルと,前記各文字の
検索対象データにおける次アドレスを記憶する次出現場
所テーブルと,検索すべき文字列が入力されたとき,前
記発生頻度テーブルを参照して,該文字列の中で最も発
生頻度の小さい文字を抽出する文字抽出部と,該文字抽
出部で抽出された文字の出現場所アドレスを,前記発生
頻度テーブルまたは次出現場所テーブルから順次求め,
該アドレスで検索される検索対象データの文字の前後の
文字を前記文字列と比較し,該文字列を含むデータを検
索する検索処理部とを備えるものである。
【0006】しかし,この方式は文字テキストデータの
みを検索対象とするものであり,この方式では,動画デ
ータや音声データや静止画データ等のマルチメディアデ
ータを検索することができなかった。
【0007】一方,動画データや音声データや静止画デ
ータ等のマルチメディアデータを検索する方式として
は,これらのデータのタイトル等を一覧表として表示
し,メニュー化したタイトル一覧等の中からユーザに選
択させる方式や,インデックスを用いたキーワード検索
方式が一般的であった。
【0008】
【発明が解決しようとする課題】マルチメディアデータ
のタイトル等の一覧表の中から,メニューによって検索
したい情報を選択する方式は,各データに付随するコメ
ント等に含まれる自由な文字列を,検索すべき文字列と
して指定した検索を行うことができず,また動画デー
タ,音声データ,静止画データ等のメディア種別に応じ
てそれぞれ個別に一覧表が作成されるのが普通であるの
で,これらのいくつかを組み合わせたものを検索範囲と
して一度で検索することができないなどの問題があっ
た。
【0009】また,インデックスを用いたキーワード検
索方式を,マルチメディアデータの検索に利用した場
合,文字テキストデータの検索の場合と同様に,検索す
る単語が限定され,ユーザが自由に検索文字列を入力し
て検索することができないという問題があった。
【0010】本発明は,前記特開平3−260869号
公報に示されている技術を,マルチメディアデータの特
性を考慮してマルチメディアデータの検索に適用できる
ように改良することにより,従来技術の問題を解決し,
ユーザが自由に入力した文字列をもとに動画データ,音
声データ,静止画データの検索を可能にすることを目的
とする。また,文字テキストデータ,動画データ,音声
データ,静止画データのすべてを一度に検索できるよう
にするとともに,特定のメディアだけの検索も可能にす
ることを目的とする。さらに,マルチメディアデータの
高速な検索を可能にすることを目的とする。
【0011】
【課題を解決するための手段】図1は本発明の構成例を
示す図である。図1において,10はCPUおよびメモ
リ等からなる処理装置,20はCD−ROMや光磁気デ
ィスク等のデータ記憶装置,31はキーボードやマウス
等の入力装置,32は表示装置,33はスピーカ等の音
声出力装置を表す。
【0012】データ記憶装置20には,検索対象データ
27である文字テキストデータ,アニメーションやビデ
オ等の動画データ,各種音声や音楽等の音声データ,イ
メージデータやイラスト等の静止画データを記憶する検
索対象データ記憶部26がある。これらの検索対象デー
タ27のうち,動画データ,音声データまたは静止画デ
ータの各々には,タイトルもしくは説明文またはコメン
トの文字列を含む管理情報が付加される。
【0013】さらに,データ記憶装置20には,発生頻
度記憶部21および次出現場所記憶部24がある。ま
た,必要に応じて状態管理記憶部23が設けられる。発
生頻度記憶部21は,検索対象データ27に含まれる文
字または単語ごとの発生頻度とそれらの各文字または各
単語の先頭出現場所情報とを対応させて記憶する発生頻
度テーブル22を記憶するものである。また,次出現場
所記憶部24は,検索対象データ27における各文字ま
たは各単語の次に現れる同一文字または同一単語の出現
場所情報を記憶する次出現場所テーブル25を記憶する
ものである。
【0014】処理装置10における検索情報入力部11
は,入力装置31から検索すべき文字列および検索範囲
を入力する。最小発生頻度検出部12は,検索すべき文
字列が入力されたとき,発生頻度テーブル22を参照し
て,検索すべき文字列の中で最も発生頻度の小さい文字
または単語を抽出する処理手段である。
【0015】検索処理部13は,最小発生頻度検出部1
2で抽出された文字または単語についての,検索対象デ
ータ27における出現場所を,最初は発生頻度テーブル
22から,次回以降は次出現場所テーブル25から順次
求め,その検索対象データ27における出現場所の前後
の文字列と検索すべき文字列とを照合し,該文字列を含
む文字テキストデータ,動画データ,音声データまたは
静止画データのいずれかを検索する処理手段である。
【0016】検索結果出力部14は,検索処理部13に
より検索された文字テキストデータ,動画データ,音声
データまたは静止画データを,メディア種別に応じて表
示装置32または音声出力装置33に出力する。
【0017】発生頻度テーブル22および次出現場所テ
ーブル25を,マルチメディア種別もしくはマルチメデ
ィアデータに付随する管理情報の種類またはこれらの組
み合わせに応じて複数種類設けてもよい。この場合,最
小発生頻度検出部12および検索処理部13は,入力装
置31から検索情報入力部11を介して入力された検索
範囲の指定に応じて,検索に使用する発生頻度テーブル
22および次出現場所テーブル25を選択する。
【0018】さらに,マルチメディア種別もしくはマル
チメディアデータに付随する管理情報の種類またはこれ
らの組み合わせに応じた発生頻度テーブル22および次
出現場所テーブル25の種類別の有無情報を管理する状
態管理記憶部23を設け,最小発生頻度検出部12およ
び検索処理部13は,検索範囲の指定および状態管理記
憶部23の管理情報に応じて,検索に使用する発生頻度
テーブル22および次出現場所テーブル25を選択する
ようにしてもよい。
【0019】検索対象データ27が音声データである場
合,その音声データに付加されたコメント等の管理情報
中に音声の内容を文字化したデータを入れておくことに
より,音声データを文字または単語で検索できるように
することが可能である。検索結果が音声の内容を文字化
したデータを含む音声データである場合に,検索結果出
力部14は,その音声データを音声出力装置33に出力
する。
【0020】例えば,検索対象となる動画データ,音声
データまたは静止画データは,1つの連続領域からなる
検索対象データ27中に出現順に埋め込まれた形で保持
されている。
【0021】
【作用】検索情報入力部11は,ユーザから検索すべき
文字列を入力すると,最小発生頻度検出部12に通知す
る。最小発生頻度検出部12は,発生頻度テーブル22
を参照し,検索すべき文字列の中で最も発生頻度の小さ
い文字(または単語)を抽出する。検索処理部13は,
その文字(または単語)の出現場所アドレスを発生頻度
テーブル22または次出現場所テーブル25から順次求
め,そのアドレスと前後のアドレス(場合によっては前
だけまたは後だけでもよい)の文字列を検索対象データ
記憶部26から読み出す。これらの文字列と入力された
文字列とを比較し,一致する文字列を含む文字テキスト
データ,動画/音声/静止画のタイトル等の文字列,ま
たはコメントの文字列を含むデータを検索する。この検
索結果から,該当するマルチメディアデータを読み出し
て,メディア種別に応じた出力装置に出力する。
【0022】以上のように検索するので,請求項1およ
び請求項2記載の発明によれば,いわば全文検索方式と
同様に,任意の文字列をもとに各種のマルチメディアデ
ータを検索することが可能になる。しかも,発生頻度の
小さい文字または単語に着目して検索するので,検索速
度を向上させることができる。
【0023】特に,請求項2記載の発明によれば,発生
頻度テーブル22および次出現場所テーブル25を文字
ではなく単語に着目して作成するので,例えば英欧文等
の場合に,効率的な検索が可能になる。
【0024】また,請求項3記載の発明によれば,動画
データ,音声データ,静止画データの各メディアのみや
それらの組み合わせ,およびコメントやタイトル等の組
み合わせによる検索範囲の指定に応じた検索を高速化す
ることが可能になる。
【0025】さらに,請求項4記載の発明の場合,状態
管理記憶部23によって発生頻度テーブル22および次
出現場所テーブル25を,そのシステムにおいて必要な
ものに限定することができるので,事前に用意する検索
のためのデータ量を少なくすることが可能になる。
【0026】請求項5記載の発明によれば,音声データ
の内容を検索し,検索結果を聴取することができる。請
求項6記載の発明によれば,動画/音声/静止画データ
を1つの検索対象データ27の中にそのまま埋め込むの
で,マルチメディアデータだけを別に格納する場合に比
べて領域の管理が不要になり,CD−ROM等の記憶媒
体の作成がきわめて容易になる。また,検索対象データ
27において検索した文字列が存在する場所から,ポイ
ンタ等を介して遠く離れた場所へアクセスする必要がな
いので,動画/音声/静止画データの検索から表示まで
の表示速度等も向上させることができる。
【0027】
【実施例】本発明のマルチメディアデータを検索する実
施例の説明に先立ち,全体の理解を容易にするために,
文字テキストデータだけの場合の検索処理の概要を,図
2に従って説明する。
【0028】図2に示すように,検索対象データ27
が,例えば「むかしむかしからすがやまへ……」という
文字テキストデータであったとする。あらかじめ,発生
頻度テーブル22および次出現場所テーブル25を次の
ように用意する。なお,図中のA1,A2,…は,検索
対象データ27の文字の出現場所を示すアドレスであ
る。
【0029】発生頻度テーブル22には,検索対象デー
タ27に現れるすべての文字の先頭出現場所と何回現れ
るかを示す発生頻度とが,各文字ごとに登録されてい
る。例えば,文字「か」が検索対象データ27において
最初に現れる位置はA2であるので,発生頻度テーブル
22の文字「か」のエントリには,先頭出現場所として
A2のアドレス情報が格納されている。また,文字
「か」が検索対象データ27に3回現れたとすると,発
生頻度として「3」が格納されている。
【0030】次出現場所テーブル25は,検索対象デー
タ27における各文字の次に現れる同一文字の出現場所
情報を持っている。例えば,文字「か」の先頭の出現場
所はA2であり,2番目の出現場所はA5であるので,
検索対象データ27のA2の文字位置に対応する次出現
場所テーブル25のフィールドに,次の同一文字の出現
場所A5が格納されている。すなわち,次出現場所テー
ブル25は,図2に示すような同一文字のチェイン情報
を持つ。
【0031】例えば検索すべき文字として「しか」がユ
ーザから入力された場合,まず最小発生頻度検出部12
は発生頻度テーブル22を参照し,文字「し」と「か」
のうち発生頻度の小さいものを見つける。この例では,
「か」は3回,「し」は2回であるので,文字「し」が
検索文字として用いられる。
【0032】検索処理部13は,発生頻度テーブル22
から「し」の先頭出現場所がA3であることを知り,検
索対象データ27におけるA3の前後の文字列「…かし
む…」と,検索すべき文字列「しか」とが一致するかを
どうかを調べる。ここでは,一致しないので,次出現場
所テーブル25から次に「し」が出現する場所を求め
る。次に検索対象データ27の中で「し」が現れる位置
はA6であることがわかるので,検索対象データ27の
A6の前後の文字列「…かしか…」と「しか」とを比較
する。ここには一致する文字列「しか」があるので,こ
の部分を検索結果として出力する。
【0033】以上は文字テキストデータだけの場合の検
索の例であるが,本発明ではこれを以下に詳しく説明す
るように,動画データ,音声データまたは静止画データ
を含むマルチメディアデータの検索に拡張している。な
お,以下に説明する実施例では,発生頻度テーブル22
および次出現場所テーブル25を文字に着目して作成し
た場合の例を説明するが,これらを複数の文字の組み合
わせ,すなわち単語をもとに作成しても,同様に本発明
を実現することができる。
【0034】発生頻度テーブル22の構成は,図2に示
すとおりである。例えば50音順の文字が記憶されてお
り,それぞれの文字の先頭出現場所アドレスと,それぞ
れの文字の発生頻度とが50音順の文字に対応づけて記
憶されている。
【0035】次出現場所テーブル25の構成例を図3に
示す。次出現場所テーブル25には,各文字が出現順に
記憶されている検索対象データ27の各文字データに対
応して,同一文字が次に出現する位置を示す次出現場所
アドレスが格納されている。なお,図3(B)に示すよ
うに,各次出現場所アドレスに加えて,その文字が含ま
れるデータがどのようなマルチメディアデータであるか
を示す種別フラグを設ける構成としてもよい。
【0036】図4は,検索対象データ27の構成例を示
している。検索対象データ27のデータ構造は,例えば
図4(A)に示すように,文字コード列からなる文字テ
キストデータと,動画データと,音声データと,静止画
データとが混在する形になっている。すなわち,検索対
象データ27の中に,動画データ,音声データ,静止画
データが埋め込まれている。動画データ,音声データ,
静止画データには,それぞれ圧縮符号化された実データ
の前に,後述する管理情報が付加されている。これらの
マルチメディアデータの先頭には,特定の文字コードか
らなる動画/音声/静止画開始文字が付与され,通常の
文字テキストデータと区別される。
【0037】図4(A)のように,動画/音声/静止画
データを1つの検索対象データ27の中にそのまま埋め
込むことにより,CD−ROM等の記憶媒体の作成がき
わめて容易になる。また,検索時における実データへの
アクセスを高速化することができる。
【0038】図4(B)は検索対象データ27の第2の
データ構造であり,動画データ,音声データ,静止画デ
ータの実データは,他の領域にまとめて格納され,直接
検索対象となるデータ部からそれらの実データの格納領
域がポイントされる形になっている。この場合,CD−
ROM等の記憶媒体の作成時には,文字テキストデータ
等の直接検索対象になる部分と,動画/音声/静止画デ
ータとの媒体上の記憶領域を別に管理する必要がある。
【0039】図5は,動画/音声/静止画のデータ格納
形式を示す図である。図4(A)に示す検索対象データ
27の場合,各マルチメディアデータの格納形式は,図
5(A)に示すようになっており,1つのマルチメディ
アデータは,タグ情報51,タイトル等の文字列53と
その文字数52,コメント55とそのコメント長54,
動画/音声/静止画データ(実データ)57とそのデー
タ長56からなる。ここで,動画/音声/静止画データ
57を除く部分が,このマルチメディアデータの管理情
報である。
【0040】図4(B)に示す検索対象データ27の場
合には,各マルチメディアデータの格納形式は,図5
(B)に示すようになっており,図5(A)において動
画/音声/静止画データ(実データ)57とそのデータ
長56の部分が,動画/音声/静止画データ(実デー
タ)へのポインタ59とそのポインタ長58となってい
る。
【0041】図5(A),(B)におけるタグ情報51
は,図5(C)に示すように,このマルチメディアデー
タがどのようなメディア種別のデータであるかを示す動
画/音声/静止画識別情報,コメントがあるかないかを
知るための情報(フラグ),動画/静止画の中に音声が
入るか入らないかという情報(フラグ),動画/音声/
静止画データが別の位置に存在するかどうかを示す情
報,すなわち図5(A)に示す格納形式か図5(B)に
示す格納形式かを示すフラグを持っている。なお,これ
らの情報は,マルチメディアデータを使う用途により,
増やしたり減らしたりすることは可能である。
【0042】コメント長54およびコメント55を付加
するか付加しないかは,動画/音声/静止画の各データ
ごとに自由であり,タグ情報51のコメント有る無しフ
ラグによって有無が示される。例えばコメント55とし
ては,動画/音声/静止画のデータを使用するための文
字列や音声データの内容が設定可能になっている。
【0043】図5(D)は,図5(A)のデータ格納形
式をさらに詳細に示したものである。動画/音声/静止
画開始文字40に続いて,タグ情報51,タイトル等の
文字数52,タイトル等の文字列53,コメント長5
4,コメント55,データ長56,動画/音声/静止画
データ(実データ)57がある。
【0044】文字列53およびコメント55の各文字の
前に付加されている“識別”情報は,データ先頭場所,
フラグF1〜F4,動画/静止画のアドレス,音声のア
ドレスまたは時間の情報があるか否かを示すフラグであ
る。データ先頭場所は,そのマルチメディアデータの先
頭位置,すなわちタグ情報51の位置を示す。
【0045】識別=00のとき,データ先頭場所等がな
く,文字の次が文字であることを示す。識別=01のと
き,データ先頭場所の情報はなく,フラグF1〜F4,
動画/静止画のアドレス,音声のアドレスまたは時間の
情報があることを示す。識別=10のとき,文字とデー
タ先頭場所の情報だけがあることを示す。また,識別=
11のとき,文字とフラグF1〜F4,動画/静止画の
アドレス,音声のアドレスまたは時間の情報があること
を示す。なお,検索すべき文字列を照合する場合には,
この“識別”の情報の部分はマスクされ,文字のみでマ
ッチングがとられる。
【0046】F1は,動画/静止画の位置情報があるか
ないかを示すフラグであり,F1=0のとき動画/静止
画の位置情報なし,F1=1のとき動画/静止画の位置
情報あり,である。
【0047】F2は,音声位置情報があるかないかを示
すフラグであり,F2=0のとき音声の位置情報なし,
F2=1のとき音声の位置情報あり,である。F3は,
動画/静止画位置情報がアドレスか時間かを示すフラグ
であり,F3=0のときアドレス,F3=1のとき時
間,である。
【0048】F4は,音声位置情報がアドレスか時間か
を示すフラグであり,F4=0のときアドレス,F4=
1のとき時間,である。動画/静止画位置情報のアドレ
スは,相対アドレスでも絶対アドレスでも,どちらでも
よい。マルチメディアデータとして,音声のみを扱うと
か映像のみを扱うというように予め決まっている場合に
は,F1,F2のフラグはなくてもよい。
【0049】図6は,本発明の実施例における検索範囲
の説明図である。本実施例では,マルチメディアデータ
のどの部分を検索対象とするかの検索範囲を,種々選択
することが可能である。例えば,検索範囲Aが指定され
た場合,文字テキストデータ,動画データ文字列部(タ
イトル等),動画データコメント部,音声データ文字列
部(タイトル等),音声データコメント部(音声の内
容),静止画データ文字列部(タイトル等),静止画デ
ータコメント部のすべてを検索対象とする。検索範囲B
が指定された場合,文字テキストデータのみを検索す
る。検索範囲Cが指定された場合,文字テキストデータ
を除くすべての部分が検索対象となる。同様に,各検索
範囲D〜Nの指定により,種々の組み合わせで検索対象
を選択することが可能である。
【0050】図7は,状態管理記憶部23の構成例を示
す。図6に示す検索範囲の種類に応じて,発生頻度テー
ブル22および次出現場所テーブル25を複数種類用意
することにより,該当する発生頻度テーブル22および
次出現場所テーブル25を用いて,指定された検索範囲
における検索を高速化することができる。ただし,検索
範囲A〜Nのすべてに対してそれぞれ発生頻度テーブル
22および次出現場所テーブル25を設けるのは,必要
とする記憶容量が大きくなるので,使用できる記憶容量
に応じて発生頻度テーブル22/次出現場所テーブル2
5を設ける検索範囲を限定してもよい。
【0051】状態管理記憶部23は,図7に示すよう
に,各検索範囲A〜N対応の発生頻度テーブル22およ
び次出現場所テーブル25の有無情報を持つ。検索範囲
が指定された場合,状態管理記憶部23を参照して指定
された検索範囲の発生頻度テーブル22/次出現場所テ
ーブル25があるかどうかを調べ,ある場合にはその発
生頻度テーブル22/次出現場所テーブル25を使用す
る。ない場合には,他の発生頻度テーブル22/次出現
場所テーブル25を使用し,検索対象データ27にアク
セスしてから,その種別に応じて検索対象を絞り込む。
【0052】図8は,検索対象データ27の他の構成例
を示している。図8に示す例では,上述した検索対象デ
ータ27と次出現場所テーブル25とを組み合わせ,検
索対象データ27の各文字に次出現場所テーブル25の
該当エントリを付加した形になっている。次出現場所テ
ーブル25は,検索範囲A〜Nのうち,図7に示す状態
管理記憶部23で指定されたものが付加される。
【0053】図9は本発明の実施例の全体処理フローチ
ャートである。最初のステップ91では,CD−ROM
等のデータ記憶装置20から,発生頻度テーブル22,
次出現場所テーブル25および状態管理記憶部23を読
み込み,メモリに置く。なお,使用メモリ量の節減のた
め,最初に一括して読み込むのではなく,発生頻度テー
ブル22等を検索処理時に必要になった時点でメモリに
読み込むようにしてもよい。
【0054】ステップ92では,検索情報入力部11に
より入力装置31から検索すべき文字列を入力する。ま
た,ステップ93において,必要に応じて検索範囲(検
索パターン)を入力する。検索範囲の指定がない場合に
は,図6に示す検索範囲Aが指定されたものとする。す
なわち,すべてのデータを検索対象とする。
【0055】次のステップ94では,最小発生頻度検出
部12および検索処理部13により,検索範囲に応じた
検索を行う。ステップ95では,検索が成功したなら
ば,検索結果出力部14により検索結果の種別に応じ
て,文字列表示処理,動画表示処理,音声出力処理,静
止画出力処理を行う。検索が失敗したならば,検索失敗
の旨をユーザに通知する。
【0056】ステップ96では,検索の終了が指示され
たかどうかを判定し,終了が指示された場合には処理を
終了する。検索を継続する場合には,ステップ92へ戻
り,同様に処理を繰り返す。
【0057】図10は,本発明の実施例における検索処
理等のフローチャートであり,図9に示すステップ94
の処理の詳細を示したものである。入力情報として,検
索文字列と検索範囲の情報が与えられる。ステップ10
1では,検索文字列と該当する検索範囲の発生頻度テー
ブル22とを用いて,検索文字列内の最も発生頻度の小
さい文字を探し,その文字の先頭出現場所と発生頻度を
求める。求めた発生頻度は,発生頻度カウンタにセット
する。
【0058】次に,ステップ102では,発生頻度カウ
ンタの値が「0」かどうかを判定する。発生頻度カウン
タの値が「0」でなければ,ステップ103へ進む。ス
テップ103では,発生頻度テーブル22から得た先頭
出現場所のアドレス(初回のとき)または次出現場所テ
ーブル25から得た次出現場所のアドレス(2回目以
降)を用いて,データ記憶装置20の検索対象データ記
憶部26からそのアドレスの前後の文字列を読み込み,
検索文字列と比較する。
【0059】ステップ104の判定により,読み込んだ
検索対象データ27内の文字列と,指定された検索文字
列とが一致しない場合,ステップ105へ進み,検索文
字列内の発生頻度の小さい文字の検索対象データ27に
おける次の出現場所を,次出現場所テーブル25から求
める。その後,ステップ106により,発生頻度カウン
タから1を減算し,ステップ102へ戻って同様に処理
を繰り返す。
【0060】ステップ104で一致すると判定された場
合には,ステップ107へ進み,一致した部分のデータ
を取り出し,動画/音声/静止画のときは,検索した文
字に付随するデータ先頭場所をもとに,必要な管理情報
と動画/音声/静止画データの格納場所を求め,その実
データを取り出す。これを検索結果として,呼び出し元
へ復帰する。
【0061】ステップ102の判定において,発生頻度
カウンタが「0」になった場合には,検索文字列に一致
する文字列が存在しないので,検索失敗(ERROR)
として呼び出し元へ復帰する。
【0062】なお,指定された検索範囲に該当する発生
頻度テーブル22/次出現場所テーブル25がない場合
には,指定された検索範囲より広い検索範囲をカバーす
る発生頻度テーブル22/次出現場所テーブル25を用
い,ステップ104の判定において,文字列の一致の他
に検索データが検索範囲内のものかを調べることによ
り,同様に検索することができる。
【0063】図11は,本発明の実施例による動画デー
タの検索例を示す。例えば,検索画面111から検索パ
ターンとして「全て」(動画/音声/静止画を含めた全
ての検索対象)が入力され,検索文字列として「たか」
が入力されたとする。なお,検索パターンが「全て」と
いう指定は,図6に示す検索範囲Aの指定に相当する。
【0064】まず,検索文字列に含まれる文字の
「た」,「か」について,発生頻度テーブル22が参照
され,各文字の発生頻度が調べられて,これらの文字中
で検索対象データ27における発生頻度の最も小さい文
字が抽出される。この例では,文字「た」の発生頻度が
最も小さいので,その発生頻度「2」が発生頻度カウン
タ112にセットされ,さらに,発生頻度テーブル22
の文字「た」に対応して記憶されている先頭出現場所ア
ドレスA1,すなわち検索対象データ27における文字
「た」の先頭格納アドレスが求められる(図11の
)。
【0065】そのアドレスA1の前後のアドレスの文字
が,検索対象データ27から読み出され,検索文字列
「たか」と照合される。一致しなければ,次にアドレス
A1に対応する次出現場所テーブル25の次出現場所ア
ドレスが参照される。この次出現場所アドレスは,検索
対象データ27において同一文字「た」が次に現れるア
ドレスA3である。
【0066】次に,発生頻度カウンタ112の値から1
が減算され,次出現場所テーブル25から得た次出現場
所アドレスA3により,再度,検索対象データ27にお
けるアドレスA3の前後の文字列が読み出される。この
文字列と検索文字列とが照合される。ここでは,検索対
象データ27中の文字列と検索文字列「たか」とが一致
するので,検索対象データ27中の文字「た」に付随す
るデータ先頭場所A2から,検索結果である動画データ
の先頭アドレスA2(動画データのタグ情報の位置)を
知り,検索結果としてタイトル等の文字列を表示装置3
2に表示するとともに,動画データを表示装置32にビ
デオ出力する(図11の)。
【0067】この検索対象データ27の中で2番目に発
生する文字「た」の位置に対応する次出現場所テーブル
25の次出現場所アドレスには「null」が記憶され
ており,これは,それ以後の検索対象データ27には文
字「た」が出現しないことを示している。
【0068】もし,発生頻度カウンタ112の値が
「0」になっても,検索文字列と一致する文字列が見つ
からなかった場合には,検索失敗として検索画面111
に該当する文字列がないことを表示する。
【0069】図12は,本発明の実施例における音声デ
ータの構造の例を示す。音声データとして,「むかしむ
かしある……おじいさんは山にでかけました−おばあさ
んは川へでかけました」という情報が,検索対象データ
27に格納されていたとする。図12では,図5(D)
に示す形式の検索対象データ27を表している。
【0070】タグ情報51は,データが音声情報である
ことと,コメント55が存在することと,音声データを
ポインタではなく,直接,本文データ中に埋め込む形で
保持していることを示している。タイトル等の文字列5
3は「むかしのはなし」であり,その文字数52は
「7」である。これらの文字列53に付加される“識
別”フラグは「10」であり,データ先頭場所の情報が
あることを示している。このデータ先頭場所の値は,タ
グ情報51の位置を示す先頭アドレスA3である。
【0071】また,コメント長54は「38」文字であ
り,コメント55には実際の音声データを文字化した情
報が格納されている。これの文字に付加されている“識
別”フラグは「11」であり,データ先頭場所およびF
1〜F4のフラグと音声データのアドレス情報を保持す
ることを示している。例えば,先頭の「む」の文字につ
いてみると,データ先頭場所はアドレスA3である。ま
た,この「む」の文字に付加されているF1・F2・F
3・F4のフラグは「0100」であり,F2だけが
「1」である。これは音声位置情報のアドレスを持つこ
とを示している。このアドレスはA6であり,実際の音
声データ(実データ)57の先頭をポイントする。
【0072】図13は,図12に示す音声データの検索
例を示す。検索画面111から検索パターンとして「音
声内容とコメント」が指定され,検索文字列として「お
ば」が入力されたとする。この検索パターンは,図6に
示す検索範囲Iに相当する。したがって,以降の処理で
は,検索範囲Iについての発生頻度テーブル22および
次出現場所テーブル25が用いられる。
【0073】まず,検索文字列に含まれる文字の
「お」,「ば」について,発生頻度テーブル22により
発生頻度が調べられ,発生頻度の最も小さい文字が抽出
される。この例では,文字「ば」よりも「お」の発生頻
度が小さいので,文字「お」が抽出され,さらに,検索
対象データ27における文字「お」の先頭格納アドレス
A2が求められる。
【0074】そのアドレスA2の前後のアドレスの文字
が,検索対象データ27から読み出され,検索文字列
「おば」と照合される。なお,この照合ではフラグ等の
文字以外の部分はマスクして,文字部分だけが照合され
る。ここでは一致していないので,次にアドレスA2に
対応する次出現場所テーブル25のアドレスA2’に格
納された次出現場所アドレスが参照される。この次出現
場所アドレスは,検索対象データ27において同一文字
「お」が次に現れるアドレスA5である。
【0075】次に,次出現場所テーブル27から得た次
出現場所アドレスA5により,再度,検索対象データ2
7におけるアドレスA5の前後の文字列が読み出され,
この文字列と検索文字列とが照合される。ここでは,検
索対象データ27中の文字列と検索文字列「おば」とが
一致するので,検索対象データ27中の文字「お」に付
随するデータ先頭場所A3から,検索結果である音声デ
ータの先頭アドレスA3(音声データのタグ情報の位
置)を知り,検索結果としてタイトル等の文字列「むか
しのはなし」が表示装置32に表示される。それととも
に,文字「お」に付随する音声位置情報のアドレスA7
から,図12に示す実際の音声データ57の後半部分が
読み出され,「おばあさんは川へでかけました」がスピ
ーカ等の音声出力装置33に音声で出力される。
【0076】以上のように本実施例は,入力された検索
文字列の中で最も発生頻度の小さい文字に着目して検索
対象データ27を検索するようにしたので,検索対象デ
ータ27の全文を逐次検索する従来の一般的な検索方式
に比べて検索速度を向上させることができる。
【0077】また,例えば図5(A)に示すようなデー
タの格納構造によって,画像/音声/静止画データを記
憶媒体の検索対象データ27中にそのまま埋め込むこと
により,CD−ROM等のアクセスにおいて,検索対象
データ27中の検索文字列の位置の近くから動画/音声
/静止画データをそのまま取り出すことができるので,
例えば図5(B)に示すような格納構造の場合に比べ
て,ポインタで更に別の空間のデータを引っ張り出す必
要がなく,動画/音声/静止画データの検索から表示ま
での表示速度も向上させることができる。
【0078】また,キーワードによる検索ではないの
で,ユーザが自由に検索文字列を選ぶことができる。し
かも,検索対象データ27の文字データに対応させて同
一文字の次の出現場所アドレスを記憶するようにしたの
で,検索のためのデータ量をあまり増やさずに,自由な
単語/文字列による検索と検索速度の高速化の両方を実
現することができる。
【0079】CD−ROM等を制作する場合でも,キー
ワードを抽出する必要がないのでキーワードの検証等が
不要となり,制作作業が容易となる。以上の実施例の説
明では,検索すべき文字列を各文字に分解して,その中
の最小発生頻度の文字に着目して検索する例を説明した
が,例えば検索対象データ27が英語の文で作成され,
検索文字列として英文が与えられるような場合には,発
生頻度テーブル22および次出現場所テーブル25を文
字ではなく単語を単位として作成しておき,文字に代え
て単語に基づいて検索する構成とすることも可能であ
る。検索の要素を単語にした場合,文字を要素にした場
合よりも各要素の発生頻度が小さくなるので,さらに検
索の高速化が可能になる。
【0080】
【発明の効果】以上説明したように,本発明は,検索す
べき文字列の中で最も発生頻度の小さい文字または単語
に着目して,対象となるデータを検索するようにし,か
つ,動画/静止画/音声データのタイトル等の文字列や
コメント等のそれぞれを分離して検索することを可能と
したので,マルチメディアデータを高速に検索すること
ができる。また,マルチメディアデータについて,通常
のテキストの全文検索方式と同様に,ユーザが自由に選
択した検索文字列によって検索することができるので,
使い易い検索方式を実現することができる。また,動画
/音声/静止画データを検索対象データの中にそのまま
埋め込むことができるため,媒体の作成が容易となる。
【図面の簡単な説明】
【図1】本発明の構成例を示す図である。
【図2】本発明に関連する検索処理概要説明図である。
【図3】次出現場所テーブルの構成例を示す図である。
【図4】検索対象データの構成例を示す図である。
【図5】動画/音声/静止画のデータ格納形式を示す図
である。
【図6】本発明の実施例における検索範囲の説明図であ
る。
【図7】状態管理記憶部の構成例を示す図である。
【図8】検索対象データの他の構成例を示す図である。
【図9】本発明の実施例の全体処理フローチャートであ
る。
【図10】本発明の実施例における検索処理等のフロー
チャートである。
【図11】本発明の実施例による動画データの検索例を
示す図である。
【図12】本発明の実施例における音声データの構造の
例を示す図である。
【図13】図12に示す音声データの検索例を示す図で
ある。
【符号の説明】
10 処理装置 11 検索情報入力部 12 最小発生頻度検出部 13 検索処理部 14 検索結果出力部 20 データ記憶装置 21 発生頻度記憶部 22 発生頻度テーブル 23 状態管理記憶部 24 次出現場所記憶部 25 次出現場所テーブル 26 検索対象データ記憶部 27 検索対象データ 31 入力装置 32 表示装置 33 音声出力装置

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 データ検索装置において,動画データ,
    音声データもしくは静止画データのいずれか1以上,ま
    たはこれらのいずれか1以上と文字テキストデータとを
    少なくとも検索対象として含み,前記動画データ,音声
    データまたは静止画データの各々には,タイトルもしく
    は説明文またはコメントの文字列を含む管理情報が付加
    されて構成された検索対象データを記憶する検索対象デ
    ータ記憶部と,前記検索対象データに含まれる文字の発
    生頻度と該文字の先頭出現場所情報とを対応させて記憶
    する発生頻度記憶部と,前記検索対象データにおける各
    文字の次に現れる同一文字の出現場所情報を記憶する次
    出現場所記憶部と,検索すべき文字列が入力されたと
    き,前記発生頻度記憶部を参照して,該文字列の中で最
    も発生頻度の小さい文字を抽出する最小発生頻度検出部
    と,該最小発生頻度検出部で抽出された文字の前記検索
    対象データにおける出現場所を,前記発生頻度記憶部ま
    たは前記次出現場所記憶部から順次求め,その検索対象
    データにおける出現場所の前後の文字列と前記検索すべ
    き文字列とを照合し,該文字列を含む文字テキストデー
    タ,動画データ,音声データまたは静止画データのいず
    れかを検索する検索処理部と,検索された文字テキスト
    データ,動画データ,音声データまたは静止画データ
    を,メディア種別に応じて出力する検索結果出力部とを
    備えたことを特徴とするデータ検索装置。
  2. 【請求項2】 データ検索装置において,検索対象とな
    る文字テキストデータ,動画データ,音声データまたは
    静止画データのうちの少なくとも複数を含み,これらの
    中の動画データ,音声データまたは静止画データの各々
    には,タイトルもしくは説明文またはコメントの文字列
    を含む管理情報が付加されて構成された検索対象データ
    を記憶する検索対象データ記憶部と,前記検索対象デー
    タに含まれる単語の発生頻度と該単語の先頭出現場所情
    報とを対応させて記憶する発生頻度記憶部と,前記検索
    対象データにおける各単語の次に現れる同一単語の出現
    場所情報を記憶する次出現場所記憶部と,検索すべき文
    字列が入力されたとき,前記発生頻度記憶部を参照し
    て,該文字列の中で最も発生頻度の小さい単語を抽出す
    る最小発生頻度検出部と,該最小発生頻度検出部で抽出
    された単語の前記検索対象データにおける出現場所を,
    前記発生頻度記憶部または前記次出現場所記憶部から順
    次求め,その検索対象データにおける出現場所の前後の
    文字列と前記検索すべき文字列とを照合し,該文字列を
    含む文字テキストデータ,動画データ,音声データまた
    は静止画データのいずれかを検索する検索処理部と,検
    索された文字テキストデータ,動画データ,音声データ
    または静止画データを,メディア種別に応じて出力する
    検索結果出力部とを備えたことを特徴とするデータ検索
    装置。
  3. 【請求項3】 請求項1または請求項2記載のデータ検
    索装置において,前記発生頻度記憶部および前記次出現
    場所記憶部を,データ種別もしくは前記管理情報の種類
    またはこれらの組み合わせに応じて複数種類有し,前記
    最小発生頻度検出部および前記検索処理部は,検索範囲
    の指定に応じて,検索に使用する前記発生頻度記憶部お
    よび前記次出現場所記憶部を選択することを特徴とする
    データ検索装置。
  4. 【請求項4】 請求項3記載のデータ検索装置におい
    て,前記データ種別もしくは前記管理情報の種類または
    これらの組み合わせに応じた前記発生頻度記憶部および
    前記次出現場所記憶部の種類別の有無情報を管理する状
    態管理記憶部を備え,前記最小発生頻度検出部および前
    記検索処理部は,検索範囲の指定および前記状態管理記
    憶部の管理情報に応じて,検索に使用する前記発生頻度
    記憶部および前記次出現場所記憶部を選択することを特
    徴とするデータ検索装置。
  5. 【請求項5】 請求項1または請求項2記載のデータ検
    索装置において,前記検索対象データにおける音声デー
    タに付加された管理情報中に音声の内容を文字化したデ
    ータを含み,前記検索結果出力部は,検索結果が前記音
    声の内容を文字化したデータを含む音声データである場
    合に,その音声データを音声出力装置に出力することを
    特徴とするデータ検索装置。
  6. 【請求項6】 請求項1または請求項2記載のデータ検
    索装置において,前記動画データ,音声データまたは静
    止画データは,1つの連続領域からなる検索対象データ
    中に出現順に埋め込まれた形で保持されていることを特
    徴とするデータ検索装置。
JP03197795A 1995-02-21 1995-02-21 データ検索装置 Expired - Fee Related JP3545824B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP03197795A JP3545824B2 (ja) 1995-02-21 1995-02-21 データ検索装置
US08/604,605 US5857200A (en) 1995-02-21 1996-02-21 Data retrieving apparatus used in a multimedia system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03197795A JP3545824B2 (ja) 1995-02-21 1995-02-21 データ検索装置

Publications (2)

Publication Number Publication Date
JPH08227426A true JPH08227426A (ja) 1996-09-03
JP3545824B2 JP3545824B2 (ja) 2004-07-21

Family

ID=12346015

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03197795A Expired - Fee Related JP3545824B2 (ja) 1995-02-21 1995-02-21 データ検索装置

Country Status (2)

Country Link
US (1) US5857200A (ja)
JP (1) JP3545824B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11259525A (ja) * 1998-03-06 1999-09-24 Ntt Data Corp 位置依存マルチメディア情報提供システム

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3282976B2 (ja) * 1996-11-15 2002-05-20 株式会社キングジム 文字情報処理装置及び方法
KR20010022749A (ko) * 1998-06-11 2001-03-26 요트.게.아. 롤페즈 가상 주크박스
JP2000184038A (ja) * 1998-12-14 2000-06-30 Pioneer Electronic Corp 選択装置
US7490092B2 (en) 2000-07-06 2009-02-10 Streamsage, Inc. Method and system for indexing and searching timed media information based upon relevance intervals
US20070011169A1 (en) * 2005-07-05 2007-01-11 Xerox Corporation Method and system for collecting data from diverse sources and transforming the collected data into a user-friendly format
US9442933B2 (en) 2008-12-24 2016-09-13 Comcast Interactive Media, Llc Identification of segments within audio, video, and multimedia items
US8713016B2 (en) * 2008-12-24 2014-04-29 Comcast Interactive Media, Llc Method and apparatus for organizing segments of media assets and determining relevance of segments to a query
US11531668B2 (en) * 2008-12-29 2022-12-20 Comcast Interactive Media, Llc Merging of multiple data sets
US8438472B2 (en) 2009-01-02 2013-05-07 Apple Inc. Efficient data structures for parsing and analyzing a document
US8176043B2 (en) 2009-03-12 2012-05-08 Comcast Interactive Media, Llc Ranking search results
US20100250614A1 (en) * 2009-03-31 2010-09-30 Comcast Cable Holdings, Llc Storing and searching encoded data
US8533223B2 (en) * 2009-05-12 2013-09-10 Comcast Interactive Media, LLC. Disambiguation and tagging of entities
US9892730B2 (en) 2009-07-01 2018-02-13 Comcast Interactive Media, Llc Generating topic-specific language models
US8423555B2 (en) 2010-07-09 2013-04-16 Comcast Cable Communications, Llc Automatic segmentation of video
US10467289B2 (en) 2011-08-02 2019-11-05 Comcast Cable Communications, Llc Segmentation of video according to narrative theme

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02206064A (ja) * 1989-02-03 1990-08-15 Hitachi Ltd 電子ファイル装置
JPH03260869A (ja) * 1990-03-12 1991-11-20 Fujitsu Ltd データ検索装置及びデータ検索方法
JPH03268064A (ja) * 1990-03-19 1991-11-28 Fujitsu Ltd データ検索装置及びデータ検索方法
JPH06119401A (ja) * 1992-10-08 1994-04-28 Hitachi Ltd サウンドデータ関連情報表示システム
JPH0721075A (ja) * 1993-06-28 1995-01-24 Matsushita Electric Ind Co Ltd マルチメディアファイリングシステム
JPH0728687A (ja) * 1993-07-15 1995-01-31 Fujitsu Ltd マルチメディア知識ベ−ス装置,及び、情報提供装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS619753A (ja) * 1984-06-26 1986-01-17 Hitachi Ltd 文書処理装置における頻発熟語の自動登録方法
US5375235A (en) * 1991-11-05 1994-12-20 Northern Telecom Limited Method of indexing keywords for searching in a database recorded on an information recording medium
JPH07113926B2 (ja) * 1992-01-27 1995-12-06 富士通株式会社 インデックスを用いた文字列検索システム及びそのインデックスの作成装置
US5325091A (en) * 1992-08-13 1994-06-28 Xerox Corporation Text-compression technique using frequency-ordered array of word-number mappers
JP3132738B2 (ja) * 1992-12-10 2001-02-05 ゼロックス コーポレーション テキスト検索方法
US5576954A (en) * 1993-11-05 1996-11-19 University Of Central Florida Process for determination of text relevancy

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02206064A (ja) * 1989-02-03 1990-08-15 Hitachi Ltd 電子ファイル装置
JPH03260869A (ja) * 1990-03-12 1991-11-20 Fujitsu Ltd データ検索装置及びデータ検索方法
JPH03268064A (ja) * 1990-03-19 1991-11-28 Fujitsu Ltd データ検索装置及びデータ検索方法
JPH06119401A (ja) * 1992-10-08 1994-04-28 Hitachi Ltd サウンドデータ関連情報表示システム
JPH0721075A (ja) * 1993-06-28 1995-01-24 Matsushita Electric Ind Co Ltd マルチメディアファイリングシステム
JPH0728687A (ja) * 1993-07-15 1995-01-31 Fujitsu Ltd マルチメディア知識ベ−ス装置,及び、情報提供装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11259525A (ja) * 1998-03-06 1999-09-24 Ntt Data Corp 位置依存マルチメディア情報提供システム

Also Published As

Publication number Publication date
US5857200A (en) 1999-01-05
JP3545824B2 (ja) 2004-07-21

Similar Documents

Publication Publication Date Title
US7921116B2 (en) Highly meaningful multimedia metadata creation and associations
US5745745A (en) Text search method and apparatus for structured documents
JP3545824B2 (ja) データ検索装置
US20080193101A1 (en) Synthesis of Composite News Stories
US20070156404A1 (en) String matching method and system using phonetic symbols and computer-readable recording medium storing computer program for executing the string matching method
US20030191645A1 (en) Statistical pronunciation model for text to speech
EP0525427A2 (en) Non-text object storage and retrieval
CN112632326B (zh) 一种基于视频脚本语义识别的视频生产方法及装置
US7010485B1 (en) Method and system of audio file searching
US7212963B2 (en) System for distinguishing names in Asian writing systems
JP3022539B1 (ja) 文書検索装置
JP2005092295A (ja) メタ情報生成方法、メタ情報生成装置、検索方法および検索装置
US20050125394A1 (en) Information search apparatus, information search method, and information recording medium on which information search program is recorded
JP3444831B2 (ja) 編集処理装置、及び編集処理プログラムが記憶された記憶媒体
JP2008097232A (ja) 音声情報検索プログラムとその記録媒体、音声情報検索システム、並びに音声情報検索方法
US20090077067A1 (en) Information processing apparatus, method, and program
JP2005234786A (ja) 映像キーワード抽出方法及び装置及びプログラム
JP3477822B2 (ja) 文書登録検索システム
JPH03260869A (ja) データ検索装置及びデータ検索方法
KR101014661B1 (ko) 멀티미디어 콘텐츠 관리 시스템 및 그 방법
JP2001101184A (ja) 構造化文書生成方法及び装置及び構造化文書生成プログラムを格納した記憶媒体
JPH0793208A (ja) データベースシステムおよびその運用方法
US20080046488A1 (en) Populating a database
US20040164989A1 (en) Method and apparatus for disclosing information, and medium for recording information disclosure program
JP2000339342A (ja) 文書検索方法および文書検索装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040406

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040409

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080416

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090416

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090416

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100416

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110416

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees