JP2000076300A - データベース構築装置及び検索エンジン - Google Patents

データベース構築装置及び検索エンジン

Info

Publication number
JP2000076300A
JP2000076300A JP10249766A JP24976698A JP2000076300A JP 2000076300 A JP2000076300 A JP 2000076300A JP 10249766 A JP10249766 A JP 10249766A JP 24976698 A JP24976698 A JP 24976698A JP 2000076300 A JP2000076300 A JP 2000076300A
Authority
JP
Japan
Prior art keywords
data
database
key
search
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10249766A
Other languages
English (en)
Inventor
Hideaki Masuguchi
秀昭 樽口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP10249766A priority Critical patent/JP2000076300A/ja
Publication of JP2000076300A publication Critical patent/JP2000076300A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 テキストデータ以外のメディアデータを基に
データベースを構築することができるデータベース構築
装置及びそのデータベースを用いた検索エンジンを提供
することを課題とする。 【解決手段】 ネットワーク上のサイトからメディアデ
ータを読み出す読み出し手段(4)と、読み出したメデ
ィアデータのうちテキストデータ以外のメディアデータ
を解析して鍵を検出する解析手段(5)と、前記鍵と前
記サイトとを対応付けてデータベース(8)を構築する
構築手段(7)とを有する検索エンジン用のデータベー
ス構築装置。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データ検索技術に
関し、特にネットワーク上のデータを基にしてデータベ
ースを構築するデータベース構築装置及びそのデータベ
ースを用いた検索エンジンに関する。
【0002】
【従来の技術】現在、インターネットが普及している。
ユーザは、インターネットに接続すれば、膨大な数のホ
ームページを見ることができる。多数のホームページの
中から、所望のホームページを探すことは困難である。
検索エンジンを用いれば、所望のホームページを検索す
ることができる。
【0003】検索エンジンは、データベースに接続され
(又はデータベースを有し)、一定の条件に該当するホ
ームページの一覧表示を行う。検索エンジンには、ロボ
ット型とディレクトリ型の2種類がある。
【0004】ロボット型検索エンジンは、世界中のサー
バを定期的に自動巡回して収集したホームページの情報
をデータベース化する。自動巡回するので、データベー
スに登録されるホームページの数が多いのが利点であ
る。データベースは、ホープページの中で使用されてい
るテキストデータ(文字データ)を基に生成される。
【0005】ホームページの検索は、ユーザが指定した
テキストデータをキーワードとして行われる。キーワー
ドが適切でない場合には、見当外れのホームページが検
索されてしまう。
【0006】ディレクトリ型検索エンジンは、ホームペ
ージの作者又は検索エンジンの管理者が登録することに
より、データベースが構築される。特定者が登録を行う
ので、データベースに登録されるホームページの数は少
ないが、その信頼性は高い。すなわち、データベースは
分類分けされているので、無関係なホームページが検索
される可能性は低い。ユーザは、キーワードを指定する
ことにより、所望のホームページを検索することができ
る。
【0007】
【発明が解決しようとする課題】従来は、テキストデー
タの通信が主であったが、近年、マルチメディアの通信
が増加してきている。例えば、テキストデータの他、楽
音データや画像データの通信が行われる。ホームページ
においても、テキストデータのみならず、楽音データや
画像データが使用されている。
【0008】しかし、検索エンジンは、テキストデータ
を検索することは可能であるが、所望の楽音データや画
像データを検索することが困難である。テキストデータ
以外のメディアデータを効率よく検索することができる
検索エンジンが望まれている。
【0009】本発明の目的は、テキストデータ以外のメ
ディアデータを基にデータベースを構築することができ
るデータベース構築装置を提供することである。
【0010】本発明の他の目的は、テキストデータ以外
のメディアデータを基に構築されたデータベースを用い
て検索を行う検索エンジンを提供することである。
【0011】
【課題を解決するための手段】本発明の一観点によれ
ば、ネットワーク上のサイトからメディアデータを読み
出す読み出し手段と、前記読み出したメディアデータの
うちテキストデータ以外のメディアデータを解析して鍵
を検出する解析手段と、前記鍵と前記サイトとを対応付
けてデータベースを構築する構築手段とを有する検索エ
ンジン用のデータベース構築装置が提供される。
【0012】本発明の他の観点によれば、テキストデー
タ以外のメディアデータに関連する鍵とそのデータが存
在するネットワーク上のサイトとを対応付けたデータベ
ースと、検索のための鍵を指定する指定手段と、前記デ
ータベースを基に前記指定された鍵に関連するテキスト
データ以外のメディアデータが存在するネットワーク上
のサイトを検索する検索手段とを有する検索エンジンが
提供される。
【0013】データベースには、テキストデータ以外の
メディアデータに関連する鍵とそのデータが存在するネ
ットワーク上のサイトとが対応付けて登録される。ユー
ザは、所定の鍵を指定することにより、その鍵に関連す
るテキストデータ以外のメディアデータが存在するネッ
トワーク上のサイトを検索することができる。
【0014】
【発明の実施の形態】図1は、本発明の実施例によるデ
ータベース構築装置の構成を示すブロック図である。
【0015】インターネット回線1には、多数のサイト
(ホームページ)2a,2b,2c,・・・が接続され
ている。以下、サイト2a,2b,2cの個々又は全て
をサイト2という。
【0016】各サイト2は、メディアデータを有する。
例えば、テキストデータ3a、楽音のウェーブデータ3
b、MIDI(musical instrument digital interfac
e)データ3c、静止画データ3d及び動画データ3e
の中の1つ又は任意の組み合わせを有する。
【0017】上記のデータは、大きく分けると、テキス
トデータ3a、楽音データ3f(ウェーブデータ3b及
びMIDIデータ3cを含む)、及び画像データ3g
(静止画データ3d及び動画データ3eを含む)に分類
される。
【0018】テキストデータ3aは、文字データであ
り、例えばHTML(hyper text markup language)形
式で記述されたテキストデータである。インターネット
上にホームページを開設する場合には、HTML形式で
記述すれば、関連する情報にリンクすることができ、さ
らに、画面に表示するイメージファイルの名前、又はリ
ンク先のサーバ名とファイル名を指定することもでき
る。
【0019】ウェーブデータ3bは、例えばマイクで楽
音を電気信号に変換し、その電気信号をアナログ形式か
らデジタル形式に変換したデータである。ウェーブデー
タ3bをアナログ形式に変換して、スピーカに供給すれ
ば、楽音を発音させることができる。ウェーブデータ3
bは、楽器音及び音声のデータを含む。
【0020】MIDIデータ3cは、複数の電子楽器間
を接続するためのMIDI規格に準拠したデータであ
り、ノートオンイベント及びノートオフイベント等を含
む。ノートオンイベントは、発音開始を指示するイベン
トであり、例えば押鍵操作により生成される。ノートオ
フイベントは、消音を指示するイベントであり、例えば
離鍵操作により生成される。
【0021】静止画データ3dは、例えばJPEG(jo
int photographic experts group)規格により圧縮され
た静止画データである。現在、パーソナルコンピュータ
やワークステーションのほとんどが、静止画の圧縮方式
としてJPEG圧縮方式を採用している。例えば、静止
画データ3dは、デジタルカメラにより生成される。
【0022】動画データ3eは、例えばMPEG(movi
ng picture experts group)規格により圧縮された動画
データである。MPEGは、さらにMPEG1、MPE
G2及びMPEG4に分けることができる。
【0023】データベース構築装置は、巡回及び解析部
6a,6b,6c、ロボット管理部7、及びデータベー
ス部8を有する。巡回及び解析部6aは、巡回ロボット
部4a及びコンテンツ解析部5aを有する。同様に、巡
回及び解析部6b及び6cは、それぞれ巡回ロボット部
4b,4c及びコンテンツ解析部5b,5cを有する。
巡回及び解析部6a,6b,6cは、3個に限定され
ず、それより少なくても多くてもよい。
【0024】以下、巡回及び解析部6a,6b,6cの
個々又は全てを、巡回及び解析部6といい、巡回ロボッ
ト部4a,4b,4cの個々又は全てを、巡回ロボット
部4といい、コンテンツ解析部5a,5b,5cの個々
又は全てを、コンテンツ解析部5という。
【0025】巡回ロボット部4は、インターネット回線
1を介して、可能な限り多くのサイト2を定期的に自動
巡回し、サイト2内のコンテンツを読み出す(ダウンロ
ードする)。すなわち、このデータベース構築装置は、
ロボット型である。コンテンツは、例えばテキストデー
タ3a、ウェーブデータ3b、MIDIデータ3c、静
止画データ3d、及び/又は動画データ3eを含む。具
体的には、巡回ロボット部4は、各サイト2のアドレス
を示すURL(uniform resource locator)を指定し、
そのサイト2内のコンテンツを読み出す。
【0026】コンテンツ解析部5は、巡回ロボット部4
が読み出したコンテンツの種類を分類する。次に、その
分類方法を説明する。
【0027】図2は、コンテンツの分類方法を示すブロ
ック図である。サイト2には、様々な種類のメディアデ
ータが含まれている。各メディアデータは、例えばテキ
ストデータ3a、ウェーブデータ3b、MIDIデータ
3c、静止画データ3d又は動画データ3eのいずれか
に分類される。
【0028】具体的な分類方法の例を3つ示す。 (1)ファイル名の拡張子を判定する方法 テキストデータ3a、ウェーブデータ3b、MIDIデ
ータ3c等は、それぞれ別のファイルに収められてい
る。各ファイルには、ファイル名が付与されている。例
えば、ファイル名は、「ABCD.html」で表され
る。ファイル名の後半部の「html」が拡張子であ
る。
【0029】拡張子が「html」又は「htm」の時
には、HTML形式で記述されたテキストデータ3aで
あると判断することができる。
【0030】拡張子が「wav」である時には、ウェー
ブデータ3bであると判断することができる。
【0031】拡張子が「mid」である時には、MID
Iデータ3cであると判断することができる。画像デー
タ3d,3eについても拡張子を基に分類することがで
きる。
【0032】(2)ファイル内のチャンクデータを判定
する方法 ファイル内には、チャンクデータが含まれているものが
ある。ファイルを実際に読み込み、そのチャンクデータ
を基にコンテンツの分類を行うことができる。
【0033】(3)MIME−TYPEを取得する方法 MIME(multipurpose internet mail extension)−
TYPEは、コンテンツのタイプを示す情報であり、H
TTP(hyper-text transfer protocol)で取得するこ
とができる。HTTPは、インターネット通信で使用さ
れるプロトコルである。
【0034】MIME−TYPEは、HTML形式のテ
キストデータ3aの場合は「text/html」、ウ
ェーブデータ3bの場合は「audio/wav」、M
IMIDデータ3cの場合は「audio/mid」又
は「smf」で表される。smfは、MIDIデータの
標準ファイル形式であるスタンダードMIDIファイル
を意味する。
【0035】図1において、データベース8には、テキ
ストデータ9a、ウェーブデータ9b、MIDIデータ
9c、静止画データ9d、及び動画データ9eの他に、
電子透かしデータ9fの各情報が登録される。次に、電
子透かしデータ9fについて説明する。
【0036】電子透かしデータは、インターネット上で
のコンテンツの不正コピーを防止するために用いられ
る。コンテンツ内には、著作権情報が電子透かしデータ
として埋め込まれる。この電子透かしデータをコンテン
ツ内から検出し、不正の有無を判定することができる。
【0037】電子透かしデータは、コンテンツ内に巧妙
に埋め込まれ、第三者には検出することができない。例
えば、電子透かし技術の一例は、本出願人の別の出願で
ある特願平9−193128号の図1及びその説明部分
に記載されている。また、特願平8−191528号及
び特願平9−148612号にも記載されている。これ
らの出願には、MIDIデータのノートオンイベント内
のベロシティに電子透かしデータを埋め込む方法が記載
されている。
【0038】電子透かしデータは、MIDIデータ3c
の他、ウェーブデータ3b、静止画データ3d及び動画
データ3eに埋め込むこともできる。
【0039】図1に示すコンテンツ解析部5は、コンテ
ンツを解析し、MIDIデータ3c等から電子透かしデ
ータを検出することができる。
【0040】コンテンツ解析部5は、分類されたコンテ
ンツ毎に、以下のコンテンツの内容を解析する。
【0041】(1)MIDIデータ MIDIデータは、プログラムチェンジ、キーイベント
及びメタイベントを含む。プログラムチェンジは音色を
示すので、プログラムチェンジを解析することにより、
音色をデータベースの登録項目にすることができる。
【0042】キーイベントは、発音開始を表すキーオン
イベントと消音を表すキーオフイベントに分けることが
できる。キーイベントは、キーコード(音高)及びベロ
シティ(音量)を含む。キーコード及びベロシティを登
録項目にする他、前のキーとの差分値、全てのキーにつ
いての平均値、分散、最大値又は最小値を登録項目にす
ることができる。
【0043】メタイベントは、テンポ、拍子、曲調、シ
ーケンサの種類等を表すので、メタイベントを解析する
ことにより、それらを登録項目にすることができる。
【0044】典型的フレーズを検出して、それを登録項
目にすることができる。典型的フレーズは、いわゆる
「さび」に相当し、高い頻度で繰り返し現れるフレーズ
又は類似したパターンが高い頻度で表れるフレーズであ
る。典型的フレーズを登録すれば、ユーザはそのフレー
ズを鍵(キー)として検索することが可能になる。後に
説明する検索では、入力されたフレーズ又はそれに近い
ものを検索して、リストアップすることができる。
【0045】曲構成を解析し、登録項目にする。例え
ば、ブロック(○拍、○小節)のパターン分類後、ブロ
ックによる曲構成情報を登録項目にする。
【0046】曲又はフレーズの時間推移を解析し、登録
項目にする。例えば、ブロック間の変化情報を差分値等
として求める。また、音色の変化を解析することもでき
る。
【0047】統計的解析を行い、登録項目にする。例え
ば、音符又は休符の時間、音高又は音程の平均値や分散
値、同時発音の音の組み合わせを解析する。
【0048】上記の情報から作曲者又は演奏者のくせを
見抜くことが可能になり、イメージ的に目的のMIDI
データを検索することができる。また、音楽のジャンル
を解析することもできる。
【0049】(2)ウェーブデータ 音声認識、周波数解析、時間推移解析を行う。例えば、
男性又は女性、音声認識された語句(単語)、楽器の種
類等を解析することができる。
【0050】(3)静止画データ 静止画の間引きを行って画素数を減らした概画像を生成
したり、画素値の統計的解析を行ったり、周波数解析を
行う。また、静止画の配色パターンを解析することもで
きる。
【0051】(4)動画データ 動画のカット部分の静止画を解析したり、動画の時間推
移解析を行う。
【0052】(5)その他 テキストデータ、電子透かしデータ、ファイルのヘッダ
情報、及びメタテキストの情報については、以下の項目
を解析する。
【0053】曲名、アルバム名、作曲者、編曲者、作詞
者、演奏者、歌手、版元、著作権者、制作者、技術者、
使用機器、スタジオ、楽器、制作日時、関連アドレス
(地理的アドレス及びネットワーク的アドレスを含
む)、関連リンク情報、値段、使用条件(環境、使用
者、期限)等を解析する。これらの情報は、テキストデ
ータ又はコードで表すことができる。コードで表す場合
は、そのコードと対応する情報を結び付けるためのテー
ブルを用意する必要がある。
【0054】データベース8には、テキストデータ9a
の他、楽音データ9b,9c、画像データ9d,9e、
及び電子透かしデータ9fの情報が登録されている。ユ
ーザは、テキストデータを鍵として楽音データや画像デ
ータを検索することができる。
【0055】例えば、曲名(テキストデータ)を鍵とし
て、その曲名のMIDIデータやウェーブデータを検索
したり、著作権者(テキストデータ)を鍵として、画像
データ(絵画や写真)を検索することができる。また、
著作権情報が電子透かしデータとして存在する場合に
は、電子透かしデータを解析し、著作権管理を行うこと
ができる。
【0056】また、楽音データを鍵として楽音データを
検索したり、画像データを鍵として画像データを検索す
ることもできる。
【0057】本実施例によれば、テキストデータ以外の
メディアデータをデータベース化し、検索対象にするこ
とができる。テキストデータ以外のメディアデータとし
ては、例えば、MIDIデータ、ウェーブデータ、静止
画データ、動画データ等であり、特にMIDIデータが
好ましい。また、テキストデータ以外のメディアデータ
を解析し、その中に存在する電子透かしデータの情報を
検索のための鍵として検出することができる。
【0058】次に、図1に示すロボット管理部7につい
て説明する。ロボット管理部7は、コンテンツ解析部5
から供給された解析データを受け、その解析データを鍵
として対応するサイト2及びそのURLをデータベース
8に登録する。データベース8には、どんなコンテンツ
がどのサイト(URL)2に存在するのかの情報を蓄積
する。
【0059】データベース8は、テキストデータ9aの
みではなく、ウェーブデータ9b、MIDIデータ9
c、静止画データ9d、動画データ9e及び電子透かし
データ9fに関する情報(鍵)が登録される。
【0060】例えば、「女性の音声」を鍵としてウェー
ブデータ9bを検索、又は「バイオリンの音色」を鍵と
してMIDIデータ9cを検索することができる。
【0061】データベース8には、上記の解析データの
他、データの種類、データの大きさ(又は再生時間)、
再生ソフトの種類(楽音再生ソフト又は画像再生ソフ
ト)、リンク先、データベースの構築日時、パスワード
の有無等を登録することができる。これらの項目は、検
索の際に画面に表示して、ユーザに知らせることができ
る。
【0062】図3は、上記のデータベースを用いて検索
する方法を示す。上記で構築されたデータベース8は、
インターネット回線1に接続される。ユーザは、検索エ
ンジン11をインターネット回線1に接続することによ
り、所望のメディアデータの検索を行うことができる。
【0063】ユーザは、MIDIデータ又は静止画デー
タ等のデータ種類を指定することにより、そのデータ種
類のデータを有するサイトを検索することができる。サ
イトにはそのアドレス(URL)が対応付けられている
ので、そのサイトを選択すれば、そのサイトのホームペ
ージを見ることができる。
【0064】また、ユーザは、「女性の声」等のテキス
トデータを鍵として指定して、ウェーブデータを検索す
ることができる。また、楽音や画像を鍵として、楽音デ
ータや画像データを検索することもできる。例えば、M
IDIデータや楽譜(音符)データを鍵として指定する
こともできる。
【0065】ユーザは、種々のメディアデータを検索の
鍵として入力することができる。例えば、キーボードや
マウスを使用することにより、テキストデータを鍵とし
て入力することができる。また、画面に表示された画像
又はファイル内の画像の全部又は一部を切り取って、画
像を鍵として入力することができる。また、マイクを使
ってウェーブデータを入力したり、楽譜入力装置やシー
ケンサを使ってMIDIデータを入力することができ
る。
【0066】データベース8には、テキストデータ9
a、ウェーブデータ9b、MIDIデータ9c、静止画
データ9d、動画データ9e及び/又は電子透かしデー
タ9fについての情報が登録されている。
【0067】データベース8に登録された情報は、検索
の鍵として使うことができる他、検索されたメディアデ
ータの情報として、ユーザが使用する検索エンジン11
の画面に表示することもできる。
【0068】電子透かしデータ9fは、著作権情報を表
すことが多い。その著作権情報を基にその電子透かしデ
ータ9fが埋め込まれたコンテンツが不正コピーされた
ものか否かをチェックすることができる。不正コピーか
否かの情報もデータベース化することができる。不正コ
ピーについては、検索の対象から外したり、警告を発す
ることができる。すなわち、著作権管理ができる。
【0069】図4は、データベースを構築するためのメ
インルーチンの処理を示すフローチャートである。
【0070】ステップSA1では、初期化処理を行う。
例えば、データベース作成の準備を行う。
【0071】ステップSA2では、第1のホームページ
(サイト)のアドレスを設定する。第1のホームページ
は、任意のホームページでよい。具体的には、データベ
ースの管理者がURL(アドレス)を入力する。
【0072】ステップSA3では、上記のアドレスにホ
ームページ(HP)が存在するか否かをチェックする。
存在する場合にはステップSA4へ進み、存在しない場
合にはステップSA8へ進む。
【0073】ステップSA4では、上記のホームページ
のコンテンツを取り込む。コンテンツ内に、テキストデ
ータ、楽音データ及び画像データ等の複数種類のデータ
が含まれているときには、その全てのデータを取り込
む。
【0074】ステップSA5では、ホームページのコン
テンツを解析する。まず、コンテンツの分類分けを行
い、その後、コンテンツの内容を解析する。このステッ
プの詳細は、後に図5を参照しながら説明する。
【0075】ステップSA6では、解析結果に応じてホ
ームページの情報をデータベースへ登録する。データベ
ースには、コンテンツの種類別に検索ができるように情
報を登録する。
【0076】ステップSA7では、取り込んだホームペ
ージのコンテンツを削除し、次のホームページの処理に
備える。データベースへの登録後は、ホームページのコ
ンテンツが不要になるので、メモリの記憶容量を節約す
るために、そのコンテンツを削除する。
【0077】ステップSA8では、次のホームページを
決定する。1つのホームページには、他のホームページ
へのリンク先が記述されていることが多い。そのリンク
先を、次のホームページとして決定することができる。
これにより、自動的に多数のホームページをデータベー
ス化することができる。なお、管理者が次のホームペー
ジのURLを入力してもよい。
【0078】その後、ステップSA3に戻り、上記の処
理を繰り返す。このデータベース構築装置は、ロボット
型であり、定期的に自動巡回し、多数のホームページの
登録を行う。
【0079】ホームページは、短周期で更新されたり、
新たに作成されたり、削除されたりする。したがって、
データベースの内容も短周期で定期的に更新することが
好ましい。
【0080】図5は、図4のステップSA5におけるホ
ームページの解析処理の詳細を示すフローチャートであ
る。
【0081】ステップSB1では、HTML形式のテキ
ストデータから単語を抽出する。どのホームページも、
通常、テキストデータを含む。
【0082】ステップSB2では、抽出した単語を分析
し、登録する語句(単語)を確定する。
【0083】ステップSB3では、テキスト以外のデー
タをファイル毎に種別化する。データは、種類毎に異な
るファイルに収められているので、ファイル毎にデータ
の種別化を行う。
【0084】ステップSB4では、楽音データ(ウェー
ブデータ又はMIDIデータ)が存在するか否かを判断
する。楽音データが存在する場合には、楽音の特質を検
出して、楽音のジャンルを登録項目として確定する。こ
のステップの詳細は、後に図6を参照しながら説明す
る。
【0085】ステップSB5では、ファイルに電子透か
しデータが埋め込まれているか否かを判断する。埋め込
まれている場合には、電子透かしデータを検出し、著作
権情報を登録項目として確定する。
【0086】ステップSB6では、閲覧制限があるか否
かを判断する。例えば、ホームページ内にパスワードの
入力画面があるか否かを判断する。その判断結果に応じ
て、閲覧制限があるか否かの情報を登録項目として確定
する。
【0087】ステップSB7では、ホームページ内にリ
ンク先が記述されているか否かを調べる。リンク先が記
述されている場合には、そのリンク先を登録項目として
確定する。
【0088】ステップSB8では、ホームページの解析
日時を取得し、その情報を登録項目とする。ホームペー
ジには、高頻度で更新されるものがあるので、解析した
日時を登録項目にする必要がある。以上で、ホームペー
ジの解析処理を終了し、図4のメインルーチンの処理に
戻る。
【0089】図6は、図5のステップSB4におけるM
IDIデータの解析処理の詳細を示すフローチャートで
ある。楽音データのうち、MIDIデータについて説明
するが、ウェーブデータについても同様に処理すること
ができる。
【0090】ステップSC1では、音色データ等の楽音
要素を抽出する。例えば、音色データは、MIDIデー
タ中のプログラムチェンジに相当する。
【0091】ステップSC2では、抽出した楽音要素を
基にMIDIデータを分類し、楽音のジャンルを推測す
る。この際、推測の適正率を付与する。例えば、管楽器
の音色又は弦楽器の音色等に分類したり、バイオリンの
音色又はピアノの音色等に分類する。
【0092】ステップSC3では、図5のステップSB
1で既に抽出された単語データ(テキストデータ)の中
に楽音データの内容を推測できるものがある場合には、
楽音のジャンルの推測を行い、その推測の適正率と上記
の楽音要素から推測したジャンルの適正率とを基に楽音
のジャンルを決定する。例えば、推測可能な単語データ
として、「バイオリン」や「オーケストラ」等がある。
以上で、図5のフローチャートの処理に戻る。
【0093】公知の検索エンジンは、サイト(ホームペ
ージ)内のテキストデータを基にデータベースを構築
し、そのデータベースを基にサイトの検索を行うもので
あるので、テキストデータの検索に適している。
【0094】本実施例によれば、テキストデータはもち
ろんのこと、サイト内のテキストデータ以外のメディア
データ(例えばウェーブデータ、MIDIデータ、静止
画データ、動画データ、電子透かしデータ)をも基にし
てデータベースを構築する。
【0095】ユーザは、テキストデータを検索できるの
みならず、テキストデータ以外の所望のメディアデータ
をも効率的に検索することができる。その際、メディア
データの種類を指定して、検索することができる。例え
ば、MIDIデータのみを検索することができる。
【0096】検索する際の鍵(キー)は、テキストデー
タでもよいし、テキストデータ以外のメディアデータで
もよい。例えば、「バイオリン」を鍵としてMIDIデ
ータを検索したり、所定の楽譜(フレーズ)を鍵として
MIDIデータを検索することもできる。
【0097】コンテンツ内に著作権情報が電子透かしデ
ータとして埋め込まれている場合、その著作権情報を基
にそのコンテンツが不正コピーされたものか否かをチェ
ックし、不正コピーか否かの情報もデータベース化する
ことができる。不正コピーについては、検索の対象から
外したり、警告を発することができる。
【0098】なお、本実施例は、インターネットに限定
されず、その他のネットワークに適用することもでき
る。
【0099】以上実施例に沿って本発明を説明したが、
本発明はこれらに制限されるものではない。例えば、種
々の変更、改良、組み合わせ等が可能なことは当業者に
自明であろう。
【0100】
【発明の効果】以上説明したように、本発明によれば、
データベースには、テキストデータ以外のメディアデー
タに関連する鍵とそのデータが存在するネットワーク上
のサイトとが対応付けて登録される。ユーザは、テキス
トデータ以外のメディアデータ(例えば、楽音のウェー
ブデータ、MIDIデータ、静止画データ、動画データ
又は電子透かしデータ)を効率的に検索することができ
る。
【図面の簡単な説明】
【図1】 本発明の実施例によるデータベース構築装置
の構成を示すブロック図である。
【図2】 メディアデータの分類方法を示すブロック図
である。
【図3】 検索エンジンを用いて検索を行うためのネッ
トワークの構成図である。
【図4】 データベースの構築方法を示すフローチャー
トである。
【図5】 図4のステップSA5におけるホームページ
の解析処理の詳細を示すフローチャートである。
【図6】 図5のステップSB4におけるMIDIデー
タの解析処理の詳細を示すフローチャートである。
【符号の説明】
1 インターネット回線、 2 サイト、 3a,
9a テキストデータ、 3b,9b ウェーブデー
タ、 3c,9c MIDIデータ、 3d,9d
静止画データ、 3e,9e 動画データ、 3
f 楽音データ、 3g 画像データ、 4 巡回
ロボット部、 5 コンテンツ解析部、 6 巡回
及び解析部、 7 ロボット管理部、 8 データ
ベース、9f 電子透かしデータ、 11 検索エン
ジン

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 ネットワーク上のサイトからメディアデ
    ータを読み出す読み出し手段と、 前記読み出したメディアデータのうちテキストデータ以
    外のメディアデータを解析して鍵を検出する解析手段
    と、 前記鍵と前記サイトとを対応付けてデータベースを構築
    する構築手段とを有する検索エンジン用のデータベース
    構築装置。
  2. 【請求項2】 テキストデータ以外のメディアデータに
    関連する鍵とそのデータが存在するネットワーク上のサ
    イトとを対応付けたデータベースと、 検索のための鍵を指定する指定手段と、 前記データベースを基に前記指定された鍵に関連するテ
    キストデータ以外のメディアデータが存在するネットワ
    ーク上のサイトを検索する検索手段とを有する検索エン
    ジン。
JP10249766A 1998-09-03 1998-09-03 データベース構築装置及び検索エンジン Pending JP2000076300A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10249766A JP2000076300A (ja) 1998-09-03 1998-09-03 データベース構築装置及び検索エンジン

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10249766A JP2000076300A (ja) 1998-09-03 1998-09-03 データベース構築装置及び検索エンジン

Publications (1)

Publication Number Publication Date
JP2000076300A true JP2000076300A (ja) 2000-03-14

Family

ID=17197918

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10249766A Pending JP2000076300A (ja) 1998-09-03 1998-09-03 データベース構築装置及び検索エンジン

Country Status (1)

Country Link
JP (1) JP2000076300A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002175327A (ja) * 2000-12-05 2002-06-21 Web I Laboratories Inc データベース管理方法
JP2002366166A (ja) * 2001-06-11 2002-12-20 Pioneer Electronic Corp コンテンツ提供システム及び方法、並びにそのためのコンピュータプログラム
JP2004537760A (ja) * 2001-07-31 2004-12-16 グレースノート インコーポレイテッド 録音の多段階識別関連出願の相互参照本出願は、「デジタル音楽の多段階識別の方法およびシステム」と題された米国仮出願第60/308,594号(発明者:デールT.ロバーツ(DaleT.Roberts)ら、出願日:2001年7月31日)に関連し、これを優先権主張するとともに、本願明細書に援用するものである。
US6859692B2 (en) 2002-07-11 2005-02-22 Yamaha Marine Kabushiki Kaisha Information transmitting device and information transmitting method for watercraft
US6863580B2 (en) 2002-07-22 2005-03-08 Yamaha Marine Kabushiki Kaisha Control circuits and methods for inhibiting abrupt engine mode transitions in a watercraft
US6923696B2 (en) 2002-07-22 2005-08-02 Yamaha Marine Kabushiki Kaisha Engine starting system for multiple engines
JP2006277763A (ja) * 2000-11-09 2006-10-12 Macrovision Corp 保護された素材の未認可のコピーのデータベースを作成する方法及び装置
US7185092B2 (en) 2000-05-15 2007-02-27 International Business Machines Corporation Web site, information communication terminal, robot search engine response system, robot search engine registration method, and storage medium and program transmission apparatus therefor
US7408950B2 (en) 2002-07-11 2008-08-05 Yamaha Marine Kabushiki Kaisha Multiple node network and communication method within the network

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06202621A (ja) * 1992-12-28 1994-07-22 Victor Co Of Japan Ltd 楽曲演奏情報を利用した楽曲検索装置
JPH09258729A (ja) * 1996-03-26 1997-10-03 Yamaha Corp 選曲装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06202621A (ja) * 1992-12-28 1994-07-22 Victor Co Of Japan Ltd 楽曲演奏情報を利用した楽曲検索装置
JPH09258729A (ja) * 1996-03-26 1997-10-03 Yamaha Corp 選曲装置

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
吉田 勝彦: "インターネット上のマルチメディアデータの柔軟な検索方式の提案", 電子情報通信学会技術研究報告, vol. 第97巻,第413号, CSNG200202311003, 16 November 1995 (1995-11-16), JP, pages 17 - 22, ISSN: 0000859641 *
吉田 勝彦: "インターネット上のマルチメディアデータの柔軟な検索方式の提案", 電子情報通信学会技術研究報告, vol. 第97巻,第413号, JPN6007007228, 16 November 1995 (1995-11-16), JP, pages 17 - 22, ISSN: 0000931366 *
吉田 勝彦: "インターネット上のマルチメディアデータの柔軟な検索方式の提案", 電子情報通信学会技術研究報告, vol. 第97巻,第413号, JPN6007009261, 16 November 1995 (1995-11-16), JP, pages 17 - 22, ISSN: 0000931363 *
柳瀬 隆史,高須 淳宏,安達 淳: "音楽検索における自動インデクシング法", 情報処理学会研究報告, vol. 第98巻,第58号, CSNG199901066015, 10 July 1998 (1998-07-10), JP, pages 117 - 124, ISSN: 0000888517 *
柳瀬 隆史,高須 淳宏,安達 淳: "音楽検索における自動インデクシング法", 情報処理学会研究報告, vol. 第98巻,第58号, JPN6007007226, 10 July 1998 (1998-07-10), JP, pages 117 - 124, ISSN: 0000931365 *
柳瀬 隆史,高須 淳宏,安達 淳: "音楽検索における自動インデクシング法", 情報処理学会研究報告, vol. 第98巻,第58号, JPN6007009258, 10 July 1998 (1998-07-10), JP, pages 117 - 124, ISSN: 0000931362 *
高羽 洋樹: "World Wide Web上の公開型画像検索システムGIRLS", テレビジョン学会技術報告, vol. 第19巻,第61号, CSNG199801121001, 28 November 1997 (1997-11-28), JP, pages 1 - 8, ISSN: 0000859640 *
高羽 洋樹: "World Wide Web上の公開型画像検索システムGIRLS", テレビジョン学会技術報告, vol. 第19巻,第61号, JPN6007007225, 28 November 1997 (1997-11-28), JP, pages 1 - 8, ISSN: 0000931364 *
高羽 洋樹: "World Wide Web上の公開型画像検索システムGIRLS", テレビジョン学会技術報告, vol. 第19巻,第61号, JPN6007009255, 28 November 1997 (1997-11-28), JP, pages 1 - 8, ISSN: 0000931361 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7185092B2 (en) 2000-05-15 2007-02-27 International Business Machines Corporation Web site, information communication terminal, robot search engine response system, robot search engine registration method, and storage medium and program transmission apparatus therefor
JP2006277763A (ja) * 2000-11-09 2006-10-12 Macrovision Corp 保護された素材の未認可のコピーのデータベースを作成する方法及び装置
JP2002175327A (ja) * 2000-12-05 2002-06-21 Web I Laboratories Inc データベース管理方法
JP2002366166A (ja) * 2001-06-11 2002-12-20 Pioneer Electronic Corp コンテンツ提供システム及び方法、並びにそのためのコンピュータプログラム
JP2004537760A (ja) * 2001-07-31 2004-12-16 グレースノート インコーポレイテッド 録音の多段階識別関連出願の相互参照本出願は、「デジタル音楽の多段階識別の方法およびシステム」と題された米国仮出願第60/308,594号(発明者:デールT.ロバーツ(DaleT.Roberts)ら、出願日:2001年7月31日)に関連し、これを優先権主張するとともに、本願明細書に援用するものである。
US6859692B2 (en) 2002-07-11 2005-02-22 Yamaha Marine Kabushiki Kaisha Information transmitting device and information transmitting method for watercraft
US7408950B2 (en) 2002-07-11 2008-08-05 Yamaha Marine Kabushiki Kaisha Multiple node network and communication method within the network
US6863580B2 (en) 2002-07-22 2005-03-08 Yamaha Marine Kabushiki Kaisha Control circuits and methods for inhibiting abrupt engine mode transitions in a watercraft
US6923696B2 (en) 2002-07-22 2005-08-02 Yamaha Marine Kabushiki Kaisha Engine starting system for multiple engines

Similar Documents

Publication Publication Date Title
US6528715B1 (en) Music search by interactive graphical specification with audio feedback
JP4945877B2 (ja) 高い雑音、歪み環境下でサウンド・楽音信号を認識するシステムおよび方法
Orio Music retrieval: A tutorial and review
US7838755B2 (en) Music-based search engine
US6307139B1 (en) Search index for a music file
JP2007531903A5 (ja)
JP2007531903A (ja) ネットワークに接続された携帯デバイスにおける特徴抽出
CN101552000A (zh) 音乐相似性处理方法
JP2000076300A (ja) データベース構築装置及び検索エンジン
KR100512143B1 (ko) 멜로디 기반 음악 검색방법과 장치
CN101551997B (zh) 一种乐曲辅助学习系统
Dannenberg et al. Panel: new directions in music information retrieval
JP5034599B2 (ja) 楽曲紹介文生成装置、ナレーション付加装置およびプログラム
Müller et al. Content-based audio retrieval
KR100702059B1 (ko) 고객 특성이 피드백 반영되는 질의 풀 기반의 유비쿼터스음악 정보 검색 시스템 및 방법
Herrera et al. A proposal for the description of audio in the context of MPEG-7
Vinet et al. The cuidado project: New applications based on audio and music content description
KR20020053979A (ko) 내용 기반의 음악 자료 검색 시스템 및 그 방법
Salosaari et al. Musir-a retrieval model for music
JP2003131674A (ja) 楽曲検索システム
JP4211636B2 (ja) 演奏制御データ生成装置、楽曲素材データ配信サーバおよびプログラム
Kuznetsov et al. Searching for music: from melodies in mind to the resources on the web
Yahzong et al. Query similar music by correlation degree
Tripathy et al. Query by humming system
US7805311B1 (en) Embedding and employing metadata in digital music using format specific methods

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070828

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071026

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071127