JPH02232768A - データ検索システム - Google Patents
データ検索システムInfo
- Publication number
- JPH02232768A JPH02232768A JP1053982A JP5398289A JPH02232768A JP H02232768 A JPH02232768 A JP H02232768A JP 1053982 A JP1053982 A JP 1053982A JP 5398289 A JP5398289 A JP 5398289A JP H02232768 A JPH02232768 A JP H02232768A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- similarity
- data
- input
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010586 diagram Methods 0.000 description 8
- 238000000034 method Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 101100385969 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CYC8 gene Proteins 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
この発明は、演奏データ等の各種のデータを格納したデ
ータベースから作曲者名やその曲のメロディ等をキーワ
ードに用いて所用のデータを検索するデータ検索システ
ムに関する。
ータベースから作曲者名やその曲のメロディ等をキーワ
ードに用いて所用のデータを検索するデータ検索システ
ムに関する。
一般に、音楽用データベースにおいては、その音楽デー
タファイルにファイルナンバー、作曲者及び演奏データ
が格納され、また、検索用データファイルには、作曲者
等の項目によってファイルナンバーが格納されている。
タファイルにファイルナンバー、作曲者及び演奏データ
が格納され、また、検索用データファイルには、作曲者
等の項目によってファイルナンバーが格納されている。
このような音楽用データベースから所用のデータを検索
するには、正確なキーワードが必要であり、作曲者をキ
ーワードとして入力する場合、例えば、作曲者roOm
acht」をキーワードとして曲名を検索するには、正
確な作曲者名roomachf4を入力ずる必要がある
. 〔発明が解決しようとする課題〕 このようなデータ検索では、検索者が自己の記憶に基づ
いた作曲者名として’ohmachi」やroomat
i」を人力した場合、これらが正しい綴りに類似してい
ても、その類似度はデータ検索とは無関係であり、入力
された作曲者名が正しくないため、所用のデータを検索
できない。
するには、正確なキーワードが必要であり、作曲者をキ
ーワードとして入力する場合、例えば、作曲者roOm
acht」をキーワードとして曲名を検索するには、正
確な作曲者名roomachf4を入力ずる必要がある
. 〔発明が解決しようとする課題〕 このようなデータ検索では、検索者が自己の記憶に基づ
いた作曲者名として’ohmachi」やroomat
i」を人力した場合、これらが正しい綴りに類似してい
ても、その類似度はデータ検索とは無関係であり、入力
された作曲者名が正しくないため、所用のデータを検索
できない。
そして、作曲者名の一部の綴りが不明の場合には、ワイ
ルドカ一ドを使って、不明な綴りの部分に、例えば、r
o*machi」や’o?machf」と入力する等、
入力すべきキーワードに工夫をしなければならなかった
。このようなワイルドカードを使用するには、検索者に
その知識と検索の経験が必要であるとともに、その綴り
の不明な部分も認識し、その不明な部分を明確に指定し
なければならない。
ルドカ一ドを使って、不明な綴りの部分に、例えば、r
o*machi」や’o?machf」と入力する等、
入力すべきキーワードに工夫をしなければならなかった
。このようなワイルドカードを使用するには、検索者に
その知識と検索の経験が必要であるとともに、その綴り
の不明な部分も認識し、その不明な部分を明確に指定し
なければならない。
また、その曲のフレーズは、正確に記憶できないため、
検索のキーワードには不向きであった。
検索のキーワードには不向きであった。
このように、従来の音楽用データベースから所用のデー
タを検索するには、検索者が作曲者名について正確な織
りを知る必要があり、正確な綴りが不明な場合には、そ
の譲りの桁数や勘違いによって検索の手数が飛躍的に増
加し、データ検索が非常に厄介なものとなるとともに、
データベースのデータを活用できないおそれがあった。
タを検索するには、検索者が作曲者名について正確な織
りを知る必要があり、正確な綴りが不明な場合には、そ
の譲りの桁数や勘違いによって検索の手数が飛躍的に増
加し、データ検索が非常に厄介なものとなるとともに、
データベースのデータを活用できないおそれがあった。
そこで、この発明は、所用のデータに対するキーワード
が不正確な場合にも、人力キーワードと特定のM似性を
持つキーワードを検索してデータ検索の容易化を図った
データ検索システムの提供を目的とする。
が不正確な場合にも、人力キーワードと特定のM似性を
持つキーワードを検索してデータ検索の容易化を図った
データ検索システムの提供を目的とする。
この発明のデータ検索システムは、第1図に示すように
、検索すべきデータに対応するキーワードを入力する入
力手段2と、前記キーワードによって分類されたデータ
が格納されたデータベース4と、このデータベース4か
ら読み出した前記キーワードと、人力手段2からの入力
キーワードとを比較して両者の類似性を判断し、前記入
力キーワードと特定の類似性を持つキーワードを選出す
る類似性判断手段6と、この類似性判断手段6で選出さ
れた前記キーワードを表示する表示手段8とを備えたも
のである. 〔作 用〕 データベース4には、キーワードとしての作曲者、フレ
ーズ等の項目に対応して演奏データ等の各種のデータが
格納されている. そこで、入力手段2を通してキーワードが入力されると
、類似性判断手段6では、その入力キーワードと、デー
タベース4のキーワードとの類似性の判断が行われ、入
力キーワードに対し、特定の類似性を持つキーワードが
選出される.そして、表示手段8では、類似性判断手段
6の判断結果に対応し、類似性を持つとして選別された
キーワードが表示される. このようなデータ検索システムにおいては、検索者は所
用のデータを表す正確なキーワードを知らない場合にも
、特定のキーワードを入力し、その入力キーワードと類
似性を持つキーワードを引き出し、そのキーワードから
所望のキーワードを選んで所用の演奏データ等を読み出
すことができるのである.したがって、このデータ検索
システムによれば、キーワードについて冗長性が高めら
れ、データ検索の容易化が図られる。
、検索すべきデータに対応するキーワードを入力する入
力手段2と、前記キーワードによって分類されたデータ
が格納されたデータベース4と、このデータベース4か
ら読み出した前記キーワードと、人力手段2からの入力
キーワードとを比較して両者の類似性を判断し、前記入
力キーワードと特定の類似性を持つキーワードを選出す
る類似性判断手段6と、この類似性判断手段6で選出さ
れた前記キーワードを表示する表示手段8とを備えたも
のである. 〔作 用〕 データベース4には、キーワードとしての作曲者、フレ
ーズ等の項目に対応して演奏データ等の各種のデータが
格納されている. そこで、入力手段2を通してキーワードが入力されると
、類似性判断手段6では、その入力キーワードと、デー
タベース4のキーワードとの類似性の判断が行われ、入
力キーワードに対し、特定の類似性を持つキーワードが
選出される.そして、表示手段8では、類似性判断手段
6の判断結果に対応し、類似性を持つとして選別された
キーワードが表示される. このようなデータ検索システムにおいては、検索者は所
用のデータを表す正確なキーワードを知らない場合にも
、特定のキーワードを入力し、その入力キーワードと類
似性を持つキーワードを引き出し、そのキーワードから
所望のキーワードを選んで所用の演奏データ等を読み出
すことができるのである.したがって、このデータ検索
システムによれば、キーワードについて冗長性が高めら
れ、データ検索の容易化が図られる。
以下、この発明の実施例を図面を参照して説明する.
第2図は、この発明のデータ検索システムの−実施例を
示す。
示す。
入力手段2には、データベース4から所用のデータを検
索するためのキーワードが人力され、例えば、タイブラ
イタ用キーボード21及び音楽用キーボード22が用い
られている。キーボード21では、キーワードとして例
えば作曲者名の綴りが入力され、また、キーボード22
ではキーワードとして曲のフレーズが入力される。キー
ボード2l側にはデータ入力装置23、また、キーボー
ド22側には音楽データ入力装置24が設置されており
、各キーボード21、22から入力されたキーワードが
コード化されてバス10に送られる。
索するためのキーワードが人力され、例えば、タイブラ
イタ用キーボード21及び音楽用キーボード22が用い
られている。キーボード21では、キーワードとして例
えば作曲者名の綴りが入力され、また、キーボード22
ではキーワードとして曲のフレーズが入力される。キー
ボード2l側にはデータ入力装置23、また、キーボー
ド22側には音楽データ入力装置24が設置されており
、各キーボード21、22から入力されたキーワードが
コード化されてバス10に送られる。
キーボード2工、22による人力キーワードと、データ
ベース4に記憶されているキーワードとの類似性を判断
する類似性判断手段6には、中央処理装置(CPU)6
1、読出し専用メモリ(ROM)62、続出し書込みメ
モリ(RAM)63が設;ηされている。CPU6 1
では、この実施例の場合、入力キーワードを検索用ナン
バーに変換し、データベース4から読み込んだキーワー
ドを表す検索用ナンバーとの類似性を演算によって判断
する.したがって、ROM62にはその類偵性判断処理
を行うための類似性判断プログラム等が記憶されている
。また、RAM63には、キーボード21、22からの
キーワードやその検索用ナンバーとともに、データベー
ス4からの検索用ナンバー等、類似性判断途上の演算デ
ータ等が一時的に記憶される. また、データベース4には、記憶媒体として例えば、ハ
ードディスク装置41が用いられ、記憶されているデー
タの読出しないし書込みはハードディスク制御装置42
によって行われる.このハードディスク装置41には、
キーワードを成す項目によって分類される種々のデータ
ベースとして例えば、音楽用データベースが構築されで
いる.そして、類似性判断の結果を表示する表示手段8
には、例えば、CRT表示装置81(以下CRT81と
いう)が用いられ、このCRT8 1を動作させるC
R T表示制御装置82が設置されている。表示千段8
には、このようなCRT8 ]の他、プリンタ等を用い
てもよい。
ベース4に記憶されているキーワードとの類似性を判断
する類似性判断手段6には、中央処理装置(CPU)6
1、読出し専用メモリ(ROM)62、続出し書込みメ
モリ(RAM)63が設;ηされている。CPU6 1
では、この実施例の場合、入力キーワードを検索用ナン
バーに変換し、データベース4から読み込んだキーワー
ドを表す検索用ナンバーとの類似性を演算によって判断
する.したがって、ROM62にはその類偵性判断処理
を行うための類似性判断プログラム等が記憶されている
。また、RAM63には、キーボード21、22からの
キーワードやその検索用ナンバーとともに、データベー
ス4からの検索用ナンバー等、類似性判断途上の演算デ
ータ等が一時的に記憶される. また、データベース4には、記憶媒体として例えば、ハ
ードディスク装置41が用いられ、記憶されているデー
タの読出しないし書込みはハードディスク制御装置42
によって行われる.このハードディスク装置41には、
キーワードを成す項目によって分類される種々のデータ
ベースとして例えば、音楽用データベースが構築されで
いる.そして、類似性判断の結果を表示する表示手段8
には、例えば、CRT表示装置81(以下CRT81と
いう)が用いられ、このCRT8 1を動作させるC
R T表示制御装置82が設置されている。表示千段8
には、このようなCRT8 ]の他、プリンタ等を用い
てもよい。
次に、第3図及び第4図は、データベース4に構築され
た音楽用データベースのデータファイルの一例を示す。
た音楽用データベースのデータファイルの一例を示す。
この音楽用データヘースには、音楽データファイルMD
Fとともに、音楽データファイルMDFから所用のデー
タを検索するために検索用データファイルRDFが格納
されている.そして、音楽データファイルMDFは、例
えば、第3図に示すように、ファイルナンバー’Fil
e 1 . 2・・・・NJ、作曲者、フレーズとと
もに演奏データが格納されている。この場合、作曲者は
演奏データの作曲者名、フレーズはその曲の最初の小節
又は特徴を表すメロディ、ファイルナンバーはその所在
及び名称を表す.この音楽データファイルMDFには、
roomachi Ox00005185 /usr
/songs /eseq/00000001.esp
」(但し、OXは16進数を表す)のように、音楽デー
タ、検索用ナンバー、ファイルの所在と名称がグループ
化されて格納されている。
Fとともに、音楽データファイルMDFから所用のデー
タを検索するために検索用データファイルRDFが格納
されている.そして、音楽データファイルMDFは、例
えば、第3図に示すように、ファイルナンバー’Fil
e 1 . 2・・・・NJ、作曲者、フレーズとと
もに演奏データが格納されている。この場合、作曲者は
演奏データの作曲者名、フレーズはその曲の最初の小節
又は特徴を表すメロディ、ファイルナンバーはその所在
及び名称を表す.この音楽データファイルMDFには、
roomachi Ox00005185 /usr
/songs /eseq/00000001.esp
」(但し、OXは16進数を表す)のように、音楽デー
タ、検索用ナンバー、ファイルの所在と名称がグループ
化されて格納されている。
また、検索用データファイルRDFは、音楽データファ
イルMDFに対応して作曲者’ coa+poser.
dirJや曲のフレーズ’phrase.dir Jを
検索項目とし、その項目別に形成されており、作曲者を
検索項目にした検索用データファイルRDF,では、第
4図の(A)に示すように、作曲者「CIC2 ・・・
CM Jに対応して検索用ナンバー及びファイルナンバ
ーrails−NHに分類され、また、フレーズを検索
項目にした検索用データファイルRDF.では、第4図
の(B)に示すように、フレーズrp+,pg ・・
・PNJに対応して検索用ナンバー及びファイルナンバ
ー’File−Nα」に分類されている。
イルMDFに対応して作曲者’ coa+poser.
dirJや曲のフレーズ’phrase.dir Jを
検索項目とし、その項目別に形成されており、作曲者を
検索項目にした検索用データファイルRDF,では、第
4図の(A)に示すように、作曲者「CIC2 ・・・
CM Jに対応して検索用ナンバー及びファイルナンバ
ーrails−NHに分類され、また、フレーズを検索
項目にした検索用データファイルRDF.では、第4図
の(B)に示すように、フレーズrp+,pg ・・
・PNJに対応して検索用ナンバー及びファイルナンバ
ー’File−Nα」に分類されている。
ところで、この音楽用データベースに格納されている検
索用ナンバーの大きさは、使用されるCPU6 1のレ
ジスタのビット数に対応させ、例えば、NビットのCP
UではNビットの整数とすることが望ましい. また、この検索用ナンバーは、データ検索の便宜のため
に形成されたものであり、その形成方法は、任意の検索
用ナンバー中の1つのビットに対し、データ内の各項目
を構成する要素例えば、文字列中のアルファベットやか
な文字、音楽フレーズ中のド、レ、ミ等を対応させる。
索用ナンバーの大きさは、使用されるCPU6 1のレ
ジスタのビット数に対応させ、例えば、NビットのCP
UではNビットの整数とすることが望ましい. また、この検索用ナンバーは、データ検索の便宜のため
に形成されたものであり、その形成方法は、任意の検索
用ナンバー中の1つのビットに対し、データ内の各項目
を構成する要素例えば、文字列中のアルファベットやか
な文字、音楽フレーズ中のド、レ、ミ等を対応させる。
その場合、1つのビットに2つ以上の要素を対応させて
もよいし、また、それに対応するものがなくてもよい。
もよいし、また、それに対応するものがなくてもよい。
例えば、32ビットにアルファベットを対応させると、
第1表のようになる. 第1表 そこで、この表示法に従えば、第5図に示すように、例
えば、作曲者’oomaehj ,+の検索用ナンバー
は、 oomachi ” ≧ Ox00005185(H
ex)となる。
第1表のようになる. 第1表 そこで、この表示法に従えば、第5図に示すように、例
えば、作曲者’oomaehj ,+の検索用ナンバー
は、 oomachi ” ≧ Ox00005185(H
ex)となる。
また、32ビットにかな文字を対応させると、第2表の
ようになる。
ようになる。
第2表
第3表
そこで、この表示法に従えば、作曲者「れんたろう」の
検索用ナンバーは、 0れんたろう”≧O x 00009804(Hex)
となる. そして、曲のフレーズを表現するため、16ビットに音
階を対応させると、第3表のようになる.(この頁以下
余白) そこで、この表示法に従えば、第6図に示すように、フ
レーズrCDECECDJの検索用ナンバーは、 ” C D E C E C D ”≧O x 001
5 (Hex)となる. 以上の構成において、音楽用データデベースからの所用
データの検索について説明する。
検索用ナンバーは、 0れんたろう”≧O x 00009804(Hex)
となる. そして、曲のフレーズを表現するため、16ビットに音
階を対応させると、第3表のようになる.(この頁以下
余白) そこで、この表示法に従えば、第6図に示すように、フ
レーズrCDECECDJの検索用ナンバーは、 ” C D E C E C D ”≧O x 001
5 (Hex)となる. 以上の構成において、音楽用データデベースからの所用
データの検索について説明する。
第7図は、この発明のデータ検索システムにおけるデー
タ検索プログラムの一例を示す。
タ検索プログラムの一例を示す。
ステップS,では検索キーワードの入力を示しており、
キーボード21又はキーボード22を選択してキーワー
ドを入力する。キーボード21を選択した場合には、検
索すべき演奏データについての作曲者をアルファベット
で入力し、また、キーボード22を選択した場合には、
その演奏データのフレーズを表すメロディを入力する.
次に、ステップS2ではキーボード21又はキーボード
22からの入力キーワードが表す項目が作曲者かフレー
ズかを認識し、その項目に対応する検索用データファイ
ルRDF,,RDF.をデータベース4からRAM63
に読み込む。
キーボード21又はキーボード22を選択してキーワー
ドを入力する。キーボード21を選択した場合には、検
索すべき演奏データについての作曲者をアルファベット
で入力し、また、キーボード22を選択した場合には、
その演奏データのフレーズを表すメロディを入力する.
次に、ステップS2ではキーボード21又はキーボード
22からの入力キーワードが表す項目が作曲者かフレー
ズかを認識し、その項目に対応する検索用データファイ
ルRDF,,RDF.をデータベース4からRAM63
に読み込む。
次に、ステップS,では、CPU6 1においてキーボ
ード2l、22からのキーワードを検索用ナンバー(以
下入力検索用ナンバーという)に変換し、その入力検索
用ナンバーをRAM63に読み込む。例えば、キーボー
ド21によって作曲者名roommachi Jが入力
された場合、その作曲者名は、例えば、第5図に示すよ
うに、16進法のコードによって表された入力検索用ナ
ンバーに変換される。
ード2l、22からのキーワードを検索用ナンバー(以
下入力検索用ナンバーという)に変換し、その入力検索
用ナンバーをRAM63に読み込む。例えば、キーボー
ド21によって作曲者名roommachi Jが入力
された場合、その作曲者名は、例えば、第5図に示すよ
うに、16進法のコードによって表された入力検索用ナ
ンバーに変換される。
また、キーボード22によるフレーズrCDECECD
,が入力された場合には、そのフレーズが、例えば、第
6図に示すように、16進法のコードによって表された
検索用ナンバーに変換される.次に、ステップS4では
、入力検索用ナンバーと検索用データファイルRDF.
、RDF.における検索用ナンバーとの間で第1段階
の類似性の判断を行う.この第1段階の類憤性判断は、
緩やかな類似性を演算によって求める. 例えば、第8図に示すように、入力検索用ナンバーと、
データベース4内の検索用ナンバーとの排他的論理和(
XOR)を演算によって求める(ステップS41)。こ
こで、入力検索用ナンバーをrABcJ、データベース
4おける検索用ナンバーをrCBDJとすると、両者の
排他的論理和を取ると、 ? 00 1 となり、この排他的論理和の演算によって両者の中で異
なる要素のみが得られる。次に、この排他的論理和の演
算結果と、入力検索用ナンバーとの論理積(AND)を
取ると(ステップS4■)、その論理積は、 となり、この論理積により、入力キーワードのみに含ま
れる要素が判る。
,が入力された場合には、そのフレーズが、例えば、第
6図に示すように、16進法のコードによって表された
検索用ナンバーに変換される.次に、ステップS4では
、入力検索用ナンバーと検索用データファイルRDF.
、RDF.における検索用ナンバーとの間で第1段階
の類似性の判断を行う.この第1段階の類憤性判断は、
緩やかな類似性を演算によって求める. 例えば、第8図に示すように、入力検索用ナンバーと、
データベース4内の検索用ナンバーとの排他的論理和(
XOR)を演算によって求める(ステップS41)。こ
こで、入力検索用ナンバーをrABcJ、データベース
4おける検索用ナンバーをrCBDJとすると、両者の
排他的論理和を取ると、 ? 00 1 となり、この排他的論理和の演算によって両者の中で異
なる要素のみが得られる。次に、この排他的論理和の演
算結果と、入力検索用ナンバーとの論理積(AND)を
取ると(ステップS4■)、その論理積は、 となり、この論理積により、入力キーワードのみに含ま
れる要素が判る。
次に、入力検索用ナンバー及び論理積の演算結果のビッ
ト数を数え(ステップS4ff、S..)、ここで、入
力検索用ナンバーのビット数をb+,論理積の演算結果
のピント数をb2とする。各ビ,ト数b, 、b.の差
を求め、ビット数b,に対する割合b0を求める(ステ
ンブS4,)。この割合b.は、入力キーワードの長さ
に対して違う要素の個数の比率を表わしている。
ト数を数え(ステップS4ff、S..)、ここで、入
力検索用ナンバーのビット数をb+,論理積の演算結果
のピント数をb2とする。各ビ,ト数b, 、b.の差
を求め、ビット数b,に対する割合b0を求める(ステ
ンブS4,)。この割合b.は、入力キーワードの長さ
に対して違う要素の個数の比率を表わしている。
そして、要求された類似度をk(0≦k≦1)とすると
、この類似度kと、割合b。との大小関係を判断し(ス
テンブS46)、bo≧kの場合には、両者が類似して
いると判断し、また、b,<kの場合には、両者は類似
していないと判断する。
、この類似度kと、割合b。との大小関係を判断し(ス
テンブS46)、bo≧kの場合には、両者が類似して
いると判断し、また、b,<kの場合には、両者は類似
していないと判断する。
この結果、人力キーワードに対して比較したキ−ワード
の大まかな類似度の判断を行うことができる.類似度k
の大きさは、必要に応じて任意に設定することができる
. このようなステップS,における大まかな類似度の判断
の後、ステップSsでは、ステップS4の類似性判断を
通過した検索用ナンバーと入力検索用ナンバーとの厳密
な類似性判断として第2段階の類似性の判断を行う. この類偵性の判断では、RAM6 3に「入力キーワー
ドの長さ+1」と「検討されるデータの長さ+1」の大
きさの二次元配列を作り、その配列の中身を左隅より計
算する。その計算方法は、人力キーワードのi文字目と
データのj文字目が一敗した場合には、 m[i] [j]=m[f−13 [j−1]+a
とし、また、一致しない場合には、 m [i] !] =maxia+u* (m [
il [ j−1]−b,m[t−11 NF−c
) とする。
の大まかな類似度の判断を行うことができる.類似度k
の大きさは、必要に応じて任意に設定することができる
. このようなステップS,における大まかな類似度の判断
の後、ステップSsでは、ステップS4の類似性判断を
通過した検索用ナンバーと入力検索用ナンバーとの厳密
な類似性判断として第2段階の類似性の判断を行う. この類偵性の判断では、RAM6 3に「入力キーワー
ドの長さ+1」と「検討されるデータの長さ+1」の大
きさの二次元配列を作り、その配列の中身を左隅より計
算する。その計算方法は、人力キーワードのi文字目と
データのj文字目が一敗した場合には、 m[i] [j]=m[f−13 [j−1]+a
とし、また、一致しない場合には、 m [i] !] =maxia+u* (m [
il [ j−1]−b,m[t−11 NF−c
) とする。
この配列において、a,bは定数であり、aは一致した
ときの得点、b, eは違ったときの減点を表す。し
たがって、aが大きい程、また、b,Cが小さい程、類
似性の基準が緩やかになる。
ときの得点、b, eは違ったときの減点を表す。し
たがって、aが大きい程、また、b,Cが小さい程、類
似性の基準が緩やかになる。
そして、演算の初期値として、
m[o] N]一−j*b
m [i] [01 −−i*c
を設定すると、入力キーワードと、データベース4から
読み込まれたキーワード即ち項目との類似度S0は、 第4表 で求められる。この類似度S0の値は、検索者によって
設定された一定値を超えたデータのみが類似していると
判断する. 第4表は、a=1、b,c=oと設定し、キーワードと
して入力された作曲者名’ouma t i Jとデー
タベース4内の検索項目として登録された作曲者名ro
omachi」の配列を示す。?は、初期値を入れる場
所である。
読み込まれたキーワード即ち項目との類似度S0は、 第4表 で求められる。この類似度S0の値は、検索者によって
設定された一定値を超えたデータのみが類似していると
判断する. 第4表は、a=1、b,c=oと設定し、キーワードと
して入力された作曲者名’ouma t i Jとデー
タベース4内の検索項目として登録された作曲者名ro
omachi」の配列を示す。?は、初期値を入れる場
所である。
また、第5表は、a=1,b,c=oと設定し、キーワ
ードとして入力された作曲者名r o u m. at
i」とデータベース4内の検索項目として登録された作
曲者名rma c h i d a Jの配列を示す。
ードとして入力された作曲者名r o u m. at
i」とデータベース4内の検索項目として登録された作
曲者名rma c h i d a Jの配列を示す。
(この頁以下余白)
第5表
そこで、類似度S。を求めると、roumati」とr
oomacht」の類似度は、第4表から明らかなよう
に、最大値が4、キーワードの長さは6であるから、類
似度S0は、 So = xl00 ζ66.7 (%)
となり、また、roumati」とrma c h i
da」のM似度は、第5表から明らかなように、最大値
が3、キーワードの長さは6であるから、類似度S0は
、 So 一xioo =50 (%)となる。したが
って、roomachi」及びrmachida」は、
[{12度50%の要求に対して類似性を持つ項目であ
ると判断される。
oomacht」の類似度は、第4表から明らかなよう
に、最大値が4、キーワードの長さは6であるから、類
似度S0は、 So = xl00 ζ66.7 (%)
となり、また、roumati」とrma c h i
da」のM似度は、第5表から明らかなように、最大値
が3、キーワードの長さは6であるから、類似度S0は
、 So 一xioo =50 (%)となる。したが
って、roomachi」及びrmachida」は、
[{12度50%の要求に対して類似性を持つ項目であ
ると判断される。
このような第2段階の類似性判断の後、ステップS,で
は、その判断結果がCRT表示装置81に表示される,
CRT表示装[81には、例えば、第9図に示すように
、データベースには検索者の入力したキーワードrou
mati」が無いので、この入力キーワードrouma
t iJと類似性を持つ項目roomachi」及び
rma c h i da」が存在し、その項目の類似
性「66%」「50%」とともに、その類似性の高い順
に表示される.そこで、検索者はこのような表示内容か
ら入力すべきであったキーワードをその類似性を参考に
しながら選択し、所用のデータを適正なキーワードを以
て検索することができるのである。
は、その判断結果がCRT表示装置81に表示される,
CRT表示装[81には、例えば、第9図に示すように
、データベースには検索者の入力したキーワードrou
mati」が無いので、この入力キーワードrouma
t iJと類似性を持つ項目roomachi」及び
rma c h i da」が存在し、その項目の類似
性「66%」「50%」とともに、その類似性の高い順
に表示される.そこで、検索者はこのような表示内容か
ら入力すべきであったキーワードをその類似性を参考に
しながら選択し、所用のデータを適正なキーワードを以
て検索することができるのである。
また、CRT表示装置8工には、第1段階の頻僚性判断
の結果を表示してもよい.そして、CRT表示装置81
に代え、又は、CRT表示装置81とともに、プリンタ
を用いれば、その判断結果を印刷して表示することがで
きる. なお、前記実施例では類似性判断の前段階で、キーワー
ドを成す項目を検索用ナンバーに変換してデータベース
4に格納するとともに、入力キーワードを検索用ナンバ
ーに変換しているが、このようにすれば、検索の類似度
の判断が容易になる利点があるが、入力キーワードを直
接データファイルの項目と付き合わせて類似性の判断を
行っても.同様に類似性の判断を行うことができる。
の結果を表示してもよい.そして、CRT表示装置81
に代え、又は、CRT表示装置81とともに、プリンタ
を用いれば、その判断結果を印刷して表示することがで
きる. なお、前記実施例では類似性判断の前段階で、キーワー
ドを成す項目を検索用ナンバーに変換してデータベース
4に格納するとともに、入力キーワードを検索用ナンバ
ーに変換しているが、このようにすれば、検索の類似度
の判断が容易になる利点があるが、入力キーワードを直
接データファイルの項目と付き合わせて類似性の判断を
行っても.同様に類似性の判断を行うことができる。
以上説明したように、この発明によれば、データベース
から所用のデータを検索する場合、そのデータベース中
の検索項目に対応する正確なキーワードを知らない場合
にも、そのキーワードと類似性を持つ項目を読み出すこ
とができ、入力キーワードについての冗長性が向上する
ので、データ検索の容易化が実現できる。
から所用のデータを検索する場合、そのデータベース中
の検索項目に対応する正確なキーワードを知らない場合
にも、そのキーワードと類似性を持つ項目を読み出すこ
とができ、入力キーワードについての冗長性が向上する
ので、データ検索の容易化が実現できる。
第1図はこの発明のデータ検索システムの構成を示すブ
ロック図、 第2図はこの発明のデータ検索システムの一実施例を示
すブロック図、 第3図は第2図に示したデータ検索システムのデータベ
ースにおける音楽データファイルを示す図、 第4図は第2図に示したデータ検索システムのデータベ
ースにおける検索用データファイルを示す図、 第5図はデータベースにおける作曲者の検索用ナンバー
の構成を示す図、 第6図はデータベースにおけるフレーズの検索用ナンバ
ーの構成を示す図、 第7図はこの発明のデータ検索システムの検索手順を示
すフローチャート、 第8図はこの発明のデータ検索システムの検索手順にお
ける第1段階の類似性判断を示すフローチャート、 第9図はこの発明のデータ検索システムにおけるC R
. T表示装置の表示内容の一例を示す図である。 2・・・・・・入力手段 4・・・・・・データベース 6・・・・・・類似性判断手段 8・・・・・・表示手段 第 1 図 データ検索システムのブロック図 第 図 音楽データファイルMDF 第 図 作曲者の検索用ナンバー 第 図 フレーズの検索用ナンバー 第 図 検索用データファイル 第 図 データ検索プログラムのフローチャート第8図 第1段階の類{以性判断のフローチャート第 図 CRT表示装置の表示内容
ロック図、 第2図はこの発明のデータ検索システムの一実施例を示
すブロック図、 第3図は第2図に示したデータ検索システムのデータベ
ースにおける音楽データファイルを示す図、 第4図は第2図に示したデータ検索システムのデータベ
ースにおける検索用データファイルを示す図、 第5図はデータベースにおける作曲者の検索用ナンバー
の構成を示す図、 第6図はデータベースにおけるフレーズの検索用ナンバ
ーの構成を示す図、 第7図はこの発明のデータ検索システムの検索手順を示
すフローチャート、 第8図はこの発明のデータ検索システムの検索手順にお
ける第1段階の類似性判断を示すフローチャート、 第9図はこの発明のデータ検索システムにおけるC R
. T表示装置の表示内容の一例を示す図である。 2・・・・・・入力手段 4・・・・・・データベース 6・・・・・・類似性判断手段 8・・・・・・表示手段 第 1 図 データ検索システムのブロック図 第 図 音楽データファイルMDF 第 図 作曲者の検索用ナンバー 第 図 フレーズの検索用ナンバー 第 図 検索用データファイル 第 図 データ検索プログラムのフローチャート第8図 第1段階の類{以性判断のフローチャート第 図 CRT表示装置の表示内容
Claims (1)
- 【特許請求の範囲】 検索すべきデータに対応するキーワードを入力する入力
手段と、 前記キーワードによって分類されたデータが格納された
データベースと、 このデータベースから読み出した前記キーワードと、前
記入力手段からの入力キーワードとを比較して両者の類
似性を判断し、前記入力キーワードと特定の類似性を持
つキーワードを選出する類似性判断手段と、 この類似性判断手段で選出された前記キーワードを表示
する表示手段とを備えたことを特徴とするデータ検索シ
ステム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1053982A JP2832988B2 (ja) | 1989-03-07 | 1989-03-07 | データ検索システム |
US07/490,000 US5261087A (en) | 1989-03-07 | 1990-03-07 | Electronic information retrieval system with relative difference analyzer |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1053982A JP2832988B2 (ja) | 1989-03-07 | 1989-03-07 | データ検索システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH02232768A true JPH02232768A (ja) | 1990-09-14 |
JP2832988B2 JP2832988B2 (ja) | 1998-12-09 |
Family
ID=12957830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1053982A Expired - Fee Related JP2832988B2 (ja) | 1989-03-07 | 1989-03-07 | データ検索システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US5261087A (ja) |
JP (1) | JP2832988B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5393927A (en) * | 1992-03-24 | 1995-02-28 | Yamaha Corporation | Automatic accompaniment apparatus with indexed pattern searching |
JPH10105578A (ja) * | 1996-09-09 | 1998-04-24 | Korea Telecommun | 点数を利用した類似単語検索方法 |
JP2006181137A (ja) * | 2004-12-28 | 2006-07-13 | Konica Minolta Holdings Inc | 医療支援システム |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2502023B2 (ja) * | 1992-04-13 | 1996-05-29 | インターナショナル・ビジネス・マシーンズ・コーポレイション | デ―タ・ファイルの比較方法及びシステム |
US5787414A (en) * | 1993-06-03 | 1998-07-28 | Kabushiki Kaisha Toshiba | Data retrieval system using secondary information of primary data to be retrieved as retrieval key |
DE4401853A1 (de) * | 1994-01-22 | 1995-08-03 | Lindenthal Detlef Dipl Soz Pae | Hörfunk-Empfänger mit Klangarchivierung |
US5918222A (en) * | 1995-03-17 | 1999-06-29 | Kabushiki Kaisha Toshiba | Information disclosing apparatus and multi-modal information input/output system |
US5739451A (en) * | 1996-12-27 | 1998-04-14 | Franklin Electronic Publishers, Incorporated | Hand held electronic music encyclopedia with text and note structure search |
US5963957A (en) * | 1997-04-28 | 1999-10-05 | Philips Electronics North America Corporation | Bibliographic music data base with normalized musical themes |
US6154783A (en) * | 1998-09-18 | 2000-11-28 | Tacit Knowledge Systems | Method and apparatus for addressing an electronic document for transmission over a network |
JP2002538553A (ja) * | 1999-03-01 | 2002-11-12 | クォーク・メディア・ハウス・ソシエテ・ア・レスポンサビリテ・リミテ | デジタル・メディア・アセット管理システムおよびプロセス |
US6381607B1 (en) * | 1999-06-19 | 2002-04-30 | Kent Ridge Digital Labs | System of organizing catalog data for searching and retrieval |
US6678680B1 (en) | 2000-01-06 | 2004-01-13 | Mark Woo | Music search engine |
US6928433B2 (en) * | 2001-01-05 | 2005-08-09 | Creative Technology Ltd | Automatic hierarchical categorization of music by metadata |
US7606819B2 (en) | 2001-10-15 | 2009-10-20 | Maya-Systems Inc. | Multi-dimensional locating system and method |
US6995309B2 (en) | 2001-12-06 | 2006-02-07 | Hewlett-Packard Development Company, L.P. | System and method for music identification |
US20080058106A1 (en) | 2002-10-07 | 2008-03-06 | Maya-Systems Inc. | Multi-dimensional locating game system and method |
US20050002769A1 (en) * | 2003-05-06 | 2005-01-06 | Scheibel Craig Carl | Pivoting material / equipment lift |
CN1991826A (zh) * | 2005-12-27 | 2007-07-04 | 鸿富锦精密工业(深圳)有限公司 | 电子书检索系统及方法 |
CA2601154C (en) | 2007-07-07 | 2016-09-13 | Mathieu Audet | Method and system for distinguising elements of information along a plurality of axes on a basis of a commonality |
US8601392B2 (en) | 2007-08-22 | 2013-12-03 | 9224-5489 Quebec Inc. | Timeline for presenting information |
CA2657835C (en) | 2008-03-07 | 2017-09-19 | Mathieu Audet | Documents discrimination system and method thereof |
US8607155B2 (en) | 2008-09-12 | 2013-12-10 | 9224-5489 Quebec Inc. | Method of managing groups of arrays of documents |
US9122374B2 (en) | 2011-02-01 | 2015-09-01 | 9224-5489 Quebec Inc. | Expandable and collapsible arrays of documents |
CA2790799C (en) | 2011-09-25 | 2023-03-21 | Mathieu Audet | Method and apparatus of navigating information element axes |
US9519693B2 (en) | 2012-06-11 | 2016-12-13 | 9224-5489 Quebec Inc. | Method and apparatus for displaying data element axes |
US9646080B2 (en) | 2012-06-12 | 2017-05-09 | 9224-5489 Quebec Inc. | Multi-functions axis-based interface |
US9946771B2 (en) | 2014-05-30 | 2018-04-17 | Apple Inc. | User interface for searching |
CA3007166C (en) | 2017-06-05 | 2024-04-30 | 9224-5489 Quebec Inc. | Method and apparatus of aligning information element axes |
JP7211050B2 (ja) * | 2018-12-05 | 2023-01-24 | 富士通株式会社 | 対話制御プログラム、対話制御システム、及び対話制御方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63233427A (ja) * | 1987-03-20 | 1988-09-29 | Hitachi Ltd | 近似パタ−ン検出方法および装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3651483A (en) * | 1969-01-03 | 1972-03-21 | Ibm | Method and means for searching a compressed index |
US4318184A (en) * | 1978-09-05 | 1982-03-02 | Millett Ronald P | Information storage and retrieval system and method |
US4328561A (en) * | 1979-12-28 | 1982-05-04 | International Business Machines Corp. | Alpha content match prescan method for automatic spelling error correction |
US4383307A (en) * | 1981-05-04 | 1983-05-10 | Software Concepts, Inc. | Spelling error detector apparatus and methods |
US4471459A (en) * | 1981-09-30 | 1984-09-11 | System Development Corp. | Digital data processing method and means for word classification by pattern analysis |
JPS59187886A (ja) * | 1983-04-08 | 1984-10-25 | Toppan Printing Co Ltd | 楽譜印刷システムにおける楽譜デ−タの入力装置および方法 |
US4783758A (en) * | 1985-02-05 | 1988-11-08 | Houghton Mifflin Company | Automated word substitution using numerical rankings of structural disparity between misspelled words & candidate substitution words |
US4745836A (en) * | 1985-10-18 | 1988-05-24 | Dannenberg Roger B | Method and apparatus for providing coordinated accompaniment for a performance |
US4833610A (en) * | 1986-12-16 | 1989-05-23 | International Business Machines Corporation | Morphological/phonetic method for ranking word similarities |
-
1989
- 1989-03-07 JP JP1053982A patent/JP2832988B2/ja not_active Expired - Fee Related
-
1990
- 1990-03-07 US US07/490,000 patent/US5261087A/en not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63233427A (ja) * | 1987-03-20 | 1988-09-29 | Hitachi Ltd | 近似パタ−ン検出方法および装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5393927A (en) * | 1992-03-24 | 1995-02-28 | Yamaha Corporation | Automatic accompaniment apparatus with indexed pattern searching |
JPH10105578A (ja) * | 1996-09-09 | 1998-04-24 | Korea Telecommun | 点数を利用した類似単語検索方法 |
JP2006181137A (ja) * | 2004-12-28 | 2006-07-13 | Konica Minolta Holdings Inc | 医療支援システム |
Also Published As
Publication number | Publication date |
---|---|
US5261087A (en) | 1993-11-09 |
JP2832988B2 (ja) | 1998-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH02232768A (ja) | データ検索システム | |
US5745745A (en) | Text search method and apparatus for structured documents | |
US5544049A (en) | Method for performing a search of a plurality of documents for similarity to a plurality of query words | |
JP3160201B2 (ja) | 情報検索方法、情報検索装置 | |
US6026398A (en) | System and methods for searching and matching databases | |
US4862408A (en) | Paradigm-based morphological text analysis for natural languages | |
JPH0424869A (ja) | 文書処理システム | |
CN101454750A (zh) | 命名实体的消歧 | |
JPH09153066A (ja) | 文書検索装置 | |
JPH03172966A (ja) | 類似文書検索装置 | |
JP3735335B2 (ja) | 類似性判断のための例題ベース検索方法及び検索システム | |
US7698254B2 (en) | System and method for producing scored search results on a database using approximate search queries | |
JP4160548B2 (ja) | 文書要約作成システム、方法、及びプログラム | |
JP2669601B2 (ja) | 情報検索方法及びシステム | |
JPH0484271A (ja) | 文書内情報検索装置 | |
JP3812818B2 (ja) | データベース生成装置、データベース生成方法及びデータベース生成処理プログラム | |
JP2850952B2 (ja) | 文書検索方法および装置 | |
JP4009937B2 (ja) | 文書検索装置、文書検索プログラム及び文書検索プログラムを記録した媒体 | |
JP2000331012A (ja) | 電子化文書検索方法 | |
JPH09259141A (ja) | 地図データリンケージシステム | |
US20020065794A1 (en) | Phonetic method of retrieving and presenting electronic information from large information sources, an apparatus for performing the method, a computer-readable medium, and a computer program element | |
JPH07296005A (ja) | 日本語テキスト登録・検索装置 | |
JP3389285B2 (ja) | 固有名詞特定方法 | |
JP2000090110A (ja) | 全文検索方法、装置、および全文検索プログラムを記録した記録媒体 | |
JPH1185765A (ja) | タグ付文書検索システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |