JP2001337992A - 類似検索システム及び類似検索方法 - Google Patents

類似検索システム及び類似検索方法

Info

Publication number
JP2001337992A
JP2001337992A JP2000158164A JP2000158164A JP2001337992A JP 2001337992 A JP2001337992 A JP 2001337992A JP 2000158164 A JP2000158164 A JP 2000158164A JP 2000158164 A JP2000158164 A JP 2000158164A JP 2001337992 A JP2001337992 A JP 2001337992A
Authority
JP
Japan
Prior art keywords
similarity
attribute
search
calculated
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000158164A
Other languages
English (en)
Inventor
Katsuhiko Tsujino
克彦 辻野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2000158164A priority Critical patent/JP2001337992A/ja
Publication of JP2001337992A publication Critical patent/JP2001337992A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 1つの単語で複数の異なった概念を表現しか
つ程度を表す概念を用いて表した類似度を用いて検索パ
ターンに類似した事例データを検索することができる。 【解決手段】 類似度検索装置10は、事例データベー
スメモリ11に格納された事例データベースに基づい
て、メモリ12,13及び14に格納されたデータを参
照して、事例データベース内の各属性において各検索パ
ターンを含む度合いを示す含み類似度と、事例データベ
ース内の各属性において各検索パターンが含まれる度合
いを示す含まれ類似度とを計算し、計算された各含み類
似度と各含まれ類似度とに基づいて、事例データベース
内の全体の属性での割合を示す類似度割合を計算して出
力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、事例データベース
から予め指定したキーワードに類似するデータを検索し
て出力する類似検索システム及び類似検索方法に関す
る。
【0002】
【従来の技術】従来例の類似検索システムが、例えば、
特開平11−110404号公報において開示されてお
り、その構成を示すブロック図を図3に示す。従来例の
類似検索システムは、事例データベースを格納する事例
データベースメモリ101と、検索パターンを格納する
検索パターンメモリ102と、検索パターンに対応する
類似事例の類似度を計算する類似度計算装置103と、
計算された類似度を表示する類似度表示装置104とを
備えて構成される。
【0003】従来例の類似検索システムにおいては、1
組のキーワード空間で定義されるキーワードの有無によ
り検索パターン及び検索対象を表現し、このキーワード
に基づき、検索パターンメモリ102内の検索パターン
と、事例データベースメモリ101内の検索対象とを比
較することにより検索を行っていた。
【0004】
【発明が解決しようとする課題】従って、従来例の類似
検索システムにおいては、言語の多義性に伴う問題か
ら、複数の異なった概念(例えば、「新聞で知る」の
「新聞」において記述されている内容と見る場合と、
「新聞で拭く」の「新聞」を物理的存在物と見る場合の
複数の異なった概念)を1つのキーワードで特徴付けて
表現してしまったり、これを避けるため、キーワードの
文字表現が複雑(例えば、「新聞報道」と「新聞紙」な
どのように文字表現が複雑)になってしまうという問題
点があった。
【0005】また、例えば、回数や成立度、信頼度など
の程度を表す概念をキーワードの有無として離散的に表
していたため、強い概念の部分的な成立状態(例えば、
「適時入院する」など)と弱い概念の全面的な成立状態
(例えば、「毎日往診を受ける」など)の類似性が適切
に表現できないという問題点があった。
【0006】本発明の目的は以上の問題点を解決し、1
つの単語で複数の異なった概念を表現しかつ程度を表す
概念を用いて表した類似度を用いて検索パターンに類似
した事例データを検索することができる類似検索システ
ム及び類似検索方法を提供することにある。
【0007】
【課題を解決するための手段】本発明に係る類似検索シ
ステムは、キーワードを含む集合空間である各属性に対
して、キーワードである属性値を含むか否かを示す形式
で事例を表すデータを含む事例データベースを格納する
第1の記憶装置と、各属性値が各属性値に含まれる度合
いの類似度と、各属性値が各属性値を含む度合いの類似
度とを示す第1の類似度テーブルを格納する第2の記憶
装置と、検索すべきキーワードを含む集合空間である各
属性に対して、検索すべきキーワードである属性値を含
むか否かを示す形式で検索パターンを表すデータを含む
検索パターンを格納する第3の記憶装置と、キーワード
を含む集合空間である各属性に対して、キーワードであ
る属性値を含む又は含まれるを示す形式で類似度設定を
表すデータを格納する第4の記憶装置と、上記第1の記
憶装置に格納された事例データベースに基づいて、上記
第2、第3及び第4の記憶装置に格納されたデータを参
照して、上記事例データベース内の各属性において上記
各検索パターンを含む度合いを示す含み類似度と、上記
事例データベース内の各属性において上記各検索パター
ンが含まれる度合いを示す含まれ類似度とを計算し、計
算された各含み類似度と各含まれ類似度とに基づいて、
上記事例データベース内の全体の属性での割合を示す類
似度割合を計算して出力する類似検索手段とを備えたこ
とを特徴とする。
【0008】また、上記類似検索システムにおいて、上
記類似検索手段は、好ましくは、上記第1の記憶装置に
格納された事例データベースに基づいて、上記第2、第
3及び第4の記憶装置に格納されたデータを参照して、
上記事例データベース内の各属性において、各検索パタ
ーンを含む属性値で最大の類似度を有する各属性値の類
似度の平均値を含み類似度として計算し、上記事例デー
タベース内の各属性において、各検索パターンが含まれ
る属性値で最大の類似度を有する各属性値の類似度の平
均値を含まれ類似度として計算する。
【0009】さらに、上記類似検索システムにおいて、
上記類似検索手段は、好ましくは、上記第1の記憶装置
に格納された事例データベースに基づいて、上記第2、
第3及び第4の記憶装置に格納されたデータを参照し
て、計算された含み類似度と、計算された含まれ類似度
とを、上記検索パターンの大きさと、上記事例データベ
ース内の属性の大きさとを用いて加重平均値を計算し
て、計算された加重平均値を、上記検索パターンと上記
事例データベース内の属性との間の相互類似度として計
算する。
【0010】また、上記類似検索システムにおいて、上
記第4の記憶装置は、好ましくは、キーワードを含む集
合空間である各属性に対して、キーワードである属性値
を含み又は含まれることを示すときの重み係数をさらに
格納し、上記類似検索手段は、上記計算された各含み類
似度と各含まれ類似度とに基づいて、上記重み係数を考
慮して、上記検索パターンと上記事例データベース内の
属性との間の全体の類似度を計算し、上記計算された全
体の類似度に基づいて、上記重み係数を考慮して、上記
事例データベース内の全体の属性での割合を示す類似度
割合を計算して出力する。
【0011】さらに、上記類似検索システムにおいて、
上記第2の記憶装置は、好ましくは、各属性値の程度間
の類似度を示す第2の類似度テーブルをさらに格納し、
上記類似検索手段は、さらに第2の類似度テーブルを参
照して、上記含み類似度と上記含まれ類似度とを計算す
る。
【0012】またさらに、上記類似検索システムにおい
て、上記第1と第3の記憶装置は、好ましくは、キーワ
ードを含む集合空間である各属性に対して、キーワード
である属性値を含むか否かを示すときに、チェックマー
クを用いて含むことを示す形式で格納される。
【0013】本発明に係る類似検索方法は、キーワード
を含む集合空間である各属性に対して、キーワードであ
る属性値を含むか否かを示す形式で事例を表すデータを
含む事例データベースを第1の記憶装置に格納するステ
ップと、各属性値が各属性値に含まれる度合いの類似度
と、各属性値が各属性値を含む度合いの類似度とを示す
第1の類似度テーブルを第2の記憶装置に格納するステ
ップと、検索すべきキーワードを含む集合空間である各
属性に対して、検索すべきキーワードである属性値を含
むか否かを示す形式で検索パターンを表すデータを含む
検索パターンを第3の記憶装置に格納するステップと、
キーワードを含む集合空間である各属性に対して、キー
ワードである属性値を含む又は含まれるを示す形式で類
似度設定を表すデータを第4の記憶装置に格納するステ
ップと、上記第1の記憶装置に格納された事例データベ
ースに基づいて、上記第2、第3及び第4の記憶装置に
格納されたデータを参照して、上記事例データベース内
の各属性において上記各検索パターンを含む度合いを示
す含み類似度と、上記事例データベース内の各属性にお
いて上記各検索パターンが含まれる度合いを示す含まれ
類似度とを計算し、計算された各含み類似度と各含まれ
類似度とに基づいて、上記事例データベース内の全体の
属性での割合を示す類似度割合を計算して出力する類似
検索ステップとを含むことを特徴とする。
【0014】また、上記類似検索方法において、上記類
似検索ステップは、好ましくは、上記第1の記憶装置に
格納された事例データベースに基づいて、上記第2、第
3及び第4の記憶装置に格納されたデータを参照して、
上記事例データベース内の各属性において、各検索パタ
ーンを含む属性値で最大の類似度を有する各属性値の類
似度の平均値を含み類似度として計算し、上記事例デー
タベース内の各属性において、各検索パターンが含まれ
る属性値で最大の類似度を有する各属性値の類似度の平
均値を含まれ類似度として計算する。
【0015】さらに、上記類似検索方法において、上記
類似検索ステップは、好ましくは、上記第1の記憶装置
に格納された事例データベースに基づいて、上記第2、
第3及び第4の記憶装置に格納されたデータを参照し
て、計算された含み類似度と、計算された含まれ類似度
とを、上記検索パターンの大きさと、上記事例データベ
ース内の属性の大きさとを用いて加重平均値を計算し
て、計算された加重平均値を、上記検索パターンと上記
事例データベース内の属性との間の相互類似度として計
算する。
【0016】また、上記類似検索方法において、上記デ
ータを第4の記憶装置に格納するステップは、好ましく
は、キーワードを含む集合空間である各属性に対して、
キーワードである属性値を含み又は含まれることを示す
ときの重み係数をさらに格納するステップを含み、上記
類似検索ステップは、上記計算された各含み類似度と各
含まれ類似度とに基づいて、上記重み係数を考慮して、
上記検索パターンと上記事例データベース内の属性との
間の全体の類似度を計算し、上記計算された全体の類似
度に基づいて、上記重み係数を考慮して、上記事例デー
タベース内の全体の属性での割合を示す類似度割合を計
算して出力する。
【0017】さらに、上記類似検索方法において、上記
第1の類似度テーブルを第2の記憶装置に格納するステ
ップは、好ましくは、各属性値の程度間の類似度を示す
第2の類似度テーブルをさらに格納するステップを含
み、上記類似検索ステップは、さらに第2の類似度テー
ブルを参照して、上記含み類似度と上記含まれ類似度と
を計算する。
【0018】またさらに、上記類似検索方法において、
上記第1と第3の記憶装置は、好ましくは、キーワード
を含む集合空間である各属性に対して、キーワードであ
る属性値を含むか否かを示すときに、チェックマークを
用いて含むことを示す形式で格納される。
【0019】
【発明の実施の形態】以下、図面を参照して本発明に係
る実施の形態について説明する。
【0020】図1は、本発明に係る一実施の形態である
類似検索システムの構成を示すブロック図である。この
実施の形態に係る類似検索システムは、図1に示すよう
に、図2の類似検索処理を実行する類似度検索装置10
と、事例ベクトルSS1,SS2,…を含む事例データ
ベースを格納する事例データベースメモリ11と、属性
値間類似度テーブル12aと属性値程度間類似度テーブ
ル12bとを有する類似度テーブルメモリ12と、類似
度設定セットテーブルを格納する類似度設定セットテー
ブルメモリ13と、検索パターンベクトルPP1,PP
2,…を格納する検索パターンメモリ14と、例えばC
RTディスプレイ装置又はプリンタ装置にてなり類似検
索装置10によって計算された類似度計算結果を出力す
る類似度計算結果出力装置15とを備えて構成される。
【0021】本実施の形態に係る類似検索システムの構
成を概説すれば、事例データベースメモリ11は、キー
ワードを含む集合空間である各属性に対して、キーワー
ドである属性値を含むか否かを示す形式で事例を表すデ
ータを含む事例データベースを格納する。また、類似度
テーブルメモリ12は、各属性値が各属性値に含まれる
度合いの類似度と、各属性値が各属性値を含む度合いの
類似度とを示す第1の類似度テーブルである属性値間類
似度テーブル12aと、各属性値の程度間の類似度を示
す第2の類似度テーブルである属性値程度間類似度テー
ブル12bとを格納する。さらに、検索パターンメモリ
14は、検索すべきキーワードを含む集合空間である各
属性に対して、検索すべきキーワードである属性値を含
むか否かを示す形式で検索パターンを表すデータを含む
検索パターンを格納する。またさらに、類似度設定セッ
トテーブルメモリ13は、キーワードを含む集合空間で
ある各属性に対して、キーワードである属性値を含む又
は含まれるを示す形式で類似度設定を表すデータと、キ
ーワードを含む集合空間である各属性に対して、キーワ
ードである属性値を含み又は含まれることを示すときの
重み係数とのセットである類似度設定セットを格納す
る。
【0022】そして、類似度検索装置10は、上記事例
データベースメモリ11内の事例データベースに基づい
て、上記メモリ12、13及び14に格納されたデータ
を参照して、図2の類似検索処理を実行することによ
り、上記事例データベース内の各属性において上記各検
索パターンを含む度合いを示す含み類似度と、上記事例
データベース内の各属性において上記各検索パターンが
含まれる度合いを示す含まれ類似度とを計算し(数1乃
至数3参照)、計算された各含み類似度と各含まれ類似
度とに基づいて、上記事例データベース内の全体の属性
での割合を示す類似度割合を計算して(数8参照)出力
することを特徴としている。ここで、類似検索装置10
は、上記事例データベース内の各属性において、各検索
パターンを含む属性値で最大の類似度を有する各属性値
の類似度の平均値を含み類似度として計算し(数4参
照)、上記事例データベース内の各属性において、各検
索パターンが含まれる属性値で最大の類似度を有する各
属性値の類似度の平均値を含まれ類似度として計算する
(数3及び数4参照)。また、類似度検索装置10は、
計算された含み類似度と、計算された含まれ類似度と
を、上記検索パターンの大きさと、上記事例データベー
ス内の属性の大きさとを用いて加重平均値を計算して
(数7参照)、計算された加重平均値を、上記検索パタ
ーンと上記事例データベース内の属性との間の相互類似
度として計算する(数5参照)。
【0023】まず、本実施の形態で用いる記号の説明を
以下に行う。 (a)M:事例数、 (b)n:属性の次元数、 (c)ti:i番目の属性の属性値(キーワード)数、 (d)Ti:i番目の属性の属性値間類似度テーブル、 (e)Ci:i番目の(属性値の回数リストからなる)
属性の属性値程度間類似度テーブル、 (f)kij:i番目の属性におけるj番目の属性値、 (g)ui:i番目の類似度設定セット、 (h)wij:i番目の類似度設定セットにおけるj番目
の属性の重み係数、 (i)fij:i番目の類似度設定セットにおけるj番目
の類似度の種類(ここで、類似度の種類は、「含まれ類
似度」、「含み類似度」及び「相互類似度」を含
む。)、 (j)PP:n次元の属性からなる検索パターンベクト
ル、 (k)Pi:Pのi番目の属性における属性値リスト、 (l)SSSm:n次元の属性からなるm番目の事例ベ
クトル、 (m)SSmi:m番目の事例ベクトルにおけるi番目
の属性の属性値リスト、 (n)|x|:要素xの要素数又は次元数。
【0024】図1において、事例データベースメモリ1
1は、類似事例の空間を示す事例ベクトルSS1,SS
2,SS3,…を格納する。ここで、事例ベクトルSS
1,SS2,SS3の一例を以下の表に示す。なお、以
下の表において、”レ”はその事例ベクトルの属性が属
性値に該当することを示すチェックマークであり、事例
データベースは、各事例ベクトルの属性において各属性
値に対して該当するか否かを、チェックマークを用いて
示す属性ベクトルSS11及びSS12を含む。また、
属性ベクトルSS13においては、チェックマークの代
わりに各属性値が満たされる程度を記載している。
【0025】
【表1】事例ベクトルSS1
【0026】例えば、事例ベクトルSS1は、属性ベク
トルSS11,SS12,SS13を含み、属性ベクト
ルSS11は属性値A及びBを含み、属性ベクトルSS
12は属性値Xを含み、属性ベクトルSS13は属性値
Lを程度2で含むが、属性値M及びNを含まないことを
示している。以下、事例ベクトルSS2,SS3につい
ても同様である。
【0027】
【表2】事例ベクトルSS2
【0028】
【表3】事例ベクトルSS3
【0029】また、検索パターンメモリ14に格納され
る検索パターンベクトルPPの一例及び類似度設定セッ
トテーブルメモリ13に格納される類似度設定セットの
一例を以下の表に示す。以下の表において、”レ”は検
索パターンベクトルの属性が属性値に該当することを示
すチェックマークであり、検索パターンメモリ14は、
検索パターンベクトルにおいて各属性値に対して該当す
るか否かを、チェックマークを用いて示す属性ベクトル
PP1及びPP2を含む。
【0030】
【表4】実施例1の検索パターンベクトルPPと類似度
設定セットu
【0031】ここで、実施例1の検索パターンベクトル
PPは、属性ベクトルPP1,PP2,PP3を含み、
ここで、属性ベクトルPP11は属性値B及びCを含
み、重み係数w1=1.0でPPを含むものを検索する
ものと登録されている。また、属性ベクトルPP12は
属性値Yのみを含み、重み係数w2=1.0で検索パタ
ーンベクトルPPを含むものを検索するものと登録され
ている。さらに、属性ベクトルPP3は何も属性値を含
まないと登録されている。
【0032】さらに、類似度テーブルメモリ12に格納
される属性値間類似度テーブル12aと属性値程度間類
似度テーブル12bの一例を以下の表に示す。各類似度
テーブル12a,12bにおいて、各類似度は、列に示
した属性値が行に示した属性値に含まれる度合いの類似
度を示す一方、行に示した属性値が列に示した属性値に
含む度合いの類似度を示す。
【0033】
【表5】属性値間類似度テーブルT1
【0034】
【表6】属性値間類似度テーブルT2
【0035】
【表7】属性値間類似度テーブルT3
【0036】
【表8】属性値程度間類似度テーブルC3
【0037】次いで、本実施の形態で用いる「含まれ類
似度」、「含み類似度」、「類似度」及び「類似度割
合」について以下に説明する。 (a)dk(kix,kiy)は属性値(キーワード)kix
が属性値(キーワード)kiyに含まれる程度を表す「含
まれ類似度」であり、属性値間類似度テーブルTiのx
行目でy列目に記載されている。 (b)dc(kix,kiy)は属性値程度間類似度テーブ
ルCiにおける属性の属性値kix,kiyの各程度を表す
「含まれ類似度」であり、属性値程度間類似度テーブル
Ciのx行目でy列目に記載されている。
【0038】(c)一般に、「含まれ類似度」d
(kix,kiy)は、次式で表される。 (c−1)i番目の属性が属性値間類似度テーブルTi
における属性値をとる属性であるとき:
【0039】
【数1】
【0040】(c−2)i番目の属性が属性値程度間類
似度テーブルCiにおける属性値をとる属性であると
き:
【0041】
【数2】
【0042】(d)D<(PPi,SSmi)は、検索
パターンベクトルPPiが事例ベクトルSSmiに含ま
れる程度を表す「含まれ類似度」であり、次式で表すこ
とができる。
【0043】
【数3】
【0044】(e)D>(PPi,SSmi)は、検索
パターンベクトルPPiが事例ベクトルSSmiに含む
程度を表す「含み類似度」であり、所定の条件のもと
で、次式に示すように、「含まれ類似度」に等しい。
【0045】
【数4】
【0046】(f)D(PPi,SSmi)は、検索
パターンベクトルPPiが事例ベクトルSSmiに近い
ときの「相互の類似度」であり、次式で表される。
【0047】
【数5】
【0048】なお、上記数5の左辺のDの下付き文字
(2つの〜で示している。)は、数式の所定のフォント
で表現できないために、≒と同義で用いている。 (g)D(PP,SSm,uz)は検索パターンベクト
ルPPと事例ベクトルSSmの類似度設定セットuz
おける類似度であり、次式で表される。
【0049】
【数6】
【0050】ここで、
【数7】
【0051】また、fziは、類似度の種類であり、<、
>、又は≒のいずれかである。 (h)類似度割合R(PP,SSm,uz)は、検索パ
ターンベクトルPPと事例ベクトルSSmの類似度設定
セットuzにおける類似度であり、次式で表される。
【0052】
【数8】
【0053】図2は、図1の類似度検索装置10によっ
て実行される類似検索処理を示すフローチャートであ
る。図2において、まず、ステップS1において、事例
データベースメモリ11内の事例データベースに基づい
て、類似度テーブルメモリ12内の各類似度テーブル1
2a及び12bと、類似度設定セットテーブルメモリ1
3内の類似度設定セットテーブルと、検索パターンメモ
リ14内の検索パターンベクトルとを参照して、上記数
1ないし数5を用いて、含まれ類似度D<(PPi,S
Smi)と、含み類似度D>(PPi,SSmi)と、
相互類似度D(PPi,SSmi)とを計算する。次
いで、ステップS2において、計算された含まれ類似度
<(PPi,SSmi)と、含み類似度D>(PPi,
SSmi)と、相互類似度D(PPi,SSmi)と
に基づいて、検索パターンメモリ14内の検索パターン
ベクトルと、類似度設定セットテーブルメモリ13内の
類似度設定セットテーブルとを参照して、上記数6及び
数7を用いて、類似度D(PP,SSm,uz)を計算
した後、上記数8を用いて類似度割合R(PP,SS
m,uz)を計算する。さらに、ステップS3におい
て、計算された類似度割合R(PP,SSm,uz)を
降順でソートして各事例ベクトルSSmに対する類似度
割合R(PP,SSm,uz)を類似度計算結果として
類似度計算結果出力装置15に出力してソートした順序
で表示又は印字して当該類似検索処理を終了する。
【0054】以上説明したように、本発明に係る実施の
形態によれば、以下の特有の効果を有する。 (A)事例データベースメモリ11と検索パターンメモ
リ14とを備えたので、検索対象、検索パターンを簡単
かつ柔軟に表現できる。 (B)類似度テーブルメモリ12と類似度設定セットテ
ーブルメモリ13とを備えたので、類似検索すべき類似
性を簡単かつ柔軟に表現できる。すなわち、「含まれ類
似度」、「含む類似度」及び「相互類似度」を用いて類
似度を表すようにしたので、これらのキーワード(及び
程度)相互の類似度を非対称に表現でき管理できる(す
なわち、Aから見たBへの類似度とBからみたAへの類
似度は異なるとした)ことにより、程度の類似性(「大
は小を兼ねる」など)の表現がより自然に表現できるよ
うになった。 (C)事例データベースメモリ11と検索パターンメモ
リ14においてチェックリストを含む形式にしたので、
所望の検索方法や検索方針を簡単かつ柔軟に指示でき
る。すなわち、複数のキーワード空間(属性と呼ぶ)に
属するキーワード(属性値)のチェックリスト(それぞ
れのキーワードとの相関の有無)及び属性値の回数(そ
れぞれのキーワードの程度)を用いて、検索パターン及
び検索対象を表現することにより、異なった属性におい
て同じ文字表現の属性値を異なったものとして扱うこと
や、キーワードの程度の差とキーワードの差異を総合的
に勘案した類似度の定義などが可能となった。
【0055】変形例.以上の実施の形態において、事例
データベースメモリ11及び検索パターンメモリ14に
おいて、上述のチェックリストの形式をとらず、キーワ
ードの空間である属性が各属性値を含むもののみを記載
する形式であってもよい。
【0056】以上の実施の形態において、類似度テーブ
ルメモリ12は、特に、属性値程度間類似度テーブル1
2bを含まなくてもよい。
【0057】以上の実施の形態において、類似度設定セ
ットテーブルメモリ13は、重み係数は1又は0であっ
て、含有方法は、検索パターンベクトルPPを含む、検
索パターンベクトルPPに含まれる、検索パターンベク
トルPPに近いのうちの少なくとも前者の2つを含み、
含有方法のみを記載して重み係数を記載しなくてもよ
い。この場合、相互類似度を計算せずに、含まれ類似度
と含み類似度のみを計算すればよい。
【0058】
【実施例】さらに、上述の実施の形態に係る類似検索シ
ステムを用いた実施例について詳述する。以下の実施例
1乃至5においては、表1乃至表3に示した事例データ
ベース表5乃至表8に示した類似度テーブルを用いる。
【0059】実施例1.実施例1では、表4に示した検
索パターンベクトル及び類似度設定セットテーブルを用
いる。以上のデータを用いて、図2の類似検索処理を実
行して、各検索パターンベクトルPPと事例ベクトルS
Smと類似度設定セットuzに係る類似度D(PP,S
Sm,uz)及び類似度割合R(PP,SSm,uz)を
計算すれば、以下のようになる。
【0060】
【数9】
【0061】
【数10】
【0062】従って、
【数11】
【0063】
【数12】 となる。
【0064】また、
【数13】
【0065】
【数14】 となる。
【0066】さらに、
【数15】
【0067】
【数16】 となる。
【0068】従って、実施例1では、事例ベクトルSS
3が検索パターンベクトルPPを最も含み、事例ベクト
ルSS2が検索パターンベクトルPPを2番目に含み、
事例ベクトルSS1が検索パターンベクトルPPを3番
目に含むと判断できる。
【0069】実施例2.実施例2において用いる検索パ
ターンベクトルPPと類似度設定セットuを以下の表に
示す。なお、事例ベクトルSSと、類似度テーブルは実
施例1と同様のものを用いる。
【0070】
【表9】実施例2の検索パターンベクトルPPと類似度
設定セットu
【0071】以上のデータを用いて、図2の類似検索処
理を実行して、各検索パターンベクトルPPと事例ベク
トルSSmと類似度設定セットuzに係る類似度D(P
P,SSm,uz)及び類似度割合R(PP,SSm,
z)を計算すれば、以下のようになる。
【0072】
【数17】
【0073】
【数18】
【0074】
【数19】
【0075】
【数20】
【0076】
【数21】
【0077】
【数22】
【0078】従って、実施例2では、事例ベクトルSS
2が検索パターンベクトルPPを最も含み、事例ベクト
ルSS3が検索パターンベクトルPPを2番目に含み、
事例ベクトルSS1が検索パターンベクトルPPを3番
目に含むと判断できる。
【0079】実施例3.実施例3において用いる検索パ
ターンベクトルPPと類似度設定セットuを以下の表に
示す。なお、事例ベクトルSSと、類似度テーブルは実
施例1と同様のものを用いる。
【0080】
【表10】実施例3の検索パターンベクトルPPと類似
度設定セットu
【0081】以上のデータを用いて、図2の類似検索処
理を実行して、各検索パターンベクトルPPと事例ベク
トルSSmと類似度設定セットuzに係る類似度D(P
P,SSm,uz)及び類似度割合R(PP,SSm,
z)を計算すれば、以下のようになる。
【0082】
【数23】
【0083】
【数24】
【0084】
【数25】
【0085】
【数26】
【0086】
【数27】
【0087】
【数28】
【0088】従って、実施例3では、事例ベクトルSS
3が検索パターンベクトルPPを近く、事例ベクトルS
S1が検索パターンベクトルPPを2番目に近く、事例
ベクトルSS2が検索パターンベクトルPPを3番目に
近いと判断できる。
【0089】実施例4.実施例4において用いる検索パ
ターンベクトルPPと類似度設定セットuを以下の表に
示す。なお、事例ベクトルSSと、類似度テーブルは実
施例1と同様のものを用いる。
【0090】
【表11】実施例4の検索パターンベクトルPPと類似
度設定セットu
【0091】以上のデータを用いて、図2の類似検索処
理を実行して、各検索パターンベクトルPPと事例ベク
トルSSmと類似度設定セットuzに係る類似度D(P
P,SSm,uz)及び類似度割合R(PP,SSm,
z)を計算すれば、以下のようになる。
【0092】
【数29】
【0093】
【数30】
【0094】
【数31】
【0095】
【数32】
【0096】
【数33】
【0097】
【数34】
【0098】従って、実施例4では、事例ベクトルSS
3が検索パターンベクトルPPを近く、事例ベクトルS
S2が検索パターンベクトルPPを2番目に近く、事例
ベクトルSS1が検索パターンベクトルPPを3番目に
近いと判断できる。
【0099】実施例5.実施例5において用いる検索パ
ターンベクトルPPと類似度設定セットuを以下の表に
示す。なお、事例ベクトルSSと、類似度テーブルは実
施例1と同様のものを用いる。また、表12において、
検索パターンベクトルの属性PP3においては、チェッ
クマークの代わりに各属性値が満たされる程度に対する
類似度を記載している。
【0100】
【表12】実施例5の検索パターンベクトルPPと類似
度設定セットu
【0101】以上のデータを用いて、図2の類似検索処
理を実行して、各検索パターンベクトルPPと事例ベク
トルSSmと類似度設定セットuzに係る類似度D(P
P,SSm,uz)及び類似度割合R(PP,SSm,
z)を計算すれば、以下のようになる。
【0102】
【数35】
【0103】
【数36】
【0104】
【数37】
【0105】
【数38】
【0106】
【数39】
【0107】
【数40】
【0108】従って、実施例5では、事例ベクトルSS
3が検索パターンベクトルPPを最も含み、事例ベクト
ルSS2が検索パターンベクトルPPを2番目に含み、
事例ベクトルSS1が検索パターンベクトルPPを3番
目に含むと判断できる。
【0109】実施例6.実施例6では、上述の実施の形
態に係る類似検索システムを用いて、「在宅介護サービ
ス計画支援装置」に適用したときの実施例について説明
する。
【0110】この実施例において用いる属性、属性値及
び類似度テーブル内の各類似度テーブル12a,12b
として以下を用いる。 (a)属性1:属性は、問題領域(聞き取り調査の結果
得られる現状分析結果)をチェックする属性である。ま
た、属性値は、ADL(日常生活動作)の介護又はリハ
ビリの可能性(以下、「ADL/リハビリの可能性」と
記す。)、手段的日常生活能力(IADL)、健康増
進、…、排便の管理、尿失禁と留置カテーテルなど30
種類を含む。さらに、属性値間類似度テーブル12a
は、30×30の表であり、ここで、対角成分は1.0
に設定され、残りは基本的には0.0に設定されるが、
一部分0.0〜1.0の所定値に設定してもよい。 (b)属性2:属性は、ニーズ(問題領域を総合的に勘
案した専門家の判断)をチェックする属性である。ま
た、属性値は、ADLの介助が必要、日常生活に見守り
が必要、…、緊急事態への対応体制の整備が必要、住環
境の整備が必要など30種類程度の属性値を含む。さら
に、属性値間類似度テーブル12aは、30×30の表
であり、ここで、対角成分は基本的に1.0に設定され
るが、専門家の判断により修正してもよい。 (c)属性3:属性は、主訴(介護を受ける人及びその
家族の要望及び意向)をチェックする属性である。ま
た、属性値は、通所系のケアを希望する、医療処置やリ
ハビリを積極的に行って欲しい、保険外のサービスでも
積極的に利用したい、…、金銭管理できなくて困ってい
る、人とのかかわりが少なくて困っているなど30種類
程度の属性値を含む。さらに、属性値間類似度テーブル
12aは、30×30の表であり、ここで、対角成分は
基本的に1.0に設定されるが、専門家の判断により修
正してもよい。 (d)属性4:属性は、目標(専門家と介護を受ける側
との共通の目標)をチェックする属性である。また、属
性値は、日常生活動作の介護負担を軽減する、社会的交
流を図る、…、感染を防ぐ、介護負担を軽減するなど1
0種類程度の属性値を含む。さらに、属性値間類似度テ
ーブル12aは、10×10の表であり、ここで、対角
成分は基本的に1.0に設定されるが、専門家の判断に
より修正してもよい。 (e)属性5:属性は、要介護度(介護保険の認定度)
をチェックする属性である。また、属性値は、例えば厚
生省により規定された、自立、要支援、要介護度1、
…、要介護度5の7種類の属性値を含む。さらに、属性
値間類似度テーブル12aは、7×7の表であり、ここ
で、対角成分は基本的に1.0に設定されるが、専門家
の判断により修正してもよい。 (f)属性6:属性は、介護内容(介護の内容と頻度)
の程度を表す属性である。また、属性値は、例えば、移
動の介助、買い物の介助、食事の機能回復訓練、…、薬
剤の管理、レクリエーション等への参加など30種類程
度の属性値を含む。さらに、属性値間類似度テーブル1
2aは、30×30の表であり、ここで、対角成分は基
本的に1.0に設定されるが、専門家の判断により修正
してもよい。また、属性値程度間類似度テーブル12b
における程度である頻度値は、毎日、週5回、週3回、
隔日、週2回、週1回、…などの20種類程度を含む。
属性値程度間類似度テーブル12bの一例(一部の抜
粋)を以下に示す。
【0111】
【表13】属性値程度間類似度テーブル12bの一例
(一部の抜粋)
【0112】ここで、「毎日」は「毎日」に完全に含ま
れ、「週5回」は「毎日」に0.8程度含まれるが、
「毎日」は「週5回」に0.6程度しか含まれない、な
どを表す。この属性値程度間類似度テーブル12bにつ
いては、専門家の判断により修正してもよい。
【0113】(g)属性7:属性は、サービス種別(介
護サービスの種類/介護担当者の職務)の程度を表す属
性である。また、属性値は、通所介護、訪問看護、…、
訪問入浴、短期入所など10種類程度の属性値を含む。
さらに、属性値間類似度テーブル12aは、10×10
の表であり、ここで、対角成分は基本的に1.0に設定
されるが、専門家の判断により修正してもよい。また、
属性値程度間類似度テーブル12bにおける程度である
頻度値は、毎日、週5回、週3回、隔日、週2回、週1
回、…などの20種類程度を含む。属性値程度間類似度
テーブル12bは上述の属性6と同様に設定される。
【0114】また、実施例6における事例ベクトルSS
の一例を以下の表に示す。
【0115】
【表14】実施例6の事例ベクトルSSの一例
【0116】さらに、実施例6における検索パターンベ
クトルPPの一例を以下の表に示す。
【0117】
【表15】実施例6の検索パターンベクトルPPの一例
【0118】上記の検索パターンの表では、「ADL/
リハビリの可能」と「高齢者の虐待」を問題としてかか
えている「要介護度1」の方で、「社会的交流」を目的
に「通所系のケア」を主訴に「通所介護」サービスに含
むような検索パターンを考え、問題の類似性と要介護
度、目標の条件が満たされることを重視している。
【0119】実施例6を本実施の形態に適用したときの
汎用的方法として見た効果として以下を有する。 (1)専門家から見た属性(問題領域、ニーズ、目標な
ど)と介護を受ける方の要望(主訴、目標など)と介護
内容、介護事業者(サービス)種別などが独立した属性
として表現されているので、表現上の混乱(「排泄の介
助が必要」と感じているのが専門家なのか、本人なのか
の合意の結果なのかなど、必ずしも専門家の意見と本人
や家族の意見は一致しない、そのことがまた事例の特性
を表すことともなる)がおきにくい。すなわち、汎用的
に適用することができ、しかも適用基準も明確である。 (2)(1)と同じ理由により、重みを変更することに
より、専門家の意見重視のパターンとか本人の要望重視
のパターンとか予算(要介護度の差異)重視のパターン
とかが簡単に設定できる。また、介護計画サービスに適
用した際の効果として、以下を有する。 (3)問題領域や主訴などから、その時に必要とされる
介護を検索することにより、介護計画の設計支援が効率
化される。 (4)(3)とは逆に、介護のパターンからそれに対応
付けられる状況(問題や主訴)などを逆検索することに
より、介護パッケージの特性や(それが想定する)効果
などについて専門家が確認する作業(学習支援など)を
支援することができる。
【0120】
【発明の効果】以上詳述したように本発明に係る類似検
索システムによれば、キーワードを含む集合空間である
各属性に対して、キーワードである属性値を含むか否か
を示す形式で事例を表すデータを含む事例データベース
を格納する第1の記憶装置と、各属性値が各属性値に含
まれる度合いの類似度と、各属性値が各属性値を含む度
合いの類似度とを示す第1の類似度テーブルを格納する
第2の記憶装置と、検索すべきキーワードを含む集合空
間である各属性に対して、検索すべきキーワードである
属性値を含むか否かを示す形式で検索パターンを表すデ
ータを含む検索パターンを格納する第3の記憶装置と、
キーワードを含む集合空間である各属性に対して、キー
ワードである属性値を含む又は含まれるを示す形式で類
似度設定を表すデータを格納する第4の記憶装置と、上
記第1の記憶装置に格納された事例データベースに基づ
いて、上記第2、第3及び第4の記憶装置に格納された
データを参照して、上記事例データベース内の各属性に
おいて上記各検索パターンを含む度合いを示す含み類似
度と、上記事例データベース内の各属性において上記各
検索パターンが含まれる度合いを示す含まれ類似度とを
計算し、計算された各含み類似度と各含まれ類似度とに
基づいて、上記事例データベース内の全体の属性での割
合を示す類似度割合を計算して出力する類似検索手段と
を備える。従って、本発明によれば、以下の特有の効果
を有する。 (A)上記第1と第3の記憶装置を備えたので、検索対
象、検索パターンを簡単かつ柔軟に表現できる。 (B)上記第2と第4の記憶装置を備えたので、類似検
索すべき類似性を簡単かつ柔軟に表現できる。すなわ
ち、「含まれ類似度」及び「含む類似度」を用いて類似
度を表すようにしたので、これらのキーワード相互の類
似度を非対称に表現でき管理できる(すなわち、Aから
見たBへの類似度とBからみたAへの類似度は異なると
した)ことにより、程度の類似性(「大は小を兼ねる」
など)の表現がより自然に表現できるようになった。 (C)上記類似検索手段により、1つの単語で複数の異
なった概念を表現した類似度を用いて検索パターンに類
似した事例データを容易にかつ適切に検索することがで
きる。
【0121】また、上記類似検索システムにおいて、上
記類似検索手段は、好ましくは、上記第1の記憶装置に
格納された事例データベースに基づいて、上記第2、第
3及び第4の記憶装置に格納されたデータを参照して、
上記事例データベース内の各属性において、各検索パタ
ーンを含む属性値で最大の類似度を有する各属性値の類
似度の平均値を含み類似度として計算し、上記事例デー
タベース内の各属性において、各検索パターンが含まれ
る属性値で最大の類似度を有する各属性値の類似度の平
均値を含まれ類似度として計算する。従って、上記類似
検索手段により、1つの単語で複数の異なった概念を表
現した類似度を用いて検索パターンに類似した事例デー
タを容易にかつ適切に検索することができる。
【0122】さらに、上記類似検索システムにおいて、
上記類似検索手段は、好ましくは、上記第1の記憶装置
に格納された事例データベースに基づいて、上記第2、
第3及び第4の記憶装置に格納されたデータを参照し
て、計算された含み類似度と、計算された含まれ類似度
とを、上記検索パターンの大きさと、上記事例データベ
ース内の属性の大きさとを用いて加重平均値を計算し
て、計算された加重平均値を、上記検索パターンと上記
事例データベース内の属性との間の相互類似度として計
算する。従って、上記類似検索手段により、1つの単語
で複数の異なった概念を表現した類似度を用いて検索パ
ターンに類似した事例データを容易にかつ適切に検索す
ることができる。
【0123】また、上記類似検索システムにおいて、上
記第4の記憶装置は、好ましくは、キーワードを含む集
合空間である各属性に対して、キーワードである属性値
を含み又は含まれることを示すときの重み係数をさらに
格納し、上記類似検索手段は、上記計算された各含み類
似度と各含まれ類似度とに基づいて、上記重み係数を考
慮して、上記検索パターンと上記事例データベース内の
属性との間の全体の類似度を計算し、上記計算された全
体の類似度に基づいて、上記重み係数を考慮して、上記
事例データベース内の全体の属性での割合を示す類似度
割合を計算して出力する。従って、上記類似検索手段に
より、1つの単語で複数の異なった概念を表現した類似
度を用いて検索パターンに類似した事例データを容易に
かつ適切に検索することができる。
【0124】さらに、上記類似検索システムにおいて、
上記第2の記憶装置は、好ましくは、各属性値の程度間
の類似度を示す第2の類似度テーブルをさらに格納し、
上記類似検索手段は、さらに第2の類似度テーブルを参
照して、上記含み類似度と上記含まれ類似度とを計算す
る。従って、上記類似検索手段により、1つの単語で複
数の異なった概念を表現しかつ程度を表す概念を用いて
表した類似度を用いて検索パターンに類似した事例デー
タを容易にかつ適切に検索することができる。
【0125】またさらに、上記類似検索システムにおい
て、上記第1と第3の記憶装置は、好ましくは、キーワ
ードを含む集合空間である各属性に対して、キーワード
である属性値を含むか否かを示すときに、チェックマー
クを用いて含むことを示す形式で格納される。従って、
上記第1と第3の記憶装置において、チェックリストを
含む形式にしたので、所望の検索方法や検索方針を簡単
かつ柔軟に指示できる。すなわち、複数のキーワード空
間(属性と呼ぶ)に属するキーワード(属性値)のチェ
ックリスト(それぞれのキーワードとの相関の有無)及
び属性値の回数などの程度(それぞれのキーワードの程
度)を用いて、検索パターン及び検索対象を表現するこ
とにより、異なった属性において同じ文字表現の属性値
を異なったものとして扱うことや、キーワードの程度の
差とキーワードの差異を総合的に勘案した類似度の定義
などが可能となった。
【0126】本発明に係る類似検索方法によれば、キー
ワードを含む集合空間である各属性に対して、キーワー
ドである属性値を含むか否かを示す形式で事例を表すデ
ータを含む事例データベースを第1の記憶装置に格納す
るステップと、各属性値が各属性値に含まれる度合いの
類似度と、各属性値が各属性値を含む度合いの類似度と
を示す第1の類似度テーブルを第2の記憶装置に格納す
るステップと、検索すべきキーワードを含む集合空間で
ある各属性に対して、検索すべきキーワードである属性
値を含むか否かを示す形式で検索パターンを表すデータ
を含む検索パターンを第3の記憶装置に格納するステッ
プと、キーワードを含む集合空間である各属性に対し
て、キーワードである属性値を含む又は含まれるを示す
形式で類似度設定を表すデータを第4の記憶装置に格納
するステップと、上記第1の記憶装置に格納された事例
データベースに基づいて、上記第2、第3及び第4の記
憶装置に格納されたデータを参照して、上記事例データ
ベース内の各属性において上記各検索パターンを含む度
合いを示す含み類似度と、上記事例データベース内の各
属性において上記各検索パターンが含まれる度合いを示
す含まれ類似度とを計算し、計算された各含み類似度と
各含まれ類似度とに基づいて、上記事例データベース内
の全体の属性での割合を示す類似度割合を計算して出力
する類似検索ステップとを含む。従って、本発明によれ
ば、以下の特有の効果を有する。 (A)上記第1と第3の記憶装置を備えたので、検索対
象、検索パターンを簡単かつ柔軟に表現できる。 (B)上記第2と第4の記憶装置を備えたので、類似検
索すべき類似性を簡単かつ柔軟に表現できる。すなわ
ち、「含まれ類似度」、「含む類似度」及び「相互類似
度」を用いて類似度を表すようにしたので、これらのキ
ーワード相互の類似度を非対称に表現でき管理できる
(すなわち、Aから見たBへの類似度とBからみたAへ
の類似度は異なるとした)ことにより、程度の類似性
(「大は小を兼ねる」など)の表現がより自然に表現で
きるようになった。 (C)上記類似検索手段により、1つの単語で複数の異
なった概念を表現した類似度を用いて検索パターンに類
似した事例データを容易にかつ適切に検索することがで
きる。
【0127】また、上記類似検索方法において、上記類
似検索ステップは、好ましくは、上記第1の記憶装置に
格納された事例データベースに基づいて、上記第2、第
3及び第4の記憶装置に格納されたデータを参照して、
上記事例データベース内の各属性において、各検索パタ
ーンを含む属性値で最大の類似度を有する各属性値の類
似度の平均値を含み類似度として計算し、上記事例デー
タベース内の各属性において、各検索パターンが含まれ
る属性値で最大の類似度を有する各属性値の類似度の平
均値を含まれ類似度として計算する。従って、上記類似
検索ステップにより、1つの単語で複数の異なった概念
を表現した類似度を用いて検索パターンに類似した事例
データを容易にかつ適切に検索することができる。
【0128】さらに、上記類似検索方法において、上記
類似検索ステップは、好ましくは、上記第1の記憶装置
に格納された事例データベースに基づいて、上記第2、
第3及び第4の記憶装置に格納されたデータを参照し
て、計算された含み類似度と、計算された含まれ類似度
とを、上記検索パターンの大きさと、上記事例データベ
ース内の属性の大きさとを用いて加重平均値を計算し
て、計算された加重平均値を、上記検索パターンと上記
事例データベース内の属性との間の相互類似度として計
算する。従って、上記類似検索ステップにより、1つの
単語で複数の異なった概念を表現した類似度を用いて検
索パターンに類似した事例データを容易にかつ適切に検
索することができる。
【0129】また、上記類似検索方法において、上記デ
ータを第4の記憶装置に格納するステップは、好ましく
は、キーワードを含む集合空間である各属性に対して、
キーワードである属性値を含み又は含まれることを示す
ときの重み係数をさらに格納するステップを含み、上記
類似検索ステップは、上記計算された各含み類似度と各
含まれ類似度とに基づいて、上記重み係数を考慮して、
上記検索パターンと上記事例データベース内の属性との
間の全体の類似度を計算し、上記計算された全体の類似
度に基づいて、上記重み係数を考慮して、上記事例デー
タベース内の全体の属性での割合を示す類似度割合を計
算して出力する。従って、上記類似検索ステップによ
り、1つの単語で複数の異なった概念を表現した類似度
を用いて検索パターンに類似した事例データを容易にか
つ適切に検索することができる。
【0130】さらに、上記類似検索方法において、上記
第1の類似度テーブルを第2の記憶装置に格納するステ
ップは、好ましくは、各属性値の程度間の類似度を示す
第2の類似度テーブルをさらに格納するステップを含
み、上記類似検索ステップは、さらに第2の類似度テー
ブルを参照して、上記含み類似度と上記含まれ類似度と
を計算する。従って、上記類似検索ステップにより、1
つの単語で複数の異なった概念を表現しかつ程度を表す
概念を用いて表した類似度を用いて検索パターンに類似
した事例データを容易にかつ適切に検索することができ
る。
【0131】またさらに、上記類似検索方法において、
上記第1と第3の記憶装置は、好ましくは、キーワード
を含む集合空間である各属性に対して、キーワードであ
る属性値を含むか否かを示すときに、チェックマークを
用いて含むことを示す形式で格納される。従って、上記
第1と第3の記憶装置において、チェックリストを含む
形式にしたので、所望の検索方法や検索方針を簡単かつ
柔軟に指示できる。すなわち、複数のキーワード空間
(属性と呼ぶ)に属するキーワード(属性値)のチェッ
クリスト(それぞれのキーワードとの相関の有無)及び
属性値の回数などの程度(それぞれのキーワードの程
度)を用いて、検索パターン及び検索対象を表現するこ
とにより、異なった属性において同じ文字表現の属性値
を異なったものとして扱うことや、キーワードの程度の
差とキーワードの差異を総合的に勘案した類似度の定義
などが可能となった。
【図面の簡単な説明】
【図1】 本発明に係る一実施の形態である類似検索シ
ステムの構成を示すブロック図である。
【図2】 図1の類似度検索装置10によって実行され
る類似検索処理を示すフローチャートである。
【図3】 従来例の類似検索システムの構成を示すブロ
ック図である。
【符号の説明】
10 類似検索装置、11 事例データベースメモリ、
12 類似度テーブルメモリ、12a 属性値間類似度
テーブル、12b 属性値程度間類似度テーブル、13
類似度設定セットテーブルメモリ、14 検索パター
ンメモリ、15類似度計算結果出力装置。

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 キーワードを含む集合空間である各属性
    に対して、キーワードである属性値を含むか否かを示す
    形式で事例を表すデータを含む事例データベースを格納
    する第1の記憶装置と、 各属性値が各属性値に含まれる度合いである類似度と、
    各属性値が各属性値を含む度合いである類似度とを示す
    第1の類似度テーブルを格納する第2の記憶装置と、 検索すべきキーワードを含む集合空間である各属性に対
    して、検索すべきキーワードである属性値を含むか否か
    を示す形式で検索パターンを表すデータを含む検索パタ
    ーンを格納する第3の記憶装置と、 キーワードを含む集合空間である各属性に対して、キー
    ワードである属性値を含む又は含まれるを示す形式で類
    似度設定を表すデータを格納する第4の記憶装置と、 上記第1の記憶装置に格納された事例データベースに基
    づいて、上記第2、第3及び第4の記憶装置に格納され
    たデータを参照して、上記事例データベース内の各属性
    において上記各検索パターンを含む度合いを示す含み類
    似度と、上記事例データベース内の各属性において上記
    各検索パターンが含まれる度合いを示す含まれ類似度と
    を計算し、計算された各含み類似度と各含まれ類似度と
    に基づいて、上記事例データベース内の全体の属性での
    割合を示す類似度割合を計算して出力する類似検索手段
    とを備えたことを特徴とする類似検索システム。
  2. 【請求項2】 上記類似検索手段は、上記第1の記憶装
    置に格納された事例データベースに基づいて、上記第
    2、第3及び第4の記憶装置に格納されたデータを参照
    して、上記事例データベース内の各属性において、各検
    索パターンを含む属性値で最大の類似度を有する各属性
    値の類似度の平均値を含み類似度として計算し、上記事
    例データベース内の各属性において、各検索パターンが
    含まれる属性値で最大の類似度を有する各属性値の類似
    度の平均値を含まれ類似度として計算することを特徴と
    する請求項1記載の類似検索システム。
  3. 【請求項3】 上記類似検索手段は、上記第1の記憶装
    置に格納された事例データベースに基づいて、上記第
    2、第3及び第4の記憶装置に格納されたデータを参照
    して、計算された含み類似度と、計算された含まれ類似
    度とを、上記検索パターンの大きさと、上記事例データ
    ベース内の属性の大きさとを用いて加重平均値を計算し
    て、計算された加重平均値を、上記検索パターンと上記
    事例データベース内の属性との間の相互類似度として計
    算することを特徴とする請求項2記載の類似検索システ
    ム。
  4. 【請求項4】 上記第4の記憶装置は、キーワードを含
    む集合空間である各属性に対して、キーワードである属
    性値を含み又は含まれることを示すときの重み係数をさ
    らに格納し、 上記類似検索手段は、上記計算された各含み類似度と各
    含まれ類似度とに基づいて、上記重み係数を考慮して、
    上記検索パターンと上記事例データベース内の属性との
    間の全体の類似度を計算し、上記計算された全体の類似
    度に基づいて、上記重み係数を考慮して、上記事例デー
    タベース内の全体の属性での割合を示す類似度割合を計
    算して出力することを特徴とする請求項1乃至3のうち
    のいずれか1つに記載の類似検索システム。
  5. 【請求項5】 上記第2の記憶装置は、各属性値の程度
    間の類似度を示す第2の類似度テーブルをさらに格納
    し、 上記類似検索手段は、さらに第2の類似度テーブルを参
    照して、上記含み類似度と上記含まれ類似度とを計算す
    ることを特徴とする請求項1乃至4のうちのいずれか1
    つに記載の類似検索システム。
  6. 【請求項6】 上記第1と第3の記憶装置は、キーワー
    ドを含む集合空間である各属性に対して、キーワードで
    ある属性値を含むか否かを示すときに、チェックマーク
    を用いて含むことを示す形式で格納されたことを特徴と
    する請求項1乃至5のうちのいずれか1つに記載の類似
    検索システム。
  7. 【請求項7】 キーワードを含む集合空間である各属性
    に対して、キーワードである属性値を含むか否かを示す
    形式で事例を表すデータを含む事例データベースを第1
    の記憶装置に格納するステップと、 各属性値が各属性値に含まれる度合いの類似度と、各属
    性値が各属性値を含む度合いの類似度とを示す第1の類
    似度テーブルを第2の記憶装置に格納するステップと、 検索すべきキーワードを含む集合空間である各属性に対
    して、検索すべきキーワードである属性値を含むか否か
    を示す形式で検索パターンを表すデータを含む検索パタ
    ーンを第3の記憶装置に格納するステップと、 キーワードを含む集合空間である各属性に対して、キー
    ワードである属性値を含む又は含まれるを示す形式で類
    似度設定を表すデータを第4の記憶装置に格納するステ
    ップと、 上記第1の記憶装置に格納された事例データベースに基
    づいて、上記第2、第3及び第4の記憶装置に格納され
    たデータを参照して、上記事例データベース内の各属性
    において上記各検索パターンを含む度合いを示す含み類
    似度と、上記事例データベース内の各属性において上記
    各検索パターンが含まれる度合いを示す含まれ類似度と
    を計算し、計算された各含み類似度と各含まれ類似度と
    に基づいて、上記事例データベース内の全体の属性での
    割合を示す類似度割合を計算して出力する類似検索ステ
    ップとを含むことを特徴とする類似検索方法。
  8. 【請求項8】 上記類似検索ステップは、上記第1の記
    憶装置に格納された事例データベースに基づいて、上記
    第2、第3及び第4の記憶装置に格納されたデータを参
    照して、上記事例データベース内の各属性において、各
    検索パターンを含む属性値で最大の類似度を有する各属
    性値の類似度の平均値を含み類似度として計算し、上記
    事例データベース内の各属性において、各検索パターン
    が含まれる属性値で最大の類似度を有する各属性値の類
    似度の平均値を含まれ類似度として計算することを特徴
    とする請求項7記載の類似検索方法。
  9. 【請求項9】 上記類似検索ステップは、上記第1の記
    憶装置に格納された事例データベースに基づいて、上記
    第2、第3及び第4の記憶装置に格納されたデータを参
    照して、計算された含み類似度と、計算された含まれ類
    似度とを、上記検索パターンの大きさと、上記事例デー
    タベース内の属性の大きさとを用いて加重平均値を計算
    して、計算された加重平均値を、上記検索パターンと上
    記事例データベース内の属性との間の相互類似度として
    計算することを特徴とする請求項8記載の類似検索方
    法。
  10. 【請求項10】 上記データを第4の記憶装置に格納す
    るステップは、キーワードを含む集合空間である各属性
    に対して、キーワードである属性値を含み又は含まれる
    ことを示すときの重み係数をさらに格納するステップを
    含み、 上記類似検索ステップは、上記計算された各含み類似度
    と各含まれ類似度とに基づいて、上記重み係数を考慮し
    て、上記検索パターンと上記事例データベース内の属性
    との間の全体の類似度を計算し、上記計算された全体の
    類似度に基づいて、上記重み係数を考慮して、上記事例
    データベース内の全体の属性での割合を示す類似度割合
    を計算して出力することを特徴とする請求項7乃至9の
    うちのいずれか1つに記載の類似検索方法。
  11. 【請求項11】 上記第1の類似度テーブルを第2の記
    憶装置に格納するステップは、各属性値の程度間の類似
    度を示す第2の類似度テーブルをさらに格納するステッ
    プを含み、 上記類似検索ステップは、さらに第2の類似度テーブル
    を参照して、上記含み類似度と上記含まれ類似度とを計
    算することを特徴とする請求項7乃至10のうちのいず
    れか1つに記載の類似検索方法。
  12. 【請求項12】 上記第1と第3の記憶装置は、キーワ
    ードを含む集合空間である各属性に対して、キーワード
    である属性値を含むか否かを示すときに、チェックマー
    クを用いて含むことを示す形式で格納されたことを特徴
    とする請求項7乃至11のうちのいずれか1つに記載の
    類似検索システム。
JP2000158164A 2000-05-29 2000-05-29 類似検索システム及び類似検索方法 Pending JP2001337992A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000158164A JP2001337992A (ja) 2000-05-29 2000-05-29 類似検索システム及び類似検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000158164A JP2001337992A (ja) 2000-05-29 2000-05-29 類似検索システム及び類似検索方法

Publications (1)

Publication Number Publication Date
JP2001337992A true JP2001337992A (ja) 2001-12-07

Family

ID=18662681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000158164A Pending JP2001337992A (ja) 2000-05-29 2000-05-29 類似検索システム及び類似検索方法

Country Status (1)

Country Link
JP (1) JP2001337992A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005033972A1 (ja) 2003-09-30 2005-04-14 Intellectual Property Bank Corp. 類似率算出装置並びに類似率算出プログラム
JP2007004779A (ja) * 2005-05-26 2007-01-11 Tokyo Electric Power Co Inc:The リンク生成、リンク重要度及び類似文書に関する情報処理方法及び装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005033972A1 (ja) 2003-09-30 2005-04-14 Intellectual Property Bank Corp. 類似率算出装置並びに類似率算出プログラム
JP2007004779A (ja) * 2005-05-26 2007-01-11 Tokyo Electric Power Co Inc:The リンク生成、リンク重要度及び類似文書に関する情報処理方法及び装置

Similar Documents

Publication Publication Date Title
Bartlett et al. Gratitude and loneliness: Enhancing health and well-being in older adults
Monterrosa How race and gender stereotypes influence help-seeking for intimate partner violence
Field et al. Continuing bonds in coping with the death of a husband
Hiedemann et al. Strategic play among family members when making long-term care decisions
Lidskog In science we trust? On the relation between scientific knowledge, risk consciousness and public trust
Newburn Atlantic crossings: ‘Policy transfer’and crime control in the USA and Britain
Steiner et al. Information needs of family caregivers of people with dementia
Jakoby The self and significant others: Toward a sociology of loss
Jette Disablement outcomes in geriatric rehabilitation
Rice Home care nursing practice: concepts and application
Bermea et al. Mental and active preparation: Examining variations in women’s processes of preparing to leave abusive relationships
McGinley et al. Growing up with parental imprisonment: children’s experiences of managing stigma, secrecy and shame
Frank Ethics as process and practice
Ferguson et al. Survey evaluation of pharmacy practice involving deaf patients
Hunter et al. The influence of peer relationships on young people's sexual health in Sub-Saharan African street contexts
Nikparvar et al. The process of adjusting to divorce after leaving violent marriages: a case study of Iranian women
Freund et al. Social workers’ attempts to navigate among the elderly, their families, and foreign home care workers in the Haredi community
Strike et al. Pushing the boundaries of outreach work: the case of needle exchange outreach programs in Canada
Kandasamy et al. An Introduction to N-Adaptive Fuzzy Models to Analyze Public Opinion on AIDS
Davis Tapping into the culture of homelessness
Shihadeh Race, class, and crime: Reconsidering the spatial effects of social isolation on rates of urban offending
JP2001337992A (ja) 類似検索システム及び類似検索方法
Fialkow et al. New partner recruitment to rural versus urban Ob-gyn practices: a survey of practicing Ob-gyns
Müller Necessity, Norm and Missing Knowledge: What Modals Tell Us About Crisis Response in German Covid-19 Reporting
Oyebode History of psychiatry in West Africa