JP2002063185A - 類似知識抽出システム - Google Patents

類似知識抽出システム

Info

Publication number
JP2002063185A
JP2002063185A JP2000251170A JP2000251170A JP2002063185A JP 2002063185 A JP2002063185 A JP 2002063185A JP 2000251170 A JP2000251170 A JP 2000251170A JP 2000251170 A JP2000251170 A JP 2000251170A JP 2002063185 A JP2002063185 A JP 2002063185A
Authority
JP
Japan
Prior art keywords
knowledge
information
similarity
data
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000251170A
Other languages
English (en)
Inventor
Tomio Hoshino
富男 星野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP2000251170A priority Critical patent/JP2002063185A/ja
Publication of JP2002063185A publication Critical patent/JP2002063185A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 知識管理において、知識の類似性を知識管理
者に提供すること。 【解決手段】 知識の類似性を割合により算出し、その
結果を画面表示することにより知識管理者に類似知識を
示す。またその結果表示において、同一画面上に一覧情
報または詳細情報として、同時に2つの知識情報を表示
することにより、知識管理者による比較を容易にし、知
識の整理や統合を可能にする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、言語からなる知識
に対しての類似度を抽出する類似知識抽出システムに関
する。
【0002】
【従来の技術】情報処理分野におけるデータ検索や、人
工知能分野における事例ベース推論の検索においても類
似検索の重要性が高まっている。類似検索とは、検索条
件と検索対象との間の類似性に関する何らかの評価尺度
を用いて行なう柔軟な情報検索で、検索条件に厳密に照
合する検索対象が存在しない場合でも、予め設定された
評価尺度内において類似した情報を検索することをい
う。このような類似検索に際しては、一般的に、検索条
件および検索対象を属性−属性値で表現し、検索条件と
検索対象との間の各属性毎の類似度(以後、属性別類似
度と呼ぶ)に、属性間の相対的な重要性(属性間重要
度)を考慮した類似度の大小で検索を行なう方式が採用
されているが、従来の知識管理システムでは類似知識の
抽出はほとんど行われていない。それは、属性間重要度
や属性別類似度を正確に数値表現するのが困難なためで
あり、特に、知識の類似性についてはプログラム的な判
断が困難であるからである。しかしながら、検索条件指
定における曖昧さを判断して同じ様なものを抽出する技
術として、特開平5−101107号公報に記載のもの
が知られている。特開平5−101107号公報に記載
のものは、検索条件として「高い」や「低い」とかの曖
昧な検索条件の指定を可能としている。これは全体に対
する割合をプログラムが自動的に判断するものである。
【0003】
【発明が解決しようとする課題】前記従来の技術では、
類似度の判定を全体に対して算出される割合で判断する
必要があり、毎回結果が変わってしまうという問題があ
る。また、1つの属性にしか条件設定ができず、概念的
に開示される知識というまとまった情報に対する類似性
を求めることができなかった。本発明の目的は、知識と
いう曖昧で画一的でない情報に対する類似性を算出し、
目に見える形で画面に表示させ、それが同一知識として
統合した方が良いのかどうか知識管理者が判断するため
の情報を提供することにある。
【0004】
【課題を解決するための手段】上記の問題を解決するた
めに、本発明の類似知識抽出システムは、知識情報の属
性1つ1つに対する類似性を評価し、それぞれの類似性
の評価割合を知識管理者に設定させ、最終的に知識間の
類似性を算出することを特徴とするものである。
【0005】
【発明の実施の形態】以下、本発明の実施形態を図面を
用いて具体的に説明する。図1は、本発明の類似知識抽
出システムの実施形態を示すブロック図である。本実施
形態における類似知識抽出システムは、中央処理装置1
とディスプレイ装置2、キーボード装置3、動作情報を
保持する動作情報データ4、知識データを保持する知識
管理データ5、知識管理データ5から類似知識を抽出し
た抽出情報を保持する抽出データ6からなっている。中
央処理装置1には動作情報データ4を作成する動作情報
設定処理7と、動作情報データ4をもとに知識管理デー
タ5から類似知識情報を抽出し、抽出データ6を作成す
る知識抽出処理8、抽出データ6の情報をもとに知識管
理データ5から情報を取得して抽出データを表示する抽
出データ表示処理9を有している。
【0006】図2は、図1における動作情報データ4の
データ構造を表したものである。データ構造はその知識
に対しての全体の類似性割合を示す知識内容の類似性割
合、その知識が主に属する属性に対しての類似性割合を
示す知識内容主属性割合、そして、その知識の属性のサ
ブクラスとなる知識内容副属性を示す知識内容副属性の
類似性割合からなる。ここで知識内容主属性の類似性割
合は1つと固定されるが、サブクラスである知識内容副
属性は複数個存在することもある。詳細は図3において
説明する。図2中の設定値21の値は割合値であるた
め、「0」以上で「1」以下の値とする。また、項番1
0から1Nまでの設定値の合計と、項番20から2Mの
設定値の合計はともに「1」でなくてはならない。
【0007】図3は、図1における知識管理データ5の
データ構造を具体的に表したものである。知識管理デー
タ5は、知識内容のデータ31と知識情報のデータ32
を保持する。知識内容とは、複数の属性と複数の知識情
報を保持する知識のまとまりのことである。また、知識
情報とは、複数の属性を保持し、知識内容に関係づけら
れたものである。例えば、図3では項番ID01001の知識
内容「機能仕様書の作成」は、主属性:内容名称「機能
仕様書の作成」と副属性1:重要度「高い(80)」と
その他の属性と、知識情報「規則○○を見る。」、「最
初に目次から作成すると良い。」から構成される。この
知識内容にはそれぞれ、知識情報名称が附加されてい
る。ID02001の知識情報「規則○○を見る。」は、主属
性:知識情報名称「規則○○を見る。」と副属性1:重
要度「高い(80)」とその他の属性を保持し、知識内
容「機能仕様書の作成」に関係づけられている。
【0008】図4は、図1における抽出データ6のデー
タ構造を表したものである。知識データは、類似性を抽
出する時の比較元の知識内容IDと比較先の知識内容I
Dが算出した類似性とともに一覧として保持される。図
4中では比較元の知識内容を主知識内容、比較先の類似
知識内容を類似知識内容と表す。データ順は主知識内容
のまとまりとして、一番類似性の高いものの順番で作成
される。
【0009】図5は、図1の類似知識を抽出する知識抽
出処理8で処理される類似性を算出する処理を示すフロ
ーチャートである。図5のフローチャートは2つの知識
内容間の類似性の算出処理を示すものである。知識抽出
処理8では2つの知識内容間の類似性算出を使用して全
ての知識内容間で類似性を算出後に類似性の高いものの
順番にデータを作成する。最初に「知識内容類似性」に
「0」を設定(ステップ51)、その後、比較対象であ
る元の知識内容Aと比較先の知識内容Bの知識内容の属
性値の類似性を求める(ステップ52)。ステップ52
については図7の知識情報の属性によって類似性を求め
る処理で詳細を説明する。ステップ52で求めた類似性
に動作情報データ4の「知識内容類似性の割合」を積分
し、その結果を「知識内容類似性」に代入する(ステッ
プ53)。比較元の知識内容Aが保持する知識情報の持
つ知識情報数量分だけ、知識情報の類似性を求める処理
を繰り返す(ステップ54)。次に、知識内容Aの1つ
の知識情報と知識内容Bの知識情報全てとを比較し、類
似性を求める(ステップ55)。ステップ55について
は図6の知識情報の類似性を求める処理で詳細を説明す
る。求めた類似性に比較元の知識内容Aが保持する知識
情報数の数で割り、動作情報データ4の「知識内容類似
性の割合」を「1」から引いた分を積分し、その値を知
識内容類似性に加える(ステップ56)。
【0010】図6は、比較元の知識内容Aの1つの知識
情報についての類似性を算出する処理を示すフローチャ
ートである。先ず、「知識情報類似性」に「0」を設定
し(ステップ61)、知識内容Aと比較先の知識内容B
の保持する知識情報の持つ知識情報数量分の比較を行な
う(ステップ62)。次に、知識内容Aと知識内容Bと
いう2つの知識情報間の類似性を求める(ステップ6
3)。ステップ63については図7の知識情報の属性類
似性を求める処理で詳細に説明する。類似性が「知識情
報類似性」よりも大きい場合(ステップ64)、「知識
情報類似性」に代入する(ステップ65)。
【0011】図7は2つの知識情報間、または知識内容
の属性比較間における類似性を算出する処理を示すフロ
ーチャートである。ここのフローでの比較対象は知識内
容Aと知識内容Bとなる。「知識情報類似性」に「0」
を設定し(ステップ71)、比較対象となる知識情報を
全ての属性(主属性、副属性)によって比較し(ステッ
プ72)、属性間の類似性を求める(ステップ73)。
ステップ73については図8の属性の類似性を求める処
理で説明する。求めた類似性に動作情報データ4の「属
性の類似性割合」を積分し、その結果を「知識類似性」
に加える(ステップ74)。
【0012】図8は2つの属性間における類似性を算出
する処理を示すフローチャートである。「属性類似性」
に「0」を設定(ステップ81)、その属性の種別が数
値属性か(ステップ82)、文字列属性か(ステップ8
3)を判定する。数値属性の場合は数値属性の類似性を
求め(ステップ84)、文字列属性の場合は文字列属性
の類似性を求める(ステップ86)。数値属性でも文字
列属性でもない場合は、バイナリ属性と判定し、バイナ
リ属性の類似性を求める(ステップ87)。求めた類似
性を「属性類似性」に代入する(ステップ88)。数値
属性とバイナリ属性の類似性を求める処理の詳細は図9
の類似性を求める処理で説明する。また文字列属性の類
似性は図10の類似性を求める処理で詳細に説明する。
【0013】図9は数値属性間とバイナリ属性間の類似
性を算出する処理を示すフローチャートである。「類似
性」に「0」を設定(ステップ91)、2つの知識内容
の属性値が同じか比較し(ステップ92)、同じなら
「類似性」に「1」を代入(ステップ93)、異なって
いたら「0」を代入する(ステップ94)。
【0014】図10は、文字列属性の類似性を算出する
処理を示すフローチャートである。「類似性」に「0」
を設定し(ステップ101)、「同一文字列数」に
「0」を設定し(ステップ102)、「比較開始番号」
に「1」を設定する(ステップ103)。「比較開始番
号」が比較元文字列サイズより小さいかどうかを判定す
る(ステップ104)。「比較終了番号」に比較元の文
字列サイズを設定する(ステップ105)。「比較開始
番号」が「比較終了番号」を超えていないかを判定し
(ステップ106)、比較元の「比較開始番号」から
「比較終了番号」までの文字列が比較先文字列内に存在
しているかどうかを判定し(ステップ107)、存在し
ていないのならば「比較終了番号」をデクリメントする
(ステップ108)。ステップ107で比較先文字列内
にあるのならば、さらに「比較開始番号」から「比較終
了番号」までの文字数が「同一文字列数」よりも大きい
かどうかを判定する(ステップ109)。そして「比較
開始番号」から「比較終了番号」までの文字数を「同一
文字列数」に代入する(ステップ1010)。ここまで
の処理を「比較開始番号」が比較元の文字列サイズより
も小さい間「比較開始番号」をインクリメントしながら
再帰処理する(ステップ1011)。全ての処理が終了
すると、最後に「同一文字列数」を比較もとと比較先の
文字列でサイズの長い方で割った値を「類似性」に代入
する(ステップ1012)。
【0015】図11は、図1の抽出データ表示処理9で
表示する画面の画面構成図である。表示画面111は、
メニュー部112と、類似知識内容表示部113、2つ
の知識情報一覧表示部114,115を一画面上に表示
する。類似知識内容表示部113には、比較もとの知識
内容とそれに類似候補の類似知識内容がツリーで表示さ
れる。但し、初期表示時においては類似知識内容は表示
されず、比較もとの知識内容の左の「+」を押下するこ
とにより展開して表示される。知識情報一覧表示部11
4と115は、2つの知識内容の知識情報を同時に一覧
で参照、比較することが可能である。
【0016】図12は、図11の画面表示を切り替える
ことにより表示可能な画面の画面構成図である。表示画
面111は、メニュー部112と類似知識内容表示部1
13、知識情報一覧表示部114、2つの知識情報詳細
表示部121,122を一画面上に表示する。知識情報
詳細表示部121と122は、2つの知識情報の詳細情
報を同時に参照、比較することが可能である。
【0017】
【発明の効果】以上に説明したように、本発明において
は類似知識を類似性という数値で抽出することができ、
類似知識候補の知識内容の知識情報一覧や知識情報の詳
細を2つ同時に同一画面に表示し、知識管理者による査
定が可能となり、知識の整理や統合などの知識管理を容
易にすることが可能になるなどの効果がある。
【図面の簡単な説明】
【図1】本発明の類似知識抽出システムの実施形態を示
すブロック図である。
【図2】動作情報データのデータ構成図である。
【図3】知識管理データのデータ構成図である。
【図4】抽出データのデータ構成図である。
【図5】知識内容間の類似性算出のフローチャートであ
る。
【図6】1つの知識情報と比較先の知識情報との類似性
算出のフローチャートである。
【図7】知識情報間の類似性算出のフローチャートであ
る。
【図8】属性間の類似性算出のフローチャートである。
【図9】数値属性間やバイナリ属性間の類似性算出のフ
ローチャートである。
【図10】文字列属性間の類似性算出のフローチャート
である。
【図11】抽出類似知識表示画面の例(その1)を示す
図である。
【図12】抽出類似知識表示画面の例(その2)を示す
図である。
【符号の説明】
1…中央処理装置、2…ディスプレイ装置、3…キーボ
ード装置、4…動作情報データ、5…知識管理データ、
6…抽出データ、7…動作情報設定処理、8…知識抽出
処理、9…抽出データ表示処理。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 問題解決に関する知識を格納する知識デ
    ータを用いて、知識情報を取込んで類似知識とを抽出
    し、これらの情報を用いて質問情報との類似比較により
    類似情報を抽出する類似知識抽出システムにおいて、 動作情報データを作成する動作情報設定処理部と、動作
    情報データをもとに知識管理データから類似知識情報を
    抽出し、抽出データを作成する知識抽出処理部と、抽出
    データの情報をもとに知識管理データから情報を取得し
    て抽出データを表示する抽出データ表示処理部を有し、 前記知識抽出処理部から抽出された類似知識情報の割合
    を用いて複数の知識に対する類似度を抽出し、その結果
    を表示することを特徴とする類似知識抽出システム。
JP2000251170A 2000-08-22 2000-08-22 類似知識抽出システム Pending JP2002063185A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000251170A JP2002063185A (ja) 2000-08-22 2000-08-22 類似知識抽出システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000251170A JP2002063185A (ja) 2000-08-22 2000-08-22 類似知識抽出システム

Publications (1)

Publication Number Publication Date
JP2002063185A true JP2002063185A (ja) 2002-02-28

Family

ID=18740612

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000251170A Pending JP2002063185A (ja) 2000-08-22 2000-08-22 類似知識抽出システム

Country Status (1)

Country Link
JP (1) JP2002063185A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011008599A (ja) * 2009-06-26 2011-01-13 Fujitsu Ltd 集合知データベースシステムにおける項目情報処理装置
JP2015057723A (ja) * 2014-10-15 2015-03-26 洋彰 宮崎 自律学習型知識構築機
WO2018003100A1 (ja) * 2016-06-30 2018-01-04 富士通株式会社 検索プログラム、検索方法および情報処理装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08194617A (ja) * 1995-01-13 1996-07-30 Fuji Xerox Co Ltd 事例作成検索装置
JPH09245051A (ja) * 1996-03-05 1997-09-19 Mitsubishi Electric Corp 自然言語事例検索装置及び自然言語事例検索方法
JPH11161496A (ja) * 1997-11-27 1999-06-18 Sekisui Chem Co Ltd 事例ベース推論システム
JP2000123041A (ja) * 1998-10-19 2000-04-28 Nippon Telegr & Teleph Corp <Ntt> 類似度判定方法及び文書検索装置及び文書分類装置及び文書検索プログラムを格納した記憶媒体及び文書分類プログラムを格納した記憶媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08194617A (ja) * 1995-01-13 1996-07-30 Fuji Xerox Co Ltd 事例作成検索装置
JPH09245051A (ja) * 1996-03-05 1997-09-19 Mitsubishi Electric Corp 自然言語事例検索装置及び自然言語事例検索方法
JPH11161496A (ja) * 1997-11-27 1999-06-18 Sekisui Chem Co Ltd 事例ベース推論システム
JP2000123041A (ja) * 1998-10-19 2000-04-28 Nippon Telegr & Teleph Corp <Ntt> 類似度判定方法及び文書検索装置及び文書分類装置及び文書検索プログラムを格納した記憶媒体及び文書分類プログラムを格納した記憶媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011008599A (ja) * 2009-06-26 2011-01-13 Fujitsu Ltd 集合知データベースシステムにおける項目情報処理装置
JP2015057723A (ja) * 2014-10-15 2015-03-26 洋彰 宮崎 自律学習型知識構築機
WO2016059733A1 (ja) * 2014-10-15 2016-04-21 洋彰 宮崎 自律学習型知識構築機
WO2018003100A1 (ja) * 2016-06-30 2018-01-04 富士通株式会社 検索プログラム、検索方法および情報処理装置

Similar Documents

Publication Publication Date Title
CN109086394B (zh) 搜索排序方法、装置、计算机设备和存储介质
CN110292775B (zh) 获取差异数据的方法及装置
US20190251471A1 (en) Machine learning device
US7464096B2 (en) Method and apparatus for information mining and filtering
CN112699645B (zh) 语料标注方法、装置及设备
CN111428503A (zh) 同名人物的识别处理方法及处理装置
CN112699232A (zh) 文本标签提取方法、装置、设备和存储介质
CN110135769A (zh) 货品属性填充方法及装置、存储介质及电子终端
CN116955856A (zh) 信息展示方法、装置、电子设备以及存储介质
JP2002063185A (ja) 類似知識抽出システム
JP3131142B2 (ja) 地図データリンケージシステム
JPH10111869A (ja) 情報分類装置とその方法
CN104243201B (zh) 网络设备测试用例对应拓扑图的存储方法及系统
JP2018156552A (ja) 計算機システム及び文章データの検索方法
CN113076322A (zh) 一种商品搜索处理方法及装置
JP4128033B2 (ja) プロファイルデータ検索装置及びプログラム
JP3772401B2 (ja) 文書分類装置
JP2020181332A (ja) 高精度類似画像検索方法、プログラム及び高精度類似画像検索装置
JPH09218879A (ja) 文書間類似度データ計算装置
US20240320270A1 (en) Method and device for information presenting
CN118035321B (zh) 一种可视化数据库可视化方法及系统
US20240320259A1 (en) Methods and device for information presenting and information processing
CN114328974A (zh) 一种基于标签的司法案例推荐方法
CN114385688A (zh) 一种应用程序接口api推荐方法及装置
JP3897409B2 (ja) 情報処理装置およびその方法、プログラムを格納した記憶媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050408

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051107