JP2003228580A - 文献知識管理装置、文献知識管理方法、プログラム、および、記録媒体 - Google Patents

文献知識管理装置、文献知識管理方法、プログラム、および、記録媒体

Info

Publication number
JP2003228580A
JP2003228580A JP2002027446A JP2002027446A JP2003228580A JP 2003228580 A JP2003228580 A JP 2003228580A JP 2002027446 A JP2002027446 A JP 2002027446A JP 2002027446 A JP2002027446 A JP 2002027446A JP 2003228580 A JP2003228580 A JP 2003228580A
Authority
JP
Japan
Prior art keywords
knowledge
knowledge structure
structure element
concept
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002027446A
Other languages
English (en)
Inventor
Kiyoshi Nitta
清 新田
Hirofumi Doi
洋文 土居
Yasuhiro Kikuchi
康裕 菊地
Naoyuki Horai
尚幸 蓬莱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Celestar Lexico Sciences Inc
Original Assignee
Celestar Lexico Sciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Celestar Lexico Sciences Inc filed Critical Celestar Lexico Sciences Inc
Priority to JP2002027446A priority Critical patent/JP2003228580A/ja
Priority to US10/503,387 priority patent/US20050154690A1/en
Priority to EP03705045A priority patent/EP1473639A1/en
Priority to PCT/JP2003/001120 priority patent/WO2003067471A1/ja
Publication of JP2003228580A publication Critical patent/JP2003228580A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 文献知識に関する検索について検索精度を維
持したまま再現率を向上させるシステム等を提供するこ
とを課題とする。 【解決手段】 本発明は、原文につき構文解釈などを行
い一つまたは複数の単語から構成される知識を作成し管
理する。そして、原文から抽出した知識を構造化して知
識構造(例えば、ノードとエッジから構成されるグラフ
構造など)にする。各知識構造要素はその知識の意味に
最も近い階層化概念辞書の概念項目へのリンクを少なく
とも一つ設定することができる。そして、入力された検
索質問に含まれる単語について、管理された知識構造か
らマッチングする関係知識構造要素および/または関係
対象知識構造要素を検索する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文献知識管理装
置、文献知識管理方法、プログラム、および、記録媒体
に関し、特に、文献中の知識を原文と概念辞書に関連付
けて管理し入力された検索質問に対する知識の検索を効
率的にかつ精度良く実行する文献知識管理装置、文献知
識管理方法、プログラム、および、記録媒体に関する。
【0002】
【従来の技術】従来の情報処理技術においては、構文解
析や意味解析などの各種の解析手法を用いる自然言語処
理技術が開発されている。また、WordNetやED
Rなどのオントロジー辞書技術、ベクター・スペース・
モデル(vector space model)など
の全文検索技術、検索に用いられる質問(以下「検索質
問」という。)を同義語等に展開して検索する質問展開
や自然言語クエリーや概念直接指定などによる概念検索
技術などが開発されている。研究者などは、これらの情
報処理技術を利用して文献データベース等にアクセスし
既知の知見を検索している。
【0003】
【発明が解決しようとする課題】しかしながら、研究者
がこれらの情報処理技術を利用して複数のデータベース
にアクセスして登録された情報を検索する必要がある
が、従来の情報処理技術においては検索精度(検索結果
の何割が正解であるかを示す指標)を維持したまま再現
率(正解集合の何割が検索結果に含まれているかを示す
指標)を向上させるための総合的なシステムは存在しな
いという問題点を有していた。以下、この問題点の内容
について、一層具体的に説明する。
【0004】例えば、文献単位にインデックスを張った
ベクター・スペース・モデルに基づく従来型の検索シス
テムでは、例えば、検索質問が“A activate
sB”であった場合、“A”と“activates”
と“B”が同一の文に属さず、かつその出現順番が違う
文献までヒットして抽出する。もしくは、上記を連語と
したそのままのパターンのみがヒットする。ここで、検
索質問である“Aactivates B”は「物質A
が物質Bを活性化させる事象」を探すことを意図してい
るものであるが、従来技術では意図したものより過剰
(すなわち、検索精度が低い)または過小(すなわち、
再現率が低い)に検索することになる。また、ベクター
・スペース・モデルに基づく従来型の検索システムで
は、同じ単語でも概念的に意味が違う場合や異なった文
献中で発見される場合などを原理的に区別することがで
きないため、検索時の正解の再現率が低くなり検索結果
中にごみデータが大量に混入する恐れが強いという問題
点を有する。
【0005】また、例えば、同義語辞書や予備検索結果
を用いた従来型の検索質問展開技術では、検索質問が
“A supress B”であった場合、AやBに固
有の展開語によって、どんな場合でも機械的に展開を行
うため、場合によっては不必要な語まで展開してしまう
ことになり検索時の精度が低くなるという問題点を有す
る。
【0006】このように、従来のシステム等は数々の問
題点を有しており、その結果、文献知識検索の利用者お
よび管理者のいずれにとっても、利便性が悪く、また、
利用効率が悪いものであった。
【0007】本発明は上記問題点に鑑みてなされたもの
で、文献知識に関する検索について検索精度を維持した
まま再現率を向上させることのできる、文献知識管理装
置、文献知識管理方法、プログラム、および、記録媒体
を提供することを目的としている。
【0008】
【課題を解決するための手段】このような目的を達成す
るため、請求項1に記載の文献知識管理装置は、文献の
原文を一つまたは複数の単語から構成される知識に分割
して管理する原文管理手段と、上記原文の各知識に基づ
いて、関係知識構造要素および関係対象知識構造要素か
ら構成される知識構造を生成して管理する知識構造管理
手段と、関係付けられた上記知識の概念を階層的に定義
する概念項目から構成される概念辞書を管理する概念辞
書管理手段と、入力された検索質問に含まれる単語につ
いて、上記知識構造管理手段により管理された上記知識
構造からマッチングする上記関係知識構造要素および/
または上記関係対象知識構造要素を検索する単語マッチ
ング手段とを備えたことを特徴とする。
【0009】この装置によれば、文献の原文を一つまた
は複数の単語から構成される知識に分割して管理し、原
文の各知識に基づいて、関係知識構造要素および関係対
象知識構造要素から構成される知識構造を生成して管理
し、関係付けられた知識の概念を階層的に定義する概念
項目から構成される概念辞書を管理するので、知識構造
で各知識構造要素が概念項目にリンクなどにより関連付
けを持つことで、機械的な知識構造要素の同等性判定が
可能になる。これにより原文で異なる語によって表現さ
れた知識構造要素であっても、概念的に同一であれば計
算機で同一であるとして処理することができる。また、
知識構造で各知識構造要素が原文にリンクなどにより関
連付けを持つことで、知識と原文との対応付けが容易に
できるようになる。また、階層化概念辞書の全概念項目
へのリンクがいずれかの知識構造要素から張られること
により、各概念項目は知識構造要素を介して原文事例を
持つことができるようになる。
【0010】また、この装置によれば、入力された検索
質問に含まれる単語について、管理された知識構造から
マッチングする関係知識構造要素および/または関係対
象知識構造要素を検索するので、検索質問に完全一致ま
たは部分一致する知識を抽出することができる。これに
より、原文をサーチする場合に比べて格段に速くかつ漏
れなく検索を実行することができるようになる。
【0011】また、請求項2に記載の文献知識管理装置
は、請求項1に記載の文献知識管理装置において、上記
単語マッチング手段は、検索結果の上記関係知識構造要
素および/または上記関係対象知識構造要素に対して、
(1)予め定めた同義関係を意味する上記関係知識構造
要素で連結された関係対象知識構造要素、(2)同一の
連結グラフに属する上記関係知識構造要素および/また
は上記関係対象知識構造要素、(3)同一の連結グラフ
に属し、かつ、要素間のパス数が予め定めた数よりも少
ない上記関係知識構造要素および/または上記関係対象
知識構造要素、(4)同一の連結グラフに属し、かつ、
要素の型が同一である上記関係知識構造要素および/ま
たは上記関係対象知識構造要素、のうち少なくとも一つ
を検索することを特徴とする。
【0012】これは、単語マッチング手段の一例を一層
具体的に示すものである。この装置によれば、検索結果
の関係知識構造要素および/または関係対象知識構造要
素に対して、(1)予め定めた同義関係を意味する関係
知識構造要素で連結された関係対象知識構造要素、
(2)同一の連結グラフに属する関係知識構造要素およ
び/または関係対象知識構造要素、(3)同一の連結グ
ラフに属し、かつ、要素間のパス数が予め定めた数より
も少ない関係知識構造要素および/または関係対象知識
構造要素、(4)同一の連結グラフに属し、かつ、要素
の型が同一である関係知識構造要素および/または関係
対象知識構造要素、のうち少なくとも一つを検索するの
で、効率的に同義語検索を実行することができるように
なり、検索の精度を下げることなく再現率を飛躍的に向
上させることができるようになる。
【0013】また、請求項3に記載の文献知識管理装置
は、請求項1または2に記載の文献知識管理装置におい
て、上記単語マッチング手段は、検索結果の上記関係知
識構造要素および/または上記関係対象知識構造要素に
対して、上記概念辞書管理手段にて管理された上記概念
辞書から対応する上記概念項目、および/または、当該
概念項目の上位および/または下位の上記概念項目を抽
出し、これらの上記概念項目に関連付けられている上記
関係知識構造要素および/または上記関係対象知識構造
要素を抽出することを特徴とする。
【0014】これは、単語マッチング手段の一例を一層
具体的に示すものである。この装置によれば、検索結果
の関係知識構造要素および/または関係対象知識構造要
素に対して、概念辞書管理手段にて管理された概念辞書
から対応する概念項目、および/または、当該概念項目
の上位および/または下位の概念項目を抽出し、これら
の概念項目に関連付けられている関係知識構造要素およ
び/または関係対象知識構造要素を抽出するので、概念
項目により検索結果の絞込みを行うことができるように
なり、検索の精度を飛躍的に向上させることができるよ
うになる。
【0015】また、請求項4に記載の文献知識管理装置
は、請求項1から3のいずれか一つに記載の文献知識管
理装置において、上記単語マッチング手段は、検索結果
の上記関係知識構造要素および/または上記関係対象知
識構造要素に対して、連結グラフとなる上記関係知識構
造要素および/または上記関係対象知識構造要素であっ
て、(1)トポロジーが同一である上記関係知識構造要
素および/または上記関係対象知識構造要素、(2)上
記概念辞書管理手段にて管理された上記概念辞書の中か
ら対応する上記概念項目、および/または、当該概念項
目の上位および/または下位の上記概念項目を抽出し、
これらの上記概念項目に関連付けられている上記関係知
識構造要素および/または上記関係対象知識構造要素、
(3)要素間のパス数が予め定めた数よりも少ない上記
関係知識構造要素および/または上記関係対象知識構造
要素、のうち少なくとも一つを検索することを特徴とす
る。
【0016】これは、単語マッチング手段の一例を一層
具体的に示すものである。この装置によれば、検索結果
の関係知識構造要素および/または関係対象知識構造要
素に対して、同一の連結グラフとなる関係知識構造要素
および/または関係対象知識構造要素であって、(1)
トポロジーが同一である関係知識構造要素および/また
は関係対象知識構造要素、(2)概念辞書管理手段にて
管理された概念辞書の中から対応する概念項目、および
/または、当該概念項目の上位および/または下位の概
念項目を抽出し、これらの概念項目に関連付けられてい
る関係知識構造要素および/または関係対象知識構造要
素、(3)要素間のパス数が予め定めた数よりも少ない
関係知識構造要素および/または関係対象知識構造要
素、のうち少なくとも一つを検索するので、同一の連結
グラフにある知識構造要素のうち概念項目などにより検
索結果の絞込みを行うことができるようになり、検索の
精度を飛躍的に向上させることができるようになる。
【0017】また、請求項5に記載の文献知識管理装置
は、請求項1から4のいずれか一つに記載の文献知識管
理装置において、上記検索質問を予め定めた論理式の形
式に正規化する論理式正規化手段をさらに備えたことを
特徴とする。
【0018】この装置によれば、検索質問を予め定めた
論理式の形式に正規化するので、入力された検索質問の
論理式のフォーマットを一定化することができ、その後
の処理の効率化を図ることができるようになる。
【0019】また、請求項6に記載の文献知識管理装置
は、請求項1から5のいずれか一つに記載の文献知識管
理装置において、上記検索質問の論理式の部分式につい
て知識構造要素集合を取得し、部分式同士の論理積を求
めるために当該知識構造要素集合の全要素の組み合わせ
について、(1)同一の文献にある、(2)予め定めた
文集合に属する文にある、(3)予め定めた構造検索式
に合致する文にある、(4)知識構造全体でみて連続で
ある知識構造である、(5)一つの文献内で連続である
知識構造である、(6)上記概念辞書管理手段にて管理
された上記概念辞書から対応する上記概念項目、および
/または、当該概念項目の上位および/または下位の上
記概念項目を抽出し、これらの上記概念項目に関連付け
られている、のうち少なくとも一つであるものを検索す
る論理式マッチング手段をさらに備えたことを特徴とす
る。
【0020】この装置によれば、検索質問の論理式の部
分式について知識構造要素集合を取得し、部分式同士の
論理積を求めるために当該知識構造要素集合の全要素の
組み合わせについて、(1)同一の文献にある、(2)
予め定めた文集合に属する文にある、(3)予め定めた
構造検索式に合致する文にある、(4)知識構造全体で
みて連続である知識構造である、(5)一つの文献内で
連続である知識構造である、(6)管理された概念辞書
から対応する概念項目、および/または、当該概念項目
の上位および/または下位の概念項目を抽出し、これら
の概念項目に関連付けられている、のうち少なくとも一
つであるものを検索するので、部分式のAND条件を求
めるときに、文献、グラフ構造、概念項目などにより検
索結果の絞込みを行うことができるようになり、検索の
精度を飛躍的に向上させることができるようになる。
【0021】また、請求項7に記載の文献知識管理装置
は、請求項1から6のいずれか一つに記載の文献知識管
理装置において、自然言語で入力された上記検索質問か
ら構文構造を生成する構文構造生成手段をさらに備えた
ことを特徴とする。
【0022】この装置によれば、自然言語で入力された
検索質問から構文構造を生成するので、自然言語検索に
も対応することができるようになる。
【0023】また、請求項8に記載の文献知識管理装置
は、請求項7に記載の文献知識管理装置において、上記
構文構造生成手段にて作成された上記構文構造から知識
構造を生成する文献知識化手段をさらに備えたことを特
徴とする。
【0024】この装置によれば、作成された構文構造か
ら知識構造を生成するので、知識構造同士の類似性を検
索することなどが可能になり、また、単語をサーチする
場合に比べて格段に速くかつ漏れなく検索を実行するこ
とができるようになる。
【0025】また、請求項9に記載の文献知識管理装置
は、請求項8に記載の文献知識管理装置において、上記
文献知識化手段にて生成した上記知識構造における各連
結グラフについて類似性を判定し、類似連結グラフの集
合を取得する連結グラフ類似性判定手段と、上記連結グ
ラフ類似性判定手段にて取得した各類似連結グラフの和
集合をとる、または、各類似連結グラフの組み合わせに
ついて論理積をとることにより類似連結グラフを統合す
るグラフ統合手段とをさらに備えたことを特徴とする。
【0026】この装置によれば、生成した知識構造にお
ける各連結グラフについて類似性を判定し、類似連結グ
ラフの集合を取得し、取得した各類似連結グラフの和集
合をとる、または、各類似連結グラフの組み合わせにつ
いて論理積をとることにより類似連結グラフを統合する
ので、知識検索結果をまとめる処理を漏れなくかつ高速
に行うことができるようになる。
【0027】また、請求項10に記載の文献知識管理装
置は、請求項1から9のいずれか一つに記載の文献知識
管理装置において、検索結果に対応する、上記関係知識
構造要素、上記関係対象知識構造要素、上記文献、上記
概念項目のうち少なくとも一つを予め定めたフォーマッ
トに変換して検索結果を作成する結果変換手段をさらに
備えたことを特徴とする。
【0028】この装置によれば、検索結果に対応する、
関係知識構造要素、関係対象知識構造要素、文献、概念
項目のうち少なくとも一つを予め定めたフォーマットに
変換して検索結果を作成するので、検索結果について任
意の適切なフォーマットで出力することができるように
なる。
【0029】また、本発明は文献知識管理方法に関する
ものであり、請求項11に記載の文献知識管理方法は、
文献の原文を一つまたは複数の単語から構成される知識
に分割して管理する原文管理ステップと、上記原文の各
知識に基づいて、関係知識構造要素および関係対象知識
構造要素から構成される知識構造を生成して管理する知
識構造管理ステップと、関係付けられた上記知識の概念
を階層的に定義する概念項目から構成される概念辞書を
管理する概念辞書管理ステップと、入力された検索質問
に含まれる単語について、上記知識構造管理ステップに
より管理された上記知識構造からマッチングする上記関
係知識構造要素および/または上記関係対象知識構造要
素を検索する単語マッチングステップとを含むことを特
徴とする。
【0030】この方法によれば、文献の原文を一つまた
は複数の単語から構成される知識に分割して管理し、原
文の各知識に基づいて、関係知識構造要素および関係対
象知識構造要素から構成される知識構造を生成して管理
し、関係付けられた知識の概念を階層的に定義する概念
項目から構成される概念辞書を管理するので、知識構造
で各知識構造要素が概念項目にリンクなどにより関連付
けを持つことで、機械的な知識構造要素の同等性判定が
可能になる。これにより原文で異なる語によって表現さ
れた知識構造要素であっても、概念的に同一であれば計
算機で同一であるとして処理することができる。また、
知識構造で各知識構造要素が原文にリンクなどにより関
連付けを持つことで、知識と原文との対応付けが容易に
できるようになる。また、階層化概念辞書の全概念項目
へのリンクがいずれかの知識構造要素から張られること
により、各概念項目は知識構造要素を介して原文事例を
持つことができるようになる。
【0031】また、この方法によれば、入力された検索
質問に含まれる単語について、管理された知識構造から
マッチングする関係知識構造要素および/または関係対
象知識構造要素を検索するので、検索質問に完全一致ま
たは部分一致する知識を抽出することができる。これに
より、原文をサーチする場合に比べて格段に速くかつ漏
れなく検索を実行することができるようになる。
【0032】また、請求項12に記載の文献知識管理方
法は、請求項11に記載の文献知識管理方法において、
上記単語マッチングステップは、検索結果の上記関係知
識構造要素および/または上記関係対象知識構造要素に
対して、(1)予め定めた同義関係を意味する上記関係
知識構造要素で連結された関係対象知識構造要素、
(2)同一の連結グラフに属する上記関係知識構造要素
および/または上記関係対象知識構造要素、(3)同一
の連結グラフに属し、かつ、要素間のパス数が予め定め
た数よりも少ない上記関係知識構造要素および/または
上記関係対象知識構造要素、(4)同一の連結グラフに
属し、かつ、要素の型が同一である上記関係知識構造要
素および/または上記関係対象知識構造要素、のうち少
なくとも一つを検索することを特徴とする。
【0033】これは、単語マッチングステップの一例を
一層具体的に示すものである。この方法によれば、検索
結果の関係知識構造要素および/または関係対象知識構
造要素に対して、(1)予め定めた同義関係を意味する
関係知識構造要素で連結された関係対象知識構造要素、
(2)同一の連結グラフに属する関係知識構造要素およ
び/または関係対象知識構造要素、(3)同一の連結グ
ラフに属し、かつ、要素間のパス数が予め定めた数より
も少ない関係知識構造要素および/または関係対象知識
構造要素、(4)同一の連結グラフに属し、かつ、要素
の型が同一である関係知識構造要素および/または関係
対象知識構造要素、のうち少なくとも一つを検索するの
で、効率的に同義語検索を実行することができるように
なり、検索の精度を下げることなく再現率を飛躍的に向
上させることができるようになる。
【0034】また、請求項13に記載の文献知識管理方
法は、請求項11または12に記載の文献知識管理方法
において、上記単語マッチングステップは、検索結果の
上記関係知識構造要素および/または上記関係対象知識
構造要素に対して、上記概念辞書管理ステップにて管理
された上記概念辞書から対応する上記概念項目、および
/または、当該概念項目の上位および/または下位の上
記概念項目を抽出し、これらの上記概念項目に関連付け
られている上記関係知識構造要素および/または上記関
係対象知識構造要素を抽出することを特徴とする。
【0035】これは、単語マッチングステップの一例を
一層具体的に示すものである。この方法によれば、検索
結果の関係知識構造要素および/または関係対象知識構
造要素に対して、概念辞書管理ステップにて管理された
概念辞書から対応する概念項目、および/または、当該
概念項目の上位および/または下位の概念項目を抽出
し、これらの概念項目に関連付けられている関係知識構
造要素および/または関係対象知識構造要素を抽出する
ので、概念項目により検索結果の絞込みを行うことがで
きるようになり、検索の精度を飛躍的に向上させること
ができるようになる。
【0036】また、請求項14に記載の文献知識管理方
法は、請求項11から13のいずれか一つに記載の文献
知識管理方法において、上記単語マッチングステップ
は、検索結果の上記関係知識構造要素および/または上
記関係対象知識構造要素に対して、連結グラフとなる上
記関係知識構造要素および/または上記関係対象知識構
造要素であって、(1)トポロジーが同一である上記関
係知識構造要素および/または上記関係対象知識構造要
素、(2)上記概念辞書管理ステップにて管理された上
記概念辞書の中から対応する上記概念項目、および/ま
たは、当該概念項目の上位および/または下位の上記概
念項目を抽出し、これらの上記概念項目に関連付けられ
ている上記関係知識構造要素および/または上記関係対
象知識構造要素、(3)要素間のパス数が予め定めた数
よりも少ない上記関係知識構造要素および/または上記
関係対象知識構造要素、のうち少なくとも一つを検索す
ることを特徴とする。
【0037】これは、単語マッチングステップの一例を
一層具体的に示すものである。この方法によれば、検索
結果の関係知識構造要素および/または関係対象知識構
造要素に対して、同一の連結グラフとなる関係知識構造
要素および/または関係対象知識構造要素であって、
(1)トポロジーが同一である関係知識構造要素および
/または関係対象知識構造要素、(2)概念辞書管理ス
テップにて管理された概念辞書の中から対応する概念項
目、および/または、当該概念項目の上位および/また
は下位の概念項目を抽出し、これらの概念項目に関連付
けられている関係知識構造要素および/または関係対象
知識構造要素、(3)要素間のパス数が予め定めた数よ
りも少ない関係知識構造要素および/または関係対象知
識構造要素、のうち少なくとも一つを検索するので、同
一の連結グラフにある知識構造要素のうち概念項目など
により検索結果の絞込みを行うことができるようにな
り、検索の精度を飛躍的に向上させることができるよう
になる。
【0038】また、請求項15に記載の文献知識管理方
法は、請求項11から14のいずれか一つに記載の文献
知識管理方法において、上記検索質問を予め定めた論理
式の形式に正規化する論理式正規化ステップをさらに含
むことを特徴とする。
【0039】この方法によれば、検索質問を予め定めた
論理式の形式に正規化するので、入力された検索質問の
論理式のフォーマットを一定化することができ、その後
の処理の効率化を図ることができるようになる。
【0040】また、請求項16に記載の文献知識管理方
法は、請求項11から15のいずれか一つに記載の文献
知識管理方法において、上記検索質問の論理式の部分式
について知識構造要素集合を取得し、部分式同士の論理
積を求めるために当該知識構造要素集合の全要素の組み
合わせについて、(1)同一の文献にある、(2)予め
定めた文集合に属する文にある、(3)予め定めた構造
検索式に合致する文にある、(4)知識構造全体でみて
連続である知識構造である、(5)一つの文献内で連続
である知識構造である、(6)上記概念辞書管理ステッ
プにて管理された上記概念辞書から対応する上記概念項
目、および/または、当該概念項目の上位および/また
は下位の上記概念項目を抽出し、これらの上記概念項目
に関連付けられている、のうち少なくとも一つであるも
のを検索する論理式マッチングステップをさらに含むこ
とを特徴とする。
【0041】この方法によれば、検索質問の論理式の部
分式について知識構造要素集合を取得し、部分式同士の
論理積を求めるために当該知識構造要素集合の全要素の
組み合わせについて、(1)同一の文献にある、(2)
予め定めた文集合に属する文にある、(3)予め定めた
構造検索式に合致する文にある、(4)知識構造全体で
みて連続である知識構造である、(5)一つの文献内で
連続である知識構造である、(6)管理された概念辞書
から対応する概念項目、および/または、当該概念項目
の上位および/または下位の概念項目を抽出し、これら
の概念項目に関連付けられている、のうち少なくとも一
つであるものを検索するので、部分式のAND条件を求
めるときに、文献、グラフ構造、概念項目などにより検
索結果の絞込みを行うことができるようになり、検索の
精度を飛躍的に向上させることができるようになる。
【0042】また、請求項17に記載の文献知識管理方
法は、請求項11から16のいずれか一つに記載の文献
知識管理方法において、自然言語で入力された上記検索
質問から構文構造を生成する構文構造生成ステップをさ
らに含むことを特徴とする。
【0043】この方法によれば、自然言語で入力された
検索質問から構文構造を生成するので、自然言語検索に
も対応することができるようになる。
【0044】また、請求項18に記載の文献知識管理方
法は、請求項17に記載の文献知識管理方法において、
上記構文構造生成ステップにて作成された上記構文構造
から知識構造を生成する文献知識化ステップをさらに含
むことを特徴とする。
【0045】この方法によれば、作成された構文構造か
ら知識構造を生成するので、知識構造同士の類似性を検
索することなどが可能になり、また、単語をサーチする
場合に比べて格段に速くかつ漏れなく検索を実行するこ
とができるようになる。
【0046】また、請求項19に記載の文献知識管理方
法は、請求項18に記載の文献知識管理方法において、
上記文献知識化ステップにて生成した上記知識構造にお
ける各連結グラフについて類似性を判定し、類似連結グ
ラフの集合を取得する連結グラフ類似性判定ステップ
と、上記連結グラフ類似性判定ステップにて取得した各
類似連結グラフの和集合をとる、または、各類似連結グ
ラフの組み合わせについて論理積をとることにより類似
連結グラフを統合するグラフ統合ステップとをさらに含
むことを特徴とする。
【0047】この方法によれば、生成した知識構造にお
ける各連結グラフについて類似性を判定し、類似連結グ
ラフの集合を取得し、取得した各類似連結グラフの和集
合をとる、または、各類似連結グラフの組み合わせにつ
いて論理積をとることにより類似連結グラフを統合する
ので、知識検索結果をまとめる処理を漏れなくかつ高速
に行うことができるようになる。
【0048】また、請求項20に記載の文献知識管理方
法は、請求項11から19のいずれか一つに記載の文献
知識管理方法において、検索結果に対応する、上記関係
知識構造要素、上記関係対象知識構造要素、上記文献、
上記概念項目のうち少なくとも一つを予め定めたフォー
マットに変換して検索結果を作成する結果変換ステップ
をさらに含むことを特徴とする。
【0049】この方法によれば、検索結果に対応する、
関係知識構造要素、関係対象知識構造要素、文献、概念
項目のうち少なくとも一つを予め定めたフォーマットに
変換して検索結果を作成するので、検索結果について任
意の適切なフォーマットで出力することができるように
なる。
【0050】また、本発明はプログラムに関するもので
あり、請求項21に記載のプログラムは、文献の原文を
一つまたは複数の単語から構成される知識に分割して管
理する原文管理ステップと、上記原文の各知識に基づい
て、関係知識構造要素および関係対象知識構造要素から
構成される知識構造を生成して管理する知識構造管理ス
テップと、関係付けられた上記知識の概念を階層的に定
義する概念項目から構成される概念辞書を管理する概念
辞書管理ステップと、入力された検索質問に含まれる単
語について、上記知識構造管理ステップにより管理され
た上記知識構造からマッチングする上記関係知識構造要
素および/または上記関係対象知識構造要素を検索する
単語マッチングステップとを含むことを特徴とする。
【0051】このプログラムによれば、文献の原文を一
つまたは複数の単語から構成される知識に分割して管理
し、原文の各知識に基づいて、関係知識構造要素および
関係対象知識構造要素から構成される知識構造を生成し
て管理し、関係付けられた知識の概念を階層的に定義す
る概念項目から構成される概念辞書を管理するので、知
識構造で各知識構造要素が概念項目にリンクなどにより
関連付けを持つことで、機械的な知識構造要素の同等性
判定が可能になる。これにより原文で異なる語によって
表現された知識構造要素であっても、概念的に同一であ
れば計算機で同一であるとして処理することができる。
また、知識構造で各知識構造要素が原文にリンクなどに
より関連付けを持つことで、知識と原文との対応付けが
容易にできるようになる。また、階層化概念辞書の全概
念項目へのリンクがいずれかの知識構造要素から張られ
ることにより、各概念項目は知識構造要素を介して原文
事例を持つことができるようになる。
【0052】また、このプログラムによれば、入力され
た検索質問に含まれる単語について、管理された知識構
造からマッチングする関係知識構造要素および/または
関係対象知識構造要素を検索するので、検索質問に完全
一致または部分一致する知識を抽出することができる。
これにより、原文をサーチする場合に比べて格段に速く
かつ漏れなく検索を実行することができるようになる。
【0053】また、請求項22に記載のプログラムは、
請求項21に記載のプログラムにおいて、上記単語マッ
チングステップは、検索結果の上記関係知識構造要素お
よび/または上記関係対象知識構造要素に対して、
(1)予め定めた同義関係を意味する上記関係知識構造
要素で連結された関係対象知識構造要素、(2)同一の
連結グラフに属する上記関係知識構造要素および/また
は上記関係対象知識構造要素、(3)同一の連結グラフ
に属し、かつ、要素間のパス数が予め定めた数よりも少
ない上記関係知識構造要素および/または上記関係対象
知識構造要素、(4)同一の連結グラフに属し、かつ、
要素の型が同一である上記関係知識構造要素および/ま
たは上記関係対象知識構造要素、のうち少なくとも一つ
を検索することを特徴とする。
【0054】これは、単語マッチングステップの一例を
一層具体的に示すものである。このプログラムによれ
ば、検索結果の関係知識構造要素および/または関係対
象知識構造要素に対して、(1)予め定めた同義関係を
意味する関係知識構造要素で連結された関係対象知識構
造要素、(2)同一の連結グラフに属する関係知識構造
要素および/または関係対象知識構造要素、(3)同一
の連結グラフに属し、かつ、要素間のパス数が予め定め
た数よりも少ない関係知識構造要素および/または関係
対象知識構造要素、(4)同一の連結グラフに属し、か
つ、要素の型が同一である関係知識構造要素および/ま
たは関係対象知識構造要素、のうち少なくとも一つを検
索するので、効率的に同義語検索を実行することができ
るようになり、検索の精度を下げることなく再現率を飛
躍的に向上させることができるようになる。
【0055】また、請求項23に記載のプログラムは、
請求項21または22に記載のプログラムにおいて、上
記単語マッチングステップは、検索結果の上記関係知識
構造要素および/または上記関係対象知識構造要素に対
して、上記概念辞書管理ステップにて管理された上記概
念辞書から対応する上記概念項目、および/または、当
該概念項目の上位および/または下位の上記概念項目を
抽出し、これらの上記概念項目に関連付けられている上
記関係知識構造要素および/または上記関係対象知識構
造要素を抽出することを特徴とする。
【0056】これは、単語マッチングステップの一例を
一層具体的に示すものである。このプログラムによれ
ば、検索結果の関係知識構造要素および/または関係対
象知識構造要素に対して、概念辞書管理ステップにて管
理された概念辞書から対応する概念項目、および/また
は、当該概念項目の上位および/または下位の概念項目
を抽出し、これらの概念項目に関連付けられている関係
知識構造要素および/または関係対象知識構造要素を抽
出するので、概念項目により検索結果の絞込みを行うこ
とができるようになり、検索の精度を飛躍的に向上させ
ることができるようになる。
【0057】また、請求項24に記載のプログラムは、
請求項21から23のいずれか一つに記載のプログラム
において、上記単語マッチングステップは、検索結果の
上記関係知識構造要素および/または上記関係対象知識
構造要素に対して、連結グラフとなる上記関係知識構造
要素および/または上記関係対象知識構造要素であっ
て、(1)トポロジーが同一である上記関係知識構造要
素および/または上記関係対象知識構造要素、(2)上
記概念辞書管理ステップにて管理された上記概念辞書の
中から対応する上記概念項目、および/または、当該概
念項目の上位および/または下位の上記概念項目を抽出
し、これらの上記概念項目に関連付けられている上記関
係知識構造要素および/または上記関係対象知識構造要
素、(3)要素間のパス数が予め定めた数よりも少ない
上記関係知識構造要素および/または上記関係対象知識
構造要素、のうち少なくとも一つを検索することを特徴
とする。
【0058】これは、単語マッチングステップの一例を
一層具体的に示すものである。このプログラムによれ
ば、検索結果の関係知識構造要素および/または関係対
象知識構造要素に対して、同一の連結グラフとなる関係
知識構造要素および/または関係対象知識構造要素であ
って、(1)トポロジーが同一である関係知識構造要素
および/または関係対象知識構造要素、(2)概念辞書
管理ステップにて管理された概念辞書の中から対応する
概念項目、および/または、当該概念項目の上位および
/または下位の概念項目を抽出し、これらの概念項目に
関連付けられている関係知識構造要素および/または関
係対象知識構造要素、(3)要素間のパス数が予め定め
た数よりも少ない関係知識構造要素および/または関係
対象知識構造要素、のうち少なくとも一つを検索するの
で、同一の連結グラフにある知識構造要素のうち概念項
目などにより検索結果の絞込みを行うことができるよう
になり、検索の精度を飛躍的に向上させることができる
ようになる。
【0059】また、請求項25に記載のプログラムは、
請求項21から24のいずれか一つに記載のプログラム
において、上記検索質問を予め定めた論理式の形式に正
規化する論理式正規化ステップをさらに含むことを特徴
とする。
【0060】このプログラムによれば、検索質問を予め
定めた論理式の形式に正規化するので、入力された検索
質問の論理式のフォーマットを一定化することができ、
その後の処理の効率化を図ることができるようになる。
【0061】また、請求項26に記載のプログラムは、
請求項21から25のいずれか一つに記載のプログラム
において、上記検索質問の論理式の部分式について知識
構造要素集合を取得し、部分式同士の論理積を求めるた
めに当該知識構造要素集合の全要素の組み合わせについ
て、(1)同一の文献にある、(2)予め定めた文集合
に属する文にある、(3)予め定めた構造検索式に合致
する文にある、(4)知識構造全体でみて連続である知
識構造である、(5)一つの文献内で連続である知識構
造である、(6)上記概念辞書管理ステップにて管理さ
れた上記概念辞書から対応する上記概念項目、および/
または、当該概念項目の上位および/または下位の上記
概念項目を抽出し、これらの上記概念項目に関連付けら
れている、のうち少なくとも一つであるものを検索する
論理式マッチングステップをさらに含むことを特徴とす
る。
【0062】このプログラムによれば、検索質問の論理
式の部分式について知識構造要素集合を取得し、部分式
同士の論理積を求めるために当該知識構造要素集合の全
要素の組み合わせについて、(1)同一の文献にある、
(2)予め定めた文集合に属する文にある、(3)予め
定めた構造検索式に合致する文にある、(4)知識構造
全体でみて連続である知識構造である、(5)一つの文
献内で連続である知識構造である、(6)管理された概
念辞書から対応する概念項目、および/または、当該概
念項目の上位および/または下位の概念項目を抽出し、
これらの概念項目に関連付けられている、のうち少なく
とも一つであるものを検索するので、部分式のAND条
件を求めるときに、文献、グラフ構造、概念項目などに
より検索結果の絞込みを行うことができるようになり、
検索の精度を飛躍的に向上させることができるようにな
る。
【0063】また、請求項27に記載のプログラムは、
請求項21から26のいずれか一つに記載のプログラム
において、自然言語で入力された上記検索質問から構文
構造を生成する構文構造生成ステップをさらに含むこと
を特徴とする。
【0064】このプログラムによれば、自然言語で入力
された検索質問から構文構造を生成するので、自然言語
検索にも対応することができるようになる。
【0065】また、請求項28に記載のプログラムは、
請求項27に記載のプログラムにおいて、上記構文構造
生成ステップにて作成された上記構文構造から知識構造
を生成する文献知識化ステップをさらに含むことを特徴
とする。
【0066】このプログラムによれば、作成された構文
構造から知識構造を生成するので、知識構造同士の類似
性を検索することなどが可能になり、また、単語をサー
チする場合に比べて格段に速くかつ漏れなく検索を実行
することができるようになる。
【0067】また、請求項29に記載のプログラムは、
請求項28に記載のプログラムにおいて、上記文献知識
化ステップにて生成した上記知識構造における各連結グ
ラフについて類似性を判定し、類似連結グラフの集合を
取得する連結グラフ類似性判定ステップと、上記連結グ
ラフ類似性判定ステップにて取得した各類似連結グラフ
の和集合をとる、または、各類似連結グラフの組み合わ
せについて論理積をとることにより類似連結グラフを統
合するグラフ統合ステップとをさらに含むことを特徴と
する。
【0068】このプログラムによれば、生成した知識構
造における各連結グラフについて類似性を判定し、類似
連結グラフの集合を取得し、取得した各類似連結グラフ
の和集合をとる、または、各類似連結グラフの組み合わ
せについて論理積をとることにより類似連結グラフを統
合するので、知識検索結果をまとめる処理を漏れなくか
つ高速に行うことができるようになる。
【0069】また、請求項30に記載のプログラムは、
請求項21から29のいずれか一つに記載のプログラム
において、検索結果に対応する、上記関係知識構造要
素、上記関係対象知識構造要素、上記文献、上記概念項
目のうち少なくとも一つを予め定めたフォーマットに変
換して検索結果を作成する結果変換ステップをさらに含
むことを特徴とする。
【0070】このプログラムによれば、検索結果に対応
する、関係知識構造要素、関係対象知識構造要素、文
献、概念項目のうち少なくとも一つを予め定めたフォー
マットに変換して検索結果を作成するので、検索結果に
ついて任意の適切なフォーマットで出力することができ
るようになる。
【0071】また、本発明は記録媒体に関するものであ
り、請求項31に記載の記録媒体は、上記請求項21か
ら30のいずれか一つに記載されたプログラムを記録し
たことを特徴とする。
【0072】この記録媒体によれば、当該記録媒体に記
録されたプログラムをコンピュータに読み取らせて実行
することによって、請求項21から30のいずれか一つ
に記載されたプログラムをコンピュータを利用して実現
することができ、これら各方法と同様の効果を得ること
ができる。
【0073】
【発明の実施の形態】以下に、本発明にかかる文献知識
管理装置、文献知識管理方法、プログラム、および、記
録媒体の実施の形態を図面に基づいて詳細に説明する。
なお、この実施の形態によりこの発明が限定されるもの
ではない。
【0074】[本発明の概要]以下、本発明の概要につ
いて説明し、その後、本発明の構成および処理等につい
て詳細に説明する。図1は本発明の基本原理を示す原理
構成図であり、図2は、文献知識管理装置100のモニ
タに表示される原文操作画面、概念辞書操作画面、およ
び、知識構造操作画面の一例を示す図であり、また、図
3は本発明の処理概要を示す概念図である。
【0075】本発明は、概略的に、以下の基本的特徴を
有する。すなわち、本発明は、原文につき構文解釈など
を行い一つまたは複数の単語から構成される知識を作成
し、各知識に区切り(図1に示す下線)や、その品詞な
どからその知識が関係対象(ノード)または関係(エッ
ジ)のいずれになるかを示す印(図1に示す「n」や
「e」等)を付した印付き原文を作成する。すなわち、
本発明は、原文を一つまたは複数の単語から構成される
知識に分割して管理する。
【0076】そして、本発明は、原文から抽出した知識
を構造化して知識構造(例えば、ノードとエッジから構
成されるグラフ構造など)にする。すなわち、本発明
は、知識の構造である知識構造を関係および関係対象を
用いて定義して管理する。知識構造は複数の知識構造要
素の集合とする。知識構造要素は関係型または関係対象
型のいずれかの型を持つ。関係型知識構造要素は関係元
の知識構造要素と関係先の知識構造要素へのリンクをそ
れぞれ一つ持つが、関係対象型知識構造要素はリンクを
持たない。関係型知識構造要素はエッジとして図示さ
れ、関係対象型知識構造要素はノードとして図示され
る。
【0077】そして、本発明は、各知識構造要素につい
てその知識が抽出された原文の一部(例えば、その原文
のヘッダ部分や知識を抽出した原文部分など)へのリン
クを少なくとも一つ設定することができる。また、本発
明は、各知識構造要素はその知識の意味に最も近い階層
化概念辞書の概念項目へのリンクを少なくとも一つ設定
することができる。
【0078】そして、本発明は、これらの原文、階層化
概念辞書、および、知識構造をそれぞれ表示・編集する
ことのできる操作画面と、それらを連携させるための機
構を持つ。
【0079】そして、本発明は、入力された検索質問を
予め定めた論理式の形式に正規化する(図3における論
理式正規化を実行する)。
【0080】そして、本発明は、入力された検索質問に
含まれる単語について、管理された知識構造からマッチ
ングする関係知識構造要素および/または関係対象知識
構造要素を検索する(図3における単語マッチングを実
行する)。すなわち、検索質問の単語について、完全一
致または部分一致する知識を知識構造データベースから
抽出する。
【0081】ここで、本発明は、単語マッチングの一例
として、同義語検索を行う。すなわち、本発明は、検索
結果の関係知識構造要素および/または関係対象知識構
造要素に対して、(1)予め定めた同義関係を意味する
関係知識構造要素で連結された関係対象知識構造要素、
(2)同一の連結グラフに属する関係知識構造要素およ
び/または関係対象知識構造要素、(3)同一の連結グ
ラフに属し、かつ、要素間のパス数が予め定めた数より
も少ない関係知識構造要素および/または関係対象知識
構造要素、(4)同一の連結グラフに属し、かつ、要素
の型(関係型または関係対象型)が同一である関係知識
構造要素および/または関係対象知識構造要素、のうち
少なくとも一つを検索してもよい。
【0082】ここで、「連結グラフ」とは、各関係対象
知識構造要素(ノード)が関係知識構造要素(エッジ)
で連結されているグラフ構造をいう。例えば、図1の知
識構造の例ではノードA、ノードBおよびノードCは同
一の連結グラフに所属し、ノードDおよびノードEは同
一の連結グラフに所属することになる。また、「パス
数」とは、ノード間の最短ルートのエッジ数をいい、例
えば、図1の知識構造の例では、ノードAとノードCと
の間のパス数は2である。
【0083】また、本発明は概念辞書を用いて概念検索
を行う。すなわち、本発明は、検索結果の関係知識構造
要素および/または関係対象知識構造要素に対して、概
念辞書管理手段にて管理された概念辞書から対応する概
念項目、および/または、当該概念項目の上位および/
または下位の概念項目を抽出し、これらの概念項目に関
連付けられている関係知識構造要素および/または関係
対象知識構造要素を抽出してもよい。
【0084】また、検索結果の関係知識構造要素および
/または関係対象知識構造要素に対して、同一の連結グ
ラフとなる関係知識構造要素および/または関係対象知
識構造要素であって、(1)トポロジーが同一である関
係知識構造要素および/または関係対象知識構造要素、
(2)概念辞書管理手段にて管理された概念辞書の中か
ら対応する概念項目、および/または、当該概念項目の
上位および/または下位の概念項目を抽出し、これらの
概念項目に関連付けられている関係知識構造要素および
/または関係対象知識構造要素、(3)要素間のパス数
が予め定めた数よりも少ない関係知識構造要素および/
または関係対象知識構造要素、のうち少なくとも一つを
検索してもよい。
【0085】ここで、「トポロジー」とは、グラフの形
態の類型をいい、例えば、図1に示す例では、ノードA
〜ノードCからなるグラフ形態、および、ノードD〜ノ
ードEからなるグラフ形態の2種類のトポロジーが存在
している。
【0086】そして、本発明は、検索質問の論理式の部
分式について知識構造要素集合を取得し、部分式同士の
論理積を求めるために当該知識構造要素集合の全要素の
組み合わせについて、(1)同一の文献にある、(2)
予め定めた文集合(例えば、要約文集合、主文集合、参
考文献文集合など)に属する文にある、(3)予め定め
た構造検索式に合致する文にある、(4)知識構造全体
でみて連続である知識構造である、(5)一つの文献内
で連続である知識構造である、(6)管理された概念辞
書から対応する概念項目、および/または、当該概念項
目の上位および/または下位の概念項目を抽出し、これ
らの概念項目に関連付けられている、のうち少なくとも
一つであるものを検索する(図3における論理式マッチ
ングを実行する)。
【0087】そして、本発明は、自然言語で入力された
検索質問から構文構造を生成する(図3における構文構
造生成を実行する)。すなわち、既知の自然言語解析技
術を用いて品詞などの構文解析を行い構文構造を生成す
る。
【0088】そして、本発明は、作成された構文構造か
ら知識構造を生成する(図3における文献知識化を実行
する)。すなわち、上述の方法により、構文構造をノー
ド(関係対象知識構造要素)およびエッジ(関係知識構
造要素)により表現する。
【0089】そして、本発明は、生成した知識構造にお
ける各連結グラフについて類似性を判定し、類似連結グ
ラフの集合を取得し、取得した各類似連結グラフの和集
合をとる、または、各類似連結グラフの組み合わせにつ
いて論理積をとることにより類似連結グラフを統合する
(図3における連結グラフの類似性判定を実行する)。
【0090】そして、本発明は、検索結果に対応する、
関係知識構造要素、関係対象知識構造要素、文献、概念
項目のうち少なくとも一つを予め定めたフォーマットに
変換して検索結果を作成する(図3における結果変換を
実行する)。
【0091】[システム構成]まず、本システムの構成
について説明する。図4は、本発明が適用される本シス
テムの構成の一例を示すブロック図であり、該構成のう
ち本発明に関係する部分のみを概念的に示している。本
システムは、概略的に、文献知識管理装置100と、論
文、雑誌、新聞、特許文献等に関する外部データベース
や文献検索などの外部分析プログラム等を提供する外部
システム200とを、ネットワーク300を介して通信
可能に接続して構成されている。
【0092】図4においてネットワーク300は、文献
知識管理装置100と外部システム200とを相互に接
続する機能を有し、例えば、インターネット等である。
【0093】図4において外部システム200は、ネッ
トワーク300を介して、文献知識管理装置100と相
互に接続され、利用者に対して論文、雑誌、新聞、特許
文献等に関する外部データベースや文献検索などの外部
分析プログラム等を実行するウェブサイトを提供する機
能を有する。
【0094】ここで、外部システム200は、WEBサ
ーバやASPサーバ等として構成してもよく、そのハー
ドウェア構成は、一般に市販されるワークステーショ
ン、パーソナルコンピュータ等の情報処理装置およびそ
の付属装置により構成してもよい。また、外部システム
200の各機能は、外部システム200のハードウェア
構成中のCPU、ディスク装置、メモリ装置、入力装
置、出力装置、通信制御装置等およびそれらを制御する
プログラム等により実現される。
【0095】図4において文献知識管理装置100は、
概略的に、文献知識管理装置100の全体を統括的に制
御するCPU等の制御部102、通信回線等に接続され
るルータ等の通信装置(図示せず)に接続される通信制
御インターフェース部104、入力装置112や出力装
置114に接続される入出力制御インターフェース部1
08、および、各種のデータベースやテーブルなどを格
納する記憶部106を備えて構成されており、これら各
部は任意の通信路を介して通信可能に接続されている。
さらに、この文献知識管理装置100は、ルータ等の通
信装置および専用線等の有線または無線の通信回線を介
して、ネットワーク300に通信可能に接続されてい
る。
【0096】記憶部106に格納される各種のデータベ
ースやテーブル(原文データベース106a〜質問知識
構造データベース106g)は、固定ディスク装置等の
ストレージ手段であり、各種処理に用いる各種のプログ
ラムやテーブルやファイルやデータベースやウェブペー
ジ用ファイル等を格納する。
【0097】これら記憶部106の各構成要素のうち、
原文データベース106aは、各種文献の原文を格納し
たデータベースである。図5は、原文データベース10
6aに格納される情報の一例を示す図である。この原文
データベース106aに格納される情報は、図5に示す
ように、原文を一意に識別するための原文ID(識別
子)、単語を一意に識別するための単語ID、知識を一
意に識別するための知識ID、知識が関係型または関係
対象型のいずれの型であるかを示す型情報、原文へのリ
ンク情報等を相互に関連付けて構成されている。ここ
で、原文データベース106aは、インターネットを経
由してアクセスする外部データベースであってもよく、
また、これらのデータベースをコピーしたり、オリジナ
ルの原文を格納したり、さらに独自の情報等を付加した
りして作成したインハウスデータベースであってもよ
い。
【0098】また、知識構造データベース106bは、
知識構造に関する情報等を格納する知識構造格納手段で
ある。図6は、知識構造データベース106bに格納さ
れる情報の一例を示す図である。この知識構造データベ
ース106bに格納される情報は、図6に示すように、
原文ID、ノードを定義するためのノード情報として知
識ID、エッジを定義するためのエッジ情報として接続
元の知識IDおよび接続先の知識ID等を相互に関連付
けて構成されている。
【0099】また、概念辞書データベース106cは、
概念辞書に関する情報等を格納する概念辞書格納手段で
ある。図7は、概念辞書データベース106cに格納さ
れる情報の一例を示す図である。この概念辞書データベ
ース106cに格納される情報は、図7に示すように、
概念項目を一意に識別するための概念項目ID、概念項
目の内容を示すための概念項目内容、概念項目に関連す
る知識ID、知識IDのリンク情報、親の階層(上位概
念)に対応する親概念項目ID、子の階層(下位概念)
に対応する概念項目のリストである子概念項目IDリス
ト等を相互に関連付けて構成されている。
【0100】また、原文操作画面データ106dは、原
文操作画面に関する情報等を格納する原文操作画面デー
タ格納手段である。
【0101】また、知識構造操作画面データ106e
は、知識構造操作画面に関する情報等を格納する知識構
造操作画面データ格納手段である。
【0102】また、概念辞書操作画面データ106f
は、概念辞書操作画面に関する情報等を格納する概念辞
書操作画面データ格納手段である。
【0103】また、質問知識構造データベース106g
は、自然言語で入力された検索質問から生成された構文
構造を文献知識化した知識構造を格納する質問知識構造
格納手段である。その格納内容は、図6を用いて上述し
た知識構造データベース106bに格納される情報と同
様である(原文の代わりに検索質問が対応する)。
【0104】また、図4において、通信制御インターフ
ェース部104は、文献知識管理装置100とネットワ
ーク300(またはルータ等の通信装置)との間におけ
る通信制御を行う。すなわち、通信制御インターフェー
ス部104は、他の端末と通信回線を介してデータを通
信する機能を有する。
【0105】また、図4において、入出力制御インター
フェース部108は、入力装置112や出力装置114
の制御を行う。ここで、出力装置114としては、モニ
タ(家庭用テレビを含む)の他、スピーカを用いること
ができる(なお、以下において出力装置114をモニタ
として記載する)。また、入力装置112としては、キ
ーボード、マウス、および、マイク等を用いることがで
きる。また、モニタも、マウスと協働してポインティン
グデバイス機能を実現する。
【0106】また、図4において、制御部102は、O
S(Operating System)等の制御プロ
グラム、各種の処理手順等を規定したプログラム、およ
び所要データを格納するための内部メモリを有し、これ
らのプログラム等により、種々の処理を実行するための
情報処理を行う。制御部102は、機能概念的に、原文
管理部102a、知識構造管理部102b、概念辞書管
理部102c、原文操作画面作成部102d、知識構造
操作画面作成部102e、概念辞書操作画面作成部10
2f、文献知識自動編集部102g、操作画面連携部1
02h、および、検索処理部102mを備えて構成され
ている。
【0107】このうち、原文管理部102aは、文献の
原文を一つまたは複数の単語から構成される知識に分割
して管理する原文管理手段である。また、知識構造管理
部102bは、原文に関係付けられた、関係知識構造要
素および関係対象知識構造要素から構成される知識構造
を管理する知識構造管理手段である。また、概念辞書管
理部102cは、関係付けられた知識の概念を階層的に
定義する概念項目から構成される概念辞書を管理する概
念辞書管理手段である。また、原文操作画面作成部10
2dは、原文管理手段により分割された知識を区別して
原文を表示し、利用者に所望の知識を構成する単語を選
択させる原文操作画面を作成する原文操作画面作成手段
である。
【0108】また、知識構造操作画面作成部102e
は、知識構造管理手段により管理された知識構造を表示
し、利用者に所望の知識構造を構成する関係知識構造要
素および関係対象知識構造要素を選択させる知識構造操
作画面を作成する知識構造操作画面作成手段である。ま
た、概念辞書操作画面作成部102fは、概念辞書管理
手段により管理される概念辞書を表示し、利用者に所望
の知識に対応する概念項目を選択させる概念辞書操作画
面作成手段である。また、文献知識自動編集部102g
は、原文操作画面、知識構造操作画面、または、概念辞
書操作画面において知識が変更、削除、追加等された場
合、あるいは、利用者から自動作成の指示があった場合
等に、当該知識に対する全ての操作画面におけるリンク
情報を自動的に変更、削除、追加する文献知識自動編集
手段である。
【0109】また、操作画面連携部102hは、各操作
画面の操作などを連携させる操作画面連携手段であり、
共有カーソル管理部102iと固有カーソル管理部10
2jとを含んで構成される。また、共有カーソル管理部
102iは、原文操作画面、知識構造操作画面、また
は、概念辞書操作画面において同一の知識を指示する共
有カーソルを表示し、利用者に当該共有カーソルを移動
させることにより所望の知識を選択させる共有カーソル
管理手段である。また、固有カーソル管理部102j
は、原文操作画面、知識構造操作画面、または、概念辞
書操作画面において知識を指示する固有カーソルを表示
し、利用者に固有カーソルを移動させることにより所望
の知識を選択させ、当該固有カーソルが表示された画面
以外の画面において当該固有カーソルが指示する当該知
識に対するリンク情報を管理する固有カーソル管理手段
である。また、知識蓄積部102kは、抽出した知識を
記憶部106の各種のデータベースに蓄積する知識蓄積
手段である。
【0110】また、検索処理部102mは、利用者によ
り入力された検索質問を検索する検索処理手段であり、
論理式正規化部102n、単語マッチング部102p、
論理式マッチング部102q、結果変換部102r、構
文構造生成部102s、文献知識化部102t、連結グ
ラフ類似性判定部102u、グラフ統合部102v、お
よび、結果画面作成部102wを備えて構成される。
【0111】ここで、論理式正規化部102nは、検索
質問を予め定めた論理式の形式に正規化する論理式正規
化手段である。また、単語マッチング部102pは、入
力された検索質問に含まれる単語について、上記知識構
造管理手段により管理された上記知識構造からマッチン
グする上記関係知識構造要素および/または上記関係対
象知識構造要素を検索する単語マッチング手段である。
また、論理式マッチング部102qは、上記検索質問の
論理式の部分式について知識構造要素集合を取得し、部
分式同士の論理積を求めるために当該知識構造要素集合
の全要素の組み合わせについて、(1)同一の文献にあ
る、(2)予め定めた文集合に属する文にある、(3)
予め定めた構造検索式に合致する文にある、(4)知識
構造全体でみて連続である知識構造である、(5)一つ
の文献内で連続である知識構造である、(6)上記概念
辞書管理手段にて管理された上記概念辞書から対応する
上記概念項目、および/または、当該概念項目の上位お
よび/または下位の上記概念項目を抽出し、これらの上
記概念項目に関連付けられている、のうち少なくとも一
つであるものを検索する論理式マッチング手段である。
【0112】また、結果変換部102rは、検索結果に
対応する、上記関係知識構造要素、上記関係対象知識構
造要素、上記文献、上記概念項目のうち少なくとも一つ
を予め定めたフォーマットに変換して検索結果を作成す
る結果変換手段である。また、構文構造生成部102s
は、自然言語で入力された上記検索質問から構文構造を
生成する構文構造生成手段である。また、文献知識化部
102tは、上記構文構造生成手段にて作成された上記
構文構造から知識構造を生成する文献知識化手段であ
る。また、連結グラフ類似性判定部102uは、上記文
献知識化手段にて生成した上記知識構造における各連結
グラフについて類似性を判定し、類似連結グラフの集合
を取得する連結グラフ類似性判定手段である。また、グ
ラフ統合部102vは、連結グラフ類似性判定手段にて
取得した各類似連結グラフの和集合をとる、または、各
類似連結グラフの組み合わせについて論理積をとること
により類似連結グラフを統合するグラフ統合手段であ
る。また、結果画面作成部102wは、検索結果の表示
画面を生成する結果画面作成手段である。なお、これら
各部によって行なわれる処理の詳細については、後述す
る。
【0113】[システムの処理]次に、このように構成
された本実施の形態における本システムの処理の一例に
ついて、以下に図を参照して詳細に説明する。
【0114】[文献知識作成処理]まず、文献知識作成
処理の詳細について図2を参照して説明する。
【0115】まず、文献知識管理装置100は、原文管
理部102aの処理により、利用者が選択した原文につ
いて原文データベース106aより取得し、原文操作画
面作成部102dの処理により、所望の原文に対する原
文操作画面用のデータを作成して入出力制御インターフ
ェース部108を介して出力装置114に出力する。
【0116】また、文献知識管理装置100は、概念辞
書管理部102cの処理により概念辞書データベース1
06cより取得した情報に基づいて、概念辞書操作画面
作成部102fの処理により、概念辞書操作画面用のデ
ータを作成して入出力制御インターフェース部108を
介して出力装置114に出力する。
【0117】また、文献知識管理装置100は、知識構
造管理部102bの処理により、原文データベース10
6aより取得した情報に基づいて雛型となる知識構造デ
ータベース106bを作成した後、知識構造操作画面作
成部102eの処理により、所望の原文に対する知識構
造操作画面用のデータを作成して入出力制御インターフ
ェース部108を介して出力装置114に出力する。こ
れらの操作画面および連携機構については図2を参照し
て説明する。
【0118】図2は、文献知識管理装置100のモニタ
に表示される原文操作画面、概念辞書操作画面、およ
び、知識構造操作画面の一例を示す図である。この図に
示すように原文操作画面は、例えば、共有カーソルMA
−1、固有カーソルMA−2、縦方向のスクロールバー
MA−3、および、横方向のスクロールバーMA−4を
含んで構成されている。
【0119】原文は複数の単語(図2においてW1〜W
10などで示す)からなる。図2に示すように、原文操作
画面は、原文中に、一つまたは複数の単語から構成され
る知識(図2において下線が一つの知識であることを示
す)や、知識がノードになるかまたはエッジになるかを
示す任意の印を付すことができる。ここで、原文の最小
単位となる知識は、本画面上の操作により伸張または短
縮することができる。
【0120】また、原文操作画面は、図2に示すように
原文と印を同時に表示するが、その表示方法は以下のい
ずれかを用いてもよい。例えば、印の種類、印の範囲、
印の種類や範囲の変更操作を指示するためのカーソル
を、それぞれ異なった種類の表示属性(色、下線、太
字、反転、点滅、サイズ、フォント種類、影、傍点、斜
体、装飾枠、SGML/XML等のタグ文字列または特
殊記号によるはさみこみ等)で区別して表示してもよ
い。ただしどの部分をとっても重複して印を付けられて
いない場合に限る。また、印の種類、印の範囲を重ね合
わせ可能な表示属性(下線、傍点、装飾枠など)で表示
し、複数の印付けを同時に表示してもよい(この場合、
重複して印を付けられている部分があってもよい)。ま
た、印の系列を切り替えるインターフェース(ラジオボ
タン、プルダウンリスト、タブなど)と併用してもよ
い。
【0121】利用者が縦方向のスクロールバーMA−
3、または、横方向のスクロールバーMA−4を入力装
置112を介して操作することにより表示領域を変更す
ると、原文操作画面作成部102dは、変更された表示
領域に対応する原文操作画面を作成して出力装置114
に出力する。
【0122】また、利用者が共有カーソルMA−1、ま
たは、固有カーソルMA−2を用いて出力装置114に
表示された所望の単語や知識などを選択し、その内容を
変更すると、原文管理部102aは、その変更内容を原
文データベース106aなどの所定の記憶領域に格納す
る。
【0123】また、図2に示すように概念辞書操作画面
は、例えば、共有カーソルMC−1、固有カーソルMC
−2、縦方向のスクロールバーMC−3、および、横方
向のスクロールバーMC−4を含んで構成されている。
【0124】概念辞書操作画面は、概念項目間の抽象・
具体関係を階層化して表示し、概念項目を追加・削除・
編集することができる。概念項目の表示方法は以下のい
ずれかを用いてもよい。まず、上下また左右に抽象度の
高低を表現する方向を定め、概念項目を頂点、関係を枝
として木またはネットワークの図として表示してもよ
く、また、アウトライン・プロセッサの木構造に概念項
目を対応させて表示してもよい。
【0125】利用者が縦方向のスクロールバーMC−
3、または、横方向のスクロールバーMC−4を入力装
置112を介して操作することにより表示領域を変更す
ると、概念辞書操作画面作成部102fは、変更された
表示領域に対応する概念辞書操作画面を作成して出力装
置114に出力する。
【0126】また、利用者が共有カーソルMC−1、ま
たは、固有カーソルMC−2を用いて出力装置114に
表示された概念項目などを選択し、その内容を変更する
と、概念辞書管理部102cは、その変更内容を概念辞
書データベース106cなどの所定の記憶領域に格納す
る。
【0127】また、図2に示すように知識構造操作画面
は、例えば、共有カーソルMB−1、固有カーソルMB
−2、縦方向のスクロールバーMB−3、および、横方
向のスクロールバーMB−4を含んで構成されている。
【0128】知識構造操作画面は、関係対象型知識構造
要素(ノード)とそれらの間に設定できる関係型知識構
造要素(エッジ)を表示し、知識構造要素の追加・削除
・編集を実行することができる。こられの知識構造要素
の表示方法は、既存のいかなるグラフ描画手法によって
グラフ化してもよい。また、ノード中に表示されるテキ
ストラベルは、必ずしも関係付けられた原文操作画面中
の原文と同じ文字列でなくてもよい。
【0129】利用者が縦方向のスクロールバーMB−
3、または、横方向のスクロールバーMB−4を入力装
置112を介して操作することにより表示領域を変更す
ると、知識構造操作画面作成部102eは、変更された
表示領域に対応する知識構造操作画面を作成して出力装
置114に出力する。
【0130】また、利用者が共有カーソルMB−1、ま
たは、固有カーソルMB−2を用いて出力装置114に
表示された知識構造要素などを選択し、その内容を変更
すると、知識構造管理部102bは、その変更内容を知
識構造データベース106bなどの所定の記憶領域に格
納する。これにて、文献知識作成処理が終了する。
【0131】[操作画面連携処理]次に、操作画面連携
処理の詳細について説明する。操作画面連携部102h
は、図2を用いて上述した原文操作画面、概念辞書操作
画面、知識構造操作画面を用いて以下の操作を可能にす
る。
【0132】まず、操作画面連携部102hは、共有カ
ーソル管理部102iの処理により、共有カーソル(M
A−1、MB−1、MC−1)を各操作画面で扱う。共
有カーソルは各操作画面固有のカーソルとは区別して以
下のように表示・操作される。
【0133】共有カーソル管理部102iは、原文操作
画面と知識構造操作画面の共有カーソルを連動させる。
すなわち、共有カーソル管理部102iは、利用者が原
文操作画面の共有カーソルを移動したとき、移動先の部
分にリンクを持つ知識構造要素がある場合、知識構造操
作画面の共有カーソルをその知識構造要素に設定する。
また、共有カーソル管理部102iは、利用者が知識構
造操作画面の共有カーソルを移動したとき、移動先の知
識構造要素に原文の一部へのリンクがある場合、原文操
作画面の共有カーソルをその原文の一部に設定する。
【0134】また、共有カーソル管理部102iは、概
念辞書操作画面と知識構造操作画面の共有カーソルを連
動させる。すなわち、共有カーソル管理部102iは、
利用者が概念辞書操作画面の共有カーソルを移動したと
き、移動先の概念項目にリンクを持つ知識構造要素があ
る場合には、知識構造操作画面の共有カーソルをその知
識構造要素に設定する。また、共有カーソル管理部10
2iは、利用者が知識構造操作画面の共有カーソルを移
動したとき、移動先の知識構造要素に概念項目へのリン
クがある場合には、概念辞書操作画面の共有カーソルを
その概念項目に設定する。
【0135】また、操作画面連携部102hは、固有カ
ーソル管理部102jの処理により、知識構造操作画面
固有カーソル(MB−2)で示される知識構造要素か
ら、原文操作画面固有カーソル(MA−2)で示される
印のついた原文の一部へリンクを張る/解除する操作を
以下のように実行する。
【0136】まず、固有カーソル管理部102jは、知
識構造操作画面固有カーソル(MB−2)で示される知
識構造要素から、概念辞書操作画面固有カーソル(MC
−2)で示される概念項目へリンクを張る/解除する操
作を以下に説明する。
【0137】固有カーソル管理部102jは、利用者が
原文操作画面で印の種類または印の範囲を変更した場
合、印の種類または設定によって以下のいずれかの処理
を行う。1)知識構造要素からその印のついた原文の一
部へのリンクを解除する。2)この解除処理を行い、さ
らにリンクを解除した知識構造要素に固有カーソルを移
動し原文へのリンクの設定を促す。3)印の範囲の変更
時のみこの解除処理、または、このリンク設定促進処理
を行う。4)変更前の印の範囲を構成する語を最も多く
含む変更後の印へリンクを付け替える。5)このリンク
付け替え処理を行い、さらにリンクを付け替えた知識構
造要素にカーソルを移動し、設定に応じて付け替えたリ
ンクの確認を促す。
【0138】また、利用者が概念辞書操作画面で概念項
目の定義変更または削除を行った場合、操作画面連携部
102hは、設定によって以下のいずれかの処理を行
う。1)知識構造要素からその概念項目へのリンクを解
除する。2)このリンク解除処理を行い、さらにリンク
を解除した知識構造要素にカーソルを移動し概念項目へ
のリンクの設定を促す。3)変更前の概念項目に近い概
念項目(先祖、兄弟、子孫)へリンクを付け替える。
4)このリンクの付け替え処理を行い、さらにリンクを
付け替えた知識構造要素にカーソルを移動し、設定に応
じて付け替えたリンクの確認を促す。
【0139】また、利用者が原文の印の種類を2種類指
定して知識構造を新規に作成すると、操作画面連携部1
02hは、ひとつの種類(Aとする)で関係型知識構造
要素への変換を指示し、もうひとつの種類(Bとする)
で関係対象型知識構造要素への変換を指示する。この場
合、操作画面連携部102hは、知識構造を以下の手順
で作成する。まず、操作画面連携部102hは、印がB
−A−B’というパターンで連続している場合、関係対
象型知識構造要素b1,b2を作成し、それぞれ原文の
前方のB印部分、後方のB’印部分へのリンクを張る。
そして、操作画面連携部102hは、関係型知識構造要
素aを作成し、原文のA印へのリンクを張る。そして、
操作画面連携部102hは、関係型知識構造要素aの関
係元知識構造要素としてb1へのリンクを、関係先知識
構造要素としてb2へのリンクを張る。一方、印がA−
A’となるか、文頭からA’で始まるか、または文末が
Aで終わるかのいずれかのパターンの場合は、操作画面
連携部102hは、内容が空で種類がBの印が原文の
A’印部分の直前またはA印の直後にあるとして最初の
手順を適用する。また、印がB−B’となるパターンの
場合は、操作画面連携部102hは、内容が空で種類が
Aの印が原文のBとB’の間にあるとして最初の手順を
適用する。そして、操作画面連携部102hは、操作記
録を記憶部106の所定の記憶領域に残す。これにて、
操作画面連携処理が終了する。
【0140】[知識蓄積処理]次に、知識蓄積処理の詳
細について説明する。このシステムを用いた知識の蓄積
作業は以下の手順に従う。
【0141】まず、原文に印をつける。原文操作画面を
用いて独自の基準で印を付けてもよいし、一般の構文解
析処理系を用いて構文タグを付けてもよい。後者の場合
は処理結果を原文操作画面で確認し必要に応じて修正す
る。
【0142】そして、操作画面連携部102hの処理に
より上述した操作画面連携処理を行い、知識構造の雛型
を作成する。関係型知識構造要素に変換する印の種類と
関係対象型知識構造要素に変換する印の種類は以下のい
ずれかの方法により決定する。まず、独自の基準で印を
つけた場合、関係に相当すると想定した部分に多くつけ
た印の種類を関係型知識構造要素に、関係対象に相当す
ると想定した部分に多くつけた印の種類を関係対象型知
識構造要素に対応させる。一方、一般の構文解析処理系
を用いて印をつけた場合、主に動詞につけられた印の種
類を関係型知識構造要素に、主に名詞句または名詞節に
つけられた印の種類を関係対象型知識構造要素に対応さ
せる。
【0143】そして、知識蓄積部102kは、知識構造
操作画面で知識構造要素の確認・編集を行う。また、必
要に応じて原文操作画面を参照し、共有カーソル連動機
能を利用する。そして、知識蓄積部102kは、蓄積す
る価値がないと判断される知識構造要素を削除する。ま
た、知識蓄積部102kは、原文には存在しないが蓄積
の価値のある知識構造要素を追加する。また、追加した
知識構造要素に密接に関連する原文部分がある場合は、
知識蓄積部102kは、原文リンクを張る。
【0144】そして、知識蓄積部102kは、知識構造
操作画面で各知識構造要素の表示属性(テキストラベ
ル、サイズ、位置、形状、色、など)を変更する。そし
て、知識蓄積部102kは、知識構造操作画面と概念辞
書操作画面を併用し、概念項目リンク操作機能を利用し
て概念項目リンクを張る。全ての知識構造要素に対して
本処理を適用する。
【0145】ここで、適切な概念項目が見つからない知
識構造要素がある場合、知識蓄積部102kは、以下の
いずれかの処理を行なう。知識構造操作画面で知識構造
要素に最適な概念項目を作成し、それに対して概念項目
リンクを張る。知識構造操作画面から概念未定義を意味
する概念項目を選択し、それに対して概念項目リンクを
張る。これにて、知識蓄積処理が終了する。
【0146】[文献知識自動生成処理]次に、文献知識
自動生成処理の詳細について説明する。文献知識管理装
置100は、文献知識を次の方法で自動生成する。
【0147】まず、概念辞書管理部102cは、上述の
方法により手作業等で階層化概念辞書の初版を概念辞書
データベース106cに整備する。必要に応じて既存の
オントロジー技術を利用する。
【0148】そして、上述の方法により知識構造を蓄積
するが、その際、階層化概念辞書中の全概念項目に対し
てリンクが張られるように計画して原文を選択し処理を
進める。この原文の選択は、ランダムに原文を選択す
る、概念項目リンクが張られていない概念項目の集合を
作成してその中から選択する、各概念項目を表現する事
例語で原文を全文検索しマッチした原文を選択する等の
いずれかの方法、または、それらを組み合わせて行う。
【0149】そして、文献知識自動編集部102gは、
利用可能な原文全てに対して以下の処理を適用し、知識
構造を自動生成する。まず、文献知識自動編集部102
gは、原文データベース106aに格納された原文に印
を付ける。必要に応じて既存の構文解析処理系を用い
る。
【0150】そして、文献知識自動編集部102gは、
上述した方法により知識構造要素を生成すると、生成し
た各知識構造要素に対して以下の処理のいずれかを適用
する。概念辞書データベース106cに格納された階層
化概念辞書の概念項目の事例語にマッチする原文部分を
持つ知識構造要素からその概念項目へのリンクを張る。
処理した原文集合から、処理中の原文Aを引数に、既存
自然言語処理技術等を用いて原文データベース106a
について類似文章検索し、原文Bを得る。
【0151】そして、文献知識自動編集部102gは、
原文Bの概念項目へのリンクを参考に、原文Aの各部分
に対応する知識構造要素から概念項目へのリンクを張
る。概念項目リンクの推定が一定の基準に達しない場
合、文献知識自動編集部102gは、概念未定義を意味
する概念項目へのリンクを張る。
【0152】そして、文献知識自動編集部102gは、
上述の処理で生成した知識構造について、確認を行いな
がら自動生成処理を繰り返す。これにて、文献知識自動
生成処理が終了する。
【0153】[検索処理]次に、検索処理の詳細につい
て図8および図9ならびに図12および図13を参照し
て説明する。ここで、以下の検索処理においては、検索
対象の文献・情報について、必要な知識を抽出し構造化
して管理していることを前提とする。本発明で開示する
手法は複数の手順(ステップ)から構成されるが、前提
とする条件は手順によって異なるため、以下に前提条件
のパターンを列挙する。 (P−1)全ての原文(ただし文献単位)に対応する知
識構造が存在する。 (P−2)全ての知識構造要素に階層化概念辞書項目が
対応付けられている。 (P−3)前提条件(P−1)と(P−2)を両方満た
す。
【0154】また、検索質問の種類に応じて次の2つの
場合に分ける。 (ステップ−1)一連の語またはそれらが論理結合され
た式。 (ステップ−2)自然言語の文章。
【0155】次に、ステップ−1とステップ−2のそれ
ぞれの場合の検索処理方法を詳細に説明する。
【0156】[ステップ−1;検索質問の種類が一連の
語またはそれらが論理結合された式の場合の処理]図1
2は、本実施形態における、検索質問の種類が一連の語
またはそれらが論理結合された式の場合の処理の一例を
示すフローチャートである。
【0157】(ステップ−1);まず、ユーザが検索質
問を入力する。
【0158】(ステップ−1−1);検索質問として入
力された語または連語の集合を全て論理式で結合された
表現に正規化する。すなわち、論理式正規化部102n
は、複数の語がスペースやカンマなどの区切り符号で区
切られて入力された場合には、これらの区切り符号を論
理積(アンド条件)などの予め定めた論理式のフォーマ
ットに合わせて修正することにより表現を正規化する。
例えば、語のデフォルト結合論理がANDであり、検索
質問の入力がw_1,w_2,w_3,...,w_n
である場合、w_1 AND w_2 AND w_3
AND...AND w_nに正規化する。デフォル
ト結合論理はANDとORのいずれかをラジオボタンG
UI等を通じて選択してもよい。
【0159】(ステップ−1−2);前提条件(P−
1)または(P−2)または(P−3)が満たされてい
るとする。単語マッチング部102pは、論理式を含ま
ないそれぞれの語または連語tについて、次の(ステッ
プ−1−2−*)のいずれかのステップ、または、任意
の順番により組み合わせたステップで処理し、全てのt
について知識構造要素集合KS(t)を得る。手順の選
択については、ユーザによる指示またはシステム設定に
従う。
【0160】(ステップ−1−2−a);単語マッチン
グ部102pは、知識構造データベース106bにアク
セスして、語tが完全一致するまたは部分一致する(ユ
ーザからの検索指示に従う。)知識構造要素を全てKS
(t)にセットする。
【0161】(ステップ−1−2−b);知識構造上の
要素の同義関係が次のいずれかの方法で定義されている
とする。 − 知識構造の関係型要素(エッジ)のうち、同義関係
を意味する要素を決め、その関係型要素で連結された要
素を同義であると定義する。この関係型要素はユーザが
指示してもよいし、階層化概念辞書の一部でもよいし、
階層化概念辞書とは別にシステム管理者が決定してもよ
い。 − 知識構造のグラフ構造において、同一の連結グラフ
に属する要素を同義であると定義する。 − 知識構造のグラフ構造において、同一の連結グラフ
に属し、かつ要素間のパス数がn以下である場合に同義
であると定義する。ここでnは1以上の整数で、ユーザ
が指示してもよいし、システム管理者が決定してもよ
い。 − 知識構造のグラフ構造において、同一の連結グラフ
に属し、かつ要素の型(ノードまたはエッジ)が同一で
ある場合に同義であると定義する。
【0162】このとき単語マッチング部102pは、以
下の(ステップ−1−2−b−*)の手順で処理する。
なお、上述した「連結グラフ」は知識構造全体から連結
情報を検索したもの、または文献毎に連結情報を検索し
たもののいずれかとする。この選択もユーザ指示または
システム既定値に従う。例えば、知識構造に<term
_1>−−<is a>−−<term_2>という構
造がある場合、検索質問として入力された語<term
_1>を<term_2>に置き換えた検索処理も進め
る。このような展開処理を何段階か繰り返し行うことも
できる。この展開段数は検索GUIから設定してもよい
し、アドホックに検索式に埋め込んでもよい。検索式に
埋め込む場合は例えば“<term_1>(n)”のよ
うに表記する。この場合は知識構造を用いた語展開をn
回まで行う。
【0163】(ステップ−1−2−b−1);語展開反
復残数n(1以上)をユーザまたはシステム既定値から
取得する。
【0164】(ステップ−1−2−b−2);語集合T
を{t}とする。
【0165】(ステップ−1−2−b−3);集合Tの
各要素t_iについて手順(ステップ−1−2−b−3
−*)で処理する。
【0166】(ステップ−1−2−b−3−1);上述
した(ステップ−1−2−a)を処理し知識構造要素集
合KS_1(t_i)を得る。集合KS(t)にKS_
1(t_i)の全要素を追加する。
【0167】(ステップ−1−2−b−3−2);集合
KS_1(t_i)の各要素と同義関係にある知識構造
要素を集合KS_2(t_i)に取得する。
【0168】(ステップ−1−2−b−3−3);集合
KS_2(t_i)内の各知識構造要素が持つ語を集合
T_1に加える。
【0169】(ステップ−1−2−b−4);TをT_
1とし、語展開反復残数nをn−1とする。
【0170】(ステップ−1−2−b−5);反復残数
nが1以上であれば手順(ステップ−1−2−b−3)
へ戻る。
【0171】(ステップ−1−2−c);前提条件(P
−2)が満たされているとする。単語マッチング部10
2pは、語tについて手順(ステップ−1−2−a)を
処理し、知識構造要素集合KS_3(t)を得る。この
とき単語マッチング部102pは集合KS_3(t)の
各要素ks_iについて次の手順(ステップ−1−2−
c−*)で処理する。
【0172】(ステップ−1−2−c−1);知識構造
要素ks_iに対応する階層化概念辞書項目cを取得す
る。
【0173】(ステップ−1−2−c−2);次に示す
(ステップ−1−2−c−2−*)のいずれかの手順で
処理する。
【0174】(ステップ−1−2−c−2−a);項目
cに関連付けられている知識構造要素集合KS(c)を
取得し、KS(t)に追加する。
【0175】(ステップ−1−2−c−2−b);項目
cの階層下にある全ての概念辞書項目について手順(ス
テップ−1−2−c−2−a)を処理する。
【0176】(ステップ−1−2−c−2−c);項目
cからn段階層を登り、その項目について手順(ステッ
プ−1−2−c−2−b)を処理する。
【0177】(ステップ−1−2−d);前提条件(P
−2)が満たされているとする。語tについて手順(ス
テップ−1−2−a)を処理し、知識構造要素集合KS
_3(t)を得る。このとき単語マッチング部102p
は、集合KS_3(t)の各要素ks_iについて次の
手順(ステップ−1−2−d−*)で処理する。例え
ば、知識構造に複数の<term_x>−−<is a
>−−<term_1>という構造ksがある場合(<
term_x>は<term_1>を含む複数の語)、
検索質問として入力された語<term_1>を<te
rm_x>に置き換えた検索処理も進める。また知識構
造ksはこれよりも複雑なグラフ構造パターンや階層化
概念辞書を介しても指定される。
【0178】(ステップ−1−2−d−1);知識構造
要素ks_iを含み連続したグラフ構造となる知識構造
集合KS_4(ks_i)を取得する。手順(ステップ
−1−2−b)の場合と同様に、連結性の定義には知識
構造全体で判断するものと文献単位で判断するものの2
種類があり、ユーザまたはシステム既定値により指定さ
れる。
【0179】(ステップ−1−2−d−2);知識構造
集合が類似であることを次の(ステップ−1−2−d−
2−*)のいずれかの方法で定義する。
【0180】(ステップ−1−2−d−2−a);集合
KS_4(ks_i)とノード・エッジの接続関係(ト
ポロジー)が同じであり、かつ全ての対応する知識構造
要素組について、組となっている要素が同一の階層化概
念辞書項目に対応するような知識構造集合を類似である
と定義する。
【0181】(ステップ−1−2−d−2−b);上述
の(ステップ−1−2−d−2−a)と同様の定義であ
るが、知識構造要素を階層化概念項目へ対応させる際
に、手順(ステップ−1−2−c−2)と同様に、階層
下全部、n段遡ったノード下全部のバリエーションがあ
り、ユーザまたはシステム既定値で指定する。
【0182】(ステップ−1−2−d−2−c);上述
の(ステップ−1−2−d−2−a)または(ステップ
−1−2−d−2−b)と同様の定義であるが、対応す
る知識構造要素組が同一の階層化概念辞書項目に対応し
ているかどうか判定する組を次の(ステップ−1−2−
d−2−c−*)のいずれかまたはその組み合わせた方
法で制限するもの。
【0183】(ステップ−1−2−d−2−c−a);
知識構造要素集合KS_5をユーザまたはシステム管理
者が定め、KS_5に含まれる知識構造要素のみ対応関
係をチェックする。
【0184】(ステップ−1−2−d−2−c−b);
階層化概念項目集合SC_1をユーザまたはシステム管
理者が定め、SC_1に対応付けされる知識構造要素の
み対応関係をチェックする。
【0185】(ステップ−1−2−d−2−c−c);
集合KS_4(ks_i)からks_iに関してn近傍
となる部分集合KS_6(ks_i,n)を取得する。
KS_6に含まれる知識構造要素のみ対応関係をチェッ
クする。nはユーザまたはシステム既定値で指定される
とする。
【0186】(ステップ−1−2−d−2−d);上述
の(ステップ−1−2−d−2−a)または(ステップ
−1−2−d−2−b)と同様の定義であるが、知識構
造のトポロジーの同一性の判定を次の(ステップ−1−
2−d−2−d−*)のいずれかまたはその組み合わせ
た方法で制限するもの。
【0187】(ステップ−1−2−d−2−d−a);
知識構造要素集合KS_5をユーザまたはシステム管理
者が定め、KS_5に含まれる知識構造要素のみトポロ
ジーをチェックする。
【0188】(ステップ−1−2−d−2−d−b);
階層化概念項目集合SC_1をユーザまたはシステム管
理者が定め、SC_1に対応付けされる知識構造要素の
みトポロジーをチェックする。
【0189】(ステップ−1−2−d−2−d−c);
集合KS_4(ks_i)からks_iに関してn近傍
となる部分集合KS_6(ks_i,n)を取得する。
KS_6に含まれる知識構造要素のみトポロジーをチェ
ックする。nはユーザまたはシステム既定値で指定され
るとする。
【0190】(ステップ−1−2−d−2−e);上述
の(ステップ−1−2−d−2−c)または(ステップ
−1−2−d−2−d)と同様の定義であるが、近傍設
定定数nを次の(ステップ−1−2−d−2−e−*)
のいずれかの方法で算出する。
【0191】(ステップ−1−2−d−2−e−a);
知識構造要素ks_iが関係対象型である場合はn_n
を、関係型である場合はn_rをnに設定する。定数n
_nとn_rはユーザまたはシステム既定値で指定され
るとする。
【0192】(ステップ−1−2−d−2−e−b);
ユーザまたはシステム既定値の指示によって全ての階層
化概念辞書項目に属性値n_iを与える。知識構造要素
ks_iに対応する階層化辞書項目の持つ属性値n_i
をnとする。
【0193】(ステップ−1−2−d−3);知識構造
からKS_4(ks_i)と類似な部分知識構造集合を
取得し、それぞれの部分知識構造でトポロジー的にks
_iに相当する知識構造要素をKS(t)に追加する。
【0194】(ステップ−1−3);論理式マッチング
部102qは、正規化された論理式でAND演算子で結
合された部分式(A AND B;AとBは部分式)を
次の(ステップ−1−3−*)の手順で処理し検索結果
として知識構造要素集合KS_andを得る。
【0195】(ステップ−1−3−1);部分式Aの条
件に合う知識構造要素集合をKS_a、部分式Bに合う
集合をKS_bとする。
【0196】(ステップ−1−3−2);集合KS_a
の全要素と集合KS_bの全要素の組合せについて次の
(ステップ−1−3−2−*)の手順で処理する。
【0197】(ステップ−1−3−2−1);集合KS
_aの要素をksa_iとし、集合KS_bの要素をk
sb_jとする。
【0198】(ステップ−1−3−2−2);要素ks
a_iの属する文献と要素ksb_jの属する文献が同
一である場合、中間結果集合KS_interimに要
素(ksa_i,ksb_j)を追加する。
【0199】(ステップ−1−3−3);中間結果集合
KS_interimの全要素について、次の(ステッ
プ−1−3−3−*)のいずれかの手順またはそれらの
組み合わせでさらに条件を絞り込む。例えば、<a>
AND <b>という論理構造の検索質問を処理する場
合、部分式<a>にヒットする知識構造要素と部分式<
b>にヒットする知識構造要素が次のような条件を満た
す場合のみ、条件を満たすよう定義を変更することがで
きる。 − 同一文章に属する − 特定パターンの文章に属する − 特定パターンのグラフ構造に属する − グラフ構造上指定距離内に位置する
【0200】(ステップ−1−3−3−a);集合KS
_interimの要素ksi(ksa_i,ksb_
j)において、知識構造要素ksa_iとksb_jが
次の(ステップ−1−3−3−a−*)のいずれかまた
はその組み合わせの条件を満たす同一文に属する場合の
みその要素を集合KS_interimに残す。
【0201】(ステップ−1−3−3−a−a);ユー
ザまたはシステム既定値として指定された文集合に属す
る文。
【0202】(ステップ−1−3−3−a−b);ユー
ザまたはシステム既定値として指定された構造検索式に
ヒットする文。
【0203】(ステップ−1−3−3−b);集合KS
_interimの要素ksi(ksa_i,ksb_
j)において、知識構造要素ksa_iとksb_jが
次の(ステップ−1−3−3−b−*)のいずれかの条
件を満たす連続グラフに属する場合のみその要素を集合
KS_interimに残す。
【0204】(ステップ−1−3−3−b−a);知識
構造全体でみて連続であるグラフ。
【0205】(ステップ−1−3−3−b−b);一文
献内で連続であるグラフ。
【0206】(ステップ−1−3−3−b−c);ユー
ザまたはシステム既定値として指定された構造検索式に
ヒットする、(ステップ−1−3−3−b−a)または
(ステップ−1−3−3−b−b)のグラフ。
【0207】(ステップ−1−3−3−b−d);グラ
フ条件(ステップ−1−3−3−b−c)を満たし、知
識構造要素ksa_iとksb_jが構造検索式に含ま
れるグラフ。
【0208】(ステップ−1−3−3−c);前提条件
(P−2)が満たされているとする。集合KS_int
erimの要素ksi(ksa_i,ksb_j)にお
いて、知識構造要素ksa_iとksb_jが次の(ス
テップ−1−3−3−c−*)のいずれかの条件を満た
す関係にある場合のみその要素を集合KS_inter
imに残す。
【0209】(ステップ−1−3−3−c−a);知識
構造要素ksa_iに対応する階層化概念辞書項目をh
c_i、要素ksb_jに対応する項目をhc_jとす
る。階層化概念辞書の階層構造において、項目hc_i
とhc_jの共通の親となる項目をhc_pとする。ユ
ーザまたはシステム既定値として指定した階層化概念辞
書項目集合に項目hc_pが属する場合、条件を満たす
とする。ここで、図8に(ステップ−1−3−3−c−
a)の処理の概念を示す。
【0210】(ステップ−1−3−3−c−b);上述
した(ステップ−1−3−3−a)と同様の方法である
が、同一文ではなく、次に示す知識構造要素集合群GK
S(ksa_i)またはGKS(ksb_j)のいずれ
かの要素にksa_iとksb_jが同時に属する場
合、条件を満たすとする。知識構造要素集合群GKS
(ks)は次の(ステップ−1−3−3−c−b−*)
の処理で生成する。ここで、図9に(ステップ−1−3
−3−c−b)の処理の概念を示す。
【0211】(ステップ−1−3−3−c−b−1);
知識構造要素ksと同一の文に属する全ての知識構造要
素を知識構造要素集合KS_sameとし、知識構造要
素集合群GKS={KS_same}とする。
【0212】(ステップ−1−3−3−c−b−2);
知識構造要素集合KS_sameの各要素ks_iにつ
いて、次の処理(ステップ−1−3−3−c−b−2−
*)を行う。
【0213】(ステップ−1−3−3−c−b−2−
1);知識構造要素ks_iに対応する階層化概念辞書
項目をhc_iとする。
【0214】(ステップ−1−3−3−c−b−2−
2);階層化概念辞書項目hc_iに対応する全ての知
識構造要素をKS(hc_i)とする。
【0215】(ステップ−1−3−3−c−b−2−
3);知識構造要素集合KS(hc_i)の各要素ks
_jについて、次の処理(ステップ−1−3−3−c−
b−2−3−*)を行う。
【0216】(ステップ−1−3−3−c−b−2−3
−1);知識構造要素集合KS_sameにおいて、知
識構造要素ks_iをks_jで置き換えた集合をKS
_same’とする。
【0217】(ステップ−1−3−3−c−b−2−3
−2);知識構造要素集合KS_same’を知識構造
要素集合群GKSに追加する。
【0218】(ステップ−1−3−3−c−c);手順
(ステップ−1−3−3−b)において、各連続グラフ
(知識構造要素)から手順(ステップ−1−3−3−c
−b)と同様の方法で知識構造要素集合群を取得し、集
合群GKS(ksa_i)またはGKS(ksb_j)
のいずれかの要素にksa_iとksb_jが同時に属
する場合、条件を満たすとする。
【0219】(ステップ−1−3−3−c−d);条件
(ステップ−1−3−3−c−b)または(ステップ−
1−3−3−c−c)における構造検索式に、知識構造
要素ksa_iまたは/かつksb_jが入り、それら
の要素の位置を参照する距離パラメタn_1,n_
2,...が指定されているとする。ユーザまたはシス
テム既定値として指定した階層化概念辞書項目組から距
離パラメタ群n_1,n_2,...への対応関係によ
りパラメタ値を決定した構造検索式で条件判定を行う。
【0220】(ステップ−1−4);論理式マッチング
部102qは、OR条件とNOT条件の論理式について
一般的な情報処理手法を用いて処理し、最終結果集合K
S_rを得る。
【0221】(ステップ−1−5);結果変換部102
rは、必要に応じて適切な結果に変換して検索結果とす
る。変換しない場合は知識構造集合を検索結果とする。
【0222】(ステップ−1−5−a);前提条件(P
−1)または(P−3)が満たされている場合、文献ま
たは(かつ)ヒット部分を検索結果とする。
【0223】(ステップ−1−5−b);前提条件(P
−2)または(P−3)が満たされている場合、概念項
目を検索結果とする。そして、結果画面作成部102w
は、検索結果を集計して結果画面を作成して出力装置1
14に出力する。これにより、検索質問の種類が一連の
語またはそれらが論理結合された式の場合の処理を終了
する。
【0224】[ステップ−2;検索質問の種類が自然言
語の文章の場合の処理]図13は、本実施形態におけ
る、検索質問の種類が自然言語の文章の場合の処理の一
例を示すフローチャートである。この場合は図13に示
すように、次の(ステップ−2−*)の手順の検索処理
を行う。
【0225】(ステップ−2);まず、ユーザが検索質
問を入力する。
【0226】(ステップ−2−1);構文構造生成部1
02sは、既存の公開技術を用いて、検索質問として入
力された文章から構文構造を生成する。
【0227】(ステップ−2−2);文献知識化部10
2tは、上述した(ステップ−2−1)で生成した構文
構造から知識構造KS_qを生成する。例えば、上述し
た文献知識の自動生成方法を用いる。
【0228】(ステップ−2−3);連結グラフ類似性
判定部102uは、検索質問から変換した知識構造KS
_q中の各連結グラフg_kについて、既述の手順(ス
テップ−1−2−d−2)と同様に連結グラフの類似性
を判定し、それぞれ類似連結グラフ集合CG(g_k)
を得る。
【0229】(ステップ−2−4);グラフ統合部10
2vは、次の(ステップ−2−4−*)のいずれかまた
はそれらを組合せた手順で上記各集合CG(g_k)を
統合処理し、最終結果となる知識構造要素集合KS_r
を得る。
【0230】(ステップ−2−4−a);各知識構造要
素集合CG(g_k)の和集合をKS_rとする。
【0231】(ステップ−2−4−b);各知識構造要
素集合CG(g_k)のAND操作の結果をKS_rと
する。ここでAND操作は既述手順(ステップ−1−
3)と同様に行うものとする。
【0232】(ステップ−2−5);結果変換部102
rは、手順(ステップ−1−5)を処理し適切な検索結
果を得る。そして、結果画面作成部102wは、検索結
果を集計して結果画面を作成して出力装置114に出力
する。これにて、検索処理が終了する。
【0233】[実施例]次に、このように構成された本
システムの実施例の処理の一例について、以下に図10
および図11を参照して詳細に説明する。図10および
図11は、本実施例における本システムの文献知識管理
処理の一例を示すフローチャートである。
【0234】本実施例では、検索質問(クエリー)とし
て「AVB」(A、Bは、タンパク質名、Vは動詞の英
単語とする。)を用いた場合を用いて、上述した文献知
識管理装置100による検索処理(上述したステップ−
1からステップ−1−3−3−c−bまで)の一例を説
明している。その結果として知識構造要素の集合KS_
and(A,V,B)を取得している。
【0235】[他の実施の形態]さて、これまで本発明
の実施の形態について説明したが、本発明は、上述した
実施の形態以外にも、上記特許請求の範囲に記載した技
術的思想の範囲内において種々の異なる実施の形態にて
実施されてよいものである。
【0236】例えば、文献知識管理装置100がスタン
ドアローンの形態で方法を行う場合を一例に説明した
が、文献知識管理装置100とは別筐体で構成されるク
ライアント端末からの要求に応じて処理を行い、その処
理結果を当該クライアント端末に返却するように構成し
てもよい。
【0237】また、実施形態において説明した各処理の
うち、自動的に行なわれるものとして説明した処理の全
部または一部を手動的に行うこともでき、あるいは、手
動的に行なわれるものとして説明した処理の全部または
一部を公知の方法で自動的に行うこともできる。この
他、上記文献中や図面中で示した処理手順、制御手順、
具体的名称、各種の登録データや検索条件等のパラメタ
を含む情報、画面例、データベース構成については、特
記する場合を除いて任意に変更することができる。
【0238】また、文献知識管理装置100に関して、
図示の各構成要素は機能概念的なものであり、必ずしも
物理的に図示の如く構成されていることを要しない。
【0239】例えば、文献知識管理装置100の各サー
バが備える処理機能、特に制御部102にて行なわれる
各処理機能については、その全部または任意の一部を、
CPU(Central Processing Un
it)および当該CPUにて解釈実行されるプログラム
にて実現することができ、あるいは、ワイヤードロジッ
クによるハードウェアとして実現することも可能であ
る。なお、プログラムは、後述する記録媒体に記録され
ており、必要に応じて文献知識管理装置100に機械的
に読み取られる。すなわち、ROMまたはHDには、O
S(Operating System)と協働してC
PUに命令を与え、各種処理を行うためのコンピュータ
プログラムが記録されている。このコンピュータプログ
ラムは、RAMにロードされることによって実行され、
CPUと協働して制御部を構成する。
【0240】しかしながら、このコンピュータプログラ
ムは、外部システム200に対して任意のネットワーク
を介して接続されたアプリケーションプログラムサーバ
に記録されてもよく、必要に応じてその全部または一部
をダウンロードすることも可能である。このあるいは、
各制御部の全部または任意の一部を、ワイヤードロジッ
ク等によるハードウェアとして実現することも可能であ
る。
【0241】また、本発明にかかるプログラムを、コン
ピュータ読み取り可能な記録媒体に格納することもでき
る。ここで、この「記録媒体」とは、フレキシブルディ
スク、光磁気ディスク、ROM、EPROM、EEPR
OM、CD−ROM、MO、DVD等の任意の「可搬用
の物理媒体」や、各種コンピュータシステムに内蔵され
るROM、RAM、HD等の任意の「固定用の物理媒
体」、あるいは、LAN、WAN、インターネットに代
表されるネットワークを介してプログラムを送信する場
合の通信回線や搬送波のように、短期にプログラムを保
持する「通信媒体」を含むものとする。
【0242】また、「プログラム」とは、任意の言語や
記述方法にて記述されたデータ処理方法であり、ソース
コードやバイナリコード等の形式を問わない。なお、
「プログラム」は必ずしも単一的に構成されるものに限
られず、複数のモジュールやライブラリとして分散構成
されるものや、OS(Operating Syste
m)に代表される別個のプログラムと協働してその機能
を達成するものをも含む。なお、実施の形態に示した各
装置において記録媒体を読み取るための具体的な構成、
読み取り手順、あるいは、読み取り後のインストール手
順等については、周知の構成や手順を用いることができ
る。
【0243】記憶部106に格納される各種のデータベ
ース等(原文データベース106a〜質問知識構造デー
タベース106g)は、RAM、ROM等のメモリ装
置、ハードディスク等の固定ディスク装置、フレキシブ
ルディスク、光ディスク等のストレージ手段であり、各
種処理やウェブサイト提供に用いる各種のプログラムや
テーブルやファイルやデータベースやウェブページ用フ
ァイル等を格納する。
【0244】また、文献知識管理装置100は、既知の
パーソナルコンピュータ、ワークステーション等の情報
処理端末等の情報処理装置にプリンタやモニタやイメー
ジスキャナ等の周辺装置を接続し、該情報処理装置に本
発明の方法を実現させるソフトウェア(プログラム、デ
ータ等を含む)を実装することにより実現してもよい。
【0245】さらに、文献知識管理装置100の分散・
統合の具体的形態は図示のものに限られず、その全部ま
たは一部を、各種の負荷等に応じた任意の単位で、機能
的または物理的に分散・統合して構成することができ
る。例えば、各データベースを独立したデータベース装
置として独立に構成してもよく、また、処理の一部をC
GI(Common Gateway Interfa
ce)を用いて実現してもよい。
【0246】また、ネットワーク300は、文献知識管
理装置100と外部システム200とを相互に接続する
機能を有し、例えば、インターネットや、イントラネッ
トや、LAN(有線/無線の双方を含む)や、VAN
や、パソコン通信網や、公衆電話網(アナログ/デジタ
ルの双方を含む)や、専用回線網(アナログ/デジタル
の双方を含む)や、CATV網や、IMT2000方
式、GSM方式またはPDC/PDC―P方式等の携帯
回線交換網/携帯パケット交換網や、無線呼出網や、B
luetooth等の局所無線網や、PHS網や、C
S、BSまたはISDB等の衛星通信網等のうちいずれ
かを含んでもよい。すなわち、本システムは、有線・無
線を問わず任意のネットワークを介して、各種データを
送受信することができる。
【0247】
【発明の効果】以上詳細に説明したように、本発明によ
れば、文献の原文を一つまたは複数の単語から構成され
る知識に分割して管理し、原文の各知識に基づいて、関
係知識構造要素および関係対象知識構造要素から構成さ
れる知識構造を生成して管理し、関係付けられた知識の
概念を階層的に定義する概念項目から構成される概念辞
書を管理するので、知識構造で各知識構造要素が概念項
目にリンクなどにより関連付けを持つことで、機械的な
知識構造要素の同等性判定が可能になる文献知識管理装
置、文献知識管理方法、プログラム、および、記録媒体
を提供することができる。
【0248】これにより、原文で異なる語によって表現
された知識構造要素であっても、概念的に同一であれば
計算機で同一であるとして処理することができる文献知
識管理装置、文献知識管理方法、プログラム、および、
記録媒体を提供することができる。
【0249】また、知識構造で各知識構造要素が原文に
リンクなどにより関連付けを持つことで、知識と原文と
の対応付けが容易にできる文献知識管理装置、文献知識
管理方法、プログラム、および、記録媒体を提供するこ
とができる。
【0250】また、階層化概念辞書の全概念項目へのリ
ンクがいずれかの知識構造要素から張られることによ
り、各概念項目は知識構造要素を介して原文事例を持つ
ことができる文献知識管理装置、文献知識管理方法、プ
ログラム、および、記録媒体を提供することができる。
【0251】また、本発明によれば、入力された検索質
問に含まれる単語について、管理された知識構造からマ
ッチングする関係知識構造要素および/または関係対象
知識構造要素を検索するので、検索質問に完全一致また
は部分一致する知識を抽出することができる文献知識管
理装置、文献知識管理方法、プログラム、および、記録
媒体を提供することができる。
【0252】これにより、原文をサーチする場合に比べ
て格段に速くかつ漏れなく検索を実行することができる
文献知識管理装置、文献知識管理方法、プログラム、お
よび、記録媒体を提供することができる。
【0253】また、本発明によれば、検索結果の関係知
識構造要素および/または関係対象知識構造要素に対し
て、(1)予め定めた同義関係を意味する関係知識構造
要素で連結された関係対象知識構造要素、(2)同一の
連結グラフに属する関係知識構造要素および/または関
係対象知識構造要素、(3)同一の連結グラフに属し、
かつ、要素間のパス数が予め定めた数よりも少ない関係
知識構造要素および/または関係対象知識構造要素、
(4)同一の連結グラフに属し、かつ、要素の型が同一
である関係知識構造要素および/または関係対象知識構
造要素、のうち少なくとも一つを検索するので、効率的
に同義語検索を実行することができるようになり、検索
の精度を下げることなく再現率を飛躍的に向上させるこ
とができる文献知識管理装置、文献知識管理方法、プロ
グラム、および、記録媒体を提供することができる。
【0254】また、本発明によれば、検索結果の関係知
識構造要素および/または関係対象知識構造要素に対し
て、概念辞書管理手段にて管理された概念辞書から対応
する概念項目、および/または、当該概念項目の上位お
よび/または下位の概念項目を抽出し、これらの概念項
目に関連付けられている関係知識構造要素および/また
は関係対象知識構造要素を抽出するので、概念項目によ
り検索結果の絞込みを行うことができるようになり、検
索の精度を飛躍的に向上させることができる文献知識管
理装置、文献知識管理方法、プログラム、および、記録
媒体を提供することができる。
【0255】また、本発明によれば、検索結果の関係知
識構造要素および/または関係対象知識構造要素に対し
て、同一の連結グラフとなる関係知識構造要素および/
または関係対象知識構造要素であって、(1)トポロジ
ーが同一である関係知識構造要素および/または関係対
象知識構造要素、(2)概念辞書管理手段にて管理され
た概念辞書の中から対応する概念項目、および/また
は、当該概念項目の上位および/または下位の概念項目
を抽出し、これらの概念項目に関連付けられている関係
知識構造要素および/または関係対象知識構造要素、
(3)要素間のパス数が予め定めた数よりも少ない関係
知識構造要素および/または関係対象知識構造要素、の
うち少なくとも一つを検索するので、同一の連結グラフ
にある知識構造要素のうち概念項目などにより検索結果
の絞込みを行うことができるようになり、検索の精度を
飛躍的に向上させることができる文献知識管理装置、文
献知識管理方法、プログラム、および、記録媒体を提供
することができる。
【0256】また、本発明によれば、検索質問を予め定
めた論理式の形式に正規化するので、入力された検索質
問の論理式のフォーマットを一定化することができ、そ
の後の処理の効率化を図ることができる文献知識管理装
置、文献知識管理方法、プログラム、および、記録媒体
を提供することができる。
【0257】また、本発明によれば、検索質問の論理式
の部分式について知識構造要素集合を取得し、部分式同
士の論理積を求めるために当該知識構造要素集合の全要
素の組み合わせについて、(1)同一の文献にある、
(2)予め定めた文集合に属する文にある、(3)予め
定めた構造検索式に合致する文にある、(4)知識構造
全体でみて連続である知識構造である、(5)一つの文
献内で連続である知識構造である、(6)管理された概
念辞書から対応する概念項目、および/または、当該概
念項目の上位および/または下位の概念項目を抽出し、
これらの概念項目に関連付けられている、のうち少なく
とも一つであるものを検索するので、部分式のAND条
件を求めるときに、文献、グラフ構造、概念項目などに
より検索結果の絞込みを行うことができるようになり、
検索の精度を飛躍的に向上させることができる文献知識
管理装置、文献知識管理方法、プログラム、および、記
録媒体を提供することができる。
【0258】また、本発明によれば、自然言語で入力さ
れた検索質問から構文構造を生成するので、自然言語検
索にも対応することができる文献知識管理装置、文献知
識管理方法、プログラム、および、記録媒体を提供する
ことができる。
【0259】また、本発明によれば、作成された構文構
造から知識構造を生成するので、知識構造同士の類似性
を検索することなどが可能になり、また、単語をサーチ
する場合に比べて格段に速くかつ漏れなく検索を実行す
ることができる文献知識管理装置、文献知識管理方法、
プログラム、および、記録媒体を提供することができ
る。
【0260】また、本発明によれば、生成した知識構造
における各連結グラフについて類似性を判定し、類似連
結グラフの集合を取得し、取得した各類似連結グラフの
和集合をとる、または、各類似連結グラフの組み合わせ
について論理積をとることにより類似連結グラフを統合
するので、知識検索結果をまとめる処理を漏れなくかつ
高速に行うことができる文献知識管理装置、文献知識管
理方法、プログラム、および、記録媒体を提供すること
ができる。
【0261】さらに、本発明によれば、検索結果に対応
する、関係知識構造要素、関係対象知識構造要素、文
献、概念項目のうち少なくとも一つを予め定めたフォー
マットに変換して検索結果を作成するので、検索結果に
ついて任意の適切なフォーマットで出力することができ
る文献知識管理装置、文献知識管理方法、プログラム、
および、記録媒体を提供することができる。
【図面の簡単な説明】
【図1】本発明の基本原理を示す原理構成図である。
【図2】文献知識管理装置100のモニタに表示され
る、原文操作画面、知識構造操作画面および概念辞書操
作画面を同時に表示した画面の一例を示す図である。
【図3】本発明の処理概要を示す概念図である。
【図4】本発明が適用される本システムの構成の一例を
示すブロック図である。
【図5】原文データベース106aに格納される情報の
一例を示す図である。
【図6】知識構造データベース106bに格納される情
報の一例を示す図である。
【図7】概念辞書データベース106cに格納される情
報の一例を示す図である。
【図8】(ステップ−1−3−3−c−a)の処理の概
念を示す図である。
【図9】(ステップ−1−3−3−c−b)の処理の概
念を示す図である。
【図10】本実施例における本システムの文献知識管理
処理の一例を示すフローチャートである。
【図11】本実施例における本システムの文献知識管理
処理の一例を示すフローチャートである。
【図12】本実施形態における、検索質問の種類が一連
の語またはそれらが論理結合された式の場合の処理の一
例を示すフローチャートである。
【図13】本実施形態における、検索質問の種類が自然
言語の文章の場合の処理の一例を示すフローチャートで
ある。
【符号の説明】
100 文献知識管理装置 102 制御部 102a 原文管理部 102b 知識構造管理部 102c 概念辞書管理部 102d 原文操作画面作成部 102e 知識構造操作画面作成部 102f 概念辞書操作画面作成部 102g 文献知識自動編集部 102h 操作画面連携部 102i 共有カーソル管理部 102j 固有カーソル管理部 102k 知識蓄積部 102m 検索処理部 102n 論理式正規化部 102p 単語マッチング部 102q 論理式マッチング部 102r 結果変換部 102s 構文構造生成部 102t 文献知識化部 102u 連結グラフ類似性判定部 102v グラフ統合部 102w 結果画面作成部 104 通信制御インターフェース部 106 記憶部 106a 原文データベース 106b 知識構造データベース 106c 概念辞書データベース 106d 原文操作画面データ 106e 知識構造操作画面データ 106f 概念辞書操作画面データ 106g 質問知識構造データベース 108 入出力制御インターフェース部 112 入力装置 114 出力装置 200 外部システム 300 ネットワーク
フロントページの続き (72)発明者 土居 洋文 千葉県千葉市美浜区中瀬1丁目3番地 幕 張テクノガーデンD17 セレスター・レキ シコ・サイエンシズ株式会社内 (72)発明者 菊地 康裕 千葉県千葉市美浜区中瀬1丁目3番地 幕 張テクノガーデンD17 セレスター・レキ シコ・サイエンシズ株式会社内 (72)発明者 蓬莱 尚幸 千葉県千葉市美浜区中瀬1丁目3番地 幕 張テクノガーデンD17 セレスター・レキ シコ・サイエンシズ株式会社内 Fターム(参考) 5B075 ND20 ND34 NK32 NK35 UU40

Claims (31)

    【特許請求の範囲】
  1. 【請求項1】 文献の原文を一つまたは複数の単語から
    構成される知識に分割して管理する原文管理手段と、 上記原文の各知識に基づいて、関係知識構造要素および
    関係対象知識構造要素から構成される知識構造を生成し
    て管理する知識構造管理手段と、 関係付けられた上記知識の概念を階層的に定義する概念
    項目から構成される概念辞書を管理する概念辞書管理手
    段と、 入力された検索質問に含まれる単語について、上記知識
    構造管理手段により管理された上記知識構造からマッチ
    ングする上記関係知識構造要素および/または上記関係
    対象知識構造要素を検索する単語マッチング手段と、 を備えたことを特徴とする文献知識管理装置。
  2. 【請求項2】 上記単語マッチング手段は、検索結果の
    上記関係知識構造要素および/または上記関係対象知識
    構造要素に対して、 (1)予め定めた同義関係を意味する上記関係知識構造
    要素で連結された関係対象知識構造要素、 (2)同一の連結グラフに属する上記関係知識構造要素
    および/または上記関係対象知識構造要素、 (3)同一の連結グラフに属し、かつ、要素間のパス数
    が予め定めた数よりも少ない上記関係知識構造要素およ
    び/または上記関係対象知識構造要素、 (4)同一の連結グラフに属し、かつ、要素の型が同一
    である上記関係知識構造要素および/または上記関係対
    象知識構造要素、 のうち少なくとも一つを検索すること、 を特徴とする請求項1に記載の文献知識管理装置。
  3. 【請求項3】 上記単語マッチング手段は、検索結果の
    上記関係知識構造要素および/または上記関係対象知識
    構造要素に対して、上記概念辞書管理手段にて管理され
    た上記概念辞書から対応する上記概念項目、および/ま
    たは、当該概念項目の上位および/または下位の上記概
    念項目を抽出し、これらの上記概念項目に関連付けられ
    ている上記関係知識構造要素および/または上記関係対
    象知識構造要素を抽出すること、 を特徴とする請求項1または2に記載の文献知識管理装
    置。
  4. 【請求項4】 上記単語マッチング手段は、検索結果の
    上記関係知識構造要素および/または上記関係対象知識
    構造要素に対して、連結グラフとなる上記関係知識構造
    要素および/または上記関係対象知識構造要素であっ
    て、 (1)トポロジーが同一である上記関係知識構造要素お
    よび/または上記関係対象知識構造要素、 (2)上記概念辞書管理手段にて管理された上記概念辞
    書の中から対応する上記概念項目、および/または、当
    該概念項目の上位および/または下位の上記概念項目を
    抽出し、これらの上記概念項目に関連付けられている上
    記関係知識構造要素および/または上記関係対象知識構
    造要素、 (3)要素間のパス数が予め定めた数よりも少ない上記
    関係知識構造要素および/または上記関係対象知識構造
    要素、 のうち少なくとも一つを検索すること、 を特徴とする請求項1から3のいずれか一つに記載の文
    献知識管理装置。
  5. 【請求項5】 上記検索質問を予め定めた論理式の形式
    に正規化する論理式正規化手段、 をさらに備えたことを特徴とする請求項1から4のいず
    れか一つに記載の文献知識管理装置。
  6. 【請求項6】 上記検索質問の論理式の部分式について
    知識構造要素集合を取得し、部分式同士の論理積を求め
    るために当該知識構造要素集合の全要素の組み合わせに
    ついて、 (1)同一の文献にある、 (2)予め定めた文集合に属する文にある、 (3)予め定めた構造検索式に合致する文にある、 (4)知識構造全体でみて連続である知識構造である、 (5)一つの文献内で連続である知識構造である、 (6)上記概念辞書管理手段にて管理された上記概念辞
    書から対応する上記概念項目、および/または、当該概
    念項目の上位および/または下位の上記概念項目を抽出
    し、これらの上記概念項目に関連付けられている、 のうち少なくとも一つであるものを検索する論理式マッ
    チング手段、 をさらに備えたことを特徴とする請求項1から5のいず
    れか一つに記載の文献知識管理装置。
  7. 【請求項7】 自然言語で入力された上記検索質問から
    構文構造を生成する構文構造生成手段、 をさらに備えたことを特徴とする請求項1から6のいず
    れか一つに記載の文献知識管理装置。
  8. 【請求項8】 上記構文構造生成手段にて作成された上
    記構文構造から知識構造を生成する文献知識化手段、 をさらに備えたことを特徴とする請求項7に記載の文献
    知識管理装置。
  9. 【請求項9】 上記文献知識化手段にて生成した上記知
    識構造における各連結グラフについて類似性を判定し、
    類似連結グラフの集合を取得する連結グラフ類似性判定
    手段と、 上記連結グラフ類似性判定手段にて取得した各類似連結
    グラフの和集合をとる、または、各類似連結グラフの組
    み合わせについて論理積をとることにより類似連結グラ
    フを統合するグラフ統合手段と、 をさらに備えたことを特徴とする請求項8に記載の文献
    知識管理装置。
  10. 【請求項10】 検索結果に対応する、上記関係知識構
    造要素、上記関係対象知識構造要素、上記文献、上記概
    念項目のうち少なくとも一つを予め定めたフォーマット
    に変換して検索結果を作成する結果変換手段、 をさらに備えたことを特徴とする請求項1から9のいず
    れか一つに記載の文献知識管理装置。
  11. 【請求項11】 文献の原文を一つまたは複数の単語か
    ら構成される知識に分割して管理する原文管理ステップ
    と、 上記原文の各知識に基づいて、関係知識構造要素および
    関係対象知識構造要素から構成される知識構造を生成し
    て管理する知識構造管理ステップと、 関係付けられた上記知識の概念を階層的に定義する概念
    項目から構成される概念辞書を管理する概念辞書管理ス
    テップと、 入力された検索質問に含まれる単語について、上記知識
    構造管理ステップにより管理された上記知識構造からマ
    ッチングする上記関係知識構造要素および/または上記
    関係対象知識構造要素を検索する単語マッチングステッ
    プと、 を含むことを特徴とする文献知識管理方法。
  12. 【請求項12】 上記単語マッチングステップは、検索
    結果の上記関係知識構造要素および/または上記関係対
    象知識構造要素に対して、 (1)予め定めた同義関係を意味する上記関係知識構造
    要素で連結された関係対象知識構造要素、 (2)同一の連結グラフに属する上記関係知識構造要素
    および/または上記関係対象知識構造要素、 (3)同一の連結グラフに属し、かつ、要素間のパス数
    が予め定めた数よりも少ない上記関係知識構造要素およ
    び/または上記関係対象知識構造要素、 (4)同一の連結グラフに属し、かつ、要素の型が同一
    である上記関係知識構造要素および/または上記関係対
    象知識構造要素、 のうち少なくとも一つを検索すること、 を特徴とする請求項11に記載の文献知識管理方法。
  13. 【請求項13】 上記単語マッチングステップは、検索
    結果の上記関係知識構造要素および/または上記関係対
    象知識構造要素に対して、上記概念辞書管理ステップに
    て管理された上記概念辞書から対応する上記概念項目、
    および/または、当該概念項目の上位および/または下
    位の上記概念項目を抽出し、これらの上記概念項目に関
    連付けられている上記関係知識構造要素および/または
    上記関係対象知識構造要素を抽出すること、 を特徴とする請求項11または12に記載の文献知識管
    理方法。
  14. 【請求項14】 上記単語マッチングステップは、検索
    結果の上記関係知識構造要素および/または上記関係対
    象知識構造要素に対して、連結グラフとなる上記関係知
    識構造要素および/または上記関係対象知識構造要素で
    あって、 (1)トポロジーが同一である上記関係知識構造要素お
    よび/または上記関係対象知識構造要素、 (2)上記概念辞書管理ステップにて管理された上記概
    念辞書の中から対応する上記概念項目、および/また
    は、当該概念項目の上位および/または下位の上記概念
    項目を抽出し、これらの上記概念項目に関連付けられて
    いる上記関係知識構造要素および/または上記関係対象
    知識構造要素、 (3)要素間のパス数が予め定めた数よりも少ない上記
    関係知識構造要素および/または上記関係対象知識構造
    要素、 のうち少なくとも一つを検索すること、 を特徴とする請求項11から13のいずれか一つに記載
    の文献知識管理方法。
  15. 【請求項15】 上記検索質問を予め定めた論理式の形
    式に正規化する論理式正規化ステップ、 をさらに含むことを特徴とする請求項11から14のい
    ずれか一つに記載の文献知識管理方法。
  16. 【請求項16】 上記検索質問の論理式の部分式につい
    て知識構造要素集合を取得し、部分式同士の論理積を求
    めるために当該知識構造要素集合の全要素の組み合わせ
    について、 (1)同一の文献にある、 (2)予め定めた文集合に属する文にある、 (3)予め定めた構造検索式に合致する文にある、 (4)知識構造全体でみて連続である知識構造である、 (5)一つの文献内で連続である知識構造である、 (6)上記概念辞書管理ステップにて管理された上記概
    念辞書から対応する上記概念項目、および/または、当
    該概念項目の上位および/または下位の上記概念項目を
    抽出し、これらの上記概念項目に関連付けられている、 のうち少なくとも一つであるものを検索する論理式マッ
    チングステップ、 をさらに含むことを特徴とする請求項11から15のい
    ずれか一つに記載の文献知識管理方法。
  17. 【請求項17】 自然言語で入力された上記検索質問か
    ら構文構造を生成する構文構造生成ステップ、 をさらに含むことを特徴とする請求項11から16のい
    ずれか一つに記載の文献知識管理方法。
  18. 【請求項18】 上記構文構造生成ステップにて作成さ
    れた上記構文構造から知識構造を生成する文献知識化ス
    テップ、 をさらに含むことを特徴とする請求項17に記載の文献
    知識管理方法。
  19. 【請求項19】 上記文献知識化ステップにて生成した
    上記知識構造における各連結グラフについて類似性を判
    定し、類似連結グラフの集合を取得する連結グラフ類似
    性判定ステップと、 上記連結グラフ類似性判定ステップにて取得した各類似
    連結グラフの和集合をとる、または、各類似連結グラフ
    の組み合わせについて論理積をとることにより類似連結
    グラフを統合するグラフ統合ステップと、 をさらに含むことを特徴とする請求項18に記載の文献
    知識管理方法。
  20. 【請求項20】 検索結果に対応する、上記関係知識構
    造要素、上記関係対象知識構造要素、上記文献、上記概
    念項目のうち少なくとも一つを予め定めたフォーマット
    に変換して検索結果を作成する結果変換ステップ、 をさらに含むことを特徴とする請求項11から19のい
    ずれか一つに記載の文献知識管理方法。
  21. 【請求項21】 文献の原文を一つまたは複数の単語か
    ら構成される知識に分割して管理する原文管理ステップ
    と、 上記原文の各知識に基づいて、関係知識構造要素および
    関係対象知識構造要素から構成される知識構造を生成し
    て管理する知識構造管理ステップと、 関係付けられた上記知識の概念を階層的に定義する概念
    項目から構成される概念辞書を管理する概念辞書管理ス
    テップと、 入力された検索質問に含まれる単語について、上記知識
    構造管理ステップにより管理された上記知識構造からマ
    ッチングする上記関係知識構造要素および/または上記
    関係対象知識構造要素を検索する単語マッチングステッ
    プと、 を含む文献知識管理方法をコンピュータに実行させるこ
    とを特徴とするプログラム。
  22. 【請求項22】 上記単語マッチングステップは、検索
    結果の上記関係知識構造要素および/または上記関係対
    象知識構造要素に対して、 (1)予め定めた同義関係を意味する上記関係知識構造
    要素で連結された関係対象知識構造要素、 (2)同一の連結グラフに属する上記関係知識構造要素
    および/または上記関係対象知識構造要素、 (3)同一の連結グラフに属し、かつ、要素間のパス数
    が予め定めた数よりも少ない上記関係知識構造要素およ
    び/または上記関係対象知識構造要素、 (4)同一の連結グラフに属し、かつ、要素の型が同一
    である上記関係知識構造要素および/または上記関係対
    象知識構造要素、 のうち少なくとも一つを検索すること、 を特徴とする請求項21に記載のプログラム。
  23. 【請求項23】 上記単語マッチングステップは、検索
    結果の上記関係知識構造要素および/または上記関係対
    象知識構造要素に対して、上記概念辞書管理ステップに
    て管理された上記概念辞書から対応する上記概念項目、
    および/または、当該概念項目の上位および/または下
    位の上記概念項目を抽出し、これらの上記概念項目に関
    連付けられている上記関係知識構造要素および/または
    上記関係対象知識構造要素を抽出すること、 を特徴とする請求項21または22に記載のプログラ
    ム。
  24. 【請求項24】 上記単語マッチングステップは、検索
    結果の上記関係知識構造要素および/または上記関係対
    象知識構造要素に対して、連結グラフとなる上記関係知
    識構造要素および/または上記関係対象知識構造要素で
    あって、 (1)トポロジーが同一である上記関係知識構造要素お
    よび/または上記関係対象知識構造要素、 (2)上記概念辞書管理ステップにて管理された上記概
    念辞書の中から対応する上記概念項目、および/また
    は、当該概念項目の上位および/または下位の上記概念
    項目を抽出し、これらの上記概念項目に関連付けられて
    いる上記関係知識構造要素および/または上記関係対象
    知識構造要素、 (3)要素間のパス数が予め定めた数よりも少ない上記
    関係知識構造要素および/または上記関係対象知識構造
    要素、 のうち少なくとも一つを検索すること、 を特徴とする請求項21から23のいずれか一つに記載
    のプログラム。
  25. 【請求項25】 上記検索質問を予め定めた論理式の形
    式に正規化する論理式正規化ステップ、 をさらに含むことを特徴とする請求項21から24のい
    ずれか一つに記載のプログラム。
  26. 【請求項26】 上記検索質問の論理式の部分式につい
    て知識構造要素集合を取得し、部分式同士の論理積を求
    めるために当該知識構造要素集合の全要素の組み合わせ
    について、 (1)同一の文献にある、 (2)予め定めた文集合に属する文にある、 (3)予め定めた構造検索式に合致する文にある、 (4)知識構造全体でみて連続である知識構造である、 (5)一つの文献内で連続である知識構造である、 (6)上記概念辞書管理ステップにて管理された上記概
    念辞書から対応する上記概念項目、および/または、当
    該概念項目の上位および/または下位の上記概念項目を
    抽出し、これらの上記概念項目に関連付けられている、 のうち少なくとも一つであるものを検索する論理式マッ
    チングステップ、 をさらに含むことを特徴とする請求項21から25のい
    ずれか一つに記載のプログラム。
  27. 【請求項27】 自然言語で入力された上記検索質問か
    ら構文構造を生成する構文構造生成ステップ、 をさらに含むことを特徴とする請求項21から26のい
    ずれか一つに記載のプログラム。
  28. 【請求項28】 上記構文構造生成ステップにて作成さ
    れた上記構文構造から知識構造を生成する文献知識化ス
    テップ、 をさらに含むことを特徴とする請求項27に記載のプロ
    グラム。
  29. 【請求項29】 上記文献知識化ステップにて生成した
    上記知識構造における各連結グラフについて類似性を判
    定し、類似連結グラフの集合を取得する連結グラフ類似
    性判定ステップと、 上記連結グラフ類似性判定ステップにて取得した各類似
    連結グラフの和集合をとる、または、各類似連結グラフ
    の組み合わせについて論理積をとることにより類似連結
    グラフを統合するグラフ統合ステップと、 をさらに含むことを特徴とする請求項28に記載のプロ
    グラム。
  30. 【請求項30】 検索結果に対応する、上記関係知識構
    造要素、上記関係対象知識構造要素、上記文献、上記概
    念項目のうち少なくとも一つを予め定めたフォーマット
    に変換して検索結果を作成する結果変換ステップ、 をさらに含むことを特徴とする請求項21から29のい
    ずれか一つに記載のプログラム。
  31. 【請求項31】 上記請求項21から30のいずれか一
    つに記載されたプログラムを記録したことを特徴とする
    コンピュータ読み取り可能な記録媒体。
JP2002027446A 2002-02-04 2002-02-04 文献知識管理装置、文献知識管理方法、プログラム、および、記録媒体 Pending JP2003228580A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2002027446A JP2003228580A (ja) 2002-02-04 2002-02-04 文献知識管理装置、文献知識管理方法、プログラム、および、記録媒体
US10/503,387 US20050154690A1 (en) 2002-02-04 2003-02-04 Document knowledge management apparatus and method
EP03705045A EP1473639A1 (en) 2002-02-04 2003-02-04 Document knowledge management apparatus and method
PCT/JP2003/001120 WO2003067471A1 (fr) 2002-02-04 2003-02-04 Appareil et procede permettant de traiter des connaissances dans des documents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002027446A JP2003228580A (ja) 2002-02-04 2002-02-04 文献知識管理装置、文献知識管理方法、プログラム、および、記録媒体

Publications (1)

Publication Number Publication Date
JP2003228580A true JP2003228580A (ja) 2003-08-15

Family

ID=27748962

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002027446A Pending JP2003228580A (ja) 2002-02-04 2002-02-04 文献知識管理装置、文献知識管理方法、プログラム、および、記録媒体

Country Status (1)

Country Link
JP (1) JP2003228580A (ja)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006313501A (ja) * 2005-05-09 2006-11-16 Nippon Telegr & Teleph Corp <Ntt> 共通クエリグラフパターン生成装置、生成方法、生成用プログラム、およびこれらを用いた共通サブグラフ検索装置、検索方法、検索用プログラム
JP2008538016A (ja) * 2004-11-12 2008-10-02 メイク センス インコーポレイテッド 概念または項目を用いて知識相関を構成することによる知識発見技術
JP2009528581A (ja) * 2005-11-14 2009-08-06 メイク センス インコーポレイテッド 知識相関サーチエンジン
JP2010503937A (ja) * 2006-09-19 2010-02-04 アルカテル−ルーセント 自然言語のテキストからオントロジを開発するための、コンピュータによって使用される方法
US8024653B2 (en) 2005-11-14 2011-09-20 Make Sence, Inc. Techniques for creating computer generated notes
US8126890B2 (en) 2004-12-21 2012-02-28 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
JP2012053625A (ja) * 2010-08-31 2012-03-15 Canon Inc 情報処理装置、情報処理方法、及びプログラム
US8140559B2 (en) 2005-06-27 2012-03-20 Make Sence, Inc. Knowledge correlation search engine
KR101139238B1 (ko) 2011-06-20 2012-05-14 유택상 아이디어 창출 지원 방법 및 시스템
JP2013054459A (ja) * 2011-09-01 2013-03-21 Fuji Xerox Co Ltd 診療情報検索装置、及びプログラム
JP2013228977A (ja) * 2012-04-24 2013-11-07 Richplaytechnology Corp 知識地図制作の方法
US8898134B2 (en) 2005-06-27 2014-11-25 Make Sence, Inc. Method for ranking resources using node pool
JP2015099497A (ja) * 2013-11-19 2015-05-28 株式会社Sbx 知識情報処理装置、知識情報処理方法、および、プログラム
WO2015107741A1 (ja) * 2014-01-15 2015-07-23 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
JP2015212926A (ja) * 2014-05-06 2015-11-26 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 検索方法及び検索装置
US9330175B2 (en) 2004-11-12 2016-05-03 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
JP2019511065A (ja) * 2016-04-07 2019-04-18 北京百度网▲訊▼科技有限公司Beijing Baidu Netcom Science And Technology Co.,Ltd. 情報検索方法及び装置
US11113607B2 (en) 2016-09-08 2021-09-07 Hitachi, Ltd. Computer and response generation method
CN114730317A (zh) * 2019-08-14 2022-07-08 株式会社谜谜克思 使用示意图的构思平台设备及方法

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9311601B2 (en) 2004-11-12 2016-04-12 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
US8108389B2 (en) 2004-11-12 2012-01-31 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
US10467297B2 (en) 2004-11-12 2019-11-05 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
US9330175B2 (en) 2004-11-12 2016-05-03 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
JP2008538016A (ja) * 2004-11-12 2008-10-02 メイク センス インコーポレイテッド 概念または項目を用いて知識相関を構成することによる知識発見技術
US8126890B2 (en) 2004-12-21 2012-02-28 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
JP2006313501A (ja) * 2005-05-09 2006-11-16 Nippon Telegr & Teleph Corp <Ntt> 共通クエリグラフパターン生成装置、生成方法、生成用プログラム、およびこれらを用いた共通サブグラフ検索装置、検索方法、検索用プログラム
JP4547300B2 (ja) * 2005-05-09 2010-09-22 日本電信電話株式会社 共通クエリグラフパターン生成装置、生成方法、生成用プログラム、およびこれらを用いた共通サブグラフ検索装置、検索方法、検索用プログラム
US8898134B2 (en) 2005-06-27 2014-11-25 Make Sence, Inc. Method for ranking resources using node pool
US9477766B2 (en) 2005-06-27 2016-10-25 Make Sence, Inc. Method for ranking resources using node pool
US8140559B2 (en) 2005-06-27 2012-03-20 Make Sence, Inc. Knowledge correlation search engine
JP4864095B2 (ja) * 2005-11-14 2012-01-25 メイク センス インコーポレイテッド 知識相関サーチエンジン
JP2009528581A (ja) * 2005-11-14 2009-08-06 メイク センス インコーポレイテッド 知識相関サーチエンジン
US9213689B2 (en) 2005-11-14 2015-12-15 Make Sence, Inc. Techniques for creating computer generated notes
US8024653B2 (en) 2005-11-14 2011-09-20 Make Sence, Inc. Techniques for creating computer generated notes
JP2010503937A (ja) * 2006-09-19 2010-02-04 アルカテル−ルーセント 自然言語のテキストからオントロジを開発するための、コンピュータによって使用される方法
JP2012053625A (ja) * 2010-08-31 2012-03-15 Canon Inc 情報処理装置、情報処理方法、及びプログラム
US9230210B2 (en) 2010-08-31 2016-01-05 Canon Kabushiki Kaisha Information processing apparatus and method for obtaining a knowledge item based on relation information and an attribute of the relation
WO2012177018A3 (en) * 2011-06-20 2013-04-04 Taek Sang Yoo Method and system for supporting creation of ideas
KR101139238B1 (ko) 2011-06-20 2012-05-14 유택상 아이디어 창출 지원 방법 및 시스템
JP2013054459A (ja) * 2011-09-01 2013-03-21 Fuji Xerox Co Ltd 診療情報検索装置、及びプログラム
JP2013228977A (ja) * 2012-04-24 2013-11-07 Richplaytechnology Corp 知識地図制作の方法
JP2015099497A (ja) * 2013-11-19 2015-05-28 株式会社Sbx 知識情報処理装置、知識情報処理方法、および、プログラム
US9965463B2 (en) 2014-01-15 2018-05-08 Sony Corporation Information processing apparatus and information processing method
WO2015107741A1 (ja) * 2014-01-15 2015-07-23 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
JP2015212926A (ja) * 2014-05-06 2015-11-26 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 検索方法及び検索装置
US10083228B2 (en) 2014-05-06 2018-09-25 Baidu Online Network Technology (Beijing) Co., Ltd. Searching method and apparatus
JP2019511065A (ja) * 2016-04-07 2019-04-18 北京百度网▲訊▼科技有限公司Beijing Baidu Netcom Science And Technology Co.,Ltd. 情報検索方法及び装置
US11113607B2 (en) 2016-09-08 2021-09-07 Hitachi, Ltd. Computer and response generation method
CN114730317A (zh) * 2019-08-14 2022-07-08 株式会社谜谜克思 使用示意图的构思平台设备及方法

Similar Documents

Publication Publication Date Title
JP2003228580A (ja) 文献知識管理装置、文献知識管理方法、プログラム、および、記録媒体
Haas et al. Clio grows up: from research prototype to industrial tool
US7739257B2 (en) Search engine
JP3213585B2 (ja) データ検索方法及び装置、データ検索システム、記録媒体
JP4141556B2 (ja) 構造化文書管理方法及びその実施装置並びにその処理プログラムを記録した媒体
WO2003067471A1 (fr) Appareil et procede permettant de traiter des connaissances dans des documents
WO2015138230A1 (en) Framework for data extraction by examples
JP2002297602A (ja) 構造化文書検索方法および構造化文書検索装置および構造化文書管理装置およびプログラムおよび記録媒体
JP2000090098A (ja) データベース問い合わせ方法及びその実施装置並びにその処理プログラムを記録した媒体
JP2002297605A (ja) 構造化文書検索方法および構造化文書検索装置およびプログラム
JP4343206B2 (ja) 構造化文書検索支援装置およびプログラム
Simou et al. Enriching and publishing cultural heritage as linked open data
Xia et al. Enriching a massively multilingual database of interlinear glossed text
JP4796108B2 (ja) 構造化文書検索装置、方法及びプログラム
JP2000020537A (ja) テキスト検索装置及びテキスト検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2005250820A (ja) ストレージシステムにおけるxml文書分類方法
CN117763200A (zh) 一种基于模式匹配的知识图谱检索方法与系统
CN101388034A (zh) 用于处理数据库的设备和方法
JP3671765B2 (ja) 異種情報源問い合わせ変換方法及び装置及び異種情報源問い合わせ変換プログラムを格納した記憶媒体
Giannakopoulos et al. Interactive text analysis and information extraction
JP2003196296A (ja) 文献知識管理装置、文献知識管理方法、プログラム、および、記録媒体
JP2008146300A (ja) 情報処理装置、情報処理方法およびプログラム
JPH0232470A (ja) シソーラス編集装置
JP2005056085A (ja) データ構造変換プログラム
JPH09282218A (ja) Html文書本型整形方法及びその装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071225

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080408

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080819